一直以来,美国是公认的AI领域强者,我国AI技术虽然差不多,但始终落人一步。然而,近日斯坦福团队的AI模型却被指控抄袭中国AI模型,这下许多人都坐不住了。
被实锤抄袭的,是斯坦福大学AI团队,他们在世界最大AI开源社区——HuggingFace上发布了一款多模态大模型,名为Llama3-V。该模型凭着低成本、高性能的优点,一经推出,火爆全网。
低成本是有多低呢?500美元即可训练一个,500美元什么概念,3000多块人民币,也就一部普通手机的价格,就能训练一个在多项基准测试中性能堪比GPT-4的模型,而且这个模型还要比那些一流顶尖模型小上100倍。
这样一个小而强,还便宜的开源模型,谁看了不热血沸腾夸上几句?所以它在推特上不停被转发,热度飞升至HuggingFace Trending 前5。
热度一起,便有人发觉不对劲,怎么这么眼熟呢?仔细一看,这跟清华系大模型创企面壁智能刚发布的MiniCPM-Llama3-V 2.5好像啊,但是该模型并没有提到任何有关清华大模型的参考或其他信息。
此时,该斯坦福团队还在嘴硬,声称没有抄袭,只是使用了一下下MiniCPM-Llama3-V 2.5的分词器。
看热闹的大家开始逐渐较真,证据越挖越多,除了构架和代码方面的相似证据,还有人发现团队成员在HuggingFace上直接导入清华大模型并改名Llama3-V。
如果硬说上面的证据都只是一系列巧合,那么Llama3-V拥有清华大模型MiniCPM-Llama3-V 2.5独有的识别“清华简”的能力总不能洗了吧。
清华简识别能力是基于非公开数据集训练的,该数据集由清华系团队逐字扫描标注,其他模型除非复制粘贴清华大模型,否则不可能有同样的能力,然而Llama3-V还真有这个能力,甚至出错都跟清华系大模型一模一样。
抄袭问题彻底实锤,斯坦福团队嘴硬无效,开始道歉并试图辩解。他们光速删库,其中两位成员还公开声明他们从头到尾都没接触过代码,甚至看都没看过,言下之意是虽然他们署名了,但此事与他们无关。
另一边的受害者面壁智能倒是很礼貌地回应了此事:他们深表遗憾,一方面认为这是受到了国际认可,另一方面更希望大家共建开放、合作、有信任地社区环境。希望团队工作被认可但不希望以这种方式被认可。
无独有偶,谷歌人工智能Gemini Pro曾声称自己是文心一言(百度大模型),让人目瞪口呆的同时还怀疑谷歌是不是也抄了中国大模型?谷歌光速修复,另有人出面解释,谷歌可能在训练时参考了文心一言的数据。
去年,OpenAI 早期投资人 Vinod Khosla还吐槽美国的开源模型都会被中国抄袭,这下回旋镖是打到自己身上了。一向被认为是落后的中国大模型却在被一直声称领先的美国团队抄袭,莫非如今地位已然反转?来看看美国AI大佬们怎么说。
斯坦福自己家的 Christopher David Manning一边指责抄袭行为一边赞扬中国开源模型的优秀。谷歌家的Lucas Beyer则在为中国模型优秀但大家却并不关注而感到遗憾。事件发生地开源AI社区HuggingFace也有负责人出来表示,中国团队做了很多令人惊奇的工作,然而总是被大家忽视。
近日的2024年人工智能向善全球峰会上,ChatGPT之父Sam Altman指出中国正积极训练大量模型,并预测中国将发展出具有自身特色的大语言模型,还会占据重要地位。
所以说,我们的AI实力不容小觑,大家也不必唯美国论,毕竟他们也在抄袭我们呢。
如何学习大模型
现在社会上大模型越来越普及了,已经有很多人都想往这里面扎,但是却找不到适合的方法去学习。
作为一名资深码农,初入大模型时也吃了很多亏,踩了无数坑。现在我想把我的经验和知识分享给你们,帮助你们学习AI大模型,能够解决你们学习中的困难。
我已将重要的AI大模型资料包括市面上AI大模型各大白皮书、AGI大模型系统学习路线、AI大模型视频教程、实战学习,等录播视频免费分享出来,需要的小伙伴可以扫取。
一、AGI大模型系统学习路线
很多人学习大模型的时候没有方向,东学一点西学一点,像只无头苍蝇乱撞,我下面分享的这个学习路线希望能够帮助到你们学习AI大模型。
二、AI大模型视频教程
三、AI大模型各大学习书籍
四、AI大模型各大场景实战案例
五、结束语
学习AI大模型是当前科技发展的趋势,它不仅能够为我们提供更多的机会和挑战,还能够让我们更好地理解和应用人工智能技术。通过学习AI大模型,我们可以深入了解深度学习、神经网络等核心概念,并将其应用于自然语言处理、计算机视觉、语音识别等领域。同时,掌握AI大模型还能够为我们的职业发展增添竞争力,成为未来技术领域的领导者。
再者,学习AI大模型也能为我们自己创造更多的价值,提供更多的岗位以及副业创收,让自己的生活更上一层楼。
因此,学习AI大模型是一项有前景且值得投入的时间和精力的重要选择。