好家伙,AI大模型圈爆料不断,没想到今天最猛的料还是抄袭的瓜啊。
5月29日,一个斯坦福团队高调宣称,只需要500美元,就可以通过他们的新产品:Llama3-v ,就可以通过Llama3,训练出一个全新的多模态大模型,比GPT-4v、Claude opus等诸多最先进模型还要的强得多。
该团队成功以低成本、高回报的噱头(加之作者们的名校、名企的背景加持),使该模型在推特上迅速走红。但这众星捧月的流量,也只眷顾了该团队不到两天的时间。此后发酵的,是网友对他们的质疑。
没想到,面对质疑,斯坦福团队选择的做法是:删库跑路滑跪删文一条龙服务……
3.5研究测试:
hujiaoai.cn
4研究测试:
askmanyai.cn
Claude-3研究测试:
hiclaude3.com
质疑:Llama3-v窃取了清华与面壁智能的最新多模态模型成果
一位网友在清华大学与面壁智能合作开发的多模态模型——MiniCPM-Llama3-V 2.5 的github项目网址下留言:Llama3-v项目中有大量工作成果指明,该项目窃取了MiniCPM-Llama3-V2.5项目成果。
该网友曾在Llama3-v项目中提出质询,竟直接被Llama3-v作者删除。后续作者也隐藏了Llama3-v的Huggingface项目页面。该网友遂在被抄袭的作者项目页下,公布证明抄袭的所有证据。
证据1:Llama3-V项目使用的模型结构和代码,与MiniCPM-Llama3-V2.5项目几乎完全相同。 Llama3-v似乎只是微调了一部分格式,修改了变量名。
Llama3-v的作者声称在架构上参考了LlaVA-UHD。但实际上Llama3-v与MiniCPM-Llama3-V2.5使用方法相同。 甚至连MiniCPM-Llama3-V2.5独有的“特殊符号”,出现在了Llama3-v的分词器中。
证据2:网友质疑,在MiniCPM-Llama3-V2.5项目发布之前,Llama3-v的作者是如何用上MiniCPM-Llama3-V2.5的分词器时,Llama3-v项目的作者开始撒谎。 该作者声称使用了面壁智能的上一代项目MiniCPM-V-2的分词器,但打脸的是,MiniCPM-V-2与MiniCPM-Llama3-V2.5的分词器并非同一个文件(文件大小截然不同)。
并且,MiniCPM-V-2的发布时间早于Llama3模型的开源时间,怎么会有Llama3的分词器呢?
证据3:Llama3-v开发者似乎完全不理解自己的代码,该团队在github提供的代码,无法与Huggingface中的项目一起使用。 网友把从HuggingFace下载的 Llama3-V模型权重中的变量名,改成了MiniCPM-Llama3-V2.5的名字后,惊喜地发现模型可以用MiniCPM-V代码成功运行。
此外,MiniCPM-Llama3-V2.5的实验功能之一便是清华简 的识别能力,Llama3-v展示出了与MiniCPM-Llama3-V2.5相同的实力,甚至连做错的样例都一模一样!但MiniCPM-Llama3-V2.5此前并未公布该实验数据,那Llama3-v的清华简 的识别能力又是从何而来的呢?
还有非常好玩的一点,MiniCPM-Llama3-V2.5是最懂猫猫的大模型,可以从表情上、神态上分析出小猫的心情,状态。 以下是一些使用例。
有兴趣的小伙伴可以使用MiniCPM-Llama3-V2.5与Llama3-v程序试验一下,看看是否也能达到同样的结果。
MiniCPM-Llama3-V2.5项目github页:https://github.com/OpenBMB/MiniCPM-V
Llama3-v项目(补档)下载链接:https://t.co/7BSWu2R7W9
致歉:盲目信任队友产生的后果
在与网友的争吵中,Llama3-v开发者之一Mastafa Aljadery 眼见情况不对,删除了此前用来宣传的推文链接。
以此同时,Llama3-v的github项目页也显示为404 error。Mustafa Aljadery的推特也进行了隐私设置,只有经过他同意的人才可以看他的推特主页。
很明显,这样的逃避并不能平民愤:这是一场关乎道德,名誉,信任的伦理问题。虽然该斯坦福团队下架了几乎所有相关项目,但很明显这还不够,面壁智能团队焦头烂额,他们需要一个答复,广大网友也需要一个答复。
对此,开发者之一Aksh Garg 发表了道歉宣言:在盲目信任队友Mustafa Aljadery的情况下,没有亲身实践该项目。 现在已经向Mustafa要求出示Llama3-v的训练证明,但到目前为止还没有被回复。
而更奇怪的是,在该致歉声明发表数小时后,该作者删除了此声明。致歉作者推特主页:https://twitter.com/AkshGarg03
官方回应:对国际认可感到欣慰,呼吁共同维护社区环境
面对此次事件,面壁智能CEO李大海做出回应:
刘知远老师在知乎上也回应了此事:
首先值得欣慰的是,通过这种“别样的方式”,全世界得以见证面壁团队的奋斗,并对成果表示了高度认可。
但,成果获得大家的认同,不应该是以他人的成果的表现形式出现,更容不得他人的侵犯与亵渎。 本次事件让我想起了前日OpenAI公布的“打击AI的不正当使用活动”新闻,面对AI这把“双刃剑”,不仅需要法律制度来制约不当的AI使用行为,更需要我们每一个人,心中都有坚定的“道德标准线”。
AI的社区环境需要大家共同维护,合作共赢,互惠共利,才能迎接AI更好的发展未来,走向AGI普惠为民的新世界!