中国大模型站起来了!甚至被美国团队反向抄袭

一直以来,美国是公认的AI领域强者,我国AI技术虽然差不多,但始终落人一步。然而,近日斯坦福团队的AI模型却被指控抄袭中国AI模型,这下许多人都坐不住了。

被实锤抄袭的,是斯坦福大学AI团队,他们在世界最大AI开源社区——HuggingFace上发布了一款多模态大模型,名为Llama3-V。该模型凭着低成本、高性能的优点,一经推出,火爆全网。

低成本是有多低呢?500美元即可训练一个,500美元什么概念,3000多块人民币,也就一部普通手机的价格,就能训练一个在多项基准测试中性能堪比GPT-4的模型,而且这个模型还要比那些一流顶尖模型小上100倍。

这样一个小而强,还便宜的开源模型,谁看了不热血沸腾夸上几句?所以它在推特上不停被转发,热度飞升至HuggingFace Trending 前5。

热度一起,便有人发觉不对劲,怎么这么眼熟呢?仔细一看,这跟清华系大模型创企面壁智能刚发布的MiniCPM-Llama3-V 2.5好像啊,但是该模型并没有提到任何有关清华大模型的参考或其他信息。

此时,该斯坦福团队还在嘴硬,声称没有抄袭,只是使用了一下下MiniCPM-Llama3-V 2.5的分词器。

看热闹的大家开始逐渐较真,证据越挖越多,除了构架和代码方面的相似证据,还有人发现团队成员在HuggingFace上直接导入清华大模型并改名Llama3-V。

如果硬说上面的证据都只是一系列巧合,那么Llama3-V拥有清华大模型MiniCPM-Llama3-V 2.5独有的识别“清华简”的能力总不能洗了吧。

清华简识别能力是基于非公开数据集训练的,该数据集由清华系团队逐字扫描标注,其他模型除非复制粘贴清华大模型,否则不可能有同样的能力,然而Llama3-V还真有这个能力,甚至出错都跟清华系大模型一模一样。

抄袭问题彻底实锤,斯坦福团队嘴硬无效,开始道歉并试图辩解。他们光速删库,其中两位成员还公开声明他们从头到尾都没接触过代码,甚至看都没看过,言下之意是虽然他们署名了,但此事与他们无关。

另一边的受害者面壁智能倒是很礼貌地回应了此事:他们深表遗憾,一方面认为这是受到了国际认可,另一方面更希望大家共建开放、合作、有信任地社区环境。希望团队工作被认可但不希望以这种方式被认可。

无独有偶,谷歌人工智能Gemini Pro曾声称自己是文心一言(百度大模型),让人目瞪口呆的同时还怀疑谷歌是不是也抄了中国大模型?谷歌光速修复,另有人出面解释,谷歌可能在训练时参考了文心一言的数据。

去年,OpenAI 早期投资人 Vinod Khosla还吐槽美国的开源模型都会被中国抄袭,这下回旋镖是打到自己身上了。一向被认为是落后的中国大模型却在被一直声称领先的美国团队抄袭,莫非如今地位已然反转?来看看美国AI大佬们怎么说。

斯坦福自己家的 Christopher David Manning一边指责抄袭行为一边赞扬中国开源模型的优秀。谷歌家的Lucas Beyer则在为中国模型优秀但大家却并不关注而感到遗憾。事件发生地开源AI社区HuggingFace也有负责人出来表示,中国团队做了很多令人惊奇的工作,然而总是被大家忽视。

近日的2024年人工智能向善全球峰会上,ChatGPT之父Sam Altman指出中国正积极训练大量模型,并预测中国将发展出具有自身特色的大语言模型,还会占据重要地位。

所以说,我们的AI实力不容小觑,大家也不必唯美国论,毕竟他们也在抄袭我们呢。

如何学习大模型

现在社会上大模型越来越普及了,已经有很多人都想往这里面扎,但是却找不到适合的方法去学习。

作为一名资深码农,初入大模型时也吃了很多亏,踩了无数坑。现在我想把我的经验和知识分享给你们,帮助你们学习AI大模型,能够解决你们学习中的困难。

我已将重要的AI大模型资料包括市面上AI大模型各大白皮书、AGI大模型系统学习路线、AI大模型视频教程、实战学习,等录播视频免费分享出来,需要的小伙伴可以扫取。

一、AGI大模型系统学习路线

很多人学习大模型的时候没有方向,东学一点西学一点,像只无头苍蝇乱撞,我下面分享的这个学习路线希望能够帮助到你们学习AI大模型。

在这里插入图片描述

二、AI大模型视频教程

在这里插入图片描述

三、AI大模型各大学习书籍

在这里插入图片描述

四、AI大模型各大场景实战案例

在这里插入图片描述

五、结束语

学习AI大模型是当前科技发展的趋势,它不仅能够为我们提供更多的机会和挑战,还能够让我们更好地理解和应用人工智能技术。通过学习AI大模型,我们可以深入了解深度学习、神经网络等核心概念,并将其应用于自然语言处理、计算机视觉、语音识别等领域。同时,掌握AI大模型还能够为我们的职业发展增添竞争力,成为未来技术领域的领导者。

再者,学习AI大模型也能为我们自己创造更多的价值,提供更多的岗位以及副业创收,让自己的生活更上一层楼。

因此,学习AI大模型是一项有前景且值得投入的时间和精力的重要选择。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/701616.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

UE 像素流与 Web 协同开发

UE 像素流与 Web 协同开发 创建Web端应用Web向UE发送消息emitCommandemitConsoleCommandemitUIInteraction UE接收Web的消息UE向Web发送消息Web接收UE的消息UE 冻结帧 与Web交互主要涉及两个方面,一个是UE向Web发送消息,另一个就是Web端向UE程序发送消息…

功率 MOSFET、其电气特性定义

本应用笔记介绍了功率 MOSFET、其电气特性定义和使用说明。介绍了功率MOSFET的破坏机制和对策及其应用和电机驱动应用。 电气特性定义及使用说明 功率 MOSFET 额定值 导通电阻R_DS(on)与耐压V_DSS的关系 图2表示耐压VDSS20~100V额定元件与导通电阻R_DS(on)之间的…

如何理解质量

早年写过一篇未发表的论文《质量的相对性》,就是为了寻求到底什么才是质量这个问题的答案。现在,在准备了诸多超越以往的认知的概念之后,关于质量是什么的想法,也逐渐有了眉目。 质量有两种,一种叫做惯性质量&#xff…

使用OpenLLM在AMD GPU上的分步指南

Step-by-Step Guide to Use OpenLLM on AMD GPUs — ROCm Blogs 引言 OpenLLM是一个开源平台,旨在促进大型语言模型(LLMs)的部署和使用,支持多种模型,适应不同的应用,无论是在云环境还是本地环境中。在本教…

再开源一个小玩意儿,帮你找到电路板上的热点

ADLib上线 也半个多月了,这段时间做了一个全流程使用ADLib的小玩意儿,跟大家分享下过程。 这是一个利用红外测温传感器寻找电路板上的热点的工具,当然了,它也可以用来测量其他物体的温度,比如地暖水管铺设位置&#x…

【重拾数学知识】导数、极值和最值

前言 在深度学习中,梯度下降法是一种常用的优化算法,用于更新模型参数以最小化损失函数。这梯度下降法中涉及到数学中的导数、极值等相关知识,因此我们重新回顾相关内容,以便加深理解。 相关概念 导数 一个问题 如何求得一个…

帮企三级分销商城10合一小程序源码系统 附带完整安装代码包以及搭建教程

系统概述 “帮企三级分销商城10合一小程序源码系统”是一款专为中小企业设计的一站式电商解决方案。该系统基于成熟的小程序开发框架构建,集商品展示、在线交易、订单管理、会员系统、营销工具、数据分析、以及独特的三级分销功能于一体,旨在帮助商家快…

优思学院|汽车行业的六西格玛案例

汽车行业正在经历前所未有的变革。市场变化、新商业模式和新的价值链不断涌现。面对这些变化,我们需要持续改进的方法。因此,优思学院今天想分享一个最近关注到的汽车行业六西格玛案例。这是一家位于葡萄牙的轮胎制造公司,通过这个案例研究&a…

机器学习-聚类算法

1.有监督学习与无监督学习 有监督:在训练集中给的数据中有X和Y,根据这些数据训练出一组参数对预测集进行预测 无监督:在训练集中给的数据只有X没有Y,根据X数据找相似度参数来对预测集进行预测 2.数据间的相似度 2.1距离相似度…

.NET C# 读写Excel及转换DataTable

目录 .NET C# 读写Excel及转换DataTable1. 依赖库2. Nuget包与版本3. ExcelUtil3.1 Excel sheet 转 DataTable3.2 Excel sheet 转 DataSet3.3 DataTable 转 Excel sheet3.4 DataSet 转 Excel3.5 私有方法 .NET C# 读写Excel及转换DataTable 1. 依赖库 using NPOI.HSSF.UserMo…

自动驾驶#芯片-1

概述 汽车是芯片应用场景之一,汽车芯片需要具备车规级。  车规级芯片对加工工艺要求不高,但对质量要求高。需要经过的认证过程,包括质量管理标准ISO/TS 16949、可靠性标准 AEC-Q100、功能安全标准ISO26262等。  汽车内不同用途的芯片要求…

肾合养生秘诀:告别手心热出汗的困扰

如果将我们的身体比作一支精心编排的交响乐团,那么各个器官便是乐团中不可或缺的乐器和乐手,而气血则如同乐团中的乐谱和指挥棒,引领着整个乐团的演奏。当乐谱缺失,指挥棒失灵,或者乐团的协作出现问题,某些…

【启明智显方案分享】ESP32-S3与GPT AI融合的智能问答嵌入式设备应用解决方案

一、引言 随着物联网(IoT)和人工智能(AI)技术的飞速发展,嵌入式设备正逐渐变得智能化。本解决方案是启明智显通过结合ESP32-S3的低功耗、高性能特性和GPT(Generative Pre-trained Transformer)…

仅需一款免费工具,就可以打造真实人设,无限生成虚拟AI网红

嘿,大家好,向阳。 很多粉丝问我,用AI做了这么多漂亮的美女,该如何用AI进行变现呢?今天我就教大家一个方法!曝光AI网红最好的平台就是小某书,在小某书上打造一个虚拟人物可以快速获取粉丝 。达到…

Mybatis Log Free

安装后重启 在 application.yml 配置 configuration: log-impl: org.apache.ibatis.logging.stdout.StdOutImpl 选择效果

【一步一步了解Java系列】:探索抽象类与接口的秘密

看到这句话的时候证明:此刻你我都在努力 加油陌生人 个人主页:Gu Gu Study专栏:一步一步了解Java 喜欢的一句话: 常常会回顾努力的自己,所以要为自己的努力留下足迹 喜欢的话可以点个赞谢谢了。 作者:小闭…

为什么看了那么多资料还是无法理解Transformer啊???

要理解和熟悉一个新的技术/新模型,比较好的方式是通过以下框架结构来熟悉: 为什么:一个新模型的诞生,一般是解决了现有的模型不能解决的一些问题。因此需了解该技术提出的背景和创新点。 是什么:熟悉这个模型的内容和架构、训练…

pip 配置缓存路径

在windows操作平台,默认情况,pip下使用的系统目录 C:\Users\用名名称\AppData\Local\pip C盘是系统盘,如果常常使用pip安装会占用大量的空间很快就满,这时候就有必要变更一下缓存保存路径了。 pip 配置缓存路径: Win…

10 -每台机器的进程平均运行时间(高频 SQL 50 题基础版)

10 - 每台机器的进程平均运行时间 -- sum(if(activity_type end,timestamp ,-timestamp )) -- 如果activity_type为“end”,值为timestamp,为“start” 为-timestamp,所有数相加end-start -- count(distinct process_id),获取同一机器有几个进行id -- r…

详解 Flink Table API 和 Flink SQL 之流处理中的表

一、关系型表和流处理表对比 关系型表/SQL流处理表处理的数据对象字段元组的有界集合字段元组的无限序列查询(Query)对数据的访问可以访问到完整的数据输入无法访问所有数据,必须持续“等待”流式输入查询终止条件生成固定大小的结果集后终止…