IEEE权威杂志特别报道一款国内大语言模型,不是百度、不是阿里、不是华为……

现如今,大模型早已成为街谈巷议的 AI 话题,ChatGPT 更火出了圈。NLP、CV 和多模态领域的大模型层出不穷,并朝着通用方向不断演进,让人们看到了 AGI 的希望。

在大模型时代,除了继续升级预训练、微调等技术和算法之外,构建开源开放的大模型评测体系和生态同等重要。

说来容易,但做起来很难。仅就开源而言,谷歌、OpenAI 等头部 AI 企业对自己的大模型大多并没有开源或仅开放 API 使用,正在逐渐形成壁垒。

在国内,BAT等大型互联网大厂在AI领域正持续发力,关于它们的新闻也是层出不穷。

然而,IEEE Spectrum官网发表的一则消息,却吸引了我的注意。

IEEE Spectrum 是由电气和电子工程师协会(IEEE)发行的一份学术期刊。 

该杂志会刊登有关影响商业和社会的技术和科学趋势的同行评审文章。2012 年,IEEE Spectrum 被评为国家杂志奖“杰出思想领袖杂志”类别的获奖者。

图片

大语言模型为什么一定要大?小不可以吗?北京智源人工智能研究院推出的“悟道 3.0”就在小而精上下起了功夫。

作为研究成果,悟道3.0·天鹰是首个具备中英双语知识,支持商用许可协议、国内数据合规需求的开源语言大模型。

这一模型在中英文高质量语料基础上从“0”开始训练,通过数据质量的控制、多种训练的优化方法,实现在更小的数据集、更短的训练时间获得更优的性能。

图片

为什么要缩小模型的规模?

训练成本高昂、芯片被卡脖子、监管变态的严苛,让悟道 2.0这样的大语言模型很难实施下去。最终,他们选择生产参数较小的模型,供国内其它公司使用。

另外,开源相对较小的模型也可能是该公司的战略选择,因为它是一个非营利性研究机构,再训练一个大语言模型的投资回报很低,这样的话,很不划算。

对于较小的开源模型,运行模型输出结果的成本会比较低,可以更容易地商业化。它们特别适用于像医疗聊天机器人之类较为小众的市场。

另外,模型小,训练需要的芯片数也少,在当前芯片短缺的情况下,模型的训练不会受较大影响。

悟道3.0·天鹰模型在国内并没有引起太多关注,可能是因为其参数规模与其他可用的开源模型相似,比如Meta的LLaMA和Llama 2。

为大模型构建基础,通过开源合作促进创新,北京智源正在努力创建一个类似于Linux的开源生态系统。

希望他们再接再历,在人工智能领域上开辟一条道路。

文章来源:

https://spectrum.ieee.org/china-chatgpt-wu-dao

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/74271.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

武汉地铁19号线完成5G专网全覆盖,现场测试下行速率超千兆!

近日,极目新闻记者从中国移动湖北公司获悉,随着武汉地铁19号线全线隧道正式贯通,湖北移动目前已完成新月溪公园至鼓架山站5G网络覆盖,轨行区5G专网全覆盖,并成功进行试车验证,19号线成为国内首条全线实现5G…

基于ipad协议的gewe框架进行微信群组管理(二)

友情链接 geweapi.com 点击访问即可。 获取群组详情 小提示: 该接口可以一次查询20个群组查询出来的信息是不带公告的 请求URL: http://域名地址/api/group/detail 请求方式: POST 请求头: Content-Type:applica…

Base64编码-算法特别的理解

Base64 在DES加密和AES加密的过程中,加密的编码会出现负数,在ascii码表中找不到对应的字符,就会出现乱码。为了解决乱码的问题,一般结合base64使用 所谓Base64,即是说在编码过程中使用了64种字符:大写A到Z、…

数据结构:力扣OJ题(每日一练)

题一:有效的括号 给定一个只包括 (,),{,},[,] 的字符串 s ,判断字符串是否有效。 有效字符串需满足: 左括号必须用相同类型的右括号闭合。左括号必须以正确的顺序闭合。每个右括号…

智安网络|恶意软件在网络安全中的危害与应对策略

恶意软件是指一类具有恶意目的的软件程序,恶意软件是网络安全领域中的一个严重威胁,给个人用户、企业和整个网络生态带来巨大的危害。通过潜伏于合法软件、邮件附件、下载链接等途径传播,破坏用户计算机系统、窃取敏感信息、进行勒索等不法行…

Linux 终端操作命令(2)内部命令

Linux 终端操作命令 也称Shell命令,是用户与操作系统内核进行交互的命令解释器,它接收用户输入的命令并将其传递给操作系统进行执行,可分为内部命令和外部命令。内部命令是Shell程序的一部分,而外部命令是独立于Shell的可执行程序…

华为AI战略的CANN

基于TVM的华为昇腾体系中—— 异构计算架构(CANN)是对标英伟达的CUDA CuDNN的核心软件层,向上支持多种AI框架,向下服务AI处理器,发挥承上启下的关键作用,是提升昇腾AI处理器计算效率的关键平台 主要包括有…

CSS前端开发指南:创造精美的用户界面

简介: 《CSS前端开发指南:创造精美的用户界面》是一本旨在帮助读者掌握CSS技术,实现令人惊叹的前端用户界面的实用指南。无论您是初学者还是有经验的开发者,本书都将为您提供全面的知识和实用技巧,帮助您创建引人注目…

网页显示摄像头数据的方法---基于web video server

1. 背景: 在ros系统中有发布摄像头的相关驱动rgb数据,需求端需要将rgb数据可以直接在网页上去显示。 问题解决: web_video_server功能包,相关链接: web_video_server - ROS Wiki 2. 下载,安装和编译&a…

Java算法_ 二叉树的最大深度(LeetCode_Hot100)

题目描述:给定一个二叉树 ,返回其最大深度。root 二叉树的 最大深度 是指从根节点到最远叶子节点的最长路径上的节点数。 获得更多?算法思路:代码文档,算法解析的私得。 运行效果 完整代码 /*** 2 * Author: LJJ* 3 * Date: 2023/…

Rx.NET in Action 第四章学习笔记

Part 2 核心思想 《Rx.NET in Action》这一部共分八章,涵盖了Rx 关键模块——**Observable(可观察序列)和Observer(观察者)**的全部功能,以及如何创建它们、连接它们和控制它们之间的关系。 然后,您将学习如何使用强大的 Rx 处理器构建复杂…

2023年京东按摩仪行业数据分析(京东销售数据分析)

近年来,小家电行业凭借功能与颜值,取代黑电和白电,成为家电市场的主要增长点。在这一市场背景下,颜值更高、功能更丰富、品种更齐全的各类按摩仪,借助新消费和电子商务的风潮,陆续被推上市场。今年&#xf…

VSCode使用SSH无密码连接Ubuntu

VSCode使用SSH无密码连接Ubuntu 前提条件: 1. 能够正常使用vscode的Remote-ssh连接Ubuntu 2. Ubuntu配置静态ip(否则经常需要修改Remote-ssh的配置文件里的IP) 链接-> ubuntun 18.04设为静态ip(.net模式,可连接…

LVGL学习笔记 30 - List(列表)

目录 1. 添加文本 2. 添加按钮 3. 事件 4. 修改样式 4.1 背景色 4.2 改变项的颜色 列表是一个垂直布局的矩形,可以向其中添加按钮和文本。 lv_obj_t* list1 lv_list_create(lv_scr_act());lv_obj_set_size(list1, 180, 220);lv_obj_center(list1); 部件包含&…

手机的发展历史

目录 一.人类的通信方式变化 二.手机对人类通信的影响 三.手机的发展过程 四.手机对现代人的影响 一.人类的通信方式变化 人类通信方式的变化是一个非常广泛和复杂的话题,随着技术的进步和社会的发展,人类通信方式发生了许多重大的变化。下面是一些主…

【Linux命令详解 | ps命令】 ps命令用于显示当前系统中运行的进程列表,帮助监控系统状态。

文章标题 简介一,参数列表二,使用介绍1. 基本用法2. 显示所有进程3. 显示进程详细信息4. 根据CPU使用率排序5. 查找特定进程6. 显示特定用户的进程7. 显示进程内存占用8. 查看进程树9. 实时监控进程10. 查看特定进程的详细信息11. 查看特定用户的进程统计…

哪种电容笔更好用?学生党开学值得买电容笔推荐

在过半个月就马上要到开学季了,随着平板电脑在大学校园内的普及,对电容笔提出了更高的要求。而苹果的正版电容笔产品,虽然有着强大的功能,但由于其具有更加昂贵的价格,让其只能作为一种学习和记录的工具,由…

HCIP-OpenStack

1、OpenStack概述 OpenStack是一种云操作系统,OpenStack是虚拟机、裸金属和容器的云基础架构。可控制整个数据中心的大型计算、存储和网络资源池,所有资源都通过API或Web界面进行管理。 为什么称OpenStack是云操作系统? 云一般指云计算&…

七、dokcer-compose部署springboot的jar

1、准备 打包后包名为 ruoyi-admin.jar 增加接口 httpL//{ip}:{port}/common/test/han #环境变量预application.yml 中REDIS_HOSTt的值,去环境变量去找;如果找不到REDIS_HOST就用myredis 1、Dockerfile FROM hlw/java:8-jreRUN ln -sf /usr/share/z…

使用vscode进行远程调试

官方调试手册:vscode官方调试手册 1.安装python扩展 如果是远程连接的话,一定要在ssh上启用扩展。不然创建基于python的配置文件时就会提示,无python扩展。 2.新建配置文件,并修改参数 点击左侧第四个按钮,运行与调试…