国内类似ChatGPT的大模型应用有哪些?发展情况如何了

第一部分:几个容易混淆的概念

图片

很多人,包括很多粉丝的科技博主,经常把ChatGPT和预训练大模型混为一谈,因此有必要先做一个澄清。预训练大语言模型属于预训练大模型的一类,而ChatGPT、文心一言又是预训练大语言模型的一个具体应用(如下图所示)。

图片

而我们今天讨论的主要是预训练大语言模型的应用,也就是我们能看得见摸得着的东西。

第二部分 国外预训练大语言模型典型应用

图片

\1. 大名鼎鼎的ChatGPT。OpenAI于2022年11月30日发布了ChatGPT,背后是微软(主要投资方)。ChatGPT一经发布就惊艳了四方,而且仅仅2个月就突破了1亿用户,打破世界纪录成为彻底的网红产品。相比较而言TikTok(抖音国际版)达到1亿用户用时9个月,Instagram(照片墙)则花了两年半的时间,Facebook当时也花了852天,可见ChatGPT有多强。

\2. 谷歌:Bard。谷歌在2023年2月9日,在巴黎发布了Bard,是专门为对抗ChatGPT出的聊天机器人产品。然而,谷歌给大家期望过高,这个产品发布会上竟然不慎翻车了,出现了一个明显的事实错误。大家可自行搜索百度,了解详情。谷歌在AI领域的领导者地位毋庸置疑,期待后续改进。

3.Anthropic: Claude. Claude大模型应用跟ChatGPT类似。Anthoropic同样是一家小有名气的创业公司,据说OpenAI核心技术人员有一部分离开,加入了Claude的开发中。

图片

第三部分 国内预训练大模型典型应用及进展

图片

\1. 百度:文心一言。2023年3月16日百度发布了文心一言,类似于ChatGPT的产品。百度做搜索引擎起家,是最早布局大模型的公司之一,因此能够实现国内率先的发布。不过,在前一天3月15日,ChatGPT进行了迭代和发布,给文心一言的发布造成不小压力。

图片

\2. 阿里:通义千问。阿里于2023年4月7日发布了“通义千问”,但并未大张旗鼓的召开新闻发布会,而是采用了邀请客户体验的方式。目前通义千问已经有人体验了,知乎上有人和文心一言做了对比测试,大家可以自行搜索。

\3. 华为:盘古大模型。华为于2023年4月8日在由中国人工智能学会主办的人工智能大模型技术高峰论坛上展示了盘古大模型的进展及其应用。不过这次是大模型,并没有类似ChatGPT的应用出来。

图片

\4. 腾讯:混元大模型。同样这次说的是大模型,并非ChatGPT类似的应用。腾讯总裁刘炽平表示,腾讯不会匆忙推出产品,而是将花费时间打造一个经过多次迭代后的长期发展机会。

\5. 京东:ChatJD。2023年2月5日,京东宣布将于未来发布类似于ChatGPT的应用——ChatJD,聚焦的是产业版。但发布时间未知。

\6. 商汤:2023年4月10日下午举办了技术交流日活动,分享人工智能技术的前沿进展,并公布其在大模型方面的最新情况。商汤研发的大语言模型被命名为“商量SenseChat”

\7. 科大讯飞:科大讯飞将于2023年5月6日发布了讯飞星火认知大模型,具有文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力 7 大核心能力。讯飞背后有中科大/中科院,语音/NLP相关领域还是十分不错的。

此外,旷世、快手等也有大模型方面的布局,近期没有消息,这里就不一一列举。

第四部分 对国内AI的发展应持有敬畏之心

图片

不得不承认,不管是百度的文心一言还是阿里的通义千问,跟ChatGPT相比还是有些差距的。但大可不必抱着喷的心态来看待这个问题。在我国,现在即便是大厂,做这件事情本身也挺不容易。主要有如下原因:

\1. 训练用的芯片被美国卡脖子。根据升级后的美国禁令条例,英伟达超算和云端训练产品A100 和H100、AMD的MI250和MI250X等GPU产品均在禁售范围之内。尤其是Nivida H100系列,这么强的芯片根本就不卖给中国;现在连A100都给限制了。为了曲线救国,国外芯片厂商也得是调整参数后才能卖给我国。因此,大家只能用之前的存货或其他算力低的芯片。(参考《美国出口管理条例》)

\2. 研发成本高。根据艾瑞咨询,ChatGPT计算资源成本很高,迭代训练一次需要460万美元。以及需要高端人才、科学家等研发成本。对国内公司而言,这一样是真金白银、每天都在烧钱。

\3. 使用成本高。目前,国内的ChatGPT类应用还没有探索出来商业化之路,每一次交互都会耗费底层大量的算力资源。毕竟研发完成以后还要跑起来的。

因此,相互理解最好,多给国内公司点个赞。模型毕竟会不断迭代的,相信未来的产品会越来越好!我们在AI的赛道上也有自己的东西!

图片

2024年3月份更新:

在过去的一年里,大模型发展非常迅速,国内据说已经有几百个做大模型的公司。有的在卷底层大模型,有的在卷大模型工具链,也有的在卷应用。这里补充列举一些做大模型基座的公司,供大家参考。

做大模型的公司,目前大体可分为四类:互联网大厂、垂类AI公司、初创公司、学术派机构。具体可参考如下值得关注的清单:

1. 互联网大厂

图片

2. 垂类AI公司

图片

3. 初创公司

图片

4. 学术机构派

图片

上述榜单只是在笔者的认知里,列举了其中一些比较有代表性的。没在清单里的也同样优秀,大家加油!争取早日突破老美的封锁,早日让我国在AI领域引领世界~

2024年5月份更新:

5月份最大的新闻是大模型相关产品降价狂潮,具体汇总如下:

5月15日字节公布了豆包主力模型在企业市场的定价。并称“1块钱能买到豆包主力模型的125万tokens,相当于三本《三国演义》。”(一个中文词语、英文单词、数字、符号计为1个token)

5月21日,阿里云宣布通义千问旗下9款商业化及开源模型降价的同时,也对标表明了“1块钱可以买200万tokens,相当于5本《新华字典》的文字量。”

几小时后,百度智能云迅速跟进,宣布文心大模型的两款主力模型ENIRE Speed和ENIRE Lite全面免费。

随后,科大讯飞宣布,讯飞星火API能力正式免费开放。同日,腾讯云也宣布,其主力模型之一混元-lite模型的价格从0.008元/千tokens调整为全面免费。

如何学习AI大模型?

作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

一、全套AGI大模型学习路线

AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!

img

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

img

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

img

四、AI大模型商业化落地方案

img

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/664730.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【Linux】Linux基本指令3

目录 1.date指令 2.cal指令 3.find指令:(灰常重要) -name 4.grep指令——行文本过滤工具 5.zip/unzip指令: 6.tar指令(重要):打包/解包,不打开它,直接看内容 7.bc…

SpringBoot六种API请求参数读取方式

SpringBoot六种API请求参数读取方式 同步请求和异步请求 同步: 指单线程依次做几件事异步: 指多线程同时做几件事 同步请求: 指客户端浏览器只有一个主线程, 此线程负责页面的渲染和发出请求等操作, 如果此主线程发出请求的话则停止渲染而且会清空页面显示的内容 直到服务器响…

3d渲染的常用概念和技术,渲染100邀请码1a12

之前我们介绍了3D渲染的基本原理和流程,这次说下几个常用概念和技术。 3D渲染中涉及到很多专业的概念和技术,它们决定了渲染质量和效果,常用的有以下几个。1、光线追踪 光线追踪是一些专业渲染器(如V-Ray和Corona等)…

算法思想总结:哈希表

一、哈希表剖析 1、哈希表底层:通过对C的学习,我们知道STL中哈希表底层是用的链地址法封装的开散列。 2、哈希表作用:存储数据的容器,插入、删除、搜索的时间复杂度都是O(1),无序。 3、什么时…

Android HIDL接口添加

一.HIDL介绍 HIDL的全称是HAL interface definition language(硬件抽象层接口定义语言),是Android Framework 与Android HAL之间的接口。HIDL 旨在用于进程间通信 (IPC),进程之间的通信 采用 Binder 机制。 二.HIDL 与AIDL 的对…

客户文章|难能可贵,非模式生物的功能研究与创新

菜豆(Phaseolus vulgaris),又名四季豆、芸豆、油豆角,是全球第一大豆类蔬菜,我国是世界上最主要的菜豆生产国和销售国。在田间生产过程中,菜豆常面临着各种生物和非生物逆境的胁迫,对其产量品质…

FOC - BLDC六步换相驱动原理

文章目录 1 . 前言2 . 电机旋转原理3 . BLDC特点4 . BLDC反电动势投影位置5 . BLDC换相时刻6 . BLDC换相注意事项7 . 小结 【全文大纲】 : https://blog.csdn.net/Engineer_LU/article/details/135149485 1 . 前言 无刷直流电机在这里区分为两种,一是永磁无刷直流电…

【Linux-LCD 驱动】

Linux-LCD 驱动 ■ Framebuffer 简称 fb■ LCD 驱动程序编写■ 1、LCD 屏幕 IO 配置■ 2、LCD 屏幕参数节点信息修改■ 3、LCD 屏幕背光节点信息■ 4、使能 Linux logo 显示 ■ 设置 LCD 作为终端控制台■ 1、设置 uboot 中的 bootargs■ 2、修改/etc/inittab 文件 ■ LCD 背光…

python前端streamlit模型部署

简单介绍使用前端streamlit框架快速部署本地模型: 1、模型训练: import pandas as pd # 流程整合 from sklearn.pipeline import make_pipeline, Pipeline # 数据处理 from sklearn.impute import SimpleImputer from sklearn.preprocessing import Min…

探索 Android Studio 中的 Gemini:加速 Android 开发的新助力

探索 Android Studio 中的 Gemini:加速 Android 开发的新助力 在 Gemini 时代的下一篇章中,Gemini融入了更多产品中,Android Studio 正在使用 Gemini 1.0 Pro 模型,使 Android 开发变得更快、更简单。 Studio Bot 现已更名为 And…

深度学习知识与心得

目录 深度学习简介 传统机器学习 深度学习发展 感知机 前馈神经网络 前馈神经网络(BP网络) 深度学习框架讲解 深度学习框架 TensorFlow 一个简单的线性函数拟合过程 卷积神经网络CNN(计算机视觉) 自然语言处理NLP Wo…

C# WinForm —— 23 Timers.Timer 组件介绍与使用

1. 简介 System.Timers.Timer 计时器 轻量 每隔一段时间触发Elapsed事件,执行操作(不是由UI线程执行的),即使事件中执行了比较耗时的操作,也不会造成 UI 失去响应 如果要获取服务器的计时功能的话,可以使用System.Timers.Timer …

unity2020打包webGL时卡进程问题

我使用的2020.3.0f1c1,打包发布WEB版的时候会一直卡到asm2wasm.exe这个进程里,而且CPU占用率90%以上。 即使是打包一个新建项目的空场景也是同样的问题,我尝试过一直卡在这里会如何,结果还真打包成功了。只是打包一个空场景需要20…

C++(入门基础版本)

1,什么是C C 是一种通用的、面向对象的编程语言,是 C 语言的一个超集,也就是说,任何有效的 C 程序都是有效的 C 程序。C 通过添加诸如类和对象、继承和多态等概念,扩展了 C 语言的功能,使其更适用于大型软…

CSS学习笔记目录

CSS学习笔记之基础教程(一) CSS学习笔记之基础教程(二) CSS学习笔记之中级教程(一) CSS学习笔记之中级教程(二) CSS学习笔记之中级教程(三) CSS学习笔记之高级…

国产身份域管架构图集合(信创政策AD域替换必看)

几类典型架构 双机架构 单点单机房 集群架构 多点单机房 两地三中心架构 多点多机房 多地分布式架构 多点多机房 全栈信创方案架构,欢迎探讨交流~

[数据集][目标检测]喝水检测数据集VOC+YOLO格式995张3类别

数据集格式:Pascal VOC格式YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数):995 标注数量(xml文件个数):995 标注数量(txt文件个数):995 标注类别…

校园导航系统C++

制作一个简单的大学城导航系统,根据用户指定的起点和终点,求出最短路径长度以及具体路径。 项目要求: 1)程序与数据相分离,地图中的所有数据都是从文件读入,而不是写在代码中 2)最短路径算法…

抖音电商经验分享,揭秘做好抖店的七个关键细节,不容忽视

大家好,我是电商花花。 随着抖音电商和大量商家的不断入驻,大家对于电商的玩法也逐渐变多,拿到结果的商家也是越来越多,更多的做店玩法和步骤被更多人熟知。 现在想要做好抖店,其实也没有想象中那么复杂和困难。 新…

网络安全基础技术扫盲篇名词解释之“证书“

用通俗易懂的话说: 证书就好比是一张身份证(类似,但不完全相同),用来证明一个网站的身份是否可信。就像你要确认一个陌生人的身份需要看他的身份证一样,电脑在连接一个网站时,也会查看网站的证…