新火种AI|微软扶持下一个OpenAI?Mistral AI新模型对标GPT-4,上线即挤爆

作者:一号

编辑:美美

OpenAI的大金主微软,还想缔造“下一个OpenAI”。

周一晚间,成立仅9个月的Mistral AI正式发布了最强力的旗舰模型Mistral Large。和此前他们所推出的一系列模型不同,Mistral AI本次发布的版本性能更强,体量也更大,直接对标OpenAI的GPT-4。

在目前所有能够通过API访问的大模型中,Mistral Large排名第二,仅次于“当红明星”GPT-4,并且和GPT-4一样,是唯二在MMLU考试中拿到了80分以上的。

而且随着Mistral Large上线,Mistral AI还推出了名为Le Chat的聊天机器人,对标ChatGPT,大有复制OpenAI成功道路的意图。即便有微软Azure算力资源的加持,Le Chat的服务器还是被挤爆了。

忘了初心,开源变闭源?

早在本次Mistral Large“炸街”之前,Mistral AI所提出的Mistral-Medium就因为其强大的性能,还有令人意外的开源而名噪一时。使得不少的大模型初创企业不再对标Llama2这个开源模型,而是转而将Mistral旗下的模型作为直接竞争对手。这一次Mistral Large的横空出世,自然引人注目。

从性能上来说,尽管Mistral Large在参数量上还比不上GPT-4,但在一些关键性能上,它还是能够和GPT-4一战的,可以说,已经是当前业内前三的地位。

在推理准确性上,Mistral Large也已经超过了Claude 2、Gemini 1.0 Pro、GPT-3.5等一众为人所熟知的大模型,并且它还支持32k token的上下文窗口,支持精确指令,自带函数调用能力。在推理速度上,Mistral Large甚至还超过了GPT-4还有谷歌刚推出不久的Gemini Pro。

但有眼尖的网友发现,Mistral修改了网站内容,删除了所有提及开源社区义务的内容,这让不少开源大模型爱好者开始担心,Mistral AI也会像OpenAI一样,从开放走向封闭。

不过据媒体对Mistral CEO的采访,未来他们依旧会坚持开源理念,但与此同时,也会推出性能最为强大的闭源模型来参与商业竞争。

从诞生之初,就充满传奇光环

谁能想到,今天这个逼近GPT-4的模型,是来自一家仅仅成立9个月的法国公司。

Mistral AI的创始人Arthur Mensch在1993年时出生于法国。在巴黎综合理工学院和巴黎高等师范学院学习期间,他结识了后来成为Mistral AI联合创始人的Timothée Lacroix和Guillaume Lample。而后两位都曾在Meta AI团队工作过,其中Lample还领导了LLaMA模型的开发。在那时,全球范围内具备构建、训练和优化大型语言模型(LLM)专业经验的人才不超过100人。

Arthur Mensch本人也颇有实力。他在2020年初便加入了谷歌,成为了DeepMind的研究员,专注于提高AI和机器学习系统的效率。在那里,他参与开发了大型语言模型,并以主要作者的身份发表了著名的“Chinchilla论文”,该研究重新定义了人们对AI模型大小、训练数据量及其性能之间关系的认识。

然而随着AI竞赛的升温,Mensch对于大公司AI实验室减少与研究社区分享研究成果的做法感到失望。他所在的团队从一个10人的小团队迅速扩大到70人的大团队,但他觉得在大型科技公司中开发不透明的技术过于官僚化,于是决定离开。

2023年初,他离开了谷歌,和前文所提到的Lacroix和Lample一起创立了Mistral AI。他们的目标是通过更加高效的方法构建和部署AI模型,并坚持开源模型的原则,希望让每个人对自己使用的AI有更多的控制权。

在种子轮融资时,Mistral AI的故事更具传奇色彩:一个6人团队凭借着7页PPT就拿到了8亿欧元的融资。而当前公司的估值已经达到了20亿美元,涨了七倍多。尽管与美国的竞争者相比,所获得的资金并不算多,但他们的目标是成为AI领域中最节省资本的公司。

微软想要打造下一个OpenAI?

在Mistral Large以令人惊喜的性能收获目光之时,微软CEO纳德拉宣布,微软已经和Mistral AI建立了多年合作伙伴关系。这也是微软继OpenAI之后,又再一次地把“真金白银”投给了AI圈的另一家顶流模型公司。

人们不禁怀疑,微软这是想要打造“下一个OpenAI”?

根据公告,微软和Mistral AI的合作将集中在以下三个关键领域:

超算基础结构:微软将通过Azure AI超算基础结构支持Mistral AI,用于AI训练和推理工作负载。

扩展市场:微软和 Mistral AI 将通过 Azure AI Studio 和 Azure 机器学习模型目录中的模型即服务(MaaS)向客户提供 Mistral AI 的高级模型。除 OpenAI 模型外,模型目录还提供了多种开源和商业模型。

人工智能研发:微软和 Mistral AI 将探索为特定客户训练特定目的模型的合作。

毫无疑问,除了OpenAI之外,微软还想给自己的Azure云服务吸引更多客户。并且,微软两头下注,实际上很可能是想要分散风险,并且期望获得更大的影响力。

去年11月,OpenAI经历了CEO奥特曼被解雇而后又重返的董事会风波。而作为OpenAI的最大股东,微软直到消息公布之前的5到10分钟才从OpenAI那里得到消息。尽管在这场风波之后,微软设法在控制 OpenAI 的非营利性董事会中获得了一个无投票权的观察员席位,这让他们对OpenAI的内部运作有了更多的了解,但在一些重大决策上,微软依旧没有投票权。

微软作为OpenAI的最大金主,显然没在OpenAI的决策上取得与之相对应的影响力。因此,微软想要扶持另一家能够与OpenAI对位的企业也是情理之中。

这一点,在路透社对Mistral AI的采访中也得到了体现,Mistral AI承认,作为交易的一部分,微软将持有该公司少数股权,但并没有透露更多细节。而微软这边则仅仅是证实了其对Mistral的投资,在是否持有该公司股权的问题上,微软给出了否定的回答。而这很可能与微软因向OpenAI提供了巨额资金而受到欧洲和美国监管机构的审查有关。

另外,由于Mistral AI是一家法国公司,在语言支持上也更加偏向于欧洲本土语言,因此微软投资Mistral AI也是想要在欧洲建立起自己的AI影响力,在欧洲AI领域站稳脚跟。

与美国不同,欧洲许多国家对AI的态度偏保守,持批判性看法,尤其是数据保护方面。因此投资一家欧洲本土的AI企业,打造一家“欧洲版OpenAI”,也许能够更让人放心。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/413686.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

c语言经典测试题7

1.题1 int main() {int count 0;int x -1;while (x){count;x x >> 1;}printf("%d", count);return 0; } 上述代码的运行结果是什么呢? 我们来分析一下:我们知道在vs中右移操作符的规则是,右边抛弃,左边由符…

什么是智能合约

前言:在介绍智能合约的前提下,需要先介绍一下区块链 一.什么是区块链 区块链实质上是一个去中心化、分布式的可进行交易的数据库或账本,具有下列典型特征: 去中心化:简单来说,在网络上一个或多个服务器瘫…

nn.Linear() 使用提醒

原本以为它是和nn.Conv2d()一样,就看第二个维度的数值,今天才知道,它是只看最后一个维度的数值!!! 例子1 Descripttion: Result: Author: Philo Date: 2024-02-27 14:33:50 LastEditors: Philo LastEditT…

GCN,R-GCN,岭回归,SVR,随机森林,Adaboost

图卷积神经网络(graph convolutional network, GCN),它将卷积神经网络拓展到图结构形式 中,GCN因可以很好地融合图结构数据的结构特征和属性特征并且有较好的组合泛化能力而被广泛使用。 关系图卷积神经网络(relational-graph convolutional network, R-GCN)&#…

排序算法2:选择排序、堆排序、归并排序

选择排序&#xff1a;简单选择排序、堆排序 一、简单选择排序 #include <stdio.h> #include <stdlib.h> #include <time.h> typedef int ElemType; typedef struct{ElemType *elem; //整形指针,申请的堆空间的起始地址存入elem int TableLen; //存储动态数组…

【办公类-21-05】20240227单个word按“段落数”拆分多个Word(成果汇编 只有段落文字 1拆5)

作品展示 背景需求 前文对一套带有段落文字和表格的word进行13份拆分 【办公类-21-04】20240227单个word按“段落数”拆分多个Word&#xff08;三级育婴师操作参考题目1拆13份&#xff09;-CSDN博客文章浏览阅读293次&#xff0c;点赞8次&#xff0c;收藏3次。【办公类-21-04…

jmeter(四)HTTP请求

启动jmeter&#xff0c;建立一个测试计划 这里再次说说怎么安装和启动jmeter吧&#xff0c;昨天下午又被人问到怎样安装和使用&#xff0c;我也是醉了&#xff1b;在我看来&#xff0c;百度能解决百分之八十的问题&#xff0c;特别是基础的问题。。。 安装&#xff1a;去官网…

云服务器ECS价格表出炉_2024年最新价格表——阿里云

2024年最新阿里云服务器租用费用优惠价格表&#xff0c;轻量2核2G3M带宽轻量服务器一年61元&#xff0c;折合5元1个月&#xff0c;新老用户同享99元一年服务器&#xff0c;2核4G5M服务器ECS优惠价199元一年&#xff0c;2核4G4M轻量服务器165元一年&#xff0c;2核4G服务器30元3…

Idea报错

在处理项目中Idea报错&#xff1a; 问题1&#xff1a; Error starting ApplicationContext. To display the conditions report re-run your application with debug enabled. 2024-02-27 17:16:54.427 ERROR 11472 --- [ restartedMain] o.s.b.d.LoggingFailureAnalysisRepo…

京东数据分析(电商数据分析):2024年1月京东白酒TOP10品牌销量销额排行榜

在公布2024年1月京东白酒品牌排行榜之前&#xff0c;分享一个有点意思的现象&#xff1a;在今年龙年春晚“黄金5分钟”的广告片里&#xff0c;白酒局知名的品牌基本都亮相了&#xff08;茅台、五粮液、洋河股份、郎酒、古井贡酒、水井坊&#xff09;&#xff0c;但今年汾酒却缺…

4核8G服务器多少钱?腾讯云和阿里云哪家便宜?

4核8G云服务器多少钱一年&#xff1f;阿里云ECS服务器u1价格955.58元一年&#xff0c;腾讯云轻量4核8G12M带宽价格是646元15个月&#xff0c;阿腾云atengyun.com整理4核8G云服务器价格表&#xff0c;包括一年费用和1个月收费明细&#xff1a; 云服务器4核8G配置收费价格 阿里…

Qt RGB三色灯上位机

今天突发奇想做一个Qt RGB三色灯上位机&#xff0c;刚好手上有一个RGB三色灯和arduion开发板。 我是想实现一个颜色选择器界面然后鼠标点击颜色区域就可以发出rgb的值&#xff0c;然后把这个值通过串口线发送给arduion,arduion再解析出数据发送给RGB三色灯。 实现界面如下&…

代码随想录算法训练营day24

题目&#xff1a;77. 组合 参考链接&#xff1a;代码随想录 回溯法理论基础 回溯三部曲&#xff1a;回溯函数模板返回值以及参数、回溯函数终止条件、回溯搜索的遍历过程。 模板框架&#xff1a; void backtracking(参数) {if (终止条件) {存放结果;return;}for (选择&…

基于YOLOv8/YOLOv7/YOLOv6/YOLOv5的生活垃圾检测与分类系统(Python+PySide6界面+训练代码)

摘要&#xff1a;本篇博客详细讲述了如何利用深度学习构建一个生活垃圾检测与分类系统&#xff0c;并且提供了完整的实现代码。该系统基于强大的YOLOv8算法&#xff0c;并进行了与前代算法YOLOv7、YOLOv6、YOLOv5的细致对比&#xff0c;展示了其在图像、视频、实时视频流和批量…

人工智能之Tensorflow程序结构

TensorFlow作为分布式机器学习平台&#xff0c;主要架构如下&#xff1a; 网络层&#xff1a;远程过程调用(gRPC)和远程直接数据存取(RDMA)作为网络层&#xff0c;主要负责传递神经网络算法参数。 设备层&#xff1a;CPU、GPU等设备&#xff0c;主要负责神经网络算法中具体的运…

IDEA基础——创建Maven项目卡在导入Maven依赖项的解决方案

解决方案 方案一&#xff1a;添加阿里云maven镜像源&#xff08;推荐&#xff09;1. 找到你maven的用户配置文件路径&#xff0c;一般为maven仓库路径的父路径&#xff1a;./xxx/repository的上一个目录2. 在配置文件中添加阿里云镜像&#xff1a; 方案二&#xff1a;下载模板配…

【MySQL】DCL

DCL英文全称是Data Control Language(数据控制语言)&#xff0c;用来管理数据库用户、控制数据库的访问权限。 1. 管理用户 在MySQL数据库中&#xff0c;DCL&#xff08;数据控制语言&#xff09;是用来管理用户和权限的语句集合。通过DCL语句&#xff0c;可以创建、修改、删…

word中的表格跨页了,要如何维持每一页的表头都有标题

在制作 Word 的表格时&#xff0c;因为内容很长&#xff0c;会一直往下延伸&#xff0c; 不过因为是混合内容&#xff0c;也不适合用 Excel 来制作表格&#xff0c;而在延伸表格时有个问题&#xff0c;当表格遇到跨页时&#xff0c;跨页后的第一行是不会像第一页打好的标题列显…

Springboot 多级缓存设计与实现

&#x1f3f7;️个人主页&#xff1a;牵着猫散步的鼠鼠 &#x1f3f7;️系列专栏&#xff1a;Java全栈-专栏 &#x1f3f7;️个人学习笔记&#xff0c;若有缺误&#xff0c;欢迎评论区指正 前些天发现了一个巨牛的人工智能学习网站&#xff0c;通俗易懂&#xff0c;风趣幽默&…

Arcgis实现点位空间位置从上到下从左到右排序

效果 背景 工作项目中经常会遇到需要对网格进行编号&#xff0c;而编号是有一定原则的&#xff0c;比如空间位置从上到下从左到右&#xff0c;或者其它原则&#xff0c;那么都可以通过下面的方式来实现 1、准备数据 点shp文件&#xff0c;查看初始FID字段标注&#xff0c;目…