35亿元!开源类ChatGPT平台Mistral AI,再获巨额融资

12月6日,彭博消息,开源类ChatGPT平台Mistral AI获得4.5亿欧元(近35亿元)融资,估值近20亿美元(142亿元)。本次由英伟达、 Salesforce等投资。

Mistral AI的开源大语言模型Mistral 7B主打参数小、能耗低、性能强等特点,并且允许商业化。支持生成文本/代码、数据微调、总结内容等,目前在github有4500颗星。

值得一提的是,Mistral AI曾在没有发布任何产品的情况下,获得1.13亿美元种子轮融资,这也是欧洲科技史上最大的种子轮融资之一。

开源地址:https://github.com/mistralai/mistral-src

帮助文档:https://docs.mistral.ai/

API接口:https://docs.mistral.ai/api

图片

相比元宇宙,刚过完1岁生日的ChatGPT经受住了商业落地、用户受众等多重考验,并且带动了一大批科技公司参与到生成式AI变革中。

目前,主要分为闭源和开源两大阵营。在Meta的Llama打响第一枪后,开源大语言模型领域涌现出了Writer、百川智能、Together.ai、Mistral AI等一大批优秀企业,同时获得了资本市场的认可。这些厂商也坚信,开源才是大模型通向AGI的捷径之一。

早在今年6月「AIGC开放社区」就介绍过Mistral AI,当时对其印象非常深刻。因为没有发布任何产品,官网只有3句话:我们正在组建一支世界一流的技术团队,来开发最好的生成式 AI 模型。

图片


今年6月Mistral AI的官网内容

我们在欧洲开展业务,总部在法国巴黎。如果你在AI领域拥有丰富的研究、开发经验,请联系我们。

当时就凭这三句话,便融了1.13亿美元种子轮融资,估值达到2.6亿美元。通常这种企业要么蹭一波热度拿完钱,随便改改模型坐着等死;

要么就是扫地僧级别的技术大牛,一出手便名震天下。从本次融资结果来看,Mistral AI属于后者确实有两下子。

公开资料显示,Mistral AI的三位联合创始人Timothée Lacroix 、Guillaume Lample和Arthur Mensch来头不小,拥有大厂履历和知名项目的成功经验同时也是大学校友。

图片


Guillaume、Arthur、Timothee

Timothée和Guillaume曾在Meta的AI研究部门工作,并领导了LLaMA的开发,这也是类ChatGPT开源模型的鼻祖。Arthur曾在谷歌的 AI 研究实验室DeepMind工作。

图片

Mistral AI核心团队

产品方面,Mistral AI在今年9月27日推出的Mistral 7B是目前最强开源大语言模型,在所有基准测试中均优于Llama 2 13B;在许多基准测试上优于或与Llama 1 34B相当;在代码测试的表现与CodeLlama 7B相当。

图片

为了使模型能以更快的速度、更小的能耗进行推理,Mistral AI分别使用了分组查询注意力和滑动窗口注意力两大机制

分组查询注意力是对标准注意力机制的一种改进,通过对查询进行分组来减少计算复杂性。在 Transformer 模型中,注意力机制通常涉及查询、键和值的三组向量。

在标准的自注意力机制中,每个查询都会与所有的键进行匹配,这在序列很长时会导致巨大的计算负担。

图片

而分组查询注意力通过将多个查询合并成一个组来工作。然后,每个组的查询向量只与一部分键向量进行交互,而不是与所有键向量交互,整体效率非常高效。

滑动窗口注意力是一种在序列处理任务中用来限制注意力机制的范围并减少计算量的技术。在这种方法中,每个元素的注意力不是对整个序列计算,而是仅限于其附近的一个窗口内的元素。

通过这种方式,模型的每个部分只需要处理窗口内的信息,从而降低了每个注意力计算中涉及的元素数目。

这不仅减少了计算需求,还可以限制模型的上下文范围,有助于模型关注局部信息。

本文素材来源Mistral AI官网、维基百科,如有侵权请联系删除

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/223231.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Apache Doris 详细教程(一)

1、Doris简介 1.1、doris概述 Apache Doris 由百度大数据部研发(之前叫百度 Palo,2018 年贡献到 Apache 社区后, 更名为 Doris ),在百度内部,有超过 200 个产品线在使用,部署机器超过 1000 台…

PIKA,一个神奇的AI工具

随着人工智能技术的不断发展,越来越多的创新性工具开始涌现,为各行各业带来了巨大的变革。其中,视频生成AI工具PIKA,以其独特的功能和广泛的应用领域,吸引了众多用户的关注。本文将详细介绍PIKA的功能、特点以及应用前…

学习设计模式的网站

Refactoring and Design Patternshttps://refactoring.guru/

前端CSS(层叠样式表)总结

CSS2总结 一、CSS基础 1. CSS简介 CSS 的全称为:层叠样式表 ( Cascading Style Sheets ) 。CSS 也是一种标记语言,用于给 HTML 结构设置样式,例如:文字大小、颜色、元素宽高等等。 简单理解: CSS 可以美化…

运维之远程桌面连接失败问题排查

背景:同一局域网,可以ping通但是远程连接不上,排查一下问题。 1、被远程计算机是否允许远程连接 2、被远程计算机防火墙是否允许 3、被远程计算机远程桌面服务是否正常 4、查看用户权限

openGauss学习笔记-145 openGauss 数据库运维-备份与恢复-备份与恢复概述

文章目录 openGauss学习笔记-145 openGauss 数据库运维-备份与恢复-备份与恢复概述145.1 逻辑备份与恢复145.2 物理备份与恢复145.3 闪回恢复145.4 三种备份恢复类型对比145.5 备份方案与策略 openGauss学习笔记-145 openGauss 数据库运维-备份与恢复-备份与恢复概述 数据备份…

Webgis学习总结

前言: 作者跟随视频学习了webgis内容进行如下学习复习总结 参考:新中地学习笔记 WebGIS第一课:测试高德API并通过: 注册申请高德API成为开发者,创建自己的项目和key进行项目初始化,可以使用JS API官方文…

DateTimePicker之禁用当前日期时间之前的数据以及校验函数

1、禁用当前日期时间功能效果 2、需要用到的属性 disabledDate: 禁用日期。disabledTime: 禁用时间。 3、相关代码 fieldProps{{disabledDate(date) {return date && date < moment().startOf(day);},disabledTime: (date: any) > disabledTime(date),}}//相关…

【微服务】spring循环依赖深度解析

目录 一、循环依赖概述 1.2 spring中的循环依赖 二、循环依赖问题模拟 2.1 循环依赖代码演示 2.2 问题分析与解决 2.2.1 使用反射中间容器 三、spring循环依赖问题解析 3.1 spring中的依赖注入 3.1.1 field属性注入 3.1.2 setter方法注入 3.1.3 构造器注入 3.2 spri…

Allure生成测试报告这样生成,阿里p10都直呼牛逼

Allure是一个开源的测试报告生成框架&#xff0c;提供了测试报告定制化功能&#xff0c;相较于我们之前使用过pytest-html插件生成的html格式的测试报告&#xff0c;通过Allure生成的报告更加规范、清晰、美观。 pytest框架支持使用Allure生成测试报告&#xff0c;接下来让介绍…

Vue3 Element-Plus 一站式生成动态表单:简化前端开发流程

文章目录 1. 引言2. Vue3 和 Element-Plus 简介2.1 Vue32.2 Element-Plus 3. 动态表单的需求与挑战4. Vue3 和 Element-Plus 动态表单的优势4.1 Vue3的组合式API4.2 Element-Plus的表单组件 5. 一站式生成动态表单的实现5.1 准备工作5.2 创建动态表单组件5.3 使用动态表单组件 …

ELK实现日志收集

1.介绍 ELK是三个开源软件的缩写&#xff0c;分别表示&#xff1a;Elasticsearch , Logstash, Kibana , 它们都是开源软件。 Elasticsearch是个开源分布式搜索引擎&#xff0c;提供搜集、分析、存储数据三大功能。它的特点有&#xff1a;分布式&#xff0c;零配置&#xff0c…

Sprite Editor图片编辑器的使用_unity基础开发教程

Sprite Editor图片编辑器的使用 什么是Sprite Editor安装插件&#xff08;3D项目&#xff09;切片方式Automatic&#xff1a;自动切片Grid By Cell Size&#xff1a;按照像素大小进行切片Grid By Cell Count&#xff1a;按照个数进行切片Isometric Grid&#xff1a;等距网格切片…

Java---线程讲解(一)

文章目录 1. 进程和线程2. 多线程实现方式3. 设置和获取线程名称4. 线程优先级5. 线程控制6. 线程的生命周期 1. 进程和线程 1. 进程&#xff1a;是正在运行的程序&#xff0c;是系统进行资源分配和调用的基本单位。每一个进程都有它自己的内存空间和系统资源。 2. 线程&#x…

7.上传project到服务器及拉取服务器project到本地、更新代码冲突解决

1.上传project到SVN服务器 1.在eclipse中&#xff0c;从show view里调出SVN资源库视图 2.在SVN资源库窗口的空白位置右键选择新建资源库位置 3.填好服务器的地址 4.资源库导入成功,SVN资源库视图下出现导入的资源库 5.新建project 6.写好project的初始版本 7.右键project --&…

如何摆脱你是一个葡萄酒新手的身份?

刚接触葡萄酒的人可能会有一种模糊的感觉&#xff0c;即他们喜欢白葡萄酒、红葡萄酒或玫瑰红葡萄酒&#xff0c;但他们可能不知道如何描述为什么&#xff0c;也不理解必要的术语。 把葡萄酒词汇想象成类似于讨论食物是很有用的&#xff0c;它是甜的、酸的还是辣的&#xff1f;对…

Jmeter接口测试:jmeter导入和导出接口的处理

JMeter测试导入接口 利用Jmeter测试上传文件&#xff0c;首先可根据接口文档或者fiddler抓包分析文件上传的接口&#xff1b;如下图&#xff1a; 以下是我通过fiddler所截取的文件上传的接口 1、填写导入接口的信息 查看文件上传栏下的填写信息&#xff1a; 文件名称&#x…

Elasticsearch,Kibana集成,x-pack鉴权配置

Elasticsearch,Kibana集成 Java8环境部署[CentOS7] cd /usr/local/src wget https://repo.huaweicloud.com/java/jdk/8u201-b09/jdk-8u201-linux-x64.tar.gztar -xzvf jdk-8u201-linux-x64.tar.gz -C /usr/local#配置环境变量 vim /etc/profile #文末添加 export JAVA_HOME/us…

docker安装及简单使用(Linux版本)

文章目录 前言一、docker安装二、docker命令pull&#xff08;安装镜像&#xff09;images&#xff08;查看镜像&#xff09;run&#xff08;创建容器&#xff09;删除容器exec&#xff08;进入运行中的容器&#xff09;常用命令 总结如有启发&#xff0c;可点赞收藏哟~ 前言 ht…

路由跳转添加进度条

根据npm官网的步骤&#xff1a; 1.先安装nprogress npm install nprogress 2.引入nprogress和样式文件 import nprogress from nprogress import nprogress/nprogress.css 3.在前置守卫添加进度条的展示 //全局前置守卫 router.beforeEach((to: any, from: any, next: an…