微软正在自主构建一个名为 MAI-1 的大型语言模型(不依赖 OpenAI)

  每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

据《The Information》报道,微软正致力于打造一个新的大规模 AI 语言模型,名为 MAI-1,有望与谷歌、Anthropic 和 OpenAI 等公司的最先进模型一较高下。这是微软自投资 OpenAI 10 亿美元获取其 AI 模型使用权以来首次自主开发如此规模的 AI 模型。OpenAI 的 GPT-4 不仅为 ChatGPT 提供动力,还驱动了微软的 Copilot 功能。

DeepMind 联合创始人 Mustafa Suleyman 将领导微软的新消费者 AI 部门。

该项目由前 Google AI 高层、曾担任 AI 创企 Inflection 首席执行官的 Mustafa Suleyman 负责。微软于 3 月以 6.5 亿美元的价格收购了该初创公司的大部分员工和知识产权。虽然 MAI-1 或许借鉴了 Inflection 团队带来的技术,但据两位了解项目的微软员工表示,MAI-1 是全新的大型语言模型(LLM)。

拥有大约 5000 亿参数的 MAI-1,将比微软以往的开源模型(如上个月报道的 Phi-3)规模更大,因而需要更多计算能力和训练数据。据报道,MAI-1 与传闻中拥有超过 1 万亿参数的 OpenAI GPT-4 规模相近,并远超 Meta 和 Mistral 的 700 亿参数模型。

MAI-1 的开发体现了微软对 AI 双管齐下的策略,一方面专注于适用于移动设备的小型本地语言模型,另一方面开发由云端驱动的大型最先进模型。苹果据称也在探索类似的策略。这也凸显出微软愿意独立于 OpenAI 进行 AI 开发,目前微软最雄心勃勃的生成式 AI 功能由 OpenAI 技术驱动,包括嵌入 Windows 的聊天机器人。

苹果发布了 8 款针对设备端使用的小型 AI 语言模型。

据消息人士透露,MAI-1 的具体用途尚未确定,其最佳应用将取决于模型的性能。为训练该模型,微软已经部署了一大批 Nvidia GPU 服务器,并从多种来源收集训练数据,包括 OpenAI GPT-4 生成的文本和公共互联网数据。

根据《The Information》援引的消息人士称,视项目进展情况,微软或许最早会在本月的 Build 开发者大会上展示 MAI-1。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/601516.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

IDEA中向Data Sources导入sql文件

IDEA中向Data Sources导入sql文件 开篇 在学习黑马的课程时,时常需要向数据库中导入sql文件生成数据库表,每次都会忘记导入步骤,折腾许久,于是将过程记录下来。 步骤 在Database中选择你要导入的数据库源,如图我想…

Matlab图像中加入脉冲噪声、高斯噪声并用均值滤波、中值滤波进行滤波处理

一、脉冲噪声和高斯噪声简介 脉冲噪声和高斯噪声是两种常见的信号干扰类型,它们的特性和影响各不相同: 脉冲噪声(Impulse Noise): 在图像中,脉冲噪声表现为随机出现的亮点或暗点,这些噪声点通常…

[开发|鸿蒙] DevEco Studio编译构建(笔记,持续更新)

构建体系 编译构建是将应用/服务的源代码、资源、第三方库等,通过编译工具转换为可直接在硬件设备上运行的二进制机器码,然后再将二进制机器码封装为HAP/APP软件包,并为HAP/APP包进行签名的过程。其中,HAP是可以直接运行在模拟器…

FIFO Generate IP核使用——同步复位

在描述FIFO(First In First Out)或其他存储结构的同步复位(Synchronous Reset)功能时,srst(或wr_rst/rd_rst,即写入和读取时钟域的同步复位信号)仅适用于块RAM(Block RAM…

企业为什么需要主数据管理工具?十大热门主数据管理工具盘点

主数据管理是一套综合性的策略和技术,用于协调和管理企业内用于识别关键业务实体(如客户、产品、供应商和员工)的一致性、准确性和统一性的数据。主数据管理的目的是创建一个“单一真相源”,确保在不同部门和系统之间共享的数据保…

AI预警未来:山体滑坡与塌方事故的潜在发现者

在科技日新月异的今天,人工智能(AI)的应用已经渗透到了我们生活的各个领域。而在防灾减灾的领域中,AI技术的引入无疑为我们打开了一扇新的大门。以梅大高速大埔往福建方向K11900m附近发生的路面塌方灾害为例,我们不禁思…

未授权访问:Redis未授权访问漏洞

目录 1、漏洞原理 2、环境搭建 3、未授权访问 4、利用redis未授权写入weshell 5、利用redis未授权反弹shell 6、利用redis未授权实现免密登录 防御手段 从这篇文章开始我就要开始学习各种未授权访问的知识和相关的实操实验了,一共有好多篇,内容主…

navicat premium16.3.9重置

软件下载 官网地址:https://navicat.com.cn/products/ # 准备脚本 1、建一个txt 2、复制以下代码 3、修改文件格式为bat 4、运行bat文件 5、重新打开navicat,试用期重置为14 经测试16.2.3以上版本均可用 echo off set dnInfo set dn2ShellFolder set r…

YOLOv8改进 | 主干篇 | 2024.5全新的移动端网络MobileNetV4改进YOLOv8(含MobileNetV4全部版本改进)

一、本文介绍 本文给大家带来的改进机制是MobileNetV4,其发布时间是2024.5月。MobileNetV4是一种高度优化的神经网络架构,专为移动设备设计。它最新的改动总结主要有两点,采用了通用反向瓶颈(UIB)和针对移动加速器优化…

用脚本写一个日期样式的字符

现在想要诸如此类样式的语句:(过去三个月的) 可以用python脚本写: from datetime import date, timedelta# 获取当前日期 current_date date.today()# 定义过去三个月的时间间隔 three_months_ago current_date - timedelta(da…

<网络安全>《79 概念讲解<第十二课 物联网常用协议-(远距离非蜂窝网络)-终端设备>》

协议简称全称名称内容说明ZigBee也称紫蜂低速短距离传输的无线通信协议一种高可靠的无线数传网络,主要特色有低速、低耗电、低成本、支持大量网上节点、支持多种网上拓扑、低复杂度、快速、可靠、安全。ZigBee技术是一种新型技术,主要是依靠无线网络进行…

用一个故事告诉你协程到底是什么

神秘使者 “久闻Java语言跨越平台,框架众多,不过二十年功夫,就已晋升天下第一编程语言,今日一见,果然名不虚传呐!” “使者先生您过奖了,咱们快些走,国王陛下已经等候多时了” 今…

电机控制系列模块解析(18)—— 位置观测器

一、简要综述 无传感器控制策略中观测器的分类,主要分为两类:基于模型的方法(Model Based)和基于显著性的方法(Saliency Based)。在此借用一张文献综述的图片,下面将列出下面借用图片中的各个分…

电脑(爱好者) :基础知识1 了解你的电脑

读懂cpu 您想了解关于您的电脑的信息吗?CPuz是一款常用的系统信息工具,可以提供关于CPU、主板、内存等硬件信息的详细情况。您可以下载并运行该软件,然后查看您的电脑硬件配置信息。 图片来源于网络 CPU-Z 简介 CPU-Z 是一款功能强大且易于使…

【边东随笔】(2) 北美鳄龟的生存智慧:细心 | 信心 | 狠心 | 耐心

非常谨慎,在水域中会先找到躲避将自身安置于有利地形 ( 细心 )。 浮出水面换气,水体稍有异动就会退回水中,优秀掠食者对自身优势牢牢的把握( 信心 )。 非常优雅,猎食动作不存在任何花里胡哨&a…

Spring Boot3.x集成Disruptor4.0

Disruptor介绍 Disruptor是一个高性能内存队列,研发的初衷是解决内存队列的延迟问题(在性能测试中发现竟然与I/O操作处于同样的数量级)。基于Disruptor开发的系统单线程能支撑每秒600万订单,2010年在QCon演讲后,获得了业界关注。2011年&…

css--控制滚动条的显示位置

各种学习后的知识点整理归纳,非原创! ① direction属性 滚动条在左侧显示② transform:scaleY() 滚动条在上侧显示 正常的滚动条会在内容超出规定的范围后在区域右侧和下侧显示在有些不正常的需求下会希望滚动条在上侧和左侧显示自己没有想到好的解决方案…

Vue3:menu导航栏出现多个同一跳转路径的菜单处理

文章目录 需求整理实现思路实现过程 需求整理,实现思路 最近公司想将之前老的项目整理出来,因为这个老项目内容太杂什么页面都往里面塞,导致菜单特别多,公司就像将这个老的项目迁出来,这个旧的项目本来是后端PHP写的。…

面试分享——订单超30分钟未支付自动取消用什么实现?如何使用Redis实现延迟队列?

目录 1.订单超时未支付自动取消,这个你用什么方案实现? 2.如何使用Redis实现延迟队列 2.1实验步骤 2.2实现生产可用的延迟队列还需关注什么 3.总结 电商场景中的问题向来很受面试官的青睐,因为业务场景大家都相对更熟悉,相关…

禹晶、肖创柏、廖庆敏《数字图像处理(面向新工科的电工电子信息基础课程系列教材)》Chapter 5插图

禹晶、肖创柏、廖庆敏《数字图像处理(面向新工科的电工电子信息基础课程系列教材)》 Chapter 5插图