Meta悄咪咪的发布多款AI新模型

大模型技术论文不断,每个月总会新增上千篇。本专栏精选论文重点解读,主题还是围绕着行业实践和工程量产。若在某个环节出现卡点,可以回到大模型必备腔调或者LLM背后的基础模型重新阅读。而最新科技(Mamba,xLSTM,KAN)则提供了大模型领域最新技术跟踪。若对于具身智能感兴趣的请移步具身智能专栏。技术宅麻烦死磕AI架构设计。

Meta 的基础 AI 研究 (FAIR) 团队发布了一些最新的AI模型,包括可以处理和生成多模态文本和图像的 Chameleon、Multi-token prediction模型以及文本到音乐模型JASCO。

Chameleon于之前介绍过,可以点击链接查看。与大多数的大型语言模型不同,多模态变色龙可以处理文本和图像的任意组合作为输入,也可以处理文本和图像的任意组合作为输出。Meta 在非商业许可下发布 7B 和 34B 变体,仅用于研究目的。

在Chameleon之前不久,Meta还展示了一种开发更好、更快的大型语言模型的新方法:multi-token prediction。该团队能够证明,在训练 AI 语言模型时,多Token预测可以提高性能、连贯性和推理能力。Meta 正在发布用于在非商业许可下完成代码的预训练模型,仅用于研究目的。

multi-token prediction在训练过程中,该模型通过共享中继和 4 个专用输出头同时预测 4 个未来令牌。在推理过程中,只使用下一个标记输出头。可选地,其他三个磁头可用于加快推理时间。

在推理过程中,所提出的架构的最基本用途是使用下一个标记预测头,同时丢弃所有其他标记。但是,可以利用额外的输出头来加速从下一个标记预测头进行解码,这里主要使用自推测解码方法,例如分块并行解码 (Stern,2018) 等算法。

举个简单的例子,假如正确的序列是12345ABC,下图显示,multi-token prediction损失函数为结果Token分配了更高的隐式权重,其中除“5 → A”之外的所有转换都易于预测。

由于“5 → A”会比较困难过度且难以预测,因此通过其相关“3→ A”、...、“5→ C”这种多头的校正将会更加顺利。

通过multi-token prediction,与传统的模型相比,13B参数模型在 HumanEval 上解决的问题 12%,在MBPP上多解决 17%。另一个好处是,使用 4个标记预测训练的模型在推理时速度提高了3倍,即使批量大小也是如此。

除此之外还发布了文本到音乐的模型JASCO。除了文本之外,它还接受各种输入,例如和弦或节拍,以改善对生成的音乐输出的控制。

借助AudioSeal,Meta发布了一种音频水印技术,即使在较长的音频片段中也可以识别和标记 AI生成的语音。与其他方法相比,据说该方法的速度要快 485 倍。AudioSeal 根据商业许可发布。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/728241.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

数据资产与用户体验优化:深入挖掘用户数据,精准分析用户需求与行为,优化产品与服务,提升用户体验与满意度,打造卓越的用户体验,赢得市场认可

一、引言 在数字化时代,数据已经成为企业最宝贵的资产之一。通过深入挖掘和分析用户数据,企业能够精准把握用户需求和行为,从而优化产品与服务,提升用户体验和满意度。这不仅有助于企业在激烈的市场竞争中脱颖而出,还…

ECM和MEMS技术在心肺声学监测中的应用

心肺疾病是全球范围内导致死亡的主要原因。因此,对这些疾病迹象的准确和快速评估对于为患者提供适当的医疗保健至关重要。心血管疾病最重要的迹象之一是心脏周期的异常。大多数呼吸系统疾病则表现为呼吸周期的异常。有多种方法可以监测心脏和肺部的周期。听诊是监测…

windows服务器下jenkins c语言打包的一些经验share

前言 因为一些原因,需要从linux环境下的jenkins 打包c语言转移到使用windows环境下的jenkins打包c语言,从转移的过程中,发现了一些问题和解决方案,故在此和各位运维工程师分享一下。 一、windows 下的c语言编译环境配置 这边就…

串口rx + RAM + LCD

REVIEW 昨天摸鱼怪发现高两位的数据写入or读出存在问题: RAM 串口的简单应用-CSDN博客 1. 今日摸鱼任务 UART_RX RAM LCD 来显示一下是 rx or tx 的问题 2. 代码部分 rx_ram_lcd.v module rx_ram_lcd(input clk ,input reset_n ,input uart_rx ,output …

【服务器03】之【Navicat完整版破解】

首先清掉电脑所有Navicat组件 虽然被卸载掉了但是没有彻底清理掉Navicat组件 在原装盘里找到Navicat清楚碎片 清空之后开始下载 navicat16 https://www.alipan.com/s/GTvP93mn3sU 点击链接保存,或者复制本段内容,打开「阿里云盘」APP ,无需…

ChatGPT提效:告别CRUD

前言 随着AIGC的发展以及大语言模型的成熟,各种AI应用眼花缭乱,以至于我们看到各种新奇的应用都会产生焦虑,我有一天会不会被淘汰?且看后文分析。AIGC的发展与逐渐成熟已经是无可逆转的局势,既然我们打不过为何不加入…

财务RPA是什么?解析财务RPA的定义和功能

RPA技术作为人工智能领域的代表之一,因其可以高效解决各种基于一定规则的重复而复杂的业务流程,帮助企业节约人工成本并提升效率,如今已经普及到各行各业。而财务领域存在大量规则明确但机械重复的工作和业务流程,这些工作场景是财…

干货 | 使用 Navicat BI 解锁数据的力量

商业智能(BI)是一种将数据转化为可执行洞察的实践,能够帮助业务领导者提升整体业绩。这个过程中最重要的一个阶段是数据探索和可视化阶段,它涉及通过报告将数据组织并转化为有意义的信息。为了让数据更易于理解,BI 专业…

了解CDN:提升网络性能和安全性的利器

在当今的数字时代,网站性能和安全性是每一个网站管理员必须关注的核心问题。内容分发网络(CDN,Content Delivery Network)作为解决这一问题的重要工具,逐渐成为主流。本文将详细介绍CDN的定义、作用及其工作原理&#…

【投稿优惠|稳定出版】2024年体育、健康与食品安全国际学术会议(ICSHFS 2024)

【投稿优惠|稳定出版】2024年体育、健康与食品安全国际学术会议(ICSHFS 2024) 2024 International Conference on Sports, Health, and Food Safety(ICSHFS 2024) 会议简介: 2024年体育、健康与食品安全国际学术会议(ICSHFS 2024…

Linux源码学习笔记01-Linux内核源码结构

Linux内核特性 是一个类Unix操作系统,但不是简化的Unix;不仅继承了Unix的特征,还有其他特性。 Linux内核的组织形式:整体式的结构,方便每个领域的开发人员参与开发;Linux进程调度方式简单高效&#xff1a…

打字速度对编程的影响大吗?

知道打字速度对编程的影响大吗?实际上,在编程的世界里,关键在于思考,而非打字速度。要明白,编程与日常聊天中的打字有着本质的区别,如果编程仅仅取决于打字速度,那它岂不就等同于打字员的工作了…

Rust中的数据抓取:代理和scraper的协同工作

一、数据抓取的基本概念 数据抓取,又称网络爬虫或网页爬虫,是一种自动从互联网上提取信息的程序。这些信息可以是文本、图片、音频、视频等,用于数据分析、市场研究或内容聚合。 为什么选择Rust进行数据抓取? 性能:…

Nature正刊!亚利桑那大学博士生陈舒立一作兼通讯最新成果!揭示亚马逊雨林干旱响应的生物地理学机制

2024年6月19日,国际知名学术期刊《Nature》发表了一项美国亚利桑那大学Scott Saleska教授团队的最新成果“Amazon forest biogeography predicts resilience and vulnerability to drought”。通过将森林样地调查数据与遥感观测相结合系统揭示了亚马逊雨林干旱响应的…

动态轮换代理在多账户管理中有何用处?

如果您要处理多个在线帐户,选择正确的代理类型对于实现流畅的性能至关重要。但最适合这项工作的代理类型是什么? 为了更好地管理不同平台上的多个账户并优化成本,动态住宅代理IP通常作用在此。 一、什么是轮换代理? 轮换代理充当…

东芝-Soft Limit 报警及其解决办法

灵感来源与生活,在生活中总能有意想不到的惊喜,下面来看看小编今天的惊喜!!! 今天不知道怎么了,有人来找就说是机器人坏了,一直报警,重启关机回原点也没有用。 意外到来,…

Dynamics 365 on-premise 隐藏高级查找导出按钮

提示 着急可以直接看结果代码部分 背景 Dynamics 365 on-premise中有个高级查找的功能,查询的结果支持导出,如下图 业务反馈这个有数据安全风险,要修改显示规则。 一开始想着能用RibbonWorkbench改,就很爽快得答应了业务。结果用RibbonWorkbench改不了。 反复尝试 既…

【EI稳定检索】2024年经济发展与商业文化国际会议(ICEDBC 2024)

2024年经济发展与商业文化国际会议 2024 International Conference on Economic Development and Business Culture 会议简介 2024年经济发展与商业文化国际会议即将在贵阳市盛大开幕。随着全球经济的持续发展,商业文化日益成为推动经济进步的重要力量。为了深入探讨…

力扣144A

文章目录 1. 题目链接2. 题目代码3. 题目总结4. 代码分析 1. 题目链接 Arrival of the General 2. 题目代码 #include<iostream> using namespace std;int heightOfSoldier[110];int main(){int numberOfSoldier;cin >> numberOfSoldier;int maxHeight -1;int mi…

DataOps真能“降本增效”?

在各行各业中&#xff0c;越来越多的公司开始重视收集数据&#xff0c;并寻找创新方法来获得真实可行的商业成果&#xff0c;并且愿意投入大量时间和金钱来实现这一目标。 据IDC称&#xff0c;数据和分析软件及云服务市场规模在 2021 年达到了 900 亿美元&#xff0c;随着企业继…