Cohere For AI 推出了 Aya,这是一款覆盖超过 100 种语言的大型语言模型(LLM)

 每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

想要加入 Aya 项目,您可以访问 Aya 项目的官方网站 (https://aya.for.ai/?ref=txt.cohere.com&{query})进行注册并开始您的探索之旅。此外,您还可以在 Cohere Playground (https://dashboard.cohere.com/welcome/login?redirect_uri=%2Fplayground%2Fgenerate%3Fmodel%3Dc4ai-aya%26ref%3Dtxt.cohere.com%26%257Bquery%257D%3D)中尝试 Aya 模型,或者下载模型和数据集,(https://cohere.com/research/aya?ref=txt.cohere.com&{query})以便深入研究和利用这一开源资源。

Cohere For AI 的研究团队,也就是 Cohere 的非营利性研究实验室 C4AI,今日宣布了一项激动人心的进展:推出了一款名为 Aya 的全新、开源、大规模多语言生成式大型语言模型(LLM),覆盖超过 101 种语言。这一跨越性的创举,使得 Aya 的语言覆盖范围是现有开源模型的两倍多,致力于为那些在大多数市场上高级模型中被大量忽略的语言和文化解锁 LLMs 的强大潜能。

C4AI 团队不仅公开了 Aya 模型,还发布了迄今为止最大的多语言指导微调数据集,包含 513 百万条数据,涵盖 114 种语言。这个庞大的数据集汇集了全球各地母语和流利的说话者的珍贵注释,旨在确保 AI 技术能够有效服务于之前访问受限的广泛全球用户。

Aya 的问世标志着机器学习社区在处理大规模多语言 AI 研究方面的范式转变,不仅仅是技术上的进步,更是研究方法、地点及参与者的变化。随着 LLMs 和 AI 的普遍应用改变了全球技术格局,许多社区因现有模型的语言限制而处于无法得到支持的状态。这种差距不仅影响了生成 AI 对全球受众的适用性和有效性,还可能加剧已经存在的技术发展差距。大多数模型由于主要依赖英语及其他几十种语言作为训练资源,往往带有固有的文化偏见。

为了填补这一差距,Aya 项目得以启动,汇集了来自 119 个国家的超过 3000 名独立研究人员的力量。Aya 团队在提升弱势语言性能方面取得了显著成就,特别是在自然语言理解、总结和翻译等复杂任务上展现出超越现有开源多语言模型的能力。在与现有最优开源模型进行的基准测试中,Aya 的表现远超 mT0 和 Bloomz,人类评估得分达到 75%,在各项模拟胜率测试中得分为 80-90%。

此外,Aya 还扩展了对 50 多种之前未被服务的语言的覆盖,包括索马里语、乌兹别克语等。尽管专有模型很好地服务了世界上最常用的一些语言,Aya 为数十种代表性不足的语言提供了前所未有的开源模型支持。

Aya 项目还发布了包含 513 百万条提示和完成项的 Aya 数据集,涵盖了 114 种语言。这一巨大的数据集是由世界各地的流利说话者创建的,它们为选定的数据集创建模板并增强了精心策划的数据集列表。这个数据集中的许多语言在指导式数据集中之前没有任何代表。这使得 Aya 数据集成为了开发者和研究人员宝贵的、大规模的高质量语言数据仓库。

C4AI 团队以 Apache 2.0 许可证发布 Aya 模型和数据集,旨在扩大对多语言进步的访问权。通过这个许可证,学术界、民间机构和小公司可以利用 Aya 模型和数据产生更广泛的影响。

Aya 将成为未来开放科学项目的基础,并期待持续提升其能力。为了加入这项开放科学倡议并确保您的语言得到代表,欢迎访问 Aya 项目网站注册并开始参与。您还可以在 Cohere Playground 尝试 Aya 模型或下载模型和数据集。

为了深入了解这项研究及其背后的团队,C4AI 将在 2 月 16 日(星期五)举办一场虚拟活动,分享更多关于新 Aya 模型的信息。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/388605.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

安卓自定义画板

包含功能: 包含 获取当前画板的截图、设置画笔样式、获取画笔样式、设置画笔宽度、获取画笔宽度、设置画笔颜色、获取画笔颜色、加载图片、获取图片位图对象、设置图片位图对象,并在画布上绘制图片、撤销上一步操作、重做上一步撤销的操作、清空所有绘图…

VScode中配置 C/C++ 环境 | IT拯救者

文章目录 0 引言1. 下载编辑器VScode2. 下载编译器MinGW并解压3. 将MinGW添加至环境变量4. 配置VScode插件5. 运行代码6. 调整和优化7. 提示8. 例行格式条款9. 例行格式条款 0 引言 由于VScode毛毛张使用不习惯,因此配置教程记不住,不过毛毛张看到一篇不…

论文阅读-PIM-tree:一种面向内存处理的抗偏移索引

论文名称:PIM-tree: A Skew-resistant Index for Processing-in-Memory 摘要 当今的内存索引性能受到内存延迟/带宽瓶颈的限制。Processing-in-memory (PIM) 是一种新兴的方法,可能通过实现低延迟内存访问,其聚合内存带宽随 PIM 节点数量扩…

力扣1732. 找到最高海拔(前缀和)

Problem: 1732. 找到最高海拔 文章目录 题目描述思路及解法复杂度Code 题目描述 思路及解法 1.求取数组gain的大小 n n n; 2.定义一个大小为 n 1 n 1 n1的数组preSum; 3.先求取前 n n n个元素的前缀和,再最后单独处理preSum[n];其中preSum[n] preSum[n - 1] gai…

Leetcode-54. 螺旋矩阵

给你一个 m 行 n 列的矩阵 matrix ,请按照 顺时针螺旋顺序 ,返回矩阵中的所有元素。 示例 1: 输入:matrix [[1,2,3],[4,5,6],[7,8,9]] 输出:[1,2,3,6,9,8,7,4,5]示例 2: 输入:matrix [[1,2,3,…

LeetCode 每日一题 Day 62 - 75

1686. 石子游戏 VI Alice 和 Bob 轮流玩一个游戏,Alice 先手。 一堆石子里总共有 n 个石子,轮到某个玩家时,他可以 移出 一个石子并得到这个石子的价值。Alice 和 Bob 对石子价值有 不一样的的评判标准 。双方都知道对方的评判标准。 给你…

【论文精读】CLIP

摘要 以往基于自然语言监督的图像表示学习方法如ConVIRT,只在一二十万张图像的小规模数据集上训练,限制了该方法能发挥的性能。故本文研究了在大规模自然语言监督下训练的图像分类器的性能,具体有: 借助互联网上大量公开可用数据…

【Android】使用Apktool反编译Apk文件

文章目录 1. 下载Apktool1.1 Apktool官网下载1.2 百度网盘下载 2. 安装Apktool3. 使用Apktool3.1 配置Java环境3.2 准备Apk文件3.3 反编译Apk文件3.3.1 解包Apk文件3.3.2 修改Apk文件3.3.3 打包Apk文件3.3.4 签名Apk文件 1. 下载Apktool 要使用Apktool,需要准备好 …

如何手机搜学法减分答案? #媒体#职场发展

今天分享拥有拍照搜题、文字搜题、语音搜题、多重搜题等搜题模式,可以快速查找问题解析,加深对题目答案的理解。 1.证件照全能管家(APP) 一个非常好用的证件照APP 常用的证件照尺寸和底色都有、日常的证件照编辑完全够用&#…

【PyQt6】QScreen 屏幕截屏

文章目录 0 环境1 简介2 QScreen 类2.1 获取 QScreen 的对象2.2 QScreen 的常见信息 3. 示例代码 0 环境 - Python 3.12.1 - PyQt6 6.6.1 pip install PyQt6 PyQt6-Qt6 6.6.1 默认安装PyQt6-sip 13.6.…

C语言学习day13:for循环练习(生成随机数)

题目: 通过程序随机一个1-100的数,用户通过键盘输入数字 看是否匹配,匹配成功则跳出循环,失败则继续循环。 思路: 然后生成一个随机数需要写成死循环,同时需要有其他的出口可以写一个提示,比…

书生浦语大模型实战营-课程作业(3)

下载sentence_transformer的代码运行情况。sentence_transformer用于embedding(转向量) 本地构建持久化向量数据库。就是把txt和md文件抽取出纯文本,分割成定长(500)后转换成向量,保存到本地,称…

压缩PDF的大小-Adobe Acrobat Pro

经常遇到上传的pdf太大,无法成功上传。 今天找到一个方法: 打开Adobe Acrobat Pro软件 → 文件 → 另存为其他(H)... →缩小大小的PDF 版本选择 4.0 最低的版本。 文件由9M变为1.5M。

Vi 和 Vim 编辑器

Vi 和 Vim 编辑器 vi 和 vim 的基本介绍 Linux 系统会内置 vi 文本编辑器 Vim 具有程序编辑的能力,可以看做是 Vi 的增强版本,可以主动的以字体颜色辨别语法的正确性,方便程序设计。 代码补完、编译及错误跳转等方便编程的功能特别丰富&…

C++ bfs反向搜索(五十七)【第四篇】

今天我们来学习bfs的反向搜索。 1.反向搜索 反向搜索:是从目标状态出发进行的搜索,一般用于终点状态唯一,起点状态有多种,且状态转移是可逆的(无向边)情况。 例题:在一个长度为 n 的坐标轴上&a…

备战蓝桥杯---图论之最短路dijkstra算法

目录 先分个类吧: 1.对于有向无环图,我们直接拓扑排序,和AOE网类似,把取max改成min即可。 2.边权全部相等,直接BFS即可 3.单源点最短路 从一个点出发,到达其他顶点的最短路长度。 Dijkstra算法&#x…

大学建筑专业的搜题软件?大学搜题工具中的高级搜索功能有哪些? #学习方法#微信#经验分享

学习和考试是大学生生活中不可避免的一部分,而在这个信息爆炸的时代,如何快速有效地获取学习资源和解答问题成为了大学生们共同面临的难题。为了解决这个问题,搜题和学习软件应运而生。今天,我将为大家介绍几款备受大学生青睐的搜…

AJAX——接口文档

1 接口文档 接口文档&#xff1a;描述接口的文章 接口&#xff1a;使用AJAX和服务器通讯时&#xff0c;使用的URL&#xff0c;请求方法&#xff0c;以及参数 传送门&#xff1a;AJAX阶段接口文档 <!DOCTYPE html> <html lang"en"><head><meta c…

《数电》理论笔记-第3章-常用组合逻辑电路及MSI组合电路模块的应用

一&#xff0c;编码器和译码器 1&#xff0c;编码器 编码:用由0和1组成的代码表示不同的事物。 编码器:实现编码功能的电路&#xff0c; 常见编码器:普通编码器、优先编码器、二进制编码器二-十进制编码器等等 1.1 三位二进制普通编码器和三位二进制优先编码器 1分58秒开始 …

Cocos2dx-lua ScrollView[一]基础篇

一.ScrollView概述 cocos游戏中ScrollView控件大量使用,95%以上的项目都会使用ScrollView,个别游戏可能全部使用翻页的滑动效果。如果想要精通Cocos的UI开发,精通ScrollView控件非常关键,因此对ScrollView的使用进行总结很有必要。 下文缩写说明:sv = ScrollView, item代…