Cohere Command R+:企业级可扩展大模型

Command R+ 是一种最先进的 RAG 优化模型,旨在处理企业级工作负载,并首先在 Microsoft Azure 上提供

今天,我们推出了 Command R+,这是我们最强大、可扩展的大型语言模型 (LLM),专为在实际企业用例中表现出色而构建。Command R+ 加入了我们的 R 系列 LLM,专注于平衡高效率和高精度,使企业能够超越概念验证,并通过 AI 进入生产。

NSDT工具推荐: Three.js AI纹理开发包 - YOLO合成数据生成器 - GLTF/GLB在线编辑 - 3D模型格式在线转换 - 可编程3D场景编辑器 - REVIT导出3D模型插件 - 3D模型语义搜索引擎 - Three.js虚拟轴心开发包 - 3D模型在线减面 - STL模型在线切割 

Command R+ 与我们最近推出的 Command R 模型一样,具有 128k 令牌上下文窗口,旨在提供一流的功能:

  • 高级检索增强生成 (RAG) 与引用以减少幻觉
  • 10 种主要语言的多语言覆盖,支持全球业务运营
  • 工具用于自动化复杂的业务流程

我们的最新模型建立在 Command R 的关键优势之上,并进一步全面提高了性能。Command R+ 在可扩展市场类别中优于类似模型,并且在关键业务关键功能上与价格高得多的模型竞争。在实现这一目标的同时,我们始终致力于保护数据隐私和安全。

随着我们继续为全球企业社区服务,我们很自豪地宣布与 Microsoft Azure 进行新的合作,以加速企业 AI 的采用。

Microsoft Azure AI 平台 CVP John Montgomery 表示:“与 Cohere 的合作突显了我们致力于引领 AI 革命的决心,将创新的 Command R+ 模型引入 Azure AI。“这种合作关系体现了我们致力于提供一套全面的人工智能工具的承诺,使企业能够在遵守最高安全性和合规性的同时实现更多目标。我们共同为企业人工智能的可能性设定了新的基准,促进了技术增强人类能力和创新的未来。

(左)Azure 上可用模型在三个关键功能上的性能比较:多语言、RAG 和工具使用。 性能是下图中列出的基准模型得分的平均值。 (右)比较 Azure 上可用模型的每百万个输入和输出令牌成本。

从今天开始,开发人员和企业可以首先在 Azure 上访问 Cohere 的最新模型,并且很快将在 Oracle 云基础设施 (OCI) 以及未来几周内的其他云平台上提供。 Command R+ 也将立即在 Cohere 的托管 API 上提供。

甲骨文应用开发与战略集团副总裁 Miranda Nash 表示:“企业显然正在寻求高度准确和高效的人工智能模型,例如 Cohere 最新的 Command R+,以投入生产。” “Cohere 的模型集成在 Oracle NetSuite 和 Oracle Fusion Cloud 应用程序中,正在帮助客户解决实际业务问题并提高财务、人力资源和营销等领域的生产力。”

1、行业领先的 RAG 解决方案

RAG 已成为企业采用LLM并使用自己的专有数据对其进行定制的基础构建块。 Command R+ 建立在 Command R 在 RAG 用例中的卓越性能之上。

Command R+ 针对高级 RAG 进行了优化,可提供企业级、高度可靠且可验证的解决方案。 新模型提高了响应准确性,并提供了减轻幻觉的内联引用。 此功能可帮助企业利用人工智能进行扩展,以快速找到最相关的信息来支持跨业务职能部门的任务,例如财务、人力资源、销售、营销和客户支持等一系列部门的任务。

(左)使用结合文本流畅性、引用质量和整体实用性的整体评分方案得出人类面对面偏好结果。 引用是在与源文档的一大块相关的摘要内的句子级别上进行测量的。 我们使用了由 250 个高度多样化的文档和摘要请求组成的专有测试集,以及类似于 API 数据的复杂指令。 基线模型经过广泛的提示设计,具有很少的镜头提示(Sonnet)和先进行两步总结,然后进行引文插入(GPT4),而 Command R+ 使用我们的 RAG-API。

(右)由各种模型支持的多跳 REACT 代理的准确性,可以访问从维基百科(HotpotQA)和互联网(Bamboogle 和 StrategyQA)检索的相同搜索工具。 HotpotQA 和 Bamboogle 的准确性是通过提示评估者(Command R、GPT3.5 和 Claude3-Haiku 以减少已知的模型内偏差)的三向多数投票来判断的,我们使用人工注释对 1000 个示例子集进行了验证。 StrategyQA 的准确性是使用以是/否判断结尾的长格式答案来判断的。 我们使用 (Shin et al. 2023)、(Press et al. 2023) 和 (Chen et al. 2023) 的测试集。

2、使用工具自动化复杂的业务工作流程

大型语言模型的一个主要承诺是它们不仅能够摄取和生成文本,而且能够充当核心推理引擎:能够做出决策并使用工具来自动执行需要智能来解决的困难任务。 为了提供此功能,Command R+ 配备了工具使用功能,可通过我们的 API 和 LangChain 访问,以无缝地自动化复杂的业务工作流程。

我们的模型系列与工具相结合,可用于解决重要的企业用例,例如自动保持客户关系管理 (CRM) 任务、活动和记录最新。 此功能有助于将我们的模型应用程序从简单的聊天机器人升级为强大的代理和研究工具,以提高生产力。

Command R+ 中的新增功能现在支持多步骤工具使用,允许模型在多个步骤中组合多个工具来完成困难的任务。 Command R+甚至可以在尝试使用工具但失败时进行自我纠正,例如在工具中遇到错误或故障时,使模型能够多次尝试完成任务并提高成功率。

我们使用 Microsoft 的 ToolTalk (Hard) 基准 (Farn & Shin 2023) 和 Berkeley 的函数调用排行榜 (BFCL) (Yan et al. 2024) 评估会话工具使用和单轮函数调用功能。 对于 ToolTalk,预测的工具调用是根据真实情况进行评估的,总体对话成功指标取决于模型调用所有工具调用并避免不良操作(即具有不需要的副作用的工具调用)的可能性。 对于 BFCL,我们使用 2024 年 3 月的版本,并在评估中包含了错误修复(所有模型都从中受益),并报告了可执行子类别的平均功能成功率得分。 我们通过额外的人工评估清理步骤验证了我们的错误修复,以防止漏报。

3、全球业务运营的多语言支持

Command R+ 旨在为尽可能多的人、组织和市场提供服务。 在与公司的讨论中,我们遇到了对多语言功能的巨大需求,这些功能可以帮助组织更无缝地跨地区和文化工作。 这就是为什么我们构建 Command R+ 以擅长全球商业的 10 种主要语言:英语、法语、西班牙语、意大利语、德语、葡萄牙语、日语、韩语、阿拉伯语和中文。

这种多语言功能使用户能够从大量数据源生成准确的响应,无论其母语是什么,帮助我们为地理位置不同的全球公司提供产品功能和工具。 我们期待看到世界各地的企业尝试我们的 Command R 型号系列来为其业务运营和产品提供动力。

FLoRES(法语、西班牙语、意大利语、德语、葡萄牙语、日语、韩语、阿拉伯语和中文)和 WMT23(德语、日语和中文)翻译任务的模型比较。

Command R+ 不仅是一个强大的多语言模型,而且 R 系列模型还配备了一个分词器,它对非英语文本的压缩效果比市场上其他型号使用的分词器要好得多,能够实现高达 57% 的成本降低 。

比较 Cohere、Mistral (Mixtral) 和 OpenAI 标记器针对不同语言生成的标记数量(作为 Cohere 标记器生成的标记数量的倍数)。 Cohere 分词器生成的表示相同文本的标记要少得多,尤其是非拉丁脚本语言的减少量特别大。 例如,在日语中,OpenAI 标记生成器输出的标记数量是 Cohere 标记生成器的 1.67 倍。

4、供货情况和定价

Cohere 与所有主要云提供商以及受监管行业和隐私敏感用例的本地云提供商合作,以使我们的模型普遍可用。

要了解你的公司如何开始在生产规模上部署 Command R+,请联系我们的销售团队。

我们最新的 Command R+ 模型现已在 Cohere 的演示环境中,为任何人提供通过简单的聊天界面测试模型的实践体验。

Cohere API Pricing$ / M input tokens$ / M output tokens
Command R$0.50$1.50
Command R+$3.00$15.00

5、我们对数据隐私和安全的承诺

凭借 Command R 型号系列,我们始终致力于保护客户数据、隐私和安全,帮助企业安心使用我们的 AI。 我们始终以数据隐私为核心构建产品,并为客户提供额外的保护,包括针对侵权索赔的版权保证。 除非客户希望我们这样做,否则我们不会访问客户的数据。 我们提供私人LLM部署和选择退出数据共享的选项。

6、公司评价

“许多组织现在专注于从生成式人工智能实验转向规模化实施。 通过我们的基础模型定制服务,埃森哲正在帮助客户将企业数据情境化,以推动整个企业的有形价值。”埃森哲首席人工智能官关兰表示。 “Command R+ 等能够处理大型生产工作负载的新模型的推出将为我们的客户提供新的机会,我们期待利用 Cohere 的功能来帮助我们的客户根据成本、性能和准确性优化生成式 AI,以满足他们的特定需求 ”。
“规模是开发、应用和评估人工智能的数据基础。在我们帮助企业简化优化和部署人工智能解决方案的过程中,我们期待看到 R+ 将如何帮助客户在保持性能的同时优化 TCO。Command R+ 的新 RAG 多语言功能将使我们能够在其他用例中部署 Cohere。我们很高兴继续发展与 Cohere 的合作伙伴关系。” –Arun C Murthy,Scale AI 首席产品和技术官
“使用 Cohere 的模型构建使我们能够准确回答客户有关全球就业法、工资法规和税收的问题。 借助 RAG 优化的 Command R+ 模型,我们可以利用我们广泛的专有数据库构建一个解决方案,提供准确且可验证的信息,同时从成本角度来看可扩展。” –Willson Cross,无边界人工智能首席执行官
“我们很高兴与 Cohere 合作,将 Command R 和 Command R+ 深度集成到 LangChain 生态系统中。 Command R+ 在 RAG 和 Tool Use 方面是一个功能异常强大的模型,这是我们看到开发人员使用 LangChain 构建的两个顶级功能。” ——Harrison Chase,浪链联合创始人兼首席执行官
“在 Microsoft Azure 上推出 Cohere 的 Command R+ 模型对 Atomicwork 来说是一个巨大的胜利,因为它有助于加速我们为企业客户提供的现代服务管理服务。现在,我们可以为客户提供由 Cohere 的 Command R+ 模型功能支持的一流企业人工智能。 我们的客户可以在值得信赖的云平台上改善他们的数字工作场所体验并提高企业生产力。” ——Vijay Rayapati,Atomicwork 联合创始人兼首席执行官

原文链接:Command R+企业LLM - BimAnt

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/544586.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Go语言图像处理深入指南:探索 `image/draw` 标准库

Go语言图像处理深入指南:探索 image/draw 标准库 引言基础知识图像类型颜色模型draw 包概览 image/draw 的基本用法创建和操作图像复制和粘贴图像遮罩和图像合成 高级技巧自定义图像处理性能优化多线程图像处理 实战案例图像滤镜实现动态图像生成图像处理工具开发 总…

2024年MathorCup妈妈杯C题终极资料分享(微调后可直接提交的数据结果+多种可视化呈现)

【腾讯文档】2024年妈杯认证杯资料汇总说明 https://docs.qq.com/doc/DSExyRGhNUm1pTHh4 我们直接将我们认为最为合适数据结果以及最好用的运行代码进行了整理以便大家可以在最后一天无法运行代码急需结果或者不会写代码时,提供帮助。、 % 数据加载 data readtab…

Vivado编译常见错误合集(一)

引言:本文对Vivado编译时常见的错误或者关键警告做一些梳理汇总,便于日后归纳总结。 1. 普通IO引脚约束为时钟时报错。 原因:Xilinx Vivado开发环境编译HDL时,对时钟信号设置了编译规则,如果时钟由于硬件设计原因分配…

Ceph [OSDI‘06]论文阅读笔记

原论文:Ceph: A Scalable, High-Performance Distributed File System (OSDI’06) Ceph简介及关键技术要点 Ceph是一个高性能、可扩展的分布式文件系统,旨在提供出色的性能、可靠性和可扩展性。为了最大化数据和元数据管理的分离,它使用了一…

MYSQL执行过程和顺序详解

一、前言 1.1、说明 就MySQL在执行过程、sql执行顺序,以及一些相关关键字的注意点方面的学习分享内容。 在参考文章的基础上,会增加自己的理解、看法,希望本文章能够在您的学习中提供帮助。 如有错误的地方,欢迎指出纠错&…

vue中使用axios获取不到响应头Content-Disposition的解决办法

项目中,后端返回的文件流; 前端需要拿到响应头里的Content-Disposition字段的值,从中获取文件名 在控制台Headers中可以看到相关的字段和文件名,但是在axios里面却获取不到 如果想要让客户端访问到相关信息,服务器不仅要在head…

嵌入式单片机 TTL电平、232电平、485电平的区别和联系

一、简介 TTL、232和485是常见的串口通信标准,它们在电平和通信方式上有所不同, ①一般情况下TTL电平应用于单片机外设,属于MCU/CPU等片外外设; ②232/485电平应用于产品整体对外的接口,一般是片外TTL串口转232/485…

<计算机网络自顶向下> CDN

视频服务挑战 规模性异构性:不同用户有不同的能力(比如有线接入和移动用户;贷款丰富和受限用户)解决方法是:分布式的应用层面的基础设施CDN 多媒体:视频 视频是固定速度显示的一系列图像的序列&#xff…

【ubuntu20.04】安装GeographicLib

下载地址 GeographicLib: Installing GeographicLib 我们是ubuntu20.04 ,所以下载第一个 GeographicLib-2.3.tar.gz 接着跟着官方步骤安装,会出错!!!!马的 官方错误示例:tar xfpz Geographi…

YOLOV5 + 双目相机实现三维测距(新版本)

文章目录 YOLOV5 双目相机实现三维测距(新版本)1. 项目流程2. 测距原理3. 操作步骤和代码解析4. 实时检测5. 训练6. 源码下载 YOLOV5 双目相机实现三维测距(新版本) 本文主要是对此篇文章做一些改进,以及解释读者在…

微软搭建零售新媒体创意工作室大举抢占数字营销广告市场

“微软新零售创意工作室新平台利用生成式人工智能,在几秒钟内轻松定制横幅广告。零售媒体预计到2026年将成为一个价值1000亿美元的行业。” 零售媒体在过去几年中发展迅速。根据eMarketerOpens在新窗口的数据,预计到2024年,仅美国的零售媒体…

基于粒子群优化的配电网重构

一、配电网重构原理 配电网重构是指在满足配电网运行基本约束的前提下,通过改变配电网中一个或多个开关的状态对配电网中一个或多个指标进行优化。通过配电网重构,可以在不增加设备投资的情况下,充分发挥配电系统的潜力,提高系统…

【C语言】每日一题,快速提升(1)!

调整数组使奇数全部都位于偶数前面 题目: 输入一个整数数组,实现一个函数 来调整该数组中数字的顺序使得数组中所有的奇数位于数组的前半部分 所有偶数位于数组的后半部分 解题思路: 给定两个下标left和right,left放在数组的起始…

【Web】VS Code 插件及快捷键

专栏文章索引:Web 有问题可私聊:QQ:3375119339 目录 一、安装步骤 二、插件 1.Chinese (Simplified) (简体中文) 2.open in browser 3.vscode-icons 4.Live Server 5.Live Server Preview 6.翻译(英汉词典) 三、快捷键 1.缩放代码…

Vivado ILA Capture Control 模式与 Advanced Trigger的功能使用以及TSM(触发状态机)的编写

文章目录 一、前言二、ILA的基本功能使用以及局限性2.1 ILA的调用2.2 ILA波形窗口观察2.3 ILA基本功能的局限性:如何观测低频的数据? 二、Capture Control 功能介绍三、Advanced Trigger功能以及TSM编写3.1 触发状态机的写法3.2 设置Advanced Trigger3.3…

MYSQL中的ER图

1.首先学习如何设计数据,在此之前我们先学会画出我们的规划图 利用Axure RP 9 然后进行以后的操作。其实非常简单看看就会

NODE MCU (ESP8285-ESP8266)用Arduino lDE 2.3.2烧录系统后串口监控不打印问题

问题: Arduino lDE 2.3.2,集合DOIT ESP-Mx DevKit板子,烧录代码后,串口监视器 打印不出来调试数据 分析: Arduino lDE 2.3.2工具提示,不支持调试 板载flash按钮无需按下,即可烧录系统,由于烧录和调试共用串口,所以怀疑是Arduino lDE 2.3.2在烧录时设置了串口的配置…

Hello 算法10:搜索

https://www.hello-algo.com/chapter_searching/binary_search/ 二分查找法 给定一个长度为 n的数组 nums ,元素按从小到大的顺序排列,数组不包含重复元素。请查找并返回元素 target 在该数组中的索引。若数组不包含该元素,则返回 -1 。 # 首…

Ubuntu 22.04 开机自动挂载webdav - 设置开机自启脚本 - 解决坚果云webdav无写入权限

效果图: 前言: 1)亲测/etc/fstab的办法没有成功自动挂载,换成传统的rc.local可以解决; 2)rc-local.service是系统自带的一个开机自启服务,但是在 ubuntu 20.04 上,该服务默认没有开…

基于物理原理的p-GaN HEMT动态导通电阻SPICE建模

来源:Physics-Based SPICE Modeling of Dynamic ON-State Resistance of p-GaN HEMTs(TPEL 23年) 摘要 这封快报介绍了一种新型基于物理学原理的SPICE建模方法,专门针对氮化镓基p型门极高电子迁移率晶体管(p-GaN HEM…