Anthropic 公司最新宣布,他们的 AI 聊天机器人模型击败了 OpenAI 的 GPT-4

  每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

AI初创公司Anthropic,背靠谷歌和数亿美元的风险投资(很可能很快还会增加数亿美元),今天宣布了其最新一代人工智能技术Claude的发布。该公司声称,这款AI聊天机器人在性能上超越了OpenAI的GPT-4。

Anthropic的新一代AI,名为Claude 3,包含了多个模型——Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus,其中Opus是最强大的。Anthropic声称,所有这些模型在分析和预测方面都显示出了“增强的能力”,在特定基准测试中的表现也优于像ChatGPT和GPT-4,以及谷歌的Gemini 1.0 Ultra(但不包括Gemini 1.5 Pro)。

值得注意的是,Claude 3是Anthropic首款多模态的人工智能,意味着它可以分析文本和图片——类似于GPT-4和Gemini的某些版本。Claude 3可以处理照片、图表、图形和技术图纸,能够从PDF、幻灯片和其他文档类型中提取信息。

与一些人工智能竞争对手相比,Claude 3在一个方面做得更好,那就是可以在单个请求中分析多张图片(最多20张)。这使得它能够比较和对比图片,如Anthropic所述。

但是,Claude 3在图像处理方面也有其限制。

Anthropic已禁用模型识别人物——无疑是出于对伦理和法律影响的考虑。公司承认,Claude 3在处理“低质量”图片(低于200像素)时容易出错,并且在涉及空间推理(例如,读取模拟时钟面)和对象计数(Claude 3不能准确计算图像中的对象数量)的任务上存在困难。

至少目前而言,Claude 3也不会生成艺术作品。模型严格用于图像分析。

不论是处理文本还是图像,Anthropic表示,客户通常可以期待Claude 3比其前代模型更好地遵循多步骤指令,产生像JSON这样的结构化输出,并且能够使用英语之外的语言进行对话。得益于“对请求更加细腻的理解”,Claude 3应该更少地拒绝回答问题。不久后,模型还将引用其回答问题的来源,以便用户可以验证。

Anthropic在一篇支持文章中写道:“Claude 3倾向于生成更具表现力和吸引力的回应,”“与我们的旧模型相比,它更易于提示和引导。用户应该发现,他们可以使用更短、更简洁的提示来达到所需的结果。”

这些改进部分源于Claude 3的扩展上下文。

模型的上下文,或上下文窗口,指的是模型在生成输出之前考虑的输入数据(例如,文本)。具有小上下文窗口的模型倾向于“忘记”即使是非常近期的对话内容,导致它们偏离主题——经常以问题性的方式。作为一个额外的好处,大上下文模型可以更好地把握它们所接收的数据的叙事流,并生成更富有上下文的回应(至少理论上是这样)。

Anthropic表示,Claude 3最初将支持200,000令牌的上下文窗口,相当于约150,000个单词,某些客户将获得高达1,000,000令牌的上下文窗口(约700,000个单词)。这与谷歌最新的人工智能模型Gemini 1.5 Pro相当,后者也提供了高达一百万令牌的上下文窗口。

然而,仅仅因为Claude 3比之前的版本有所提升,并不意味着它是完美的。

在一篇技术白皮书中,Anthropic承认Claude 3并非免疫其他人工智能模型所面临的问题,即偏见和幻觉(即,编造事实)。与某些人工智能模型不同,Claude 3不能搜索网络;模型只能使用2023年8月之前的数据回答问题。而且,虽然Claude支持多种语言,但它在某些“低资源”语言上的流利程度不及英语。

但Anthropic承诺将在接下来的几个月中频繁更新Claude 3。

“我们并不认为模型智能已经达到其极限,我们计划在接下来的几个月内发布Claude 3模型家族的[增强功能],”公司在博客文章中写道。

Opus和Sonnet现已通过网页、Anthropic的开发控制台和API、亚马逊的Bedrock平台以及谷歌的Vertex AI提供。Haiku将于今年晚些时候推出。

以下是定价细节:

Opus:每百万输入令牌15美元,每百万输出令牌75美元 Sonnet:每百万输入令牌3美元,每百万输出令牌15美元 Haiku:每百万输入令牌0.25美元,每百万输出令牌1.25美元 那么,Claude 3的全局观是什么呢?

嗯,正如我们之前报道的,Anthropic的雄心是创造一个下一代的“AI自我教学”算法。这样的算法可以用来构建虚拟助手,它们可以回答电子邮件、执行研究、生成艺术品、书籍等——我们已经通过GPT-4和其他大型语言模型尝试了其中的一些功能。

Anthropic在上述博客文章中暗示了这一点,称它计划添加使Claude 3具备开箱即用能力的功能,通过让Claude与其他系统交互、"交互式"编码和提供"高级代理能力"。

这最后一点让人想起OpenAI报道的雄心,即建立一个软件代理来自动执行复杂任务,如将数据从文档转移到电子表格或自动填写费用报告并将其输入会计软件。OpenAI已经提供了一个API,允许开发人员将“代理式体验”构建到他们的应用中,而Anthropic似乎也致力于提供可比的功能。

我们能从Anthropic那里看到图像生成器吗?坦白说,我会感到惊讶。如今,图像生成器是许多争议的主题,主要是出于版权和偏见相关的原因。谷歌最近被迫禁用了其图像生成器,因为它以对历史背景的滑稽无视注入了多样性。而且,一些图像生成器供应商正在与艺术家进行法律斗争,这些艺术家指控他们通过在未提供补偿或甚至信用的情况下,使用他们的作品训练GenAI而获利。

我很好奇看到Anthropic训练GenAI的技术进化,“宪法AI”,该公司声称使其GenAI的行为更易于理解、更可预测并且需要时更简单地调整。宪法AI旨在提供一种方式,使AI与人类意图对齐,让模型使用一组简单的指导原则回答问题和执行任务。例如,对于Claude 3,Anthropic表示,它添加了一个原则——根据众包反馈——指导模型对残疾人士表现出理解并易于接近。

无论Anthropic的最终目标是什么,它都在长期规划中。根据去年5月泄露的一份推介文稿,该公司计划在未来12个月左右的时间里筹集高达50亿美元——这可能只是它需要保持与OpenAI竞争的基线。(毕竟,训练模型并不便宜。)它已经在谷歌和亚马逊分别承诺的资本和承诺中分别获得了20亿美元和40亿美元,以及其他支持者合计超过十亿美元。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/432526.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

设计MySQL数据表的几个注意点

最近合作搞项目,发现了很多问题。特别的,数据库层面上的问题更为致命。记录一下,希望后面看到博客的同学们注意。 注意:以下观点只用于一般情况下的单体、微服务,不保证适用所有场景。 一、ID问题 ID名称问题 如下图…

四平方和c++

题目 输入样例: 5输出样例: 0 0 1 2 思路 首先想到的是使用三重循环求出 a,b,c,d 可以通过 n - a - b - c 得到。理论时间复杂度为O(1000 * 1000 * 1000) O(10^9)。因此需要想办法降低循环层数。 考虑使用两个双重循…

Unreal Engine5记录 02简单的第三人称游戏

导航视口 选择对应的第三人称游戏选项,并选择项目创建的位置,点击创建 创建之后,会打开一个默认的导航视口 点击运行,进入窗口 你就像进入了一个游戏关卡,这个和你玩的第三人称游戏一样(类似吃鸡&#xf…

React-useEffect

1.概念 说明:用于在React组件中创建不是由事件引起而是由渲染本身引起的操作,比如发送 A列AX请求,更改DOM等。 2.案例 // useEffect用于组件不是由事件引起的而是由渲染本身引起的操作,如ajax,更改Dom等。 import { useEffect,…

图解目标检测的现代历史

任务分类 图像分类 根据图像的主要对象对图像进行分类。 目标定位 预测包含主要对象的图像区域。然后,可以使用图像分类来识别该区域内的物体 目标检测 定位和分类出现在图像中的所有对象。这个任务通常包括:确定区域,然后对其中的对象进行…

SpringCloudGateway工作原理与链路图

SpringCloudGateway基本介绍 Spring Cloud Gateway 构建于Spring Boot 2.x、 Spring WebFlux和Project Reactor之上。因此,在使用 Spring Cloud Gateway 时,您可能不会应用许多熟悉的同步库(例如 Spring Data 和 Spring Security)和模式。 Spring Cloud Gateway 需要 Sprin…

javaWebssh文玩竞价管理系统myeclipse开发mysql数据库MVC模式java编程计算机网页设计

一、源码特点 java ssh文玩竞价管理系统是一套完善的web设计系统(系统采用ssh框架进行设计开发),对理解JSP java编程开发语言有帮助,系统具有完整的源代码和数据库,系统主要采用B/S模式开发。开发环境为TOMCAT7.0…

1909_Arm Cortex-M3编程模型

1909_Arm Cortex-M3编程模型 全部学习汇总: g_arm_cores: ARM内核的学习笔记 (gitee.com) 编程模型的部分除了单独的核心寄存器描述之外,它还包含有关处理器模式和软件执行和堆栈的特权级别的信息。 处理器有两种模式,分别是线程模式和Handle…

2024年【山东省安全员C证】考试试卷及山东省安全员C证复审模拟考试

题库来源:安全生产模拟考试一点通公众号小程序 山东省安全员C证考试试卷根据新山东省安全员C证考试大纲要求,安全生产模拟考试一点通将山东省安全员C证模拟考试试题进行汇编,组成一套山东省安全员C证全真模拟考试试题,学员可通过…

WordPress建站入门教程:小皮面板phpstudy如何安装PHP和切换php版本?

小皮面板phpstudy支持的PHP版本有很多,包括5.2.17、5.3.29、5.4.45、5.5.9、5.6.9、7.0.9、7.1.9、7.2.9、7.3.4、7.3.9、7.4.3、8.0.2、8.2.9。那么我们如何安装其他的php版本和切换网站的php版本呢?只需要简单几步即可,具体如下&#xff1a…

解决前端性能问题:如何优化大量数据渲染和复杂交互?

✨✨祝屏幕前的小伙伴们每天都有好运相伴左右,一定要天天开心!✨✨ 🎈🎈作者主页: 喔的嘛呀🎈🎈 目录 引言 一、分页加载数据 二、虚拟滚动 三、懒加载 四、数据缓存 五、减少重绘和回流 …

is not valid JSON at JSON.parse

在后台读取一个文件里的JSON数据,转换成字符串返回给前端,前端使用JSON.parse转换JSON报错。在将JSON校验和压缩后发现前端还是转换失败。在返回结果的时候可以看见一个小红点 最后排查,不带BOM的识别是Java遗留的一个bug。 解决方案&#…

OSI 的七层模型

OSI七层模型 一般指开放系统 互连参考模型 (Open System Interconnect 简称OSI) 是国际标准化组 织(ISO)和国际电报电话咨询委员会(CCITT)联合制定的开放系统互连参考模型,为开放式互连信息系 统提供了一种功能结构的框架。 应用层:各种应用程序协议,比…

第八篇:预测受众(Predictive audience)技术是如何赋能数字化营销生态的?- 我为什么要翻译介绍美国人工智能科技巨头IAB公司

IAB平台,使命和功能 IAB成立于1996年,总部位于纽约市。 作为美国的人工智能科技巨头社会媒体和营销专业平台公司,互动广告局(IAB- the Interactive Advertising Bureau)自1996年成立以来,先后为700多家媒…

CSS字体样式的使用,先收藏了

CSS 篇 link 与 import 的区别 link 是 HTML 方式, import 是CSS方式link 最大限度支持并行下载, import 过多嵌套导致串行下载,出现 FOUC (文档样式短暂失效)link 可以通过 rel"alternate stylesheet" 指定候选样式浏览器对 lin…

spark 实验二 RDD编程初级实践

目录 一. pyspark交互式编程示例(学生选课成绩统计) 该系总共有多少学生; 该系DataBase课程共有多少人选修; 各门课程的平均分是多少; 使用累加器计算共有多少人选了DataBase这门课。 二.编写独立应用程序实现数…

【深圳五兴科技】Java后端面经

本文目录 写在前面试题总览1、java集合2、创建线程的方式3、对spring的理解4、Spring Boot 和传统 Spring 框架的一些区别5、springboot如何解决循环依赖6、对mybatis的理解7、缓存三兄弟8、接口响应慢的处理思路9、http的状态码 写在前面 关于这个专栏: 本专栏记录…

微信小程序云开发教程——墨刀原型工具入门(页面交互+交互案例教程)

引言 作为一个小白,小北要怎么在短时间内快速学会微信小程序原型设计? “时间紧,任务重”,这意味着学习时必须把握微信小程序原型设计中的重点、难点,而非面面俱到。 要在短时间内理解、掌握一个工具的使用&#xf…

AlibabaCloud微服务:Linux 部署 Sentinel 流量控制

目录 一、实验 1.环境 2.Linux 部署 Sentinel 3. 微服务接入Sentinel配置 二、 问题 1.Linux本地启动Sentinel控制台 2.JDBC连接失败 一、实验 1.环境 (1)主机 表1 主机 系统软件版本IP备注Linuxopenjdk 1.8.0192.168.204.200 maven3.5.0nac…

基于QGIS的研究区域遥感影像裁切下载方法-以岳麓区为例

目录 前言 一、数据说明 1、遥感影像 2、矢量范围 二、按矢量范围导出 1、第一步、导出影像 2、第二步、设置输出格式 3、设置裁切范围 4、设置分辨率 三、按矢量范围掩膜 1、第一步、打开裁剪工具 2、第二步、参数设置 ​编辑 3、执行掩膜 四、webgis支持 1、生成运行…