超越GPT-4o!新王Claude 3.5 Sonnet来啦!免费使用

目录

01 比GPT-4o更智能,比Claude 3 Opus快两倍

02 最强视觉Model

03 使用Claude的新方式:Artifacts

04 安全性和透明度




Anthropic刚刚发布了全新大模型Claude 3.5 Sonnet,号称是迄今为止最智能的模型。

一文几步教你注册使用Claude 3.5 Sonnet!icon-default.png?t=N7T8https://www.zhihu.com/question/647071517/answer/3421076391

据介绍,Claude 3.5 Sonnet是即将推出的Claude 3.5系列的首个版本。



该模型在绝大多数基准评估中都超越了竞品大模型和自家前代最强Claude 3 Opus,同时在运行速度和成本上与Claude 3 Sonnet相当。



没体验过OpenAI最新版GPT-4o?快戳最详细升级教程,几分钟搞定:
升级ChatGPT-4o Turbo步骤icon-default.png?t=N7T8https://www.zhihu.com/pin/1768399982598909952

目前,Claude 3.5 Sonnet已经在Claude.ai和Claude iOS应用程序上免费提供,Claude Pro和Team计划订户可以以更高的速率访问它。

官方地址:https://claude.ai/



此外,Claude 3.5 Sonnet还可以通过Anthropic API、亚马逊云科技Bedrock等渠道使用。

每百万个输入token的价格为3美元,每百万个输出token的价格为15美元,上下文窗口为200k token。



Anthropic表示,其目标是每隔几个月大幅度改进性能、速度和成本之间的权衡曲线。


今年晚些时候将发布Claude 3.5 Haiku和Claude 3.5 Opus。

除了开发下一代大模型,Anthropic还在开发新的模式和功能,以支持更多企业用例,包括与企业应用程序的集成。

团队还在探索诸如Memory之类的功能,使模型能够记住用户的偏好和交互历史,从而实现更加个性化和高效的体验。



01 比GPT-4o更智能,比Claude 3 Opus快两倍


Claude 3真的比GPT-4强吗?icon-default.png?t=N7T8https://www.zhihu.com/question/647113899/answer/3425719762

Claude 3.5 Sonnet在研究生水平推理(GPQA)、本科生水平知识(MMLU)和编码能力(HumanEval)方面设定了新的行业基准。



它在理解细微差别、幽默和复杂指令方面表现出显著进步,并且擅长以自然、亲切的语气撰写高质量内容。

Claude 3.5 Sonnet的运行速度是Claude 3 Opus的两倍。

这种性能提升加上实惠的价格,使Claude 3.5 Sonnet成为复杂任务的理想选择。

在内部代理编码评估中,Claude 3.5 Sonnet解决了64%的问题,优于Claude 3 Opus(解决了38%)。



Anthropic评估了Claude 3.5 Sonnet根据自然语言描述的需求,修复错误或增加功能到开源代码库中的能力。

在获得指导和相关工具后,Claude 3.5 Sonnet可以独立编写、编辑和执行代码,并具有复杂的推理和故障排除功能。

Claude 3.5 Sonnet可以轻松处理代码转换,这对于更新旧版应用程序和迁移代码库特别有效。

不过我们已知的是,公开测试集更难,那么针对公开测试集的人类基线应该会更低。

下表展示了Claude 3.5 Sonnet与其他模型的比较,评估基准包括推理、阅读理解、数学、科学和编码。在所有这些基准测试中,Claude 3.5 Sonnet的表现均优于之前的前沿模型Claude 3 Opus。

我们也可以看到表中Claude 3.5与GPT-4o的对比数据,除了数学方面,得分都比GPT-4o高或接近。

02 最强视觉Model

Anthropic表示,Claude 3.5 Sonnet是其最强的视觉模型,在所有标准视觉基准测试中都超越了前代Claude 3 Opus。

尤其是在需要视觉推理的任务中表现更为明显,例如解释图表、图形或从不完美的图像中转录文本,这是零售、物流和金融服务行业的核心功能。在这些领域,人工智能可以从图像、图形或插图中收集到比单独文本更多的见解。

下图展示了Claude 3.5 Sonnet与Claude 3 Opus、GPT-4o、Gemini 1.5 Pro在视觉数学推理、科学图表、视觉问答、图表QA、文件视觉QA任务中的性能比较。

03 使用Claude的新方式:Artifacts

Anthropic在Claude.ai上推出了Artifacts,这是一项扩展用户与Claude交互的新功能。当用户要求Claude生成代码片段、文本文档或网站设计等内容时,这些工件会出现在对话旁边的专用窗口中。

这创建了一个动态工作空间,用户可以在其中实时查看、编辑和构建Claude的创作,将AI生成的内容无缝集成到他们的项目和工作流程中。

Artifacts预览功能标志着Claude从对话式AI向协作工作环境的演变,并将很快扩展到支持团队协作。未来,团队将能够安全地将他们的知识、文档和正在进行的工作集中在一个共享空间中,而Claude则按需充当队友。

04 安全性和透明度

Anthropic表示,他们对模型进行了严格的测试,并致力于减少其被滥用的可能性。Anthropic安全团队对Claude 3.5 Sonnet在化学、生物、放射性和核(CBRN)风险、网络安全和自主能力领域进行了评估,最后将Claude 3.5 Sonnet分类为AI安全等级2(ASL-2)模型,表明它不会构成灾难性伤害的风险。

此外,作为对安全和透明度承诺的一部分,Anthropic还与外部专家合作测试和完善这一最新模型中的安全机制。


如何使用WildCard正确方式打开GPT-4o,目前 WildCard 支持的服务非常齐全,可以说是应有尽有!

官网有更详细介绍:WildCard



推荐阅读:

Claude 3真的比GPT-4强吗?

更强大Mamba-2正式发布啦!!!

黎曼猜想取得重大进展!!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/730761.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

硬件开发笔记(二十一):外部搜索不到的元器件封装可尝试使用AD21软件的“ManufacturerPart Search”功能

若该文为原创文章,转载请注明原文出处 本文章博客地址:https://hpzwl.blog.csdn.net/article/details/139869584 长沙红胖子Qt(长沙创微智科)博文大全:开发技术集合(包含Qt实用技术、树莓派、三维、OpenCV…

英文字母表

目录 一 设计原型 二 后台源码 一 设计原型 二 后台源码 namespace 英文字母表 {public partial class Form1 : Form{public Form1(){InitializeComponent();}private void Form1_Load(object sender, EventArgs e){foreach (var item in panel1.Controls){if (item ! null)…

数据仓库的实际应用示例-广告投放平台为例

数据仓库的数据分层通常包括以下几层: ODS层:存放原始数据,如日志数据和结构化数据。DWD层:进行数据清洗、脱敏、维度退化和格式转换。DWS层:用于宽表聚合值和主题加工。ADS层:面向业务定制的应用数据层。…

【大数据】—二手车用户数据可视化分析案例

项目背景 在当今的大数据时代,数据可视化扮演着至关重要的角色。随着信息的爆炸式增长,我们面临着前所未有的数据挑战。这些数据可能来自社交媒体、商业交易、科学研究、医疗记录等各个领域,它们庞大而复杂,难以通过传统的数据处…

掌握数据魔方:Xinstall引领ASA全链路数据归因新纪元

一、引言 在数字化时代,数据是App推广和运营的核心驱动力。然而,如何准确获取、分析并应用这些数据,却成为了许多开发者和营销人员面临的痛点。Xinstall作为一款专业的App全渠道统计服务商,致力于提供精准、高效的数据解决方案&a…

Linux开发讲课8--- linux的5种IO模型

一、这里IO是什么 操作系统为了保护自己,设计了用户态、内核态两个状态。应用程序一般工作在用户态,当调用一些底层操作的时候(比如 IO 操作),就需要切换到内核态才可以进行 服务器从网络接收的大致流程如下&#xff1…

拍卖商城开发要点源码及功能分析

要创建一个正规的拍卖商城平台,需要遵循一系列步骤,确保平台的合法性、专业性和用户体验。以下是一个详细的步骤指南: 一、明确平台定位与规划 确定拍卖商城平台的目标市场、用户群体和主要拍卖品类。 制定平台的发展规划和战略目标&#…

gorm 学习笔记 五:自定义数据类型和枚举

一:Json类型 Info保存到数据库时,通过Value()转化为json,读取出来的时候 json字符串自动转成结构体Info type Info struct {Status string json:"status"Addr string json:"addr"Age int json:"age"…

无人机比赛有哪些?

无人机比赛项目可是多种多样,精彩纷呈呢! 常见的比赛项目包括S形绕桩赛、平台起降赛、应用航拍、投掷物品和定点飞行等。这些项目不仅考验无人机的性能,更考验飞行员的操控技巧。 在S形绕桩赛中,飞行员需要操控无人机快速而准确…

云计算技术高速发展,优势凸显

云计算是一种分布式计算技术,其特点是通过网络“云”将巨大的数据计算处理程序分解成无数个小程序,并通过多部服务器组成的系统进行处理和分析这些小程序,最后将结果返回给用户。它融合了分布式计算、效用计算、负载均衡、并行计算、网络存储…

初识 GPT-4 和 ChatGPT

文章目录 LLM 概述理解 Transformer 架构及其在 LLM 中的作用解密 GPT 模型的标记化和预测步骤 想象这样⼀个世界:在这个世界里,你可以像和朋友聊天⼀样快速地与计算机交互。那会是怎样的体验?你可以创造出什么样的应用程序?这正是…

市场价格到底是因为什么而变动?

在外汇及广泛的金融市场中,影响金融工具价格起伏的因素纷繁复杂。然而,万变不离其宗,无论是哪个市场,价格的最终决定力量始终是供需之间的平衡法则。 对于外汇、大宗商品等金融市场而言,表面上似乎受宏观经济数据、央…

分享HTML显示2D/3D时间

效果截图 实现代码 <!DOCTYPE html> <head> <title>three.jscannon.js Web 3D</title><meta charset"utf-8"><meta name"viewport" content"widthdevice-width,initial-scale1,maximum-scale1"><meta n…

基于组件的架构:现代软件开发的基石

目录 前言1. 基于组件的架构概述1.1 什么是组件&#xff1f;1.2 组件的分类 2. 基于组件的架构的优势2.1 提高代码的可重用性2.2 增强系统的灵活性2.3 简化维护和升级2.4 促进团队协作 3. 实现基于组件的架构3.1 识别和定义组件3.2 设计组件接口3.3 组件的开发和测试3.4 组件的…

Python 爬取淘宝指定搜索商品评论 标题 销量 计算sign

只需要替换原来的Cookie和token即可使用&#xff0c;自动计算对应链接地址的sign直接使用即可。需要注意是一个账号爬取过多会有验证码 import json import hashlib import random import timeimport pandas as pd import requestsresults []def fetch_review_list(datas, md…

张大哥笔记:5种信息差赚钱模式

从古至今&#xff0c;赚钱最快的路子就一个&#xff0c;而且从未改变&#xff0c;那就是信息差&#xff01;在商业活动中&#xff0c;信息不对称现象普遍存在&#xff0c;如果你善于利用这些信息差的话&#xff0c;就可以赚到钱&#xff01; 1、价格的信息差 商品价格在不同地…

【LLM-多模态】高效多模态大型语言模型综述

一、结论写在前面 模型规模的庞大及训练和推理成本的高昂&#xff0c;限制了MLLMs在学术界和工业界的广泛应用。因此&#xff0c;研究高效轻量级的MLLMs具有巨大潜力&#xff0c;特别是在边缘计算场景中。 论文深入探讨了高效MLLM文献的领域&#xff0c;提供了一个全面的视角…

FLASH闪存

一、FLASH简介 1、FLASH简介 &#xff08;1&#xff09;STM32F1系列的FLASH包含程序存储器、系统存储器和选项字节三个部分&#xff0c;通过闪存存储器接口&#xff08;外设&#xff09;可以对程序存储器和选项字节进行擦除和编程 &#xff08;2&#xff09;读写FLASH的用途…

Setapp AI 怎么样,值得订阅吗?

Setapp 是一款提供 240 多款 Mac 软件库&#xff0c;可以满足 Mac 和 iOS 用户的各种需求。只需支付一笔订阅费&#xff0c;就可以使用一系列应用程序&#xff0c;这些应用程序可以简化任务、提高创造力和组织工作流程。不过&#xff0c;Setapp 并不只注重应用程序的数量&#…

Transformer预测 | 基于Transformer的风电功率多变量时间序列预测(Matlab)

文章目录 预测效果文章概述模型描述程序设计参考资料预测效果 文章概述 Transformer预测 | 基于Transformer的风电功率多变量时间序列预测(Matlab) Transformer 模型本质上都是预训练语言模型,大都采用自监督学习 (Self-supervised learning) 的方式在大量生语料上进行训练,…