OpenAI发布GPT-4.5:功能非常特殊,推理很贵

今天凌晨4点,OpenAI进行了在线技术直播,发布了最新模型GPT-4.5。

GPT-4.5与之前的模型相比,本次最大的亮点是加上了“情商”,这也是目前所有大模型最缺、最难的功能。

此外,GPT-4.5 在SimpleQA上的测试数据显示,超过OpenAI o1、OpenAI o3-mini并且幻觉非常低,是目前OpenAI最强大模型之一。

图片

OpenAI联合创始人兼首席执行官Sam Altman特意发文对GPT-4.5进行了详细解读。

对我来说,GPT-4.5是第一个让我感觉像是在和一个有思想的人对话的模型。有好几次,我都不禁靠在椅背上,惊讶于能从人工智能那里得到真正有用的建议。

坏消息:GPT-4.5是一个大型且成本高昂的模型。我们本真的很想同时向Plus和Pro用户推出,但我们的业务增长迅猛,GPU 已经不够用了。下周我们会增加数万个 GPU,到时候就会向 Plus 用户推出。(很快还会有数十万个 GPU 到位,我敢肯定,大家会把我们能配备的每一个 GPU 都充分利用起来。)

我们也不想这样,但要精准预测导致 GPU短缺的增长高峰实在太难了。

提前告知一下:这不是一个推理模型,也不会在基准测试中表现得特别突出。是一种不同类型的智能,有着我从未感受过的神奇之处。真的很期待大家去体验!

图片

看了Sam这段话估计大家心里都有一个共同想法吧,既然推理这么贵,需要那么多GPU,是时候让DeepSeek再次出手量化一下了吧~

这不网友直接就替咱说出来了,你们一直严重依赖大量的 GPU,而中国人在没有这么多 GPU 的情况下也取得了同样的成果。为什么不像中国人那样专注于效率呢?

作为一名交易员,我只是不希望当 Deepseek用十分之一的计算力推出比 GPT-4.5 更强大的产品时,交易市场再次陷入动荡。

图片

刚刚看了一下API价格,确实贵的离谱…

图片

这听起来像是一个在大量录制的人类之间电话通话内容上进行训练的模型。

图片

增加服务之后,API价格会下降吗?

图片

真是令人激动的时代!一个真正让人感觉像是在与有思想的人对话的模型,这是一个巨大的飞跃。GPU 短缺只是暂时的困难,重要的是你们创造出的神奇成果。期待能亲自体验 GPT-4.5!

图片

GPT-4.5情商

在以往的大模型中,虽然能够生成流畅的文本,但在处理情感相关的场景时,往往显得生硬、机械,甚至有时会给出不恰当的回应。

GPT-4.5通过一系列技术创新和训练方法为模型增加了“情商”功能,显著提升了其在情感识别、同理心表达以及情感引导等方面的能力,使其在与人类互动时能够展现出更加温暖、细腻且富有同理心的特质。

GPT-4.5能够通过用户的文字输入,敏锐地捕捉到其中的情感色彩,无论是喜悦、悲伤、愤怒还是焦虑。这种能力并非简单地基于关键词的匹配,而是通过深度学习和大量的对话数据训练而来。

模型学会了从语句的整体语境中理解情感的细微差别,从而能够更准确地判断用户的情绪状态。例如,当用户表达“我最近考试没过,心情很糟糕”时,GPT-4.5不仅能够识别出这句话中的负面情绪,还能进一步感知到用户可能需要的不仅仅是解决问题的建议,更需要的是情感上的支持和安慰。

基于这种情感识别能力,GPT-4.5能够以一种富有同理心的方式回应用户。不会简单地给出一些通用的、冷漠的建议,而是会用温暖、关怀的语言来表达对用户情感的理解和支持。例如,可能会说:“哎呀,听到这个我很难过。考试没过确实会让人感到沮丧和失落,但这只是暂时的,并不能代表你的能力和价值。”

图片

这样的回应不仅能够缓解用户的情绪,还能让用户感受到被理解和关注。这种同理心的表达是GPT-4.5情商功能的核心体现,使得模型在与人类互动时更加自然、亲切,仿佛是一个真正能够倾听和理解的朋友。

此外,GPT-4.5还具备情感引导的能力。不仅能够回应用户当前的情感状态,还能够通过对话引导用户走向更加积极的情绪状态。

例如,在面对用户的焦虑或压力时,GPT-4.5可以提供一些缓解压力的方法,或者通过鼓励的话语帮助用户重建信心。可能会说:“虽然这次考试没有达到预期,但你可以把当作一个学习的机会,相信自己下次一定能够做得更好。”这种情感引导能力使得GPT-4.5不仅仅是一个被动的情感回应者,更是一个能够帮助用户调节情绪的真正人工智能。

GPT-4.5架构简单介绍

GPT-4.5的核心架构建立在无监督学习和推理能力的结合之上。无监督学习是其基础,通过海量未标注数据的训练,模型能够自主学习语言的结构和模式,从而提高其准确性和直觉能力。使得模型在处理复杂的语言任务时,能够凭借其对语言的深刻理解来生成更加自然和准确的文本。

推理能力的引入为模型增加了“思考”推理链的能力,在回答问题之前进行逻辑分析和思考,这在处理需要复杂推理的任务时尤为重要,例如,科学问题、数学问题以及其他需要深度分析的复杂问题。

在预训练完成后,GPT-4.5还使用了复杂的后训练过程。采用了监督微调和基于人类反馈的强化学习相结合的方法。监督微调通过标注数据进一步优化模型的性能,使其在特定任务上表现得更加精准。

图片

这种方法使得模型能够更好地适应不同的应用场景,提高其在实际任务中的表现。而基于人类反馈的强化学习则让模型能够更好地理解人类的需求和意图。通过与人类的互动,模型不断学习如何生成更符合人类期望的文本,从而使对话更加自然和富有情感。

在模型规模方面,GPT-4.5是OpenAI迄今为止最大的模型,其参数规模达到了前所未有的高度。为了训练这样一个庞大的模型,OpenAI开发了一系列创新的训练机制。

其中,低精度训练技术是关键之一,通过优化计算资源,低精度训练使得模型能够在有限的硬件条件下进行高效的训练。这种技术不仅提高了训练效率,还降低了训练成本,使得大规模模型的训练成为可能。

图片

OpenAI还首次尝试了跨数据中心的分布式训练。由于模型规模庞大,单个数据中心的计算资源无法满足其训练需求。因此,OpenAI利用多个数据中心同时进行预训练,充分利用了大规模计算资源,显著提升了模型的训练效率。

目前,ChatGPT Pro用户已经可以使用GPT-4.5模型,下周OpenAI将为Plus和Team用户推出。

本文素材来源OpenAI,如有侵权请联系删除

END

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/979189.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

信号和槽

connect(信号发送者,发送的信号,信号接收者,信号的处理); 信号函数和槽函数的参数必须是一样的,但信号的参数可以多余槽函数的参数(前面的参数类型必须一致) 是控件和控件间的信号传递,这两个…

AI人工智能机器学习之降维和数据压缩

1、概要 本篇学习AI人工智能机器学习之降维和数据压缩,以主成分分析(PCA, Principal Component Analysis)为例,从代码层面讲述机器学习中的降维和数据压缩。 2、降维和数据压缩 - 简介 在机器学习和数据分析中,降维&…

突破网络壁垒:实现 Mac SSH 访问 Windows WSL Ubuntu 的最佳实践20250301

突破网络壁垒:实现 Mac SSH 访问 Windows WSL Ubuntu 的最佳实践 背景与痛点 在现代开发环境中,开发者通常会面临不同操作系统之间的协同工作。例如: 主要开发环境位于 Windows 的 WSL Ubuntu 子系统需要从局域网内的 Mac 设备进行远程访问…

数字样机:从技术革新到产业赋能的演进之路

摘要:数字样机作为产品全生命周期数字化的核心技术,旨在通过虚拟化建模与仿真技术重构传统工业研发范式。 数字样机(Digital Prototype,DP)技术是一种数字化设计技术,利用数字样机替代原型样机&#xff0c…

Ollama+LM Studio+Anything LLM本地部署大模型

主要用于自我学习大模型本地部署的实战 首先安装Ollama,官网OllamaGet up and running with large language models.https://ollama.com/ 安装LM Studio,官网 LM Studio - Discover, download, and run local LLMsRun Llama, Mistral, Phi-3 locally o…

fastadmin 后台sku 插件

老规矩先上效果图 新引用需要用到的js define([backend], function (Backend) {require.config({paths: {// vue: ../js/vue,//js省略,如果是vue.min.js,就学vue.minlayui: /assets/LayuiSpzj/layui/layui,//js省略,如果是vue.min.js&#x…

毕业项目推荐:基于yolov8/yolo11的野生菌菇检测识别系统(python+卷积神经网络)

文章目录 概要一、整体资源介绍技术要点功能展示:功能1 支持单张图片识别功能2 支持遍历文件夹识别功能3 支持识别视频文件功能4 支持摄像头识别功能5 支持结果文件导出(xls格式)功能6 支持切换检测到的目标查看 二、数据集三、算法介绍1. YO…

Android+SpringBoot的老年人健康饮食小程序平台

感兴趣的可以先收藏起来,还有大家在毕设选题,项目以及论文编写等相关问题都可以给我留言咨询,我会一一回复,希望帮助更多的人。 系统介绍 我将从经济、生活节奏、技术融合等方面入手,详细阐述居家养老管理模式兴起的…

【Redis】Redis 入门

借鉴枫枫知道 一、连接 redis 1.1 命令行连接 // 完整的命令 redis-cli -h 127.0.0.1 -p 6379 -a password// 简写 redis-cli// 认证,进行redis之后 auth password1.2 go 代码连接 package mainimport ("fmt""github.com/go-redis/redis" …

HVAC 设计:使用 Ansys Discovery 探索更好的设计

通过 Ansys Discovery 及其 2025 年新功能利用 CFD,通过 Computational Insights 应对 HVAC 行业的挑战。 挑战 HVAC 行业在设计高效可靠的管道系统方面面临多项挑战: 压力损失:设计不当的管道会增加能耗并降低热性能。复杂的几何形状&…

【Redis】Redis初阶

🔥个人主页: 中草药 一、认识Redis Redis(Remote Dictionary Server)是一个开源的、基于内存的键值对存储数据库,支持持久化、网络化访问,并提供多种数据结构操作,用作数据缓存。它由Salvatore …

帧中继+静态路由实验(大规模网络路由器技术)

一、帧中继实验 (1)实验拓扑图如下图所示: 帧中继交换机1接口两侧的DLCI值: 数据链路连接标识符(DLCI,Data Link Connection Identifier),DLCI值用于标识 永久虚电路 (PVC&#xf…

Azure Speech

1、文字转语音(Text-To-Speech, TTS) 2、语音转文字(Speech-To-Text): Azure Speech to Text 1- 环境配置:Microsoft Azure 注册使用免费服务: 需要信用卡,本人没有,所以没有完成注册

海洋cmsv9报错注入,order by 和limit注入

海洋cmsv9 1,我们拿到海洋cmsv9源码分析发现注入点,$rlist 2,seacms开源,可以知道seacmsv9系统数据库(mysql)为seacms,存放管理员账号的表为 sea_admin,表中存放管理员姓名的字段为…

Linux系统下基于mplayer媒体播放器

1、项目背景 随着多媒体技术的发展,各种音视频格式的流行,用户对媒体播放器的功能和性能要求 日益增加。MPlayer是一个强大的开源媒体播放器,支持多种音视频格式。本项目旨在 基于MPlayer构建一个轻量级的Linux媒体播放器,提供简洁…

牛客NC288803 和+和

​import java.util.Comparator;import java.util.PriorityQueue;import java.util.Scanner;​public class Main {public static void main(String[] args) {// 创建Scanner对象用于读取输入Scanner sc new Scanner(System.in);// 读取两个整数n和m,分别表示数组的…

2025 软件供应链安全情报预警平台建设与实践

何为数字安全供应链情报? 所谓的数字供应链开源安全情报主要针对目标是开源数字应用资产。包括开源组件,中间件和操作系统。开源安全情报类型可以分为三大类: 1 第一类是传统的安全漏洞风险情报,开源漏洞情报数据获取主要有2种渠…

红蓝对抗之常见网络安全事件研判、了解网络安全设备、Webshell入侵检测

文章目录 ​​研判(入侵检测)​​ ​​设备​​ ​​经典网络​​​​云网络​​ ​​异常HTTP请求​​​​Webshell分析​​ ​​Webshell 的分类​​​​Webshell 的检测​​ ​​主机层面​​​​流量层面​​ ​​附录​​ ​​常见端口漏洞…

【Python系列】Python 连接 PostgreSQL 数据库并查询数据

???欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:kwan 的首页,持续学习,不断总结,共同进步,活到老学到老…

DeepSeek赋能智慧社区:提升社区治理,优化资源配置,带来全新变革

在数字化浪潮的推动下,智慧社区正逐渐成为城市发展的重要方向。作为一款先进的人工智能大模型,DeepSeek凭借其强大的多模态数据分析和智能决策能力,正在为智慧社区的建设注入新的活力。 标准规范及顶层设计指南、供应商整体解决方案合集、供应…