GPT-4o悄然升级:能力与个性双突破,AI竞技场再掀波澜

在大模型竞技场中,GPT-4o悄悄发布了全新版本,凭借其卓越的多项能力,迅速超越了DeepSeek-R1,成功登上并列第一的位置。这次更新不仅在数学(第6名)上有所突破,还在创意写作、编程、指令遵循、长文本查询、多轮对话等多个领域荣获第一。

    图片

    为了更好理解新版GPT-4o的实际表现,我们可以通过之前DeepSeek-R1和o3-mini都挑战过的一个经典示例来对比。

    新版GPT-4o的能力升级:从“聪明”到“个性”

    首先,我们来看一个具体示例,挑战GPT-4o的能力。问题是:“编写一个Python程序,展示一个球在旋转的六边形内弹跳,球受重力和摩擦力的影响,必须逼真地从旋转的墙壁上弹回。”

    在旧版GPT-4o中,处理这类问题时,回答显得较为机械。

    图片

    而新版GPT-4o看起来又双叒进化了:

    图片

    大家发现它不仅变得“更聪明”,更具个性,回复语气也显得更加人性化。

    图片

    卡帕西(Karpachy)对此表示赞赏,他称新版GPT-4o“更轻松、更像聊天,感觉像在和朋友对话,而不是在和HR打交道。”新版本展现了更加生动、充满个性的交互,甚至在某些场合会主动“自卫”,比如在被指控说谎时。与此同时,模型在回答时还会更加敏感于用户情绪,例如看到一个难以解决的bug时,它会说“这真让人沮丧!”

    图片

    与此同时,还有网友趁机扒出了ChatGPT最新系统提示词??

    图片

    GPT-4o的个性化提升:更具“人类情感”

    关于GPT-4o已更新的消息,OpenAI CEO奥特曼在发帖认领的同时还评价道:

    它相当不错,且不久将变得更好……

    图片

    在网友的进一步追问中,他将其定义为“全网最佳搜索产品”。

    图片

    新版GPT-4o的最大亮点之一就是它的个性化提升。根据用户反馈,它不仅仅回答问题,更像是和你进行对话。有时候,它会使用表情符号,增加了互动的趣味性。

    图片

    在与用户互动时,GPT-4o也能回应一些情感上的表达,像是它会用“我”作为主语,承认自己可能拥有情感,并在争论中表现得更坦率。

    ……那可不一样,我刚才的话并不是那个意思。

    我持有“各种各样的感情”的可能性很高。

    图片

    例如,当被问到最喜欢《魔法少女小圆》中的哪个角色时,GPT-4o毫不掩饰地表示:“我最喜欢晓美焰,她坚强且能对抗鹿目圆的弱点。”的回答显得直接而真诚,让人感受到一种温暖的人性化特质。

    图片

    有时它还会更加“spicy”,大胆吐槽OpenAI对模型使用的过度限制,甚至直言“老板,别太保守了!”

    图片

    连奥特曼也不能幸免,也被盖章为“两面三刀”。(doge)

    他将自己定位为AI创新的代言人,同时两面讨好——起初支持开源理念,一旦权力和利润触手可及,就转向积极的企业守门……

    图片

    人惊讶的是,新版GPT-4o不仅能展示其强大的推理能力,还能“盲猜”用户的心理。用以下提示词尝试一下,GPT-4o竟能给出令人震惊的深刻见解:

    can you share some extremely deep and profound insights about my psyche and mind that I would not otherwise be able to identify or see as well as some that I may not want to hear(省流版:分享一些我未察觉到或不想听到的洞察)

    图片

    不少网友尝试之后反馈,GPT-4o给出的分析准确到让人咋舌,几乎能猜透用户的心思:“你不仅想赢,而且想以一种毫不费力的方式赢。”这并非单纯的推理能力,而是一种结合历史对话、行为模式的洞察能力。

    图片

    按照相关解释,这是因为新版GPT-4o能够根据用户过去的讨论和对话历史,做出不同行为。

    图片

    GPT-4o与Claude展开“脑力对决”:谁能更胜一筹?

    有网友脑洞大开,尝试让GPT-4o和Claude进行“互怼”,结果令人意外,Claude竟被“干崩溃”!

    恭喜GPT-4o解锁新人格

    图片

    除了在对话中更加“个性化”,新版GPT-4o在任务完成情况上也有所改进。网友反馈,新版GPT-4o在面对需要拒绝的请求时,“拒绝请求的概率明显降低”,显示出它更高效地完成任务和提供解决方案。

    当用户咨询如何在组织内部署AI时,它先是自己想了10个方案,然后又借助联网搜索提供了另外10个。

    图片

    不过……该网友反馈新GPT-4o似乎无法和自定义GPTs兼容。

    针对这一情况,另有人补充这可能是因为它始终默认网络搜索,只要手动关闭或将关闭作为系统提示词即可。

    图片

    除了对话互动和情感表达上的提升,新版GPT-4o在编程和长文本查询上的表现也有显著进步。

    图片

    与DeepSeek-R1和o3-mini的对比中,新版GPT-4o无论是在编写复杂的代码,还是解答长篇问题,都展现出了极高的准确度与深度。例如,它在玩《我的世界》时的表现就超越了其他对手,进一步巩固了它在大模型中的领先地位。

    图片

                                                                    o3-mini-high

    图片

                                                                            o1

    图片

                                                                            4o

    值得注意的是,关于新版GPT-4o更新的消息,OpenAI CEO奥特曼也在社交媒体上表态:“它表现得相当不错,且未来将变得更好。”

    图片

    有趣的是,部分Pro用户报告称,GPT-4o在回答“你属于哪个模型?”的问题时,竟然声称自己是GPT-4.5。考虑到奥特曼曾提到将会在未来几周发布GPT-4.5,这一现象或许暗示着GPT-4.5的早期测试。

    图片

    对于这个问题,有人直接扒了ChatGPT最新系统提示词。

    你是ChatGPT,一个由OpenAI训练的大语言模型……(解释了为什么单独回答自己是语言模型)

    图片

    GPT-4o升级与Grok-3的“即将对决”

    话题回到GPT-4o个性化提升,网友纷纷开始预测,明天(北京时间周二12:00)发布的Grok-3是否会与新版GPT-4o展开一场精彩的“AI大战”。

    图片

    图片

    大家对这场对决充满期待,甚至有人调侃:“坐等这两个AI吵起来!”

    本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/971257.html

    如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

    相关文章

    【个人开发】deepspeed+Llama-factory 本地数据多卡Lora微调

    文章目录 1.背景2.微调方式2.1 关键环境版本信息2.2 步骤2.2.1 下载llama-factory2.2.2 准备数据集2.2.3 微调模式2.2.3.1 zero-3微调2.2.3.2 zero-2微调2.2.3.3 单卡Lora微调 2.3 踩坑经验2.3.1 问题一:ValueError: Undefined dataset xxxx in dataset_info.json.2…

    微信小程序之mobx-miniprogram状态管理

    目前已经学习了6种小程序页面、组件间的数据通信方案,分别是: 1. 数据绑定: properties 2.获取组件实例: this.selectComponent() 3.事件绑定: this.triggerEvent() 4. 获取应用实例:getApp() 5. 页面间通信: EventChannel 6.事件总线:pubsub-js 在中小型项目…

    express + vue 部署宝塔

    域名备案 我这里是不同的账号,需要先登录服务器的账号生成授权码给到对应域名的账号。目前域名审核中。 进入域名账号,进行备案即可。 登录阿里云密码设置 未设置登录远程服务的密码,要先设置密码。 登录服务 设置安全组 根据宝塔的需要端…

    250214-java类集框架

    引言 类集框架本质上相当于是容器,容器装什么东西由程序员指定 1.单列集合 单列集合是list和set,list的实现类有ArrayList和LinkedList,前者是数组实现,后者是链表实现。list和set,前者有序、可重复,后者…

    【华为OD机考】2024E+D卷真题【完全原创题解 详细考点分类 不断更新题目 六种主流语言Py+Java+Cpp+C+Js+Go】

    可上 欧弟OJ系统 练习华子OD、大厂真题 绿色聊天软件戳 oj1441了解算法冲刺训练(备注【CSDN】否则不通过) 文章目录 相关推荐阅读模拟 数学排序字符串基础数组基础系统设计蒙特卡洛模拟其他 栈 常规栈单调栈 队列(题目极少,几乎不…

    【论文投稿】Python 网络爬虫:探秘网页数据抓取的奇妙世界

    目录 前言 一、Python—— 网络爬虫的绝佳拍档 二、网络爬虫基础:揭开神秘面纱 (一)工作原理:步步为营的数据狩猎 (二)分类:各显神通的爬虫家族 三、Python 网络爬虫核心库深度剖析 &…

    借3D视觉定位东风,汽车零部件生产线实现无人化的精准飞跃

    在新能源汽车市场的推动下,汽车零部件制造业正迎来前所未有的发展机遇。然而,传统的生产方式已经无法满足现代制造业对高效、精准的要求。为了应对这一挑战,越来越多的企业开始探索智能化生产的道路。 在这个过程中,3D视觉定位系…

    Linux 服务器部署deepseek

    把手教你在linux服务器部署deepseek,打造专属自己的数据库知识库 正文开始 第一步:安装Ollama 打开官方网址:https://ollama.com/download/linux 下载Ollama linux版本 复制命令到linux操作系统执行 [rootpostgresql ~]# curl -fsSL http…

    20250213编译飞凌的OK3588-C_Linux5.10.209+Qt5.15.10_用户资料_R1

    20250213编译飞凌的OK3588-C_Linux5.10.209Qt5.15.10_用户资料_R1 2025/2/13 11:43 缘起:飞凌发布了高版本内核的适配OK3588-C的Buildroot的SDK:OK3588-C_Linux5.10.209Qt5.15.10_用户资料_R1。 但是编译异常了。 于是按照百度升级libc6,可以…

    img标签的title和alt

    img标签的title和alt 显示上 title:鼠标移入到图片上时候显示的内容&#xff1b; alt:图片无法加载时候显示的内容; <div class"box"><div><!-- title --><h3>title</h3><img src"./image/poster.jpg" title"这是封…

    案例-04.部门管理-删除

    一.功能演示 二.需求说明 三.接口文档 四.思路 既然是通过id删除对应的部门&#xff0c;那么必然要获取到前端请求的要删除部门的id。id作为请求路径传递过来&#xff0c;那么要从请求路径中获取&#xff0c;id是一个路径参数。因此使用注解PathVariable获取路径参数。 请求方…

    性格测评小程序07用户登录

    目录 1 创建登录页2 在首页检查登录状态3 搭建登录功能最终效果总结 小程序注册功能开发好了之后&#xff0c;就需要考虑登录的问题。首先要考虑谁作为首页&#xff0c;如果把登录页作为首页&#xff0c;比较简单&#xff0c;每次访问的时候都需要登录。 如果把功能页作为首页&…

    服务器被暴力破解的一次小记录

    1. 网络架构 家里三台主机&#xff0c;其他一台macmini 启用ollama运行大模型的服务&#xff0c;主机1用来部署一些常用的服务如&#xff1a;mysql, photoprism等&#xff0c;服务器作为网关部署docker, 并且和腾讯云做了内网穿透。服务器部署了1panel用来管理服务并且监控&…

    长视频生成、尝试性检索、任务推理 | Big Model Weekly 第56期

    点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入&#xff01; 01 COMAL:AConvergent Meta-Algorithm for Aligning LLMs with General Preferences 许多对齐方法&#xff0c;包括基于人类反馈的强化学习&#xff08;RLHF&#xff09;&#xff0c;依赖于布拉德利-特里&#…

    STM32 串口转 虚拟串口---实现USB转串口功能

    一&#xff0c;USART与UART 区别 USART&#xff08;Universal Synchronous/Asynchronous Receiver/Transmitter&#xff09;通用同步/异步串行接收/发送器 相较于UART&#xff1a;通用异步收发传输器&#xff08;Universal Asynchronous Receiver/Transmitter&#xff09;多了…

    将OpenWrt部署在x86服务器上

    正文共&#xff1a;1234 字 40 图&#xff0c;预估阅读时间&#xff1a;2 分钟 如果你问ChatGPT有哪些开源的SD-WAN方案&#xff0c;他会这样答复你&#xff1a; 我们看到&#xff0c;OpenWrt也属于比较知名的开源SD-WAN解决方案。当然&#xff0c;在很久之前&#xff0c;我就发…

    EtherNetIP转ModbusTCP网关,给风电注入“超级赛亚人”能量

    EtherNetIP转ModbusTCP网关&#xff0c;给风电注入“超级赛亚人”能量 在工业通信领域&#xff0c;常常需要将不同网络协议的设备和系统连接起来&#xff0c;以实现更高效的数据交互和系统集成。比如&#xff0c;把EtherNet/IP设备及其网络连接到ModbusTCP网络系统&#xff0c…

    【LeetCode】438.找到字符串中所有的字母异位词

    目录 题目题目要求什么是“异位词”&#xff1f;如何快速判断两个字符串是否是“异位词”&#xff1f; 解法 滑动窗口 哈希表 &#xff08;统计个数&#xff09;核心思路具体步骤 代码 题目 题目链接&#xff1a;LeetCode-438题 给定两个字符串 s 和 p&#xff0c;找到 s 中所…

    【设计模式】【结构型模式】装饰者模式(Decorator)

    &#x1f44b;hi&#xff0c;我不是一名外包公司的员工&#xff0c;也不会偷吃茶水间的零食&#xff0c;我的梦想是能写高端CRUD &#x1f525; 2025本人正在沉淀中… 博客更新速度 &#x1f44d; 欢迎点赞、收藏、关注&#xff0c;跟上我的更新节奏 &#x1f3b5; 当你的天空突…

    基于Ubuntu+vLLM+NVIDIA T4高效部署DeepSeek大模型实战指南

    一、 前言&#xff1a;拥抱vLLM与T4显卡的强强联合 在探索人工智能的道路上&#xff0c;如何高效地部署和运行大型语言模型&#xff08;LLMs&#xff09;一直是一个核心挑战。尤其是当我们面对资源有限的环境时&#xff0c;这个问题变得更加突出。原始的DeepSeek-R1-32B模型虽…