OpenAI 正式推出Deep Research

  每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

OpenAI 正式推出一款全新的 AI “智能研究助手”,专为需要深入研究和复杂信息分析的用户打造,而它的名字也十分直白——Deep Research

根据 OpenAI 在周日发布的博文,这项新功能主要面向金融、科学、政策、工程等领域的专业人士,以及需要精准、可靠信息支持的研究型用户。当然,官方还补充道,Deep Research 也适用于日常生活中那些需要认真比对的消费决策,比如购车、家电选购或家具挑选。

换句话说,Deep Research 适用于那些不满足于简单答案或摘要,而是需要从多个来源深度挖掘信息的场景

Deep Research 限量开放,未来扩展至更多用户

目前,Deep Research 已向 ChatGPT Pro 用户开放,每月限 100 次查询。接下来,OpenAI 计划在未来一个月内向 Plus 和 Team 级用户开放,最终覆盖 Enterprise 订阅。而对于英国、瑞士及欧洲经济区的用户,OpenAI 目前还没有明确的发布时间表。

使用 Deep Research 也很简单——用户只需在 ChatGPT 的“撰写器”(composer)中选择“Deep Research”模式,然后输入查询内容,甚至可以附上文件或电子表格进行分析。目前,这项功能仅支持网页端,但 OpenAI 计划在本月晚些时候推出移动端和桌面应用集成。

不过,Deep Research 需要一定时间来处理查询,可能需要 5 到 30 分钟。完成后,用户将收到通知。

目前仅支持文本输出,未来将增加图像和数据可视化

当前 Deep Research 的答案是纯文本形式,但 OpenAI 透露,他们计划很快加入嵌入式图像、数据可视化等功能。此外,未来 Deep Research 还将支持访问更专业的数据来源,包括订阅制数据库和企业内部资源。

但问题来了——Deep Research 的答案究竟有多精准?

众所周知,AI 并不完美,时常会出现“幻觉”(hallucination)或错误推理,特别是在深度研究场景下,这种错误可能导致严重误导。对此,OpenAI 表示,每一条 Deep Research 生成的回答都将包含完整文档、清晰的引用来源,并附带思考过程总结,以便用户验证信息的可靠性

但这样的“防错机制”是否足够?目前仍是一个未知数。毕竟,OpenAI 自家的 ChatGPT 搜索功能也曾因提供不准确的信息而遭受批评。相比 Google 搜索,ChatGPT 在某些查询上的表现甚至更糟,这无疑让人对 Deep Research 的准确性持谨慎态度。

新一代 AI 赋能 Deep Research,更擅长推理和数据分析

为了提高 Deep Research 的可信度,OpenAI 采用了一个特别优化版的 o3“推理”AI 模型,它通过强化学习进行训练,专门用于浏览网页和分析数据。强化学习的原理是让 AI 通过不断试错,在接近目标时获得奖励,从而不断优化推理能力

这个 o3 模型具备更强的推理、搜索和数据分析能力,能够:
✅ 在互联网上搜索、解读并分析大量文本、图片和 PDF 文件
✅ 根据用户上传的文件进行浏览、解析
✅ 使用 Python 工具绘制和调整图表,并嵌入 AI 生成的图像和数据
✅ 在回答中提供精准引用,指明具体句子或段落的来源

Deep Research 在测试中的表现如何?

为了评估 Deep Research 的能力,OpenAI 使用了 “人类最后的考试”(Humanity’s Last Exam) 进行测试,该评测包含超过 3000 道各学科领域的高难度问题。在这项极具挑战性的测试中,Deep Research 的 o3 模型取得了 26.6% 的正确率

乍一看,这个分数并不高,但 OpenAI 解释说,这项测试比其他 AI 评测基准更严苛,以确保 AI 技术不会轻易“通关”。相比之下,其他 AI 的表现更惨不忍睹:
🔹 Google Gemini Thinking:6.2%
🔹 Grok-2(xAI):3.8%
🔹 OpenAI 自家的 GPT-4o:3.3%

当然,即便表现相对较好,Deep Research 仍然有不少限制——它有时会误判权威信息与谣言的区别,也不太擅长在不确定时主动表达疑虑,同时还可能在格式和引用上出现错误

AI 深度研究,真的比搜索引擎更好吗?

对于担心 AI 会影响学生学习或信息检索的人来说,Deep Research 提供的详尽、可验证的回答似乎比普通 AI 聊天机器人给出的简单答案更具吸引力。但问题是——用户是否真的会去核对 AI 的答案,还是会直接复制粘贴?

另外,有趣的是,这种 AI 深度研究功能其实并不新鲜——Google 两个月前刚刚宣布了一个同名的 AI 研究工具,也是用于复杂信息分析。看来,AI 领域的“军备竞赛”仍在持续升温,谁能最终占据主导地位,还有待市场的进一步检验。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/963809.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

多模态论文笔记——NaViT

大家好,这里是好评笔记,公主号:Goodnote,专栏文章私信限时Free。本文详细解读多模态论文NaViT(Native Resolution ViT),将来自不同图像的多个patches打包成一个单一序列——称为Patch n’ Pack—…

VLAN 基础 | 不同 VLAN 间通信实验

注:本文为 “ Vlan 间通信” 相关文章合辑。 英文引文,机翻未校。 图片清晰度限于原文图源状态。 未整理去重。 How to Establish Communications between VLANs? 如何在 VLAN 之间建立通信? Posted on November 20, 2015 by RouterSwi…

使用Pygame制作“吃豆人”游戏

本篇博客展示如何使用 Python Pygame 编写一个简易版的“吃豆人(Pac-Man)” 风格游戏。这里我们暂且命名为 Py-Man。玩家需要控制主角在一个网格地图里移动、吃掉散布在各处的豆子,并躲避在地图中巡逻的幽灵。此示例可帮助你理解网格地图、角…

springboot使用rabbitmq

使用springboot创建rabbitMQ的链接。 整个项目结构如下&#xff1a; 1.maven依赖 <dependency><groupId>com.rabbitmq</groupId><artifactId>amqp-client</artifactId><version>3.4.1</version> </dependency>application.y…

安卓(android)订餐菜单【Android移动开发基础案例教程(第2版)黑马程序员】

一、实验目的&#xff08;如果代码有错漏&#xff0c;可查看源码&#xff09; 1.掌握Activity生命周的每个方法。 2.掌握Activity的创建、配置、启动和关闭。 3.掌握Intent和IntentFilter的使用。 4.掌握Activity之间的跳转方式、任务栈和四种启动模式。 5.掌握在Activity中添加…

RabbitMQ快速上手及入门

概念 概念&#xff1a; publisher&#xff1a;生产者&#xff0c;也就是发送消息的一方 consumer&#xff1a;消费者&#xff0c;也就是消费消息的一方 queue&#xff1a;队列&#xff0c;存储消息。生产者投递的消息会暂存在消息队列中&#xff0c;等待消费者处理 exchang…

java命令详解

这里以jdk8为例子&#xff0c;查看默认的垃圾回收器 java -XX:PrintCommandLineFlags -version-XX:UseParallelGC : Parallel Scavenge 和 Parallel Old 组合 -XX:InitialHeapSize268435456 : 初始化堆大小&#xff08;字节&#xff09; -XX:MaxHeapSize4294967296 : 最大堆大…

自主Shell命令行解释器

什么是命令行 我们一直使用的"ls","cd","pwd","mkdir"等命令&#xff0c;都是在命令行上输入的&#xff0c;我们之前对于命令行的理解&#xff1a; 命令行是干啥的&#xff1f;是为我们做命令行解释的。 命令行这个东西实际上是我们…

分析哲学:从 语言解剖到 思想澄清的哲学探险

分析哲学&#xff1a;从 语言解剖 到 思想澄清 的哲学探险 第一节&#xff1a;分析哲学的基本概念与公式解释 【通俗讲解&#xff0c;打比方来讲解&#xff01;】 分析哲学&#xff0c;就像一位 “语言侦探”&#xff0c;专注于 “解剖语言”&#xff0c;揭示我们日常使用的语…

自定义数据集 使用paddlepaddle框架实现逻辑回归

导入必要的库 import numpy as np import paddle import paddle.nn as nn 数据准备&#xff1a; seed1 paddle.seed(seed)# 1.散点输入 定义输入数据 data [[-0.5, 7.7], [1.8, 98.5], [0.9, 57.8], [0.4, 39.2], [-1.4, -15.7], [-1.4, -37.3], [-1.8, -49.1], [1.5, 75.6…

QtCreator在配置Compilers时,有一个叫ABI的选项,那么什么是ABI?

问题提出 QtCreator在配置Compilers时,有一个叫ABI的选项,那么什么是ABI&#xff1f; ABI&#xff08;Application Binary Interface&#xff09;介绍 ABI&#xff08;Application Binary Interface&#xff0c;应用二进制接口&#xff09;是指应用程序与操作系统或其他程序…

[STM32 标准库]EXTI应用场景 功能框图 寄存器

一、EXTI 外部中断在嵌入式系统中有广泛的应用场景&#xff0c;如按钮开关控制&#xff0c;传感器触发&#xff0c;通信接口中断等。其原理都差不多&#xff0c;STM32会对外部中断引脚的边沿进行检测&#xff0c;若检测到相应的边沿会触发中断&#xff0c;在中断中做出相应的处…

Maven jar 包下载失败问题处理

Maven jar 包下载失败问题处理 1.配置好国内的Maven源2.重新下载3. 其他问题 1.配置好国内的Maven源 打开⾃⼰的 Idea 检测 Maven 的配置是否正确&#xff0c;正确的配置如下图所示&#xff1a; 检查项⼀共有两个&#xff1a; 确认右边的两个勾已经选中&#xff0c;如果没有请…

【JavaScript】Web API事件流、事件委托

目录 1.事件流 1.1 事件流和两个阶段说明 1.2 事件捕获 1.3 事件冒泡 1.4 阻止冒泡 1.5 解绑事件 L0 事件解绑 L2 事件解绑 鼠标经过事件的区别 两种注册事件的区别 2.事件委托 案例 tab栏切换改造 3.其他事件 3.1 页面加载事件 3.2 页面滚动事件 3.2 页面滚…

Spring Cloud工程搭建

目录 工程搭建 搭建父子工程 创建父工程 Spring Cloud版本 创建子项目-订单服务 声明项⽬依赖 和 项⽬构建插件 创建子项目-商品服务 声明项⽬依赖 和 项⽬构建插件 工程搭建 因为拆分成了微服务&#xff0c;所以要拆分出多个项目&#xff0c;但是IDEA只能一个窗口有一…

neo4j入门

文章目录 neo4j版本说明部署安装Mac部署docker部署 neo4j web工具使用数据结构图数据库VS关系数据库 neo4j neo4j官网Neo4j是用ava实现的开源NoSQL图数据库。Neo4作为图数据库中的代表产品&#xff0c;已经在众多的行业项目中进行了应用&#xff0c;如&#xff1a;网络管理&am…

selenium记录Spiderbuf例题C03

防止自己遗忘&#xff0c;故作此为记录。 鸢尾花数据集(Iris Dataset) 这道题牵扯到JS动态加载。 步骤&#xff1a; &#xff08;1&#xff09;进入例题&#xff0c;需要找到按钮规律。 flip_xpath: str r"//li/a[onclickgetIrisData({});]" &#xff08;2&…

自定义数据集 使用pytorch框架实现逻辑回归并保存模型,然后保存模型后再加载模型进行预测,对预测结果计算精确度和召回率及F1分数

导入必要的库&#xff1a; import numpy as np import torch import torch.nn as nn import torch.optim as optim from sklearn.metrics import precision_score, recall_score, f1_score 准备数据&#xff1a; class1_points np.array([[1.9, 1.2],[1.5, 2.1],[1.9, 0.5]…

如何运行Composer安装PHP包 安装JWT库

1. 使用Composer Composer是PHP的依赖管理工具&#xff0c;它允许你轻松地安装和管理PHP包。对于JWT&#xff0c;你可以使用firebase/php-jwt这个库&#xff0c;这是由Firebase提供的官方库。 安装Composer&#xff08;如果你还没有安装的话&#xff09;&#xff1a; 访问Co…

《Linux服务与安全管理》| 数据库服务器安装和配置

《Linux服务与安全管理》| 数据库服务器安装和配置 目录 《Linux服务与安全管理》| 数据库服务器安装和配置 任务一&#xff1a; 安装PostgreSQL数据库&#xff0c;设置远程登录&#xff0c;客户端可以成功登录并操作数据库。 任务二&#xff1a; 安装MySQL数据库&#xf…