GPT-4老板:AI可能会杀死人类,已经出现我们无法解释的推理能力

来源: 量子位  微信号:QbitAI

“AI确实可能杀死人类。”

这话并非危言耸听,而是OpenAI CEO奥特曼的最新观点。

而这番观点,是奥特曼在与MIT研究科学家Lex Fridman长达2小时的对话中透露。

不仅如此,奥特曼谈及了近期围绕ChatGPT产生的诸多问题,坦承就连OpenAI团队,也根本没搞懂它是如何“进化”的:

从ChatGPT开始,AI出现了推理能力。但没人能解读这种能力出现的原因。

唯一的途径是向ChatGPT提问,从它的回答中摸索它的思路。

针对马斯克在推特上的“危险论”,他直言:

马斯克在我心中是英雄,我支持也理解他的担忧。

虽然他在推特上挺混蛋的,但希望马斯克能看到我们在解决AGI安全问题上付出了多大的努力。

除此之外,在这场对话过程中,奥特曼还提到了不少刁钻的话题,例如:

  • ChatGPT、GPT-4开发的内幕

  • GPT-4是人类迄今所实现的最复杂的软件

  • 如何看待大家拿ChatGPT越狱

  • ……

在看过这场对话之后,网友直呼:

两位AI大佬用大家都能理解的方式聊AI,多来点这样的访谈。

那么接下来,我们就来一同看下他们这场深度对话。

GPT-4内幕大曝光

GPT-4是这场对话中最受关注的部分。

它是如何训练的?如何在训练模型时避免浪费算力?如何解决AI回答不同价值观的人的问题?

首先是训练过程,依旧是预训练+RLHF,不过透露了一点具体细节。

GPT-4早在去年夏天就已经训练完成,后面一直在进行对齐工作,让它表现得更符合人类需求。

相比预训练数据集,RLHF所用的数据非常少,但效果是决定性的。

对此,奥特曼透露了一点数据来源,包含一些开源数据集、以及合作商提供的部分数据集。

当然,数据集中也有一点Reddit论坛上出现的迷因梗(meme),但不是很多。对此奥特曼遗憾表示:

如果再多点,它的回答可能会更有趣。

即便如此,团队甚至奥特曼自己依旧不能完全解读GPT-4。

目前对它的解读方式,依旧是通过不断问它问题,通过它的回答来判断它的“思路”。

而就在不断测试中,OpenAI发现从ChatGPT开始,GPT系列出现了推理能力

虽然ChatGPT绝大部分时候都被当做数据库使用,但它确实也出现了一定的推理能力,至于这种能力具体如何出现的,目前却无人能回答。

但大模型的训练往往意味着大量算力需求。对此奥特曼再次提到了OpenAI独特的训练预测方法:

即便模型很大,团队目前也有办法只通过部分训练,预测整个模型的性能,就像是预测一名1岁的婴儿能否通过SAT考试一样。

关于这一点,在GPT-4论文和官方博客中也有更详细介绍。

最后奥特曼承认,GPT-4确实存在应对不同价值观的人的问题。

临时解决办法就是把更改系统消息(system message)的权限开放给用户,也就是ChatGPT中经常见到的那段“我只是一个语言模型……”。

通过改变系统消息,GPT-4会更容易扮演其中规定的角色,比在对话中提出要求的重视程度更高,如规定GPT-4像苏格拉底一样说话,或者只用JSON格式回答问题。

所以,对于GPT系列来说,谁最可能载入人工智能史册?奥特曼倒不认为是GPT-4:

从可用性和RLHF来看,ChatGPT无疑是最具里程碑的那一个,背后的模型没有产品的实用性重要

最会打太极的CEO

GPT-4论文中没有透露参数规模、训练数据集大小等更多细节,还被外界吐槽越来越不Open了。

在这次访谈中,面对主持人步步追问,奥特曼依旧守口如瓶。

GPT-4预训练数据集有多大?奥特曼只是很笼统的介绍了有公开数据集、有来自合作伙伴的内容(如GitHub提供的代码)还有来自网络的内容。

活像ChatGPT也能写出来的那种赛博八股文,只有在谈到Reddit的时候透露了网络梗图在训练数据中占比不大,“不然ChatGPT可能更有趣一些”。

GPT-4模型参数量有多大?奥特曼只是说之前疯传的100万亿参数是谣言,然后又糊弄过去了。

我认为人们被参数竞赛所吸引,就像过去被CPU的主频竞赛所吸引一样。现在人们不再关心手机处理器有多少赫兹了,关心的是这东西能为你做什么。

不过奥特曼对于一种说法是持有肯定态度——“GPT-4是人类迄今所实现的最复杂的软件”

但在主持人Lex突然抛出一些时下针对GPT-4的尖锐观点时,奥特曼的应对也堪称“AI般淡定”(狗头)。

例如,关于前段时间闹得沸沸扬扬的GPT-4越狱问题。

一名斯坦福教授仅仅用30分钟,就诱导GPT-4制定出了越狱计划,并全部展示了出来。

对此奥特曼表示,就如同当年iPhone也面临被“黑”或者说越狱的问题(如当年免费的越狱版App Store)一样,这并非不能解决的事情。

奥特曼甚至坦承,他当年就把自己的第一台苹果手机越狱了——甚至当时觉得这是个很酷的事情。

但现在已经没有多少人去干苹果越狱的事情了,因为不越狱也足够好用了。

奥特曼表示,OpenAI的应对思路同样如此,即把功能做的足够强,他甚至表示,愿意在这方面给用户开更多权限,以便了解他们到底想要什么。

除此之外,Lex还提到了马斯克对于奥特曼的批评。

奥特曼虽然是当年被马斯克一手提拔的人才,但如今马斯克不仅退出了他们联手创办的OpenAI,还对OpenAI现状十分不满,经常在推特上阴阳怪气这家公司。

我捐1亿美金成立的非营利组织怎么就变成一个300亿市值的营利性公司了呢?如果这是合法的,为什么其他人不这样做?

作为OpenAI现任CEO,奥特曼并未直接回应此事,而是调侃了一下马斯克在航天领域也经常被“老前辈”们批评的事情。

这一系列采访问答,不禁让人想到在ChatGPT发布后,奥特曼对于记者“将ChatGPT整合进微软必应和Office”问题的回应方式:

你知道我不能对此发表评论。我知道你知道我不能对此发表评论。你知道我知道你知道我不能对此发表评论。

既然如此,为什么你还要问它呢?

GPT的“偏见”不会消失

GPT在迭代过程中“偏见”必然存在,它不可能保持完全中立。

在主持人提到关于ChatGPT以及GPT-4种存在的偏见问题时,奥特曼这样回应道。

ChatGPT在推出之初,就不是一个成熟的产品,它需要不断迭代,而在迭代的过程中,仅仅依靠内部的力量是无法完成的。

“提前”推出ChatGPT技术,是要借助外部世界的集体智慧和能力,同时也能让全世界参与进“塑造AI”的过程中。

而不同人对于问题的看法也各不相同,所以在这个过程中,“偏见”问题就不可避免。

甚至奥特曼在话里话外也透露着:在GPT中,“偏见”永远不会消失

他将外部参与建设GPT比作“公开领域建设的权衡”。

GPT生成答案是个性化控制的结果,迭代的过程则是更精准地控制“个性化”的过程。

有趣的是,期间奥特曼还暗戳戳“背刺”起了马斯克的推特:

推特摧毁掉的多元性,我们正在将其找回来。

(嗯,奥特曼是懂一些话术的)

当然,谈到ChatGPT,总绕不开其背后的公司OpenAI,在成立之初,它就立下了两个Flag:

  • 1、非营利性

  • 2、通用人工智能(AGI)

如今,已经过去八年之久,这两个Flag也是发生了巨大的变化:AGI的大旗还在高举,而非营利性这面旗则已经摇摇欲坠。

对此,奥特曼也是分别作出了回应。

对于OpenAI“非营利性质”的逐渐削弱,奥特曼直言:很久之前,就已经意识到非营利性不是长久之计

仅仅依靠非营利筹集到的资金对OpenAI的研究来说远远不够,商业化是必然选择。

但在之后奥特曼也试图“找补”回一些,称目前的商业化的程度仅止于满足投资者与员工的固定回报,剩余资金还是会流向非营利性组织。

提到AGI,一开始在OpenAI声称要做通用人工智能时,还有一堆人在嘲讽,如今做出GPT-4这样的产品,回过头来再看,嘲讽的声音已经越来越少了。

而面对外界询问“GPT-4是AGI吗”这样的问题时,奥特曼则是直接给出了自己理解中的AGI:

AGI所掌握的知识应该是要超过人类科学知识总和的,并且具有创造性,能够推动基础科学的发展;

而目前所有GPT并不能做到这些,想要达到AGI还需要在目前GPT的范式上进行拓展,至于如何拓展,正是目前所缺乏的。

值得一提的是,谈到AGI时,是奥特曼在访谈中鲜有的“两眼放光”的时刻。

他抛出了一句极具“科研分子理想情怀”的金句:

也许AGI是永远抵达不了的乌托邦,但这个过程会让人类越来越强大。

但奥特曼并不否认过分强大的AGI“可能杀死人类”这一观点:

我必须承认,(AI杀死人类)有一定可能性。

很多关于AI安全和挑战的预测被证明是错误的,我们必须正视这一点,并尽早尝试找到解决问题的方法。

One More Thing

在谈话最后,Lex Fridman还试图让奥特曼讲一些给年轻人们的建议,奥特曼直接来了个“反鸡汤文学”:

网络上的“成功学”帖子太诱人,建议不要听太多建议。

我就是无视建议做到现在这样的。

参考链接:
https://www.youtube.com/watch?v=L_Guz73e6fw

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/5560.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

《统计学习方法》学习笔记之第一章

统计学习方法的学习笔记:第一章 目录 第一节 统计学习的定义与分类 统计学习的概念 统计学习的分类 第二节 统计学习方法的基本分类 监督学习 无监督学习 强化学习 第三节 统计学习方法三要素 模型 策略 第四节 模型评估与模型选择 训练误差与测试误差 过…

Ubuntu设置清华源

本文为自己安装记录回顾用 下面的是ubuntu20.04Ubuntu 更换镜像源 Ubuntu默认的服务器是在国外,连接很慢。 更换成国内的镜像源,使用清华镜像源,连接就会快一点 下面介绍更换清华镜像源的方法 1.打开Ubuntu的控制台(快捷键ctrlAlt…

Mysql事务(MVCC实现原理)、锁、sql优化

一.事务 数据库事务就是访问、操作各种数据的一个数据库操作序列, 是由事务开始到事务结束之间全部的执行过程组成的, 事务处理可以用来维护数据库的完整性, 保证成批的sql要么全部执行要么全部都不执行, 当然在mysql中只有使用了Innodb数据库引擎的数据库或表才有事务. 事…

2023值得我们关注的10种软件测试趋势

未来测试的趋势 随着软件在商业和日常生活中继续发挥关键作用,测试将不断发展以满足现代数字环境的需求。客户对软件得质量有着很高的要求并且测试时间应该更加快。因此,组织努力更快、更频繁地交付他们的软件,并且测试过程需要更多地集成到开…

C++继承相关总结

文章目录前言1.继承的相关概念1.继承概念2.继承的相关语法3.基类和派生类对象赋值转换(赋值兼容规则)2.继承中的注意事项1.继承中的作用域2.派生类的默认成员函数1.构造函数与拷贝构造2.赋值重载与析构3.友元关系与静态成员变量3.多继承(菱形继承)1.虚拟继承2.虚拟继…

栈和队列OJ题合集(包含循环队列的两种实现)

目录 一:前言 二:有效的括号(括号匹配) 三:用队列实现栈 四:用栈实现队列 五:设计循环队列 一:前言 对栈和队列的基本性质和实现有问题的可以看上一期 链接:http://t.csdn.cn/YQMBA​​​​ 注意:本文用数据的大小来表示入栈入队的先后。 二:有效的括号(括号匹配…

fastp软件介绍

fastp软件介绍1、软件介绍2、重要参数解析2.1 全部参数2.2 使用示例2.3 重要参数详解(1)UMI去除(2)质量过滤(3)长度过滤(4)低复杂度过滤(5)adapter过滤&#…

《文章复现》考虑用户舒适度的冷热电多能互补综合能源系统优化调度

说明书 免费:https://download.csdn.net/download/qq_50594161/87625438 MATLAB代码:考虑用户舒适度的冷热电多能互补综合能源系统优化调度 关键词:用户舒适度 综合能源 PMV 优化调度 参考文档:《冷热电气多能互补的微能源网鲁…

什么是RabbitMQ?有什么用如何使用?一文回答

RabbitMQ RabbitMQ channel:操作MQ的工具exchange:交换机,路由消息到队列中queue:队列,缓存消息virtual host:虚拟主机,对queue,exchange等资源的逻辑分组 MQ模型 基本消息队列工作…

Java 8 - Lambda 表达式

1. 函数式接口 当一个接口中只有一个非 default 修饰的方法,这个接口就是一个函数式接口用 FunctionalInterface 标注 1)只有一个抽象方法 FunctionalInterface public interface MyInterface {void print(int x); } 2)只有一个抽象方法和…

射频接收机概述

接收机架构 射频接收机架构是指电子设备中用于接收无线电信号的部分。它通常由前置放大器、中频放大器、混频器、局部振荡器和带通滤波器等组成。以下是一个基本的射频接收机架构: 前置放大器:前置放大器的作用是放大接收天线接收到的微弱无线电信号&am…

程序员万万不能去的3种公司,越做越倒退,过来人的经验

俗话说“条条大路通罗马”,但是对于程序员来说,有些路千万别走,走得越久越难以抽身,甚至说毁掉你的职业生涯。 今天来跟大家讲一下,作为程序员,有些公司千万不要进去,你以为稀松平常&#xff0…

用Python发送电子邮件?这也太丝滑了吧(21)

小朋友们好,大朋友们好! 我是猫妹,一名爱上Python编程的小学生。 欢迎和猫妹一起,趣味学Python。 今日主题 猫爸赚钱养家,细想起来真的不容易啊! 起早贪黑,都是6点早起做早饭,送…

Autodesk AutoCAD 2023(CAD设计软件)自动化工具介绍以及图文安装教程

Autodesk AutoCAD是一款功能强大的计算机辅助设计软件,主要用于2D和3D设计、制图和草图。它适用于多种行业,包括建筑、土木工程、机械工程、电气工程等等。 Autodesk AutoCAD具有2D和3D设计、多种工具和功能、可扩展性、与其他Autodesk软件集成和多平台…

记录一次解决Maven问题的坑

记录一次解决Maven问题的坑目录概述需求:设计思路实现思路分析1.一步步的解决问题比较方法2.后来感觉和这个没关系3.最后查询资料拓展实现性能参数测试:参考资料和推荐阅读Survive by day and develop by night. talk for import biz , show your perfec…

python get方法及常用的代码

1.首先,我们需要下载一个 Python的 pygame库。 2.接着,我们需要在 Pygame中去注册一个自己的账户。 3.登录成功后,我们就可以去下载 pygame中的文件了。 4.我们现在只需要将下载文件放入到 Pygame库中即可,这就完成了下载&#xf…

算法学习day43

算法学习day431. 力扣1049. 最后一块石头的重量 II1.1 分析1.2 代码2. 力扣494. 目标和2.1 分析2.2 代码3. 力扣474.一和零3.1 分析3.2 代码4.参考资料1. 力扣1049. 最后一块石头的重量 II 1.1 分析 动规五部曲: 1.确定dp数组以及下标的含义 dp[j]表示容量为j的背…

第⑦讲:Ceph集群RGW对象存储核心概念及部署使用

文章目录1.RadosGW对象存储核心概念1.1.什么是RadosGW对象存储1.2.RGW对象存储架构1.3.RGW对象存储的特点1.4.对象存储中Bucket的特性1.4.不同接口类型的对象存储访问对比2.在集群中部署RadosGW对象存储组件2.1.部署RGW组件2.2.集群中部署完RGW组件后观察集群的信息状态2.3.修改…

剑指offer JZ27 二叉树的镜像

Java JZ27 二叉树的镜像 文章目录Java JZ27 二叉树的镜像一、题目描述二、辅助栈三、递归法使用辅助栈和递归法解决剑指offer JZ27 二叉树的镜像的问题。 一、题目描述 操作给定的二叉树,将其变换为源二叉树的镜像。   数据范围:二叉树的节点数 0≤n≤…

--编写一个存储过程,输入一个日期,返回该日期与当下日期的时间差,如果该差是负的,则提示该日期已经过去XX天,不然提示距离该日期还有xx天

--创建存储过程&#xff0c;一个输入参数&#xff0c;一个输出参数 create or replace procedure sp_minus(i_date varchar2,o_minus out varchar2) is --声明一个变量&#xff0c;用来存放异常 v_errm varchar2(200); begin --判断输入格式 if length(i_date)<>8 th…