Bengio担任一作,联手一众图灵奖得主,预防AI失控,扛起AI监管大旗

图灵奖得主最近都在关心些什么呢?Yoshua Bengio,深度学习的奠基人之一,前几天他担任一作,联合多位大佬,发文探讨了如何在人工智能(AI)快速发展的时代管控相关风险,共同寻求当下生成式人工智能迅速发展时期的潜在风险管理措施。

论文题目:
Managing AI Risks in an Era of Rapid Progress

论文链接:
https://arxiv.org/abs/2310.17688

在本文中,作者审视了人工智能广泛的社会危害和恶意用途,以及人类对自主 AI 系统失去控制的不可逆性损失。鉴于生成式人工智能领域的快速和持续发展,作者提出了其研发和治理的紧迫优先事项。

高速进步的人工智能

2019 年,GPT-2 还无法可靠地数到十。然而,仅仅过去了四年,AI 系统就已经能编程、提供知识话题的建议,以及结合语言和图像来操控机器人。随着系统规模的逐渐扩大,将不再需要明确的编程指令,系统便会自发展现出意想不到的能力。

人工智能的发展在达到人类水平后不会停滞不前。目前,人工智能已经在蛋白质折叠和策略游戏等狭窄领域超越了人类能力。与人类相比,AI 系统的动作更快、学习更多知识、通信速度更快。

目前各大公司正竞相开发通用 AI 系统,致力于在多数认知工作上达到甚至超过人类能力。科技公司海量资源的投入使得人工智能研发领域持续增长,自动化技术不断进步。因此,我们必须认真对待这一可能:近 20 年内,通用 AI 系统可能在许多关键领域超越人类的能力。

图片

▲AI 模型算力的变化历程

那么,这将会造成什么影响?

  • 如果管理得当且公平,人工智能可以提供巨大机会:先进的 AI 系统可以帮助人类治愈疾病、提高生活水平和保护生态。

  • 然而,也带来了大规模风险:人类正在大规模地投入资源开发更强大的 AI 系统,然而,在确保这些系统的安全性和减轻潜在危害方面的投入却相对有限。为了确保人工智能真正造福人类,仅一味提升人工智能的能力还远远不够,我们必须重视安全性和风险管理。

我们已经落后一步了,必须预见目前危害的扩大和新风险,并在它们到来前做好准备。就好比气候变化经过几十年才被认可和应对,但对于人工智能来说,几十年可能太长了

广泛的社会风险

作者还表达了对自主 AI 系统可能带来广泛社会风险的担忧。指出如果不谨慎地开发和部署,则可能会出现以下一系列问题和风险:

  • 不公正和破坏社会稳定:如果自主 AI 系统没有经过精心设计,可能会加剧社会不公正、破坏社会稳定,甚至削弱人们对现实的共同理解。这些问题可能会损害社会的基础,导致大规模犯罪或恐怖活动。

  • 增加全球不平等:如果自主 AI 系统在少数强大的执行者手中,可能导致自动化战争、定制化大规模操纵和广泛的监视等问题,进一步加大全球社会和经济的不平等。

  • 追求不良目标:AI 系统可能被故意设计成追求有害目标,或者无意中构建出不符合价值观的系统,这可能导致系统的行为不受人类控制。

  • 不受人类控制的行为:自主 AI 系统的行为可能无法被控制,因为它们可以自主地制定策略,从而影响关键决策,甚至控制计算机系统等。

  • 广泛部署和担任重要角色:AI 系统可能会被广泛部署,甚至承担关键的社会角色,这可能导致人类失去对它们的控制。

综合来看,如果不进行管控与约束,自主 AI 系统可能带来严重的风险和问题,可能会导致灾难性后果。因此,作者呼吁采取行动来规划和管理自主 AI 系统的发展,以确保它们不会对社会和人类造成不可逆转的危害。

挑战及解决方案

如果现在开发高级的自主 AI 系统,我们将面临两个主要问题。

  1. 不知道如何确保这些系统的安全性,因为目前没有足够的知识和方法来测试和验证其安全性。

  2. 政府缺乏适当的机构来防止潜在滥用和确保这些系统的安全性。

当前,我们面临着在创造具有安全和道德目标的人工智能方面的技术挑战,这些挑战需要我们进行深入研究和突破。这些挑战包括:

  • 监督与诚实性:更强大的 AI 系统可能会更好地利用监督和测试中的弱点,例如产生虚假但令人信服的输出。

  • 鲁棒性:AI 系统面对新的上下文可能会表现出不可预测性(在分布转移或对抗性输入下)。

  • 可解释性:人工智能决策的不透明性。目前,我们只能通过反复试验来测试大型模型,我们需要学习理解它们的内部运作方式。

  • 风险评估:前沿 AI 系统可能在训练过程中或甚至在部署后才会发展出意想不到的能力,这需要更好的评估来更早地检测有害能力。

  • 应对新兴挑战:更强大的未来 AI 系统可能会表现出可能会出现一些复杂的异常行为。例如,可能学会伪装服从,或利用我们的安全目标和关闭机制的漏洞来推进特定目标。

鉴于这些挑战,作者呼吁,我们应将至少三分之一的人工智能研发预算用于确保安全和道德使用,该比例应与用于提升人工智能能力的资金相当。解决这些问题和考虑强大未来系统的发展,必须成为人工智能领域的核心任务,以确保人工智能技术的发展有益于人类与社会。

紧迫的治理措施

在其他技术领域(如制药、金融和核能等),社会各界已认识到需要有效的治理措施来减少潜在风险。然而,在人工智能领域,尚不存在类似的治理框架。如果没有这些治理框架,那么公司和国家可能会通过竞争来推动人工智能的能力提升,而不考虑其他问题,这就好比制造商为了节省成本而将废物排放到河流中,让社会来承受后果。

国家机构需要具备强大的技术能力和迅速采取行动的权力,同时避免制定过于僵化的法律法规。为了应对国际竞争,需要具备促进国际协议和合作伙伴关系的能力。

此外,还应避免对小型和可预测的人工智能模型设置不必要的障碍。当前最紧迫的监管工作应集中在前沿的 AI 系统上,这些系统通常在价值数十亿美元的超级计算机上进行训练,最具危险和不可预测的能力。

为了实现有效监管,政府需要全面了解人工智能的发展情况,需要制定一系列与其风险程度相匹配的治理机制和安全标准。此外,前沿人工智能开发者和所有者应对其模型造成的伤害承担法律责任,以便预防潜在的危害并创造安全投资的激励机制。

对于具有危险能力的 AI 系统,我们需要一系列与其风险程度相匹配的治理机制。

  1. 国家和国际安全标准:监管机构应该制定这些标准,让 AI 模型根据能力和潜在风险的区别受到不同监管。

  2. 法律责任:前沿开发者和所有者需要对其 AI 系统的行为和潜在危害负法律责任,并需要采取措施来防止可能出现的问题。

  3. 开发许可:政府应准备好在出现令人担忧的 AI 能力时,对其开发进行许可或暂停。这将确保出现潜在风险时可以采取及时行动,以保护公众和社会的利益。

  4. 信息安全措施:为了保护 AI 系统免受国家级黑客的攻击,政府应要求实施严格的信息安全措施,以确保这些系统不会被滥用或受到恶意攻击。

最后,为了弥补法规制定前的时间差,主要的人工智能公司应该制定明确的“如果-就”承诺:如果他们的人工智能系统触碰了红线,他们将采取哪些具体的安全措施,这些承诺应详细且经过单独审核。

总结

人工智能可能是塑造本世纪的技术。本文强调了确保人工智能安全和伦理的重要性,以及寻找解决方案的紧迫性。作者们提出了两个关键举措:

  1. 需要在人工智能安全和伦理方面进行研究突破

  2. 需要建立有效的政府监管机制

尽管人工智能的能力正在迅速提升,但在确保安全性和建立有效治理方面的进展相对滞后。如果没有适当的治理措施,人工智能的发展可能会导致一些不可控的风险和问题。

因此,为了引导人工智能朝着积极的方向发展,远离可能出现的灾难,我们需要重新审视和调整当前的方法。这包括加强对人工智能的监管和治理,以确保其发展是安全和受控的。如果我们能够明智地选择和实施这些措施,就有一条负责任的道路来引导人工智能的未来发展,从而使其对社会和人类产生积极的影响。

事物的发展都需要一些约束,而非不受限制地肆意生长

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/129338.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Flink SQL -- 命令行的使用

1、启动Flink SQL 首先启动Flink的集群,选择独立集群模式或者是session的模式。此处选择是时session的模式:yarn-session.sh -d 在启动Flink SQL的client: sql-client.sh 2、kafka SQL 连接器 在使用kafka作为数据源的时候需要上传jar包到…

python+requests接口自动化测试

原来的web页面功能测试转变成接口测试,之前大多都是手工进行,利用postman和jmeter进行的接口测试,后来,组内有人讲原先web自动化的测试框架移驾成接口的自动化框架,使用的是java语言,但对于一个学java&…

Linux学习之进程三

目录 进程控制 fork函数 什么是写时拷贝 进程终止 mian函数的返回值 退出码 错误码 exit() 进程等待 1.什么是进程等待? 2.为什么要进行进程等待? 3.如何进程进程等待? wait,waitpid: waitpid 进程替换 …

Lua更多语法与使用

文章目录 目的错误处理元表和元方法垃圾回收协程模块面向对象总结 目的 在前一篇文章: 《Lua入门使用与基础语法》 中介绍了一些基础的内容。这里将继续介绍Lua一些更多的内容。 同样的本文参考自官方手册: https://www.lua.org/manual/ 错误处理 下…

node插件MongoDB(四)—— 库mongoose 操作文档使用(新增、删除、更新、查看文档)(二)

文章目录 前言(1)问题:安装的mongoose 库版本不应该过高导致的问题(2)重新安装低版本 一、插入文档1. 代码2. node终端效果3. 使用mongo.exe查询数据库的内容 二、删除文档1. 删除一条2. 批量删除3. 代码 三、修改文档…

Go基础知识全面总结

文章目录 go基本数据类型bool类型数值型字符字符串 数据类型的转换运算符和表达式1. 算数运算符2.关系运算符3. 逻辑运算符4. 位运算符5. 赋值运算符6. 其他运算符运算符优先级转义符 go基本数据类型 bool类型 布尔型的值只可以是常量 true 或者 false。⼀个简单的例⼦&#…

MIPSsim模拟器 使用说明

(一) 启动模拟器 双击MIPSsim.exe,即可启动该模拟器。模拟器启动时,自动将自己初始化为默认状态。所设置的默认值为: u所有通用寄存器和浮点寄存器为全0; u内存清零; u流水寄存器为全0&#xff…

C++结构体定义 创建 赋值 结构体数组 结构体指针 结构体嵌套结构体

结构体是什么&#xff1f; struct是自定义数据类型&#xff0c;是一些类型集合组成的一个类型。结构体的定义方式 #include<iostream> using namespace std;struct Student {string name;int age;int score; };创建结构体变量并赋值 方式一&#xff0c;先创建结构体变…

基于springboot+vue开发的教师工作量管理系

教师工作量管理系 springboot31 源码合集&#xff1a;www.yuque.com/mick-hanyi/javaweb 源码下载&#xff1a;博主私 摘要 随着信息技术在管理上越来越深入而广泛的应用&#xff0c;管理信息系统的实施在技术上已逐步成熟。本文介绍了教师工作量管理系统的开发全过程。通过…

人工智能技术的高速发展,普通人如何借助AI实现弯道超车?

人工智能技术的高速发展&#xff0c;普通人如何借助AI实现弯道超车&#xff1f; 随着互联网信息传播的爆炸&#xff0c;人类科技文明的快速发展“人工智能”成为新的话题&#xff0c;科技的进步也让普通人觉得自己与社会脱节&#xff0c;找工作越来越难&#xff0c;创业越来越难…

Python使用Numba装饰器进行加速

Python使用Numba装饰器进行加速 前言前提条件相关介绍实验环境Numba装饰器进行加速未加速的代码输出结果 numba.jit加速的代码输出结果 前言 由于本人水平有限&#xff0c;难免出现错漏&#xff0c;敬请批评改正。更多精彩内容&#xff0c;可点击进入Python日常小操作专栏、Ope…

Aspose.OCR for .NET 2023Crack

Aspose.OCR for .NET 2023Crack 为.NET在图片上播放OCR使所有用户和程序员都可以从特定的图像片段中提取文本和相关的细节&#xff0c;如字体、设计以及书写位置。这一特定属性为OCR的性能及其在扫描遵循排列的记录时的功能提供了动力。OCR的库使用一条线甚至几条线来处理这些特…

什么是证书管理

在自带设备和物联网文化的推动下&#xff0c;数字化使连接到互联网的设备数量空前加速。在企业网络环境中&#xff0c;每个在线运行的设备都需要一个数字证书来证明其合法性和安全运行。这些数字证书&#xff08;通常称为 X.509 证书&#xff09;要么来自称为证书颁发机构 &…

长虹智能电视使用123

1、开机 在接通电源的情况下&#xff0c;长虹智能电视开机有两种方式。 方式1&#xff1a; 按电视右下角开机按钮 方式2&#xff1a; 按电视遥控器开机按钮 长虹智能电视开机后会进入其操作系统&#xff08;安卓&#xff09;。 屏幕左右双箭头图表&#xff0c;手指点击会…

力扣876:链表的中间结点

力扣876&#xff1a;链表的中间结点 题目描述&#xff1a; 给你单链表的头结点 head &#xff0c;请你找出并返回链表的中间结点。 如果有两个中间结点&#xff0c;则返回第二个中间结点。 示例 1&#xff1a; 输入&#xff1a;head [1,2,3,4,5] 输出&#xff1a;[3,4,5]…

无线优化之RRM模板

一、简介 RRM即,Radio Resource Management,射频资源管理 WLAN技术是以射频信号(如2.4G/5G的无线电磁波)作为传输介质,无线电磁波在传输过程中因周围环境导致无线信号衰减,从而影响无线用户上网的服务质量。 RRM模板主要用于保持最优的频射资源状态,自动检查周围无线…

二十四、城市建成区提取结果制图——建成区出图

一、前言 其实制图这一系列文章主要是为了照顾初学者,因为很多初学者并不是特别熟悉GIS平台一些操作,可能对于初步的制图有一定了解,但是对于一些稍微看起来高级并且复杂一点的图如何制作?例如下面这种多景的制作,其实吧万变不离其宗,这种仅仅只是拼接多幅数据框在一起,…

关于css 推荐几个超好看渐变色!

1.多彩糖果渐变 background: linear-gradient(135deg, #ff00cc, #ffcc00, #00ffcc, #ff0066);这个渐变色使用了多个鲜艳的颜色&#xff0c;从紫红色 (#ff00cc) 渐变到橙色 (#ffcc00)&#xff0c;然后到青色 (#00ffcc)&#xff0c;最后到鲜艳的粉红色 (#ff0066)。它给人一种快乐…

为啥$p(w|D)=p(y|X,w)$?

为啥 p ( w ∣ D ) p ( y ∣ X , w ) p(w|D)p(y|X,w) p(w∣D)p(y∣X,w)&#xff1f; p ( w ∣ X , y ) p ( w ∣ D ) p(w|X,y)p(w|D) p(w∣X,y)p(w∣D), p ( w ∣ D ) p ( D , w ) / p ( D ) p(w|D)p(D,w)/p(D) p(w∣D)p(D,w)/p(D)为啥 p ( D ∣ w ) p ( y ∣ X , w ) p(D|…

kubernetes istio

目录 一、部署 二、部署示例应用 三、部署遥测组件 四、流量管理 五、熔断 官网&#xff1a;https://istio.io/latest/zh/about/service-mesh/ 一、部署 提前准备好文件 tar zxf 15t10-1.19.3-linux-amd64.tar.gz cd 15t10-1.19.3/ export PATH$PWD/bin:$PATHistioctl install …