面向未来的前沿人工智能监管

策制定者应该为未来十年人工智能系统更加强大的世界做好准备。这些发展可能会在人工智能科学没有根本性突破的情况下发生,只需扩展当今的技术以在更多数据和计算上训练更大的模型即可。

用于训练前沿人工智能模型的计算量在未来十年可能会显着增加。到 2020 年代末或 2030 年代初,用于训练前沿 AI 模型的计算量可能是用于训练 GPT-4 的计算量的大约 1,000 倍。考虑到算法的进步,有效计算量可能是用于训练 GPT-4 的大约一百万倍。何时达到这些阈值存在一些不确定性,但在预期成本和硬件限制内,这种增长水平似乎是可能的。

无需政府干预,这种规模的改进是可能实现的,完全由当今大型科技公司规模的私营公司资助。它们也不需要芯片制造或设计方面的根本性突破。超出当今私营公司限制的支出增加或全新的计算范式可能会带来更大的计算增长。

训练前沿人工智能模型的成本不断上升,可能会导致前沿研究出现寡头垄断,但能力可能会迅速激增。目前,算法的进步和硬件的改进迅速降低了训练先前最先进模型的成本。按照目前的趋势,五年内,在任何给定能力水平上训练模型的成本大约下降了 1,000 倍,即原始成本的 0.1% 左右,从而使培训成本大大降低并提高了可及性。

美国政府对运往中国的先进人工智能芯片实施了出口管制,并且随着时间的推移,拒绝参与者获得硬件改进会导致相对能力差距越来越大。无法获得硬件改进的参与者将很快因跟不上前沿研究的步伐而付出代价。到 2027 年,如果出口管制保持在当前的技术门槛并发挥最大作用,那么使用旧的、符合出口标准的芯片可能会导致培训成本损失大约十倍。

然而,任何特定水平的人工智能能力的扩散只会再延迟几年。目前,仅由于算法的进步,在任何给定的人工智能能力水平上训练模型的成本都在迅速下降。如果算法改进继续广泛应用,受硬件限制的参与者将能够训练具有相当于曾经前沿模型的能力的模型,但仅落后前沿两到三年。

计算和算法的改进对于推动人工智能前沿的进步以及影响能力扩散的速度和对象都发挥着重要作用。目前,由于硬件改进和计算支出增加,用于训练大型人工智能模型的计算量每七个月就会翻一番。对于大型语言模型,算法效率(即以更少的计算实现相同性能水平的能力)大约每八到九个月就会翻一番。性能的提高来自计算量的增加和算法的改进。如果由于成本上升和/或硬件性能提升减少而在 2030 年代计算增长放缓,那么前沿模型的未来进展可能在很大程度上取决于算法的改进。

目前,随着在任何给定性能水平上训练模型所需的计算量迅速下降,算法效率的快速提高使得功能能够快速增长。最近,一些领先的人工智能实验室开始隐瞒有关其最先进模型的信息。如果算法改进缓慢或变得不那么广泛可用,这可能会减缓人工智能前沿的进展,并导致能力扩散更慢。

虽然人工智能的未来如何发展存在很大的不确定性,但当前的趋势表明,人工智能系统的未来将比当今最先进的技术更强大。人工智能前沿最先进的系统最初将仅限于少数参与者,但可能会迅速扩散。政策制定者应该从今天开始制定监管框架,为未来做好准备。建立预期监管框架至关重要,因为人工智能进步与政策制定过程之间的速度脱节,难以预测新人工智能系统执行特定任务的能力,以及当今缺乏监管的人工智能模型激增的速度。等到具体危害发生后再监管前沿人工智能系统几乎肯定会导致监管为时已晚。

如果当前趋势持续下去,用于训练模型的计算量可能会成为富有成效的监管途径。大量计算是训练前沿人工智能模型的入门成本。未来 10 到 15 年,计算作为训练最强大的人工智能系统的重要输入,其重要性可能会增加。然而,考虑到算法的进步能够随着时间的推移以更少的计算量训练具有同等性能的人工智能系统,对计算访问的限制可能会减缓但不会阻止能力的扩散。如果与模型本身的法规(例如对某些经过训练的模型的出口管制)相结合,计算法规将更加有效。

政策制定者和行业领导者越来越关注高性能通用人工智能模型(有时称为“前沿”模型)的监管。当前前沿人工智能模型的例子包括 GPT-4 (OpenAI)、Claude 3 (Anthropic) 和 Gemini Ultra (Google)。公司已经在使用越来越多的数据和计算硬件来训练更大、能力更强的下一代模型。

用于训练前沿人工智能系统的计算量正在以不可持续的速度增长。从 2010 年到 2022 年,用于训练最先进机器学习模型的计算量增加了 100 亿倍,并且每六个月翻一番。1对于最大的模型,用于训练的计算量大约每七个月就会翻一番。计算量的快速增长超过了硬件改进的速度,部分原因是培训支出的增加。训练最大模型的成本大约每 10 个月就会翻一番。2仅最终的训练运行当前前沿模型的训练成本就高达数千万美元。考虑到早期的训练运行和实验,如今训练前沿模型的全部成本可能约为 1 亿美元。3随着培训费用持续上升,可能达到数亿美元甚至数十亿美元。

当前的趋势表明,人工智能系统的未来将比当今最先进的技术更加强大。

短期内,人工智能前沿的大规模训练可能会继续增长。据报道,领先的人工智能实验室已经在训练下一代模型或为此筹集资金。4 Nvidia 正在发货数十万颗新芯片,这将使未来的训练运行更加强大。然而,从长远来看,成本和可能的硬件限制可能会限制未来的计算增长。5当前的计算增长指数不可能无限期地持续下去。它持续多长时间、以何种速度以及在趋于平稳之前计算量的增长量对人工智能的未来进步具有重要影响。成本和硬件获取作为训练高性能人工智能系统的进入壁垒的作用也具有政策影响,例如出口管制和一些监管建议。

有关成本和计算趋势如何影响人工智能未来的几个问题:

1. 成本和计算预测:如果当前趋势继续下去,用于训练前沿人工智能模型的计算量和训练成本将如何随着时间的推移而上升?考虑到算法的进步,有效计算量将如何随着时间的推移而增加?

2. 成本增长的限制:在达到私营公司的支出限制之前,可以计算增加多少,什么时候会发生?如果成本增长速度随着成本上升而减慢,这可能会如何影响用于训练前沿模型的计算量?

3. 硬件改进的限制:持续硬件改进的限制可能会如何影响未来的计算增长?

4. 扩散:随着时间的推移,硬件和算法效率的改进将如何影响人工智能功能的可用性?

5. 受硬件限制的参与者的成本:硬件可用性的限制(例如,由于出口管制)可能如何影响那些被拒绝获得人工智能硬件持续改进的参与者的成本和计算增长?
6. 计算监管阈值:随着时间的推移,硬件和算法效率的改进如何影响作为前沿模型监管阈值的训练计算的有效性?

这些问题的答案对当今的政策相关决策具有重要影响,例如出口管制或其他限制计算密集型人工智能模型访问的拟议法规的预期效果。一方面,成本上升的趋势正在整合少数领先的人工智能实验室对前沿人工智能模型的访问。另一方面,硬件改进和算法效率的反补贴趋势正在降低能力障碍,从而实现扩散。

一些监管和政策干预措施可能或多或少可行或可取,具体取决于计算和成本随时间的变化以及对前沿人工智能模型和能力扩散的影响。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/468594.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Linux初识环境变量

🌎环境变量【上】 文章目录: 环境变量 什么是环境变量 关于命令行参数 环境变量       简单了解       为什么需要环境变量       系统中其他环境变量 总结 前言: 环境变量是一种非常重要的概念,它们对于系统的…

springboot酒店管理系统 论文【源码】

springboot酒店管理系统开发说明 开发语言:Java 框架:springboot JDK版本:JDK1.8 服务器:tomcat7 数据库:mysql 5.7(一定要5.7版本) 数据库工具:Navicat11 开发软件&#xff1…

路由器级联

目录 一、实现功能二、实现步骤2.1 接线步骤 三、效果3.1 常规连接3.2 路由器级联 一、实现功能 主路由器:可有WiFi功能,LAN口下接各设备,并接一个辅路由器辅路由器:开启WiFi功能,有线或无线下接各设备功能&#xff1…

长安链正式发布三周年,技术更迭支撑产业变革

导语: 2024年1月27日长安链正式发布三周年,开源社区借开年之际与大家一同回顾长安链三年来的技术发展历程,每一个里程碑的建设都得益于与长安链同行的合作伙伴与开发者,希望在2024年可以共同携手继往开来,为数字经济发…

深入浅出前端本地储存(1)

引言 2021 年,如果你的前端应用,需要在浏览器上保存数据,有三个主流方案: CookieWeb Storage (LocalStorage)IndexedDB 这些方案就是如今应用最广、浏览器兼容性最高的三种前端储存方案 今天这篇文章就聊一聊这三种方案的历史…

安装vcenter管理esxi

安装vcenter管理esxi虚拟化操作系统 文章目录 安装vcenter管理esxi虚拟化操作系统1.安装vcenter2.vcenter的应用 1.安装vcenter esxi虚拟机具体安装步骤请参考上一篇文章,vcenter软件包需自己到网上下 2.vcenter的应用

蚓链帮助企业对资源进行数字化整合,加速变现实现利他多赢!

​蚓链作为一种数字化资源整合的工具或平台,可以帮助企业实现数字化资源整合。在当前的数字化时代,各种信息和资源呈现出乘方式的增长。企业要想在竞争中脱颖而出,就需要对这些资源进行有效的整合和利用。蚓链通过提供一套完善的数字化解决方…

Flutter Plugin中依赖aar本地包

一、首先在项目的根目录的build.gradle中,添加如下代码 allprojects {repositories {//...flatDir {//pay_2c2p就是你的flutter plugin插件名称dirs project(:pay_2c2p).file(libs)}} }二、然后到Plugin的android目录中 ,在src目录的同级创建libs目录将…

Java安全基础 必备概念理解

Java安全基础 关键概念汇总 文章目录 Java安全基础 关键概念汇总前置知识1.构造器this以及包的使用2.继承3.重写/ 重载 / super4.多态5.区分和equals方法6.toString的使用7.Object的概念8.static,final,代码块static代码块final 9.动态代理10.类的动态加载1)类加载器含义&#…

LeetCode 热题 100 | 回溯(三)

目录 1 131. 分割回文串 2 51. N 皇后 菜鸟做题,语言是 C,感冒好了 ver. 1 131. 分割回文串 题眼:给你一个字符串 s,请你将 s 分割 成一些子串。 根据题眼可知,我们需要做的是将字符串 s 连续分割 为几段&#…

医保智慧购药:探索医保买药小程序技术开发与应用

如今,医保智慧购药成为了一种趋势,尤其是医保买药小程序的技术开发和应用,为患者提供了更加便捷、高效的医药购买体验。 医保买药小程序是一种基于手机移动终端的应用程序,它通过智能化的算法和医保系统的对接,为患者…

gPTP简介

1、gPTP(generalized precision time protocol)广义时钟同步协议 gPTP(generalized precision time protocol)广义时钟同步协议,即IEEE 802.1AS协议。它是IEEE 1588协议的延伸,可以为TSN提供全局精准…

Legacy|电脑Windows系统如何迁移到新安装的硬盘?系统迁移详细教程!

前言 前面讲了很多很多关于安装系统、重装系统的教程。但唯独没有讲到电脑换了新的硬盘之后,怎么把旧系统迁移到新的硬盘上。 今天小白就来跟各位小伙伴详细唠唠: 开始之前需要把系统迁移的条件准备好,意思就是在WinPE系统下,可…

【Linux】Linux权限详解(权限管理-目录权限-粘滞位)

主页:醋溜马桶圈-CSDN博客 专栏:Linux_醋溜马桶圈的博客-CSDN博客 gitee:mnxcc (mnxcc) - Gitee.com 目录 1.Linux权限的概念 2.Linux权限管理 2.1 文件访问者的分类 2.2 文件类型和访问权限 ​编辑 1.文件类型 2.基本权限 2. 3 文件权…

android adb 实时画面 和操作

1. 下载 scrcpy 建议 windows10 用户 点击链接下载 不然可能会提示缺少部分 dll https://github.com/Genymobile/scrcpy/releases/download/v2.3.1/scrcpy-win32-v2.3.1.ziphttps://github.com/Genymobile/scrcpy/releases/download/v2.3.1/scrcpy-win32-v2.3.1.zip windo…

Java语言: JVM

1.1 内存管理 1.1.1 JVM内存区域 编号 名字 功能 备注 1 堆 主要用于存放新创建的对象 (所有对象都在这里分配内存) jdk1.8之后永久代被替换成为了元空间(Metaspace) 2 方法区(加、常、静、即) 被虚拟机加载的类信息(版本、字段、方法、接口…

递推算法C++

所谓递推,是指从已知的初始条件出发,依据某种递推关系,逐次推出所要求的各中间结果及最后结果。其中初始条件或是问题本身已经给定,或是通过对问题的分析与化简后确定。从已知条件出发逐步推到问题结果,此种方法叫顺推…

Linux:网络的初步认知

文章目录 网络的认知如何理解协议网络分层OSI模型TCP/IP五层(或四层)模型网络传输的基本流程协议的参与局域网通信原理 本篇将会引入到网络的话题 网络的认知 第一个问题是,网卡是文件吗?答案是显然的,在Linux下一切皆文件,基于…

大模型日报 3月14日

资讯 研究 智能体的ChatGPT时刻!DeepMind通用AI向人类玩家进化,开始理解游戏 https://mp.weixin.qq.com/s/-GNZaY9vPQJCJUD7WGTjGA 视频游戏是 AI 系统的重要试验场。与现实世界一样,游戏也是丰富的学习环境,具有反应灵敏的实…

Hive SQL必刷练习题:向用户推荐朋友收藏的商品(两种思路)

问题需求: 需要请向所有用户推荐其朋友收藏但是用户自己未收藏的商品,请从好友关系表(friendship_info)和收藏表(favor_info)中查询出应向哪位用户推荐哪些商品。期望结果如下: 1)…