解析:什么是生成式AI?与其他类型的AI有何不同?

原创 | 文 BFT机器人 

图片

快速浏览一下头条新闻,你会发现生成式AI似乎无处不在。事实上,一些新闻标题甚至可能是通过生成式AI编写的,例如OpenAI旗下的ChatGPT,这个聊天机器人已经展现出了生成看起来像人类所写文本的惊人能力。

当人们提到“生成式人工智能”时,他们指的到底是什么?

在生成式AI热潮兴起之前,当人们谈论人工智能时,通常是指那些可以基于数据进行预测的机器学习模型。例如,通过数百万个示例对此类模型进行训练,以预测某种X射线是否显示出肿瘤的迹象,或者某个借款人是否可能拖欠贷款。

图片

生成式 AI 可以被认为是一种另类的机器学习模型,经过训练后可以创建新数据,而不是对特定数据集进行预测。生成式AI系统指的是用来生成类似于其训练数据的更多对象的系统。“当涉及到生成式AI和其他类型的AI背后的技术时,它们之间的界限可能有点模糊。通常相同的算法可以用于两者,“麻省理工学院电气工程与计算机科学副教授、计算机科学与人工智能实验室(CSAIL)成员Phillip Isola表示。

尽管 ChatGPT 及其同类产品的发布引起了广泛的关注和讨论,但该技术本身并不是全新的。这些强大的机器学习模型是基于超过50年的研究和计算技术进步。

01

复杂性的提升

生成式AI的一个早期实例被称为马尔可夫链。该技术以俄罗斯数学家安德烈·马尔科夫(Andrey Markov)的名字命名,他在1906年引入了这种统计方法来模拟随机过程的行为。在机器学习中,马尔可夫模型长期被用于如电子邮件程序中预测下一个单词的自动填充任务。

图片

在文本预测中,马尔可夫模型能够通过分析前一个或几个单词来生成句子中的下一个单词。但这些模型由于只能回顾有限的信息,因此生成的文本往往不够合理,MIT电气工程与计算机科学Thomas Siebel教授、CSAIL和数据、系统与社会研究所(IDSS)成员Tommi Jaakkola表示。“我们在过去十年之前就开始进行生成式操作,但主要区别在于我们现在能生成的对象的复杂性以及训练这些模型的规模。”他补充道。

在几年前,研究人员倾向于寻找一种能够充分利用特定数据集的机器学习算法。但现在这种焦点已经略有转移,许多研究人员开始利用更大规模的数据集,可能包括数亿甚至数十亿数据点,来训练能够取得卓越成果的模型。

ChatGPT及其类似系统的基础模型在工作方式上与马尔可夫模型大致相同。区别在于,ChatGPT规模更大、更复杂,有数十亿个参数,并且它已经接受了互联网上可公开获取的大量数据的训练。在这个庞大的文本资料库中,单词和句子以具有某些依赖关系的顺序出现,这种重复性有助于模型了解如何将文本切割为具有一定可预测性的统计块。模型通过学习这些文本块的模式,并利用此知识来预测接下来可能出现的内容。

图片

02

更强大的架构

庞大的数据集是推动生成式AI热潮的催化剂之一,重要的研究进展也促成了更为复杂的深度学习架构的发展。

2014年,蒙特利尔大学的研究人员提出了一种名为生成对抗网络(GAN)的机器学习架构。GAN使用两个协同工作的模型:一个学习生成目标输出(如图像),另一个学习从生成器的输出中区分真实数据。生成器试图欺骗鉴别器,并在此过程中学习制作更逼真的输出。图像生成器StyleGAN就是基于此类模型的实例。

此后一年,斯坦福大学和加州大学伯克利分校的研究人员引入了扩散模型,通过迭代优化其输出,这些模型可以学习生成类似于训练数据集中样本的新数据样本,并用于创建逼真的图像。

图片

2017年,谷歌的研究人员推出了transformer架构,该架构已被用于开发大型语言模型,比如驱动ChatGPT的模型。在自然语言处理中,Transformer将文本语料库中的每个词编码为一个令牌,然后生成一个注意力图,该图捕捉每个令牌与所有其他令牌的关系。这个注意力图帮助Transformer在生成新文本时理解上下文。

这些仅仅是可用于生成式AI的众多方法中的一小部分。

03

应用范围广泛

这些方法的共同特点是将输入转换为一组令牌,这些令牌是数据块的数值表示形式。只要数据可以转换为这种标准的令牌格式,理论上可以应用这些方法来生成类似的新数据。“效果会因数据复杂度和信号提取难度而异,但它实际上越来越接近于通用CPU处理任意类型数据的方式,”Isola表示。

这为生成式AI开辟了大量的应用场景:

例如,Isola的团队正在使用生成式AI来创建合成图像数据,这些数据可用于训练另一个智能系统,例如教计算机视觉模型如何识别物体。

Jaakkola的团队正在使用生成式AI来设计新的蛋白质结构或有效的晶体结构以指定新材料。就像生成模型学习语言的依赖性一样,如果展示晶体结构,它也可以学习使结构稳定和可实现的关系。

图片

尽管生成模型可以取得惊人的成果,但它们并非适用于所有类型的数据,对于那些涉及在结构化数据(如电子表格中的表格数据)上进行预测的任务,生成式AI模型往往不如传统的机器学习方法。

04

生成式AI的机遇与风险

生成式AI聊天机器人目前在呼叫中心被用来解答客户的问题,但这一应用凸显了实施这些模型可能带来的一个潜在问题——人类的工作岗位被替代。此外,生成式AI可能会继承和扩散训练数据中存在的偏见,或放大仇恨言论和虚假陈述。同时这些模型具有抄袭的能力,并且可以生成看起来像是由特定人创作的内容,从而引发潜在的版权纠纷。

但另一方面,麻省理工学院的研究人员提出,生成式AI可能赋能艺术家,他们可以利用生成工具帮助创作他们可能无法用其他方式制作的创意内容。而在其他领域——如制造业,研究人员认为,在未来生成式AI不仅是让模型生成椅子的图像,它也许能生成可实际制造的椅子设计方案,这类应用或将彻底改变许多领域的经济格局。

若您对该文章内容有任何疑问,请与我们联系,我们将及时回应。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/151851.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

io+day8

#ifndef __SEM2 #define __SEM3 4 //声明一个创>5 int init_sem(6 7 //声明一个p操8 int P(int sem9 10 //声明一个v操11 int W(int sem12 13 //声明一个删>14 int del_sem(i15 16 #endif 1 #include <myhead.h> …

【博客系统】 二

本文主要介绍了linux和如何在云服务器上部署一个简单的servlet程序. 一.云服务器 真正搞一个网站,是希望这个网站被其他人访问到 , 所以需要一个云服务器(具有外网ip)来让别人也可以访问 云服务器 操作系统是Linux(一般都是通过命令行来操作) 当前市面上常见的系统: 1.windo…

IDEA写mybatis程序,java.io.IOException:Could not find resource mybatis-config.xml

找不到mybatis-config.xml 尝试maven idea:module&#xff0c;不是模块构造问题 尝试检验pom.xml&#xff0c;在编译模块添加了解析resources内容依旧不行 <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://maven.apache.or…

魔众文库系统 v5.6.0 DWG文件格式支持,部分数据封面显示异常,定时调度清理临时文件

魔众文库系统基于文档系统知识&#xff0c;建立平台与领域&#xff0c;打造流量、用户、付费和变现的闭环&#xff0c;帮助您更好的搭建文库系统。 魔众文库系统发布v5.6.0版本&#xff0c;新功能和Bug修复累计17项&#xff0c;DWG文件格式支持&#xff0c;部分数据封面显示异…

P95陷阱

想象这个场景&#xff1a; 一位测试同事走到你的座位旁&#xff0c;说&#xff1a;“接到客户&#xff08;上游系统&#xff09;反馈&#xff0c;说我们系统有个Rest接口响应慢。我看了监控上的P95响应时间&#xff0c;都一秒多了&#xff0c;帮忙看看吧。” 又来活了。 你喜…

langchain 之 Tools 多案例使用(一)

原文&#xff1a;langchain 之 Tools 多案例使用&#xff08;一&#xff09; - 简书 ATTENTION: 如果采用 openai 的接口&#xff0c;需要走代理&#xff0c;本文采用 proxychains 进行设置。开启 debug 模式后&#xff0c;能看到更多的输出信息。 import langchain langcha…

ROC 曲线:健康背景下的应用和解释

一、介绍 在医疗保健领域&#xff0c;做出明智的决策对于改善患者治疗结果、有效分配资源和设计有效的诊断测试至关重要。受试者工作特征 (ROC) 曲线是一个强大的工具&#xff0c;在评估诊断测试的性能、区分健康个体和患病个体以及优化医疗保健干预方面发挥着至关重要的作用。…

第07章 面向对象编程(进阶)

一 关键字&#xff1a;this 1.1 this是什么&#xff1f; 在Java中&#xff0c;this关键字不算难理解&#xff0c;它的作用和其词义很接近。 它在方法&#xff08;准确的说是实例方法或非static的方法&#xff09;内部使用&#xff0c;表示调用该方法的对象。它在构造器内部使…

【android】install android NDK

目录 1 下载NDK 2 解压 3 android-ndk的配置 1 下载NDK 下载网址&#xff1a;NDK 下载 | Android NDK | Android Developers 如果没有所需要的版本&#xff0c;则点击页面下面 不受支持的 NDK 下载需要的版本。 2 解压 将压缩文件&#xff08;例如 android-ndk-r25c-…

(五)什么是Vite——冷启动时vite做了什么(依赖、预构建)

vite分享ppt&#xff0c;感兴趣的可以下载&#xff1a; ​​​​​​​Vite分享、原理介绍ppt 什么是vite系列目录&#xff1a; &#xff08;一&#xff09;什么是Vite——vite介绍与使用-CSDN博客 &#xff08;二&#xff09;什么是Vite——Vite 和 Webpack 区别&#xff0…

一看就会的jni,不会你来打我!

环境配置 Android Studio&#xff0c;这个不多说了。 简单说一下NDK的下载和环境变量&#xff0c;方便在Terminal里使用命令(mac版)。 下载 1.可以通过Android Studio内置的Settings-Android SDK-SDK Tools安装NDK&#xff0c;下载目录为 /Users/mac-xxx(Username)/Library…

VF01 bapi BAPI_BILLINGDOC_CREATEMULTIPLE修改付款方

系统标准通过函数SD_PARTNER_READ&#xff0c;读取VBPA表销售订单对应的伙伴。 调整通过源代码增强LV60AA01最后位置。

《QT从基础到进阶·二十九》QT,opencv源码调试

有时候我们在使用VS调试程序的bug&#xff0c;但发现程序崩溃的地方并不在我们写的程序中&#xff0c;我们通过调用堆栈发现程序崩溃的地方出现在QT或者opencv等源码中&#xff0c;那么我们怎么能把断点打到这些开源库中&#xff0c;下面提供一种办法&#xff1a; 解决方案–右…

单日充值破6000万、8天收入破亿,小程序短剧的商业真相

进入2023年以来&#xff0c;短剧发展的速度相当惊人。无论是从短视频平台的用户规模来说&#xff0c;还是从短剧内容的商业效益来看&#xff0c;都进入了双增长的狂飙模式。 小程序指的是在一些APP的小程序平台上&#xff08;多为微信端&#xff0c;抖音、快手等平台也有&…

使用requests库解决Session对象设置超时的问题

在requests库的IRC频道中&#xff0c;提出了一个问题&#xff0c;即Session对象在requests库中没有一个可以全局设置的timeout属性&#xff0c;而是需要为每个请求传递timeout值&#xff0c;或者创建一个自定义子类来实现。 为了解决这个问题&#xff0c;可以向Session对象添加…

Apache阿帕奇安装配置

目录 一、下载程序 1. 点击Download 2. 点击Files for Microsoft Windows 3. 点击Apache Lounge 4. 点击httpd-2.4.54-win64-VSI6.zip ​编辑​ 5. 下载压缩包 6.解压到文件夹里 二、配置环境变量 1. 右键我的电脑 - 属性 2. 高级系统设置 3. 点击环境变量 4. 点击系统…

中国芯片金字塔成形,商业化拐点将至

其作始也简&#xff0c;其将毕也钜。 传说埃及用时30年建成左赛尔金字塔&#xff0c;成为亘古不灭的世界奇迹。在今天&#xff0c;中国芯片产业走过8年“国产替代”历程&#xff0c;国产芯片的“金字塔”体系业已初具雏形&#xff0c;展现出蓬勃的发展潜力。 2023年是补全自主…

Linux系统进程与进程间通信

Linux是一个多用户、多任务的操作系统&#xff0c;支持多个进程同时运行。进程是Linux系统中的基本单元&#xff0c;它们负责执行各种任务&#xff0c;如网页浏览、文件下载、程序运行等。在Linux中&#xff0c;进程是由一个或多个线程组成的&#xff0c;线程是进程的基本执行单…

浅谈安科瑞无线测温产品在巴西某工厂的应用

摘 要&#xff1a;高压开关设备是变电站和配电站中保证电力系统安全运行的重要设备之一,因此,开关柜的稳定运行对于整个电力系统有非常重要的意义。设备老化、长期高负荷运行都可能使设备局部温度过高而发生火灾&#xff0c;因此,对变电站内的敏感设备进行温度检测变得尤为重要…

Java实现简单的俄罗斯方块游戏

一、创建新项目 1.首先新建一个项目&#xff0c;并命名为俄罗斯方块。 2.其次新建一个类&#xff0c;命名为Main&#xff0c;或其他的。 二、运行代码 代码如下&#xff1a; package 俄罗斯方块;import java.awt.BorderLayout; import java.awt.Color; import java.awt.Gr…