解析生成式人工智能 | 它真的有这么强大吗?

原创 | 文 BFT机器人

图片

当人们说“生成式人工智能”时,你知道这代表着什么意思吗?为什么这些系统似乎正在覆盖所有涉及联想的应用程序?近日,麻省理工学院的人工智能专家帮助剖析了这种日益流行且无处不在的技术。

当你快速浏览一下头条新闻就会发现,如今生成人工智能似乎无处不在。其中一些头条新闻实际上可能就是由生成式人工智能撰写的,例如OpenAI的ChatGPT,这是一个聊天机器人,它表现出了令人意想不到的能力,那就是可以生成看似由人类编写的文本。

图片

图片来源:网络

但“生成式人工智能”真正的含义是什么呢?

在过去人工智能蓬勃发展,当人们谈论人工智能时,通常谈论的是可以根据数据进行预测的机器学习模型。例如,使用人工智能对将要会出现的情况进行预测。

生成式人工智能可以被认为是一种机器学习模型,经过训练可以创建新的数据,而不是对固定的数据集进行预测。生成式人工智能系统能够学习生成更多像它在训练时创建数据的对象。

“当谈到生成式人工智能和其他类型人工智能的实际区别时,区别可能有点模糊,一般来说,相同的算法可以用于两者。”麻省理工学院电子工程与计算机科学副教授、计算机科学与人工智能实验室(CSAIL)成员Phillip Isola说。

尽管ChatGPT及其同类产品的发布引起了大肆宣扬,但该技术本身并不是全新的。这些强大的机器学习模型借鉴了50多年前的研究和计算进展。

01

复杂性成上升趋势

生成式人工智能的一个早期是一个简单得多的模型,称为马尔可夫链。这项技术是以俄罗斯数学家Andrey Markov的名字命名的,他在1906年引入了这项技术来模拟随机过程。在机器学习中,马尔可夫模型长期以来一直用于下一个单词预测任务,例如电子邮件程序中的自动完成功能。

在文本预测中,马尔可夫模型通过查看前一个单词或前面的几个单词来生成句子中的下一个单词。但由于这些简单的模型预测的数据集有限,因此它们不擅长生成可信的文本。

“我们在过去十年之前就已经开始生成东西了,但这里的主要区别在于我们可以生成的对象的复杂性以及我们可以训练这些模型的规模,”省理工学院电气工程和计算机科学的教授Tommi Jaakkola说道。

就在几年前,研究人员还倾向于寻找一种能够充分利用特定数据集的机器学习算法。但这种关注点已经发生了一些转移,许多研究人员现在正在使用更大的数据集(可能包含数亿甚至数十亿的数据点)来训练可以取得令人更加可靠结果的模型。

ChatGPT和类似系统的基础模型的工作方式与马尔可夫模型非常相似。但一个很大的区别是ChatGPT更大、更复杂,有数十亿个参数,它接受了大量数据的训练——在这种情况下,大部分是互联网上公开可用的文本。

在这个庞大的文本语料库中,单词和句子以具有一定重复性的顺序出现。这种重复有助于模型理解如何将文本切割成具有一定可预测性的统计块。它学习这些文本块的模式,并利用这些知识来提出接下来可能发生的情况。

02

更强大的架构

虽然更大的数据集是导致生成式人工智能逐渐强大的催化剂之一,但各种重大研究进展也产生了更复杂的深度学习架构。

2014年,蒙特利尔大学的研究人员提出了一种称为生成对抗网络 (GAN) 的机器学习架构。GANs使用两个协同工作的模型:一个学习生成目标输出(如图像),另一个学习从生成器的输出中区分真实数据。生成器试图欺骗鉴别器,并在此过程中学习做出更真实的数据输出。图像生成器StyleGAN就是基于这些类型的模型。 

一年后,斯坦福大学和加州大学伯克利分校的研究人员引入了扩散模型。通过迭代地完善它输出,这些模型学习生成与训练数据集中的样本相似的新数据样本,并已用于创建逼真的图像。扩散模型是文本到图像生成系统稳定扩散的核心。

2017年,谷歌的研究人员推出了转换器架构,该架构已用于开发大型语言模型,例如为ChatGPT提供支持的语言模型。在自然语言处理中,转换器将文本语料库中的每个单词编码为一个标记,然后生成一个标记图,该图捕获每个标记与所有其他标记的关系,此标记图可帮助转换器在生成新文本时理解上下文。

这些只是可用于生成人工智能的众多方法中的几种。

03

危险的信号已经举起

生成式人工智能聊天机器人现在被用于客服中心来回答人类客户的问题,但这一应用程序强调了实施这些模型的一个潜在危险信号——工人被取代了。

此外,生成式人工智能可以继承和扩散训练数据中存在的虚假问题,或放大仇恨言论和虚假陈述。这些模型具有抄袭的能力,并且可以生成看起来像是由特定人类创作者制作的内容,从而引发潜在的版权问题。

另一方面,有人提出,生成人工智能可以增强艺术家的能力,他们可以使用生成工具来帮助他们制作创造性的内容,否则他们可能没有生产的手段。

在未来,生成式人工智能将改变许多领域的经济动态。

或者有些人认为生成式人工智能未来可以应用在制造业中,也许它可以生成一个生产椅子的程序,而不只是让制作一张椅子的图像。

生成式人工智能系统在未来将用于开发更广泛的智能人工媒介。这些模型的工作方式和我们对人类大脑工作方式的理解存在一定的差异,但我认为也有相似之处。这些大模型与人类大脑是可以共存的,我们有能力在头脑中思考和想象,提出有趣的想法或计划,而生成式人工智能是帮我们实现创新和想法的媒介,正确使用生成式人工智能能够给社会或者个人带来更多的效益。

注:若您对该文章内容有任何疑问,请与我们联系,将及时回应。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/175289.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

如何看待程序员领域内的“内卷”现象?

要搞清楚这个问题,我首先就来阐释一下“内卷”的概念。 内卷本身是从一个学术名词演化为网络流行词的,本是指文化模式因达到某种最终形态,既无法保持稳定也不能转化为更高级的新形态,而只能在这种文化模式内部无限变得复杂的现象。…

HTML+CSS+ElementUI搭建个人博客静态页面展示(纯前端)

网站演示 搭建过程 技术选取 HTML/CSSVUE2ElementUI(Version - 2.15.14) 环境配置与搭建 安装指令 1. 先确保你的电脑已经安装好了npm和node npm -vnode -v2. ElementUI下载&#xff0c;推荐使用 npm 的方式安装 npm i element-ui -S3. CDN引入 <!-- 引入样式 --> <…

Redis 与其他数据库的不同之处 | Navicat

Redis&#xff0c;即远程字典服务器&#xff08;Remote Dictionary Server&#xff09;&#xff0c;它是一个多功能且高性能的键值存储系统&#xff0c;在数据库领域中已获得广泛关注和认可。在处理简单数据结构方面&#xff0c;它因其快速和高效而著称。本文中&#xff0c;我们…

基于高质量训练数据,GPT-4 Turbo更出色更强大

11月7日消息&#xff0c;OpenAI在首届开发者大会上正式推出了GPT-4 Turbo。 与GPT-4相比&#xff0c;GPT-4 Turbo主要有6方面的提升&#xff1a; 1、扩展下文对话长度&#xff1a;GPT4最大只能支持8k的上下文长度&#xff08;约等于6000个单词&#xff09;&#xff0c;而GPT-4…

SOLIDWORKS实用技巧——工程图模板替换

概述 工程师常在出图时选择最佳模板&#xff0c;在编辑一段时间后&#xff0c;发现需要更改图纸大小&#xff0c;怎样更改图纸大小还不影响现有工作。你是否也有此类问题&#xff1f; 那么&#xff0c;新建工程图时的模板从哪里来&#xff1f;如何轻松替换已有工程图的图纸格…

你还记得你常用的数据库有哪些吗?

接上文&#xff0c;常用数据库有哪些 Oracle 开发厂商&#xff1a;甲骨文公司 最新版本&#xff1a;Oracle Database 19c&#xff08;长期支持版&#xff09;、Oracle Database 21c&#xff08;创新版&#xff0c;已生产可用&#xff09; 发行方式: 商业软件&#xff08;Comme…

swagger的ApiImplicitParam注解中的required属性不起作用

问题的发现 如上两图&#xff0c;在接口中使用了’ApiImplicitParam’注解&#xff0c;仅指定了一个参数是必填&#xff0c;但是通过swagger文档查看三个参数均不能为空。 原因探究 最终确定到因为在RequestParam中也有一个required属性&#xff0c;用于指定是否必填。swagge…

ERP对接淘宝/天猫/京东/拼多多商品详情数据API接口

引言 今天&#xff0c;我们时代变化非常快&#xff0c;传统行业做法&#xff0c;已经无法完全适应时代的发展。互联网的发展&#xff0c;造成了一股网购热。京东&#xff0c;天猫&#xff0c;淘宝&#xff0c;易购……网购&#xff0c;给我们生活带来了方便&#xff0c;消费者…

系统试运行方案

系统试运行的目的&#xff1a; 试运行目的通过既定时间段的试运行&#xff0c;全面考察项目建设成果。并通过试运行发现项目存在的问题&#xff0c;从而进一步完善项目建设内容&#xff0c;确保项目顺利通过竣工验收并平稳地移交给运行管理单位。通过实际运行中系统功能与性能的…

股票基础数据(二)

二. 股票基础数据 文章目录 二. 股票基础数据一. 查询股票融资信息数据二. 查询所有的股票信息三. 查询所有的股票类型信息四. 根据类型查询所有的股票数据信息五. 查询股票当前的基本信息六. 查询股票的K线图, 返回对应的 base64 信息七. 展示股票的K线图数据, 对应的是数据信…

Go 异常处理流程

在 Go 语言中&#xff0c;panic、recover 和 defer 是用于处理异常情况的关键字。它们通常一起使用来实现对程序错误的处理和恢复。 1. defer 语句 defer 用于在函数返回之前执行一段代码。被 defer 修饰的语句或函数会在包含 defer 的函数执行完毕后执行。defer 常用于资源清…

服务器 jupyter 文件名乱码问题

对于本台电脑&#xff0c;autodl服务器&#xff0c;上传中文文件时&#xff0c;从压缩包名到压缩包里的文件名先后会出现中文乱码的问题。 Xftp 首先是通过Xftp传输压缩包到Autodl服务器&#xff1a; 1、打开Xftp&#xff0c;进入软件主界面&#xff0c;点击右上角【文件】菜…

Nacos升级2.2.2 相关版本升级及升级中问题【下篇】

上篇对nacos进行了升级&#xff0c;如果有不清楚的小伙伴可以参考文章&#xff1a;https://blog.csdn.net/weixin_38801572/article/details/130237813 本篇主要是对升级后的鉴权问题进行处理&#xff0c;找了好多的文章都是添加username、password操作&#xff0c;但是实际操作…

8.3 Windows驱动开发:内核遍历文件或目录

在笔者前一篇文章《内核文件读写系列函数》简单的介绍了内核中如何对文件进行基本的读写操作&#xff0c;本章我们将实现内核下遍历文件或目录这一功能&#xff0c;该功能的实现需要依赖于ZwQueryDirectoryFile这个内核API函数来实现&#xff0c;该函数可返回给定文件句柄指定的…

足底筋膜炎症状及治疗方法

足底筋膜炎是一种常见的足部疾病&#xff0c;通常会引起足跟疼痛和不适。这种疼痛通常在早晨起床后或者长时间休息后更为明显&#xff0c;行走一段时间后可能会减轻。下面我们将详细介绍足底筋膜炎的症状及治疗方法。 一、足底筋膜炎的症状 足跟疼痛&#xff1a;这是足底筋膜…

Avalonia 实现简单的IM即时通讯、视频通话(源码,支持国产系统,统信、银河麒麟)

Avalonia 在跨平台上的表现非常出色&#xff0c;对信创国产操作系统&#xff08;像银河麒麟、统信UOS、Deepin等&#xff09;也很不错。现在&#xff0c;我们就来使用 Avalonia 实现一个跨平台的简单IM&#xff0c;除了文字聊天外&#xff0c;还可以语音视频通话。废话不多说&a…

B032-服务器 Tomcat JavaWeb项目 Servlet

目录 服务器服务器的认识 Tomcat服务器Tomcat服务器的介绍Tomcat的安装Tomcat报错的情况Tomcat要启动成功的条件 JavaWeb项目Web的项目结构发布项目的第一种方式发布项目的第二种方式 Eclipse中搭建动态Web项目eclipse安装Tomcat插件servletservlet示例servlet的执行流程servle…

MySql 计算同比、环比

一、理论 国家统计局同比、环比计算公式 增长速度是反映经济社会某一领域发展变化情况的重要数据&#xff0c;而同比和环比是反映增长速度最基础、最核心的数据指标&#xff0c;也是国际上通用的指标。在统计中&#xff0c; 同比和环比通常是同比变化率和环比变化率的简称&…

【bug 回顾】上传图片超时

测试 bug 问题分析 - 上传图片超时 最近在测试上遇到一个莫名奇妙的问题&#xff0c;最后也没有得到具体是哪块的原因&#xff0c;看各位大佬有没有思路&#xff1f;&#xff1f; 一 、背景 现在我们有三台服务器&#xff0c;用来布两套环境。其中另外一台服务器3配置的 tom…

打包项目报错:程序包javax.servlet不存在

背景&#xff1a; WebService项目在没有配置Tomcat的情况下重新打包&#xff0c;由于是直接导入别人写好的项目&#xff0c;没有配置其他环境&#xff0c;所以报错程序包javax.servlet不存在 解决方法&#xff1a; 找到servlet-api.jar包&#xff0c;导入到现有项目的SDK 重…