翻译: 生成式人工智能的工作原理How Generative AI works

在这里插入图片描述

ChatGPT 和 Bard 等系统生成文本的能力几乎像魔法一样。它们确实代表了 AI 技术的一大步进。但是文本生成到底是如何工作的呢?在这个视频中,我们将看看生成式 AI 技术的底层原理,这将帮助你理解你可以如何使用它,以及何时可能不想依赖它。让我们来看看。首先让我们看看生成式 AI 在 AI 领域中的位置。关于 AI 有很多炒作和兴奋,我认为一个有用的方式是将 AI 视为一系列工具的集合。AI 中最重要的工具之一是监督学习,它非常擅长于标记事物。如果你不知道这意味着什么,不用担心,我们将在下一张幻灯片中更多地讨论这个。其次是生成式 AI,这个领域直到最近才开始表现得非常好。如果你研究 AI,你可能会认识到还有其他工具,比如所谓的无监督学习和强化学习。但为了这门课程的目的,我将简要介绍什么是监督学习,然后花大部分时间讨论生成式 AI。

这两个,监督学习和生成式 AI,是当今 AI 中最重要的两个工具。对于大多数商业用例,如果你现在不担心这些工具以外的其他工具,你应该没问题。
在这里插入图片描述

在描述生成式 AI 如何工作之前,让我简要描述一下什么是监督学习,因为生成式 AI 是使用监督学习构建的。监督学习是一种技术,使计算机在给定一个输入(我将称之为 A)时非常擅长生成相应的输出(我将称之为 B)。
在这里插入图片描述

看几个例子。给定一封电子邮件,监督学习可以决定这封电子邮件是否是垃圾邮件。输入 A 是一封电子邮件,输出 B 是 0 或 1,其中 0 表示非垃圾邮件,1 表示垃圾邮件。这就是今天的垃圾邮件过滤器工作原理。作为第二个例子,可能是我曾经参与过的最赚钱的应用,不是最鼓舞人心,但对一些公司来说是赚钱的,是在线广告,其中给定一个广告和一些关于用户的信息,一个 AI 系统可以生成一个与您是否可能点击该广告相对应的输出 B。通过显示略微更相关的广告,这为在线广告平台带来了可观的收入。在自动驾驶汽车和驾驶辅助系统中,监督学习被用来将你的汽车前方的图像和雷达信息作为输入,并标记出其他汽车的位置。给它一个医疗 X 光片,它可以尝试用医疗诊断来标记它。我还在制造缺陷检查方面做了很多工作,你可以让一个系统拍摄一部手机的照片,当它从生产线上滚下来时,检查手机是否有任何划痕或其他缺陷,或者在语音识别中,输入 A 将是一段音频,我们将用文本转录来标记它,或者作为最后一个例子,如果你经营一家餐馆或其他偶尔有人写评论的生意,监督学习可以阅读这些评论,并将每一个标记为具有正面或负面情绪。这对于监控业务声誉很有用。

在这里插入图片描述

事实证明,大约 2010-2020 年的十年是大规模监督学习的十年。我想简要谈谈这一点,因为事实证明,这为现代生成式 AI 奠定了基础。但我们从 2010 年左右开始发现的是,对于很多应用来说,我们有很多数据,但即使我们提供了更多数据,如果我们训练的 AI 模型很小,它的性能并没有变得更好。这意味着,例如,如果你正在构建一个语音识别系统,即使你的 AI 听了成千上万小时或数十万小时的数据,这是很多数据,与只听了较少量音频数据的系统相比,它并没有变得更准确。但越来越多的研究人员在这一时期开始意识到,如果你训练一个非常大的 AI 模型,意味着在非常快速、非常强大的计算机上,有很多内存的 AI 模型,那么随着你提供越来越多的数据,它的性能会越来越好。

事实上,多年前当我开始并领导了 Google Brain 团队时,我为 Google Brain 团队设定的主要使命是,我说,让我们只是构建非常非常大的 AI 模型并向它们提供大量数据。幸运的是,这个配方奏效了,并最终推动了 Google 的许多 AI 进步。大规模监督学习今天仍然很重要,但这种用于标记事物的非常大的模型的想法是我们今天如何获得生成式 AI 的。
在这里插入图片描述

让我们看看生成式 AI 是如何使用一种叫做大型语言模型的技术来生成文本的。这是大型语言模型(我将缩写为 LLM)生成文本的一种方式。给定一个输入,比如“我喜欢吃”,这被称为提示,一个 LLM 然后可以用“百吉饼配奶油芝士”之类的东西来完成这个句子,或者如果你再运行一次,它可能会说“我妈妈的肉饼”,或者如果你第三次运行,也许它会说“和朋友一起出去”。一个大型语言模型是如何生成这个输出的呢?事实证明,LLM 是通过使用监督学习构建的。这是一种将输入 A 和输出标签 B 的技术。它使用监督学习来反复预测下一个词是什么。例如,如果一个 AI 系统在互联网上读到了一句话,比如“我最喜欢的食物是百吉饼配奶油芝士”,那么这一个句子就会变成很多数据点,让它尝试学习预测下一个词。具体来说,根据这个句子,我们现在有一个数据点,它说,给定短语“我最喜欢的食物是”,你认为下一个词是什么?在这种情况下,正确的答案是百吉饼。此外,给定“我最喜欢的食物是百吉饼”,你认为下一个词是什么?是“配”,等等。

在这里插入图片描述

这句话被转化为多个输入 A 和输出 B,以便从中学习,其中 LLM 正在学习给定几个词来预测接下来的词是什么。当你在大量数据上训练一个非常大的 AI 系统时,对于 LLM 来说,大量数据意味着数千亿甚至超过一万亿的词,那么你就会得到一个像 ChatGPT 这样的大型语言模型,它在给定一个提示时非常擅长生成一些额外的词作为响应。现在,我暂时省略一些技术细节。具体来说,下周我们将讨论一个使 LLM 不仅仅预测下一个词,而且实际上学会遵循指令并在其输出中保持安全的过程。但 LLM 的核心是这项从大量数据中学习预测下一个词的技术。这就是大型语言模型的工作方式;它们被训练来反复预测下一个词。事实证明,许多人,也许包括你,已经发现这些模型对日常工作中的写作、寻找基本信息或作为思考伙伴帮助思考问题很有用。

参考

https://www.coursera.org/learn/generative-ai-for-everyone/lecture/FhzP3/how-generative-ai-works

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/218155.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

免费的SEO外链发布工具,提升排名的利器

互联网已经成为信息传播和商业发展的重要平台。而对于拥有网站的个人、企业来说,如何让自己的网站在搜索引擎中脱颖而出?SEO(Search Engine Optimization)作为提高网站在搜索引擎中排名的关键手段. 什么是SEO外链? S…

【数据结构】最短路径——Floyd算法

一.问题描述 给定带权有向图G(V,E),对任意顶点 V (ij),求顶点到顶点的最短路径。 转化为: 多源点最短路径求解问题 解决方案一: 每次以一个顶点为源点调用Dijksra算法。时间复杂…

根据已有安装的cuda配置合适的pytorch环境

目前网络上根据电脑配置安装合适的深度学习环境的帖子已经很多了,但是现实中会出现很久之前已经安装了对应的cuda,但是现在忘记了当时安装的是什么版本。本文针对这一问题展开攻略。 1 cuda安装版本查询 我们在查询自己应该安装什么版本的cuda时&#…

前端——html拖拽原理

文章目录 ⭐前言⭐draggable属性💖 api💖 单向拖动示例💖 双向拖动示例 ⭐总结⭐结束 ⭐前言 大家好,我是yma16,本文分享关于 前端——html拖拽原理。 vue3系列相关文章: vue3 fastapi 实现选择目录所有文…

仅 CSS 阅读进度条

为了构建一个阅读进度条,即显示用户向下滚动时阅读文章的进度,很难不考虑 JavaScript。但是,事实证明,您也可以使用纯 CSS 构建阅读进度条。 从本质上讲,一个名为 animation-timeline 的新实验性 CSS 属性可以让你指定…

【工具使用-Audition】如何使用Audition频谱分析

一,简介 本文以Audition 2020为例,介绍如何生成频谱分析的图像。 二,操作步骤 使用快捷键“shift D” 三,总结 本文主要介绍如何查看频谱分析,供参考。

dll动态链接库【C#】

1说明: 在C#中,dll是添加 【类库】生成的。 2添加C#的dll: (1)在VS中新建一个Windows应用程序项目,并命名为TransferDll。 (2)打开Windows窗体设计器,从工具箱中为窗体添加相应的控件。 (3)在该应用程序的“解决方案资源管理”中的“引用”文件上单击鼠标右键, 在…

沐风老师3DMAX拼图随机生成器Puzzle建模工具使用教程

3DMAX拼图随机生成器Puzzle建模工具使用教程 3DMAX拼图随机生成器Puzzle,是一款用MAXScript脚本语言开发的3dsMax小工具,可以随机创建可编辑多边形3D拼图对象。可批量生成阵列。 【适用版本】 3dMax2015-2024(不仅限于此范围) 【…

【Unity动画】Unity 动画播放的流程

本文以2D为案例,讲解Unity 播放动画的流程 准备和导入2D动画资源 外部导入序列帧生成的 Unity内部制作的 外部导入的3D动画 2.创建动画过程 打开时间轴Ctrl6 选中场景中的一个未来需要播放动画的物体 回到时间轴点击Create一个新动画片段 拖动2D动画资源放入…

探索图像生成中的生成对抗网络 (GAN) 世界

一、介绍 生成对抗网络(GAN)的出现标志着人工智能领域的一个重要里程碑,特别是在图像生成领域。GAN 由 Ian Goodfellow 和他的同事于 2014 年提出,代表了机器学习中的一种新颖方法,展示了生成高度逼真和多样化图像的能…

专业做除甲醛净化器的品牌 甲醛净化器什么牌子最好用

室内产生了超标的甲醛,大部分都会采取选择甲醛空气净化器来去除,甲醛净化器逐渐成为室内清除甲醛的主力,在选择甲醛净化器时,人们常常会被市场上琳琅满目的空气净化器品牌所迷惑,各品牌和型号都声称自己最好&#xff0…

❀dialog命令运用于linux❀

目录 ❀dialog命令运用于linux❀ msgbox部件(消息框) yesno部件(yesno框) inputbox部件(输入文本框) textbox部件(文本框) menu部件(菜单框) fselect部…

Python---面向对象的基本概念

对象 对象,object,现实业务逻辑的一个动作实体就对应着OOP编程中的一个对象! 所以:① 对象使用属性(property)保存数据!② 对象使用方法(method)管理数据! …

PyQt实战 创建一个PyQt5项目

前后端分离 参考链接 PyQt5实战(二):创建一个PyQt5项目_pyqt5实战项目_笨鸟未必先飞的博客-CSDN博客 项目目录 创建一个QT项目 调用pyuic工具将dialog.ui文件编译为Python程序文件ui_dialog.py。 # -*- coding: utf-8 -*-# Form implemen…

element-ui upload组件中将file文件数据转成二进制流数据格式

方法一 handleBeforeUpload (file)const reader new FileReader()reader.readAsArrayBuffer(file)reader.onload async function (theFile) {const binary new Blob([theFile.target.result]) // 转成二进制流数据 即binary数据格式}}方法二 const aBlob new Blob([file],…

【C语言】深入理解指针(1)

目录 前言 (一)内存与地址 从实际生活出发 地址 内存 内存与地址关系密切 (二)指针变量 指针变量与取地址操作符 指针变量与解引用操作符 指针的大小 指针的运算 指针 - 整数 指针-指针 指针的关系运算 指针的类型的…

2022 China Collegiate Programming Contest (CCPC) Guilin Site

A.Lily Problem - A - Codeforces 题意 思路 数所有周围没L的格子 #include <bits/stdc.h>using i64 long long;constexpr int N 2e5 10; constexpr int mod 1e9 7; constexpr int Inf 0x3f3f3f3f; constexpr double eps 1e-10;std::string s;int n;void solv…

vue3 + TS 项目中使用pinia-plugin-persistedstate持久化缓存

Vue 3和Pinia是一对非常好的组合&#xff0c;可以帮助你构建现代化的Vue应用程序。而pinia-plugin-persistedstate是一个用于在Pinia存储中实现状态持久化的插件。下面我将详细介绍如何在Vue 3应用程序中使用Pinia和pinia-plugin-persistedstate模块。 首先&#xff0c;确保你…

Redis高可用之Sentinel哨兵模式

一、背景与简介 Redis关于高可用与分布式有三个与之相关的运维部署模式。分别是主从复制master-slave模式、哨兵Sentinel模式以及集群Cluster模式。 这三者都有各自的优缺点以及所应对的场景、对应的业务使用量与公司体量。 1、主从master-slave模式 【介绍】 这种模式可以采用…

Vue学习计划--Vue2(二)Vue代理方式

Vue data中的两种方式 对象式 data:{}函数式 data(){return {} }示例&#xff1a; <body><div id"app">{{ name }} {{ age}} {{$options}}<input type"text" v-model"value"></div><script>let vm new Vue({el: …