【研0深度学习】李宏毅2024春《生成式人工智能导论》持续更新...

文章目录

  • 第1讲 什么是生成式人工智慧?
  • 第2讲 今日的生成式人工智慧厉害在哪里?
  • 第3-5讲 训练不了人工智慧,你可以训练你自己(在不训练模型的情况下强化语言模型的方法)
  • 第6讲 大模型修炼史——第一阶段 自我学习 累计实力

第1讲 什么是生成式人工智慧?

  • 生成式人工智慧的目的不是进行做有结果的分类,而是使机器生成复杂有结构的物件。今天的生成式人工智慧多以深度学习构成。
  • 以现如今流通最广泛的ChatGPT为例,GPT可以看作一个函数,输入图片、语音或者文字等,“创造性”地输出结果。这里的“创造性”的实现是将问题拆解成一连串的文字进行接龙,转化为分类问题。对于每个结果都有概率,在这个概率的基础上掷骰子,进行输出。
  • 如下图所示有百分之五十的概率输出“学”字。那么问题来了,如果每次输出概率最大的不行吗?回答是不行的,因为如果每次输出概率最大的token的话,可能会导致输出重复混乱,所以采用掷骰子的方法。

第2讲 今日的生成式人工智慧厉害在哪里?

如今的GPT能够通过人类下的指示prompt,灵活地完成任务,而不是只有某些特定的功能。
现在人工智慧已经从「工具」进化成「工具人」,那么我还能做什么呢?

  • 思路一:我改不了模型,那我改变我自己——给更清楚的指令、提供额外资讯(Prompt Engineering)
  • 思路二:我要自己训练模型

第3-5讲 训练不了人工智慧,你可以训练你自己(在不训练模型的情况下强化语言模型的方法)

按照今天语言模型的能力,只需要把要完成的任务描述清楚即可。
有些在不训练模型的情况下可以训练语言模型的方法:

  1. 神奇咒语:叫模型一步一步思考
  2. 提供额外资讯:把前提讲清楚
  3. 提供生成式AI不清楚的咨询/范例:如文本等信息。In-context Learning
  4. 拆解任务:把一个大任务,拆解成小任务让GPT逐步完成
  5. 让语言模型检查自己的错误
  6. 使用工具:
  1. 使用搜索引擎:在网络或资料库中搜索额外的信息给语言模型最后输出结果,这个方法又称为Retrieval Augmented Generation(RAG)
  2. 写代码:解决部分问题时,使用代码进行解决,而不是可能出现错误的文字接龙,这个方法叫做Program of Thought(PoT)
  3. 文生图AI(DALL-E)
  4. 除了上述三种工具之外,还有很多GPT插件待探索和发现。
  1. 语言模型彼此合作:
  1. 未来不需要打造全能的模型,语言模型可以彼此分工,不同团队可以专注打造专业领域的模型。
  2. 另外,为了降低模型的成本,可以训练一个模型,选择不同的模型做合适的事情。比如,简单的问题并不需要使用高昂的GPT4进行回答,当训练一个模型可以选择回答模型的时候,简单问题就可以选择GPT3.5进行回答,根据不同问题难度选择不同把成本的模型。
  3. 让模型彼此讨论得到的结果,对结果进行修正,这样比模型自己反省得到的结果优秀。多模型讨论的方法称做Exchange of Thought。但是现在模型讨论面临的问题时,讨论结束太快,所有在加prompt的时候最好加上:不一定要同意其他人的观点,自己思考如何得到正确的观点。
  4. 引入不同的角色:根据不同任务引入不同的角色,每个角色给除自己以外的打分,分数太低的就不参与工作。

第6讲 大模型修炼史——第一阶段 自我学习 累计实力

大模型训练的第一阶段:Pre-tain。大模型在第一阶段中从网络中搜寻大量的文字资料进行Self-supervised learing 自监督式学习。
那么需要多少个文字资料才能够让机器学习到足够的知识呢?对于语言知识,大概1亿个资料就足够,但是对于世界知识,1亿个资料是远远不够的,因为世界知识过于庞杂,层次过多,即使到30亿的训练资料也不够学习。(如下图所示)

在网络上搜寻资料时也不是随便搜寻,也是要进行资料清理的:(以GPT-3/The Pile/PaLM使用的资料品质分类器所示)

过滤有害内容
去除HTML等符号-只保留项目符号
去除低品质资料
去除重复资料
测试集过滤

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/653244.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Linux 系统中 ODBC 驱动的安装与配置指南

Linux 下的 ODBC 包 从发布包中获取,包名为 openGauss-*.*.0-ODBC.tar.gz。Linux 环境下,开发应用程序要用到 unixODBC 提供的头文件(sql.h、sqlext.h 等)和库 libodbc.so。这些头文件和库可从 unixODBC-2.3.0 的安装包中获得。 …

JavaWeb开发 2.Web开发 Web前端开发 ①介绍

内心一旦平静,外界便鸦雀无声 —— 24.5.27 一、初识Web前端 网页有哪些部分组成? 文字、图片、音频、视频、超链接 ...网页,背后的本质是什么? 前端代码前端的代码是如何转换成用户眼中的网页的? 通过浏览器转化(解析和渲染)成用户看…

PID控制中的积分到底是什么,为什么它可以将矩形线转换为曲线?simulink搭建PID控制,积分模块1/s

PID控制中的积分到底是什么,为什么它可以将矩形线转换为曲线, 这个问题呢其实道理很简单,用到的是初中的知识 我们做几个测试案例 如下面matlab搭建了积分1/s 那显示如下(红色曲线相当于加速度、蓝色曲线相当于速度)&a…

WHLUG活动回顾 | 4大技术分享!干货满满,热闹非凡!

内容来源:deepin(深度)社区 2024 年 5 月 25 日下午,由 deepin(深度)社区华中科技大学开放原子开源俱乐部联合举办的武汉 Linux 爱好者线下沙龙活动(WHLUG)在华中科技大学成功举办。…

因智而兴 向“新”而行 | 软通动力携子公司鸿湖万联亮相数字中国建设峰会·智算云生态大会

5月23日至27日,第七届数字中国建设峰会在福州盛大召开。作为峰会的重要组成部分,由中国电信、中国电科、中国电子联合主办的第三届智算云生态大会同步召开。此次大会以“国云注智 聚力向新”为主题,深入探讨了智算云、人工智能、数据要素、量…

技术支持服务体系建设

作者黄凯,曾就职于阿里云,从事对外电商能力输出平台Linkedmall的研发工作。 背景 曾在某公司做过某项目的技术支持负责人,对技术支持服务体系的建设偶有心得。打算分享一下。 我们是个ToBToC的电商项目,最初随着项目的上线&…

如何部署一套高可用性的医院信息管理系统?基于华为云、SpringBoot、Vue及Jenkins、Gitlab的CI/CD流程

目录 一、项目背景 二、项目架构 三、项目部署流程 1、前端部署 2、后端部署 3、监控与运维 四、项目过程 一、项目背景 随着医疗信息化程度的不断加深,医院信息管理系统的稳定性和可用性成为了医疗机构日常运营的关键。在这个数字化时代&am…

干冰清洗机的清洗原理及应用

干冰清洗机的清洗原理及应用可以详细阐述如下: 一、清洗原理 干冰清洗机的清洗原理主要基于干冰的低温冷冻作用。干冰在常温下会迅速升华,吸收大量的热量,使周围的温度迅速降低。当干冰颗粒通过特殊的干冰清洗机喷射到清洗物体表面时&#…

数据库系统概论(个人笔记)(第三部分)

数据库系统概论(个人笔记) 文章目录 数据库系统概论(个人笔记)3、SQL介绍3.1 SQL查询语言概述3.2 SQL数据定义3.3 SQL查询的基本查询结构3.4 其他基本操作3.5 设置操作3.6 空值3.7 聚合函数3.8 嵌套子查询3.9 数据库的修改 3、SQL…

sklearn监督学习--k近邻算法

sklearn监督学习 一、分类与回归二、泛化、过拟合与欠拟合三、k近邻算法四、分析KNeighborsClassifier五、k近邻算法用于回归优点、缺点和参数 一、分类与回归 监督学习是最常用也是最成功的机器学习类型之一。监督机器学习问题主要有两种,分别叫做分类与回归。分类…

金蝶云星空与旺店通·企业版对接集成采购入库查询打通创建采购入库单

金蝶云星空与旺店通企业版对接集成采购入库查询打通创建采购入库单 数据源系统:金蝶云星空 金蝶K/3Cloud(金蝶云星空)是移动互联网时代的新型ERP,是基于WEB2.0与云技术的新时代企业管理服务平台。金蝶K/3Cloud围绕着“生态、人人、体验”&…

没人愿意和我们最好的工程师一起工作

几年前,有一位魔术般厉害的工程师(我们叫他“乔恩”)为我工作。他的代码写得很好,代码审查(PRs)也完成得很快。从技术角度来看,他是个出色的工程师。 我们从其他工程师那里得到了一些关于他的普…

IDEA通过tomcat运行注意事项

配置run--》edit configurations 以下的A B部分要保持一致 A和B的路径要保持一致

在线封装APP:轻松实现个性化应用发布

你是否曾经因为无法快速封装和发布自己的APP而感到困扰?传统的APP封装和发布流程繁琐,需要耗费大量时间和精力。幸运的是,现在有了在线封装APP的解决方案,帮你轻松搞定这些麻烦事。 小猪APP封装平台www.appzhu.cn 什么是在线封装…

【乐吾乐3D可视化组态编辑器】相机与视角

系统默认的相机为环绕旋转相机,它可以环绕一个中心点做上下左右的旋转,来从不同角度观察场景。当然,您也可以把一些特定角度的信息保存下来,在系统中我们把这个信息称作视角。通过交互中的切换视角动作,您就可以实现把…

​你见过哪些不过度设计的优秀APP?​

优联前端https://ufrontend.com/ 提供一站式企业前端解决方案 “每日故宫”是一款以故宫博物院丰富的藏品为基础,结合日历形式展示每日精选藏品的移动应用。通过这款应用,用户可以随时随地欣赏到故宫的珍贵藏品,感受中华五千年文化的魅力。…

基于Python和MD5算法的公寓管理系统设计与实现-计算机毕业设计源码77723

摘 要 本论文主要论述了如何使用Python开发一个公寓管理系统,本系统将严格按照软件开发流程进行各个阶段的工作,面向对象编程思想进行项目开发。在引言中,作者将论述公寓管理系统的当前背景以及系统开发的目的,后续章节将严格按照…

一文详解SpringBoot的自定义starter

目录 一、SpringBoot 二、自定义starter 三、SpringBoot的自定义starter 一、SpringBoot Spring Boot是一个开源的Java框架,由Pivotal团队(现为VMware的一部分)于2013年推出,旨在简化Spring应用程序的创建和部署过程。它基于S…

基于混合Transformer-CNN模型的多分辨率学习方法的解剖学标志检测

文章目录 Anatomical Landmark Detection Using a Multiresolution Learning Approach with a Hybrid Transformer-CNN Model摘要方法实验结果 Anatomical Landmark Detection Using a Multiresolution Learning Approach with a Hybrid Transformer-CNN Model 摘要 精确定位…

【MySQL数据库】存储过程实战——图书借阅系统

图书借阅归还 借阅不用count判断,归还不用具体字段值判断 每次借阅或者归还只能操作1本 数据准备 -- 创建数据库 create database db_test3 CHARACTER SET utf8 COLLATE utf8_general_ci; -- 使用数据库 use db_test3; -- 创建图书信息表: create tabl…