一、对人工智能大模型了解与认知


黑8说

月黑风高,乌云密布,树木低垂,黯淡沉闷。这黎明前的风暴,预示着新时代的变革即将到来。 在一个8线小城市的办公室中

黑8对主任说: 世界上有男人、女人、人妖,米国有1/3男,2/3女…,以后会增加一个非常重要的人种,他就像孙悟空拔毫毛,变化出拥有各种本事的自己。如果咱们不懂驾驭他,做他的师傅,咱们可就被统治了。

革委会梁主任好奇的问: 这是什么妖怪啊?

黑8郑重的说: 人工智能大模型

主任不屑的说: 哪有那么夸张,离咱们远了去了,你小子是不是疯了,危言耸听,自以为是。

黑8顺着主任说: 梁主任啊,这妖怪来头还不小呢,正以一日千里的速度赶来。咱们非常有必要提升对他的了解和认知。您知道吗?他比咱们看的真,听的细,想的快,说的准,未来他能让机器人不知疲倦的用双手、双脚进行精细劳作,简直就是要把我们替了。他可不同于智能手机、电脑的应用功能,还有siri、小度、小艺什么的,这些都太Low了。他才是真正的“超人”

主任质问到: 这么牛,不能落地不还是等于0吗?

黑8认真的说: 能落地啊,主任您要是不信,今天我立个Flag,做不到我请您吃大餐,您看行吗?

主任着急的问: 你倒是说说他能干什么呀?

黑8这下可来了劲头,心有成竹的说: 您看啊,我老婆是老师,经常收文后写摘要通知,我让大模型替她写了。

我儿子学翻译,让他记录难点和错题,我让大模型以听、说、读、写的方式,使他强化学习,直至掌握。

我女儿爱跳舞、画画,让她指出主题、音乐和动作类型,我让大模型给她编舞;让她指出主题、线条、色彩,我让大模型给她画画。

我一哥们是搞开发的,我让大模型给他出产品PPT、技术方案、架构设计、前后端代码和测试用例,一条龙,流水线完成。

还能做医生、老师、律师、会计师、画家、作家、心理医生等等,很多很多,先做这些案例,您看怎么样?

梁主任“哼”了一声,将信将疑,心里盘算,说的这么悬,看来我真得了解一下,这也是我们革委会的使命啊。正当梁主任转身刚要走时。

被黑8叫住: 主任,您看我这有篇文章,您可以先了解了解。黑8是多聪明的人,一眼就看出主任的心思。

主任会心的笑了,心想: 黑8就是黑8,你个棒槌。

之后,可想而知,梁主任确实认真看了这篇文章。收获很大,为之一振,从心里认识到,他真不是什么妖怪,确实是个【新新人类】

OpenAI 首席科学家 Ilya Sutskever 说过:


数字神经网络和人脑的生物神经网络,在数学原理上是一样的

1.AI是什么

AI(人工智能)是指通过计算机系统模拟、复制和执行人类智能行为的技术和方法。

AI的实现方式包括机器学习、深度学习、自然语言处理、计算机视觉等技术。

AI在各个领域,包括医疗、金融、制造、交通等,都有着广泛的应用,并对社会和经济产生深远的影响。

2.大模型能干什么

大模型,全称「大语言模型」,英文「Large Language Model」,缩写「LLM」。

国家对话产品大模型链接
美国OpenAI ChatGPTGPT-3.5、GPT-4https://chat.openai.com/
美国Microsoft CopilotGPT-4 和未知https://copilot.microsoft.com/
美国Google BardGeminihttps://bard.google.com/
中国百度文心一言文心 4.0https://yiyan.baidu.com/
中国讯飞星火星火 3.5https://xinghuo.xfyun.cn/
中国智谱清言GLM-4https://chatglm.cn/
中国月之暗面 Kimi ChatMoonshothttps://kimi.moonshot.cn/
中国MiniMax 星野abab6https://www.xingyeai.com/

2.1 按格式输出

在这里插入图片描述

2.2 分类

在这里插入图片描述

2.3 聚类

在这里插入图片描述

2.4持续互动

在这里插入图片描述

2.5技术相关问题

在这里插入图片描述

2.6解决问题

大模型把语言描述作为输入,有输入就能输出结果
但如何发挥大模型的现有能力呢?最大的障碍是没有形成认知对齐
在这里插入图片描述
找落地场景的思路:

  1. 从最熟悉的领域入手
  2. 让AI学最厉害员工的能力,再让他辅助其他员工,实现降本增效
  3. 找[文本进、文本出]的场景
  4. 别求大而全。将任务拆解,先解决小任务、小场景

3.认知

3.1 目标

懂AI、懂编程、懂业务你就是AGI(artificial general intelligence 通用人工智能)SuperStar。

要懂原理、重实践、提认知

不懂原理就不会举一反三,走不了太远。
不懂实践就只能纸上谈兵,做事不落地。
认知不高就无法做对决策,天花板太低。

目前行业共识:两个确定和一个不确定

  • 确定未来,AI必定重构世界
  • 确定进入,收获红利
  • 不确定落地,解决需求,技术路线,产品策略

只等不确定 确定了,巅峰即来

3.2 知识体系

请添加图片描述

3.3 学习方法

  • 至少懂一门语言
  • 有真实的项目经验
  • 原理一定用心学
  • 认知一定用心领悟
  • 实践一定要多

4.大模型是怎么工作的

其实它只是根据上文,猜下一个词(的概率)
请添加图片描述

通俗理解

  1. 大模型阅读了人类曾说过的所有话。这就是机器学习,也叫训练
  2. 大模型将输入文字转化为一串编码,并计算后面跟着的不同编码的概率,存入神经网络,并保存数据参数(权重)
  3. 大模型用之前输入的文字编码加上现在输入的文字编码,并计算出下一个最高概率的编码。这个过程就是生成(推理)
  4. 步骤3循环反复,生成更多的文字

这套生成机制的内核叫「Transformer 架构」。但其实,transformer 已经不是最先进的了。

架构设计者特点链接
TransformerGoogle最流行,几乎所有大模型都用它OpenAI 的代码
RWKVPENG Bo可并行训练,推理性能极佳,适合在端侧使用官网、RWKV 5 训练代码
MambaCMU & Princeton University性能更佳,尤其适合长文本生成GitHub

5.用好AI的关键

OpenAI 首席科学家 Ilya Sutskever 说过:

数字神经网络和人脑的生物神经网络,在数学原理上是一样的

我们要把 [AI当人看] ,来理解、控制和看待,其有优点也有不足。

6.大模型应用架构

大模型技术分两个部分:

  • 基础大模型的训练
  • 开发大模型的应用

大模型应用技术特点:门槛低,天花板高

6.1典型业务架构

在这里插入图片描述
Agent 还太超前,Copilot 值得追求

6.2技术架构

prompt(提词) 一问一答方式
在这里插入图片描述

Agent + Function Calling (代理+函数调用)

  • Agent:AI主动提要求
  • Function Calling: AI要求执行某个函数
  • 场景举例:你问水果好吃吗?他反问你哪种水果
    在这里插入图片描述

RAG(Retrieval-Augmented Generation 检索增强生成)

  • Embeddings:把文字转换为更易于相似度计算的编码。这种编码叫向量
  • 向量数据库:把向量存起来,方便查找
  • 向量搜索:根据输入向量,找到最相似的向量
  • 场景举例:考试时,看到一道题,到书上找相关内容,再结合题目组成答案。然后,就都忘了
    在这里插入图片描述

Fine-tuning (精调)

在这里插入图片描述

6.3如何选择技术路线

在这里插入图片描述
值得尝试Fine-Tuning的情况:

  • 提高大模型的稳定性
  • 用户量大,降低推理成本的意义很大
  • 提高大模型的生成速度

6.4基础模型选型

合规和安全是首要考量因素。使用测试数据选择最优的模型。

需求国外大模型国产大模型开源大模型
国内 2C🛑
国内 2G🛑
国内 2B
出海
数据安全特别重要🛑🛑

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/352230.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

HCIP实验7-三层架构实验

搭建实验拓扑图 实验开始 配置r1,r2的IP地址及环回 r1 [r1]interface LoopBack 0 [r1-LoopBack0]ip address 1.1.1.1 32 [r1]interface g0/0/0 [r1-GigabitEthernet0/0/0]ip address 23.1.1.1 24 [r1]interface g0/0/1 [r1-GigabitEthernet0/0/1]ip address 34.1.1.1 24 [r1…

Bitbucket第一次代码仓库创建/提交/创建新分支/合并分支/忽略ignore

1. 首先要在bitbucket上创建一个项目,这个我没有权限创建,是找的管理员创建的。 管理员创建之后,这个项目给了我权限,我就可以创建我的代码仓库了。 2. 点击这个Projects下的具体项目名字,就会进入这样一个页面&#…

11k+ star 一款不错的笔记leanote安装教程

特点 支持普通模式 支持markdown模式 支持搜索 安装教程 1.安装mongodb 1.1.下载 #下载 cd /opt wget https://fastdl.mongodb.org/linux/mongodb-linux-x86_64-3.0.1.tgz 1.2解压 tar -xvf mongodb-linux-x86_64-3.0.1.tgz 1.3配置mongodb环境变量 vim /etc/profile 增…

java集合ArrayList和HashSet的fail-fast与fail-safe以及ConcurrentModificationException

在 java 的集合工具类中&#xff0c;例如对 ArrayList 或者 HashSet 进行删除元素后再遍历元素时&#xff0c;会抛出 ConcurrentModificationException 异常。 fail-fast ArrayList public class TestList {public static void main(String[] args) {ArrayList<Integer>…

Java 基于SpringBoot+Vue的母婴商城系统,附源码,文档

博主介绍&#xff1a;✌程序员徐师兄、7年大厂程序员经历。全网粉丝30W、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ &#x1f345;文末获取源码联系&#x1f345; &#x1f447;&#x1f3fb; 精彩专栏推荐订阅&#x1f447;…

宝塔面板一键部署幻兽帕鲁联机服务器教程

幻兽帕鲁是一款深受玩家喜爱的多人在线游戏&#xff0c;玩家可以自行搭建联机服务器&#xff0c;邀请亲朋好友一起在世界探索畅玩&#xff0c;为了方便玩家更快速的部署自己的幻兽帕鲁联机服务器&#xff0c;宝塔面板推出了幻兽帕鲁一键部署服务&#xff0c;一键即可安装并调整…

2024.1.24 GNSS 学习笔记

1.伪距观测值公式 2.载波相位观测值公式 3.单点定位技术(Single Point Positionin, SPP) 仅使用伪距观测值&#xff0c;不使用其他的辅助信息获得ECEF框架下绝对定位技术。 使用广播星历的轨钟进行定位&#xff0c;考虑到轨钟的米级精度&#xff0c;所以对于<1米的误差&…

【STM32】STM32学习笔记-W25Q64简介(37)

00. 目录 文章目录 00. 目录01. SPI简介02. W25Q64简介03. 硬件电路04. W25Q64框图05. Flash操作注意事项06. 预留07. 附录 01. SPI简介 在大容量产品和互联型产品上&#xff0c;SPI接口可以配置为支持SPI协议或者支持I 2 S音频协议。SPI接口默认工作在SPI方式&#xff0c;可以…

ASP.NET Core 7 Web 使用Session

ASP.NET Core 好像不能像20年前那样直接使用Session函数&#xff0c;我使用如下方法 1、在NuGet安装以下2个包 2、在Program.cs注册 //注册Session builder.Services.AddSession(options > {options.IdleTimeout TimeSpan.FromMinutes(60);options.Cookie.HttpOnly fals…

放个烟花迎接龙年春节吧

不知不觉即将迎来2024龙年春节了。龙的形象在中国传统文化中有着广泛的应用&#xff0c;比如在传统文化中&#xff0c;龙代表着权力、威严、吉祥和神灵的象征&#xff0c;同时也是生命力和繁荣的象征。 今天的文章将用原生JavaScript和Canvas API实现一个烟花的效果&#xff0…

使用Docker部署MySQL并结合内网穿透实现远程访问本地数据库

文章目录 前言1 .安装Docker2. 使用Docker拉取MySQL镜像3. 创建并启动MySQL容器4. 本地连接测试4.1 安装MySQL图形化界面工具4.2 使用MySQL Workbench连接测试 5. 公网远程访问本地MySQL5.1 内网穿透工具安装5.2 创建远程连接公网地址5.3 使用固定TCP地址远程访问 前言 本文主…

以太网的 MAC 层

目录 1. MAC 层的硬件地址 48 位的 MAC 地址 2. MAC 帧的格式 以太网 V2 的 MAC 帧格式 无效的 MAC 帧 IEEE 802.3 MAC 与以太网 V2 MAC 帧格式的区别 1. MAC 层的硬件地址 硬件地址又称为物理地址&#xff0c;或 MAC 地址。 IEEE 802 标准为局域网规定了一种 48 位…

GitHub无法完成推送 的设置选项

GitHub无法完成推送 的设置选项 系统设置 VS中控制台设置【指令】 控制台调出方法 以下为VS控制台指令 git config --global --unset http.proxy git config --global --unset https.proxygit config --global http.proxy 127.0.0.1:7890 git config --global https.proxy …

JAVA学习笔记三

1.java执行流程分析 2.什么是编译 javac Hello.java 1.有了java源文件&#xff0c;通过编译器将其编译成JVM可以识别的字节码文件 2.在该源文件目录下&#xff0c;通过javac编译工具对Hello.java文件进行编译 3.如果程序没有错误&#xff0c;没有任何提示&#xff0c;但在…

AI代理产品大汇总

目前做AI Agents相关产品的&#xff0c;可以看这个最全汇总 1. 最新的AI Agents 列表编制完成。 2. 列表包括:多种使用案例、开源或闭源状态、以及最新的AI Agent产品等筛选条件。 3. 这个列表每周都在不断收到新的项目提交。 4 该列表可以让学生和AI从业者快速了解当前AI生…

C++快速幂详解简单易懂

引言&#xff1a; 如果我们计算a的k次幂&#xff0c;循环k次每次 a&#xff0c;时间复杂度O(k)&#xff0c;现在我们要把其优化为log(k)的时间复杂度。另外a的k次幂极有可能报long long&#xff0c;比如2的64次幂就已经爆long long 了&#xff0c;所以在k很小的时候就会爆掉l…

RHCE 部署Ubuntu系统(ubuntu-23.10-live-server-amd64.iso)

目录 一、新建虚拟机 二、安装系统 1、 选择安装语言&#xff0c;默认 【 English 】&#xff0c;直接回车 2、选择键盘&#xff0c;默认回车 3、安装的服务器版本&#xff0c;根据需求自行选择&#xff0c;本次安装选择 【 Ubuntu Server 】 4、网络设置&#xff0c;此…

Linux抽象文件系统

一.概念 Linux采用了抽象文件系统的概念来统一管理不同类型的文件和文件系统。抽象文件系统是对不同文件系统的封装&#xff0c;使得用户和应用程序可以以相同的方式访问和操作不同类型的文件系统。 Linux的抽象文件系统通过以下几个组件来实现&#xff1a; VFS&#xff08;V…

(七)springboot实战——springboot3集成R2DBC实现webflux响应式编程服务案例

前言 本节主要内容是关于使用新版springboot3集成响应式数据库R2DBC,完成响应式web服务案例。需要注意的是&#xff0c;此次项目使用的JDK版本是JDK17&#xff0c;springboot版本使用3.2.2版本&#xff0c;数据库使用关系型数据库mysql。WebFlux 是一个基于响应式编程模型的框…

taskflow 源码阅读笔记-1

之前写了一篇介绍Taskflow的短文&#xff1a;传送门 Taskflow做那种有前后依赖关系的任务管理还是不错的&#xff0c;而且他的源码里运用了大量C17的写法&#xff0c;觉得还是非常值得学习的&#xff0c;因此决定看一下他的源码&#xff0c;这里顺便写了一篇代码学习笔记。 概…