一.AI大模型开发-初识机器学习

机器学习基本概念

前言

本文主要介绍了深度学习基础,包括机器学习、深度学习的概念,机器学习的两种典型任务分类任务和回归任务,机器学习中的基础名词解释以及模型训练的基本流程等。

一.认识机器学习

1.人工智能和机器学习

人工智能(Artificial Intelligence,简称AI) 是指由计算机系统所表现出的智能行为。它是一门研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的学科。人工智能的目标是使机器能够执行通常需要人类智能才能完成的任务,如学习、推理、解决问题、理解语言、识别图像等

人工智能的关键技术包括:

  • 机器学习(Machine Learning, ML):通过数据训练模型,使计算机能够从经验中学习并改进性能。
  • 深度学习(Deep Learning):一种特殊的机器学习方法,使用多层神经网络来处理复杂的数据模式。
  • 自然语言处理(Natural Language Processing, NLP):使计算机能够理解和生成人类语言。
  • 计算机视觉(Computer Vision*:让计算机能够“看”和解释图像或视频内容。
  • 强化学习(Reinforcement Learning):通过奖励和惩罚机制来训练AI系统做出最优决策。

机器学习是一种通过大量数据去迭代逼近未知参数的最优解的方法。 深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络。

在这里插入图片描述

人工智能已经广泛应用于多个行业,如医疗、金融、交通、娱乐、教育等。常见的应用场景包括自动驾驶汽车、智能客服、个性化推荐、疾病诊断、语音助手等。

2.机器如何学习

机器学习是对人脑学习的模拟,人类通过学习在大脑中形成对事物的认知,也就是知识,当大脑接受到新的问题时能够根据自身的认知和经验给出答案。那么机器也是一样,我们对AI提供大量的数据进行学习和反复训练那么AI也能够形成一套“知识”体系。当输入新的数据给AI那么它就能根据自己的“知识”体系给出较为精准的结果,如下:

在这里插入图片描述

3.什么是神经网络

深度学习和机器学习最大的区别是深度学习引入了神经网络,神经网络的构建是通过模拟人类神经元之间的信息传递过程。

人体大脑学习过程是通过感觉器官接收外界刺激信息,如视觉、听觉、触觉等,这些信息转化为神经信号传递到大脑,神经信号在神经元之间通过突触进行传导。 神经元是主要由树突、轴突、突出组成,树突是从上面接收很多信号,经过轴突处理后传递给突触,突触会进行选择性向下一级的树突传递信号。

通过这种方式,神经元之间形成了复杂的连接网络,使得大脑能够进行信息的传递、整合和处理,以实现各种认知、情感和行为功能。此外,突触在学习、记忆等过程中还可以发生动态的变化和重塑,以适应新的经验和环境需求。
在这里插入图片描述

那么神经网络模拟的就是神经元之间的信息传递过程,每个神经网络单元抽象出来一种=数学MP模型,也叫感知器,它接收多个输入(x1,x2,x3…),产生一个输出 即 y= W1X1+W2X2+W3X3+…+WnXn + b。

这就好比是神经末梢感受各种外部环境的变化(感知外部刺激),产生不同的电信号(也就是输入:x1,x2,x3…xn),这些强度不同(也就是参数w1,w2,w3…wn)的电信号汇聚到一起,会改变这些神经元内的电位,如果神经元的电位超过了一个“阈值”(参数 b),它就会被激活(激活函数),即“兴奋”起来,向其他神经元发送化学物质。

下面是MP模型示例图,它是麦卡洛克一皮茨模型(McCulloch-Pitts model )简称,一种早期的神经元网络模型.
在这里插入图片描述
MP模型由美国神经生理学家麦卡洛克(McCulloch, W.)和数学家皮茨 <Pitts,W.)于1943年共同提出。设有n个神经元相互连结,每个神经元的状态Si (i=1,2,…,n)取值0或1,分别表示该神经元的抑制和兴奋,每个神经元的状态都受其他神经元的制约,B是第i个神经元的阂值,W是神经元i与神经元j之间的连结强度。

MP模型过程:

  1. 每个神经元都是一个多输入端如x1,x2,x3
  2. 每个输入都会乘以权重w1,w2,w3,再加一个阈值 b
  3. 最后我们会得到 y = w1x1 + w2x2 + w3x3 + b,最终我们得到一个值 y
  4. 得到这个值后是否会向下游输出则取决于激活函数f(x)
  5. 向下游输出的结果Oj的值要么是0,要么是1。

激活函数

激活函数:就是在人工神经网络的神经元上运行的函数,负责将神经元的输入映射到输出端。

如果不用激活函数:每一层输出都是上层输入的线性函数,无论神经网络有多少层,输出都是输入的线性组合,这种情况就是最原始的感知机(Perceptron)。 如果使用激活函数:激活函数给神经元引入了非线性因素,使得神经网络可以任意逼近任何非线性函数,这样神经网络就可以应用到众多的非线性模型中。

单个的感知器(也叫单感知机)就构成了一个简单的模型(MP模型),但在现实世界中,实际的决策模型则要复杂得多,往往是由多个感知器组成的多层网络,如下图所示,这也是经典的神经网络模型(也叫多感知机),由输入层、隐含层、输出层构成。

4.机器学习的两种任务

机器学习的典型任务可以分为:分类任务 和 回归任务,分类任务:找到分类边界,将不同类型的数据划分开。回归任务:通过模型拟合数据点分布,预测新数据的值。分类任务输出离散值,回归任务输出连续值。

分类任务: 是根据每个样本的值特征预测该样本属于类型A、类型B还是类型C,例如情感分类、内容审核,相当于学习了一个分类边界(决策边界),用分类边界把不同类别的数据区分开来。

回归任务:是对连续值进行预测,根据每个样本的值特征预测该样本的具体数值,例如房价预测,股票预测等,相当于学习到了这一组数据背后的分布,能够根据数据的输入预测该数据的取值。

在这里插入图片描述
分类模型只能输出对与错,通常用来将预测结果是将样本划分到某个特定类别,而回归模型输出的数据的预测值,例如,判断一个水果是苹果还是橙子用分类模型,而预测明天的气温是多少度则用回归模型。

5.有监督学习和无监督学习

为什么要分有监督和无监督:当训练员训练小狗的时候,如果小狗做出了一个正确的动作,都会奖励一个实物给小狗来标记一个正确的信号,模型训练也是如此:我们需要通过真实数据去标注模型的预测值是否正确,或者误差值是多少,这个就是有监督学习,有监督和无监督区别如下:

有监督学习:监督学习利用大量的标注数据来训练模型,对模型的预测值和数据的真实标签计算损失,然后将误差进行反向传播(计算梯度、更新参数),通过不断的学习,最终可以获得识别新样本的能力。

每条数据都有正确答案,通过模型预结果与正确答案的误差不断优化模型参数

无监督学习:无监督学习不依赖任何标签值,通过对数据内在特征的挖掘,找到样本间的关系,比如聚类相关的任务。有监督和无监督最主要的区别在于模型在训练时是否需要人工标注的标签信息。

只有数据没有答案,常见的是聚类算法,通过衡量样本之间的距离来划分类別

6.什么是模型

模型可以通过对海量数据的学习,吸收数据里面的“知识”。然后,再对知识进行运用,例如回答问题、创造内容等,所谓模型,就是一个包含了大量未知参数的函数,给函数输入数据生成输出,所谓训练,就是通过大量的数据去迭代逼近这些未知参数的最优解。

为什么要训练模型?如果我们对模型提供不同领域的数据进行训练那么他们能够预测的数据范围也就不一样。比如:我们使用法律相关的数据进行训练,那么当你在询问它法律的问题时他就能给出较为精准的答案,当你问他医疗的问题它肯定就无法给出你想要的答案了。

就好比一只小狗你训练它跳火圈,那么它就只会跳火圈,你训练它学猫叫他它就会学猫叫,AI也是一样,这样就形成了一个一个的“模型”,有些模型的能力是绘图,有些模型的能力是对话,就看你怎么训练它。

如果你们公司希望大模型能够针对于你们自己的业务和数据做出精准的预测值,那么就需要通过你们公司自己的大量数据去训练,这也就是为什么企业都需要自己去部署和训练模型,因为市面上的模型不一定适用于你们公司的业务。

大模型(Large Model) 是指参数量非常庞大、规模远超传统模型的人工智能模型。这类模型通常具有数以亿计甚至数以万亿计的参数,能够在多种任务上表现出卓越的性能和通用性。大模型通过大量的数据训练,能够捕捉到复杂的数据模式和语义信息,从而在自然语言处理、计算机视觉、语音识别等领域展现出强大的能力。

我们现在口头上常说的大模型,实际上特指大模型的其中一类,也是用得最多的一类——语言大模型(Large Language Model,也叫大语言模型,简称LLM)。
除了语言大模型之外,还有视觉大模型、多模态大模型等。现在,包括所有类别在内的大模型合集,被称为广义的大模型。而语言大模型,被称为狭义的大模型

7.大模型训练流程

如果想要大模型如同人脑一样给出精准结果,那么需要提供大量数据进行“投喂”(学习),并且需要“标记”模型给出的答案是否“正确”,我们把学习的过程,我们称之为训练,运用的过程,则称之为推理。比如:我给大模型投喂的数据是"1+1=?" , 然后给出正确值为 2,那么大模型就学习到1+1=2,那么当你对他提出问题“1+1=?”,那么它可能就会给出推理的值2,下面是大模型学习和训练的过程:
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/972699.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Redis未授权访问漏洞原理

redis未授权访问漏洞 目录 redis未授权访问漏洞一、Redis介绍二、redis环境安装三、漏洞原理四、漏洞复现4.1 webshell提权4.2redis写入计划任务反弹shell4.3 ssh key免密登录4.4 Redis基于主从复制的RCE方式 五、Redis加固建议 一、Redis介绍 Redis&#xff0c;全称为Remote …

什么是网络安全?网络安全防范技术包括哪些?

伴随着互联网的发展&#xff0c;它已经成为我们生活中不可或缺的存在&#xff0c;无论是个人还是企业&#xff0c;都离不开互联网。正因为互联网得到了重视&#xff0c;网络安全问题也随之加剧&#xff0c;给我们的信息安全造成严重威胁&#xff0c;而想要有效规避这些风险&…

使用VSCODE开发C语言程序

使用vscode配置C语言开发环境 一、安装VSCODE 1、下载vscode ​ 从官方网站&#xff08;https://code.visualstudio.com/Download&#xff09;上&#xff0c;下载windows版本的vscode 2、安装vscode ​ 下载完毕后&#xff0c;按照提示进行安装即可&#xff08;尽可能不要安…

轴承故障特征—SHAP 模型 3D 可视化

往期精彩内容&#xff1a; Python-凯斯西储大学&#xff08;CWRU&#xff09;轴承数据解读与分类处理 基于FFT CNN - BiGRU-Attention 时域、频域特征注意力融合的轴承故障识别模型-CSDN博客 基于FFT CNN - Transformer 时域、频域特征融合的轴承故障识别模型-CSDN博客 P…

ComfyUI多功能插件安装-Comfy UI Manager

原生ComfyUI中的节点内容较少&#xff0c;在使用过程中所需要的很多实用插件没有 可以安装 Comfy UI Manager 以帮助我们更高效率的使用ComfyUI&#xff08;Comfy UI Manager 也相当于一个节点&#xff0c;但是可以管理、更新其他实用节点&#xff09; ComfyUI是由Dr.Lt.Data开…

PET-SQL:基于大模型的两阶段Text2SQL方法

一. 背景 论文: PET-SQL: A Prompt-Enhanced Two-Round Refinement of Text-to-SQL with Cross-consistency 二. 算法介绍 2.1 主要流程 PET-SQL这篇文章提出了一种创新的基于大型语言模型的Text2SQL方法&#xff0c;该方法将SQL生成过程分为两个不同的阶段。在第一阶段&am…

大模型开发实战篇4:多模态之图片识别

多模态的定义 在人工智能领域&#xff0c;模态指的是数据的不同形式或类型&#xff0c;例如文本、图像、音频、视频等。多模态则意味着模型能够处理和理解多种不同模态的数据。 大模型的多模态指的是那些能够处理和理解多种模态数据的大型人工智能模型。这些模型通常基于深度…

力扣 跳跃游戏 II

贪心算法&#xff0c;存下每一步的最远&#xff0c;去达到全局的最小跳跃次数。 题目 从题中要达到最少次数&#xff0c;肯定是每一步尽可能走远一点。但注意j被限制了范围&#xff0c;这种不用想每一步遍历时肯定选最大的num[i]&#xff0c;但要注意&#xff0c;题中是可以到…

goland无法debug项目

1、其实个原因是因为正在使用的Delve调试器版本太旧&#xff0c;无法兼容当前的Go语言版本1.2。Delve是Go语言的一个调试工具&#xff0c;用于提供源码级别的调试功能。Go语言每隔一段时间会发布新版本&#xff0c;而相应的调试器Delve也可能会更新以提供新的特性或修复已知问题…

SpringAI系列 - ToolCalling篇(二) - 如何设置应用侧工具参数ToolContext(有坑)

目录 一、引言二、集成ToolContext示例步骤1: 在`@Tool`标注的工具方法中集成`ToolConext`参数步骤2:`ChatClient`运行时动态设置`ToolContext`参数三、填坑一、引言 在使用AI大模型的工具调用机制时,工具参数都是由大模型解析用户输入上下文获取的,由大模型提供参数给本地…

​实在智能与宇树科技、云深科技一同获评浙江省“人工智能服务商”、 “数智优品”​等荣誉

近日&#xff0c;浙江省经信厅正式公布《2024 年浙江省人工智能应用场景、应用标杆企业、人工智能服务商及 “数智优品” 名单》。 实在智能获评浙江省“人工智能服务商”&#xff0c;核心产品 “实在 Agent 智能体” 入选 “数智优品”。一同获此殊荣的还有宇树科技、云深处科…

【云安全】云原生-Docker(六)Docker API 未授权访问

Docker API 未授权访问 是一个非常严重的安全漏洞&#xff0c;可能导致严重的安全风险。 什么是 Docker API &#xff1f; Docker API 是 Docker 容器平台提供的一组 RESTful API&#xff0c;用于与 Docker 守护程序进行通信和管理 Docker 容器。通过 Docker API&#xff0c;…

open-webui安装

docker安装openwebui 拉取镜像 docker pull ghcr.io/open-webui/open-webui:maindocker images启动 docker run -d -p 8346:8080 --name open-webui ghcr.io/open-webui/open-webui:maindocker ps查看端口占用 lsof -i:8346访问地址 http://ip:port http://127.0.0.1:8346

在ubuntu上用Python的openpyxl模块操作Excel的案例

文章目录 安装模块读取Excel数据库取数匹配数据和更新Excel数据 在Ubuntu系统的环境下基本职能借助Python的openpyxl模块实现对Excel数据的操作。 安装模块 本次需要用到的模块需要提前安装(如果没有的话) pip3 install openpyxl pip3 install pymysql在操作前&#xff0c;需…

SOME/IP--协议英文原文讲解8

前言 SOME/IP协议越来越多的用于汽车电子行业中&#xff0c;关于协议详细完全的中文资料却没有&#xff0c;所以我将结合工作经验并对照英文原版协议做一系列的文章。基本分三大块&#xff1a; 1. SOME/IP协议讲解 2. SOME/IP-SD协议讲解 3. python/C举例调试讲解 4.2 Speci…

基于YOLO11深度学习的果园苹果检测与计数系统设计与实现【python源码+Pyqt5界面+数据集+训练代码】

《------往期经典推荐------》 一、AI应用软件开发实战专栏【链接】 项目名称项目名称1.【人脸识别与管理系统开发】2.【车牌识别与自动收费管理系统开发】3.【手势识别系统开发】4.【人脸面部活体检测系统开发】5.【图片风格快速迁移软件开发】6.【人脸表表情识别系统】7.【…

【C++】 Flow of Control

《C程序设计基础教程》——刘厚泉&#xff0c;李政伟&#xff0c;二零一三年九月版&#xff0c;学习笔记 文章目录 1、选择结构1.1、if 语句1.2、嵌套的 if 语句1.3、条件运算符 ?:1.4、switch 语句 2、循环结构2.1、while 语句2.2、do-while 语句2.3、 for 循环2.4、循环嵌套…

mysql 学习15 SQL优化,插入数据优化,主键优化,order by优化,group by 优化,limit 优化,count 优化,update 优化

插入数据优化&#xff0c; insert 优化&#xff0c; 批量插入&#xff08;一次不超过1000条&#xff09; 手动提交事务 主键顺序插入 load 从本地一次插入大批量数据&#xff0c; 登陆时 mysql --local-infile -u root -p load data local infile /root/sql1.log into table tb…

玩转大语言模型——使用LM Studio在本地部署deepseek R1的零基础)教程

系列文章目录 玩转大语言模型——使用langchain和Ollama本地部署大语言模型 玩转大语言模型——三分钟教你用langchain提示词工程获得猫娘女友 玩转大语言模型——ollama导入huggingface下载的模型 玩转大语言模型——langchain调用ollama视觉多模态语言模型 玩转大语言模型—…

【复现DeepSeek-R1之Open R1实战】系列7:GRPO原理介绍、训练流程和源码深度解析

目录 4.6 GRPO训练过程4.6.1 GRPO原理4.6.2 设置参考模型4.6.3 从训练集中抽取问题4.6.4 旧策略模型生成G个输出4.6.5 对每个输出用奖励模型 RM 打分4.6.6 根据目标函数做梯度更新 【复现DeepSeek-R1之Open R1实战】系列博文链接&#xff1a; 【复现DeepSeek-R1之Open R1实战】…