啥是大模型

介绍完了chatGPT的生成原理, 那么我们继续介绍介绍大模型。
大模型的缩写是LLM,全称是Large Language Model, 所以这个大模型也可以被称作为大语言模型
那么问题来了,为啥有了大模型呢,难道之前都是小模型吗?确实,大模型刚开始就是因为参数大,训练数据多所以就叫做大模型,在大模型之前的模型参数和训练数据相比之下确实小,这解释了大模型中的大字,那么模型两字该如何理解呢?是我们所说的数学模型、软件系统中的软件模型还是说科学研究中的理论假设或者时尚界的诸如实物的模型呢?要搞清楚模型,那么我们就得从机器学习开始说起。

一:机器学习

机器学习,顾名思义就是让计算机自己去学习并存储对应的知识,然后帮助人类去做一些工作。比如常见的人脸识别就是给到计算机足够多的人脸照片,然后让他识别出来对应的人脸是谁。大家可能好奇这后面是如何实现的,可以想一想我们初中学习的二元一次方程 y=kx+b, 我们如果要解出来这个方程,我们是不是要给到两个点的x,y 坐标就可以得出来k和b并解答出来这个方程,这个y=kx+b 就是我们上面所说的最最简单的模型,就是方程组。
当然现实世界中比这个一元二次方程组复杂的多,可能是n元n次方程组,那么我们就要给到相应的坐标点和相应的数学方法去对这个方程求解,但是万变不离其宗,理论上给到足够多的好的输入和输出,就是对应的x和y值,计算机就可以得到很精确的模型,帮助我们解决掉一些问题。通俗点来说,把这个通过投喂数据给计算机并且让它自己推导出来方程或者叫模型的过程就叫做机器学习。

二:监督学习和无监督学习

上面我们讲到了x和y, 有一个x就必定有对应的y,有多少个x就有多少个对应的y,所以这种有一方输入必定有对应的输出的机器学习就叫做监督学习,比如我们常见的图像分类或者说一些诸如天气和股票的预测的学习都是这样的;但是当我们有一群x,不知道对应的y,让机器自己去看这些x应该输出怎样的y,诸如我们生活中常见的那个把不一样的橘子分成不同的堆等,我们分的时候没有瞄准的目标,只能自己心里去大概看看这些橘子可以分成几类,这样的有输入但是不知道输出的机器学习就可以叫做无监督学习;

三:强化学习

强化学习,可以这么理解,就是对应的某个领域的初步模型已经推导出来了,但是还有一些对应的场景它可能给出的答案不是很正确,但是经过我们测试人员的反馈,告诉它某些答案应该是怎么样的,让它自己知道对应的这个场景顺便去微调模型可以达到更好的适应,这不就是说这个模型对现实世界的适应性得到了更大的加强么,我们生活中强化学习运用比较多的领域是智能体,比如生活中的机器人

四:深度学习

深度学习,这里的深度可以理解成为模型的层数,为什么这样说呢?因为我们的现实世界中的一些场景是很复杂的,光靠上述的诸如y=ax1+bx2+cx3+dx4+…+nxn 很难适配这样的场景,既然一个这样的模型不行,那么来很多个函数呢,一个函数的输出作为另一个函数的输入,互相交叉,一个函数对应下游的多个函数,这样n*m 个函数不就构成了一张网么,在ai中也称之为人工神经网络,这里的一个个函数就像我们的大脑里的神经元似的,神经元互相之间构成了我们的神经网络,哈哈哈,数学是理解万物的语言不是吹的。
所以,我们可以假设好一个神经网络,然后给一堆样本和对应的结果,让机器不舍昼夜地自己去一步步地推导出这些个神经网络对应的每个神经元的模型,最终凑成了一个大的神经网络,这样的过程那就叫做深度学习了。

五:大模型

所以,大模型里面的那个模型就是我们所说的数学模型了,只不过不是单一的数学函数,是n多个复杂的数学函数的集合,大模型其实就是深度学习所对应的神经网络的数学模型集合了,是具有海量参数的模型集合,为啥之前深度学习出现了之后没有立马出现大模型呢,一个是当时对应的算力和数据不够充分,更大一部分是谷歌的那篇transformer的论文没有出现,哈哈哈,要知道原因且听下回分解。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/948232.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Qt窗口获取Tftpd32_svc服务下载信息

前言 一个由Qt开发的Windows小工具需要布置Tftp协议服务端来支持设备下载数据,并显示下载列表(进度、下载源等)。 考虑开发方便,优先使用了Qtftp方案,经测试发现,不够稳定,会有下载超时的情况&a…

xml格式化(3):增加头部声明

前言 这篇文章&#xff0c;是用来增加头部声明。 正文 from lxml import etreedef pretty_print(element, level0, indent" "):result ""# 判断元素是否为注释节点if isinstance(element, etree._Comment):result f"{indent * level}<!--{el…

python +tkinter绘制彩虹和云朵

python tkinter绘制彩虹和云朵 彩虹&#xff0c;简称虹&#xff0c;是气象中的一种光学现象&#xff0c;当太阳光照射到半空中的水滴&#xff0c;光线被折射及反射&#xff0c;在天空上形成拱形的七彩光谱&#xff0c;由外圈至内圈呈红、橙、黄、绿、蓝、靛、紫七种颜色。事实…

【Linux】定时运行shell脚本

1、at命令 at命令允许指定Linux系统何时运行脚本&#xff0c;它会将作业提交到队列中&#xff0c;指定shell在什么时候运行该作业。 at 的守护进程 atd 在后台运行&#xff0c;在作业队列中检查待运行的作业。 at 守护进程会检查系统的一个特殊目录&#xff08;一般位于/var/…

vue3 css实现文字输出带光标显示,文字输出完毕,光标消失的效果

Vue实现过程如下&#xff1a; <template><div ><p ref"dom_element" class"typing" :class"{over_fill: record_input_over}"></p></div> </template> <script setup> import {onMounted, ref} from…

数据库高安全—角色权限:角色创建角色管理

目录 3.1 角色创建 3.2 角色管理 书接上文openGauss安全整体架构&安全认证&#xff0c;从安全整体架构与安全认证两方面&#xff0c;对高斯数据库的高安全性能进行了解读&#xff0c;本篇我们将从角色创建和角色管理两方面对高斯数据库的角色权限进行介绍。 3.1 角色创建…

【U8+】用友U8软件中,出入库流水输出excel的时候提示报表输出引擎错误。

【问题现象】 通过天联高级版客户端登录拥有U8后&#xff0c; 将出入库流水输出excel的时候&#xff0c;提示报表输出引擎错误。 进行报表输出时出现错误&#xff0c;错误信息&#xff1a;找不到“fd6eea8b-fb40-4ce4-8ab4-cddbd9462981.htm”。 如果您正试图从最近使用的文件列…

《GICv3_Software_Overview_Official_Release_B》学习笔记

1.不同版本的 GIC 架构及其主要功能如下图所示&#xff1a; 2.GICv2m&#xff08;Generic Interrupt Controller Virtualization Model&#xff09;是针对ARM架构的GIC&#xff08;通用中断控制器&#xff09;的一种扩展&#xff0c; GICv2m扩展为虚拟化环境中的中断管理提供了…

【循环神经网络】RNN介绍

在人工神经网络中&#xff0c;”浅层网络”是指具有一个输入层、一个输出层和最多一个没有循环连接的隐藏层的网络。随着层数的增加&#xff0c;网络的复杂性也在增加。更多的层或循环连接通常会增加网络的深度&#xff0c;并使其能够提供不同级别的数据表示和特征提取&#xf…

C#调用Lua

目录 xLua导入 打包工具导入 单例基类导入与AB包管理器导入 Lua解析器 文件加载与重定向 Lua解析器管理器 全局变量获取 全局函数获取 对于无参数无返回值 对于有参数有返回值 对于多返回值 对于变长参数 完整代码 List与Dictionary映射Table 类映射Table 接口映射…

麒麟操作系统服务架构保姆级教程(七)Nginx+PHP+Mysql部署服务

上边几篇文章已经交过大家二进制部署nginx和php&#xff0c;现在咱们打通nginx和php&#xff0c;mysql和php&#xff0c;开始部署服务&#xff0c;学会部署服务之后就可以开始学习负载均衡啦&#xff0c;话不多说&#xff0c;咱们直接开始~~~ 目录 一、.nginx部署 二、安装PH…

开源模型迎来颠覆性突破:DeepSeek-V3与Qwen2.5如何重塑AI格局?

不用再纠结选择哪个AI模型了&#xff01;chatTools 一站式提供o1推理模型、GPT4o、Claude和Gemini等多种选择&#xff0c;快来体验吧&#xff01; 在全球人工智能模型快速发展的浪潮中&#xff0c;开源模型正逐渐成为一股不可忽视的力量。近日&#xff0c;DeepSeek-V3和Qwen 2.…

【Java项目】基于SpringBoot的【新生宿舍管理系统】

【Java项目】基于SpringBoot的【新生宿舍管理系统】 技术简介&#xff1a;本系统使用采用B/S架构、Spring Boot框架、MYSQL数据库进行开发设计。 系统简介&#xff1a;管理员登录进入新生宿舍管理系统可以查看首页、个人中心、公告信息管理、院系管理、班级管理、学生管理、宿舍…

《learn_the_architecture_-_trustzone_for_aarch64_102418_0101_03_en》学习笔记

1.TrustZone是Arm A-profile架构中安全架构的名称。TrustZone首次在Armv6K中引入&#xff0c;Armv7-A和Armv8-A也支持。TrustZone提供两个执行环境&#xff0c;它们之间具有系统范围的硬件强制隔离。在Arm架构中&#xff0c;有两种安全状态&#xff1a;安全和非安全。在EL0、EL…

Excel | 空格分隔的行怎么导入excel?

准备工作&#xff1a;windows&#xff0c;一个记事本程序和微软的Excel软件。 打开记事本&#xff0c;选中所有内容&#xff0c;按CtrlA全选&#xff0c;然后复制(CtrlC)。 在Excel中&#xff0c;定位到你想粘贴的单元格&#xff0c;按CtrlV进行粘贴。粘贴后&#xff0c;你会在…

南京观海微电子----GH7009国宇测试盒使用

1. SPI接线 针对7009&#xff1a; 2. 国宇上位机代码准备 在主函数首尾两端加入IO2时序控制的代码、以及国语SPI有效位控制的代码&#xff08;请注意7009和其他700x使用的有效位控制不一致&#xff0c;需要用哪一款加入哪一行即可&#xff09;&#xff1a; 三、国宇SPI读的使…

Arduino Uno简介与使用方法

目录 一、Arduino Uno概述 1. 硬件特性 2. 开发环境 二、Arduino Uno的基本使用方法 1. 硬件连接 2. 软件编程 三、Arduino Uno编程基础 1. 基本语法 2. 常用函数 四、Arduino Uno应用举例 1. LED闪烁 2. 温度检测 3. 超声波测距 五、Arduino Uno的扩展与应用 1…

使用命令行管理git项目

# 初始化一个新的Git仓库 git init # 添加文件到暂存区 git add <file> # 提交暂存区的更改到仓库 git commit -m "commit message" # 查看当前仓库的状态 git status # 查看提交历史 git log # 查看文件的改动 git diff <file> # 创建一个新…

网络安全的学习与实践经验(附资料合集)

学习资源 在线学习平台&#xff1a; Hack This Site&#xff1a;提供从初学者到高级难度的挑战任务&#xff0c;适合练习各种网络安全技术。XCTF_OJ&#xff1a;由XCTF组委会开发的免费在线网络安全网站&#xff0c;提供丰富的培训材料和资源。SecurityTube&#xff1a;提供丰…

基于STM32的热带鱼缸控制系统的设计

文章目录 一、热带鱼缸控制系统1.题目要求2.思路3.电路仿真3.1 未仿真3.2 开始仿真&#xff0c;显示屏显示水温、浑浊度、光照强度等值3.3 当水温低于阈值&#xff0c;开启加热并声光报警3.4 当浑浊度高于阈值&#xff0c;开启自动换水并声光报警3.5 当光照低于阈值&#xff0c…