大语言模型推理能力从何而来?

前言

DeepSeek R1采用强化学习进行后训练,通过奖励机制和规则引导模型生成结构化思维链(CoT),从而显著提升了推理能力。这一创新方法使得DeepSeek R1能够在无需大量监督数据的情况下,通过自我进化发展出强大的推理能力。那么语言模型的推理能力具体是什么,让我们一起来讨论。

利用计算机做推理的历史

推理是人类运用逻辑或经验,从已知的事实或前提出发,推导出新的结论或判断的认知活动。推理在人类生活中无处不在,例如科学研究、法律审判、医学诊断、教育评估等。在这些场景中,人们需要根据已有的证据或假设,运用合适的推理方式,得出合理的结论或决策。

人类用计算机科学做推理的研究始于人工智能的诞生,例如早期的逻辑程序设计语言(如Prolog)和专家系统(如MYCIN)。这些系统都是基于符号逻辑的形式化推理,可以处理一些结构化的、确定性的、规则化的问题,例如数学证明、棋类游戏、医学诊断等。然而,这些系统也有很多局限性,难以处理不完备的、不确定性的、非结构化的问题,例如自然语言理解、常识推理等。

随着深度学习和神经网络的发展,人类用计算机科学做推理的方式也发生了变化。神经网络可以从大量的数据中自动学习特征和知识,而不需要人为地设计规则和符号也可以处理更多的复杂的、多模态的、动态的问题,例如语音识别、机器翻译、图像生成等。然而,神经网络也有很多挑战,例如难以解释和验证其内部的推理过程、难以泛化到新的领域和任务、难以利用先验知识和常识等。这些问题需要更多的推理和解释能力,而不仅仅是学习和记忆能力。

近年来,预训练技术催生了大语言模型,在提示学习(Prompt Learning)的引导下大语言模型展现出惊人的推理能力,吸引了学术界和工业界的广泛关注。这种技术可以在具备涌现能力的大语言模型下有效地提升大语言模型的推理能力和解释能力,使其能够应对更多的复杂问题和场景。

为什么大语言模型会产生推理

语言是人类用来表达思想和感情的符号系统,是人类大脑高级认知能力和思考过程的一种体现。大语言模型是一种利用海量的人类自然语言文本来学习和模仿人类语言沟通方式的人工智能技术,它的基本功能是根据给定的提示来生成或补全文本,例如写小说、新闻、诗歌等,这体现了它们的文本创造能力。然而,大语言模型不仅仅是在预测下一个词元(token),当模型达到一定规模时(100亿-1000亿个参数规模)就能够在没有进行训练的情况下完成特定任务,例如语言理解、生成、逻辑推理、翻译、编程等。这些任务需要一定的认知推理能力,而大语言模型似乎通过合理的提示就能够表现出这种能力,就像AI拥有了人类的意识一样。我们称这种能力为“涌现能力”。

这种涌现能力和传统的人工智能技术有着本质的区别。传统人工智能技术所展现出来的水平很大程度上取决于我们给它的训练样本,就像“鹦鹉学舌”一样,只是在样本所涵盖的知识领域内进行泛化。而大语言模型却让我们看到了一种质的飞跃,它能够主动地创造和解决问题,就像“乌鸦喝水”一样,我们并没有事先在训练过程中给它类似的样本或条件,它可以自己想出方法。这种自主的创造力就是大语言模型与其他技术显著不同的特征。

思维链(Chain of Thought,CoT)是一种新颖且有效的提示工程技术,它能够利用大语言模型的涌现能力,赋予大语言模型推理能力,并提升大语言模型在复杂推理任务中(例如算术推理、常识推理和符号推理)的表现。

然而,大语言模型只是一种自然语言生成模型,并不具备真正意义上的计算和推理能力,为什么给它一个逻辑清晰的例子时,它能按照逻辑的方式输出呢?这是因为通过这个例子为大语言模型提供了一个“更仔细、更认真思考、有逻辑性”的语境,这种语境是人类描述推理问题的某种习惯模式。在这个语境下后续文本生成将会获得一个偏向生成具有推理风格文本的最大概率。

比如说,“让我们一步一步思考(Let’s think step by step)”这句话在提示中出现时,通常意味着下面会有一个按照逻辑顺序分析的过程。

因此,站在一个更高的视角来观察,这些思维链无一例外都是通过“某种人类理解的、有逻辑的、抽象化的”结构来做提示编排(大部分模拟人类的思考逻辑过程的某种抽象结构),从而触发(启发)大语言模型消耗更多的算力往推理方向去生成。

深入阅读

在过去的一段时间里,人们总结了非常多的利用思维链提示(COT)增强大语言模型推理的方法,在人民邮电出版社出版的《AI原生应用开发:提示工程原理与实战》(京东图书:https://item.jd.com/14373635.html)一书中,作者用了一章的篇幅详细介绍了市面上主流的利用思维链技术提升大模型推理的方法,并且进一步研究了思维链的本质,揭开了利用语言模型推理的面纱,让我们一起看看吧!在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/974943.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

最新本地部署 DeepSeekR1 蒸馏\满血量化版 + WebOpenUI 完整教程(Ubuntu\Linux系统\Ollama)

测试机为6133CPU(40Cores)256G D44*4090D 24G 一种方法是部署蒸馏版Distill模型。一种是部署Huggingface上unsloth的量化版模型 Ollama及模型安装 1.下载并安装ollama curl -fsSL https://ollama.com/install.sh | sh如果下载不动可以试试挂梯子或者再试几次 挂代理代码&…

PySide6学习专栏(四):用多线程完成复杂计算任务

如果计程序中要处理一个非常庞大的数据集中的数据,且数据处理计算很复杂,造成数据处理占用大量时间和CPU资源,如果不用多线程,仅在主进程中来处理数据,将会使整个程序卡死,必须采用多线程来处理这些数据是唯…

路由基本配置

学习目标 • 根据拓扑图进行网络布线。 • 清除启动配置并将路由器重新加载为默认状态。 • 在路由器上执行基本配置任务。 • 配置并激活以太网接口。 • 测试并检验配置。 • 思考网络实施方案并整理成文档。 任务 1:网络布线 使用适当的电缆类型连接网络设备。…

STM32MP157A单片机移植Linux驱动深入版

需求整理 在Linux设备树中新增leds节点&#xff0c;其有3个gpio属性&#xff0c;分别表示PE10对应led1&#xff0c;PF10对应led2&#xff0c;PE8对应led3&#xff0c;设备树键值对如下&#xff1a; leds { led1-gpio <&gpioe 10 0>; led2-gpio &l…

瑞芯微RV1126部署YOLOv8全流程:环境搭建、pt-onnx-rknn模型转换、C++推理代码、错误解决、优化、交叉编译第三方库

目录 1 环境搭建 2 交叉编译opencv 3 模型训练 4 模型转换 4.1 pt模型转onnx模型 4.2 onnx模型转rknn模型 4.2.1 安装rknn-toolkit 4.2.2 onn转成rknn模型 5 升级npu驱动 6 C++推理源码demo 6.1 原版demo 6.2 增加opencv读取图片的代码 7 交叉编译x264 ffmepg和op…

如何为自己的 PDF 文件添加密码?在线加密 PDF 文件其实更简单

随着信息泄露和数据安全问题的日益突出&#xff0c;保护敏感信息变得尤为重要。加密 PDF 文件是一种有效的手段&#xff0c;可以确保只有授权用户才能访问或修改文档内容。本文将详细介绍如何使用 CleverPDF 在线工具为你的 PDF 文件添加密码保护&#xff0c;确保其安全性。 为…

蓝桥杯核心内容

核心内容 数学 质数与筛质数&#xff0c;分解质因数 分解质因数 所有的数都可以写成有限个数相乘质数&#xff1a;可以写成1✖本身&#xff08;如131✖13&#xff09;合数&#xff1a;ab1✖...✖bn-》把乘数里面是合数的再分&#xff08;如b3是合数-》b3c1✖c2&#xff09;进…

七星棋牌源码高阶技术指南:6端互通、200+子游戏玩法深度剖析与企业级搭建实战(完全开源)

在棋牌游戏行业高速发展的今天&#xff0c;如何构建一个具备高并发、强稳定性与多功能支持的棋牌游戏系统成为众多开发者和运营团队关注的焦点。七星棋牌全开源修复版源码 凭借其 六端互通、200子游戏玩法、多省区本地化支持&#xff0c;以及 乐豆系统、防沉迷、比赛场、AI智能…

【学习笔记】【SpringCloud】MybatisPlus 基础使用

目录 一、使用 MybatisPlus 基本步骤 1. 引入 MybatisPlus 依赖 2. 定义Mapper接口并继承BaseMapper 二、MybatisPlus 常用配置 三、自定义SQL 四、IService 接口 1. 批量新增的效率问题 2. 配置方式 五、插件功能 1. 分页插件 一、使用 MybatisPlus 基本步骤 1. 引…

QT 引入Quazip和Zlib源码工程到项目中,无需编译成库,跨平台,压缩进度

前言 最近在做项目时遇到一个需求&#xff0c;需要将升级的文件压缩成zip&#xff0c;再进行传输&#xff1b; 通过网络调研&#xff0c;有许多方式可以实现&#xff0c;例如QT私有模块的ZipReader、QZipWriter&#xff1b;或者第三方库zlib或者libzip或者quazip等&#xff1…

在高流量下保持WordPress网站的稳定和高效运行

随着流量的不断增加&#xff0c;网站的稳定和高效运行变得越来越重要&#xff0c;特别是使用WordPress搭建的网站。流量过高时&#xff0c;网站加载可能会变慢&#xff0c;甚至崩溃&#xff0c;直接影响用户体验和网站正常运营。因此&#xff0c;我们需要采取一些有效的措施&am…

linux 安装启动zookeeper全过程及遇到的坑

1、下载安装zookeeper 参考文章&#xff1a;https://blog.csdn.net/weixin_48887095/article/details/132397448 2、启动失败 1、启动失败JAVA_HOME is not set and java could not be found in PATH 已安装 JAVA 配置了JAVA_HOME,还是报错解决方法&#xff1a;参考&#xf…

投资组合风险管理

投资组合风险管理 市场风险 信用风险流动性风险风险指标收益率波动率最大回撤 α \alpha α&#xff08;詹森指数&#xff09;&#xff0c; β \beta β卡玛比率月胜率上/下行捕获比夏普比率索提诺比率经风险调整的收益率&#xff08;&#x1d440;2&#xff09;特雷诺比率信息…

MySQL八股学习笔记

文章目录 一、MySQL结构1.宏观结构1.1.Server层1.2.存储引擎层 2.建立链接-连接器3.查询缓存4.解析SQL-解析器&#xff08;1&#xff09;词法分析&#xff08;2&#xff09;语法分析 5.执行SQL5.1.预处理器 prepare5.2.优化器 optimize5.3.执行器 execute&#xff08;1&#xf…

在windows下安装windows+Ubuntu16.04双系统(下)

这篇文章的内容主要来源于这篇文章&#xff0c;为正式安装windowsUbuntu16.04双系统部分。在正式安装前&#xff0c;若还没有进行前期准备工作&#xff08;1.分区2.制作启动u盘&#xff09;&#xff0c;见《在windows下安装windowsUbuntu16.04双系统(上)》 二、正式安装Ubuntu …

自然语言处理NLP 04案例——苏宁易购优质评论与差评分析

上一篇文章&#xff0c;我们爬取了苏宁易购平台某产品的优质评价和差评&#xff0c;今天我们对优质评价与差评进行分析 selenium爬取苏宁易购平台某产品的评论-CSDN博客 目录 1. 数据加载 2. 中文分词 3. 停用词处理 4. 数据标注与合并 5. 数据集划分 6. 文本特征提取 …

最新版本Exoplayer扩展FFmpeg音频软解码保姆级教程

ExoPlayer 是一个开源的 Android 媒体播放库&#xff0c;由 Google 开发和维护&#xff0c;用于替代 Android 系统自带的 MediaPlayer。它提供了更强大的功能、更好的性能和更高的灵活性&#xff0c;适用于各种复杂的媒体播放场景。所以被广泛用于各种播放器场景。 最近项目中…

华为昇腾910b服务器部署DeepSeek翻车现场

最近到祸一台HUAWEI Kunpeng 920 5250&#xff0c;先看看配置。之前是部署的讯飞大模型&#xff0c;发现资源利用率太低了。把5台减少到3台&#xff0c;就出了他 硬件配置信息 基本硬件信息 按照惯例先来看看配置。一共3块盘&#xff0c;500G的系统盘&#xff0c; 2块3T固态…

【操作系统】操作系统概述

操作系统概述 1.1 操作系统的概念1.1.1 操作系统定义——什么是OS&#xff1f;1.1.2 操作系统作用——OS有什么用&#xff1f;1.1.3 操作系统地位——计算机系统中&#xff0c;OS处于什么地位&#xff1f;1.1.4 为什么学操作系统&#xff1f; 1.2 操作系统的历史1.2.1 操作系统…

使用Dify将AI机器人嵌入到你的前端页面中及chrome的扩展应用

目录 1 博主有话说2 前提环境3 Dify创建个聊天助手应用4 将AI聊天机器人嵌入到html中5 将AI聊天机器人设置为chrome的扩展应用6 博主增语 1 博主有话说 那博主话不多说&#xff0c;先展示一下成果&#xff01; 这个界面是使用dify配置的一个“聊天助手”的应用&#xff0c;助…