大语言模型被证明没有推理能力,但是它的救星Prolog来了,我准备入坑了

大语言模型(LLM),如GPT等,在自然语言生成上已经展示了非凡的能力,但在推理方面,事情就没那么简单了。它们被证明在逻辑推理上存在严重的短板。大家可能都有类似体验——当你需要LLM帮你推导一个复杂的逻辑问题时,它们的回答往往模棱两可,甚至牛头不对马嘴。这背后的原因是什么?其实,LLM的核心是统计学习,推理并不是它们的强项。但别担心,Prolog,一个以推理见长的古老编程语言,正悄然成为LLM的救星。我准备好入坑了,因为它的逻辑能力确实有望弥补LLM的这一重大缺陷。

1. LLM为什么“不会推理”?

要理解为什么LLM无法进行有效的推理,首先要明白它们的运作方式。大语言模型是基于海量的数据进行训练的,它们通过分析语料库中的词汇关系,生成符合统计规律的答案。然而,推理,特别是多步骤的逻辑推导,涉及到规则的遵循和因果关系的理解,而不是简单的词汇关联。

举个例子,你可以让LLM生成一篇关于天气的短文,它也许能做得很好。但是如果你给它一个复杂的逻辑推理题,比如“如果所有猫都怕水,汤姆是只猫,那么汤姆怕水吗?”这种涉及多个前提和结论的推导,LLM有时会“迷失”。它可能会给出一个看似合理但没有实际逻辑支撑的答案。因为LLM不是真的在“理解”这些前提与结论之间的关系,它只是根据概率推测下一个可能的词或句子。

2. Prolog如何解决推理问题

那么,Prolog如何解决LLM在推理方面的短板呢?Prolog是一种基于逻辑的编程语言,诞生于1970年代。它的主要优势在于能够通过一系列的规则和事实进行符号推理。对于复杂的逻辑问题,Prolog通过递归的方式一步步进行推导,直至得出符合所有条件的结论。这一点正是LLM所不具备的能力。

比如,对于刚才的“猫怕水”的问题,Prolog会先根据定义好的规则(“所有猫都怕水”),再结合事实(“汤姆是只猫”),推导出结论(“汤姆怕水”)。这一切都是基于逻辑链条,而不是概率。

将Prolog与LLM结合使用,你可以让LLM处理海量的自然语言输入,而Prolog则专门负责逻辑推理部分。这种组合不仅提升了系统的推理能力,还可以通过LLM生成更自然、更符合上下文的语言输出。

3. Prolog与LLM结合的实际场景

这种技术组合在很多场景下都有用武之地。首先是在医疗诊断领域。大语言模型可以快速浏览成千上万的医学文献,提取有价值的信息,但真正的诊断往往需要严谨的推理过程。Prolog可以根据患者的症状和既有的医学规则,逐步推导出最可能的病因,从而提供更可靠的诊断建议。

另一个典型的应用场景是法律领域。在法律咨询系统中,LLM可以帮助查询大量的法律条文和案例,而Prolog则可以在这些条文的基础上进行逻辑推理,确保答案符合法律逻辑。比如,涉及到多个法律条款的案件,Prolog能够帮助逐步推导出最符合逻辑的法律结论。

此外,Prolog与LLM的结合还可以用于自动驾驶、供应链管理等需要复杂决策的场景。在这些领域中,Prolog负责推理和决策,而LLM则提供数据分析和语言生成。想象一下,在一个自动驾驶系统中,LLM可以实时分析道路情况,而Prolog则负责基于逻辑规则进行决策——该在什么情况下停车、加速或转向。

4. 入坑Prolog,是一件容易的事吗?

Prolog是一种强大的逻辑编程语言,尤其擅长解决基于规则和约束的逻辑问题。下面且看他的魔力,展示了它在解决逻辑推理和问题求解方面的能力。

1. 家谱推理 (Family Tree)

问题描述:给定一些基本的家庭关系,推导出父母、祖父母、兄弟姐妹等复杂关系。

代码语言:javascript

复制

% 基本关系
parent(john, mary).
parent(jane, mary).
parent(john, tom).
parent(jane, tom).

% 规则定义
father(X, Y) :- parent(X, Y), male(X).
mother(X, Y) :- parent(X, Y), female(X).
sibling(X, Y) :- parent(Z, X), parent(Z, Y), X \= Y.

% 性别
male(john).
female(jane).
female(mary).
male(tom).

查询:

代码语言:javascript

复制

?- father(john, Who).
% 查询 John 是谁的父亲,返回: Who = mary, Who = tom.
2. 图的路径查找 (Graph Path Finding)

问题描述:在一个城市网络中找到从一个城市到另一个城市的路径。

代码语言:javascript

复制

% 城市之间的直接连接
connected(a, b).
connected(b, c).
connected(c, d).
connected(a, e).
connected(e, d).

% 路径规则:如果X和Y直接连接,或者通过Z连接
path(X, Y) :- connected(X, Y).
path(X, Y) :- connected(X, Z), path(Z, Y).

% 查询
?- path(a, d).
% 结果:X = a, Z = e, Y = d.

这个例子展示了如何递归地在图中寻找路径。path(X, Y) 表示 X 和 Y 之间存在路径,通过直接或间接的连接找到结果。

3. 容易犯错的逻辑问题 (Knights and Knaves Puzzle)

问题描述:A说:“我们两人中有一个是骗子。”B保持沉默。谁是骑士,谁是骗子?

代码语言:javascript

复制

% 规则定义
knight(A) :- A.
knave(A) :- \+A.

% 场景假设
statement(A, B) :- (A, \+B); (\+A, B).

% 查询
?- statement(knight(A), knight(B)).
% 结果:A是骑士,B是骗子。

这些经典示例展示了Prolog在逻辑推理、图算法、约束满足问题和逻辑谜题求解中的应用。

然而,Prolog虽然强大,但也不是没有挑战。首先,它是一种非常不同于主流编程语言的语言,习惯了传统编程方式的开发者可能需要时间来适应。它更像是在写数学公式,而不是在写代码。另外,如何让LLM和Prolog无缝对接也是一个技术难题。毕竟,LLM的输出是基于文本的,而Prolog的输入则需要是逻辑规则的形式。要设计一个有效的接口,将自然语言转化为逻辑规则,反之亦然,这需要一定的工程工作。

不过,随着技术的发展,越来越多的研究开始关注这一方向。实际上,已经有一些初步的探索证明了这一思路的可行性。

图为加入 Prolog 之后,造就牛逼哄哄的数据,看看就好

未来,随着AI系统对推理能力要求的提升,Prolog与LLM的结合可能会变得越来越普遍。这也是我为什么准备入坑Prolog的原因——在未来的智能系统中,它的地位不可忽视。

一些思考

在当下的大语言模型浪潮中,逻辑推理能力一直是一个亟待解决的问题。而Prolog作为一个逻辑编程语言,正好补足了LLM的这一短板。通过将两者结合,未来的AI系统不仅能够生成自然语言,还能在复杂场景中进行严谨的推理。这种组合无疑将开辟更多智能应用的可能性。准备入坑的你,是否也感受到了这个新世界的大门正在缓缓开启?

如何系统的去学习大模型LLM ?

大模型时代,火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。 “AI会取代那些行业?”“谁的饭碗又将不保了?”等问题热议不断。

事实上,抢你饭碗的不是AI,而是会利用AI的人。

科大讯飞、阿里、华为等巨头公司发布AI产品后,很多中小企业也陆续进场!超高年薪,挖掘AI大模型人才! 如今大厂老板们,也更倾向于会AI的人,普通程序员,还有应对的机会吗?

与其焦虑……

不如成为「掌握AI工具的技术人」,毕竟AI时代,谁先尝试,谁就能占得先机!

但是LLM相关的内容很多,现在网上的老课程老教材关于LLM又太少。所以现在小白入门就只能靠自学,学习成本和门槛很高。

针对所有自学遇到困难的同学们,我帮大家系统梳理大模型学习脉络,将这份 LLM大模型资料 分享出来:包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴,可以 扫描下方二维码领取🆓↓↓↓

👉CSDN大礼包🎁:全网最全《LLM大模型入门+进阶学习资源包》免费分享(安全链接,放心点击)👈

一、LLM大模型经典书籍

AI大模型已经成为了当今科技领域的一大热点,那以下这些大模型书籍就是非常不错的学习资源。

在这里插入图片描述

二、640套LLM大模型报告合集

这套包含640份报告的合集,涵盖了大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。(几乎涵盖所有行业)

在这里插入图片描述

三、LLM大模型系列视频教程

在这里插入图片描述

四、LLM大模型开源教程(LLaLA/Meta/chatglm/chatgpt)

在这里插入图片描述

LLM大模型学习路线

阶段1:AI大模型时代的基础理解

  • 目标:了解AI大模型的基本概念、发展历程和核心原理。

  • 内容

    • L1.1 人工智能简述与大模型起源
    • L1.2 大模型与通用人工智能
    • L1.3 GPT模型的发展历程
    • L1.4 模型工程
    • L1.4.1 知识大模型
    • L1.4.2 生产大模型
    • L1.4.3 模型工程方法论
    • L1.4.4 模型工程实践
    • L1.5 GPT应用案例

阶段2:AI大模型API应用开发工程

  • 目标:掌握AI大模型API的使用和开发,以及相关的编程技能。

  • 内容

    • L2.1 API接口
    • L2.1.1 OpenAI API接口
    • L2.1.2 Python接口接入
    • L2.1.3 BOT工具类框架
    • L2.1.4 代码示例
    • L2.2 Prompt框架
    • L2.3 流水线工程
    • L2.4 总结与展望

阶段3:AI大模型应用架构实践

  • 目标:深入理解AI大模型的应用架构,并能够进行私有化部署。

  • 内容

    • L3.1 Agent模型框架
    • L3.2 MetaGPT
    • L3.3 ChatGLM
    • L3.4 LLAMA
    • L3.5 其他大模型介绍

阶段4:AI大模型私有化部署

  • 目标:掌握多种AI大模型的私有化部署,包括多模态和特定领域模型。

  • 内容

    • L4.1 模型私有化部署概述
    • L4.2 模型私有化部署的关键技术
    • L4.3 模型私有化部署的实施步骤
    • L4.4 模型私有化部署的应用场景

这份 LLM大模型资料 包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴,可以 扫描下方二维码领取🆓↓↓↓

👉CSDN大礼包🎁:全网最全《LLM大模型入门+进阶学习资源包》免费分享(安全链接,放心点击)👈

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/893501.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

cleanmymacX破解版下载 cleanmymacx激活码永久免费 mac电脑免费垃圾清理软件推荐

CleanMyMac,它的字面意思为“清理我的Mac”,是一款Mac清理工具,是MacPaw旗下的一款知名专业Mac系统软件工具,。CleanMyMac X不仅获得了苹果公司的认证,还因其丰富的功能和用户友好型设计,荣获“亚洲设计奖”…

动态量化:大模型在端侧CPU快速推理方案

作为一款高性能的推理引擎框架,MNN高度关注Transformer模型在移动端的部署并持续探索优化大模型在端侧的推理方案。本文介绍权重量化的模型在MNN CPU后端的推理方案:动态量化。动态量化指在运行时对浮点型feature map数据进行8bit量化,然后与…

Linux 和Windows创建共享文件夹实现文件共享

直接开整 1.Windows下创建共享文件夹share右击-》属性—》共享-》选择所有人-》点击共享 2.共享创建完成后可以使他的共享网络地址或者Windows ip地址-推荐使用Windows ip地址有时候 不知道什么原因他Linux解析不了网络地址 共享网络地址 —共享文件夹share 右击-》属性—》共…

基于Java实现(PC)大学班级事务管理系统

courseDesign_Java Java 课设 要求 本次设计要求利用 Java 实现 C/S 模式的大学班级内日常事务管理系统(PC 版,应用于校内网有线网络访问,暂不开发移动端),不得依赖现有的建模框架,使用 swings 技术完成如…

spring-boot学习(2)

上次学习截止到拦截器 1.构建RESfun服务 PathVariable通过url路径获取url传递过来的信息 2.MyBatisPlus 第三行的mydb要改为自己的数据库名 第四,五行的账号密码改成自己的 MaooerScan告诉项目自己的这个MyBatisPlus是使用在哪里的,包名 实体类的定义…

中级课程RHCE

RHCE 一、复习RHCSA1.1 系统安装1.1.1 安装虚拟机1.1.2 第一个快照1.1.3 第二个快照vi编辑器1.1.4 看网关网卡 1.2 文件管理1.3 目录管理1.4 用户管理1.5 权限管理1.6 存储管理1.6.1 标准分区管理实验:1.6.2 逻辑卷管理实验:1.6.3 交换空间管理实验 …

一文探索RareShop:首个面向消费者的RWA NFT商品发售平台

作者:Weilin,PANews 本轮牛市中,加密消费级应用正成为一种热门趋势,比如pump.fun和Polymarket等产品已成为C端用户的明星。加密货币正日益渗透到日常消费者的产品、服务和行为中。这意味着加密货币的使用不再局限于投机交易或去中…

跟着深度学习好书实践tensorflow神经网络

前言 2024 年诺贝尔物理学奖授予了约翰霍普菲尔德 (John Hopfield)和图灵奖得主、AI教父杰弗里辛顿(Geoffrey Hinton),"以表彰他们利用人工神经网络进行机器学习的奠基性发现和发明"。 辛顿在接受电话采访…

Github 2024-10-18Java开源项目日报Top9

根据Github Trendings的统计,今日(2024-10-18统计)共有9个项目上榜。根据开发语言中项目的数量,汇总情况如下: 开发语言项目数量Java项目8非开发语言项目1Python项目1HTML项目1《Hello 算法》:动画图解、一键运行的数据结构与算法教程 创建周期:476 天协议类型:OtherStar…

Mysql(4)—数据库索引

一、关于索引 1.1 简介 数据库索引是数据库管理系统中用于提高数据检索效率的数据结构。索引类似于书籍中的索引,它允许用户快速找到数据,而不需要扫描整个表。 ​ ‍ MySQL索引的建立对于MySQL的高效运行是很重要的,索引可以大大提高My…

java幂等控制问题

🏆本文收录于《全栈Bug调优(实战版)》专栏,主要记录项目实战过程中所遇到的Bug或因后果及提供真实有效的解决方案,希望能够助你一臂之力,帮你早日登顶实现财富自由🚀;同时,欢迎大家关注&&am…

游戏逆向基础-跳出游戏线程发包

附加游戏后下断点 bp ws2_32.send send函数断下后,可以看到数据地址每次都一样 可以说明这个游戏是线程发包,所以直接在数据窗口中转到这个地址,然后对这个地址下硬件写入断点。 下了硬件写入断点后可以一层一层往上面跟,确定写…

集合框架07:LinkedList使用

1.视频链接:13.14 LinkedList使用_哔哩哔哩_bilibilihttps://www.bilibili.com/video/BV1zD4y1Q7Fw?spm_id_from333.788.videopod.episodes&vd_sourceb5775c3a4ea16a5306db9c7c1c1486b5&p142.LinkedList集合的增删改查操作 package com.yundait.Demo01;im…

汽车行业焕新潮流涌动,联众优车以优质服务响应市场变化

随着消费者环保意识的改变及新能源汽车市场的快速发展,我国新能源汽车领域正掀起一股新的消费热潮,而旧车的合理处置问题也随之成为社会各界关注的焦点。今年4月末,商务部、财政部等七大部委携手颁布了《老旧汽车置换补贴实施指南》(以下简称…

学会组装、调试、维修无人机后从事飞手工作技术优势分析

学会组装、调试、维修无人机后从事飞手工作,将带来显著的技术优势,这些优势不仅提升了飞手的综合能力,也增强了其在行业中的竞争力。以下是对这些技术优势的详细分析: 一、深入理解无人机结构与功能 1. 结构认知:通过…

RabbitMQ 作为消息中间件,实现了支付消息的异步发送和接收, 同步和异步相比 响应速度具体比较

在支付场景中,使用 RabbitMQ 实现消息的异步发送和接收与同步处理相比,响应速度和整体系统性能会有显著的不同。以下是同步和异步方式在响应速度上的详细比较: 1. 同步处理方式 在同步模式下,支付消息的处理流程通常是&#xf…

exchange邮件系统ADFS双因素认证技术方案

exchange作为微软公司推出的邮件系统,在企业界有着广泛的应用,通常情况下,exchange为邮箱用户提供的认证方式是基于AD的静态密码认证,虽然微软在AD认证上已经做了大量的安全性优化,但是由于是静态密码方式认证&#xf…

医院信息化与智能化系统(1)

医院信息化与智能化系统(1) 这里只描述对应过程,和可能遇到的问题及解决办法以及对应的参考链接,并不会直接每一步详细配置 1、 MySQL准备 创建并初始化user数据库,后续为验证mybatis-plus(后续简称mp) 2、确认idea配置 在新版IDEA中需要…

5.计算机网络_抓包工具wireshark

安装 Linux中安装wireshark: sudo apt-get install wireshark Linux中执行wireshark: sudo wireshark 使用 注意:只有与外网交互的数据才可以被wireshark抓到,本机回环的数据不会被抓到 实验内容: 使用nc命令…

爬虫(反调试)

其实就是一种给页面反爬机制,一般页面用不到。 万能解决反调试方法: