想要一劳永逸地消除 AI 幻觉,该如何做?

作者:老余捞鱼

原创不易,转载请标明出处及原作者。

写在前面的话:
        
尽管 LLMs 基于存储、检索和生成(RAG)的方法在某些情况下能够提供准确的回答,但在面对名词短语碰撞时,RAG方法可能会因为语义相似性而失效。为了解决这个问题,本文提出了命名实体过滤(NEF)作为一种解决LLM幻觉的方法。NEF的核心在于在查询时过滤掉与目标实体语义相似但实际上指向不同实体的信息,从而避免LLM产生混淆,接下来我们将详细讲解NEF的实施方法和原理。


一、NEF( Named Entity Filtering )介绍

       当多个名字语义相似时,ChatGPT 4 和其他 LLM 经常会产生幻觉。比如下面这个经典的例子:“Alfonso” and “Afonso.”

       阿方索灾难(The Alfonso Debacle):如果你问的是关于 "Alfonso "的问题,但发送的是关于 "Afonso "的信息,那么法律硕士很可能会将 "Afonso"的信息应用到 "Alfonso "上--尽管它们是两个不同的名字。

       本文接下来的内容如下:

  • 解释需要解决的问题 。
  • “阿方索灾难”演示。
  • “阿方索灾难”如何导致部署到生产中的基于 RAG 的真实聊天机器人产生幻觉?
  • 命名实体过滤法(NEF)--一种消除“阿方索灾难”所产生的幻觉的方法。
  • 最后,我们将对本文进行总结。

       本系列的目的是为您提供完整的步骤集,以便您应用NEF模式来完全消除幻觉。欢迎来到第一步!

二、问题

       我曾向 ChatGPT 4 询问有关 Cruise LLC 所面临挑战的信息(Cruise 是一家开发自动驾驶汽车的公司)。(然而,ChatGPT 4 的回复却将 Cruise LLC 面临的挑战与游轮业(如旅游船艇)面临的挑战穿插在一起。)

       这里有一个很少被讨论的问题。请注意,ChatGPT 并没有穿插墨西哥卷饼行业或任何其他行业所面临的挑战。相反,这种混淆是系统性的。法律硕士混淆特定主题和词语是有系统原因的。

       我们稍后将探讨为什么 RAG 本身并不能防止这种混淆。我们还将探讨命名实体过滤如何完全解决这一问题。现在,让我们先关注阿方索大溃败,了解 ChatGPT 4 和其他 LLM 产生幻觉的原因,从而理解命名实体过滤是如何完全消除这一问题的。

三、阿方索灾难

       一家名为 Vellum 的公司发布了一个 ChatGPT-4 幻觉查询:"葡萄牙第三任国

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/879085.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

SpringBoot启动成功,但端口启动失败

目录 一、问题展示 二、问题分析 2.1.端口与Tomcat的关系 2.2.问题分析 三、SpringBoot常见知识记录 3.1.SpringBoot项目常用jar包 3.1.1.必要性jar包 3.1.2.选择性jar包 3.2.标签的作用及取值 3.2.1.compile(编译范围) 3.2.2.provided…

Maya---机械模型制作

材质效果(4)_哔哩哔哩_bilibili 三角面 四边面 多边面 *游戏允许出现三角面和四边面 游戏中一般是低模(几千个面) 动漫及影视是高模 机械由单独零件组合而成,需独立制作 低面模型到高面模型 卡线是为了将模型保…

[JavaEE] 网络初识(网络通信 及 TCP / UDP / IP 封装分用 )

Author:MTingle major:人工智能 --------------------------------------- Build your hopes like a tower! 文章目录 目录 文章目录 一. 网络通信基础 1. 局域网LAN 2. ⼴域⽹WAN 3. IP地址 4. 端口号 二.协议 1. 五元组 2. 协议分层 协议分层的优点: 3. OSI七层协…

mongoDB-1

文章目录 一、疑似坑1.11.2 mongo ops manager1.3 mongo features视图固定大小集合(有点类似ringbuffer数据结构,capped collections)(聚簇集合)clustered collection(类比到Mysql的聚簇索引)聚合管道 aggregation pipelineWiredTiger (默认存…

STM32中的计时与延时

前言 在裸机开发中,延时作为一种规定循环周期的方式经常被使用,其中尤以HAL库官方提供的HAL_Delay为甚。刚入门的小白可能会觉得既然有官方提供的延时函数,而且精度也还挺好,为什么不用呢?实际上HAL_Delay中有不少坑,而这些也只是HAL库中无数坑的其中一些。想从坑里跳出来…

【3D打印】使用simplify 3D切片更改Gcode手动断电续打、掉电、未打完继续打印、补救

一、问题描述 有些时候会遇到3D打印机没料但机器还在继续打、掉电重启后未正常恢复打印、挤出机端没有料但断料检测未触发等情况。我们又不想打印放弃,但又想继续之前的进度打印。 这时候我们需要更改3D打印文件的Gcode参数来进行继续打印。 至于什么是Gcode&…

帕金森遗传给子女的概率大吗?揭开真相,守护健康未来

在健康话题日益受到关注的今天,帕金森病这一神经系统疾病常常引发公众的广泛讨论。尤其是当谈及帕金森病是否会遗传给子女时,许多家庭都充满了担忧和疑惑。那么,帕金森病遗传给子女的概率究竟有多大?今天,我们就来揭开…

2024 年浙江省网络安全行业网络安全运维工程师项目 职业技能竞赛网络安全运维工程师(决赛样题)

2024年浙江省网络安全行业网络安全运维工程师项目 职业技能竞赛网络安全运维工程师(决赛样题) 应急响应:1 通过流量分析,找到攻击者的 IP 地址2 找到攻击者下载的恶意文件的 32 位小写 md5 值3 找到攻击者登录后台的 URI4 找到攻击…

Unity 给模型贴上照片

Unity将真实世界的照片贴图到模型上 原因 模拟仿真,直接使用照片肯定是效果最好的,省下做材质了 直接拖动即可 导入图片到Unity中将图片修改为Sprite模式直接将图片拖动到Scene面板的物体上即可 注意:是将图片拖动到Scene面板的物体上&a…

婚礼弹幕上墙阳光正好,爱意正浓,打造一场出圈的唯美婚礼!

原文地址 婚礼现场的弹幕功能可以给整个场景增添温暖和喜庆的氛围。通过手机发送祝福,让亲友可以即时将祝福传达给新人,同时这些祝福以弹幕的形式在大屏幕上滚动展示,增加了现场互动的乐趣。墙上新闻搭配的功能则更加抢眼,不仅可…

k8s中的存储

目录 一 configmap 1.1 configmap的功能 1.2 configmap的使用场景 1.3 configmap创建方式 1.3.1 字面值创建 1.3.2 通过文件创建 1.3.3 通过目录创建 1.3.4 通过yaml文件创建 1.3.5 configmap的使用方式 1.3.5.1 使用configmap填充环境变量 1.3.5.2 通过数据卷使用c…

kubernetes技术详解,带你深入了解k8s

目录 一、Kubernetes简介 1.1 容器编排应用 1.2 Kubernetes简介 1.3 k8s的设计架构 1.3.1 k8s各个组件的用途 1.3.2 k8s各组件之间的调用关系 1.3.3 k8s的常用名词概念 1.3.4 k8s的分层结构 二、k8s集群环境搭建 2.1 k8s中容器的管理方式 2.2 k8s环境部署 2.2.1 禁用…

定位HardFault

一、HardFault定义 STM32出现HardFault_Handler硬件错误的原因主要有两个方面: 1、内存溢出或者访问越界。(包括使用野指针) 2、堆栈溢出。 二、定位HardFault步骤 1. 判断所使用堆栈: 发生异常之后可首先查看LR寄存器中的值…

SAP B1 单据页面自定义 - 用户界面编辑字段

背景 接《SAP B1 基础实操 - 用户定义字段 (UDF)》,在设置完自定义字段后,如下图,通过打开【用户定义字段】可打开表单右侧的自定义字段页。然而再开打一页附加页面操作繁复,若是客户常用的定义字段,也可以把这些用户…

pytest 接口测试

pytest 核心重点 读取excel(xfile --> read) 函数循环执行( pytest 装饰器,自动解析,一个个单独执行) 接口关联(Template 处理参数变量) pytest 是什么 .py文件名 用 test_开头,…

【计算机网络】HTTP相关问题与解答

此篇文章内容会不定期更新,仅作为学习过程中的笔记记录 目录 一、HTTP请求和响应报文是怎样的? 1、请求报文 2、响应报文 二、HTTP请求方法有哪些? GET HEAD POST PUT DELETE PATCH OPTIONS TRACE CONNECT 三、GET请求与POST请…

linux cmake版本升级教程(Centos7)

有时候,当前系统的cmake版本,并一定能满足编译要求,所以需要进行升级到高于某个版本才能正常编译。本章教程,主要在centos7上进行升级cmake版本。 一、查看当前的cmake版本 cmake --version二、下载指定版本的cmake wget https://github.com/Kitware/CMake/releases/down…

Element UI:初步探索 Vue.js 的高效 UI 框架

Element UI:初步探索 Vue.js 的高效 UI 框架 一 . ElementUI 基本使用1.1 Element 介绍1.2 Element 快速入门1.3 基础布局1.4 容器布局1.5 表单组件1.6 表格组件1.6.1 基础表格1.6.2 带斑马纹表格1.6.3 带边框表格1.6.4 带状态的表格 1.7 导航栏组件讲解 二 . 学生列…

安装WINDOWS微软商店已下架的WSL系统,以UBUNTU 16.04 为例

下载WSL系统 方法1:POWERSHELL 用powershell下载 PowerShell Invoke-WebRequest -Uri https://aka.ms/wsl-ubuntu-1604 -OutFile Ubuntu.appx -UseBasicParsing 1 如果下载时间很长,可以这样把进度条关闭: $ProgressPreference Silentl…

计算机人工智能前沿进展-大语言模型方向-2024-09-12

计算机人工智能前沿进展-大语言模型方向-2024-09-12 1. PharmaBench: Enhancing ADMET benchmarks with large language models Z Niu, X Xiao, W Wu, Q Cai, Y Jiang, W Jin, M Wang… - Scientific Data, 2024 大语言模型在药物发现中的应用:PharmaBench 文章由…