清华大学第五弹:《DeepSeek与AI幻觉》

作者:清华大学新闻与传播学院新媒体研究中心、人工智能学院(新媒沈阳团队)
时间:2025年2月

完整版下载地址:夸克网盘分享


一、AI幻觉的定义与分类
  1. 定义
    • 学术定义:模型生成与事实不符、逻辑断裂或脱离上下文的内容,本质是统计概率驱动的“合理猜测”。
    • 通俗解释:“一本正经地胡说八道”。
  1. 分类
    • 事实性幻觉:内容与可验证的现实事实不一致(如错误回答“蜂蜜适合糖尿病患者”)。
    • 忠实性幻觉:内容与用户指令或上下文意图偏离(如回答偏题)。

二、AI幻觉的成因
  1. 数据偏差:训练数据中的错误或片面性被放大(如医学领域过时论文导致错误结论)。
  2. 泛化困境:模型难以处理训练集外的复杂场景(如预测南极冰层融化对非洲农业的影响)。
  3. 知识固化:模型依赖参数化记忆,缺乏动态更新能力(如虚构2023年后的事件)。
  4. 意图误解:用户提问模糊时模型“自由发挥”(如“介绍深度学习”可能偏离实际需求)。

三、AI幻觉的潜在风险
  1. 信息污染:虚假内容泛滥,污染下一代模型训练数据。
  2. 信任危机:用户难以辨别专业场景(医疗、法律)内容的真实性。
  3. 安全漏洞:错误信息用于自动化系统(金融分析、工业控制)可能引发连锁反应。
  4. 控制欠缺:开源模型易被滥用为恶意工具。

四、AI幻觉的评测与案例分析
  1. 评测方法
    • 通用性测试:模拟真实用户场景,人工标注幻觉率(如DeepSeekV3幻觉率2%)。
    • 事实性测试:覆盖多领域的300道测试题(如DeepSeekV3事实性幻觉率29.67%)。
  1. 典型案例
    • 金融行业:某银行利用DeepSeek构建因果归因网络,降低不良率4.2%。
    • 医疗领域:Whisper转录病例时出现50%的幻觉内容(如篡改患者死亡年龄)。
    • 文学/历史:模型虚构《水浒传》情节(如李逵大闹五台山)。

五、应对AI幻觉的策略
  1. 技术方案
    • RAG框架:检索增强生成,结合权威数据库。
    • 外部知识库:强化垂直领域知识。
    • 推理增强:通过思维链(如DeepSeek R1)降低逻辑错误。
  1. 用户策略
    • 提示词工程:限定时间、知识来源、专业身份(如“基于2023年前文献回答”)。
    • 双AI验证:多模型交叉审查。
    • 联网搜索:实时获取最新信息降低幻觉率(如开启后DeepSeekV3通用幻觉率降至0%)。
  1. 高风险场景防护
    • 医疗诊断、法律咨询、金融预测等领域需严格限制生成内容,附加风险提示。

六、AI幻觉的创造力价值
  1. 科学发现
    • 利用“错误折叠”启发新型蛋白质设计(如2024年诺贝尔化学奖案例)。
  1. 文艺与设计
    • 生成超现实角色、虚拟环境,突破人类思维定式(如游戏开发灵感)。
  1. 技术创新
    • 从“缺陷”到方法论转化(如AI生成虚构导管设计优化实验结果)。
  1. 新型科研范式
    • “AI幻觉→实验验证→理论重构”三阶段流程推动创新闭环。

七、总结与展望
  • 核心观点:AI幻觉既是技术局限性的折射,也是超越人类想象的创新源泉。
  • 应对哲学:与其追求“绝对正确”,需学会与AI的“想象力”共舞,平衡风险与创造力。
  • 未来方向:开发自动化幻觉识别工具,完善对齐机制,探索幻觉驱动的跨学科创新。

八、演示文稿精彩展示

九、往期精彩

《DeepSeek从入门到精通》——清华大学

《DeepSeek如何赋能职场应用》——清华大学

《普通人如何抓住DeepSeek的红利》——清华大学

《DeepSeek+DeepResearch:让科研像聊天一样简单》——清华大学

《DeepSeek原理与效应》——天津大学

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/975313.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

鹰角基于 Flink + Paimon + Trino 构建湖仓一体化平台实践项目

摘要:本文整理自鹰角大数据开发工程师,Apache Hudi Contributor 朱正军老师在 Flink Forward Asia 2024 生产实践(二)专场中的分享。主要分为以下四个部分: 一、鹰角数据平台架构 二、数据湖选型 三、湖仓一体建设 四、…

deepin 下安装nvm(npm+node)

1、切换root用户,并更新系统 sudo su sudo apt update && apt upgrade -y 期间所有提示选择yes即可 2、切换回自己用户 su - fchsoft 3、安装git sudo apt install git -y 4、安装wget sudo apt install wget -y 5、安装nvm 创建文件夹 mkdir -p…

【JavaEE进阶】MyBatis通过注解实现增删改查

目录 🍃前言 🍀打印日志 🌴传递参数 🎋增(Insert) 🚩返回主键 🎄删(Delete) 🌲改(Update) 🌳查(Select) 🚩起别名 🚩结果映射 🚩开启驼…

三、数据治理应用开发整体架构

1.数据治理应用开发整体架构概览 该架构图描绘了一个全面的数据治理应用开发平台,旨在为用户提供从数据调研、治理构建、资产管理到应用开发、运维监控等全生命周期的一体化服务。整体架构呈现出模块化、松耦合的特点,并强调低代码开发和业务中台能力。 …

C#项目05-猜数字多线程

本项目利用多线程,通过点击按钮猜数字, 知识点 线程 基本概念 进程:一组资源,构成一个正在运行的程序,这些资源包括地址空间、文件句柄以及程序启动需要的其他东西的载体。 线程:体现一个程序的真实执行情况, 线…

XiaoMi Mi5(gemini) 刷入Ubuntu Touch 16.04——安卓手机刷入Linux

最近在研究个人用的小服务器,期间也搞了一台某讯的盒子,s905的芯片,28G,刷入了Armbian,在自己本地当linux服务器用用挺方便的,但总感觉性能不太够。 然后灵机一动,手上还有几台旧的安卓手机&am…

Spring Security+JWT+Redis实现项目级前后端分离认证授权

1. 整体概述 权限管理包括用户身份认证和授权两部分,简称认证授权。对于需要访问控制到资源,用户首先经过身份认证,认证通过后用户具有该资源的访问权限方可访问。 1.1 认证概述 认证是确认用户身份的过程,确保用户是谁。 1.1.1 …

【Linux】:应用层协议 HTTP (超文本传输协议)

📃个人主页:island1314 🔥个人专栏:Linux—登神长阶 ⛺️ 欢迎关注:👍点赞 👂🏽留言 😍收藏 💞 💞 💞 1. HTTP -- 概述 虽然我们说…

【ORB-SLAM3】鲁棒核函数的阈值设置

问题背景 阈值 δ \delta δ 是 Huber 鲁棒核函数的重要参数。首先给出结论,在ORB-SLAM系列中,该阈值选取的原则为: 单目情况下,根据95%置信水平下两自由度卡方检验的临界值, δ \delta δ 设置为 5.991 \sqrt{5.9…

零基础学QT、C++(六)制作桌面摄像头软件

目录 一、前言 二、Python项目包 三、C项目包 四、 项目说明 五、结语 章节汇总 一、前言 上一节,成功导入了OpenCV库 零基础学QT、C(四)QT程序打包-CSDN博客文章浏览阅读1.1k次,点赞29次,收藏23次。QT程序打包。将项…

银河麒麟系统安装mysql5.7【亲测可行】

一、安装环境 cpu:I5-10代; 主板:华硕; OS:银河麒麟V10(SP1)未激活 架构:Linux 5.10.0-9-generic x86_64 GNU/Linux mysql版本:mysql-5.7.34-linux-glibc2.12-x86_64.ta…

解耦的艺术_应用架构中的解耦

文章目录 Pre解耦的技术演化应用架构中的解耦小结 Pre 解耦的艺术_通过DPI依赖倒置实现解耦 解耦的艺术_通过中间层映射实现解耦 解耦的技术演化 技术的演化史,也是一部解耦的历史。从最初的面向对象编程(OOP)到Spring框架的依赖注入&…

Python采用DeepSeekR1本地部署+本地API接口实现简单对话

以下内容摘抄自 【Ai】— DeepSeek-r1 版本选择(超详细)https://blog.csdn.net/weixin_44205779/article/details/145479506 Ollama:零代码部署大模型,轻松玩转AIhttps://blog.csdn.net/scy799327210/article/details/145798396 大模型 ollama命令详解大全https://blog.…

记录 pycharm 无法识别提示导入已有的模块解决方案 No module named ‘xxx‘

在windows下,使用pycharm开发项目,每个项目都有自己独立的虚拟环境,有时候就会出现,在该项目中明明已经安装了某个模块,但是在写代码的时候就是导入不了,无法识别导入,在运行的时候却又是正常的…

uniapp 网络请求封装(uni.request 与 uView-Plus)

一、背景 在开发项目中,需要经常与后端服务器进行交互;为了提高开发效率和代码维护性,以及降低重复性代码,便对网络请求进行封装统一管理。 二、创建环境文件 2.1、根目录新建utils文件夹,utils文件夹内新建env.js文…

【OpenCV】入门教学

🏠大家好,我是Yui_💬 🍑如果文章知识点有错误的地方,请指正!和大家一起学习,一起进步👀 🚀如有不懂,可以随时向我提问,我会全力讲解~ &#x1f52…

解决双系统开机显示gnu grub version 2.06 Minimal BASH Like Line Editing is Supported

找了好多教程都没有用,终于解决了!!我是因为ubuntu分区的时候出问题了 问题描述: 双系统装好,隔天开机找不到引导项,黑屏显示下列 因为我用的D盘划分出来的部分空闲空间,而不是全部&#xff0c…

计算机毕业设计Hadoop+Spark+DeepSeek-R1大模型民宿推荐系统 hive民宿可视化 民宿爬虫 大数据毕业设计(源码+LW文档+PPT+讲解)

温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 作者简介:Java领…

Visual Studio Code 2025 安装与高效配置教程

一、软件简介与下载 1. Visual Studio Code 是什么? Visual Studio Code(简称VS Code)是微软推出的免费开源代码编辑器,支持 智能代码补全、Git集成、插件扩展 等功能,适用于前端开发、Python、Java等多种编程场景。…

【Node.js】express框架

目录 1初识express框架 2 初步使用 2.1 安装 2.2 创建基本的Web服务器 2.3 监听方法 2.3.1 监听get请求 2.3.2 监听post请求 2.4 响应客户端 2.5 获取url中的参数(get) 2.5.1 获取查询参数 2.5.2 获取动态参数 2.6 托管静态资源 2.6.1 挂载路径前缀 2.6.2 托管多…