DeepSeek与AI幻觉

来源：清华大学
发布时间：2025/02/26
浏览次数：441
举报

相关深度报告REPORTS

DeepSeek与AI幻觉.pdf

DeepSeek与AI幻觉。

由清华大学发布了《DeepSeek与AI幻觉》这篇报告。以下是对该报告的简单概括，更多内容请前往原报告进行下载查看。当模型具备强大的逻辑关联能力时，会倾向于在已知事实间建立「超合理」的虚构连接。例如，时间线延展：已知某科学家发明A技术（1990年），自动补全其在1995年获得诺贝尔奖（实际未发生）。

一、什么是AI幻觉

学术：指模型生成与事实不符、逻辑断裂或脱离上下文的内容，本质是统计概率驱动的“合理猜测”说人话：一本正经地胡说八道。

事实性幻觉：指模型生成的内容与可验证的现实世界事实不一致忠实性幻觉：指模型生成的内容与用户的指令或上下文不一致。

二、DeepSeek为什么会产生幻觉

数据偏差：训练数据中的错误或片面性被模型放大（如医学领域过时论文导致错误结论） 泛化困境：模型难以处理训练集外的复杂场景（如南极冰层融化对非洲农业的影响预测） 知识固化：模型过度依赖参数化记忆，缺乏动态更新能力（如2023年后的事件完全虚构） 意图误解：用户提问模糊时，模型易“自由发挥”（如“介绍深度学习”可能偏离实际需求）。

音乐为什么没有幻觉？音乐的主观性和多样性：音乐是一种高度主观的艺术形式，人们对音乐的审美和理解有很大的差异。一段音乐是否“合理”或“正确” ，往往取决于文化背景、个人偏好和上下文 音乐的抽象性：音乐本质上是抽象的，不像文本或图像那样直接对应现实世界的具体事物。文本中的“幻觉”通常是因为模型生成的内容与事实不符，而音乐本身往往缺少明确的事实基础 音乐的可感知性差异：音乐是时间性的艺术形式，即使某些部分听起来不协调或不符合预期，它们也可能在整个作品的上下文中变得合理。相比之下，文本或图像中的问题往往是瞬间可见的，容易引起注意  音乐“幻觉”的潜在表现：逻辑断裂的歌词、结构混乱的旋律、风格混杂的编曲。

AI幻觉的潜在风险。信息污染风险：由于DeepSeek的低门槛和普及度高，大量AI生成内容涌入中文互联网，加剧了虚假信息传播的“雪球效应” ，甚至污染下一代模型训练数据 信任危机：普通用户难以辨别AI内容的真实性，可能对医疗建议、法律咨询等专业场景的可靠性产生长期怀疑  控制欠缺：DeepSeek的对齐工作较其他闭源大模型有所欠缺，其开源特性也允许使用者随意使用，可能会成为恶意行为的工具  安全漏洞：若错误信息被用于自动化系统（如金融分析、工业控制），可能引发连锁反应。

三、AI幻觉评测

测试1：随机生成100条通用提示语，模仿普通用户的真实使用场景，获取大模型回答后进行人工判断与标注，并进行交叉验证。

测试2：随机抽取300道事实性幻觉测试题，涵盖健康、科学、历史、文化、音乐等等多个领域，获取大模型回答后与正确答案比对，人工标注幻觉类型，并进行交叉验证。

四、如何减缓AI幻觉

提示词工程

三角验证法：交叉比对多个AI回答或权威来源。 • 警惕“过度合理”：越细节丰富的回答越需谨慎（如AI虚构论文标题与作者）。• 理解幻觉，享受幻觉：理解幻觉的特点和应对方法，享受幻觉带来的创意灵感

五、AI幻觉的创造力价值

科学发现：从“错误”到突破的范式跃迁。蛋白质设计：大卫·贝克团队利用AI“错误折叠”启发新型蛋白质结构，获2024诺贝尔化学奖。 • 认为AI幻觉是“从零开始设计蛋白质”的关键 • 发表的多篇论文都将“幻觉”纳入标题当中。

娱乐与游戏：创造新的视觉和听觉体验。AI生成的虚拟环境和角色设计为游戏开发人员提供了无限的可能性，增强了玩家的沉浸感和探索欲 • AI幻觉还被用于生成故事、对话和诗歌，为游戏和文学创作提供灵感。

 技术创新：从“缺陷”到方法论的转化。DeepMind团队发现，AI在图像分割任务中产生的“超现实边界”虽不符合真实场景，却意外提升了自动驾驶系统对极端天气（如浓雾、暴雨）的识别精度。

（本文仅供参考，不代表我们的任何投资建议。如需使用相关信息，请参阅报告原文。）