DeepSeek与AI幻觉

  • 来源:清华大学
  • 发布时间:2025/02/26
  • 浏览次数:441
  • 举报
相关深度报告REPORTS

DeepSeek与AI幻觉.pdf

DeepSeek与AI幻觉。

由清华大学发布了《DeepSeek与AI幻觉》这篇报告。以下是对该报告的简单概括,更多内容请前往原报告进行下载查看。当模型具备强大的逻辑关联能力时,会倾向于在已知事实间建立「超合理」的虚构连接。例如,时间线延展:已知某科学家发明A技术(1990年),自动补全其在1995年获得诺贝尔奖(实际未发生)。

一、什么是AI幻觉

学术:指模型生成与事实不符、逻辑断裂或脱离上下文的内容,本质是统计概率驱动的“合理猜测”说人话:一本正经地胡说八道。

事实性幻觉:指模型生成的内容与可验证的现实世界事实不一致忠实性幻觉:指模型生成的内容与用户的指令或上下文不一致。

二、DeepSeek为什么会产生幻觉

数据偏差:训练数据中的错误或片面性被模型放大(如医学领域过时论文导致错误结论) 泛化困境:模型难以处理训练集外的复杂场景(如南极冰层融化对非洲农业的影响预测) 知识固化:模型过度依赖参数化记忆,缺乏动态更新能力(如2023年后的事件完全虚构) 意图误解:用户提问模糊时,模型易“自由发挥”(如“介绍深度学习”可能偏离实际需求)。

音乐为什么没有幻觉?音乐的主观性和多样性:音乐是一种高度主观的艺术形式,人们对音乐的审美和理解有很大的差异。一段音乐是否“合理”或“正确” ,往往取决于文化背景、个人偏好和上下文 音乐的抽象性:音乐本质上是抽象的,不像文本或图像那样直接对应现实世界的具体事物。文本中的“幻觉”通常是因为模型生成的内容与事实不符,而音乐本身往往缺少明确的事实基础 音乐的可感知性差异:音乐是时间性的艺术形式,即使某些部分听起来不协调或不符合预期,它们也可能在整个作品的上下文中变得合理。相比之下,文本或图像中的问题往往是瞬间可见的,容易引起注意  音乐“幻觉”的潜在表现:逻辑断裂的歌词、结构混乱的旋律、风格混杂的编曲。

AI幻觉的潜在风险。信息污染风险:由于DeepSeek的低门槛和普及度高,大量AI生成内容涌入中文互联网,加剧了虚假信息传播的“雪球效应” ,甚至污染下一代模型训练数据 信任危机:普通用户难以辨别AI内容的真实性,可能对医疗建议、法律咨询等专业场景的可靠性产生长期怀疑  控制欠缺:DeepSeek的对齐工作较其他闭源大模型有所欠缺,其开源特性也允许使用者随意使用,可能会成为恶意行为的工具  安全漏洞:若错误信息被用于自动化系统(如金融分析、工业控制),可能引发连锁反应。

三、AI幻觉评测

测试1:随机生成100条通用提示语,模仿普通用户的真实使用场景,获取大模型回答后进行人工判断与标注,并进行交叉验证。

测试2:随机抽取300道事实性幻觉测试题,涵盖健康、科学、历史、文化、音乐等等多个领域,获取大模型回答后与正确答案比对,人工标注幻觉类型,并进行交叉验证。

四、如何减缓AI幻觉

提示词工程

三角验证法:交叉比对多个AI回答或权威来源。 • 警惕“过度合理”:越细节丰富的回答越需谨慎(如AI虚构论文标题与作者)。• 理解幻觉,享受幻觉:理解幻觉的特点和应对方法,享受幻觉带来的创意灵感

五、AI幻觉的创造力价值

科学发现:从“错误”到突破的范式跃迁。蛋白质设计:大卫·贝克团队利用AI“错误折叠”启发新型 蛋白质结构,获2024诺贝尔化学奖。 • 认为AI幻觉是“从零开始设计蛋白质”的关键 • 发表的多篇论文都将“幻觉”纳入标题当中。

娱乐与游戏:创造新的视觉和听觉体验。AI生成的虚拟环境和角色设计为游戏 开发人员提供了无限的可能性,增强 了玩家的沉浸感和探索欲 • AI幻觉还被用于生成故事、对话和诗 歌,为游戏和文学创作提供灵感。

 技术创新:从“缺陷”到方法论的转化。DeepMind团队发现,AI在图像分割任务中产生的“超现实边界”虽不符合真实场景,却意外提升了自动驾驶系统对极端天气(如浓雾、暴雨)的识别精度。


(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

相关报告
评论
  • 相关文档
  • 相关文章
  • 全部热门
  • 本年热门
  • 本季热门
  • 全部热门
  • 本年热门
  • 本季热门
  • 最新文档
  • 最新精读
分享至