DeepSeek与AI幻觉
- 来源:清华大学
- 发布时间:2025/02/26
- 浏览次数:441
- 举报
DeepSeek与AI幻觉.pdf
DeepSeek与AI幻觉。
由清华大学发布了《DeepSeek与AI幻觉》这篇报告。以下是对该报告的简单概括,更多内容请前往原报告进行下载查看。当模型具备强大的逻辑关联能力时,会倾向于在已知事实间建立「超合理」的虚构连接。例如,时间线延展:已知某科学家发明A技术(1990年),自动补全其在1995年获得诺贝尔奖(实际未发生)。
一、什么是AI幻觉
学术:指模型生成与事实不符、逻辑断裂或脱离上下文的内容,本质是统计概率驱动的“合理猜测”说人话:一本正经地胡说八道。
事实性幻觉:指模型生成的内容与可验证的现实世界事实不一致忠实性幻觉:指模型生成的内容与用户的指令或上下文不一致。
二、DeepSeek为什么会产生幻觉
数据偏差:训练数据中的错误或片面性被模型放大(如医学领域过时论文导致错误结论) 泛化困境:模型难以处理训练集外的复杂场景(如南极冰层融化对非洲农业的影响预测) 知识固化:模型过度依赖参数化记忆,缺乏动态更新能力(如2023年后的事件完全虚构) 意图误解:用户提问模糊时,模型易“自由发挥”(如“介绍深度学习”可能偏离实际需求)。
音乐为什么没有幻觉?音乐的主观性和多样性:音乐是一种高度主观的艺术形式,人们对音乐的审美和理解有很大的差异。一段音乐是否“合理”或“正确” ,往往取决于文化背景、个人偏好和上下文 音乐的抽象性:音乐本质上是抽象的,不像文本或图像那样直接对应现实世界的具体事物。文本中的“幻觉”通常是因为模型生成的内容与事实不符,而音乐本身往往缺少明确的事实基础 音乐的可感知性差异:音乐是时间性的艺术形式,即使某些部分听起来不协调或不符合预期,它们也可能在整个作品的上下文中变得合理。相比之下,文本或图像中的问题往往是瞬间可见的,容易引起注意 音乐“幻觉”的潜在表现:逻辑断裂的歌词、结构混乱的旋律、风格混杂的编曲。
AI幻觉的潜在风险。信息污染风险:由于DeepSeek的低门槛和普及度高,大量AI生成内容涌入中文互联网,加剧了虚假信息传播的“雪球效应” ,甚至污染下一代模型训练数据 信任危机:普通用户难以辨别AI内容的真实性,可能对医疗建议、法律咨询等专业场景的可靠性产生长期怀疑 控制欠缺:DeepSeek的对齐工作较其他闭源大模型有所欠缺,其开源特性也允许使用者随意使用,可能会成为恶意行为的工具 安全漏洞:若错误信息被用于自动化系统(如金融分析、工业控制),可能引发连锁反应。
三、AI幻觉评测
测试1:随机生成100条通用提示语,模仿普通用户的真实使用场景,获取大模型回答后进行人工判断与标注,并进行交叉验证。

测试2:随机抽取300道事实性幻觉测试题,涵盖健康、科学、历史、文化、音乐等等多个领域,获取大模型回答后与正确答案比对,人工标注幻觉类型,并进行交叉验证。
四、如何减缓AI幻觉
提示词工程
三角验证法:交叉比对多个AI回答或权威来源。 • 警惕“过度合理”:越细节丰富的回答越需谨慎(如AI虚构论文标题与作者)。• 理解幻觉,享受幻觉:理解幻觉的特点和应对方法,享受幻觉带来的创意灵感
五、AI幻觉的创造力价值
科学发现:从“错误”到突破的范式跃迁。蛋白质设计:大卫·贝克团队利用AI“错误折叠”启发新型 蛋白质结构,获2024诺贝尔化学奖。 • 认为AI幻觉是“从零开始设计蛋白质”的关键 • 发表的多篇论文都将“幻觉”纳入标题当中。
娱乐与游戏:创造新的视觉和听觉体验。AI生成的虚拟环境和角色设计为游戏 开发人员提供了无限的可能性,增强 了玩家的沉浸感和探索欲 • AI幻觉还被用于生成故事、对话和诗 歌,为游戏和文学创作提供灵感。
技术创新:从“缺陷”到方法论的转化。DeepMind团队发现,AI在图像分割任务中产生的“超现实边界”虽不符合真实场景,却意外提升了自动驾驶系统对极端天气(如浓雾、暴雨)的识别精度。
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
- samirtan:2025年DeepSeek指令公式大全.pdf
- 2025DeepSeek行业大模型算力网加速应用生态白皮书.pdf
- 布局到审查:基于DeepSeek建筑规划方案双重保障.pdf
- 2025年规划和自然资源行业应对DeepSeek浪潮的思考报告.pdf
- 2025年中国大模型一体机行业研究:DeepSeek大模型一体机如何破局行业发展.pdf
- 正泰安能:向设计要效益:AI自动化设计的实践与回报.pdf
- 艺恩报告:智驾未来:AI重塑汽车消费新纪元.pdf
- 清鹏算电:AI与电力市场应用探索——清鹏能源大模型智能体实践与展望.pdf
- 启信慧眼:全球布局洞见先行:构建AI时代的供应链韧性-2026供应链风控白皮书.pdf
- 计算机:通过AI原生,提升驾驶敏捷性和商业价值统一采购平台(英文版).pdf
- 相关标签
- 相关专题
- 相关文档
- 相关文章
- 全部热门
- 本年热门
- 本季热门
- 1 清华大学DeepSeek从入门到精通.pdf
- 2 普通人如何抓住DeepSeek红利.pdf
- 3 Deepseek+外经贸企业创新突围讲义精华全版.pdf
- 4 人工智能专题报告:DeepSeek研究框架.pdf
- 5 人工智能行业专题分析:比较试用DeepSeek看模型走向应用的新迹象.pdf
- 6 Deepseek相关产业专题分析:国产AI应用的“诺曼底时刻”.pdf
- 7 汽车行业专题研究:DeepSeek对智能驾驶影响几何?.pdf
- 8 20250215-清华大学-:DeepSeek+DeepResearch,让科研像聊天一样简单
- 9 DeepSeek R1深度解析及算力影响几何.pdf
- 10 AI+医疗行业专题报告:DeepSeek系列报告之AI+医疗.pdf
- 1 Deepseek+外经贸企业创新突围讲义精华全版.pdf
- 2 博睿数据2025从运维提效到LLMOps如何用DeepSeek铺就大模型可观测性进阶之路.pdf
- 3 2025年华为昇腾服务器DeepSeek V3R1推理部署最佳实践技术报告.pdf
- 4 浙江大学DS系列专题:DeepSeek技术溯源及前沿探索.pdf
- 5 浦东教育发展研究院:浦东新区中小幼教师 DeepSeek等大模型使用指南v1.0.pdf
- 6 计算机行业专题研究:DeepSeek重构算力基建长期价值的认知.pdf
- 7 AI赋能资产配置专题报告:DeepSeek解读中央政治局经济工作会议.pdf
- 8 2025年DeepSeek实用指南1.0版.pdf
- 9 2025从DeepSeek到品牌跃迁AI之于品牌的机遇与挑战报告.pdf
- 10 通信行业专题研究:DeepSeek算力效率提升≠算力通缩,国产算力需求方兴未艾.pdf
- 1 讯飞医疗科技公司研究报告:AI医疗先行者,贯通式布局医疗信息化.pdf
- 2 医药生物行业医疗器械2026年度策略:把握出海陡峭曲线,卡位AI医疗商业化落地.pdf
- 3 艾瑞咨询:2025年中国企业级AI应用行业研究报告.pdf
- 4 新经济中工作的四大未来:2030年的AI与人才(英译中).pdf
- 5 2026年半导体设备行业策略报告:AI驱动新成长,自主可控大时代.pdf
- 6 青矩技术公司研究报告:全过程工程咨询服务领军者,积极布局AI推行数智化咨询新模式.pdf
- 7 AI医疗行业专题报告:AI重构医疗,从场景落地到变现讨论.pdf
- 8 专题报告:个人AI助理OpenClaw部署及其在金融投研中的应用研究——AIAgent赋能金融投研应用系列之二.pdf
- 9 2026年AI行业应用深度展望:AI应用重塑流量格局,字节阿里腾讯C端布局加快.pdf
- 10 讯飞医疗科技公司研究报告:AI医疗龙头,GBC全场景贯通&中试基地卡位明确,规模化落地有望加速.pdf
- 全部热门
- 本年热门
- 本季热门
- 1 2025年DeepSeek大模型如何助力投研?
- 2 DeepSeekManus与AIAgent行业现状报告
- 3 2025年用DeepSeek优化价量因子
- 4 从Deepseek到Manus:Al如何重塑企业价值报告
- 5 Deepseek对中国算力产业的影响
- 6 北京大学-DeepSeek原理与落地应用
- 7 北京大学-DeepSeek私有化部署和一体机
- 8 DeepSeek企业落地应用讲义精华全版
- 9 北京大学-DeepSeek内部研讨系列:DeepSeek与AIGC应用
- 10 2025年深度解读DeepSeek:部署、使用、安全
- 1 2025年DeepSeek大模型如何助力投研?
- 2 DeepSeekManus与AIAgent行业现状报告
- 3 2025年用DeepSeek优化价量因子
- 4 从Deepseek到Manus:Al如何重塑企业价值报告
- 5 Deepseek对中国算力产业的影响
- 6 北京大学-DeepSeek原理与落地应用
- 7 2026年创新引领,AI赋能:把握科技产业升级下的投资机会
- 8 2026年新消费行业年度策略:新消费三大引擎,AI+消费、情绪经济、新质零售
- 9 2026年AI“创造性破坏”重构产业生态——多行业联合人工智能3月报
- 10 2026年AI“创造性破坏”下的产业重构
- 1 2026年创新引领,AI赋能:把握科技产业升级下的投资机会
- 2 2026年新消费行业年度策略:新消费三大引擎,AI+消费、情绪经济、新质零售
- 3 2026年AI“创造性破坏”重构产业生态——多行业联合人工智能3月报
- 4 2026年AI“创造性破坏”下的产业重构
- 5 2026年计算机行业OpenClaw:吹响AI Agent时代号角
- 6 2026年专用设备行业:AI算力驱动散热架构升级,液冷一次侧设备迎来价值重估——AIDC液冷深度报告
- 7 2026年腾讯控股重新探讨腾讯的AI争议:嵌入式工作流为何胜过单品表象
- 8 2026年汇量科技公司研究报告:出海程序化广告龙头构筑AI飞轮
- 9 2026年轻松健康公司研究报告:深耕AI医疗的数字健康生态构建者,数据与技术双轮驱动
- 10 2026年房地产行业深度报告:地产+AI工具系列报告之二,基于OpenClaw的房地产股票投研生产力提升实践
- 最新文档
- 最新精读
- 1 2026年中国医药行业:全球减重药物市场,千亿蓝海与创新迭代
- 2 2026年银行自营投资手册(三):流动性监管指标对银行投资行为的影响(上)
- 3 2026年香港房地产行业跟踪报告:如何看待本轮香港楼市复苏的本质?
- 4 2026年投资银行业与经纪业行业:复盘投融资平衡周期,如何看待本轮“慢牛”的持续性?
- 5 2026年电子设备、仪器和元件行业“智存新纪元”系列之一:CXL,互联筑池化,破局内存墙
- 6 2026年银行业上市银行Q1及全年业绩展望:业绩弹性释放,关注负债成本优化和中收潜力
- 7 2026年区域经济系列专题研究报告:“都”与“城”相融、疏解与协同并举——现代化首都都市圈空间协同规划详解
- 8 2026年历史6轮油价上行周期对当下交易的启示
- 9 2026年国防军工行业:商业航天革命先驱Starlink深度解析
- 10 2026年创新引领,AI赋能:把握科技产业升级下的投资机会
