华为盘古团队:2025年Pangu Ultra MoE 模型架构与训练方法技术报告.pdf
- 上传者:元*
- 时间:2025/06/09
- 热度:302
- 0人点赞
- 举报
华为盘古团队:2025年Pangu Ultra MoE 模型架构与训练方法技术报告。PanguUltraMoE是一款在AscendNPU平台上全流程开发的准万亿参数MoE大 模型,其性能上在开源评测集上达到一流水平。本文旨在全面介绍PanguUltra MoE面向超大规模参数与高稀疏比场景下所采用的关键技术方案,涵盖模型架 构、训练方法和高效推理系统等方面。
免责声明:本文 / 资料由用户个人上传,平台仅提供信息存储服务,如有侵权请联系删除。
热门下载
- 全部热门
- 本年热门
- 本季热门
- 华为盘古团队:2025年Pangu Ultra MoE 模型架构与训练方法技术报告.pdf 303 4积分
- 大语言模型(LLM)在量化金融中的应用展望.pdf 936 6积分
- AIAgent专题报告:拐点已至,2B+2C星辰大海.pdf 718 7积分
- 国家发展和改革委员会:中国智·惠世界(2025)(中英版).pdf 560 20积分
- 2025大语言模型翻译质量评测报告.pdf 482 4积分
- 未来工作:大语言模型和工作.pdf 407 5积分
- 2024AI+研发数字峰会:打造自适应AI运维智慧体,大语言模型在软件日志运维的实践.pdf 329 6积分
- 大语言模型威胁分类.pdf 310 6积分
- 2025年多模态大语言模型技术及应用标准领航研究报告.pdf 307 6积分
- 华为盘古团队:2025年Pangu Ultra MoE 模型架构与训练方法技术报告.pdf 303 4积分
- 国家发展和改革委员会:中国智·惠世界(2025)(中英版).pdf 560 20积分
- 2025大语言模型翻译质量评测报告.pdf 482 4积分
- 2024AI+研发数字峰会:打造自适应AI运维智慧体,大语言模型在软件日志运维的实践.pdf 329 6积分
- 2025年多模态大语言模型技术及应用标准领航研究报告.pdf 307 6积分
- 智联招聘:2025人工智能大语言模型技术影响下的劳动力市场求职错配情况报告.pdf 241 4积分
- 大语言模型时代的AI4Science.pdf 225 20积分
- 赛迪智库:2025全球智能体发展进展、面临挑战与对策建议报告.pdf 217 5积分
- 2025年从“看到”到“看透”:掌握大语言模型中的品牌话语权报告.pdf 193 5积分
