华为盘古团队:2025年Pangu Ultra MoE 模型架构与训练方法技术报告.pdf

  • 上传者:元*
  • 时间:2025/06/09
  • 热度:302
  • 0人点赞
  • 举报

华为盘古团队:2025年Pangu Ultra MoE 模型架构与训练方法技术报告。PanguUltraMoE是一款在AscendNPU平台上全流程开发的准万亿参数MoE大 模型,其性能上在开源评测集上达到一流水平。本文旨在全面介绍PanguUltra MoE面向超大规模参数与高稀疏比场景下所采用的关键技术方案,涵盖模型架 构、训练方法和高效推理系统等方面。

1页 / 共16
华为盘古团队:2025年Pangu Ultra MoE 模型架构与训练方法技术报告.pdf第1页 华为盘古团队:2025年Pangu Ultra MoE 模型架构与训练方法技术报告.pdf第2页 华为盘古团队:2025年Pangu Ultra MoE 模型架构与训练方法技术报告.pdf第3页 华为盘古团队:2025年Pangu Ultra MoE 模型架构与训练方法技术报告.pdf第4页 华为盘古团队:2025年Pangu Ultra MoE 模型架构与训练方法技术报告.pdf第5页 华为盘古团队:2025年Pangu Ultra MoE 模型架构与训练方法技术报告.pdf第6页
  • 格式:pdf
  • 大小:0.8M
  • 页数:16
  • 价格: 4积分
下载 获取积分

免责声明:本文 / 资料由用户个人上传,平台仅提供信息存储服务,如有侵权请联系删除。

留下你的观点
  • 相关标签
  • 相关专题
热门下载
  • 全部热门
  • 本年热门
  • 本季热门
分享至