未来智库
专业分类
行业研究
电子信息/游戏

SuperCLUE：中文大模型基准测评2025年5月报告.pdf

上传者：元*
时间：2025/06/16
热度：364
0人点赞
举报

SuperCLUE：中文大模型基准测评2025年5月报告。o4-mini(high)在本次5月测评中表现优异，总分达到70.51分，超过国内最好模型7.35分。该模型在推理、代码生成、智能体、指令遵循等多个方面表现出卓越的综合能力，特别是在代码生成（91.52）、指令遵循（68.07）方面得分较高。

Doubao-1.5-thinking-pro-205415、SenseNova V6 Reasoner等国内模型表现亮眼。其中，Doubao-1.5-thinking-pro-205415在文本创作与理解任务以 81.04的高分领先其他模型。

Hunyuan-T1-20250403在国内模型中指令遵循得分第一，为36.97分，但是与海外模型指令遵循得分第一的o4-mini(high)相比，差距达到了31.1分，国内模型在指令遵循方面表现较弱，还有较大的提升空间。

SuperCLUE：中文大模型基准测评2025年5月报告.pdf第1页

SuperCLUE：中文大模型基准测评2025年5月报告.pdf第2页

SuperCLUE：中文大模型基准测评2025年5月报告.pdf第3页

SuperCLUE：中文大模型基准测评2025年5月报告.pdf第4页

SuperCLUE：中文大模型基准测评2025年5月报告.pdf第5页

SuperCLUE：中文大模型基准测评2025年5月报告.pdf第6页

SuperCLUE：中文大模型基准测评2025年5月报告.pdf第7页

SuperCLUE：中文大模型基准测评2025年5月报告.pdf第8页

SuperCLUE：中文大模型基准测评2025年5月报告.pdf第9页

SuperCLUE：中文大模型基准测评2025年5月报告.pdf第10页

SuperCLUE：中文大模型基准测评2025年5月报告.pdf第11页

SuperCLUE：中文大模型基准测评2025年5月报告.pdf第12页

SuperCLUE：中文大模型基准测评2025年5月报告.pdf第13页

格式：pdf
大小：13.3M
页数：39
价格： 13积分

下载获取积分

免责声明：本文 / 资料由用户个人上传，平台仅提供信息存储服务，如有侵权请联系删除。

留下你的观点

相关标签
相关专题

热门下载

全部热门
本年热门
本季热门

科技行业专题研究：AI大模型时代的全球产业链重构（211页）.pdf 2174 30积分
2024大模型典型示范应用案例集.pdf 2171 37积分
大模型“引爆”行业新一轮变革：2024年中国AI大模型场景探索及产业应用调研报告.pdf 1859 8积分
2023大模型落地应用案例集.pdf 1752 12积分
机器人行业专题报告：机器人的大脑，具身智能.pdf 1592 8积分
科大讯飞研究报告：讯飞星火点亮千行百业.pdf 1416 6积分
20250215-清华大学-：DeepSeek+DeepResearch，让科研像聊天一样简单 1412 15积分
AIGC行业深度报告：大模型改变开发及交互环境，处于高速迭代创新周期.pdf 1325 9积分
2024年中国大模型行业应用优秀案例白皮书.pdf 1236 8积分
弈衡通用大模型评测体系白皮书.pdf 1178 6积分

AI大模型深度报告：大模型研究框架（2025）.pdf 1100 7积分
CIC赛昇：2025年大模型智能体开发平台技术能力测试研究报告.pdf 926 5积分
2025年大模型平台落地实践研究报告.pdf 779 7积分
艾瑞咨询：2025年中国制造业数字化转型行业发展研究报告.pdf 730 5积分
爱分析AI大模型教育行业白皮书.pdf 642 6积分
华为&中国信通院：2025超节点发展报告.pdf 607 6积分
2025年医疗大模型研究报告-新质生产力大模型在各医疗场景的赋能实践.pdf 577 7积分
半导体行业专题报告：AI大模型竞赛方兴未艾，OpenAI与DeepSeek引领行业生态重构.pdf 558 6积分
2025年中国AIDC产业发展白皮书：智算中心如何撑起大模型时代的蓝图？.pdf 466 7积分
美团大模型+Agent+实践手册.pdf 447 5积分

云2025大模型推理优化与部署实践产业洞察研究报告.pdf 199 6积分
MINIMAX_WP公司研究报告：全球化多模态大模型公司，高性价比构筑核心竞争力.pdf 161 3积分
同济大学：2025开源大模型法律风险及防范研究报告.pdf 160 6积分
大模型赋能投研之十五：国产大模型编程辅助投研方案全方位评测.pdf 154 4积分
2025大模型原理技术与应用.pdf 147 20积分
中文大模型基准测评2025年年度报告：2026开年特别版，含1月底重磅模型动态评测.pdf 130 7积分
2025年AI大模型车载软件平台白皮书.pdf 114 5积分
大模型技术深度赋能保险行业白皮书（2025）.pdf 113 6积分
2025具身智能十大观察报告-洞悉智能发展之势探索智能向善之路.pdf 105 5积分
大模型上下文工程指南.pdf 14 7积分

分享至

收藏
0