未来智库
专业分类
行业研究
电子信息/游戏

SuperCLUE团队：中文大模型基准测评2025年上半年报告.pdf

上传者：N***
时间：2025/08/12
热度：260
0人点赞
举报

SuperCLUE团队：中文大模型基准测评2025年上半年报告。海外头部模型o3、o4-mini(high)和Gemini-2.5-Pro在本次七月通用基准测评中取得了 73.78分、73.32分和68.98分的总成绩，分别位于榜单前三。Doubao-Seed-1.6-thinking 250715以68.04的总分取得国内第一、全球第四的成绩。

海外模型在推理任务上的优势尤其显著，o3和o4-mini(high)在推理任务上分别取得了 75.02和72.68的分数，领跑推理任务榜单。国内推理任务成绩最好的模型分别是 DeepSeek-R1-0528和Doubao-Seed-1.6-thinking-250715，均有超过65分的表现，但与海外头部模型依旧相差近10分。

SuperCLUE团队：中文大模型基准测评2025年上半年报告.pdf第1页

SuperCLUE团队：中文大模型基准测评2025年上半年报告.pdf第2页

SuperCLUE团队：中文大模型基准测评2025年上半年报告.pdf第3页

SuperCLUE团队：中文大模型基准测评2025年上半年报告.pdf第4页

SuperCLUE团队：中文大模型基准测评2025年上半年报告.pdf第5页

SuperCLUE团队：中文大模型基准测评2025年上半年报告.pdf第6页

SuperCLUE团队：中文大模型基准测评2025年上半年报告.pdf第7页

SuperCLUE团队：中文大模型基准测评2025年上半年报告.pdf第8页

SuperCLUE团队：中文大模型基准测评2025年上半年报告.pdf第9页

SuperCLUE团队：中文大模型基准测评2025年上半年报告.pdf第10页

SuperCLUE团队：中文大模型基准测评2025年上半年报告.pdf第11页

SuperCLUE团队：中文大模型基准测评2025年上半年报告.pdf第12页

SuperCLUE团队：中文大模型基准测评2025年上半年报告.pdf第13页

SuperCLUE团队：中文大模型基准测评2025年上半年报告.pdf第14页

SuperCLUE团队：中文大模型基准测评2025年上半年报告.pdf第15页

SuperCLUE团队：中文大模型基准测评2025年上半年报告.pdf第16页

SuperCLUE团队：中文大模型基准测评2025年上半年报告.pdf第17页

SuperCLUE团队：中文大模型基准测评2025年上半年报告.pdf第18页

SuperCLUE团队：中文大模型基准测评2025年上半年报告.pdf第19页

SuperCLUE团队：中文大模型基准测评2025年上半年报告.pdf第20页

格式：pdf
大小：6.1M
页数：60
价格： 6积分

下载获取积分

免责声明：本文 / 资料由用户个人上传，平台仅提供信息存储服务，如有侵权请联系删除。

留下你的观点

相关标签
相关专题

热门下载

全部热门
本年热门
本季热门

科技行业专题研究：AI大模型时代的全球产业链重构（211页）.pdf 2171 30积分
2024大模型典型示范应用案例集.pdf 2169 37积分
大模型“引爆”行业新一轮变革：2024年中国AI大模型场景探索及产业应用调研报告.pdf 1857 8积分
2023大模型落地应用案例集.pdf 1749 12积分
机器人行业专题报告：机器人的大脑，具身智能.pdf 1587 8积分
20250215-清华大学-：DeepSeek+DeepResearch，让科研像聊天一样简单 1410 15积分
AIGC行业深度报告：大模型改变开发及交互环境，处于高速迭代创新周期.pdf 1324 9积分
科大讯飞研究报告：讯飞星火点亮千行百业.pdf 1312 6积分
2024年中国大模型行业应用优秀案例白皮书.pdf 1232 8积分
弈衡通用大模型评测体系白皮书.pdf 1176 6积分

云2025大模型推理优化与部署实践产业洞察研究报告.pdf 196 6积分
同济大学：2025开源大模型法律风险及防范研究报告.pdf 157 6积分
MINIMAX_WP公司研究报告：全球化多模态大模型公司，高性价比构筑核心竞争力.pdf 155 3积分
大模型赋能投研之十五：国产大模型编程辅助投研方案全方位评测.pdf 150 4积分
2025大模型原理技术与应用.pdf 144 20积分
中文大模型基准测评2025年年度报告：2026开年特别版，含1月底重磅模型动态评测.pdf 126 7积分
大模型技术深度赋能保险行业白皮书（2025）.pdf 107 6积分
2025年AI大模型车载软件平台白皮书.pdf 101 5积分
2025具身智能十大观察报告-洞悉智能发展之势探索智能向善之路.pdf 100 5积分

分享至

收藏
0