商汤科技大模型业务布局及商业化进展如何?

商汤科技大模型业务布局及商业化进展如何?

最佳答案 匿名用户编辑于2025/03/04 14:44

日日新大模型体系覆盖全面,日日新 5.5 性能对标 GPT-4o。

1.模型性能:技术迭代迅速,日日新 5.5 可对标 GPT-4o

商汤是国内最早布局 AI 大模型的企业之一,已实现 CV、NLP、多模态、AIGC 等大模型 的全面布局。商汤自 2018 年开始布局大模型,2019 年推出 10 亿参数的视觉大模型,2021 年开始自研 NLP 大模型和多模态大模型,2022 年发布业界最大规模的 320 亿参数的 CV 大模型,2023 年发布“日日新 SenseNova”及“书生通用大模型体系”大模型体系,2024 年发布日日新 5.0 及 5.5,分别可对标 GPT-4Turbo 和 GPT-4o。目前公司的通用大模型已 覆盖视觉、语言、多模态、内容生成、决策领域,未来将向 AGI 进一步迈进。

自研“日日新 SenseNova”大模型体系快速迭代,布局生成式 AI。2023 年,公司正式发 布商汤“日日新 SenseNova”大模型体系并在年内进行初步迭代;此后日日新在 18 个月 内迭代 5 次,其中 1Q24 推出的日日新 4.0 在考试、语言、知识、推理、数理、编程的六大 测评维度中全面超越 GPT-3.5 并逼近 GPT-4,成为国内率先比肩 GPT-4 的大模型;2Q24 推出的日日新 5.0 可全面对标 GPT4-Turbo,可实现多模态对话,经国内权威大模型测评机 构 SuperCLUE 测评,其以总分 80.03 分的优异成绩刷新国内最好的中文基准测评成绩,并 且在中文综合成绩上超越 GPT-4-Turbo-0125;3Q24 推出日日新 5.5,在大语言模型和多 模态模型方面可对标 GPT-4o,用户体验明显改善,可初步实现流式交互。

日日新 5.0 版本综合性能对标 GPT-4 Turbo,5.5 版本综合性能对标 GPT-4o。 1) 日日新 5.0:2024 年 4 月,日日新升级至 5.0 版本,具备更强的知识、数学、推理及代 码能力,其端侧大模型可在中端性能手机上达到 18.3 字/秒的推理速度,在高端旗舰手 机上达到 78.3 字/秒,高于人眼 20 字/秒的阅读速度。日日新 5.0 综合性能全面对标 GPT-4 Turbo。 2) 日日新 5.5:2024 年 7 月,日日新升级至 5.5 版本,相较过往的亮点有:a)基础能力 方面,模型综合性能较 5.0 版本平均提升 30%,在数学推理、英文能力和指令跟随等 关键能力上有显著增强,该方面能力可超越 GPT4-Turbo,比肩 GPT4-o;b)多模态能 力方面,模型感知、表达、理解能力显著提高,该方面能力可超越 GPT4-Turbo,对标 GPT4-o;c)流式交互方面,响应延时控制到 560 毫秒,可以与用户实现原生多态实 时交互,覆盖声音、文本、图像、视频等多种形式,例如可帮助用户读取眼前画面中的 核心内容;d)端侧模型方面,采用 MoE 架构,知识问答、文案生成和文本总结能力领 先,首包延时降低 40%,推理速度提升 15%,领先业界。日日新 5.5 是国内首个对标 GPT-4o 的大模型,实现了核心性能指标的全面升级。在 MMB v1.1、MMStar、Math Vista、 AI2D、OCRBench 等多项全球权威测评中,日日新 5.5 的得分均超过 GPT-4o。

日日新 5.0 及 5.5 能力提升主要得益于三个方面:1)采用 MoE 架构,激活少量参数就能 完成推理。且推理时上下文窗口达到 200K 左右。2)基于超过 10TB tokens 训练、覆盖 数千亿量级的逻辑型合成思维链数据, 能最大限度发挥云边端协同的优势,在各核心能力提 升的同时,大幅降低推理成本。3)商汤 AI 大装置 SenseCore 算力设施与算法设计的联合 调优。

2.模型产品:落地应用广泛,商业对接丰富

日日新大模型体系覆盖全面。基于行业领先的模型性能,日日新可提供自然语言处理、图 片生成、数据标注、模型训练等多种能力,落地应用产品包括大语言模型及生成式 AI 等大 类,涵盖了商量(AI 聊天问答助手)、小浣熊(智能编程及办公助手)、拟人(角色定制与 对话)、大医(医患智能助手)、秒画(AI 文生图)、Vimi(可控人物视频生成)、如影(数 字人生成)、琼宇(3D 大场景重建)、格物(3D 小物品重建)、地界(智能遥感解译)等。

大语言模型产品: 1)小浣熊,小浣熊企业 Copiplot 助手是国内领先的编程和数据分析模型,其代码解释器在 SuperClue 代码评测排名第一,在规模 1000 以上的数据分析测试集上精度达 85.71%,超 过 GPT-4 的 84.62。小浣熊支持多种文件类型、跨文件分析,支持多列分析、统计、可视 化。 2)商量多模态对话,商量可进行问题解答及互动,同时掌握网络热门话题及其背后深层含 义,可精准解读并理解图像内容,支持百万字上下文长度。 3)商量·大医,模型基于海量医学知识训练,能实现专业医学问答及复杂医学任务推理, 并支持多模态医学文件的智能解读和交互问答,已覆盖智能自诊、用药咨询、诊后随访管 理、智慧病历、影像报告结构化等 10 余个细分医疗场景。在互联网问诊、导诊、用药咨询、 健康问答四项任务的自动化评测和执业医师人工评测中表现优于 GPT-4,在 MedBench 职 业药剂师考试中获得第二名。 4)拟人,AI 人设模型让 IP 角色活化,广泛触达 C 端用户,用户可与“梦中人”交流互动。 支持快速、高质量 IP 角色定制,角色可精准记忆超长对话内容,用户次日留存率达 60%以 上,单日最长交互轮数超过 2000,单日最长交互时长超 18 小时。 AI 生成式平台产品: 1)秒画,AI 文生图和视频平台,2024 年 1 月更新的秒画 4.0 可支持 100 亿参数量,高效 数据清理策略增量至 10 亿图文对,达到 10 倍加速效果。基于秒画技术架构的文生视频可 达 4k 高清画质,长度达分钟级。2)如影,可通过几分钟的视频定制数字人并能呈现逼真的口型、表情和动作,具备 AI 文 案生成等功能,帮助企业及个人创作数字人视频。如影通过中国信通院“可信虚拟人生成 内容管理系统”测评,并荣获“L3 卓越级”证书。案例方面,其 AI 数字员工“海小智” 和“海小慧”上线上海银行 APP 及线下旗舰网点,数字讲师“小鹿老师”在中公网校与商 汤联合上线的 AI 系统班授课。 3)琼宇,可实现 100km^2 大范围城市级 NeRF 模型重建,支持 4k 分辨率实时渲染,渲染 精度高(室外每 10000m^2 精度 5cm、室内每 1000^2 精度 1cm),可广泛应用于实景三维、 CIM 平台、数字孪生、云上看馆等场景。为杭州亚运会官方智能视觉服务独家供应商,构 建贯穿整个亚运和亚残运会周期的多场景虚实融合赛事体验。 4)格物,可在约 1 小时内快速重建物件,重建效果具备结构完整、纹理精细、颜色真实、 光照还原等特性。应用包括打造多场景应用产品,放大数字资产价值,生成商品 3D 说明书 及品牌宣传视频,AI 珠宝穿戴等;其具备轻量化、易使用特点,便于品牌物料投放、用户 社媒传播。

SenseMARS:赋能元宇宙,实现物理世界与数字世界的无缝融合。SenseMARS 搭载了 感知智能、决策智能、智能内容生成(包括增强现实、混合现实及软件智能体)及其他基 础设施(如云引擎等),可兼容 App、小程序及 H5 等不同应用形态,以及超 200 款手机、 平板电脑、AR/VR 眼镜、智能电视及消费级无人机等多种物联网设备。截至 2022 年底, SenseMARS 的 AIGC 相关能力赋能了小红书、微博、bilibili、ZEPETO、Line 等 APP 应 用超 200 个,头部客户续约率超 95%,拓展的线下场景覆盖面积增加至 1,500 万平方米, 覆盖大型游乐园区、大型商场、博物馆、银行等 120 个场景。

SenseCare 智慧医院综合解决方案覆盖五大场景。依托大模型底层赋能,商汤 SenseCare 智慧医院综合解决方案围绕智慧医疗云、智慧诊疗、智慧就医、智慧医院管理、智慧医学 科研五大场景,提升医疗服务效率和患者体验。 SenseCare 与医院合作案例有:1)智慧医院解决方案已应用于上海交通大学医学院附属 瑞金医院、郑州大学第一附属医院、四川大学华西医院、上海交通大学医学院附属新华医 院等众多国内顶级医疗机构,为上千万患者提供智能医疗服务,并运用病理数字阅片平台 和 AI 辅助诊断算法,提升医生阅片效率。2)助力上海交通大学医学院附属新华医院建设 全院级智慧就医平台,基于医疗大语言模型“大医”赋能,实现门诊环节全流程智能化, 包括智能导诊、高精度预问诊、实时定位及推送诊室位置、就诊路径规划、诊后随访、通 过智能语音问答评估患者高风险因素、科学服药引导等。截至 2023 年,平台已服务十余万 患者。3)助力上海交通大学医学院附属瑞金医院建设全院智慧影像云平台,覆盖包括影像 数据互联互通、移动阅片、5G+ 远程会诊、AI 影像质控、AI 智能诊疗、影像科研教学、患者云影像健康档案等多种功能,将 1-2 小时术前规划时间缩短至 3-5 分钟,将接收病理诊 断报告的 3-5 天缩短至 2 天,分担医生负荷并优化患者体验。相关成果已入选由瑞金医院 病理科主编的中国首本《数字化智慧病理科建设白皮书》。

3.生成式 AI 商业化:公有云+私有化部署+端侧 AI 变现,新客户快速增长

生成式 AI 商业化进展迅速,商汤目前为超过三千家行业领军客户提供顶尖大模型能力 与算力服务。生成式 AI 是公司成立以来最快实现收入从无到破十亿体量的业务,且公 司与数十家订单金额超千万元的客户保持合作。2023 年间,生成式 AI 70%的客户是 新客户,30%是存量客户;客单价以 50%速度增长,数十家订单金额超过五千万元, 大模型调用在 2H23 以 120 倍增长。 生成式AI变现方式包括公有云、私有化部署和端侧AI,公有云+私有化部署服务超3000 家企业。公有云及私有化部署为商汤主要的变现方式,通过公有云或私有化部署服务的 企业客户覆盖金融、互联网、AI 科技、高校等,包括各大运营商,券商,银行,京东、 小米、阅文等互联网公司、HiDream、澜舟等创业公司,清华、交大、南洋理工等学术 机构。

1)公有云服务,即企业客户通过接入公有即商汤 AIDC 大装置的方式,来获取算力服 务和商汤大模型 API。公有云服务也是商汤的主要变现方式。华为、京东、招商银行、 中国移动、清华大学等各行业领军客户皆与商汤通过公有云的方式展开合作。各企业对 商汤公有云服务有较大需求,公有云服务发展势态良好,我们认为其原因有:a)算力 要求方面,尽管公有云和私有云均可以用于企业大模型训练,但基础大模型训练对 GPU 数量要求巨大,商汤 AIDC 作为规模领先业界的大装置及公有云巨头,在基础大模型训 练中发挥关键的作用;b)大模型应用服务方面,用户通过 API 能够便捷地调用模型, 商汤凭借其丰富全面的大模型应用获得竞争力;c)降本增效方面,中小型 AI 企业往往 无法通过自建算力设施满足自身训推需求,且算力租赁业务价格往往较高,而公有云服 务具备规模效应,在用户数增长及技术优化的情况下,云计算服务价格可维持较低,更 受企业青睐。

2)私有化部署,即本地化搭载商汤大模型以提供算力服务。私有化部署方式主要针对 的客户是对数据安全要求较高的大型企业,包括各大国有银行、国有企业、医院等,如 中国银行、中国工商银行、中国南方电网、华西医院、芒果 TV 等。

3)端侧 AI,a)企业模型搭载方面,公司已与几乎所有头部安卓厂商和部分车企建立深度 合作关系,超过 150 家客户与商汤启动商业对接,AI 模型已赋能超过 20 亿台手机和上百 万台车,目前已搭载在小米小爱、联想笔记本电脑中;此外,商汤端侧模型也尝试与芯片 厂商合作,如高通、MTK 等;b)端侧小模型方面,与商汤日日新 5.5 同时发布的端侧小模 型“日日新 5.5 SenseChat Lite”借助端云协同的推理架构,模型推理速度可达每秒 100 字,延迟则可降至几十毫秒;该服务的技术领先也带来价格优势,接入商汤“日日新•商量 SenseChat”端侧大模型的单台设备成本低至 9.9 元/年;3)一体机方面,商汤也推出了金 融、医疗、政务的一体机,一机配置 4 张国产卡,可同时支持 100 名用户使用模型。

参考报告

商汤研究报告:AI 2.0领军,“1+X”聚焦生成式AI.pdf

商汤研究报告:AI2.0领军,“1+X”聚焦生成式AI。“大装置+大模型”深度协同,“自有+代运营”拥抱智算浪潮商汤大装置构建了面向大模型训练和推理的算力基础设施,自有临港AIDC峰值算力9400P,是亚洲最大的AIDC之一。此外,公司24年转向代运营轻资产战略,我们认为将有效帮助扭亏。截至24年8月,公司纳管算力20exaFLOPS,并预计24年底达25exaFLOPS。公司AIDC服务能力受到客户认可,在2H23中国GenAIIaaS服务市场份额15.4%(第三)。IDC预测未来五年GenAIIaaS市场将以79.8%...

查看详情
相关报告
我来回答