商汤在AI领域有哪些布局?

商汤在AI领域有哪些布局?

最佳答案 匿名用户编辑于2024/03/11 16:33

基于大装置 的能力,商汤目前已构建了计算机视觉、自然语言处理、AI 内容生成、多模态、决策智能 等多个领域的大模型。

1.商量大语言模型赋能专业知识、医疗、编程等领域

商汤目前已基于 AI 大装置,推出了自然语言大模型“商量”、中文医疗语言大模型“商量·大 医”、编程助手“商量·AI 代码助手”三个应用平台,赋能专业知识、医疗、编程等垂类场 景。

1)自然语言大模型“商量”(SenseChat)

自然语言大模型“商量”拥有 1800 亿参数,具备超长文本知识理解、文本生成、内容创作、 多轮问答、逻辑推理等能力。它通过与用户进行多轮互动来解决复杂问题、提供定制化建 议、辅助创作文本,且自带知识自动及时更新模块,从而生成更可信、更准确和更安全的 信息。例如,用户可以通过与“商量”进行对话,让它辅助创作一段广告、一份邀请函,“商 量”也能够接入财务、法律等专业知识领域,对用户上传的专业领域长文本 PDF 进行理解 和对话。

2)中文医疗语言大模型“商量·大医”

中文医疗语言大模型“商量·大医”基于海量医学知识和真实医患互动对话数据打造,它 能够通过多轮对话辅助支持导诊、问诊、健康咨询、辅助决策等多场景,从而持续赋能医 疗领域,提升医院诊疗效率,为患者打造更好的服务体验。据商谈科技展示的案例,“商量·大 医”已落地新华医院,能够担任健康咨询助手,为用户解答熬夜会带来身体变化的原因, 并通过引导给用户提供就医挂号建议。

3)编程助手“商量·AI 代码助手”

编程助手“商量·AI 代码助手”具备代码补全、代码扩写、代码翻译、代码重构、代码修 正、注释生成代码、复杂度分析、测试用例生成等功能,并能支持多语言的中英文编程。“商 量·AI 代码助手”创造了软件开发新范式,改变了代码编写领域原有的二八定律,即 80% 由人工生成,剩下的 20%由 AI 完成,构建了新的二八定律:代码=80%AI 生成+20%人工, 这将有助于用户更高效的编写和调试代码,提升工作效率,简化开发流程。据商汤内部实 测,使用“商量·AI 助手”后,员工编写代码的效率提升 62%,HumanEval 测试集的一次 性通过率达到了 40.2%,数据表现优于 Copliot。 据商汤科技展示的案例,AI 自主编写了代码,通过递归辗转相除法计算出了两个数的最大 公约数,并进一步判断了两个数是否互为质数。

2.配套生成式 AI 应用,驱动垂直场景降本增效

基于 SenseCore 大装置及“商量”大语言模型,商汤科技还推出了“日日新”大模型体系 下的生成式 AI 应用,包括“秒画 SenseMirage”文生图创作平台、“如影 SenseAvatar” AI 数字人视频生成平台、“琼宇 SenseSpace”3D 场景生成平台和“格物 SenseThings” 3D 内容生成平台。

#1“秒画 SenseMirage”文生图创作平台

“秒画 SenseMirage”文生图创作平台融合了超 10 亿参数的商汤自研文生图模型,能够根 据用户提示词生成图片,其具备以下特点:1)推理速度快。秒画由单卡 A100 支持,能够 在 2 秒内生成 1 张 512K 分辨率的图片;2)可自训练。LoRA 小模型搭载在大模型上,用 户可通过自身需求,通过图片实例训练生成大模型没见过的东西,5 分钟内就能定制属于自 己的 LoRA 小模型,使结果更精确;3)提供生成模型开源社区。秒画汇聚了 1 万+开源模 型,能够为创作者提供加速内容生产创作工具的生态平台;4)提供 B 端 API 服务。 根据商汤科技展示的案例,原有的文生图模型难以理解“港风美女”这一提示,而上传 20 张左右的香港明星照片后,对模型进行增量训练,短时间内秒画就可以生成图片。

#2“如影 SenseAvatar”AI 数字人视频生成平台

“如影 SenseAvatar”AI 数字人视频生成平台具备全栈智能创作能力,能够实现 AI 数字人 动作表情生成、AI 文案生成、AI 跨语言文稿生成、AI 素材生成等功能,实现在直播、营销 视频等场景的落地。用户仅需提供一段 5 分钟的真人视频素材,如影就可以生成出来声音 及动作自然、口型准确、多语种精通的数字人分身。 如影具备以下特点:1)风格种类丰富。如影可生成 2D、3D、卡通等数字人形象;2)集成 了文本生成、文生图、实时问答等多种工具。如影可以根据用户的简单提示生成文案,然 后进一步根据文案自动生成数字人视频,并可以依据用户需求提供不同的语言版本。 据商汤科技示例,用户先在大模型中简单描述与故宫联合开发的文创产品,如影就可以生 成一段视频,并配上视频文案。

#3“琼宇 SenseSpace”3D 场景生成平台

“琼宇 SenseSpace”3D 场景生成平台具备城市级大尺度的空间重建生成能力,它能够: 1)快速生成城市级 3D 场景。琼宇可以在 2 天内生成 100 平方公里的场景,缩减原有 10000 人·天的工作量;2)高还原场景细节。琼宇可以厘米级重建精度,还原场景的真实细节和 光照效果,支持实时渲染和互动,例如它可以渲染出墙面的反光、地板的灯光。琼宇 3D 场 景生成平台可应用于影视创作、建筑设计、商品营销、数字孪生管理运营等垂直领域。

#4“格物 SenseThings”3D 内容生成平台

“格物 SenseThings”3D 内容生成平台具备物体的精细化 3D 生成能力,可以还原室内场 景的物体复杂的几何结构、纹理、材质、光泽等信息,做到实时高逼真渲染。传统 3D 建模 具备难点:1)复杂物体建模会牵连到背景;2)有光泽的物体无法分辨材质。但格物系统 能够:1)复刻复杂结构物体;2)精准复刻光照;3)完美还原材质。通过扫描快速建立 3D 物体模型,格物平台综合扫描效率提升了 400%,成本降低了 95%。 格物能够应用于空间的创意设计中,可以做家装、影视作品的嵌入、综艺视频中的物体摆 件等,也可以运用到数字人直播间的 3D 场景选择步骤中。

参考报告

人工智能行业专题研究:从阿里商汤华为大模型看应用趋势.pdf

人工智能行业专题研究:从阿里商汤华为大模型看应用趋势。近期国内大模型频繁发布,如阿里发布大语言模型“通义千问”,商汤推出“商量”,华为的盘古大模型则聚焦AIforIndustry。我们认为,拥有稀缺数据集和版权IP的公司有望首先受益于大模型的普及应用,后续影响同样将延伸到视频/虚拟人、游戏制作等领域。数据集方面,高壁垒的数据集或将受益于大模型的训练;IP版权方面,作为数据训练源头的版权IP将迎来海量需求,行业产能升级也将反哺版权IP创作;视频/虚拟人方面,AI有望提升制作效率降低成本,同时虚拟人的互动性有望增强;游戏方面,大模型可在NPC聊天内容...

查看详情
相关报告
我来回答