2023年科大讯飞跟踪报告 发布1+N星火大模型

  • 来源:中信证券
  • 发布时间:2023/06/09
  • 浏览次数:1513
  • 举报
相关深度报告REPORTS

科大讯飞(002230)跟踪报告:大模型国家队,AI应用场景未来可期.pdf

科大讯飞(002230)跟踪报告:大模型国家队,AI应用场景未来可期。公司推出“1+N”星火大模型,对标海外ChatGPT。GPT引领AIGC技术革命,国内科技巨头纷纷加码布局,技术升级和商业化进程不断加速。作为国内领先的AI企业,公司于5月6日发布了“1+N”星火认知大模型。我们看好公司在认知大模型的源头核心技术储备,算法方面,公司拥有核心技术储备,打造国内算法+大模型第一梯队;算力方面,公司围绕自主可控人工智能算力平台展开建设,核心技术底座自主可控;数据方面,公司具备场景数据优势,专业领域稀缺数据构成核心竞争力。作为人工智能“国家...

科大讯飞推出“1+N”星火大模型,对标海外 ChatGPT

大模型激发 AIGC 能力涌现,国内巨头纷纷加码布局

ChatGPT 是自然语言处理(NLP)下的 AI 大模型,通过大算力、大规模训练数据突 破 AI 瓶颈。2022 年 11 月,OpenAI 推出 ChatGPT,ChatGPT 基于 GPT-3.5,使用人类 反馈强化学习技术,将人类偏好作为奖励信号并微调模型,实现有逻辑的对话能力。 ChatGPT 本质上是通过超大的统计语言模型对词语序列的概率分布进行建模,利用上下文 信息预测后续词语出现的概率分布,其超预期的表现反映了在算力水平提升的情况下大语 言模型技术路线的成功,通过对大规模的未标注的文本数据进行训练,突破了 AI 发展的技 术瓶颈。 GPT 引领 AIGC 技术革命,通用人工智能(AGI)带来无限可能。通用人工智能即用 一个模型解决大多数的问题,模型可以具备或超越人类智力的水平,如此才能真正做到降 低人工智能的成本。2023 年 3 月 15 日,OpenAI 发布 GPT-4,在 GPT-3.5 的基础上进一 步提高文本输入上限和答案准确度。GPT-4 的另一个重要突破在于支持从图片格式到文本 的多模态,在 GPT-3.5 将模型准确率进一步提升的前提下,继续扩大参数量提高准确性的 边际收益开始下降。产业界开始关注图片、语音、视频等多模态输入及输出的可能性。支 持多模态也意味着模型本身泛化能力的进一步提升,是迈向通用人工智能的重要一步,为 行业带来无限想象空间。

国内科技巨头纷纷加码布局,技术升级和商业化进程不断加速。目前,国外大模型起 步较早,且由于英文的数据质量高、数据易于清洗等因素一直处于领先的状态。出于数据 安全、国产化需求等因素的考虑,国内急需对标海外水平的国产通用大模型。4 月,根据 TechNode 报道,GPT 被爆出大规模封锁亚洲 IP 账号,GPT-4 在支付方式上部分国家的 银行卡支付受限等,均表明在大模型和应用的开源情况并不乐观,国际科技竞争也使得通 用大模型的开放程度受到阻碍。此外,中国具有世界上最大的互联网用户基数,基于英文 数据训练的模型与基于中文数据训练的模型存在较大的差异,中文互联网也需要其独特的基于中文语料的大模型,更好地服务于国内的产业。目前,百度、腾讯、中国科学院、科 大讯飞、字节跳动、阿里等国内厂商均已推出了自己的大模型。

随着大模型技术的持续演进,未来 AI 大模型有望成为各层应用的基础能力,赋能各 个行业应用的发展。GPT 基础能力包括文本生成(分析)、代码生成、对话交互、机器翻 译、图像生成、视频生成等,借此赋能通用与垂直领域应用,有望带来商业模式的重塑与 变革。结合 ChatGPT 现有应用场景,以及对 GPT 未来模型演变的展望,我们归纳出 GPT 的基础能力,具体包括:文本生成(分析)、代码生成、对话交互、机器翻译、图像生成、 视频生成等。我们认为,这些基础能力将支撑 GPT 在通用与垂直领域的应用,新的应用 领域的出现也将基于这些能力的组合。例如,在办公软件领域,行业应用主要涉及 GPT 的文本能力;在教育领域,GPT 主要应用到文本、对话、翻译能力。

发布“1+N”星火大模型,打造自主可控的大模型国家队

面对海外龙头 GPT 技术快速迭代,公司坚持“顶天立地”战略,持续加强投入研发 底座自主可控和国产化适配,布局“1+N”认知大模型。“十四五”开年之际,公司在原有 AI1.0 战略的基础上,提出了全新的 AI2.0 发展战略。面对海内外 GPT 技术的快速迭代, 公司在大模型布局上步步紧跟。继 2022 年 12 月宣布启动“1+N”大模型攻关后,公司于 今年 5 月 6 日正式发布推出“1+N”星火认知大模型。公司“1+N”布局具体包括 1 个通 用认知智能大模型算法研发及高效训练底座平台,以及应用于教育、医疗、人机交互、办 公等多个行业领域的专用大模型版本。

算法方面,公司拥有核心技术储备,打造国内算法+大模型第一梯队。目前,公司已 开源的通用领域中文预训练模型,相关模型库月均调用量超 1000 万;同时,公司承建了 认知智能国家重点实验室,实验室立项开放课题超过 50 个,充分展现认知智能研发技术 的领先优势;此外,公司还拥有国家新一代人工智能开放创新平台、语音及语言处理国家 工程研究中心,依托三大平台,公司拥有充足算法研发技术领先产出。算法层面,公司在 Transformer 深度神经网络算法方面拥有丰富经验,产品已应用于公司的语音识别、图文识别、机器翻译等任务并达到国际领先水平,2022 年公司在语音、图像和认知智能领域 国际高水平技术测评中收获 16 项冠军。在 AI 预训练模型方面,公司已面向认知智能领域 陆续开源了 6 大类、超过 40 个通用领域的系列中文预训练语言模型,成为业界最广泛 流行的中文预训练模型系列之一。此外,公司创新提出了知识与大模型融合统一的理解框 架 X-Reasoner,有望弥补大模型的模糊记忆技术短板。

算力方面,公司围绕自主可控人工智能算力平台展开建设,核心技术底座自主可控。 从产业发展趋势来看,算力将成为关键的竞争资源。公司在总部自建有业界一流的 AI 数据 中心,同时拥有 4 城 7 中心的深度学习计算平台,为大模型训练平台建设奠定硬件基础。 此外,在工程技术方面公司实现了百亿参数大模型推理效率的近千倍加速,为未来更大更 多认知智能大模型技术经济实惠规模化应用提供了可能。目前,公司的训练、推理在国产 平台上的方案已跑通成型,国产化平台也已常态化应用于公司的 AI 算法研发,基于国产 AI 芯片的国产软硬件适配取得新进展,实现核心技术底座自主可控。

数据方面,公司具备场景数据优势,专业领域稀缺数据构成核心竞争力。公司深耕医 疗、教育、办公、企业服务、智慧城市等专业领域,这些领域的数据是稀缺资源,核心场 景数据的掌握有利于在通用大模型的基础上打造垂直领域的优势分支。根据公司的年报数 据,截至 2022 年年末,公司开放平台已经已开放 559 项 AI 能力及场景解决方案,聚集 398.1 万开发者团队,总应用数达 164.6 万,链接超过 500 万生态合作伙伴。医疗领域, 公司“智医助理”系统早在 2017 年已通过国家执业医师资格考试综合笔试测试,正确率 76%。目前“智医助理”作为全科医生助手已可以诊断 1200 多种常见病,累计提供 5.5 亿次 AI 辅诊建议;教育领域,根据地业务推广,基于 G、B 端产生了丰富的数据资源;语 音业务方面,公司 2019 年已进入语音识别技术生产成熟期,已能在行业场景中获得海量 真实数据。未来,数据量积累的差距也将进一步抬高公司技术壁垒。

打造通用认知智能测评体系,引领模型测评规范化。围绕通用人工智能 7个重要方向, 公司与中科大共建认知智能重点实验室牵头设计整套细化测试方法和基本模块方向,并联 合中国科学院人工智能产学院创新联盟以及长三角人工智能产业链联盟共同探讨形成了 覆盖 7 大类一共 481 个细分的任务类型,对大模型能力规范给出具体评价标准。具体包括文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力以及多模态能力 7 个 方面。

作为人工智能“国家队”,公司担任大模型工作组副组长单位,参与大模型标准体系 建设。5 月 31 日,在杭州通用人工智能论坛暨 AIIA 人工智能产业发展大会上,公司被授 予人工智能关键技术和应用评测工业和信息化部重点实验室大模型工作组的副组长单位, 参编中国信通院大模型标准体系 2.0 的建设,具体参编《大规模预训练模型技术和应用评 估方法 第 4 部分:模型应用》,推动国产大模型产业发展。 提出大模型能力发展规划,下半年计划推出超越当前 ChatGPT 中文能力的语言模型。 根据公司星火认知大模型发布会的介绍,讯飞星火认知大模型在年内还将有三个关键里程 碑节点,其中 6 月 9 日,将突破开放式问答、多轮对话能力明显提升、数学能力再升级; 8 月 15 日,代码能力升级以及多模态交互能力提升,希望能帮助到更多的合作伙伴及开发 者团队;10 月 24 日,将实现通用模型对标 ChatGPT,中文能力超越 ChatGPT 的当前版 本,英文能做到相当水平,并在教育、医疗等领域做到业界领先。

星火大模型落地多应用场景实现闭环,赋能开放平台共建生态

伴随星火大模型的推出,对现有讯飞产品的应用成效将很快提升,重点体现在人机交 互体验、内容生成及批改辅导等产品功能和个性化服务三个方面。根据公司在 2022 年年 报业绩说明会上的介绍,在公司核心的教育、医疗等场景中,认知大模型会率先深度应用。 该技术对现有讯飞产品的应用成效将很快提升,特别是在以下三个方面:1)人机交互上, 无论是在车载交互、客服系统、智慧家庭等方面,语义理解对交互的影响将大幅度降低, 交付效果将显著提升。2)内容生成、批改辅导等方面,例如英语听说教学、学习机、办 公系列产品等,都将受益于该技术。3)个性化服务和精准服务,例如因材施教、医疗慢 病管理、辅诊等方面,个性化的精准服务将显著提高产品品质。

在 5 月 6 日讯飞星火认知大模型发布时,公司也发布了落地教育、办公、汽车、数字 员工四大行业应用成果,实现商业模式闭环。 “大模型+AI 学习机”,旨在实现让 AI 像老师一样批改作文,像口语老师一样实景对 话。根据公司在大模型发布会上的介绍,中英文作文批改和英语口语学习是学生平时学习 两大难点,集成了星火认知大模型后,讯飞 AI 学习机可实现中英文作文类人批改,围绕写 作要求、分析全篇结构和文采,像老师一样层层批改点评,它还可以实现写作思路启发, 利用 AI 润色技术生成片段优化参考和写作建议提升,让孩子在启发中精准提升。 在口语对话方面,讯飞 AI 学习机精通中英双语,不仅发音纯正、表达地道,孩子直接 说中文也能翻译成英文并教孩子朗读,还能对孩子的发音进行评分。陪伴式对话练习,让 孩子更愿意开口说,提升口语表达能力。

“大模型+智能办公本”,根据手写要点自动生成会议纪要,助力办公效能进一步提升。 依托于星火认知大模型,讯飞智能办公本升级了语篇规整及会议纪要能力。根据公司的介 绍,在语篇规整方面,讯飞智能办公本可以去除语音转写文稿中的口语化词汇、过滤冗余 词汇,对文本进行润色等,轻松将一篇语音转写文稿规整成书面化内容,阅读效率提升 50%。在会议纪要方面,将语音实时转写与墨水屏纸感书写相结合,并且可以对会议记录内容形 成一份精简的会议纪要,有助于快速回溯会议内容。 “大模型+智能座舱”,实现车内跨业务、跨场景人车自由交流。大模型将重塑汽车人 机交互,智能座舱提供多轮、多人、多区域、多模态智能汽车人机交互范式,人机交互体 验跃升。 “大模型+RPA”,基于自然语言生成业务流程和 RPA,帮助企业员工完成大量重复性 工作。智能 RPA 平台具备快速学习行业的业务流程、软件界面的功能布局和元素、流程 场景的代码规范等多模态知识的能力,通过自然语言交互生成机器人,实现端到端的智能 自动化。

未来,讯飞星火认知大模型还将赋能包括医疗、城市、政法、工业等在内的更多行业, 向更广阔的产业领域延伸。根据公司最新的公告,6 月 9 日讯飞星火认知大模型升级发布 会上,星火认知大模型在学习、医疗、工业、办公等领域进一步的商业落地成果亦将同步 发布,包括: 1)星火语伴 APP:大模型赋能的 AI 口语助手,实现 1 对 1 口语陪练和随身翻译; 2)星火认知大模型+医疗诊后管理平台:大模型赋能更人性化、个性化的医疗全流程 管理,将专业的诊后管理和康复指导延伸到院外; 3)星火认知大模型+工业互联网平台:大模型赋能的工业互联网平台,实现企业产、 供、销、服、管等各流程的知识学习与 AI 赋能,有效助力企业降本增效; 4)星火认知大模型+讯飞听见智慧屏产品:大模型赋能的会议室超级智能终端,AI 淬 炼会议内容,自动生成待办事项,提升企业办公效率。

与此同时,公司还会将大模型的能力开放给开发者团队,共建 AI 生态。未来,公司 计划把原有 560 项能力通过大模型加持,一方面使得认知智能更加通用,另外一方面更好 整合赋能开发者。此外,公司还有 AI 星火营生态计划,目前讯飞已经有 400 万+实名认证 开发者,500 万+合作伙伴,大模型能够极大降低创业者门槛,促进讯飞生态体系繁荣。 同时,公司也会开放插件,帮助提升大模型插件能力。

AI+教育:大模型应用核心场景,学习机率先实现突 破

GPT 催化启发式、个性化教学,公司建立 AI+教育闭环生态

GPT 有望催化“启发式”教学模式,加快教育领域的个性化、多样化变革探索。 ChatGPT 可以理解为一名“全能教师”,即便是小众、冷门的领域,也能够给出相对有逻 辑的回答。我们认为,GPT 技术将催化“启发式”教学模式,引导学生更加积极主动地进 行思考、发问,并与“全能教师”进行对话探讨,这有别于传统的应试教学模式。

海外众多教育企业开始接入 GPT,引领 AI 教育新变革。根据解决的问题以及面向的 服务对象,AI+教育领域可以分为面向学生、面向教师教学,以及面向学校教学管理等三 类产品与服务。大模型的出现则给 AI 赋能教育带来了全面升级,传统教育难以解决的个性 化学习、因材施教、评价方式单一等问题得到了良好的解决。目前海外已经有诸多教育领 域的玩家宣布拥抱大模型,引领 AI 教育新变革。 专注于数学、英语词汇以及医学考试的学习平台 Quizlet 于 2023 年 3 月宣布推出世界 首款利用 ChatGPT 构建的 AI 教学辅导工具 Q-Chat,学生可以通过和专属 AI 进行多轮对 话,学习包括语言、历史在内的多种学科。

世界领先级语言学习平台多邻国(Duolingo)于 2021 年开始使用 GPT-3 进行 DET 英语测试中的自动项目生成服务;2023 年 3 月 14 日,多邻国宣布在其进阶订阅服务 Super Duolingo 的基础上推出 Duolingo Max 服务,该服务接入 GPT-4,面向 ios 客户端英语、 西班牙语、法语用户提供 AI 辅助学习功能解释答案和角色扮演。

世界知名公开课平台可汗学院于 2023 年 3 月 14 日宣布推出基于 GPT-4 的服务 Khanmigo,主要应用于课堂作业辅助教学场景中。学生可以访问 Khanmingo 并向其提问, 但 Khanmigo 并不会直接将答案告诉用户,而是通过多轮问答、引导与启发的方式帮助学 生掌握问题;同时 khanmigo 面向教师提供教案编写功能,帮助提高教师教学任务、管理 学生的效率。

公司在教育行业投入多年,AI+教育成为讯飞最核心赛道。AI 教育核心在于个性化学 习,AI 赋能是实现个性化教学的关键。在人工智能领域的博弈中,智慧教育成为讯飞最核 心的赛道。公司在认知智能领域具备长期深厚积累,在教育领域,依托“人工智能助力教 育,因材施教成就梦想”理念指导,面向国家重大教育命题,通过人工智能核心技术加教 育教学场景深度融合应用,为学生、教师以及各级教育管理者提供精准便捷的服务,实现教与学过程中的数据积累,帮助师生减负增效,促进教育进步。目前,公司智慧教育产品 体系覆盖了校园、考试、教学及学习等环节,面向政府、学校、学生和家长等用户。

公司的教育产品已经形成了 G/B/C 三类客户业务体系的产业生态闭环,具有极高的用 户粘性。G 端业务主要以市县区等区域建设为主体,涵盖面向区域内各类学校及用户的因 材施教整体解决方案等;B 端业务主要以学校建设为主体,包括面向学校的智慧课堂、大 数据精准教学、英语听说课堂、智慧作业等;C 端业务主要以家长用户群自主购买为主, 包括 AI 学习机、个性化学习手册、课后服务课程服务等产品。

G 端以区域“因材施教”解决方案为核心,异地复制持续落地。目前,公司区域“因 材施教”解决方案已累计在 50 多个市、区(县)级应用,有效辅助师生减负增效,已产 生可以用统计数据证明的应用成效。上述“因材施教解决方案”规模化的实施和应用,借 助信息化提升区域教学管理精细化水平,借助智能助教帮助教师减轻批改、常规备课负担: 构建以生为本的学情画像,提升教学精准性,实现以学定教,帮助学生实现个性化学习, 告别题海战术。通过常态化和规模化应用,有效促进了区域教学质量提升。

B 端以智慧课堂作为产品化突破重点,持续打磨体系化竞争力。目前,公司畅言智慧 课堂凭借其先发优势、技术领先,相比行业其他产品有更大的覆盖学校用户基础、更加完 整领先的产品方案。教育云平台助力智慧课堂高效运行,实现内容和数据积累。智慧校园 打通智慧课堂与智能考试、智慧学习、智慧管理和智慧环境等场景的联系,为个性化学习 保驾护航。作为学生过程化学习数据的主要源头,智慧考试为智慧课堂启动带来强大动力。 在聚焦校园主阵地建设同时,公司持续深化教学主场景应用,从助力因材施教到助推“五 育”并举,发布了智慧心育、智慧体育综合解决方案。伴随“双减”政策回归学校主阵地, 开拓了课后服务的增量市场。

C 端以个性化学习手册为首要发力点,学习机带来新增量。个性化学习手册在其长期 深度应用的示范区、示范校,持续助力校、师、生、家聚焦学业水平、促进素养提升。此 外,面向职教高考需求延伸至中职教育市场,已在部分省市形成应用示范。公司 AI 学习 机自上市以来,得到用户和行业的高度认可。在竞争激烈的学习机行业中,科大讯飞 AI 学 习机市场份额和品牌知名度持续提升,用户净推荐值 NPS 持续保持行业第一。

学习机率先上线星火大模型,未来有望快速增长

AI 学习机成为公司星火大模型在教育领域率先落地的产品,实现中英文作文批改和口 语对话两大功能。语言场景存在两个困难任务,分别为作文能力提升和口语提升,传统教 师批改费时费力,星火大模型成功应用于此类场景,并能够自动生成打分、评语和范文, 给出优化参考。大模型的应用突破将在 AI 学习机的中英文作文辅导、中英文口语学习等方 面带来显著提升。 语文作文场景中,AI 学习机能够提供错别字、语句不通、内容评价等细分类别的识别, 并针对特定句段进行标注。在识别学生错误的同时也能够提供知识卡片,帮助学生进行知 识拓展。英语场景中,讯飞学习机能够给出词汇、拼写、语法问题,并能够给出句型结构 分析,同时结合讯飞原有 OCR 识别技术,实现对手写作文一键式批改;口语听说能力方 面覆盖中小学大纲主要情景和话题,并能够根据要求进行开放式问答。目前星火大模型已 经在 T20 和 T20 Pro 学习机产品进行部署。

2021 年我国学习平板出货量约 470 万台,与当前 K12 学生数量相比,渗透率较低。 根据 IDC 数据,2021 年我国学习平板出货量为 470 万台,同比增长 7.2%。根据教育部的 数据,2021 年全国 K12 学生数量约 1.97 亿,当前学习机的渗透率较低。与此同时,读书 郎教育招股说明书转引 Frost&Sullivan 的数据显示,2020 年我国学习机市场规模达到 145 亿元,同比增长 19.0%,预计 2025 年我国学习机市场规模将达到 254 亿元。

科大讯飞、百度等新兴玩家出货量超越传统学习机厂商,份额有望持续提升。根据 IDC 的数据,2021Q4-2022Q2 前三大学习机厂商小度、步步高、科大讯飞出货市场份额超过 一半,其中,科大讯飞、小度(百度旗下 AI 品牌)作为人工智能领军企业,分别于 2019 年、2021 年推出智能学习机产品,发挥 AI 技术优势快速开拓市场规模。2022 年 618 购 物节时,科大讯飞 AI 学习产品斩获京东平台学习机品类累计销售额冠军,天猫平台学习机 品类 6.18 单日销售额冠军。

大模型赋能学习机有望转变角色,推动市场空间提升,讯飞学习机业务有望实现快速 增长。在传统教育情境下,学习机充当教辅工具,仅帮助学生对课堂中授课内容进行巩固, 无法代替传统教师角色;在星火大模型的赋能下,讯飞 AI 学习机不仅能够实现对课中内容 的查漏补缺,更能够对学生的更多问题进行解答并实现知识拓展,充当 AI 教师的角色。 AI 教师角色填补了学生在课余无法及时与教师互动的不便,同时在基于课程内知识“因材 施教”的同时,结合学生关注重点,进一步提升学习效果,原有市场需求也将得到进一步 挖掘。我们预计,伴随大模型赋能学习机的效果逐步显现,整体市场需求有望提升,讯飞 学习机业务规模将迎来快速增长。

AI+消费者:技术迭代满足多场景需求,AI 赋能或打 破硬件边界

海外 GPT+C 端商业化快速发展,公司消费者产品持续打磨迭代

ChatGPT 迅速走红,以订阅制服务 C 端用户,成本控制下将有效加速商业化落地。 自 2022 年 11 月 ChatGPT 发布以来,微软迅速推进其商业化进程:2023 年 2 月 2 日推 出由 ChatGPT 支持的高端 Teams 消息服务——Teams plus,月费 7 美元(7 月将涨价至 10 美元);2 月 7 日宣布在旗下 Bing 搜索引擎和 Edge 浏览器中嵌入 ChatGPT 聊天机器 人,开启搜索引擎新时代;3 月 17 日,在 GPT-4 发布后仅两天时间,重磅推出 Microsoft 365 Copilot,将 GPT-4 嵌入 office 全家桶中,能够自动为用户生成文稿、PPT、Excel 等。 除了微软一连串的大动作,海外多家企业也都在尝试将 GPT 等技术嵌入其 C 端产品或服 务中,相关应用正加速落地。

公司立足办公+生活两大场景,消费者产品布局不断完善。自 2016 年成立消费者事业 群以来,公司 To C 产品不断推陈出新,致力于满足消费者多样化的产品需求。在办公场 景下,公司推出智能办公本、智能录音笔、讯飞听见智慧办公服务平台等多款智慧办公设 备及智能化的软硬件一体解决方案,用 AI 辅助会议纪要出稿、录音转文字、翻译、音视频 内容生产等工作,打破办公效率瓶颈。在生活场景下,公司推出面向消费者的翻译机、智 能无线麦克风、智能助听器、电子阅读器等智慧硬件,以及讯飞有声、讯飞词曲+、讯飞 AI 电视助手等软件应用或服务平台,让跨语言、跨地区的沟通不再有边界,让人工智能技 术惠及生活的每一个角落。

坚持“科技+人文+设计”理念,C 端产品技术逐年创新迭代。以 C 端明星产品翻译 机为例,讯飞 2016 年推出第一款 C 端产品——讯飞晓译翻译机,开启了 AI 翻译机时代, 此后历经六载,翻译机已经迭代至 4.0 版本,功能及品质都有了质的飞跃。2022 年 8 月公 司全新发布的翻译机 4.0 支持 83 种语言在线翻译,16 种语言离线翻译,32 种语言拍照翻 译。针对金融、医疗、司法、体育等 16 个主流行业,讯飞额外定制了 6000 万句对的专业 语料,囊括了超过 120 万个行业术语,推出行业翻译版本。翻译机 4.0 在软硬件上也有革 新,面向日常跨语言场景,搭载高精度传感器,能够通过检测使用者手持机器的姿势变化 进行自动收音、识别和翻译,并且加入双语自动识别,省去了按键操作,真正实现“拿起 说,放下译”,提高面对面跨语种交流时的沟通效率。

除翻译机之外,公司同时潜心打磨其他 To C 产品,每年技术进步保持在 30%的水平 上。2022 年推出的智能办公本 Air 语音实时转写准确率可达 98%,获“金芦苇”工业设计 金奖;智能无线麦克风 C1 具备智能降噪、一站式后期字幕制作功能;讯飞智能录音笔企 业标准 Q/XF C002-2022《讯飞智能录音笔》获得 2022 年度由中国标准化研究院和工信 部电子四所所辖权威评估机构深圳赛西信息技术有限公司联合认定的企业标准"领跑者"荣 誉称号,成为首批登榜企业;根据公司微信公众号介绍,智能录音笔 SR502 能识别多国 语言、多种方言和民族语,在线和离线状态都能实现语音转文字,1 小时录音约 5 分钟就 能出稿,在办公或学习场景下都能高效满足用户的语音、文字、图像采集与处理等需求。

星火大模型打破智能硬件性能边界,未来将融合多款 C 端产品落地

星火大模型赋能智能办公本 X2 和讯飞听见会写两大 C 端产品率先落地,多项性能大 幅提升。 讯飞智能办公本 X2 是行业内首个融合大模型技术的智能办公硬件,在本轮认知大模 型的深度赋能下,主要升级了会议纪要和语篇规整两大功能:1)会议纪要能力:录音转 会议纪要的速度和准确度进一步提高,新增语音转写的离线模式以提高安全性,实现字音 同步匹配以帮助用户快速匹配回溯。2)语言规整能力:根据公司微信公众号,讯飞智能 办公本 X2 在保持 96%以上原文忠实度的情况下,将文章篇幅缩短 20%-40%,将口语化 的文稿进行提炼和润色,有效提升文本可读性,提高办公效率。在刚刚开始的 2023 年 618 大促中,大模型带来的商业化效果已经开始显现,讯飞智能办公本系列在京东、天猫、抖 音三大平台同时获得电纸书类目开门红销售额冠军。

“讯飞听见会写”搭载星火认知大模型,升级会议纪要、语篇规整、一键成稿三大功 能,结合“讯飞听见智慧屏畅享版”上市。“讯飞听见会写”是首批搭载星火大模型的另一款 智能 C 端产品,在会议纪要、语篇规整、一键成稿三大能力上进行了升级。在语音转文字 的基础上,讯飞听见会写进一步利用 AI 技术进行文本分析,用户可选择品宣文案、新闻稿 件、工作总结、工作计划和工作代办五种文稿类型,实现一键出稿。除此之外,受益于大 模型优秀的逻辑推理、语言理解和文本生成能力,讯飞听见会写能够抓取文本关键信息, 迅速生成简明扼要的全文摘要。在 5 月 10 日开幕的第三届 BEYOND 国际科技创新博览会 上,“讯飞听见·会写”获得“消费科技创新大奖”。同时,公司正式宣布上市新款 AI 硬件 产品——“讯飞听见智慧屏畅享版”,搭载 “讯飞听见·会写”,定位一款“会记录的智慧 屏”,升级了白板书写、原生云会议、无线投屏三大功能,并在外源影音实时转译、多语 种翻译、声纹角色分离、多应用协作四大性能上进行创新。

星火大模型有望打破智能硬件性能边界,让产品从“能听会说”提升到“能理解会思 考”,未来有望进一步推动公司 C 端产品升级迭代。具体来说,我们认为星火大模型的应 用未来将至少从以下几方面提升 C 端产品性能: 1)提高人机交互性。借助大语言模型的自然语言理解能力,用户能与 AI 进行多轮对话,用自然语言提出问题,并且能够得到更加具有创造性、更富人类色彩的回答,使讯飞 听见、讯飞文档等 C 端软件产品更加便捷化、人性化。同时,大模型也能显著提升麦克风、 录音笔等智能硬件的后端理解能力,进一步提高人机交互性。 2)实现多模态信息输入。参考海外 GPT 的迭代过程,GPT-3 只能接受文本信息输入, 而 GPT-4 不仅将文本处理容量提升至 25000 字,是 ChatGPT 的 8 倍,还能支持语音、图 像等多维度信息输入。未来公司 C 端产品有望实现多模态信息输入。 参考海外微软等公司的 GPT 商业化进程,伴随着星火大模型技术的持续演进,讯飞 AI+消费者应用前景广阔,有望迅速实现商业化落地,推动公司业绩增长。

AI+医疗、政法:大模型落地契合场景,储备新增长 机遇

医疗和法律是大模型落地契合的场景,海外巨头正积极布局

在 GPT 之前,AI+医疗的应用主要体现在图像分割、影像分析、机器翻译、病理细胞 分析等领域,侧重于辅助。根据微软联合 OpenAI 发表的论文,GPT-4 具备变革医疗行业 的长期潜力,我们认为 GPT 的潜在应用场景丰富,覆盖诊前、诊中、诊后全流程,AI 技 术引入医疗行业有助于各医疗环节的提质增效。目前,海外科技巨头谷歌、微软等都在布 局“AI+医疗”领域,相关产品正快速涌现。未来,“大模型+医疗”场景的效果值得期待。 微软联合 OpenAI 发表论文,GPT-4 具备变革医疗行业的长期潜力。3 月 20 日,微软 联合 OpenAI 发表的论文《Capabilities of GPT-4 on Medical Challenge Problems》显示, GPT-4 在美国医疗资格考试(USMLE)的自我评估和样本考试中分别获得了 86.65%和 86.7%的平均成绩,得分显著高于 GPT-3.5 的 53.61%和 58.78%。USMLE 是一个用于评 估临床能力的三步考试计划,考生正确回答约 60%即达到及格门槛,该项实验展现了 GPT-4 及其后续模型变革医疗领域的长期潜力。

“GPT+医疗”应用场景丰富,覆盖诊前、诊中、诊后全流程,实现提质增效。GPT 等人工智能技术在医疗垂直领域的应用场景广泛覆盖了诊前、诊中及诊后全医疗流程,可 应用于健康评估、智能导诊、医学图像识别、辅助诊断、病历生成、患者跟踪回访、药品 研发、手术指引等方面。AI 技术引入医疗行业有助于各个医疗环节的提质增效,如减轻就 医导诊压力,大幅减少医护人员的重复工作,提高问诊效率和诊断准确度,提升患者就医 体验等。

全球多家企业布局“AI+医疗”领域,相关产品正快速涌现。2022 年年底,谷歌发布 第一代医疗 AI 模型 Med-PaLM。Med-PaLM 是首个在类似美国医疗资格考试(USMLE) 中及格的 AI 模型(正确率 67.2%),其关于医疗问题的回答在绝大多数评估指标上都通过 了人类临床医生的评审。3 月 14 日谷歌在年度健康活动“The Check Up”上表示,新一 代模型 Med-PaLM2 在医学考试中达到了 85.4%的正确率,具备医学“专家”水平,表现 显著优于其他语言模型。当地时间 3 月 20 日,距离 GPT-4 发布不到一周,微软旗下语音 识别子公司 Nuance Communications 发布了 AI 临床笔记软件 Dragon Ambient eXperience(DAX™)Express(简称“DAX Express”),是医疗领域第一款结合 GPT-4 的应用,根据官网介绍,该产品几秒钟就能够帮医生自动书写临床电子病历。

与此同时,生成式 AI 将推动“AI+法律”场景的落地。ChatGPT 等人工智能工具在提 供法律援助、法条检索、自动化生成法律文件、辅助分析案情、预测司法结果和风险等方 面有着广阔的应用空间,能够大幅提高法务人员的工作效率和办案准确度。目前,全球多 家提供法律服务的公司或团队开始尝试将 GPT 等技术融入日常法务工作。 生成式 AI 在法律行业应用前景广阔,有望大幅提升行业效率。凭借着强大的逻辑推理、 学习和文本生成能力,生成式 AI 技术在法律行业同样有着变革行业的强大影响力。 ChatGPT 等人工智能工具在提供法律援助、法条检索、自动化生成法律文件、辅助分析案 情、预测司法结果和风险等方面有着广阔的应用空间,能够大幅提高法务人员的工作效率 和办案准确度。

目前,海外多家企业开始使用 ChatGPT 辅助法务工作,并进入司法系统产生法律效 力。自 ChatGPT 问世以来,全球多家提供法律服务的公司或团队开始尝试将 GPT 等技术 融入日常法务工作。根据 Vice News 报道, 1 月 30 日,哥伦比亚法院使用 ChatGPT 辅 助审判了一起关于患自闭症谱系障碍(ASD)儿童的医疗权利问题的案件,ChatGPT 给 出了和法官一致的裁决,标志着 ChatGPT 首次正式进入司法系统并产生法律效力。根据 普华永道官网显示,3 月 15 日,普华永道与初创公司 Harvey 签订为期 12 个月的合同, 为其来自 100 多个国家的 4000 名律师引入基于 GPT-4 的人工智能聊天机器人,以提升工 作效率。伦敦 Allen & Overy 律所也同样宣布使用 Harvey 的聊天机器人帮助律师起草合同 和客户备忘录。

讯飞医疗构建“一体两翼”体系,产品覆盖全医疗场景

讯飞医疗构建“一体两翼”技术框架体系,以医学知识自学习为底座,诊疗推理和健 康交互为两翼。公司从 2016 年开始切入医疗业务,坚持“用人工智能服务健康中国”的 理念,提出构建医疗 AI“一体两翼”技术框架体系:“一体”代表以医学知识自学习为基 础底座,让 AI 技术赋能医学知识表示、医学文本结构化、医学知识挖掘和更新;“两翼” 代表该体系以诊疗推理和健康交互为两翼,通过诊断推理、治疗推荐、健康评估、风险预 测等相关技术研发,致力于让 AI 成为每个医生的诊疗助手,通过语音识别、多模态深度理 解、多轮交互、个性化主题干预等相关技术研发,致力于让 AI 成为每个人的健康助手。

讯飞医疗相关产品及解决方案覆盖五大智慧医疗领域,应用程度不断加深。讯飞医疗 将 AI 技术与智慧医疗建设深度融合,提供涵盖智慧卫生、智慧医院、智能硬件、智慧医保、 智慧影联五大领域,覆盖诊前、诊中、诊后全医疗场景的产品解决方案,构建了包括智联 网医疗平台、智医助理、智慧医院等业务方向在内的人工智能医疗产品体系,并积极向医 保控费、慢性管理等方向延展。公司智慧医疗系列产品及解决方案覆盖范围不断扩大,应用程度不断加深,根据公司微信公众号的数据,截止 2023 年 2 月 28 日,已经覆盖 1600 种疾病、3 万医疗机构,AI 辅诊 5.68 亿次,准确率达 98%,修正诊断有价值病历 66.4 万, 语音外呼累计服务人次 10.49 亿。

G 端“智医助理”实现规模化运营,助力基层医疗水平提升。根据公司公告,2017 年,基于讯飞认知医学技术的“智医助理”机器人参加国家执业医师资格考试笔试并以超 过分数线 96 分的优异成绩通过,超过了 96.3%的人类考生,成为公司培育期的战略性产 品。2022 年,“智医助理”已经实现规模化运营,覆盖全国 380 个区县,有效降低基层医 生误诊漏诊率,降低错误用药风险,提高基层医生问诊水平和服务效率。2022 年,“智医 助理”入选“国家卫健委数字健康示范案例”,在国家卫健委总结“十八大以来卫生健康 信息化工作进展与成效”发布会上成为医疗人工智能唯一应用标杆。

B 端智慧医疗产品成绩斐然,积极向医保、影联方向延伸。根据公司官网数据显示, 在 B 端,目前公司智慧医院产品在解放军 301 医院、北京协和医院、上海交通大学医学 院附属瑞金医院、浙江大学医学院附属第一医院、江苏省人民医院、北大口腔医院、华西 口腔医院等国内顶级医疗机构上线应用,覆盖全国 300 余家三甲医院。智慧医保业务让人 工智能赋能医保基金监管,将监管效能提升三倍以上,已经在山西吕梁、云南普洱等地投 入使用,已服务 117 家定点医疗机构,审核总医疗费用 12.2 亿元,违规预警金额近 1 亿 元。2022 年 3 月,公司“基于全病历的 DRG 分组关键信息监管”方案在国家医保局“智慧 医保解决方案大赛”的“精确医保决策” 赛道获得全国第一。讯飞医疗积极向智慧影联方向 延伸布局,支持安徽省影像云远程医疗平台建设,目标实现全省医院影像检查数据互联互 通,目前已完成远程会诊近 500 万次,联网医院超过 1800 家,合作 386 支会诊团队,2523 名会诊专家。

C 端业务开始发展,推出多款医疗产品。在 C 端,讯飞医疗推出晓医 A.I.助手血压计、 讯飞智能助听器等产品,面向用户提供慢病管理、家庭医生随访等服务。2022 年 12 月, 讯飞联合人民好医生推出《个人防疫手册》语音版,帮助每个人“成为自己健康的第一责 任人”,防疫手册后台访问量已突破 5300 万。

依托良好政策环境和 GPT 技术浪潮,公司希望将 AI 打造成为每个人的健康助手。党 的二十大报告提出“保障人民健康放在优先发展的战略位置”,“提高基层防病治病和健康 管理能力”。2 月 23 日,中办、国办印发《关于进一步深化改革促进乡村医疗卫生体系健 康发展的意见》提出大力推进“互联网医疗健康”,构建乡村远程医疗服务体系,加快推 动人工智能辅助诊断在乡村医疗机构的配置应用。乘政策东风和 GPT 技术浪潮,结合公 司多年来在医疗垂直领域的经验积累,星火大模型赋能后的智医助理已经具备超过 GPT4.0 的医疗能力,未来将进一步结合医学专业知识和相关法规进行迭代,实现打造“每 个医生的 AI 诊疗助理,每个人的 AI 健康助手”。

政策红利+GPT 赋能,讯飞“智慧司法”业务有望加速渗透

我国相关政策法规不断出台,自上而下加速法院信息化建设。近年来,国家出台多项 关于法院信息化和智慧法院的政策法规,为法院数字化转型和智能化升级提供了重要的指 导意见和政策支持。2017 年最高人民法院发布《最高人民法院关于加快建设智慧法院的 意见》,强调加快建设智慧法院,运用大数据和人工智能技术提供精准智能服务,此后我 国智慧法院建设进入高速发展期,在庭审管理、信息化办公、司法公开等多个方面不断实 现更高效、便捷的智能化改造;2019 年,最高人民法院再次出台《最高人民法院办公厅 关于做好 2019 年智慧法院建设工作的通知》,提出按照《人民法院第五个五年改革纲要 (2019 一 2023)》的要求,全面推进智慧法院建设,构建中国特色现代化智慧法院应用体 系;2022 年,关于人工智能应用于司法领域的政策法规再度出台,顶层设计自上而下推 动法院信息化建设,标志着 AI+政法进入政策红利期。

讯飞“智慧司法”业务布局五大方向,下游客户实现快速覆盖。随着法院信息化建设 的不断推进,公司在智慧警务、政法跨部门大数据办案平台、智慧法院、智慧检务、智慧 “视检”五大智慧司法方向不断完善布局,持续推出“AI+政法”产品及解决方案,产品 广泛应用于公安、检察院、法院等各级司法行政机关,覆盖全国 31 个省市自治区,超过 3,000 个政法单位,高院、省检覆盖率均超 90%。

智能庭审系统有效解决庭审效率瓶颈问题,渗透率不断提升,实现审判体系和审判能 力现代化。公司面向智慧法院领域开发的智能庭审系统利用成熟的人工智能语音识别技术、 同步录音音像和区块链技术,建立法律领域专用语言模型,有效识别庭审过程中多语种多 方言的法言法语,实现自动播报庭审纪律,自动生成、回听及检索庭审笔录等功能,大幅 提高庭审效率。根据智慧法院进行时微信公众号,目前,讯飞智能庭审系统已经辅助书记 员生成 600 余万份庭审笔录,平均提升庭审效率 30%,复杂庭审时间可缩短超过 50%, 系统平均使用率达 75%以上,应用成熟地区使用率达 90%,如苏州中院庭审使用率约为 92%,其下辖的虎丘法院、吴江法院庭审使用率已基本达到 100%。2020 年 12 月,讯飞 协助编制了《法院语音云平台建设及接入规范》,整合全国法院智能语音能力建设,收集 训练各地语料,不断训练优化方言模型和案例模型,目前已支持 28 中方言口音以及粤语、 四川话等纯方言的识别,标准普通话识别准确率可达 98%。

刑事案件辅助办案系统利用 AI 技术辅助刑事办案各个环节,有效保障司法公正性。公 司研发出全球首个刑事案件辅助办案系统,将自然语言理解、图像识别、语音识别等人工 智能技术融侦查、批捕、审查起诉到审判等各个刑事办案环节,实现统一证据标准、指引 证据规则、校验证据真实性、分析证据链是否自相矛盾以及把关、监督刑事办案全过程等 功能,有效保障司法公正性,防止冤假错案发生。2018 年 3 月,智能辅助办案系统开始 在上海市全面应用并首次实现庭审实质化,截至目前已经完成了 102 个常见刑事案件罪名 的证据标准制定工作,在安徽、吉林、广东、云南、福建、贵州和新疆等地成功应用。

对标海外,GPT 等人工智能技术有望助力讯飞“智慧司法”业务再升级。未来,随着 GPT 等人工智能技术的不断发展和应用,借助生成式 AI 强大的自然语言理解、文本生成 和逻辑推演能力,讯飞“智慧司法”业务有望进一步拓展,对标海外 GPT 等技术在法律领域 的落地应用,在法言法语识别、法律文本生成、辅助司法决策、案情推理分析等方面持续 加强技术创新和产品迭代,用人工智能技术推动“平安中国”、“法治中国”建设,推动司 法体系深化改革进程。


(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

相关报告
评论
  • 相关文档
  • 相关文章
  • 最新文档
  • 最新精读
分享至