2022年自然语言处理行业之拓尔思研究报告 全球专利数增长,NLP成为主要投入方向

  • 来源:中信建投证券
  • 发布时间:2022/08/15
  • 浏览次数:2875
  • 举报
相关深度报告REPORTS

拓尔思(300229)研究报告:“智能语义”领军者的厚积薄发.pdf

拓尔思(300229)研究报告:“智能语义”领军者的厚积薄发。一、公司基本情况介绍;二、自然语言处理(NLP)行业发展现状;三、公司核心竞争力;四、未来主要看点;五、盈利预测、投资建议与风险提示。

1.拓尔思基本情况介绍

1.1 公司发展历史:NLP行业龙头

拓尔思是国内最早从事自然语言处理(NLP)技术研发的企业。NLP是语义智能的核心技术,自2000年起,公司开始从 事自然语言和文本挖掘方面的研究,并在国内推出最早的商业化文本挖掘软件TRS CKM,被国内外数以千计的用户采用。

公司语义智能技术向多个子领域延展并保持领先。目前,公司的语义智能技术还涵盖知识图谱、图像/视频等多媒体内 容深度分析理解等子领域,在智能搜索、知识图谱等领域均处于领先地位。2020年,公司自主研发的新一代基于深度 学习的语义智能技术平台——TRS智拓,获得了国家工业信息安全发展研究中心评定的人工智能优秀产品,目前已在国 家知识产权局机检报告系统、南方电网人工智能平台等项目中应用。

深耕人工智能领域20多年,客户资源丰富。公司的产品和服务已被国内外8000多家机构用户广泛使用,覆盖80%的国家 部委、60%的省市级政府机关、300余家媒体机构、众多大中型企业和科研教育单位。

1.2 三大技术体系共筑强核心竞争力

自主核心技术优势明显。人工智能、大数据和数字安全构成了公司业务底层的技术支撑。

人工智能领域:公司是国内最早从事自然语言处理(NLP)研发的企业之一,在NLP、知识图谱、OCR、图像视频结构化领 域都具备自主可控的底层技术,处于行业领先地位。

大数据领域:公司是最早从事中文全文检索技术研发的企业,具有全球领先的智能检索技术,现已将领先优势拓展到数 据采集、治理、分析挖掘等大数据核心技术的全生命周期,所有底层技术均自主可控。 

数据安全领域:公司子公司天行网安是国内最早从事网络安全和数据交换的企业,发明了国内第一台安全隔离网闸, 在数据视频交换、单向导入等方面具有雄厚的技术实力。

1.3 商业模式:云和数据服务比重不断提升

公司人工智能、大数据软件产品和服务合计收入占比近70%,其中人工智能软件产品和服务收入增长较快,包括安全产 品在内的自主研发的技术产品和服务合计收入占比超过80%,且毛利率均超过70%,具有较高的盈利能力,其余主要为 系统集成和其他收入。 人工智能软件产品和服务收入大幅增长主要是公司基于语义智能技术的产品应用和数据智能服务在金融、制造、能源 等企业客户、公共安全、互联网和传媒等行业的开拓推广收效显著,获得较大规模的销售订单。 公司云和数据服务业务营业收入规模不断扩大,连续多年取得了较高的增长速度,营收占比达36.84%;产品和服务的 SaaS化比例也快速提升。

1.4 财务分析:业绩稳定增长,毛利净利进一步提升

营业收入和归母净利润呈稳定增长态势。2017年-2020年,公司营业收入/净利润分别为8.21/1.58亿元,8.45/0.61亿 元,9.67/1.57亿元,13.09/3.19亿元,CAGR 21%/106%。由于2021年公司营业收入不再包含成都子公司2020年的配套 商业房产项目收入和原控股子公司耐特康赛的互联网营销收入,去除上述影响后,2021年主营业务收入实际较2020年 同期同比增长31.83%,主营业务利润实际同比增长33.28%,增速进一步加快。 新业务进一步提升毛利率和净利率。随着公司在公文写作、风控信息、行业信息推送、专利查询的新业务的展开,公 司的毛利率和净利率也进一步提升。2021年公司毛利率62.1%,净利率23.9%,是公司高度产品化及高研发效率的体现。

2.自然语言处理(NLP)行业发展现状

2.1 自然语言处理概念

自然语言处理(Natural Language Processing)是通过构建算法使计算机自动分析、表征人类自然语言的学科。 自然语言处理是计算机理解和生成自然语言的过程,自然语言处理技术使计算机具有识别、分析、理解和生成自然 语言文本的能力。与计算机视觉相比,基本构成元素从像素变成了字母或汉字。 自然语言的理解层次可分为语音识别、词法分析、句法分析、语义分析和语用分析。具体应用包括机器翻译、文本 摘要、文本分类、文本校对、信息抽取、语音合成、语音识别等。

2.2 NLP的丰富应用场景

智能问答系统:通过中文分词、短文本相似度、命名实体识别等相关技术计算两个问题对的相似度,可解决问答、对 话、语料挖掘、知识库构建等问题。使用场景丰富,包括发散思考的闲聊型也包括严谨回复的任务型,对此首先都需 要语义理解,然后分别采用基于生成回答的和基于检索的解决方法。

舆情分析:通过关键词提取、文本聚类、主题挖掘等算法模型,挖掘突发事件、舆论导向,进行话题发现、趋势发 现、舆情分析等。输入文本后,将其分解为分词形式,通过调用特定功能的深度网络,多维度分析情绪、热点、趋 势、传播途径等,及时全面的掌握舆情动态。

内容推荐:通过关键词提取、短文本相似度等技术,提取关键语义信息,精准匹配出语义相似的内容,从而快速构建 内容推荐场景。

翻译:通过文本语言分析,精准翻译语句内容,从而帮助用户跨语言沟通。

2.3 NLP当前存在的问题

自然语言处理存在技术难题:自然语言的语义与上下文或前后轮对话语境有关,而目前多轮建模发展并不成熟,与语音 识别以及图像识别的单轮分析模型的成熟度无法相提并论。此外,众多潜藏在人类意识中的常识,计算机并不具备且无 法学习。

自然语言处理模型通用性不强:自然语言使用情况复杂,基于某一领域语料库建立的自然语言处理模型不具通用性,应 用于其他领域时系统性能显著下降,每个细分垂直领域的数据量有限,由于神经网络模型需要大量的数据才能提升效 果,所以需要模型无法很好的训练出来。

机器理解自然语言技术未有突破:机器只能通过系统设定的规则机械地分析源语的语法结构,语言逻辑无法处理,对于 复杂句子结构或层层句式嵌套的情况,机器的自然语言理解准确度不高。自然语言处理应用暂时只能通过完善部分领域 的知识库和语料库,优化部分领域内的自然语言处理应用的用户体验。

2.4 未来技术突破:垂直场景+多模态融合

解决一些实际的工业应用问题:包括长文本建模、可控生成、性能优化、小样本等具体问题,对细粒度的场景进行 扩展或者优化。

多模态语言处理融合:深度学习神经网络的引进使得语言模态、文字模态、图像模态、视频模态的编码和解码可在 同一个深度学习框架下统一运行。不同模态的对象可被同一模式编码与解码,产生更多的产品应用模式。

具象AI(Embodied AI):除了图像和文本之外,预训练模型也能够与环境交互,从环境的交互中学习。

2.5 NLP千亿市场空间与竞争格局

根据MarketsandMarkets™的研究,NLP市场规模预计将从2019年的102亿美元增长到2024年的264亿美元。 随着智能设备数量增长以及行业智能化业务处理水平要求的提高,自然语言处理市场有望得到进一步拓展。2017-2023 年,全球自然语言处理规模复合年均增长率达到24%。 2020年,我国人工智能核心产业及带动产业规模分别为1512.5亿元和5725.7亿元,预计至2021年将分别达到1898.1亿元 和7442.1亿元。以语音语义市场为例,2021H2相比2020H2增长37.0%,市场规模达12.3亿美元,全年实现21.7亿美元的 市场规模,科大讯飞仍然位居第一,但市场份额有所下降,阿里云、百度智能云市场份额开始上升。

2.6 全球专利数增长,NLP成为主要投入方向

全球专利数大幅增加:从2008年到2020年,全球有效专利数量稳定上升,在2020年增长5.9%,达到约1,590万件,接近 2008年总量的两倍。从国家构成来看,美国和中国占据了最主要两部分,中国的有效专利增速在2020年达到了14.5%, 以310万的总数仅次于美国的330万。

企业对专利处理的需求在增大:中国企业在专利工作中的资源投入增长较快 ,2020-2021年几乎所有企业都对专利工作 提高了预算投入,只有4%的企业减少专利预算,增长超过10%的企业达到46.8%。大量的专利处理需求也产生对知识产权 公司的需求,国内外优秀企业快速发展,如国外的科睿唯安、INOLOGY,国内的拓尔思、智慧芽。

NLP技术帮助处理大量专利:专利中绝大多数有价值的信息都存储为非结构化文本,并采用高度技术性的语言,对专利 人员技术要求高。而机器学习擅长处理大批量数据,对应NLP处理专利领域大量文本数据。通过NLP技术可以对专利进行 语义理解,为使用者自动提取重要信息。

2.7 专利库竞品公司:智慧芽

智慧芽(PatSnap)成立于2007年10月,是一家科技创新情报SaaS服务商,聚焦科技创新情报和知识产权信息化服务两大 板块。通过机器学习、计算机视觉、自然语言处理(NLP)等人工智能技术,为科技公司、高校和科研机构、金融机构 等提供大数据情报服务。 公司创始人张济徽,本科毕业于新加坡国立大学生物工程专业,2007年创办智慧芽PatSnap。 旗下产品包括PatSnap全球专利数据库、Innosnap知识产权管理系统、Insights英策专利分析系统、Discovery创新情 报系统、Life Science系列数据库等。

2021年3月17日,智慧芽(PatSnap)宣布完成3亿美元的E轮融资,本轮融资由腾讯和软银愿景基金二期领投,CPE跟投, 红杉中国、顺为资本和祥峰投资等老股东继续加持。指数资本担任独家财务顾问。从规模来看,该笔融资是2020年以 来SaaS行业最大一笔融资,伴随此轮融资智慧芽估值也超过10亿美元。

智慧芽的自然语言处理技术

通过大数据处理和文本聚类,从专利中挖掘关键技术信息:不需要人工大量投入阅读和标引精力;对专利的引用 量、PatSnap同族数、侵权诉讼量、申请人、专利价值等多个维度做聚类分析,找重点专利。

通过语义理解、向量相似度比对,降低寻找目标专利的难度:系统结合输入内容,挖掘文本的语义信息,在数据库 做相似性匹配;语义相似度算法模型主要包括关键词及其扩展模型、语义向量模型和语义图谱向量模型,同时结合 实践经验形成的规则。

智能的自动处理机制:利用OCR技术自动识别官文,根据文档规则触发内部和官方期限,减少用户重复作业。支持 CPC一键转档、递交以及CPC来文的自动获取,并且定期对自有公开专利的著录项目、法律状态、权利要求、说明 书、附图信息,利用智慧芽专利数据资源自动更新,减少手动状态维护。

海外竞品公司:科睿唯安

科睿唯安(Clarivate Analytics)成立于2016年10月,拥有并经营着一批以订阅为基础的商业服务,主要为全球客户 提供科学和学术研究、专利分析和监管标准、制药和生物技术情报、商标保护、品牌保护和知识产权管理等服务。早 在2011年,前身还是汤森路透知识产权与科技事业部的科睿唯安就开始使用机器翻译人工辅助的方式提供快速、准确 的中国专利数据英文翻译文本,开发了中文机器翻译人工辅助系统CN MAT,将自然语言处理技术与事人工辅助翻译相 结合,为全球其他国家的人士深入了解中文专利内容提供了有力的支持。

基于特殊的专利和技术词汇数据库和自然语言处理技术,通过生成词云将专利进一步地浓缩和提炼,提高对于技术和 专利专家的可读性。通过文本聚类,将专利的高频词汇通过词向量(Word Vector)方法投影到二维平面上进行可视 化,得到专利地图,从而迅速了解不同公司之间的专利布局。

Innography高端专利分析工具(Innography Advanced Analysis,简称Innography)是一款专利在线检索分析工具,由 美国Innography公司于2007年推出,是世界顶级的知识产权商业情报分析工具。 Innography公司于2015年被世界领先的知识产权管理和技术公司CPA GLOBAL收购,CPA GLOBAL于2020年7月被科睿唯 安收购,此次交易为全股票交易,CPA Global股东将获得约2.18亿股科睿唯安普通股,占科睿唯安完全稀释后股份的 35%。按照科睿唯安7月30日成交量加权平均股价计算,股份折合企业价值约为68亿美元,其中包括约9亿美元的税收 资产现值。

有丰富的专利数据源,可以查询和获取100多个国家1亿多篇高质量的专利文献、法律状态,其中包括40个国家的专利 全文数据。包括五大功能模块:专利检索、公司检索、诉讼检索、商标检索、非专利文献检索。

3.拓尔思核心竞争力

3.1 技术领先,屡获国家级技术大奖

公司作为国内长期坚持自主研发核心技术的企业之一,发展至今,承担过包括国家863计划、重点研发计划、信息安全 专项、核高基专项等几十项国家级项目。 公司凭借技术优势多次获得国家级、市级荣誉,包括:国家科技进步二等奖、连续4年获得中国自主可靠企业核心软件 品牌、上海市科技进步一等奖等。 公司基于强大的技术体系,面对金融、医疗、媒体等多行业分别开设重点研发实验室,力争在细分垂直领域做到最 优。公司及全资/控股子公司拥有600余项软件著作权。

3.2 NLP的真正核心壁垒—行业数据

公司立足于“语义智能”的深厚积累,分别基于三大核心技术体系:人工智能和大数据技术领域推出通用产品、行 业产品或SaaS化的软件和数据智能服务, 布局全行业。 公司典型客户均为政府部门及各行业龙头公司,基于海量的行业数据的模型训练将让公司进一步提升核心竞争力。

3.3  深入布局各行业场景,抢占卡位优势

政府网站

公司积极参与政府网站集约化试点以及政府资源库的建设工作,试点范围有望全面拓宽。在首批10省1市试点地区中,公司积极 参与湖北、贵州、吉林、重庆、北京、广西、山东等省市的集约化试点工作。2019年,公司还陆续参与了陕西、天津、南京、武 汉、长沙、桂林等省市政府网站集约化建设。

公司集约化解决方案安全智能、开放可控,具有较强的竞争优势。公司集约化解决方案采用平台化架构,具有高复用性,管理方 式灵活新颖,一体化访问使得服务运行更加简单便捷。公司的平台实现了智能化、全云化,交付高效灵活、使用体验好,目前也 进行了全面国产化适配,安全可控。

公司信息资源库建设经验丰富。信息资源的集约化建设是集约工作重点之一,公司多年来一直帮助国家信用信息中心、新华社、 人民日报、市场监管总局等各个行业建设资源中心或资源库平台,在数据归集、数据分析和利用等各个方面都有深厚的经验积 累。

舆情监测

网络舆情监测行业在国家政策的大力助推下需求强烈。随着信息化进程的加快,国家高度重视网络空间治理,密集出台 相关法律法规。2020年4月,国家网信办等十二部门联合印发《网络安全审查办法》;同年12月,国家发改委等四部门联 合印发《关于加快构建全国一体化大数据中心协同创新体系的指导意见》。

公司作为业内领军企业,将持续受益于政策风口红利。“十四五”规划提出要推进网络强国建设,网络安全是网络强国 的保障。公司是网络空间治理领域市场份额居首、实力优势领先的企业,受益于持续向好的政策环境,发展潜力大。

公司产品和服务全面。在舆情监测和分析领域,公司拥有舆情态势感知私有云平台,网察大数据分析云服务(SaaS)、 网络舆情数据服务(DaaS)、网络舆情报告服务(KaaS)、网络传播效果分析系统/服务等多种产品和服务,目前已经服 务于国内千余家机构用户,包括互联网空间治理和监管机构、党政机关、媒体机构、教育机构、大中型企业。

金融监管

在金融领域,拓尔思基于在该行业的长期积累以及对金融业务场景的深刻了解,依托强大的数据采集能力及自然语 言处理技术,为金融机构提供全方位的解决方案。

针对互联网金融的快速发展,将大数据应用于打击非法集资、传销,服务于各地政府金融监管部门和经侦部门。通 过大数据挖掘、发现、追踪企业社会行为轨迹,从而达到金融风险预警和管控目标,提出的冒烟指数在风险防范中 发挥越来越重要的作用。

独创量化分析指标——冒烟指数,从综合合法性、非法集资特征词、收益率偏高、负面反馈指数、传播力五个维度 构建企业非法集资的风险评判标准。运用六项监管机制,通过线索发现、线索跟踪、监测预警、协调警示、监督控 制、信息共享,全流程辅助金融监管部门进行监测预警,做到“打早打小”。

企业服务

公司帮助电力、通讯、能源、航空、制造、公共服务等行业的央企和世界500强企业在全流程场景服务中实现业务创 新和精细化管理,提供一站式数据分析可视化结果展示、知识图谱关联、数据推荐,打造企业统一综合服务平台。

智能客服:TRS智能客服基于语音识别、自然语言理解等AI技术,提供全天候客服机器人、智能助手、智能办公协同 软件等产品,实时精准识别用户问题、进行答案匹配与排序,帮助企业更好地理解客户需求并作出快速应答。

智慧办公:提供以文本分析为核心的企业内部综合办公平台,提供智能文档审阅、垂直搜索引擎、异构内容中心、 知识管理平台、异构知识图谱等核心组件,为领导决策、科研学习提供全面客观的自动化、一体化、智能化地支 持。

公共安全

在公共安全领域,拓尔思主要面向数据采集、数据治理、数据应用、数据管理等方面,实现一切数据资源化、资源 知识化、知识目录化的原则,利用大数据、自然语言处理、知识图谱技术,面向案件侦破、网络追逃、对象管控、 数据分析、情报研判等提供基础性、实用性、工具性的支撑。

公司研发出云搜索系统、智能辅助办案系统、水晶球情报分析师平台、信息系统安全审计平台、互联网开源情报与 舆情服务等。其中云搜索系统采用大数据技术,实现海量、异构的公安行业内部、外部数据融合,面向人物、组织、 物品、事件、地点等进行深度分析、挖掘,彻底改变了公安行业海量数据无法有效利用的现状,为其实战业务增添 了强劲驱动。

出版

在出版领域,拓尔思积极参与国家新闻出版广电总局关于推进新闻出版业数字化升级工作的技术号召,主要为用户 提供资源管理、知识加工、知识服务及产品运营服务,并推出出版知识服务解决方案,帮助出版商构建领域知识图 谱,通过对出版行业数据的再加工,利用NLP中数据挖掘、信息抽取、知识融合等各类技术,构建统一的行业知识 库,不断加强对内容本身和读者兴趣行为的深入挖掘分析,开拓知识服务新模式。

3.4 公司持续高研发投入,巩固技术优势

持续高研发投入以夯实核心技术优势。公司高度重视技术研发,为进一步强化核心竞争力提供重要支撑。2021年,公 司研发支出总额为2.09亿元,占营业收入的比重为20.3%。  高尖端人才的不断引入。随着研发投入的加大,2021年公司的研发人员总数却呈现下降,原因是公司调整研发人员结 构,更多地聘用人工智能和大数据各领域的专业人才。在提高研发人员占比的同时,不断优化公司的研发体系。

4.拓尔思未来主要看点

4.1 云和数据业务保持高增速,成为营收核心驱动力

云和数据业务高增速发展: 2018-2021年,云和数据业务收入高速增长,在前两年保持50%的高增长率,2021年虽然 受到疫情等因素影响,仍保持14%的增速。2021年,云和数据业务收入总金额已达到3.78亿。

营收占比快速升高,成为营收最主要驱动力:收入营收占比方面,从开始的17%提升到36%,在公司整体业务中的重要 性显著升高。2020年达到25%,超过技术服务业务的17%,成为公司主营业务产品中最主要的产品,占除房地产外营业 收入的36.48% ,成为驱动拓尔思高速增长的最主要驱动力。在2022年经营计划中明确提出支持公司优先发展云和数 据智能服务的战略,将继续保持营收地位。

产品SaaS化比例快速提升,技术优势明显

产品SaaS化比例快速上升:行业应用私有云产品主要有TRS海云集约化智能门户平台、TRS融媒体智能生产与传播服务平 台、TRS舆情态势感知平台等;数据智能公有云服务主要有TRS网察大数据云服务、TRS数家媒体大数据云服务、TRS网脉网 站友好性分析云服务、TRS数星智能风控大数据云服务、“冒烟指数”金融风险预警云服务等。

产品适用场景丰富,包括金融风险、网络事件等监测,并对检测内容检索分析,符合多类别不同行业公司需求,2021年 云和数据服务业务新签约了平安银行、中国农业银行、上汽通用、潍柴动力等多家重要企事业客户。

技术优势明显:公司自主投资建设的大数据中心,对网络大数据不间断的大规模实时采集,已具备数千亿数据量的检索、 分析能力。产品的在线云服务可以充分利用大数据这一优势,从而提供对这些数据的在线处理、分析。以TRS网察大数据 分析平台为例,云计算帮助产品在数据、技术和功能上具有明显优势。

SaaS商业模式接受度提升,公司云服务适合推广

SaaS商业模式接受度提升,市场空间广阔:2021年中国SaaS行业市场规模已达到了322.6亿元,预计2023年将破555亿 元,保持30%左右的增长率。社会环境驱动着SaaS的广泛应用,数字化办公需求迅速增长,推动着SaaS行业的市场规模不 断扩大,呈现长期稳定上涨的趋势。

公司的云服务适合推广:公司融合“私有部署+云服务”的业务模式,可根据客户的个性化需求,弹性灵活地把解决方案 部署到各种IT基础架构,具备为客户提供全栈式应用交付能力。通过在线云服务,降低用户初始投入资金和技术门槛, 培养用户长期价值。2020年,公司继续深化云和数据智能服务战略,产品和服务全面提升,主要产品海云集约化门户平 台、融媒体智能生产与传播服务平台和舆情态势感知平台都推出了私有云部署版本,支持多租户的使用,支持行业客户 业务模式“上云”。

企业级服务优势明显,云服务模式切入小B客户

快速响应客户需求,企业级客户服务优势明显。公司以核心技术产品为依托,在新一代电子政务、融媒体、金融、安全、 网络舆情大数据等垂直行业和领域拥有独特价值的解决方案,公司保有覆盖全国的区域化的开发服务团队和垂直行业化的 资深咨询团队,能够快速及时地响应客户需求,满足客户个性化的需要。公司面向企业级客户的服务能力和资源是经过长 时间面向企业级客户经营和维护累积而成,具有专业、资深、高效、扎实和弹性的优势,能够支撑公司在企业级市场持续 提高用户满意度,维系和提升长期客户价值。

云服务模式降低客户使用成本,下游客户面进一步拓宽。公司客户目前以公安等政府部门为主,随着全社会“上云用数赋 智”的数字化转型不断推进,企业客户对于AI、大数据、云服务方面等需求不断提升,公司顺应行业发展趋势,做大做强 “云和数据智能服务”,主动实现业务模式的升级转型,短期有望带动小B客户需求,拓宽公司客户范围。

4.2 中国虚拟人市场巨大,宣传充分推广阻力小

市场规模飞速增长,市场巨大:虚拟人产业保持较快增长态势,2021年,中国虚拟人带动产业市场规模和核心市场规模 分别为1074.9亿元和62.2亿元,预计2023年分别达到3334.7亿元和205.2亿元。在市场增速上也始终保持超高增长率,近 三年的产业市场和核心市场增速都超过60%。

了解程度增加,便于推广服务:相较于2021年,2022年中国网民对虚拟人的了解和关注程度更高,从2021年的63.6%的关 注度上升至2022年87.8%。社交媒体多元化发展,推动了虚拟人的宣传,网民渗透率提升,相比于刚开始的新奇,网民对 虚拟人的接受程度也不断提高,便于新产品的推广。

新业务发展初见成效:智能虚拟人

公司当前创新业务布局主要分为四大方向,即智能虚拟人业务、数据要素市场业务、能源大数据智能化业务和开源情报 及信创业务。 虚拟人的“灵魂”部分主要通过自然语言处理、知识图谱、大数据等智能技术, 赋予数字人知识储备、语义理解、推理 分析、自主决策和行动的智能驱动能力,逐步代替真人工作的能力引擎。 公司在智能虚拟人应用布局将优先面向金融、传媒、政府、营销等行业的专业服务场景,主要助力虚拟人智能对话、知 识积累,理解语义和智能决策,不仅可成为虚拟客服、虚拟带货主播、虚拟审核员、虚拟编辑、虚拟记者、虚拟顾问、 虚拟助教等专业虚拟人角色的智慧驱动引擎,同时也可以根据场景需要赋予智能虚拟人不同的专业风格特色。

虚拟人相关产品丰富,业务布局广阔

当前,公司智能虚拟人技术成熟、产品体系丰富, 已在全国两会及北京冬奥会播报、政务问答、智能 风控报告及新闻写作、银行消保审核及客服清分服 等方面实际落地应用。 公司已在国家知识产权局的专利智能审核、外观智 能检索,政府门户网站的智能问答,各大金融企业 的合同智能审查、客服智能清分、说明书自动概 述, 媒体和互联网的内容智能审核、媒体智能采 编、自动写稿、自动播报等场景广泛实现智能化和 自动化。 公司经过与多个行业客户的多年合作与积累,已迭 代沉淀了百亿级多行业领域的知识图谱,并拥有快 速构建领域知识图谱的技术产品和服务能力,为高 效打造智能虚拟人的大脑知识库提供支撑。

4.3  新业务:知识产权业务的千亿美金市场

各项知识产权申请量持续快速增长 :中国2020年发明、实用新型和外观这三项专利的申请总量分别达到149.71万件、 292.7万件和77.0万件,同比增长6.9%、29.0%和8.3%,均显著高于全球增速。根据中国国家知识产权局数据,2021年中 国授权发明专利量增长31.3%,同样位居全球领先。 企业运用知识产权的能力和意愿快速提升:2021年,中国专利许可的备案合同金额达到 120.3亿元,同比增长达到 34.3%,许可金额增速显著高于专利申请的增速,也意味着企业在正在加速实践专利的商业化运用。 伴随着从“中国制造”市场向“中国设计”市场的转型,知识产权工作在经济与社会效益中发挥的作用越来越显著。预 计2022年中国朱韩立申请量495.7万件。预计2023年中国知识产权运营的市场规模将达到1111.3亿美元,市场空间广。

知识产权国产产品渗透率低

科睿唯安的扩张:2020年10月27日,科睿唯安收购合享智慧,将布局从高端市场拓展到中端市场。  科睿唯安控制了中国高端市场,凭借其德温特专利数据库,客户包括了国家知识产权局、中国科学院、中国工程院、重要央企国 企、广大中国高校等。 合享智慧则与智慧芽占领了中低端的绝大部分市场,每家都拥有几千家中国客户,在收购合享智慧后,对中低端市场也有了广泛 渗透。索意互动的智能检索算法很强,受到专利审查员青睐,但规模小影响力一般。而其他专利数据库提供商,如大为软件、广 州奥凯、佰腾等都属于小众市场。

海外龙头科睿唯安,高毛利高营收增长

2021年公司实现快速发展,营收18.77亿,同比增长49.67%,也证明了知识产权服务的广阔市场空间。公司业务毛利率近年来稳定在 65%左右。由于公司在研发端的大力投入,近年来处于亏损状态,但在21年出现拐点,亏损减少为2.7亿。 截止7.26日科睿唯安的市值96.31亿美元, PS(TTM) 4.56倍。拓尔思目前只有科睿唯安六分之一的市值和业务规模,考虑到知识产权 领域的数据敏感性,拓尔思在NLP领域的深厚积累将帮助它加快对海外巨头的国产替代。

科睿唯安的业务部门主要分为科学部门和知识产权部门。科学部门包括两部分产品,一是为学术界和政府部门提供指导,二是用于生 物医药方面的研究。知识产权部门则包括专利、商标、领域和知识产权管理产品线。知识产权部门在收入中的占比于21年迅速上升, 2021年该业务营收9.76亿美元。 科睿唯安的收入方式包括初次订阅、重复订阅以及单独购买,2021年79.1%的收入来自于基于订阅的方式。

国产替代需求大,看好国内知识产权公司

国产替代需求:2022年3月11日,全球科学和知识产权信息服务最大提供商之一,科睿唯安官方网站宣布:科睿唯安将停 止在俄罗斯的所有商业活动。目前中国专利数据库方面,高端和接近半数的中低端市场被科睿唯安占据。从中高端专利数 据库方面的自主和安全性上来看,国产替代的需求很大,需要国产产品在中高端与科睿唯安竞争。

智慧芽优势:智慧芽支持包括语义搜索、图像搜索在内的9大检索方式。22年7月全面升级图搜技术,仅仅通过上传图片, 即可立即匹配专利技术方案,规避了传统检索中用户需要自己尝试关键词的痛点。此外还具有全面的信息呈现与追踪能 力,利用数据可视化构建多维度专利信息情报,并通过微信、邮件跟踪竞争对手的专利动态。2021年3月17日,公司完成3 亿美元的E轮融资,目前估值超10亿美金,证明市场对该业务国产替代的重视。

拓尔思优势:在知识产权领域,拓尔思研发了具有自主知识产权的专利全文检索引擎、图像检索系统、机检报告系统等。 通过将专利申请接收、机检报告生成、机检报告结果推送等功能紧密结合,自动实现机检报告业务的全流程服务,能够有 效地识别出权利书、说明书、附图明显抄袭的专利申请,降低工作负担,提高专利审查质量和公信度。全过程采用自然语 言处理与智能检索技术,可满足海量专利和非专利文献复杂的检索需求。


(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

相关报告
评论
  • 相关文档
  • 相关文章
  • 最新文档
  • 最新精读
分享至