智能文字识别起源、功能及应用情况如何?

智能文字识别起源、功能及应用情况如何?

最佳答案 匿名用户编辑于2025/05/15 13:41

AI 领域重要分支,受益于用户文档管理和企业数字化转型需求提升。

智能文字识别技术由 OCR 技术演变而来。OCR(Optical Character Recognition,光学字符识别)技 术可将图像中的文字转变为机器可读可处理的字符信息,是机器与现实世界进行视觉交互的重要基 础。2017 年以来,OCR 技术越来越多与自然语言处理技术相融合,形成了智能文字识别技术。 智能文字识别是 AI 领域的一个重要分支。智能文字识别技术融合了智能图像处理、基于深度学习 的复杂文字场景文字识别、自然语言处理(NLP)等多项 AI 技术。与传统的简单文字识别相比,智 能文字识别技术具备更多认知与理解能力,可适应多语言、多版式、多样式等复杂场景,识别准确 率大幅提升,同时可基于理解能力进一步开发文档解析、分类、对比、审核等功能,是个人文档资 产管理和企业数字化转型的关键。

智能文字识别技术能够解决实际场景下的众多难题。在个人用户的角度上,智能文字识别的文档还 原、篡改检测、反光去除等功能能够满足用户在办公、求职、学习等不同场景下的图片、文档处理 的需求,个人用户的合同、名片、发票、笔记等非结构化纸质文档通过智能文字识别技术数字化后, 用户可以随时在手机、电脑等多个终端进行查询、管理和分享。在企业用户的角度上,票据分类、 合同抽取、证照票据结构化、智能审核等功能能够帮助企业进行数字化转型,提取、存储、转化、 解析企业运营过程中产生的大量非标准化文档数据,提升企业运营效率,节省人力成本。

从下游行业应用来看,金融、物流运输行业的市场规模占比较高、增速较快。金融和物流运输行业 的业务流程中,需要处理大量的证照、单据、表格等文档,并对文档进行录入、分类、比对、审核, 因此在业务流程信息化建设方面有更高的投资意愿,在文档处理方面也有较为强烈的降本增效需求, 使得智能文字识别技术能够在金融和物流运输行业较快实现商业化落地。 智能文字识别行业与国家科技创新战略和相关产业政策相匹配。智能文字识别技术作为人工智能领 域的重要分支之一,响应了我国“促进人工智能和实体经济深度融合”的号召,符合我国“加快数 字化发展、建设数字中国”的政策要求。国家科技部、商务部发布的《中国禁止出口限制出口技术 目录》将“印刷体汉字识别技术、程序结构、主要算法和源程序”、“具有交互和自学习功能的脱 机手写汉字识别系统及方法”、“汉字识别的特征抽取方法和实现文本切分技术的源程序”等纳入 了限制出口的信息处理技术范围,意味着智能文字识别技术是涉及我国核心利益,限制境外企业获 取的核心技术。

根据 Grand View Research 数据,2023 年全球智能文字识别服务市场规模为 125.6 亿美元,2030 年市 场规模有望增长至 329.0 亿美元,年均复合增速约 14.8%。2023 年中国智能文字识别服务市场规模 约 10.6 亿美元,预期到 2030 年市场规模将增长至 30.9 亿美元,年均复合增速约 16.5%,超过全球 市场规模增速。

智能文字识别行业面向下游的 C 端和 B 端客户。其中面向 C 端客户的产品主要是 APP 产品,面向 B 端客户的服务包括基础技术服务、标准化服务和场景化解决方案。

C 端:以文字识别类 APP 产品为主。App Store 中可以公开检索到的智能文字识别 C 端 APP 包括扫描全能王 CamScanner、ABBYY FineScanner、名片全能王 CamCard、ABBYY Business Card Reader、Office Lens、Google Lens、Adobe Scan、夸克扫描王等。

扫描全能王、名片全能王的月活量高于其他可比公司,在占领用户心智方面具备一定优势。从 2023 年的平均月活数据来看,扫描全能王 CamScanner 月活数据排名第一,显著高于其他可比公司,且月 活量超过了第二至五位的月活量之和;名片全能王 CamCard2023 年的平均月活也要高于其他同类 APP。从 2023 年 12 月中国 App Store 的搜索关键词热度来看,“扫描全能王”的搜索热门程度要高 于“扫描”、“文件扫描”、“文档扫描”等功能词,“名片全能王”的搜索热门程度也要高于“名 片”、“名片识别”、“名片管理”等功能词,表明扫描全能王和名片全能王在占领用户心智方面 具有较明显优势。

条目识别率是文字识别领域常用的衡量识别效果的指标。根据中国合格评定国家认可委员会(CNAS, 全 称 China National Accreditation Service for Conformity Assessment ) 认 可 的 检 测 实 验 室 (NO.CNASL8192)2020 年出具的一系列《软件测试报告》显示,名片全能王 APP 针对常规多语言 名片的字符识别率为 99.43%,扫描全能王 APP 针对常规印刷体文档字符的平均识别率为 99.77%, 手写体文档字符平均识别率为 97.00%。与其他文字识别企业的识别率相比,合合 AI 开放平台对中 文证照条目的识别率达到 99.6%,在复杂场景下的文字识别率达到 81.9%,超过了国内其他文字识别 企业。

B 端:场景化解决方案收入持续增长,持续打造标杆客户。智能文字识别 B 端服务包括基础技术服务、标准化服务和场景化解决方案,三者的竞争格局有所不 同。其中基础技术服务的市场参与者较多,包括智能文字识别厂商、传统文字识别厂商和云服务平 台厂商等,市场中存在一定的同质化竞争;标准化 B 端产品主要打造标准化 SaaS 和 PaaS 产品,技 术门槛较高,目前仅有少数企业布局,包括提供 SaaS 产品服务的合合信息、提供 PaaS 产品的阿里 云、百度云、腾讯云等;场景化解决方案通常需要在客户现场实施部署,具有区域性,市场较为分 散。且场景化解决方案对行业理解和业务场景落地能力的经验要求较高,目前商业化落地案例相对 有限。

主营智能文字识别业务的企业在拓展 B 端业务时更具优势。智能文字识别 B 端服务领域的主要参与 者包括各头部互联网厂商旗下的云服务平台,例如百度云、腾讯云、阿里云、Google Cloud 等,还 包括在 B 端和 C 端均有布局的主营智能文字识别业务的合合信息、ABBYY 等。云服务平台提供的 产品丰富多样,以云服务器、云存储、云数据库等为主,智能文字识别仅为其产品之一。云服务平 台切入智能文字识别领域的主要原因在于其基于成熟的 PaaS 平台提供基础化、标准化的 OCR 识别 服务的边际成本较低,而且能进一步提升云平台服务的丰富度。但智能文字识别的场景化解决方案 往往需要大量人力和研发投入以满足顾客的个性化需求,项目周期较长,边际成本较高,云服务平 台的投入意愿和资金有限。

2021-2024 年,合合信息智能文字识别 B 端业务收入分别为 0.68/0.71/0.67/0.75 亿元,其中 2023 年 B 端业务收入同比有所下降,主要系智能文字识别 B 端基础技术服务产品竞争较为激烈,导致该板块 收入下降。但同期 B 端场景化解决方案收入保持较快增长,占 B 端业务收入的比重也从 2021 年的 28.78%提升至 2023 年的 37.47%。2024 年,公司重点加强智能文字识别 B 端服务涉及的智能文档处 理领域,推出了文档解析、智能文档抽取等多款应用,在泛金融、财务数字化、供应链数字化等多 个场景中实现了成熟应用。2024 年公司智能文字识别 B 端业务收入同比增长 11.3%至 0.75 亿元。

公司旗下智能文字识别 B 端业务包括基础技术服务、标准化服务、场景化解决方案三个板块。 2021-2023 年,基础技术服务和标准化服务收入占 B 端收入比重总体呈现下降态势,主要原因是基 础技术服务领域重点向客户提供证照、银行卡、名片等智能文字识别基础技术,产品同质化较高, 价格竞争日益激烈。公司标准化服务为名片全能王企业版SaaS软件服务,提供面向企业的名片识别、 客户名片管理、CRM 客户关系管理等基于公有云的服务,主要销售至日本,收入以老客户续期为主。 2021-2023 年,公司场景化解决方案收入规模和占 B 端收入比重持续提升。场景化解决方案主要包 括智能文字识别 AI 机器人和 AI 训练平台,前者包括合同机器人、财报机器人等,可针对财报、票 据、合同、表单等与客户业务场景深度融合的复杂文档进行文字识别,并提供差异比对、指标分析 等服务。支持公有云服务、私有化部署、API 集成等多种集成方式,对接企业内部管理系统;后者 可自动执行模型训练、测试、部署和发布等操作流程,实现无感知的模型训练和部署服务。

智能文字识别场景化解决方案主要针对业务场景复杂的大型企业,这些企业更重视数字化转型,信 息化与 IT 投入不断提升,付费意愿也相对较强。以公司与德国汽车零部件供应商伟巴斯特的合作为 例,伟巴斯特每月需要处理 1.5-2 万张供应商采购发票,人工处理费时费力,且具有一定合规风险。 伟巴斯特借助合合票据机器人+SAP ERP 系统,实现了票据的扫描-识别-验真-合规自动检查-发票与 订单数据匹配-数字化数据-影像留存的全流程财税管理,使得财税处理中的每个环节都可调阅可追溯, 整体作业效率提升 500%-1000%。

参考报告

合合信息研究报告:稀缺的C端生产力软件龙头,AI与海外双轴驱动.pdf

合合信息研究报告:稀缺的C端生产力软件龙头,AI与海外双轴驱动。公司是AI文字识别领军企业。自成立起将文字识别、图像处理作为核心研发方向,深耕超过15年,旗下拥有“扫描全能王”、“名片全能王”(海外市场则对应CamScanner、CamCard)等多款智能文字识别App。智能文字识别是AI领域的重要分支之一,个人用户的文档管理需求提升和企业用户的数字化转型需求都将扩大AI文字识别技术的发展空间。2018-2024年,公司业绩表现良好,营收规模逐年提升,盈利能力总体增强。截至2025年4月10日,扫描全能王免费版和付费版在中国区AppStore的效...

查看详情
我来回答