公司专注于大数据领域,技术原创性强,产品矩阵完整。
1.技术原创性强,产品自主可控,与国产生态适配性强
公司成立于2013年,其核 心研发团队曾任职于英特尔,在英特尔基于Apache Hadoop 1.x技术研发开源的 Hadoop发行版产品,是行业中较早探索、研发大数据技术的团队。在具有一定技术 积累的基础上,公司通过自研大数据技术逐步取代开源技术,经过多年的发展,软 件产品自主率行业领先。截止2021年11月,其核心产品大数据基础平台TDH代码自 主率为74%。此外,相较于数据库产品,公司开发的大数据平台产品的定位更为综 合。面向数据接入、处理、存储、查询检索、分析挖掘等全生命周期,公司已形成 大数据与云基础平台、分布式关系型数据库、数据开发与智能分析工具的软件产品 矩阵,产品在金融、能源、电信、交通等行业广泛应用。

公司大数据产品在开源技术的基础上进行了较大比例的自研开发,技术壁垒较高。 公司在开源技术的基础上,进行了较大比例的自研开发工作,其大数据产品在高并 发事务处理、多模型融合分析以及多方数据安全协作等方面具有较高的技术壁垒。 公司对开源技术的核心组件实现了自研替换,包括YARN资源调度组件、Storm流处理组件以及HDFS分布式存储管理系统。公司自研的大数据平台产品采用分布式、云 原生等技术,不仅在逐渐替代传统的关系型数据库产品,而且在部分应用场景中实 现了对Cloudera和Oracle等海外公司数据库产品的国产替代。
公司的大数据和数据库产品与国产软硬件基础平台产品有较强的适配性。公司完成 了和多个国产硬件平台的适配,支持在一个集群内允许多个不同的硬件架构(如X86 架构和国产鲲鹏、飞腾、龙芯等架构)混合部署,能够更好的让用户实现逐步的国 产化替代进程。分布式分析型数据库ArgoDB已经完成和飞腾、鲲鹏等国产硬件及麒麟、UOS 等国产操作系统的深度适配。分布式交易型数据库KunDB支持X86与各种 国产芯片架构,以及CentOS、RedHat、UOS、麒麟等国内外主流的操作系统,能 够运行在异构CPU架构以及多种操作系统混合部署的集群环境中。我们认为,公司 在国产软硬件生态的适配性具有相对优势,预计将受益于金融、电信等行业信息系 统的国产替代进程。

公司的大数据产品较好满足公共部门数字化转型的需求。随着公共部门数字化转型 的深化,政务数据体系存在统筹管理机制不健全、供需对接不顺畅、共享应用不充 分、标准规范不统一、安全保障不完善等问题。2022年9月,国务院印发了《全国 一体化政务大数据体系建设指南》,提出了加强数据汇聚融合、共享开放和开发利 用的要求。我们认为,公司的大数据平台产品具备的多源异构数据融合分析能力较 好的满足了政务数据融合联通的需求,未来有望受益于政务大数据体系建设。公司 在政务数据平台领域已具有一定项目经验。例如,公司给上海市大数据资源平台提 供的数据云平台TDC产品支撑全市数据的归集,为各类数据治理工作提供多样化存 储和计算能力,保障对外服务的时效性、可靠性,提升上层数据应用的安全性。 公司营收快速增长,金融和公共部门行业客户贡献营收较大。
公司营收由2018年的 1.1亿元增长至2021年的3.3亿元,CAGR为43.1%。在金融、公共部门和能源等行业 数字化转型的需求旺盛的背景下,公司推出的大数据基础平台TDH、数据云平台TDC 等产品较好的满足了海量、异构、多源数据处理和分析的需求,相应产品在各行业 快速渗透,带动营收快速增长。2022年前三季度,公司营收1.7亿元,同比增加24.8%。 分行业来看,2021年,金融和公共部门客户贡献营收分别为1.4亿元和9232万元, 占营收比重分别为42.6%和27.9%。
1. 在金融领域,公司不仅提供数据仓库、数据分析等常用的大数据产品扩大客户覆 盖面,还拓展了智能风控、隐私计算等业务,深度挖掘客户价值。公司已覆盖监 管机构、交易所、银行、证券公司等金融机构。2021年,金融领域客户贡献营收同比增长35.8%。 2. 在公共部门领域,公司的大数据产品有效推动数据基础设施的构建,满足了政务 信息化、民生服务、社会治理、市场监管等相关应用需求。2021年,公共部门 领域客户贡献营收同比增长54.8%。 3. 此外,在能源领域,公司大数据产品在国家电网、南网集团等公司落地,推动其 数字化转型。2021年,能源领域客户贡献营收3552万元,同比增长36.7%,占 营收比重为10.7%。

公司已在多个行业实现了国产替代。相较于海外竞品,公司在技术架构、SQL兼容 性、存储管理系统方面实现了较大的技术进步,对Oracle、Elastic以及Cloudera等 公司的大数据产品实现了国产替代。公司的大数据基础平台TDH、分布式分析型数 据库ArgoDB以及智能分析工具Sophon已在金融、能源、制造、交通等多个行业实 现了关键信息系统的国产替代。2019-2021年,公司具有国产替代功能相关软件产 品收入分别为1.1亿元、1.3亿元和1.8亿元,占总营收比重59.4%、42.4%和42.2%。
2.大数据基础平台是营收主力,标准化软件产品授权占比有所提升
大数据基础平台业务是营收主力,产品交付以软件授权为主。在数字化基础设施建 设过程中,公司主要为客户提供数字化基础设施底层、中间层的基础软件和技术服 务,支持客户进行数字化转型。公司具体主要提供以下产品和服务:1. 大数据基础 软件业务包括大数据与云基础平台、分布式关系型数据库、数据开发与智能分析工 具等标准软件及配套技术服务,以软件产品授权的方式交付为主,毛利率较高。2021 年,该业务营收2.6亿元,同比增长18.4%,占营收比重为79.9%。2. 应用与解决方 案,主要针对具体应用场景,提供大数据存储、处理以及分析等相关场景下的咨询 及定制开发等服务的解决方案。3. 此外,公司根据客户及项目需求销售少量第三方 软件、硬件等其他业务。
公司的大数据基础平台产品主要按照节点收费。在分布式架构中,一个计算节点一 般对应一台服务器。在软件产品授权模式下,公司的大数据基础软件主要按照节点 数量收费。大数据基础平台TDH作为公司成熟的产品品类,功能全面,性能优异, 其销售量较大且呈现逐年增长的趋势。2021年,TDH销售节点数量为5416个,同比 增长40.7%;TDH均价1.43万元/节点,较2020年的单价也有所增长。相较于TDH, 其他产品的单节点均价更高,但销量仍处于爬坡过程中。2021年,TDC、TDS、Sophon、 ArgoDB和KunDB的单节点均价分别为4.7万元、1.9万元、7.3万元、7.4万元和4.1 万元。公司在金融、公共部门、能源等领域已经具有一定的用户粘性。我们认为, 单价更高的软件产品有望实现在老客户中的拓展销售,从而提升单客户价值。

2021年,公司软件产品授权收入占总营收比重有所提升。2021年,公司软件产品授 权收入为1.2亿元,同比增长61.4%,占营收比重为35.9%。2019-2021年,公司软 件产品授权及配套服务业务占营收比重分别为49.6%、30.5%和20.7%。我们认为, 公司产品在商业化落地过程中,偏定制化的配套服务占比正逐渐减少,标准化软件 产品交付的营收占比有望持续提升。
公司软件产品及技术服务业务毛利率逐年上升。软件产品授权过程基本只涉及产品 安装和交付,不涉及技术服务,因此其毛利率较高。2019-2021年,软件产品授权 毛利率分别为96.9%、97.2%和97.3%。此外,随着软件产品标准化程度及客户IT技 术水平逐渐提高,公司提供的安装服务成本逐年下降。2019-2021年,软件产品授 权及配套服务毛利率分别为51.8%、58.1%和61.4%,呈现出逐年提升的趋势。总体 而言,随着标准化软件产品占总营收比重逐渐提升,公司的软件产品及技术服务业 务毛利率逐年上升。2019-2021年,软件产品及技术服务业务毛利率分别为64.4%、 66.3%和71.8%。
3.营收现阶段以大数据平台各组件为主,数据库营收快速增长
公司现阶段的营收来源以大数据计算引擎、分析组件为主。公司各软件品类中,大 数据基础平台TDH占总营收比例较大。分拆来看,其各组件中实现营收较多的以关 系型分析引擎Inceptor、实时流计算引擎Slipstream以及科学计算平台Sophon Discover等组件为主,而宽表数据库Hyperbase、图数据库StellarDB等数据库产品 实现营收占比较低。我们认为,计算引擎、分析组件等大数据平台关键核心组件是 公司过去的研发重点。经过多年迭代,核心组件的性能已具有较强竞争力,是营收 主力。
公司大数据平台代码自主化率较高,技术原创性更强,自研组件品类丰富。公司在 开源技术的基础上,对数据存储层、计算引擎层、编译器层、资源管理层等核心功能进行了重构,基本实现底层技术的自主研发。根据工信部电子五所出具的《代码 扫描测试报告》,截止2021年11月,其核心产品大数据基础平台TDH代码自主率为 74%;截止2022年5月,数据云平台TDC代码自主率为73%。我们认为,相较于国 内外厂商,公司的大数据产品自研占比较高,更加满足在部分场景自主可控、安全 可靠的要求。此外,公司的技术原创性更强,自研的组件和产品更加丰富,下游应 用场景覆盖面更广。
TDH、ArgoDB和Sophon等产品已实现部分场景的国产替代。TDH和ArgoDB产品 不仅凭借分布式架构的优势对传统数据库Oracle、IBM DB2以及Teradata等传统数 据库实现了较好的替代,还以较高的性价比和安全性实现了Ealstic Search、CDP等 海外分布式架构数据产品的替代。此外,公司开发的智能分析工具Sophon自2014 年至今持续迭代,其内置的分布式统计算法、机器学习算法可实现在大数据集上高 校的复杂统计和预测性分析,对于海外智能统计分析工具SAS有较好的替换效果。 目前,公司的大数据基础平台TDH、分布式分析型数据库ArgoDB以及智能分析工具 Sophon已在金融、能源、制造、交通等多个行业实现了关键信息系统的国产替代。
公司数据库营收快速增长,占总营收比重持续提升。在软件产品授权模式下,2021 年,公司的宽表数据库Hyperbase、搜索型数据库Scope、分析型数据库ArgoDB、 图数据库StellarDB和交易型数据库KunDB分别实现营收1036万元、1030万元、839 万元709万元和101万元。各数据库产品虽然营收规模较小,但其增速较快。 2019-2021年,在软件产品授权模式下,公司数据库产品实现的营收分别为1644万 元、2332万元和3716万元,营收CAGR为50.3%。我们认为,公司的研发采取自底 向上、由核心到应用的策略,在底层核心组件实现较大比例自研的情况下,未来有 望向各数据库研发投入更多资源。各类数据库产品功能不断完善、性能持续提升, 其实现的营收有望保持快速增长趋势。
公司分布式数据库产品代码自主化率较高,在国产替代方面更具优势。根据工信部 电子五所出具的《代码扫描测试报告》,截止2022年2月,交易型数据库KunDB代 码自主率为74.3%;截止2022年5月,分析型数据库ArgoDB代码自主率为90.6%。 我们认为,公司的数据库产品自研占比较高,更加满足在部分场景自主可控、安全 可靠的要求,在对海外产品进行国产替代过程中具有相对优势。2021年3月,中央 国家机关政府采购中心发布关于中央国家机关2021年数据库软件协议供货采购项目 成交公告,公司ArgoDB和KunDB已入围数据库管理系统供应商名单。 公司的宽表数据库Hyperbase、图数据库StellarDB等非关系型数据库推出时间早、 迭代时间久,具有较强的竞争力,营收规模相对较大。
公司的关系型数据库ArgoDB 和KunDB分别于2018、2019年推出,其升级迭代时间较短。此外,在分布式关系型 数据库领域,华为的GaussDB、阿里云的OceanBase通过自研开发,持续迭代,已 具备一定技术积累。云计算公司凭借软硬件基础设施的综合能力以及公有云部署的 优势,其关系型数据库已在多个行业、多个场景广泛落地。因此,我们预计,公司 的关系型数据库产品ArgoDB和KunDB预计将面临比非关系型数据库领域更大的竞 争压力。