数据库按照数据模型、设计架构等维度可分为多种类型。
数据库(Database)是一个长期存储在计算机内的、有组织的、可共享的、统一管理的大量数据的集合软件,与芯片、操作系统共同组成IT系统的核心,广泛服务于各类行 业应用。按照不同的维度,数据库划分为不同类型:(1)按数据模型:分为关系型数据库(SQL)、非关系型数据库(NoSQL);(2)按设计架构:分为集中式数据库、 分布式数据库;(3)按部署模式:分为本地部署数据库和云部署数据库;(4)按业务负载特征:分为 OLTP 数据库、OLAP 数据库和 HTAP 数据库。
数据库起源于上世纪60年代,在90年代前后IBM、甲骨文等相继进入中国,由于当时国内信息化技术薄弱,国外数据库厂商轻易垄断了中国数据库市场,银行业数据库市场 几乎全被国外厂商占领。2000年左右,国产数据库厂商相继成立并开始发展,2016年左右国内开始了国产数据库替代试点,目前国产数据库替代工作已经进入规模化推广 阶段,并逐步深入到核心系统。

我国银行可分为中央银行、政策性银行、大型国有商业银行、股份制银行、城市商业银行、农村金融机构六大类,除中央银行和政策性银行外,商业银行因资产规模不同, 科技投入存在巨大差异,大型国有银行年度科技投入在100-300亿元之间,股份制商业银行在10-150亿元之间,城商行和农商行为百万元到数十亿元不等。
银行IT系统主要可以划分为业务系统、渠道系统、管理系统、支持系统以及外部系统。2000年中国银行业开始数据大集中,追求大而全的业务系统,很多业务系统、渠道系 统和管理系统均被纳入核心系统范畴,被称做“胖核心”。但随着行业的不断发展,2008年前后,银行核心系统越来越庞大复杂,再加上移动互联网的广泛应用,曾经的 “胖核心”架构无法满足银行业发展需求,为应对金融业务的频繁变动,银行业务系统开始拆分为多个子系统或中心,开始进入“瘦核心”架构阶段。至2015年微众银行、 网商银行采用分布式微服务、单元化架构为银行业提供新的设计思路。2017年中国人民银行提出发展规划,鼓励实施架构转型,推动了分布式核心系统的发展。
根据业务场景不同,对于数据库技术要求有共性也有差异,如客户账户查询、存/取/汇/贷款业务、小额支付业务等场景,业务时效性要求高、不同业务类型SQL混合请求、 强事务⼀致性,小事务高并发;计提结息、总分核对、会计科目记账等场景,业务时效性要求相对较低,批量提交SQL,单位时间内对单个数据表读写量大,大事务高并发。 根据业务场景从技术角度进行分类,可重点从数据规模、事务一致性、负载特征、数据分析能力、应用适配能力等角度进行对比,并得出合适的技术架构。

根据金融信息化研究所数据,在2022年我国银行业国产数据库应用占比已经达到17.88%。至2024年,根据第一新声对于业内典型数据库厂商的调研结果,普遍认为当前银 行业国产数据库使用占比已经超过20%。商业银行中,国有大型商业银行国产数据库替代推进策略与中小商业银行存在明显差异,头部大行肩负国产替代试点示范任务,同 时具备人员能力、技术储备以及雄厚财力等优势,普遍采取先核心再外围的替代策略。而中小银行因综合能力相对欠缺,普遍采用“先简单再复杂、先外围再核心”的策略。 在绝对数量方面中小银行占据绝大多数,因此银行业整体来看,核心系统替代率明显低于外围系统替代。
当前国内数据库厂商中,集中式数据库代表厂商有GBASE南大通用、达梦数据、电科金仓等,分布式数据库代表厂商有腾讯云、奥星贝斯、平凯星辰等。涉及到开源数据库 产品的厂商较多,众多开源数据库主要基于MySQL、PostgreSQL、openGauss(基于PostgreSQL重写)、Greenplum等开源路线。
根据第一新声研究,2022-2027年中国金融业数据库整体市场将维持较高增长态势 ,2024年整体市场规模预计为44.7亿元,到2027年预计将超百亿元。金融数据库市场中, 银行业占比最高,占金融整体数据库市场规模比例为80%左右,预计2024年中国银行业数据库市场规模达到35.8亿元。

按数据模型不同,数据库可分为关系型数据库和非关系型数据库,其中关系型数据库占比为83.5%,非关系型数据库占比为16.5%。关系型数据库更适合高并发读写、严格 数据一致性、复杂查询和处理等场景,但是银行业对于海量基础数据背后信息的挖掘,为非关系型数据库提供了丰富的应用场景。
按业务负载不同,数据库可分为OLTP(联机事务处理)数据库、OLAP(联机分析处理)数据库、HTAP(混合事务/分析处理)数据库。根据金融信息化研究所数据,我国 银行业数据库中,OLTP数据库占比非常高,约为65.48%,OLAP数据库占比20.67%,HTAP数据库占比13.85%。
按设计架构不同,数据库可分为集中式数据库和分布式数据库。根据金融信息化研究所数据,我国银行业数据库中,仍旧以集中式架构占据主导地位,应用占比接近80%。 分布式数据库占比约20%,虽然占比较低,近年来受央行相关政策引导、国产数据库单机能力不足、互联网大厂及各方的技术普及和宣传等因素影响,分布式数据库在银行 业受关注程度不断提升。
信创产业经历多年发展,国产替 代已经步入深水区,尤其金融业 信创推进节奏显著高于电力、教 育、医疗等其他行业。从银行业 数据库来看,银行对于数据安全 要求极高,所以普遍采用本地部 署,而不采用公有云部署; 国产数据库厂商经过持续深耕, 在银行业渗透不断提升,当前在 银行业市场中已经处于主导地位。 截至2023年末,根据第一新声 不完全统计结果,9家典型国产 数据库厂商在银行业本地部署数 据库累计装机部署接近6万套。9 家典型厂商中,已有6家厂商的 累计银行业客户数超过50家。
从发展历程角度,我国数据库起步较晚,为迅速完成数据库产品商用,开源成为大部分数据库厂商发展的优先技术路线。开源数据库具备源码公开、功能丰富、成本低、获 取途径广等诸多优势,社区支持为日益复杂的业务需求贡献越来越多的解决方案,使得开源数据库在银行业得以广泛使用。但同时开源数据库也面临开源协议、安全漏洞、 侵权、感染、停服、断供等诸多风险。伴随国际局势变化,科技行业合规压力日益增大,以全球最大的开源项目之一Linux内核项目为例,2024年10月18日,11名俄罗斯 开发者因合规要求被从维护者名单中除名,表明开源社区在全球政治技术合作中,面临的形势将日趋复杂和多变。

近年来,国产数据库在银行业替代取得丰富成果的同时,仍旧面临诸多问题和痛点亟待解决。规划选型阶段,替代节奏紧张、中小银行选型能力受限;替换实施阶段,迁移 过程稳定性与连续性、性能要求、异地灾备、服务器、数据一致性等皆对国产数据库提出较大挑战;到实际应用阶段,国产数据库替代存在很多双轨并行,应用适配经验不 足,真正从“能用”到“好用”仍需沉淀。