当前已进入后关系型阶段。
从数据库分类来看:数据库管理系统是“按照数据结构来组织、存储和管理数 据的仓库”,是一种用于建立、使用、操纵和管理数据库的大型基础软件,既 是业务数据的存储中心,也是统计分析计算的基础,对 IT 核心系统起着关键性 作用,是信息化时代、大数据时代中各行各业不可或缺的重要基础软件。按其 管理的数据结构,可分为关系型数据库、非关系型数据库(NoSQL,包括键值 型、文档型、图、对象型等);按其设计架构可分为集中式数据库和分布式数 据库;按其部署模式可分为本地数据库和云数据库;按其应用场景可分为 OLTP 事务型数据库、OLAP 分析型数据库、HTAP 混合型数据库;按其存储介 质可分为磁盘数据库和内存数据库;按其商业模式可分为商业数据库和开源数 据库。
从市场规模和增速来看:Gartner 发布的 2022 年全球数据库管理系统市场报告 显示,2022 年全球数据库管理系统(DBMS)市场达到 910 亿美元,相较前一年 增长了 14.4%,超过了整体软件市场 11.3%的增长。其中,非关系型 DBMS 市 场增长 26.8%,占 DBMS 市场份额的 21%,而关系型 DBMS(RDBMS)市场增 长 12.2%,市场份额为 78%。根据艾瑞咨询的研究数据,国内 2022 年集中式 数据库市场份额约 80%,分布式部署不到 20%。根据阿里云官网援引 Gartner的预测数据,2021 年,云数据库在整个数据库市场中的占比首次达到 50%,到 2022 年,预计将有 75%的数据库天然部署或迁移至云平台。数据库上云将成为 未来数据库的发展趋势。

根据中国信息通信研究院《数据库发展研究报告(2021)》,数据库技术演进 与互联网发展相互促进,数据库共经历前关系型、关系型和后关系型三大阶段, 当前已进入后关系型。
(1)前关系型阶段(1960-1970),解决数据集中存储和共享等问题,网状层 次数据库初尝探索。数据模型主要基于网状模型和层次模型,代表产品为 IDS 和 IMS,该类产品在当时较好地解决了数据集中存储和共享的问题,但在数据 抽象程度和独立性上存在明显不足。 1963 年,通用电气公司的 Charles Bachman 等人开发出世界上第一个数 据库管理系统(以下简称 DBMS)也是第一个网状 DBMS——集成数据存 储(Integrated Data Store,IDS)。 同时期为解决“阿波罗登月”计划处理庞大数据量的需求,北美航空公司 (NAA)开发出 GUAM 软件。其设计思想是将多个小组件构成较大组件,最 终组成完整产品。这是一种倒置树的结构,也被称之为层次结构。随后 IBM 加入 NAA,将 GUAM 发展成为 IMS(Information Management System)系统并发布于 1968 年,成为最早商品化的层次 DBMS。
(2)关系型阶段(1970-2008),关系型数据库大规模应用,主要应用于银行、 军工、政府等以处理结构化数据。以 IBM 公司研究员 E.F.Codd 提出关系模型 概念,论述范式理论作为开启标志,期间诞生了一批以 DB2、Sybase、Oracle、 SQL Server、MySQL、PostgreSQL 等为代表的广泛应用的关系型数据库,该 阶段技术脉络逐步清晰、市场格局趋于稳定。 1970 年,IBM 实验室的 Edgar Frank Codd 发表了一篇题为《大型共享数 据库数据的关系模型》论文,提出基于集合论和谓词逻辑的关系模型,为 关系型数据库技术奠定了理论基础。 1974 年,Ingres 原型诞生,为后续大量基于其源码开发的 PostgreSQL、 Sybase、Informix 和 Tandem 等著名产品打下坚实基础。1977 年, Oracle 前身 SDL 成立。1978 年,SDL 发布 Oracle 第一个版本。 20 世纪 80 年代,关系型数据库进入商业化时代。20 世纪 90 年代, Access、PostgreSQL 和 MySQL 相继发布。至此,关系型数据库理论得 到了充分的完善、扩展和应用。
(3)后关系型阶段(2008-至今),因数据量膨胀、数据类型不断丰富、数据 应用不断深化,模型拓展与架构解耦并存。进入 21 世纪,随着信息技术及互联网不断进步,数据量呈现爆发式增长,各行业领域对数据库技术提出了更多需 求,数据模型不断丰富。谷歌的三篇论文开启后关系型数据库阶段,该阶段由 于数据规模爆炸增长、数据类型不断丰富、数据应用不断深化,技术路线呈现 多样化发展。随着各行业数字化转型不断深入,5G、云计算等新兴技术快速发 展,传统数据库的应用系统纷纷优化升级。根据信通院《数据库发展研究报告 (2021 年)》,后关系型阶段的数据库演变特征包括:数据模型不断拓展,非 关系型数据库开始兴起,NoSQL 数据库应运而生;分布式架构逐渐成熟;统一 框架支撑分析与事务混合处理;与云基础设施深度结合。
根据 Gartner 2011-2022 年 DBMS 市场份额排名变化,可以发现以下几大技术 趋势:(1)云数据库厂商崛起。Amazon、Google、Alibaba、Huawei、 Tencent 等均借助云优势排名稳步上升,其中 Amazon 于 22 年上升一位超越 Microsoft 位居第一;Oracle、IBM、SAP 等传统型数据库厂商排名略有下降; 数仓和大数据分析平台方面,Snowflake、Databricks 也借助云数仓优势排名上 升,而 Teradata、Cloudera、Marklogic 排名均有所下降。(2)非关系型数据 库广受关注。在 22 年份额排名靠前的数据库厂商中,文档数据库 MongoDB、 图数据库 Neo4j 和 TigerGraph 均成功抓住 NoSQL 发展机遇跻身榜单。 Gartner 2023 年数据库管理系统魔力象限展示出了相近的结论:AWS 连续 9 年位列领导者;微软、甲骨文、谷歌等国外科技巨头同样位于领导者象限; Snowflake、Databricks、MongoDB、Neo4j 等新型数据库厂商表现突出;我国 厂商阿里云入选魔力象限。

根据 DB-Engines 按照受欢迎程度排序的数据库榜单:Oracle、MySQL、 Microsoft SQL Server、PostgreSQL 四大流行的关系型数据库位列榜单前四, 第五到七名分别为文档数据库 MongoDB、键数据库 Redis、搜索引擎数据库 Elasticsearch。 而根据各款数据库产品受欢迎程度:文档数据库 MongoDB、云数仓厂商Snowflake、微软推出的云数据库产品 Microsoft Azure SQL Database、搜索引 擎数据库 Splunk 等热度前列,再次印证云和非关系型数据库系大数据时代下的 “利器”。