成熟的分布式数据库标志是什么?

成熟的分布式数据库标志是什么?

最佳答案 匿名用户编辑于2023/02/20 14:58

分布式数据库系统成熟有两个重要的标志:功能完备,运行效率优秀。

1.功能完备

数据库系统是在实践中逐渐成长完善的软件系统,功能集是相当的庞大。数据存储、数据修改、 数据查询、数据管理等不同方面,都有各种类型的业务诉求。

数据存储方面,以 OceanBase 为例,分布式数据库在已经拥有非常高效的存储压缩的基础上, 在最新的迭代中也支持了更多的字符集。同时,对大对象的支持也是 OceanBase 一个很大的突破, 同类的其他分布式数据库对大对象支持得都不够友好。应用开发中,虽然不是所有业务都会依赖大 对象,但是总有一些业务场景比较依赖大对象功能。OceanBase 现在可以提供对大对象功能的全 面的支持。并且,在大对象功能的基础上,还支持了 JSON、GIS 等复杂数据类型,这类数据通常都会在一个元素中存储比较多的内容,如果没有大对象能力在底层做支撑,还真是不好用。

数据修改方面,OceanBase 支持了任意大小的事务,在应用的数据导入、数据订正、数据维 护等流程中,应用开发者或者数据库管理员不时会在一个事务中修改大量数据。这种使用方式,对 于传统数据库来说不是难事,对于新的分布式数据库来说,因为事务模型发生了很大改变,支持大 事务都是很大挑战。当 OceanBase 支持了任意大小事务后,使用者再也不用操心一个事务修改的 数据量是否过大。OceanBase 还全面支持了各种重整数据的 DDL 功能,比如修改主键、修改分 区键、重新定义列类型等等。再结合 OceanBase 之前就支持在线的后建索引的能力,OceanBase 已经具备了完善的对于数据维护操作的能力。对于新业务和变化很快的业务,Schema 会随着业 务发展不停的变化,有了重整数据的各种 DDL 的支持,用户就能很方便得使用 OceanBase 来承 载这种经常变化的业务场景。

数据查询方面,OceanBase 在语法上兼容 MySQL 和 Oracle,支持了从大量琐碎的函数到 存储过程等重量级功能。同时,OceanBase 的查询优化器、执行器也都不断迭代,任何数据库的 查询优化和改写能力都来自实践经验的不断积累,业界比较公认的 Oracle 的查询优化能力是很强 的,目前的 OceanBase 的查询优化器已经达到了 Oracle 的同等水准。OceanBase 的执行器的 并行执行和向量化执行能力也已经是成熟和高效的引擎,可以很好的支持大数据量的查询,这是新 兴的 HTAP 系统才具备的能力,OceanBase 这方面的能力已经超过了传统的数据库系统。

数据管理方面,数据库系统里通常都存储了用户的关键业务数据,用户使用数据库系统不仅只 是运行一个实例进行数据操作,还为了备份、安全、监管,进行各种数据管理操作。比如,定期备 份所有的数据,或者在异地搭建一个从库等。对于数据库系统来说,备份数据和搭建从库都有物理 和逻辑两种方式,物理备库和物理从库才拥有保证数据的一致性和应对所有业务场景的普适性。 OceanBase 是分布式数据库中最早支持了物理备份恢复和物理从库的系统,使用 OceanBase 可 以让数据库管理员非常方便的完成各种数据管理的任务。

2.运行效率优秀

数据库系统为什么要重视运行效率?数据库系统作为底层基础软件,其与生俱来的使命就是更 好的利用硬件来完成数据库的各种功能。作为大规模部署的通用软件,软件自身的每一点运行效率 的提升都能带来巨大的生产效率的提升和生产成本的下降,所以,所有的专业数据库系统都在不停 的优化运行效率。

相比于其他分布式数据库,OceanBase 的整体性能非常优秀。而且,OceanBase 在单机部 署时,与传统的单机数据库相比,OceanBase 的性能也非常优秀。也许有人会有疑问,分布式数 据库为什么要重视单机性能?性能优化的本质是尽可能发掘出硬件的极致,在一台服务器上的操作与跨机的操作走不同的硬件,天然有不同的特性,当然需要针对不同的特性进行优化。

换个角度看分布式系统。分布式系统是由网络连接的一组服务器上工作的系统。这里的网络指 的是以太网。但很容易被忽视的事情是服务器内部也是由若干个网络有机结合的一个系统。CPU 利用内存控制器把数据通过消息从内存中加载到 CPU 的 Cache 中。CPU 利用 IO 控制器通过消 息把数据从硬盘加载到内存中。CPU 的核心之间通过消息交换访存的信息和 Cache 的信息。每一 处都类似一个小网络不停地进行信息的交换。从运行效率角度看,以太网比机器内的网络具有很长 的传输距离、更低的传输功耗,但是操作复杂、延迟大。当不同特性的硬件摆在数据库系统设计者 的面前时,设计者一定要考虑怎么更好地利用不同层次的硬件能力,更加高效的实现数据库的特性。 OceanBase 的单机分布式一体化架构核心就是让 OceanBase 系统在一台机器上运行开销与传统 单机数据库是类似的,同时让 OceanBase 还具备分布式的扩展能力,支持利用多台服务器进行数 据存储和服务能力的扩展。

OceanBase 的一体化架构的核心就是让系统以机器为单元组织数据库的管理结构,能在一台 机器上通过本地操作和本地引用完成的事情就放在一台机器做,尽量减少跨机的操作与跨机的结构。 通过在保证扩展性的同时,还能把一台服务器的硬件能力发挥到极致,OceanBase 可以给到使用 者从一台很小规格的机器到多台服务器组成的集群都能高效运行的数据库系统。

参考报告

2022年中国数据库行业年度分析报告.pdf

2022年中国数据库行业年度分析报告。随着互联网、大数据、人工智能等新一代信息技术的创新聚变,数字化产业正在成为全球经济新的驱动引擎,以数据为核心生产要素的增长变革,成为面向网络化、智能化方向提质增效及重塑核心竞争力的基础。随着数字化转型深入推进和数据量的爆炸式增长,产业对数据库的需求发生了革命性变化。技术发展让数据创造无处不在,从企业应用到个人应用和万物互联,来自新时代的数据库挑战持续增长:数据存储从TB级别、PB级别增至EB级别;海量并发从企业内部数百至数千并发到互联网模式下百万级至亿万级并发;新的应用场景要求数据库具备弹性伸缩能力;各行业在加速信息化基础设施的分布式建设;此外端边云协同、...

查看详情
相关报告
我来回答