综合应用场景、存储架构、产品形态等多个维 度,下面对存储介质、集中式存储、分布式存储、超 融合、数据保护存储等进行介绍。
1.存储介质(存储器)
存储器主要分为外部存储器和内部存储器,如图1-1 所示,其中外部存储器包含半导体存储器、磁存储器 和光存储器,内部存储器包含易失性存储器和新型非 易失存储器。
按照读写方式,外部存储器中的半导体存储器可分为 只读存储器ROM(EEPROM、PROM、EPROM)和闪 存存储介质(NOR Flash、NAND Flash)。磁存储器 件主要包括磁带、磁盘。光存储主要包括蓝光光盘 (BD)、归档光盘(AD)、全息存储、玻璃存储等。数字化、云计算、智能化所催生的大数据爆炸性增长 的态势,加速了市场对于大容量、高性能存储设备的 需求。NAND闪存(NAND Flash)具有高性能、低延 时的特性,随着Flash颗粒单位成本的不断降低,据 IDC预测,固态硬盘(SSD)有望突破成本瓶颈,凭 借访问速度和存储密度优势,代替机械硬盘成为市场 主流存储设备。

从产品应用市场上来分,固态硬盘可分为消费级、 企业级、工业级三种类型;从接口形态上来分,包 括EMMC、UFS、SATA、PCIe等;从体系结构上来分, 包括传统架构、开放架构、ZNS(Zoned Namespace, 分区命名空间)、KV(Key-value)以及可计算存储 (CSD)等。 据IDC预测,2025年全球的SSD市场规模将由2020年 的300亿美元增长到约为500亿美元。2020年全球企 业级SSD市场规模约为169.3亿美元,主要应用于高 端存储领域,如互联网、云服务、金融、电信、能源 等行业的数据中心和人工智能等场景。2021年工业 级SSD的全球市场规模达到20亿美金,其广泛应用于 汽车制造、轨道交通、工业自动化控制、安防监控、 物联网工程、石油电力等领域,产品接口形态多样, 包括2.5寸SATA、M.2 SATA、M.2 PCIe、mSATA、BGASSD等。消费级SSD在2022年全球出货量预计3.59亿 只,主要应用于个人办公电脑、娱乐产品等方面。 企业级SSD的技术开发壁垒相比消费级SSD要高,代 表厂商有得一微、浪潮、Micron、Samsung、忆恒 创源等;消费级SSD国内外主流厂商包括长江存储、 江波龙、KIOXIA、Samsung[厂商名称按中英文首字 母排序,后文同上]等。
大数据时代,80%的数据是访问频率低的冷数据。按照 被访问频率从高到低,存储数据可分为热数据、温数 据、冷数据。经常被访问的称为热数据,较少被访问的 数据称为冷数据,处于中间状态的称为温数据。80%的 数据最终都会变为冷数据。冷数据对读取速度要求不 高,主要考虑长期存储成本,适合采用光存储方案。 光存储系统是介质技术、硬件设备技术与软件技术的融 合。光存储介质是最终数据存储的物理载体,掌握光存 储介质技术是实现蓝光数据存储系统自主可控,持续提 升系统整体性能的基础。2015年左右,国内外一些代 表厂商相继推出蓝光数据存储系统及相关产品,集成了 磁盘、SSD多种不同存储介质,可实现批量数据自动刻 录、存储、读取,支持分布式存储架构,可按需扩展存 储节点,支持磁光电统一化管理,数据分层、横向扩 展、条带化、离线管理等功能,提供RAID、多副本、冗 余恢复纠错、单盘可读、光盘巡检等多种数据保护模 式。光存储凭借其光盘存储介质的长寿命、大容量、物 理记录数据不可改写的特点,可实现海量数据长期、安 全可靠、低能耗、低成本的存储。
当前流行的光存储介质有DVD,Blu-ray和Archival Disc(AD),其中AD碟片由索尼和东芝联合启动研发, 为三层记录双面光盘制式,其中300GB AD碟片轨道 间距减小为 225 nm,数据位长度减小为79.5nm。区 别于蓝光,AD碟片的平台(Land)和沟槽(Groove) 同时刻写。AD碟片已实现300GB和500GB的单碟容 量,未来计划实现1TB容量。除传统光存储介质外, 还有包括全息存储、玻璃多维存储等技术路线正在研 发中。全息存储基于干涉原理进行数据记录,但其主 要有两个问题:(1)材料制备困难、材料稳定性 差、数据记录后的材料形变问题;(2)信号噪声 大,其中包括页内串扰、页间串扰、光电系统噪声、 材料散射噪声等。美国的InPhase、日本的Optware 都先后推出了原理样机,国内紫晶信息存储技术股份 有限公司也正在从事球面波离轴单臂全息系统的研 发。玻璃多维存储技术有包括华中科技大学、英国南安普顿大学、吉林大学等高校,华为、微软等企业正 在从事研发工作。该技术有着寿命长、耐极端环境、 容量潜力大等特点,但目前仍有写入速度慢、写入系 统昂贵等问题需要攻克。
在传统磁电存储中融入了光存储应用,解决冷数据存 储问题,光磁电混合存储开始加快业务应用落地推 广。随着企业级市场发展,产品服务形式也由单一光 存储介质拓展到光存储设备以及解决方案。市场边界 不断外延,市场需求规模呈现倍数级增长,行业也迎 来了蓬勃发展的机遇期,而具备光存储技术研发实力 的国内厂商,也迎来了跨越发展契机。光存储凭借长 期、安全、低成本、绿色节能等性能优势,在企业级 存储应用领域被重新赋能,迈入新的产业发展周期, 应用服务不断创新发展,市场需求空间出现倍数级增 长,成为支持海量数据存储,保障国家信息安全的核 心底层存储技术之一。同时,新的产业发展周期也孕 育出新的技术发展需求,光存储系统依托的底层介质 下一代全息存储介质技术开始由科学研究转入产业化 应用研究,迈入新的技术发展周期,可满足数据归 档、备份和温、冷数据的存储需求,广泛应用于金 融、医疗、气象、遥感、政务、运营商、数据中心等 行业等领域。
目前国内外的主流厂商有铼德、清华同方、苏州互盟、 SONY、松下、易华录、紫晶存储、中环、中科开迪。 按照数据存储易失性,易失性存储器包括动态存储器 DRAM、静态存储器SRAM 。非易失存储器NVRAM主 要有阻变式存储器(Resistive Random Access Memory,RRAM)、磁性随机存储器(Magnetic Random Access Memory,MRAM)、铁电随机存储 器(Ferroelectric Random Access Memory, FeRAM)相变存储器(Phase Change Memory, PCM)等。如表1-1所示,与DRAM相比,非易失性随 机存储器具有存储密度高、随机IO性能好、静态功耗 低等特征,成为下一代内存最有潜力的候选者。

2.集中式存储
集中式存储是指由一台或多台主计算机组成中心节 点,数据集中存储于这个中心节点中,并且整个系统 的所有业务单元都集中部署在这个中心节点上,系统 所有的功能均由其集中处理。主存储产品多采用集中 式存储架构。 与单机存储相比,集中式存储通常包含两个或多个控 制器。集中式存储作为机头,连接磁盘阵列、交换机 以及管理设备,通过FC、iSCSI等方式为一个或多个 主机提供存储服务。集中式存储部署方式相对简单, 集群中节点数据少,能够提供高效、稳定的数据访问 服务和高IOPS、低时延的数据处理能力,并提供快 照、镜像、克隆、主备双活容灾、云备份、其他像多 DC等数据保障机制,从而使用户的数据安全更有保 障,减少故障处理时间,对故障场景可满足高稳定 性、高可靠性以及用户服务永远在线、数据永不丢失 的要求。同时为降低用户使用成本,在高端存储中提 供重删压缩等数据缩减技术。集中式存储包括混闪存 架构和全闪存架构。近年来,随着固态硬盘(SSD) 等高速介质的应用越来越广泛,集中式存储的架构也 在渐渐往全闪存储架构的方向演进,并最终会成为主 流的方向。
集中式存储作为企业级存储市场用户的主要选择,据IDC 统计, 2021年集中式存储占中国企业级存储市场的55.6% 份额。其中集中式存储中的全闪存储因其性能及SSD介质 成本不断降低等优势,在2021年增速达到15.9%,市场份额占比高速增长,成为了用户关键应用系统的新选择。 总之,从长远看,集中式存储在其高IOPS、低时延、高 可靠、高安全等领域会占据主流,如金融、证券等关键 市场领域。因此全闪存储将成为集中式存储未来的主 流,成为未来发展的主要方向。
目前集中式存储主流厂商包括Dell EMC、HPE、华为、 宏杉、IBM、浪潮、联想、NetAPP、新华三、中电52 所、中科蓝鲸等。

3.分布式存储
分布式存储(Distributed Storage System)在计算机领 域中特指采用分布式架构的计算机信息存储系统,它通 常建立在多个标准化的通用硬件设备之上,通过软件系 统的有效管理和整合,一组各自独立的硬件设备节点在 逻辑上呈现为一个统一整体,向外界提供信息存储服 务,满足各种结构化与非结构化业务需求,应用于高性 能计算、AI应用、虚拟化/云资源池、数据库、大数据 分析和海量数据备份归档等场景。 通常具有如下典型特征:(1)系统采用分布式架构, 具有强大的横向扩展(Scale-out)能力,由地理位置 上分散的多台存储节点设备组成,通过计算机网络利用 核心软件系统进行统一管理;(2)各节点的存储资源 有效整合,资源充分池化,具备良好的扩展能力; (3)具备系统级高可用与高可靠特性,在部分设备节 点失效的情况下,仍能正常提供数据保护和存储服务。
分布式存储因其支持块、文件、HDFS、对象多种协议 的特性,被广泛应用于内容资源池、备份归档、视频存 储、高性能计算、云平台存储等多个场景,具有较好的 场景适应性。分布式存储从数据类型上可分为分布式文 件系统、分布式块存储和分布式对象存储(也称“对象 存储”)三种常见的产品形态和技术路线。分布式存储在接口、协议上以及对应用支持的发展上带来一些衍生 技术和名词,例如,分布式统一存储,能够同时提供 块、文件、对象三种数据的访问接口,常见的分布式统 一架构包括文件底座+协议网关、对象底座+协议网 关;可更好的支持云和容器技术访问和管理的云原生分 布式存储;以及更好支持流式视频数据的分布式流存储 等。
分布式存储作为近几年不断被熟知的存储产品形态,不 断被市场认可,凭借良好的扩展性、存储成本等因素, 在互联网、人工智能、大数据、云计算等新兴场景中被 广泛使用。据IDC统计,2021年分布式存 储份额为23.9%,未来5年的复合年均增长率达到 12.8%,在2026年将接近30%,成为中国企业存储市场 的重要部分。相比较而言,未来3-5年,分布式文件存 储占比会有所下降,块和对象类型缓慢增加。

目前分布式存储主流厂商包括阿里云、Dell EMC、 DDN、华为、宏杉、H3C、IBM、联想、浪潮、Pure Storage、曙光、杉岩、深信服、西安奥卡云、XSKY、 中科蓝鲸、中电52所等众厂商。 云存储是在云计算(Cloud Computing)概念上延伸和 发展出来的一个新的概念,是指通过集群应用、网格技 术或分布式文件系统等功能,将网络中大量各种不同类 型的存储设备通过应用软件集合起来协同工作,共同对 外提供数据存储和业务访问功能的一个系统。其访问不 需要内部网络连接(也称“网络附加存储”)或与存储 硬件的直接连接(也称“直接附加存储”),让云计算 能够在云环境中运行工作负载。
目前云存储的应用形式包括公共云存储、私有云存储和 混合云存储等3种类型,支持块、文件或对象3种格式, 但是在一些软件定义的云存储产品中也可将3种格式整 合到一个易于部署的统一解决方案中。一般而言,云存 储通常比传统的本地存储系统更加安全可靠且可扩展。 自2003到2006年的阶段,来自谷歌的三架马车:GFS (分布式文件存储)、BigTable(键值存储Key-Value Store)和MapReduce(大数据分析系统),以及 Chubby(分布式锁服务)的相继发表,打造了云计算 分布式系统的开发蓝本。在此期间,国外谷歌GCP、微 软Azure、亚马逊AWS,国内阿里云、百度云、华为云 相继打造了各自的云存储系统和产品。Gartner发布的 《Gartner Solution Scorecard 2021》显示,阿里云IaaS 基础设施能力拿下全球第一,在计算、存储、网络、安 全四项核心评比中均斩获最高分,这也是中国云首次超 越谷歌、微软和亚马逊等国际厂商。美国联合市场研究 公司数据显示,2015年全球云存储市场规模已经达到 了211.7亿美元,2019年达到了425亿美元,2020年在全 球企业对于经济高效的数据存储和数据保护需求的不断 增长的背景下,全球云存储市场规模突破500亿美元。
目前主流云包括阿里云、百度云、谷歌云、华三云、华 为云、浪潮云、天翼云、微软Azure、亚马逊AWS等。
4.超融合存储
超融合一体机HCI(Hyper-Converged Infrastructure)是 指在由多个通用计算机单元设备(如X86/ARM服务器) 组成的一套系统中,同时提供计算、存储和网络的融合 资源和服务能力。该架构充分利用虚拟化技术、SDS软 件定义存储技术,有效组织和管理多个节点,通过网络 聚合形成统一的虚拟资源池和基础架构。其本质仍是一 个分布式系统,拥有多个同等的节点(计算机设备), 通过核心软件将所有节点统一组织管理起来,并采用增 加节点的方式,实现整体系统能力的扩展。其优势主要 在于可降低总拥有成本、提高性能和IT团队的效率。

目前市场上超融合的产品分为两种交付形式,一种是超 融合基础架构系统Hyper-Converged Infrastructure System(HCIS),以软硬一体机的形式,将超融合软件 和硬件一起交付给用户,是超融合产品的最初形态,也 是目前市场上企业采用的主流。HCIS一体机具备敏捷部 署、易于管理和产品软硬件统一支持的优点,可以高效 的支持数据中心使用场景。 目前市场上的HCIS厂商主要有Dell EMC、HITACHI、 H3C、华为、浪潮、联想、NetAPP、青云HCI、UIT创新 科、深信服、曙光、SmartX、中电52所、中科蓝鲸等, 比较有代表性的产品包括华为的FusionCube系列、H3C UIS超融合一体机系列、浪潮InCloud Rail系列、中科蓝 鲸HCS、深信服Sangfor-HCI系列等。
另一种是超融合基础架构软件,以软件形态交付用户。 HCI软件支持更灵活更弹性的解决方案,包括“自带硬 件(Bring Your Own Hardware)”策略,解决了服务器 利旧的问题,有助于降低项目TCO (总拥有成本Total Cost of Ownership)。HCI软件与底层硬件平台松耦合, 可支持企业现有的硬件平台,无需锁定供应商,为部署 带来更多的灵活性。 国外比较有代表性的HCI软件产品有Nutanix的NDFS、 Vmware的vSAN、Maxta的MxSP、新华三的H3C UIS超 融合软件、SmartX的SMTX OS、UIT创新科的UScale 2.0等。 超融合基础设施由于其敏捷弹性、资源高效、管理极简 等特征,越来越成为企业部署数据中心的重要选择。据 IDC统计,如图1-10所示,2021年中国HCI市场保持健康 增长,同比增长41.1%,达到18亿美元的规模,未来5年 将继续以健康的速度增长,复合年增长率为12.6%, 2025年超融合市场规模将达到近33.2亿美元。超融合市 场如今已经成为厂商必争之地,大型IT厂商和创业公司 纷纷投身其中,不仅Dell、浪潮、华为等服务器大厂积 极推出相应的产品,同时还催生了Nutanix、SimpliVity 以及国内SmartX等为代表的一大批初创企业。
5.数据保护存储
随着金融在线交易、智能制造、政务信息化、文旅数 字化等业务的快速发展,自然灾害、人为破坏、勒索 软件攻击对企业核心价值数据的威胁越来越大,如何 保障业务不中断、数据不丢失,成为全行业共同关注 的焦点,围绕数据生命周期提供“热数据容灾、温数 据备份和冷数据归档”的全面保护将变得越来越重 要。2020年全球数据保护市场达到613亿美元,预计 到2026年可达1134亿美元,年均复合增长率有 9.1%。2021年我国颁布《数据安全法》、《个人隐私保护法》、《数据安全管理条例》等法律法规以及 一系列相关政策,将对未来几年数据复制与保护市场 产生积极影响。 主要的数据保护存储设备制造商有爱数、 Commvault、Dell EMC、Druva、HPE、华为、IBM、 浪潮、Veritas、英方、中兴等。 从数据保护场景来看,可分为容灾、备份、归档三大 类场景;按数据存储方式可以分为在线、近线、离线 三种方式。
数据容灾对于需要被高频应用、高密度访问的“热数 据”体系来说尤为重要。容灾系统的目的在保证系统 数据和服务的“在线性”,即当系统发生故障时,仍 然能够正常地向网络系统提供数据和服务,以使系统 不致停顿。常见的容灾系统架构包括单中心容灾、同 城互备、同城双活、两地三中心等。 备份是用于做数据的保护,防止应用或者核心数据丢 失,定期或者实时将数据保存在其他介质或存储设备 上,保证在源端数据丢失的情况下做数据的恢复,同 时保存的数据可以做其他开发、测试或其他大数据分 析使用。 数据归档是将不再经常使用的数据移到一个单独的存 储设备来进行长期保存的过程,常用的存档介质包括 磁带、光学介质存储、磁盘存储、云存档等。
数据备份是容灾的基础,是指为防止系统出现操作失 误或系统故障导致数据丢失,而将全部或部分数据集 合从应用主机的硬盘或阵列复制到其它的存储介质的 过程。传统的数据备份主要是采用内置或外置的磁带 机进行冷备份,随着技术的不断发展,数据的海量增 加,不少的企业开始采用网络备份。网络备份一般通 过专业的数据存储管理软件结合相应的硬件和存储设 备来实现。 国际上代表性的数据保护一体机有Dell EMC公司的 PowerProtect DP系列和DD系列、Veritas公司的 NetBackup和Backup Exec、IBM公司的Spectrum Protect、HPE公司的StoreOnce D2D系列和StorageWorks D2D系列、NetApp公司的NearStore VTL系列 等产品;国内厂商推出的相关设备有华为DPA系列和 OceanProtect X系列、浪潮DP系列和TL系列、腾讯 TStor B2000等。此外比较有代表性的数据保护软件 有Dell EMC的Avamar、Networker、Data Protection Advisor、RecoverPoint等产品,以及Veritas Storage Foundation、NetApp SnapCenter、浪潮DPS软件、 华为OceanStor BCManager等。
随着云计算技术的发展和应用,云数据保护目前应用 也较为普遍。云数据保护是采用云应用程序和云存储 服务管理数据副本,实现本地数据或云端部分数据损 坏、丢失或服务中断时可恢复使用。目前,流行的云 数据保护方案有云备份、云归档、多云等技术。 国内外有影响力的产品有Dell EMC DDCloudTier & ECS、HPE Cloud Bank Storage、NetApp Cloud Backup、Veritas NetBackup SaaS Protection、 Druva InSync、英方i2Cloud Box、Commvault Metallic等。