(报告出品方:华泰证券)
产业概览:关系型数据库占主流,分布式时代加速到来
数据库是信息系统运行的关键基础。从定义来看,数据库是按照一定的数据结构组织、存储和管理数据的仓库,在计算机中一般由一个或者一组文件构成;从本质来看,计算机解决的是数据计算和数据处理问题,数据库则是计算机应用系统中的专门管理数据资源的系统;从架构上看,数据库作为计算机三大基础软件(操作系统、数据库、中间件)之一,向下可充分发挥硬件算力,向上支撑上层的应用需求,是信息系统高效运行的关键基础。
数据库软件的核心是数据库管理系统。数据库作为基础软件,可面向多种应用,被多个用户、程序共享,其中数据库管理系统(DataBaseManagementSystem,DBMS)负责搭建、处理、维护数据库的数据及数据间逻辑关系,由外部组件集与内核组件集共同组成:1)外部组件集:以数据库配套的独立支撑软件为主,例如数据库驱动;2)内核组件集:一般可以分为管理组件、网络组件、计算组件、存储组件四大模块。
产业复盘:变革与数据需求相协同,发展迈入后关系型阶段
自20世纪60年代以来,数据库行业随信息技术发展而快速演变,主要经历了三大阶段:1)前关系型阶段(-):年查尔斯·巴赫曼(CharlesBachman)开发出第一个数据库管理系统,网状数据管理系统IDS(IntegratedDataStore)初步成型;随后为解决阿波罗登月计划所需的大量数据,年IMS(InformationManagementSystem)系统作为最早商业化的DBMS正式发布;此阶段数据库主要解决了数据独立存储、统一管理、统一访问的问题,实现了数据与程序分离,但缺乏被广泛接受的理论基础;2)关系型阶段(-):年,员埃德加·科德(EdgarF.Codd)发表《大型共享数据库的数据关系模型》,关系型模型理论被初步提出;随后关系型数据库(RelationalDatabaseManagementSystem,RDBMS)诞生,国际标准组织将SQL作为国际数据库标准语言,并进行标准化,SQL成为关系型数据库主流语言并引领变革,Access、MySQL、PostgreSQL等大批关系型数据库诞生,带动关系型数据库完成了从理论到实践的转换;3)后关系型阶段(-至今):随着Web2.0的到来,数据量出现指数增长,传统关系型数据库无法有效对应日新月异的数据类型及业务场景,为更有效地处理海量数据,应对多样的数据结构,NoSQL、NewSQL等非关系型数库脱颖而出,数据库迈入第三发展阶段。
根据数据结构、架构模型、业务负载特征的不同,数据库可划分为不同类别。为了更清楚的了解数据库之间的特性差异,数据库产品可依照不同标准进行分类,常见的分类依据包括数据结构、架构模型、业务负载特征、部署方式等,其中数据结构类型是最常用的标准。1)根据数据结构类型:可分为关系型数据库、NoSQL数据库、NewSQL数据库;2)根据架构模型:可分为集中式数据库、分布式数据库;3)根据业务负载特性:可分为OLAP数据库(分析型数据库)、OLTP数据库(事务型数据库)、HTAP数据库(混合型数据库)。
按数据结构分类:关系型、NoSQL、NewSQL
数据库的数据结构类型随存储需求变化而不断拓展。最早的数据存储需求主要来源于结构化数据,因此数据库产品多采用关系型架构,主流产品包括:Oracle、MySQL、PostgreSQL等;年以后随着互联网应用的快速普及,产生大量非结构化数据的存储需求,NoSQL数据库快速兴起,主流产品包括Redis、MongoDB等;后来为解决NoSQL数据库缺乏强一致性及事务支持的问题,NewSQL数据库逐步发展,主流产品包括:Spanner、TiDB等。
1)关系型数据库
关系型数据库是由多个二维表所组成的集合。关系型数据库,是指采用了关系模型来组织数据的数据库,数据以行和列的形式进行存储,这一系列的行和列被称为表,一组表组成了数据库。表格之中每一行通过独有的主码(PrimaryKey)来区分彼此,每一列都拥有统一的数据类型,外码(ForeignKey)通常与主码(PrimaryKey)一起使用,用于建立表与表之间的联系,通过匹配外码以寻找相应的行。
关系型数据库具备ACID特性,为主流数据库类型。关系型数据库严格遵循原子性Atomicity、一致性Consistency、隔离性Isolation、持久性Durability(以上简称ACID特性),在维护数据库完整性、数据一致性方面优势突出,适用于对数据安全性、事务支持高度要求的应用场景。1)原子性:为避免不同指令之间的冲突,数据库中的事务执行被视为原子不可再分,指令要么全部成功执行,要么失败而保持原状;2)一致性:为确保业务逻辑一致性,数据库设置约束与触发器保证数据库完整性,任何事务看到的数据总保持一致;3)隔离性:数据库通过加锁,保证事务之间相互隔离,从而避免脏读、幻读等;4)持久性:为避免数据库丢失等意外事故,数据库所有指令都将会被永久保存,不会被回滚。
2)NoSQL(NotOnlySQL)数据库
NoSQL数据库尝试解决关系型数据库的扩展可用性缺陷。不同于关系型数据库,NoSQL数据库只遵守BASE模型:基本可用BasicallyAvaliable、软状态Softstate、最终一致性Eventualconsistency:1)基本可用:当系统出现故障时,NoSQL数据库不像关系型数据库一样进行强制拒绝,而是允许损失部分可用功能或降低响应速度,以保证核心功能可用;2)软状态:在处理数据过程中,允许数据状态出现暂时不一致的情况;3)最终一致性:NoSQL数据库只追求最终的结果一致,数据处理的过程中暂时不一致将被允许。NoSQL数据库解决了关系型数据库刚性架构的拓展性缺陷,NoSQL的动态架构可实现横向扩展。
NoSQL数据库更适用于海量数据的快速读写场景。NoSQL概念早在年就已经被CarloStrozzi提出,21世纪初才进入规模化发展阶段,主要原因在于年互联网进入Web2.0时代,大量非结构化数据出现,数据量呈现指数型增长,传统的关系型数据在非结构化数据处理、海量数据快速读写、数据库扩展等方面的劣势逐渐暴露,因此,基于BASE特性的NoSQL架构被重新提出并得到快速发展,MongoDB、Redis、HBase等NoSQL数据库逐步进入大众视野,并实现了在电商、社交网络、搜索引擎等领域的应用落地。
常见NoSQL数据库主要包括键值型数据库、列族数据库、文档数据库、图数据库:(1)键值型数据库:适用于内容缓存,如会话、配置文件、参数等。其扩展性高,灵活性好,大量操作时性能高,但数据无结构化,查询方法单一;(2)列族数据库:适用于分布式数据存储与管理,将同一列数据存在一起,可扩展性强,查找速度快,复杂性低,但功能局限;(3)文档数据库:适用于存储文档数据,数据结构灵活,但缺乏统一查询语法;(4)图数据库:适用于图像数据、社交网络、推荐系统,专注构建关系图谱,支持复杂的图形算法,但只能支持一定的数据规模。
3)NewSQL数据库
NewSQL数据库实现关系型数据库与NoSQL数据库的优势整合。尽管NoSQL数据库处理数据的速度快,常用于处理海量数据,但NoSQL数据库并不遵守ACID原则,无法满足事务一致性要求。年,MatthewAslett提出NewSQL(可横向扩展的OLTP关系型数据库)概念,年谷歌公司发布Spanner与F1论文,用原子钟和TruetimeAPI解决分布式问题,推动NewSQL快速发展。NewSQL架构旨在整合关系型数据库与NoSQL数据库的优势:1)保留NoSQL数据库对海量数据处理的速度与可扩展性;2)采用以SQL为主要接口的关系数据模型,保持传统关系型数据库的ACID特性。近年来NewSQL数据库快速发展,主要包括三类发展路径:1)基于全新的架构设计,代表产品为GoogleSpanner、SAPHANA;2)基于分片中间件,代表产品为ScaleArc;3)基于云服务商的DaaS(database-as-a-service)平台,代表产品为AmazonAurora、ClearDB。
关系型数据库与非关系型数据库各有千秋。对比来看,1)关系型数据库:严格遵守ACID原则,具备较强的约束性以及数据完整性,利于数据库的管理的同时也导致数据库难以扩展,在业务快速发展的信息时代存在一定的成本劣势;其二维的数据结构减少了数据的冗余,但读取海量数据效率不理想;作为传统数据库,关系型数据库发展时间长,技术成熟,学习成本低;2)NoSQL数据库:遵守BASE原则,相较于关系型数据库,更便于扩展,储存模式简单,查询速度更快;但其极高的可用性在一致性上做出了妥协,使用成本较高且不利于管理,相关技术具备较高的成熟度;3)NewSQL数据库:在底层解决了事务一致性问题,并整合了NoSQL在可扩展性、可用性上的优势,但NewSQL技术较新,学习成本较高,且目前大多NewSQL只适用特定场景,距离普及还需要一定时间。
按架构模型分类:集中式架构、分布式架构
集中式数据库指将信息存储、维护在单个位置的数据库。集中式数据库利用系统中心的服务器统一管理所有资源,对数据进行集中储存及管理,并由一台机器作为服务器。由于集中数据库的所有数据仅存储在单个位置,因此在数据访问、协调、管理方面具有突出优势,同时相较于其他数据库成本更低,为大多数企业最开始的选择。但随着数据存储需求的变化,集中式数据库的缺点逐渐显现:1)难以扩展:只能通过提升硬件性能实现数据处理性能的提升;2)容灾性差:集中式数据库采用完全共享(Shared-everything)架构,一旦任何环节发生系统故障,整个数据库系统都将无法使用。
常见的集中式数据库架构,主要包括一主多备、一写多读、多写多读三类:1)一主多备(备用不可读):使用单台主机模式部署,其他备机为主机备份数据,并在主机宕机的情况下代替主机提供服务;2)一写多读:一个节点提供写服务,其他多个节点提供读服务,写节点宕机时,读节点可以代替写节点来提供服务;3)多写多读:多个计算节点共享存储,每个节点都提供读写服务,同时采用分布式锁或集中式锁解决写冲突。分布式架构逐渐成熟,主要解决集中式架构扩展性差的问题。不同于既重视数据库统一处理数据的架构,分布式数据库将数据分散在多个相互连接的节点上,通过使用多台机器,将需要处理的数据、工作均衡分散到各个节点中,各节点相互连接又能够独立工作,节点故障不会对其他节点产生影响。因此,近年来随业务拓展与数据体量变大,分布式架构成为众多企业的选择。分布式数据库涵盖两大核心技术:1)数据的复制/分区:通过复制或分区实现数据的多节点存放,复制包括主从复制、对等复制,分区包括垂直分区、水平分区(即分片);2)分布式事务:通过机制设计保证分布式环境下事务的ACID特性,包括两阶段提交(2PC)、三阶段提交(3PC)、最大努力通知等解决方案。
分布式数据库技术路线选择上,都是以解决数据容量扩展问题为首要目标,主流方案包括三类:1)分库分表+中间件:下层的单机数据库提供存储和执行能力,在多个单机数据库上封装一层中间层补充分布式能力,以统一的数据分片规则管理分布在不同数据库节点的数据;2)共享存储架构:计算节点独立并且共享一个不带计算功能的存储集群(Shared-storage),采用存算分离架构,计算层和存储层都可以动态扩缩容;3)去中心化架构:每个节点有独立的计算和存储功能,采用存算分离架构,并且节点之间不共享数据(Shared-nothing),分布式集群的每个节点都是独立节点。
按业务负载分类:OLAP、OLTP、HTAP
OLAP为分析型数据库,OLTP系统为事务型数据库。按业务负载类型区分,数据库大致可以分成两大类:联机事务处理OLTP(On-LineTransactionProcessing)、联机分析处理OLAP(On-LineAnalyticalProcessing):1)OLTP是传统的关系型数据库的主要应用,主要是基本的、日常的事务处理,记录即时的增、删、改、查,例如银行交易;2)OLAP是数据仓库系统的主要应用,支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果,典型的应用就是复杂的动态报表系统。
发展趋势:数据、计算双重变化加速分布式数据库时代到来
数据库的发展与计算载体紧密相关。数据库是计算机行业的基础核心软件,所有应用软件的运行和数据处理都要与其进行数据交互。数据库的开发难度,不仅体现在与其他基础器件的适配,更在于如何实现对数据高效、稳定、持续的管理。从数据库的发展历程来看,计算架构的变化,计算载体的变化、计算场景的变化,以及计算数据格式的变化都对数据库的发展带来一定影响。或者说,在以上计算环境变化下,其需要的数据库类型也发生了变化。从计算载体来看,数据的计算从原来的大型机、到小型机、个人电脑PC、互联网、移动互联网、云计算,以及未来更多终端的物联网智能终端。计算的载体更加多样化。从计算场景来看,数据计算也从单独的单机计算,到互联网多群体交互的联网计算和云计算,以及万物互联的高并发、低时延的物联网计算。从计算架构来看,传统的IT架构也正逐步向云架构迁移。我们也经历了从C-S架构到B-S架构,而目前的云原生、分布式计算架构正对传统计算架构带来深刻变革。而新的计算架构也对计算的基础软件(操作系统、数据库、芯片等)提出更高的需求。
在以上计算环境的变化下,我们看到,联网的数据也在发生深刻变化。数据的大小。目前联网数据量也在高速增长。通信技术的发展带动从2G到3G、4G、5G的演进,每代通信技术之间,联网的数据规模也呈现(几个)数量级的增加。对大容量、高性能计算提出更高要求。数据的类型。计算场景的演变,我们对数据的定义也在发生变化。图片、语音、视频等非结构化数据成为增量数据的主要类型。联网的数据类型也逐步从原来的结构化数据到非结构化数据演变,这就对计算的并发性提出了更高的要求。数据的快慢。对数据的高速计算是计算机一直以来的追求。但原有的IT架构下,计算速度的提升存在一定的物理条件限制。经典的IT架构已经存在了几十年的历史,当时的IT架构并没有完全考虑到目前计算场景的变化。因此,新的计算场景下,对数据高速计算的追求,需要我们从底层基础软件的变革开始。我们看到无论芯片、操作系统还是数据库,都在经历深刻变革。
全球关系型数据库市场增速渐趋平稳。近年来受数据量激增以及数据类型不断丰富影响,传统关系型数据库的流行程度呈下降趋势,据DB-Engines数据显示,近24个月关系型数据库的市场流行度下降8.23pct,市场增速逐步趋于平缓,据T4.ai预测,-年全球关系型数据库市场规模复合增长率为6%,较-年的11%或将有所下降。非关系型数据库的市场份额占比快速提升,根据Gartner年发布的《全球数据库管理系统(DBMS)市场报告》,年全球非关系型数据库的市场收入达亿美元,占总体数据库市场的19%,相较于年8%的市场占比,非关系型数据库的市场份额显著提升。
全球数据量激增,分布式数据库机遇显现。随着智能移动手机普及、云计算的兴起以及互联网的快速发展,全球数据量不断攀升,据IDC数据显示,全球数据量已从年的1.2ZB增长至年的59ZB,复合增长率高达47.63%。据IDC预测,年全球数据量将进一步增长至ZB,-年复合增长率为24.29%。随着数据量上升,全球数据库规模快速增长,据Gartner预测,年全球数据库市场规模有望突破千亿美元,-年复合增长率为13.78%,同时大数据分析、高并发计算、非结构化/异构数据处理的需求日益显现,分布式数据库兼具拓展性与高可用性,或将成为数据库行业新的增量市场。
在非结构化数据与高并发计算需求的推动下,分布式数据时代加速到来。在计算、数据的双重变革下,我们认为,数据库行业的发展演进也将经历重要的技术变革。在传统计算环境和数据类型方面,传统的关系型数据库依然发挥着重要的作用;但面向未来新的计算场景与数据需求,数据库产品亟需进行技术升级以适应下游需求的变化,通过统计国内外典型数据库厂商的技术路线及产品体系变化,我们判断,数据库行业已进入以云数据库、分布式数据库为代表的3.0阶段。
竞争格局:海外数据库先发优势突出,国产数据库快速发展
全球数据库产业呈现海外厂商主导的典型特征。相较海外厂商来说,国内数据库研究起步较晚,大约是20世纪90年代改革开放以后才开始进入萌芽阶段,该阶段数据库研究主要源自国家的相关研究计划或者大学科研需求,缺乏实际的业务场景驱动,因此数据库技术发展较为缓慢。从全球市场来看,以Microsoft、Oracle为代表的海外数据库数据库厂商仍占据绝大部分市场份额,处于绝对领导地位,根据Gartner发布的《年全球数据库研究报告》,全球共14家企业入选事务型数据库魔力四象限(中国仅1家入榜),19家企业入选分析型数据库魔力四象限(中国仅3家入榜),处于领导者象限的企业均为海外厂商。
根据Gartner发布的《全球数据库市场份额报告》,微软连续两年市场占有率排名第一,年占全球市场份额24.0%,与年相比略有下降;亚马逊云科技AWS市场占有率排名上升,主要受其云数据库产品快速增长带动,年AWS云数据库产品同比增长42.3%,约为全球云数据库市场增长率22.3%的两倍;Oracle数据库市场占有率排名略有下降,年占全球市场份额20.6%,主要由于Oracle云数据库增速远低于市场增速。
国产数据库国际影响力快速提升:1)云数据库表现优异:年OceanBase数据库打破数据库基准性能测试(TPC-C)世界纪录,且于-年连续三年稳居首位;年阿里云、华为云数据库产品分别入选Gartner《全球云数据库魔力象限报告》领导者象限、特定领域者象限;2)非关系型数据库受国际认可:根据DB-Engines发布的数据库管理系统受欢迎程度排名,年2月,智臾科技DolphinDB荣登时序数据库排行第10位,年10月,智臾科技DolphinDB、涛思数据TDengine、阿里TSDB,依次位列时序数据库排行第9、13、35位;年5月,欧若数网NebulaGraph、华为云GraphBase、百度智能云HugeGraph图数据库,依次位列图数据库排行第15、28、30名。
数据库产品包含开源数据库、商业数据库两种商业模式。其中,商业数据库收费方式主要有两种:1)本地部署:本地部署的商业数据库,一般采用License订阅方式收费,一般按用户数或者按CPU数定价,按年订阅,以Oracle为典型代表;2)公有云部署:公有云部署的商业数据库,除了License收费还可采用SaaS收费方式,用户可按用量付费,按年/季度/月收费,以Snowflake为典型代表;开源数据库供用户免费使用,主要商业模式包括三种:1)完全开源式:借助基金会完全托管,以HBase为典型代表;2)开源版本和商业版本分别运营:通过运营开源版本社区积累人才、应用场景、市场品牌等,再通过售卖商业版本获取利润,以TiDB为典型代表;3)先开源后闭源:运作前期通过开源社区优化产品与品牌,之后停止社区的维护将产品闭源商业化,以Neo4j为典型代表。
国产数据库:产业机遇明朗,国产品牌迅速成长
国产数据库迎来产业*金期,国产替代空间广阔。国产数据库产业*金期加速到来,主要受三方面因素影响:1)数据库广泛开源:全球数据库开源趋势明显,据DB-Engines数据显示,年1月起开源数据库流行程度反超商业数据库,数据库开源为国产数据库发展提供了良好的技术生态;2)国产化替代逐步推进:国产数据库作为信创的关键环节,随国产化替代深入推进而受到高度重视,产品、技术均实现快速发展;3)云数据库日益兴起:从全球数据库部署占比来看,云数据库产业趋势明朗,受益于高人口基数与应用软件繁荣带来场景红利,国产云数据库爆发巨大的产品优势。根据艾瑞咨询发布的《中国数据库行业研究报告》,年国产数据库占全国市场47%,仅存量市场的替换空间已超亿。
技术沉淀叠加信创需求,国产数据库迎来*金发展期
国产数据库发展顺应国家需求,国产替代加速产业发展。年,国家邮电部提出开发和建设“市内电话业务计算机综合管理系统”,即“九七工程”,在此背景下,国内第一批数据库企业开始发展,早期国内数据库行业高度依赖大学以及国家*府机关,主要用来满足国家部门的使用需求。年以前,国内银行以及企业高度依赖IMB、Oracle等海外厂商研发的数据库系统,单方向的技术依赖使国内厂商处于被动态势。年,棱镜门事件爆发,信息安全的自主可控成为国家需求,国内企业积极响应国家需求,自主研发数据库系统。国产数据库作为国产化替代的重要环节,在我国信创产业*策的指引下实现加速发展。
总体来看,国产数据库的发展历程大致可分为三个阶段:1)海外垄断期(-年):SQL体系初建立,美国三巨头(Oracle,MySQL,SQLServer)相继初露峥嵘,并逐步统治全球市场。年国内召开第一次数据库年会,改革开放引领浪潮,积极引入国外技术,以三大巨头为代表的海外数据库于90年代席卷中国;2)国产萌芽期(-年):“十五”计划期间,国家计划设立“数据库重大专项”,国内研究所与大学积极投入数据库研究,IT社区逐步兴起;年,中国首个数据库“人大金仓KingbaseES数据库系统”诞生,随后武汉达梦数据库、神通数据库系统等国产数据库系统相继面世,打破了Oracle、IBM的市场垄断格局;3)快速发展期(年至今):年,阿里巴巴成立阿里云,开始研发自己的数据库产品AliSQL;随后,华为、腾讯等企业相继加入自主研发队伍,推出自有数据库产品;云计算时代与开源社区的兴起,国产数据库实现弯道超车,基于NoSQL等新技术的数据库产品加速面世。年,国外厂商神话被打破,蚂蚁集团的OceanBase数据库成功登顶世界上最权威的数据库评测机构TPC(国际事务处理性能委员会)排行榜榜首。国产数据库逊于海外数据库已成为过往,国产自研数据库进入百花齐放阶段,近年来随着国产化替代深入推进,软件厂商、集成商、运营商纷纷入局数据库市场,我国数据库产业加速发展。
经过多年技术研发和经验积累,国产数据库市场份额逐年提升。以人大金仓、南大通用、神舟通用为代表的国产数据库厂商自创建以来不断发力,逐步打破了海外厂商的垄断局面,同时数据库初创厂商、云厂商等也加速发力,快速替换海外数据库厂商的市场份额。根据智研咨询数据显示,国产数据库企业的市场占比已从年的4.19%提升至年的16.64%;根据艾瑞咨询发布的《中国数据库行业研究报告》,年国产数据库市场占比已提升至47.4%,其中传统数据库厂商占比7.1%,国产云数据库等新兴厂商占比40.3%。根据IDC发布的《年上半年中国关系型数据库软件市场跟踪报告》,在传统部署模式市场中,华为、阿里、达梦数据、人大金仓的市占率分别为14.7%、5.7%、5.7%、5.0%,在公有云部署模式市场中,阿里、腾讯、华为的市占率分别为44.7%、17.4%、7.4%。
关系型数据库占主流地位,市场竞争格局初显
国产数据库参与厂商包括传统厂商、初创厂商、云厂商和跨界厂商四类。1)传统厂商:以达梦数据、人大金仓、南大通用等企业为代表的传统数据库厂商,是我国最早参与数据库研发、应用的企业,在数据库领域具有深厚的技术沉淀;2)初创厂商:以巨杉、PingCAP、偶数科技、星环科技等企业为代表的初创厂商,依托于新兴的数据库技术与需求,近年来实现蓬勃发展;3)云厂商:以阿里巴巴、腾讯等企业为代表的云数据库厂商,得益于互联网业务和开源技术的快速发展,积极搭建自研云数据库平台,迅速占领云数据库市场份额;4)跨界厂商:以中兴、浪潮等企业为代表的跨界厂商,积极布局企业级数据库市场。
根据源代码来源不同,国产数据库代码来源可分为三大类:1)基于开源代码研发:MySQL系的巨杉数据库、阿里云数据库,PostgreSQL系的华为Gauss数据库;2)收购商业源码+自研:南大通用收购IBM的Informix数据库源码;3)独立自研:以武汉达梦数据库为典型代表。
关系型数据库占主流,多基于MySQL和PostgreSQL二次开发而来。关系数据库作为传统数据库产品,诞生时间早于非关系型数据库,产品体系更加成熟,在我国数据库市场中占据主流地位。1)从数据库数量来看:根据中国信通院发布的《数据库发展研究报告》,截至年6月,我国数据库产品共有款,其中关系型数据库81个,占比60%,非关系型数据库54个,占比40%;关系型数据库中基于开源数据库MySQL和PostgreSQL进行二次开发的个数分别为23和24个,分别占关系型数据库比例为28.40%和29.63%,合计占比为58.03%。2)从市场份额来看:根据艾瑞咨询发布的《中国数据库行业研究报告》,关系型数据库市场份额占比约为90%,非关系数据库市场份额仅约为10%。
云数据库产品优势逐步显现,国产厂商掌握场景红利。国产云数据库厂商的快速发展主要获益于我国的互联网场景红利,过去十年互联网及移动互联网在中国快速发展,国产厂商享受了高人口基数与丰富软件应用场景带来的场景红利,积极开拓面向海量、高并发数据的云数据库产品,并凭借产品优势与本土化业务理解迅速占领国内市场。根据IDC发布的《H2中国关系型数据库软件市场跟踪报告》,H2公有云关系型数据库规模为8.7亿美元,国产云数据厂商的市场份额合计占比超68%,国产厂商(阿里、腾讯、华为)分别位居前五名中的第1、2、4位,其中阿里处于绝对龙头位置,占总体市场份额的42.5%。
初创厂商不断涌现,数据库产业体系日益完善
国产厂商多处在发展初期,具备较大成长空间。与老牌海外数据库厂商50余年的发展历史相比,多数国产数据库厂商的成立时长在10年以内,根据中国信通院发布的《数据库发展研究报告》,-年成立的数据库厂商数量占国内厂商总数比重近50%。由于多数国产数据库厂商成立年限较短,因此在人才储备与技术积累等方面,仍与海外厂商存在较大差距。根据中国信通院发布的《数据库发展研究报告》,员工人数小于的国产数据库企业占比高达84%(Oracle员工13,名),专利数量小于50的国产数据库企业占比高达77%(Oracle专利1.4万个),大部分厂商仍然拥有较大的成长空间。
初创厂商多基于新兴数据库技术,