当前位置:网站首页>中金 | 数智中国之二:数据库商业市场五问五答
中金 | 数智中国之二:数据库商业市场五问五答
2022-06-09 13:45:00 【墨天轮】

数据库是组织正常运转所需要依赖的核心软件,其本身也是一门系统技术。从技术到产品,中间需要跨越可用性的沟堑,才有机会迈向商业成功的坦途。从初代产品到1984年的5.0版本,Oracle数据库历经7年才打磨出稳定运行的产品。我们认为真实的客户场景才能试炼出具备可用性和稳定性的软件产品。在本篇报告中,我们将从商业视角出发,对比当前中外数据库市场的格局,讨论中外数据库市场的差距,力求解析中国数据库市场的历史机遇与投资机会。
摘要
1)数据库市场呈现怎样的格局?数据库市场方兴未艾。从技术流行度视角看,关系模型在完备的数学理论支持下率先实现商业化,目前虽居第一但已向多模演进;云原生、New SQL、数据湖仓等路线热度升温;从商业化视角看,市场处在多种技术路线并存、格局未定的状态,云成为搅动市场格局的重要力量。
2)数据库的中外差距在何处?集中式关系型数据库的中外差距更为显著,一方面从发展史看,Oracle等海外龙头进入国内市场时产品已然成熟,而国内产品化刚处发轫之始,海外产品在实践中经受了重要场景锤炼、建立用户信任。另一方面,在商用市场,Oracle通过扩展SQL语言形成自己的“方言”体系掌握事实上的行业标准;在开源市场,收购MySQL助力其掌握开源社区的话语权。同时,通过加强运维及DBA人才培养加强内生造血能力;通过开展系列收并购活动丰富上下游适配,海外龙头以数据库为核心建立的生态圈已相对完善。
3)数据库的国内投资方向有哪些?我们认为国产数据库的投资方向应契合国产数据库厂家打破海外巨头垄断的破局之道,分别为a)抓住利好政策窗口期替换存量集中式关系型市场;b)在架构上另辟蹊径,原生分布式打破集中式部署下的垄断;c)云化趋势打开OLAP、数据湖仓等增量分析型市场。我们的测算结果显示国产替代存量市场规模大于600亿元;与此同时,分析型的增量市场正以30%以上的年均复合增速(2022-2025)高速扩张。
4)什么样的国产数据库厂家可以脱颖而出?我们认为,技术实力是数据库厂商的立身之本,在此基础之上,完善的服务体系和生态构建是从技术成功转化为商业成功必不可少的两大要素。
5)怎么给一个数据库公司估值?我们认为传统的数据库厂家与新兴的数据库厂家适用不同的估值方法。通过整理海外数据库厂家的估值逻辑,我们观察到“终局”思路(远期估值再折现)是造成新兴数据库公司与传统数据库厂家估值差异的原因。
风险
国内生态建设不及预期;流动性不及预期;市场竞争加剧。
正文
数据库市场呈现怎样的格局?
技术流行度视角:关系型数据模型仍居第一但已向多模演进;云原生、NewSQL、数据湖仓等技术路线热度升温。关系模型在完备的数学理论支持下最先实现商业化,并在超过50年的核心业务场景打磨之下趋于成熟。我们的统计数据显示,截至2022年4月底,在技术流行度口径下关系模型产品的份额达到72%;同时,目前已有近40%的关系型产品提供对于多模的支持,新兴技术路线的流行度排名也快速提升。
商业化视角:数据库市场处在多种技术路线并存、格局未定的状态,云成为搅动市场格局的重要力量。根据Gartner的数据,全球数据库市场规模从2017年至2021年以20%的CAGR高速增长至800亿美元。同时,我们观察到云原生、大数据项目、数据湖/仓库等路线带来了变革的力量,有的项目一经推出便很快进入市占率排行前列,比如2013年前后Hadoop路线下的Cloudera、2020年前后的Snowflake、Spark路线之下的Databricks。收入口径下,Gartner数据显示2021年云厂商Microsoft、AWS的市占率排名均已超过Oracle。全球数据库市场格局未定,云架构支撑的海量数据高性价比存储与分析成为影响市场格局的重要力量。
技术流行度视角:关系模型仍居榜首,新兴技术路线流星赶月
全球市场:云原生、NewSQL、湖仓一体等技术热度持续升温
图表:数据库系统流行度排名

资料来源:DB-engines,中金公司研究部
注:统计时间截至2022/4/22,评价维度主要包括在网络/技术论坛中被讨论/提及的次数、就业机会的数量、在职专家人数等,具体标准参考DB-engines官网公示
在关系型技术路径上,开源的力量不容忽视,PostgreSQL与MySQL在全球范围内已然延展出两大产品家族。我们在《数据库系列报告开篇:技术路径复盘及展望》中提出开源思潮的流行影响数据库技术架构的迭代。在全球范围内,PostgreSQL与MySQL两大顶级开源关系型数据库项目深刻地影响着厂家的技术路线选择,并已然成长延伸出两大产品家族。
图表:开源数据库源流与发展:PostgreSQL图谱

注:统计截至2022年2月底,具体信息以公司公告为准;
资料来源:墨天轮,PostgreSQL社区,openGauss社区,Greenplum社区,公司公告,中金公司研究部
图表:开源数据库源流与发展:MySQL图谱

注:统计截至2022年2月底,具体信息以公司公告为准;
资料来源:墨天轮,MySQL社区,MariaDB社区,公司公告,中金公司研究部
2016年以来,云原生、NewSQL、湖仓一体等技术热度持续升温。虽然受限于发展历史较短,在流行度的绝对值上新兴技术尚无法和头部的成熟项目抗衡,但我们能看到2016年以后新技术路径发展势头迅猛。云原生领域,云原生数据仓库Snowflake是目前最炙手可热的数据库上市公司之一;NewSQL领域,Amazon Aurora、CockroachDB、TiDB是典型代表;而大数据领域,Spark SQL技术路线的流行度稳步上升,Databricks作为选择Spark路线的商业公司,伴随着湖仓一体概念的升温而受到资本市场热捧。
图表:近年云原生、NewSQL技术流行度不断升温

资料来源:DB-engines,中金公司研究部
注:统计时间截至2022/4/22,评价维度主要包括在网络/技术论坛中被讨论/提及的次数、就业机会的数量、在职专家人数等,具体标准参考DB-engines官网公示
国内市场:关系型路线占据主导,开源路线被广泛应用
从存量市场看,关系型路线仍占据主导,同时产品多基于开源技术二次开发而来。从技术流行度角度出发,国内数据库产品数据模型份额结构和全球市场趋势一致,呈现出关系型路线占主导、非关系型产品蓬勃发展的特点。
►关系型路线占主导:关系模型的ACID特性助力其支撑核心事务场景,在国内数据库产品市场同样更为流行。根据信通院的统计数据,截至2021年中,关系型数据库数量占比约为60%。近些年,NoSQL路线在国内同样备受瞩目,以MongoDB、HBase、Redis为代表的开源路线在NoSQL系产品得到了广泛应用。
►我国的关系型数据库产品广泛应用开源路线:我们将国内存量关系型数据库产品的技术路径做进一步分解,根据信通院的数据,关系型产品中分别有约30%、28%的产品由开源数据库PostgreSQL、MySQL二次开发而来。
图表:从技术流行度来看,关系型数据模型在国内外市场均占据主导地位(2021年)

资料来源:DB-engines,工信部,中金公司研究部
注:统计时间截至2022/4/22,评价维度主要包括在网络/技术论坛中被讨论/提及的次数、就业机会的数量、在职专家人数等,具体标准参考DB-engines官网公示
商业化视角:数据市场方兴未艾,格局未定
全球市场:云成为变革市场格局的重要力量
全球数据库市场处在高速发展过程中,目前Microsoft、AWS、Oracle占据大半市场。根据Gartner的数据,从2017年到2021年,全球数据库市场以20%的年均复合增速维持高速增长;2021年市场规模接近800亿美元,同比增速超过22%。从格局来看,传统数据库龙头Oracle与全球云巨头Microsoft、AWS市占率位列行业前三。我们观察到自2018年以来,Oracle市占率略有下滑,云成为变革市场格局的重要力量。
图表:全球数据库市场维持高速增长,2017-2021

资料来源:Gartner,中金公司研究部
图表:2021年全球数据库厂商市场份额概览

资料来源:Gartner,中金公司研究部
图表:2011-2021年数据库市场份额排名变迁

注:上图中的收入量级只统计数据库相关收入,具体数据以公司公告为准
资料来源:Gartner,各公司公告,中金公司研究部
头部NoSQL、大数据厂商收入增速快且备受资本市场关注。NoSQL、大数据领域的上市公司中,Cloudera营收规模最大,但近年增长放缓,而MongoDB、Elastic增速均在50%左右,Snowflake更是实现多年翻倍增长。资本市场高度关注新技术趋势厂商,如近年炙手可热的湖仓一体公司Databricks、图数据库项目Neo4j。
图表:头部NoSQL、大数据领域上市公司收入

资料来源:Wind,中金公司研究部
注:Cloudera 2019年收入增长迅猛主要因为其收购了Hortonworks并表导致
图表:Databricks、Neo4j历史融资情况

资料来源:FactSet,中金公司研究部
国内市场:海外厂家仍占主导,国产替代任重道远
海外厂家在国内数据库市场占据主导份额,国产替代任重道远。从收入口径看,海外厂家仍在我国数据库市场占据主要市场份额,其中Oracle又占据主导地位。根据IDC的最新数据,2021年本地部署的关系型数据库产品市场中,仅Oracle一家的市场份额即接近27%;在金融行业中,Oracle的主导地位尤为明显,根据信通院的数据,2020年其在金融行业占据55%的数据库市场。
图表:金融行业存量数据库系统格局,2020

资料来源:IDC,信通院,中金公司研究部
下游重点行业的客户特征解析
金融、政务、公共事业、制造、医疗等为价值量贡献较大的下游行业客户。金融始终是中国数据库及大数据应用最大的细分行业市场之一。此外,在关系型数据库市场中,政府、公共事业(电信、能源、交通)和制造等行业贡献靠前,与金融一起占据了超80%的市场空间;在大数据应用市场中,医疗、政务、互联网和教育贡献靠前,Top5行业亦占据了整体约70%的市场空间。
图表:按照下游客户所在行业分类的关系型数据库市场规模,2019-2024e

资料来源:Frost & Sullivan,信通院,中金公司研究部
金融&电信:价值量大、技术要求高、迁移难度大
数据一致性要求高,存量系统中海外成熟关系型数据库产品占比高,系统复杂、迁移难度较大。传统金融机构(银行、证券、保险)和电信运营商是支撑国民经济正常运行的关键行业,且合规、监管较严格,对数据一致性要求很高,核心业务系统以关系型数据库为主。同时,金融、电信业务极为复杂,核心系统作为业务底座涉及与上层应用、其他分析或技术平台数据交互的问题,迁移、改造难度较大,一般均会采用双轨并行、逐步替换的方式。
金融业务与大数据深度融合,是未来发展的核心竞争要素之一。除了满足日常交易需求的数据库以外,金融机构拥有庞大的客群基础,积累了大量非结构化的行为数据等,蕴藏了丰富的客户偏好、社会关系等信息资源,若能充分利用将有效提高业务效率、风险防范水平等。目前金融大数据已经在信贷风险评估、供应链金融、骗保识别等领域得到广泛应用,大数据应用分析能力正在成为金融机构未来发展的核心竞争要素之一。
政务:看重服务、数据安全、自主性
存量市场国产替代需求急切,增量市场持续受益于数字政府能力建设持续投入。一方面,电子政务的建设使得政府机构对信息系统的依赖性及信息安全标准越来越高,数据库作为其中的核心软件,需要自主掌握源代码控制权。另一方面,自2015年起针对政务大数据产业发展的相关政策紧密出台,目前政务数据量已经初具规模,大数据技术也日趋成熟,是政务大数据发展的良好时期,但仍然需要解决部门之间存在壁垒、数据标准不统一、数据孤岛等问题以更大程度地发挥数据价值,推进政府数字化转型,最终实现服务精准化、高效化、一体化。
政务场景下选型看重服务、数据安全保障等。我们认为政务场景下业务逻辑相对简洁,对于数据一致性、时延等的容忍度高于金融/电信场景,但由于政务行业本身IT能力储备相对较弱,而数据库相关工具部署、使用门槛较高,因此需要数据库厂商提供较多服务支持,同时政务场景的特殊性使其对于供应链安全、数据安全等格外重视。
互联网:IT能力强、多自研、对国产商业化数据库需求相对较少
互联网巨头在云数据库时代扮演者IT基础资源提供者和数据库开发创新者的角色。一方面,互联网巨头凭借自身服务器资源、技术人才储备、资金充裕等优势,出于业务协同、战略布局、开源创收等考虑纷纷下场云计算;另一方面,互联网业务的发展反哺数据库系统的创新,随着业务的扩大传统的商用数据库成本过于高昂,倒逼国内大厂去“IOE”走上自研道路,而大厂丰富的业务、海量的数据和技术人才储备也为自研数据库提供场景和条件。
互联网中小企业数据库选型时对开源、公有云、NoSQL接受度高,对国产商业化数据库产品和运维服务需求相对较小。互联网企业文化更加开放,并且自身IT能力较强,其特殊的业务场景往往需要NoSQL支撑,此外中小互联网企业一般面临资金、人员有限,场地不足,业务爆发快等问题,云计算服务能够匹配中小互联网企业的IT基础设施需求,使其专注于业务层面拓展。因此互联网企业对于开源、NoSQL、公有云等新技术趋势接受度更高,更愿意采用开源数据库并进行二次开发,往往是开源社区的重要贡献者。
数据库的中外差距在何处?
从发展史看,国内滞后海外二十年
我国第一个自主知识产权数据库成型于1988年,滞后于海外20年。我们在《数据库系列报告开篇:技术路径复盘及展望》中对数据库发展史进行了详尽复盘,回溯数据库近70年的历史,可以看到在早期数据库跨时代的事件中鲜有中国厂家或者学术研究者的身影。早在1968年,IBM推出了世界上首个大型商用数据库IMS。对比来看,我国的数据库技术研究起步于1980年前后;到1988年武汉达梦推出第一个国产自主版权数据库,我国数据库产品的商业化进程滞后于海外二十年。
从产品迭代视角来看,Oracle等海外龙头进入国内市场时其产品已然成熟,而国内产品化刚起步。从1979年到1989年Oracle进入中国市场的时间节点,Oracle数据库已经迭代到第六版,不仅实现了行级锁、在线备份和恢复、增强可扩展性等核心性能与商业特性,而且完成了PL/SQL这一Oracle自有的SQL“方言”的拓展,产品历经20年的打磨已然成熟。而彼时国内数据库尚处于学术研究起步、积累阶段,海外厂商迅速在电信、金融、政务等重要行业拿下大单、近乎垄断。
图表:国内外数据库产品迭代对比图

注:以上图表仅选取部分厂家、部分产品版本内容,根据公司官方公开数据整理,具体信息以公司公告为准
资料来源:公司公告,公司官网,中金公司研究部
Oracle垄断集中式关系型数据库“事实标准”
在商用市场,SQL+“方言”助力Oracle掌握行业“事实标准”。SQL语言在1986年被美国国家标准学会纳为关系型数据库的标准语言,后被国际标准化组织(ISO)采纳为国际标准成为事实上操作关系型数据库的行业标准。而Oracle(时称Relational Software, Inc.)早在1979年即开发出世界上第一款商用的基于SQL的关系型数据库。Oracle数据库此后乘SQL国际标准之风大阔步迈入企业级市场。同时,Oracle通过扩展SQL语言形成自己的“方言”体系——高度兼容SQL的高级数据库程序设计语言PL/SQL,给自己的数据库赋予了更多商用增强便捷功能。通过40余年的落地、推广与生态培养,Oracle数据库在主导集中式关系型数据库市场的同时,也将自有的“方言”SQL体系成功扶持为事实上的行业标准。
在开源市场,Oracle收购MySQL已然获取开源社区的话语权。MySQL 1.0发布于1996年,在2000年采用GPL协议进入开源的世界。如我们在前一章所述,时至今日,MySQL是世界范围内最受欢迎的开源数据库之一。2009年,Oracle通过收购成为了MySQL的法律主体,具有变更开源协议的权力。至此,数据库世界开源与商业的汩汩溪流汇入Oracle的大河,Oracle一方面通过产品迭代不断打磨关系型数据库的性能,另一方面通过开源社区汇集了多方生态,一步步加强在数据库市场的话语权。
图表:Oracle扩展的“方言”体系PL/SQL特点概览

资料来源:《Oracle数据库原理及应用》(2019,李然等),中金公司研究部
构建人才与产业链上下游生态是基础软件构筑壁垒的必经之路
商业成功与人才生态相互促进,Oracle全球拥有百万量级的开发者队伍。数据库相关知识体系庞杂艰深、壁垒高,不同产品、技术路径需要单独额外学习,而在设计、建设、运维的各个实践环节都需要大量的专业人才。完善的培训、社区、认证体系、DBA和运维人才的充足供给保障数据库产品的最佳实践,而数据库产品商业繁荣带来的就业机会和优厚薪酬又激励人才供给,形成正向循环。
海外巨头通过收并购不断夯实基础能力,扩展产品生态。从产业链的角度来看,数据库除了锤炼自身的技术实力之外,对接上游需要接入服务器和存储、网络等IT基础资源,沿产业链下游支撑各行各业的应用软件系统。我们复盘Oracle、IBM、微软等数据库产品供应商发展史都会发现,各海外巨头均通过大量收并购补充基础技术实力、拓展生态应用。
图表:Oracle的收购版图

注:统计截至2021年12月31日,具体信息以公司公告为准。
资料来源:公司公告,公司官网,中金公司研究部
数据库的国内投资方向有哪些?
诚如前文所析,国内数据库研究起步时间晚于海外二十年,集中式关系型数据库“事实标准”由海外巨头掌控。国内厂家如何破局?我们提出三个观点:1)抓住利好政策窗口期替换存量市场;2)原生分布式数据库的国产替代打破集中式部署下的垄断;3)云化趋势之下的联机分析型(OLAP)数据库带来增量市场。
海外集中式关系型数据库的国产替代寻机存量市场
关键领域亟待自立自强,国产崛起正在路上。数据要素是数字经济深化发展中的“核心引擎”[1],我们认为通过数据库对数据资产进行良好的组织和管理是释放数据要素价值、推动数据要素市场发展的前提和基础。2015年起,数据库、大数据基础产业愈发受到国家重视,相关政策密集发布。2021年11月底工信部《“十四五”软件和信息技术服务业发展规划》中明确“关键基础软件补短板”是八大专项行动之一,提出须聚力攻坚基础软件,对数据库进行补强;《“十四五”大数据产业发展规划》中,要求2025年大数据产业规模突破3万亿元,并明确夯实基础、打造生态等6大主要任务。政策支持持续加码,为行业发展保驾护航。我们认为抓住政策窗口期替换存量海外集中式数据库,对国产厂家而言是下一个5-10年维度发展的历史机遇。
从供给侧看,我们认为国产替代主要在集中式关系型市场展开,存量替代空间可观。我们综合多方数据推算到,截至2021年,以Oracle、微软、IBM等公司为代表的海外厂家在集中式关系型数据库市场的市占率接近70%,集中式关系型数据库市场的国产替代空间广阔。从需求侧看,存量替代有集中式与分布式两种选择,我们认为需要根据下游客户特点分开讨论。我们的测算结果显示集中式数据库国产替代年均释放约100亿元左右的需求。
场景一:国产集中式数据库替换海外集中式数据库
国产集中式数据库替换海外集中式数据库:我们认为将主要在政务及大型央企国企市场展开,年均释放约60亿元市场空间。根据沙利文的数据,2020年政务及公共事业客户贡献了27%的关系型数据库市场,是数据库国产替代展开的重要领域之一。我们在第一章中分析了政务市场客户的数据库选型特点,政务客户对于供应链安全、数据安全、产品稳定性等格外重视,同时,对于数据库厂家的服务能力也有较高的要求。我们的测算结果显示,政务及部分国企央企客户的数据库国产替代带来的整体市场规模超过400亿元,年均市场规模约60亿元,市场容量较大,国产厂家前景可期。
场景二:国产分布式数据库替换海外集中式数据库
国产分布式数据库替换海外集中式数据库:我们认为金融将成为核心市场,同时呈现集中式与分布式并存的格局;金融市场分布式与集中式合计国产替代市场规模约200亿元。2022年2月9日,中国人民银行等四部门引发《金融标准化“十四五”发展规划》,明确要求金融业系统服务器终端须支持构建分布式和集中式并存的双核架构格局。2022年1月初,中国银保监会发布《中国银保监会办公厅关于银行业保险业数字化转型的指导意见》,明确要求推进主要业务系统从传统架构向分布式架构转型,要求支持大规模企业级应用。金融行业存量数据库以Oracle、IBM DB2等海外集中式关系型数据库为主,我们认为在政策窗口期内,金融市场将成为国产分布式与集中式数据库国产替代的重要市场。我们的测算结果显示,考虑集中式与分布式并存的场景,金融行业数据库国产化带来的市场规模超300亿元,国产替代有望在未来5-10年内渐次有序展开。
原生分布式从架构出发寻求突围机遇
分布式架构为国产厂家带来追赶海外厂家技术实力的机会,部分厂家技术实力已然站在世界前列。我们看到,由于海外厂家在集中式关系型数据库方面发力更早、积淀更深,也同时由于国内硬件发展的桎梏,我们在集中式关系型数据库方面实现技术超越仍需时日。但是,国产数据厂家在架构上另辟蹊径,探索出分布式架构的破局之法。1998年,武汉达梦的DM2即实现了自主知识版权的商业版分布式数据库。
我们在数据库开篇报告《数据库系列报告开篇:技术路径复盘及展望》中讨论了分布式数据库的实现机制,分布式架构带来的可用性与一致性问题的权衡推动着分布式架构实现上的创新,很多国产数据库厂商也都给出了独到的解法,有的原生分布式数据库产品已然表现出超越海外集中式数据库的性能。
图表:从第三方测试结果也可以看到,部分国产原生分布式厂家技术实力已处在世界前列

注:排名截至2022年4月22日;E-MapReduce为大数据平台(基于Hadoop、Spark)
资料来源:TPC,中金公司研究部
技术视角看,分布式架构也是国内厂家突围的方向之一。集中式架构采用纵向扩展(Scale up),强调提升单机性能。伴随摩尔定律失效而来的问题之一是单机性能瓶颈,增加单机性能所需的成本呈几何倍数增加,边际收益显著递减。分布式架构高性价比地实现集中式架构难以提供的横向扩展性,有能力突破集中式数据库的存储瓶颈。
云化趋势打开国产数据库增量市场
新技术趋势给国产数据库厂商带来弯道超车的机会,云化是确定性的行业趋势。一方面,每一次新的技术浪潮都带来新的商业机会,虽然在传统架构、关系型市场中海外厂商积淀较深,但分布式、云原生、多模、HTAP、数据湖仓等新兴技术目前仍然处于高速发展上升期,且不少国产厂商提前布局;另一方面,中国本土即有丰富的海量数据应用场景,数据库作为基础软件也需在实践中不断打磨,国产替代大背景下,本土客户和厂商通力合作亦能帮助国产数据库快速迭代提升。
图表:预计云数据库数量在国内数据库产品所占的比例将逐渐提升,2015-2024e

资料来源:Frost & Sullivan,中金公司研究部
云架构能高性价比地满足海量数据的分析型需求,打开OLAP等分析型数据库的增量市场。使用云数据库的客户能够以低廉的价格享受云架构之下的存储资源。同时,我们认为在云架构存算分离、按需付费、按需扩展等特性支持之下,用户的大规模冷数据存储、批处理,以及海量数据分析型需求能够被高性价比地满足。我们认为,云不仅实现底层IT资源的重构,而且为OLAP、数据仓库、数据湖等分析型市场打开了另一扇探路之门。
图表:分析型数据库占比逐年提升,我们认为云架构将成为重要推力

资料来源:Frost & Sullivan,中金公司研究部
图表:我们认为云架构同样为数据湖市场规模高速提升的重要推手

资料来源:计世资讯,中金公司研究部
数据库的关键成功要素是什么?
技术为先
过硬的技术实力是在竞争中立稳脚跟的前提。数据库、大数据等是典型的智力密集型行业,具有研发投入大、研发周期长、技术壁垒高等特点,且随着5G、云计算和人工智能等新兴技术的深入发展,数据库、大数据相关技术升级迭代加快,需要供应商准确把握新技术发展动向和趋势,持续投入,并将新技术与现有的技术平台和核心产品有效结合。而落到具体考察的技术指标上,可以参考《中央国家机关2021年数据库软件协议供货采购项目征集公告》,其分别对事务型、分析型数据库系统评价体系做出明确要求。
图表:央采2021事务型数据库(OLTP)评价指标

资料来源:《中央国家机关2021年数据库软件协议供货采购项目征集公告》,中金公司研究部
下游客户实际选型过程中除了参考第三方性能测试结果以外,往往都会进行POC测试。正如我们在数据库开篇报告《数据库系列报告开篇:技术路径复盘及展望》中介绍的,TPC是为数据库提供权威性能测评的第三方机构,目前国内仅有少量产品如Oceanbase、南大通用的Gbase和星环科技的ArgoDB等进行了相关测试。但由于数据库性能对硬件配置、业务环境、参数设置等都高度敏感,且不同客户有个性化的需求侧重,因此实际选型过程中企业都倾向于在自己配置的环境中进行POC测试以此来比较不同竞品的技术实力。
核心期刊论文发表数量、专利数量也是衡量厂商技术实力的另一抓手。学术研究一直是数据库技术发展的重要支撑体系,学术界公认的数据库领域顶级会议为VLDB、SIGMOD和ICDE,我国在全球数据库领域学术影响逐渐提升,阿里、华为、腾讯、蚂蚁金服、百度、PingCAP等企业论文入选。专利是企业知识产权成果积累与商业化保护的重要手段,我国数据库企业自研技术发展历史相对较短,截至2021年6月,全部企业技术专利累计仅千余,平均专利数量不足五十个,整体与海外成熟厂商水平差距较大,但仍有小部分领先国产厂商已累计百余专利。
服务筑基
数据库技术体系庞杂,对专业度要求高,传统行业客户往往需要全方位服务。数据库部署涉及对底层硬件/操作系统、上层应用及业务逻辑等的适配,且目前国产化替换通常需要迁移,对服务人员的专业能力、工作经验都提出要求。传统行业尤其是金融、电信、政府、制造、交通等,企业内部精通数据库的IT人员稀缺,因此尤其依赖外部服务。过去海外数据库巨头在拓展中国市场时,通常直接和专业的本土服务商进行合作,目前国产数据库厂商基本都有自己的服务团队也会与服务商合作拓宽覆盖范围。以星环科技为例,据其最新招股书披露,2018-2020年度公司软件产品授权及配套服务和技术服务相关收入占比合计达到56.24%、53.45%、50.86%。
数据库服务能力涉及售前、售中、售后各方面。信通院在数据库服务能力成熟度模型中将所需服务分为规划设计、实施部署和运维运营三大块,专业的数据库服务商通常需要提供全流程的服务覆盖,而对于国产数据库厂商来说,服务范围一般包括:1)售前支持:方案制定、产品定制化、咨询服务;2)现场支持:实施测试、售后服务、定期巡检;3)远程服务:互联网支持服务、7*24电话支持服务、邮箱、社交媒体等;4)专家培训:专业的培训讲师、配套的培训教材、现场操作培训。
生态加持
数据库向下适配硬件、操作系统,向上支撑各类应用,运维人才、配套工具保障最佳实践,生态支持是其商业成功的重要加持。Oracle在早期能拉开与DB2、SQL server的差距,很大程度上受益于其开放的生态,虽然是闭源产品,但Oracle开放大量接口且内部操作可供DBA追踪分析,培养起丰富的人才资源,衍生出大量围绕Oracle提供产品和解决方案的服务类厂商、生态工具厂商,其生态繁荣与商业成功相辅相成。
开源和云能够加速生态圈的建立,国产数据库厂商积极开源、上云。开源数据库源代码开放、有详细的产品文档和良好的社区生态,企业可以无成本试用,因此具备用户群体广、传播速度快的特点,能够帮助初创厂商加速传播获客、加速生态建立。巨杉数据库、Oceanbase是国内最早开源的数据库厂商,而后自2019年起华为、腾讯、阿里陆续将自家的数据库开源。此外云计算时代,云数据库可以借助云基础平台,而无需从头建立生态,从而避免生态短板、快速进行商业变现。我国主流数据库厂商均有云产品或云适配相关布局。
图表:国产数据库厂商开源情况

资料来源:CSDN,Github,中金公司研究部
注:统计时间截至2021/12/19
国产数据库厂商产品流行度概览
国产厂商厚积薄发,从学习追赶到颠覆式创新。墨天轮数据显示,截至2021年12月,TiDB、openGauss、达梦分别位居国产数据库流行排行榜Top3;前11席位中,云厂商贡献5席,人大金仓、武汉达梦和南大通用均在列,此外还有初创厂商TiDB、中兴通讯和从阿里云中独立的Oceanbase。从数据模型角度,上榜产品均以关系型为主,但除了传统架构以外,近年国产数据库厂商积极创新,贡献了不少原生分布式、云原生的产品,其中TiDB更是目前最炙手可热的NewSQL产品,其流行度得分也遥遥领先。
图表:国产数据库流行排行榜Top10

资料来源:墨天轮,中金公司研究部
注:上表中产品从数据模型角度均为关系型,上表类型分类中的“关系型”特指非原生分布式、非云原生的传统关系型;openGauss特指开源项目,GaussDB指企业级产品,时间截至2021/12;评价维度主要包括搜索引擎、趋势指数、三方测评、生态(社区、高校合作、培训认证、开放文档等)、就业机会等,具体标准参考墨天轮官网
怎么给一个数据库公司估值?
从全球视角看,传统集中式关系型数据库市场巨头主导、格局稳健、市场规模稳步增长;同时,分布式、云等计算机底层架构的变革驱动,分析型、流批一体等场景需求催化,以及大数据、人工智能等新型分析技术的应用都驱动着数据库架构不断演变,新兴的数据库市场高速发展、格局未定。因此,我们认为传统的数据库厂家与新兴的数据库厂家适用于不同的估值方法。我们对不同发展阶段、架构各异的海外数据库厂家估值方式进行整理,以期给国内数据库厂商估值做参考。
稳定盈利的数据库公司:DCF、EV/FCF、P/E
以集中式关系型数据库见长的传统数据库龙头厂家比如Oracle、IBM已深耕行业六十余年,通过经典的数据库产品获得大多数行业客户青睐,客户关系较为稳定,利润、现金流稳健增长、格局稳健。我们能够预期该类企业在较长时间段内能够持续稳定经营并盈利,适用于DCF估值;也可结合P/E、P/S等相对估值法估值。
高速发展期的新兴大数据公司:EV/Sales并结合Rule of 40等指标分析
对于处在商业化早期的公司往往需要高研发投入打磨产品、高销售投入开拓市场,以支撑收入规模化扩张,此时公司的利润、现金流常处于负值。即使公司可预期的市场空间大、有望实现规模化收入后产生正向现金流,但在该发展阶段采用DCF估值会带来对终值依赖度较高等问题。此时,EV/Sales也是一种可选的估值方法。在海外,以Snowflake、MongoDB、Elastic等为代表的新兴数据库/大数据公司多采用订阅制为主的商业模式,因而采用SaaS公司常用的EV/Sales估值也较为合理。
在EV/Sales的视角下,Snowflake等公司享有较高的估值倍数的原因往往来自于两个方面:
►收入端持续高增。2021/2022财年,Snowflake分别实现营收同比增速123%/106%,Bloomberg预期公司在2023财年维持66%的增速。2022年65x EV/Sales对应0.6-1.0倍EV/Sales/g。在实践中,海外投资者为了将公司业务的迅速放量考虑在估值中,通常会对收入回归稳健增长的时点进行远期估值再折现。
►产业地位与可预期的市场空间。数据库是核心的计算机基础软件,与企业的核心数据资产牢牢绑定,在产业链中也处在核心地位。同时,当前所处的时代数据爆发式增长,而数据价值并未得到有效提取释放,这也意味着由数据存储、数据分析处理等环节组成的大数据市场空间可期。因此,资本市场为该类公司匹配了相对更高的估值倍数。
一般而言,企业难以同时实现较高的收入增速和较高的利润率,Rule of 40衡量了收入增速和利润率的权衡关系,我们认为在EV/Sales估值体系下同时考虑Rule of 40指标有助于投资人筛选优质数据库标的。Rule of 40将收入增速和现金流利润率之和大于40%的SaaS公司衡量为优质的SaaS公司。
长期视角下的“终局法”思路促成新老数据库公司估值差异
当前市场环境下,短期业绩难以支撑EV/Sales视角下的高估值。我们发现,虽然成长期数据库公司具有高收入增速、所处赛道具有广阔发展前景的特点,但短期业绩却难以兑现,在3-5年维度下净利润可能仍旧亏损、现金流持续净流出。在市场流动性强、景气度持续向上的“牛市”环境中,风险偏好向上,资本市场愿意给予商业模式优秀、收入迅速扩张的公司较高的估值。然而,根据中金策略组的观点,在美联储加息缩表叠加俄乌局势未定的影响下,全球美元流动性增速回落、避险情绪提升,我们认为此时继续沿用EV/Sales估值往往缺乏锚点。
数据库适用于长期视角下的终局法估值。不论对于海外新兴数据库/大数据市场,还是国内快速成长、日新月异的数据库市场,优质的数据库厂商均处在快速成长期,业绩有规模化扩张的潜力。我们观察到,不同于传统数据库公司业务已然成熟、格局趋于稳健,以Snowflake、MongoDB等为代表的新兴数据库公司尚处快速成长期、收入高速增长,海外投资者通常采用5-10年后业务步入平稳后的远期时点对新兴数据库公司估值,再做折现。我们认为“终局”思路是造成新兴数据库公司与传统数据库厂家估值差异的原因。
►从格局来看,数据库是“赢家通吃”型的标准软件产品。数据库是高标准化、高毛利的软件产品,更重要地,数据库作为高技术含量的基础软件,从诞生之初便不受地理区位限制,是天生具有全球化能力的软件产品。我们用《数据库系列报告开篇:技术路径复盘及展望》一整篇报告阐述了技术架构对于数据库产品生命力的关键作用。从关系模型支撑Oracle数据库崛起、Spark从Hadoop生态圈突围并帮助创业公司击败传统巨头等例证我们可以看到,正确的技术方向与商业抉择可以帮助数据库厂家在未来获取较高的市占率。因此,数据库的技术特性决定了我们可以从终局视角审视数据库厂家的路线选择。
►长期视角下的终局法估值:我们认为在大数据、云时代下兴起的海外厂商及部分新兴国产数据库厂家仍处在成长期,需要持续的研发投入打磨产品、持续的销售/营销投入塑造品牌,在3-5年后才进入收入的规模扩张期、在5-10年后再进入利润兑现期。在终局视角下,通常给予公司10年期的现金流预测与FCF终值折现,并结合远期PE或者EV/FCF估值进行估值。
风险讨论
国内生态建设不及预期。数据库向下适配硬件、操作系统,向上支撑各类应用,需要运维人才、配套工具保障最佳实践,因此,产品生态是厂商选型的重要考量之一,生态支持是数据库供应方商业成功的重要加持。海外数据库厂商,尤其在关系型OLTP领域发展历史悠久,生态组成渐趋丰富,若国内数据库产业生态建设速度不及预期,可能会影响下游客户的产品选型意愿。
流动性不及预期。数据库作为基础IT设施的一部分,企业的投资意愿及力度会受宏观经济因素影响,若流动性不及预期,市场整体景气度下降,短期将影响行业整体增速。另一方面,数据库需要大量前期研发投入,若流动性不及预期,影响数据库初创厂商的融资能力,将不利于行业整体产品技术的持续迭代。
市场竞争加剧。通过复盘数据库行业发展史可以发现,我国曾出现数次数据库创业热潮,尤其自大数据被纳入国家级发展战略之一以来,涌现出一批以数据库和大数据为主营业务的初创公司。据墨天轮数据,截至2021年底,其已收录近200个国产数据库产品,尤其在关系型、OLTP等领域的市场参与者众多。若竞争加剧,将在短期内影响行业内公司的收入增速及盈利能力。
[1] http://www.gov.cn/zhengce/content/2022-01/12/content_5667817.htm
文章来源
本文摘自:2022年6月8日已经发布的《数智中国之二:数据库商业市场五问五答》
韩 蕊 SAC 执业证书编号:S0080121080059
于钟海 SAC 执业证书编号:S0080518070011 SFC CE Ref:BOP246
王之昊 SAC 执业证书编号:S0080522050001
法律声明
边栏推荐
- I haven't published a thesis for 5 years, and I want to give up my doctoral degree? Ten thousand words self narration of the doctoral director of the University of science and technology of China: he
- 临时全局变量和IRISTEMP数据库
- Interviewed a software tester for 7 years: 7 years for success and 7 years for failure
- TCP/IP协议机制详解
- Graphpad prism 9 for Mac
- Uniswapv2 peripheral contract learning (VI) -- exampleoraclesimple sol
- 面试了一位7年软件测试工作者:成也“7”年,败也“7”年
- Enter a line of characters (80 at most), start from the location, intercept number characters and output them.
- 占位智能家居市场,施耐德电气仅靠一个Wiser系统?
- Software configuration item change and baseline change
猜你喜欢

Basic use of canvas (obtain canvas, draw rectangle, clear screen content, animation, draw irregular graphics, circle, dotted line, draw text, color gradient, set shadow, render picture, deformation of

我为InfoQ写作社区定制一款机械键盘庆生

元宇宙产业投资全景图,快人一步走进元宇宙新时代!

Multivariate time series analysis -- causal test

51单片机定时器0作为时间基准以及延时函数参考使用

Qiniu cloud backup website

今天19:30 | 图形学专场—中国科学院计算技术研究所高林老师团队

硬件基础——模拟电路

字节序,object类
![[Ji Wang] review of Cisco final multiple choice questions](/img/80/e84d8b2a5873b2d215463a503bebf7.png)
[Ji Wang] review of Cisco final multiple choice questions
随机推荐
零基础学网络:命令行(CLI)调试防火墙实战
Cloud native essay kubernetes workload
联调这夜,我把同事打了...
苏涛:对抗样本技术在互联网安全领域的应用
Wechat applet
Uniswap contract learning -- uniswap uni token
智慧农业小麦室外病虫害防治规范,北斗农业
大道至简 | 设计 ViT 到底怎么配置Self-Attention才是最合理的?
[tgcalls] trace the call debugging managers to the upper layer of 3:ticket:: candidate >
PhD Debate | 自监督学习在推荐系统中的应用
QUIC和互联网传输的未来
工作到一半电脑重启
七牛云备份网站
ERC721非同质代币(NFT)介绍
Vscade markdown add, paste and import pictures
[leetcode question brushing record] sorting
51单片机定时器0作为时间基准以及延时函数参考使用
【深度优先搜索】玩具蛇:迷宫问题
数据科学中的 10 个重要概念和图表的含义
#云原生征文#Kubernetes工作负载
