当前位置:网站首页>数据库一席谈:打造开源的数据生态,支撑产业数字化浪潮
数据库一席谈:打造开源的数据生态,支撑产业数字化浪潮
2022-08-03 10:57:00 【开源头条】
嘉宾 | 刘松、吴海燕、王楠、潘娟
近年来,伴随着海量数据的膨胀和分析能力需求的日益增长,数据库需要不断适应市场需求的变化。开源作为一种跨越组织、公司边界的协同开发模式,正在帮助国内诸多企业在数字化浪潮中得到更好的发展。
7月27日,2022开放原子全球开源峰会数据库分论坛上,在平凯星辰副总裁刘松的主持下,华创资本管理合伙人吴海燕、IDC中国研究经理王楠、SphereEx联合创始人& CTO潘娟围绕“打造开源的数据生态支撑产业数字化浪潮”这一话题展开热烈讨论。
国内数据库现状:空前繁荣、异常火爆
刘松:近两年,中国数据库市场是一个空前繁荣、异常火热的状态。数据库其实是一个古老赛道,近年来它重新火爆的原因究竟是什么?
王楠:从分析师的角度来看,主要有两个层面。
一个是从宏观的技术层面。云计算、互联网技术,包括数据库技术的发展,使传统的数据库市场重新产生了活力。
另一个是国际环境层面。在政治、经济、文化方面,国家对于本土厂商扶持的力度更大,在一定程度上促进中国数据库市场的发展。
潘娟:除了技术和环境,我认为还有其他五个层面。
第一,数据本身独特的价值性。数据的价值很大程度上决定着公众的一些看法。例如数据的安全性、大数据的挖掘及意义、数据如何服务企业等,数据的价值让公众对数据有了更多的期待和思考。
第二,数据带来的需求的变化。众所周知,大数据出现后,数据的价值被认可。公众对数据的多样性、规模、查询速度等需求变得更高,强大的需求形成巨大助推力。
第三,技术的沉淀。许多一开始就专注在互联网领域的人,从最开始技术满足公司业务的发展,到之后通过积累实现产品功能、产品力上的爆发,更多的技术人员在原来的位置上实现更高的期待,不断地实现技术沉淀。
第四,云的出现。云的出现让公共的交付模式等发生了根本变化。
第五,开源热潮。现在,学生、社会、厂商等层面,有更多的人士拥护开源的热潮,而开源的力量也可以去促进数据的火热。
吴海燕:从需求的角度来看,近年来,除了腾讯、阿里、Amazon这些互联网公司,还有很多创业公司进入数据库的创业赛道里。如果没有数据大量且快速的增长或者数据多样化的出现,传统巨头公司仍会处于统治市场的地位。数据的变化给新型创业公司带来更多机会,因为技术架构和需求的改变,需要新东西来支撑。
从中国消费互联网的发展来看,给中国的创业公司去做开源数据库奠定了人才和需求的基础。在移动互联网时代,中国互联网公司在短视频、社交APP等方面吸引着其他国家互联网人员的学习。数据增长速度更快、需求变多,是消费互联网的极大繁荣和普及下的结果。同时,两者相互促进。中国的消费互联网为开源提供了大量免费的场景,也促使数据库公司不断打磨自身产品。
从投资者的角度来看,只有存在创业公司的时候才需要有早期投资人,新一代的开源数据库、云数据库的优秀成绩,在资本市场上都给VC(风险投资)和PE(私募股权投资)带来了巨大的ROI(投资回报率),吸引了更多投资人的目光,形成了创、投两热的闭环,也使得数据库市场更加繁荣。
用户如何选择:开源or闭源,云上or云下?
刘松:伴随着数据库市场的繁荣,大量的数据库为企业用户在选择上带来了很大的困难。在数据库行业,一直有经典二元的悖论,用户究竟选择开源数据库还是闭源数据库?
王楠表示,选择主要是依据企业自身,因为不同的企业的核心规划也不同。
在头部企业中,由于IT能力比较强,倾向于做自创数据库,愿意尝试用开源和新技术。但在核心系统里,它们却希望使用高性能、高稳定、高安全性、能为服务提供有效保障的数据库。
在一些创新型领域企业的偏用户侧和消费互联网的系统里,愿意尝试用新的数据库。
此外,其他因素也需要考虑。尤其是开源的MySQL、PostgreSQL两大体系遍布中国市场,在基本所有公司都宣称兼容这两类数据库时,用户企业将会更多地考虑行业内部是否有头部厂商成功的应用案例、先行经验等要素。其次,在做PoC(概念验证)时,要重点考核在未来业务的应用迁移上,具体需要的额外改造工作。同时,厂商的服务能力、是否有第三方服务的合作伙伴等要素也需要进行综合考虑。
潘娟:客户需求是数据库领域的创业者最关注的。
从开源和闭源来看,作为一个开源爱好者且公司属性是开源商业化公司,肯定会选开源。首先,某项目能去开源创业,一定在之前就得到了市场的认可。通过层层印证可用性后,再去提供商业化的服务,至少满足大部分场景的需求。其次,项目初期为了打造品牌和证明实力,都会投入极大的心血。此时,一些中小型公司会存在“占便宜”的现象;而对于大型公司来说,开源项目能站在巨人肩膀上做自主可控,并且能产生一定的社会价值。只有大家去认可开源项目的价值,开源商业化公司才能为客户企业提供最优质的一体化服务。
从云上和云下来看,应该从多方面考虑,例如企业能力、企业规模、成本、自主可控等。因为大厂会考虑到成本和自主可控问题,所以云最开始的客户是中小型企业。同时,政策、国情和市场接受度这些因素也需要考虑,因此云上和云下模式主要根据具体政策和公司规模,以及客户和市场等因素决定。
吴海燕:从宏观的数据来看,2021年全球数据库管理市场是800亿美元,云数据库392亿美元,占49%的市场。Gartner预测,2025年云数据库量将有75%的市场占比量。宏观的数据表明,上云成为不可阻挡的趋势。
从微观的数据来看,全球NoSQL数据库的先行者MongoDB经历了从云下到云上,在2021年,MongoDB Atlas全年收入占比已提升至半数以上。因此,上云肯定是趋势,数据库服务也要上云。未来,大概只有少数因为监管需求导致不能用的公有云。
关于开源和闭源,中国互联网公司如果要走全球化,开源是不可避免的一种方式。在2021年,数据库市场已有一个转折点,Database超过了50%。2021年中国的数据库市场估值大约是300亿元人民币,全球是大约800亿美元,因此,做全球化的估值更高。同时,中国企业客户为软件付费的能力、意愿和习惯还不够。付费能力并非直接问题,因为中美的GDP体量非常接近,中国用约300亿元人民币的支撑起跟美国付了300亿美元差不多大体量,由此可见,全球化是必然趋势。而走全球化,开源是一个更契合互联网发展的方式,开源社区能连接全球用户,闭源则无法使国外用户方便地尝试国内的产品。
数据库未来生态:竞争与合作中发展
刘松:IaaS层作为云厂商的初始阶段,如今已经告一段落。现在提及的多云实际代表云的2.0。在几大云平台的多云环境上层,会有越来越多的东西,包含数据库、新一代数据库的中间件、数据工具等。未来,数据生态将更多由新兴的创业公司来成为主角吗?而云厂商只守好自己的IaaS层吗?
王楠:在多云数据管理上,一方面开源的独立厂商会更有优势,它跟巨头公司没有太多竞争关系,大家都愿意将底层的资源给它;另一方面,客户希望在不止一个平台上也能使用云厂商的数据库。目前,数据管理团队愿意部署到其他家的平台上,底层的IaaS是不愿意的。IaaS认为数据库本来是给IaaS层引流的,将数据库部署到其他家,等于给其他家做了嫁衣。因此,现阶段的阻力来自于云厂商。但未来第三方开源独立厂商强大以后,头部的云厂商将展开这样的合作。
潘娟:由于客户害怕产生问题,所以一定会优先考虑相对中立的公司。从术业有专攻的角度来看,团队虽小,但有资本和其他方面的扶持,在整个层面都会涌现出不同的idea和产品。因此,我会更倾向于云中立的公司,我也认为它们的数量会越来越多。不过从提供基础组件的云厂商来考虑,它们提供了最基础的土壤,如果不允许自身收获额外的加成价值和产品,便会产生竞争。综合考虑,不能给结论,但是、我能看到的是良性博弈的局面。
吴海燕:这是技术架构变迁的过程,从上一代技术架构变到云架构中间留了很多工具上的缺口,导致工具和技术软件、DevOps也开始火了。我认为不能投公有云和小云,因为云需要非常大的资本投入。建设云就好像在建高速公路,高速公路上要跑各种各样的车,如果高速公路建好了没有车,也收不到过路费,这就需要许多独立第三方搭应用、做产品和服务。总而言之,对早期的股权投资机构来讲,肯定还是投轻资产的技术驱动的,日后是面向未来的满足用户需求的东西。因此,独立第三方软件公司面向下一代云架构去满足未来需求,将是未来重点的关注对象。
总结
数字化的爆发带来了数据价值,开源、多云、基础设施的演进,包括人工智能的介入让数据价值的发现变得容易。在互联网高速发展的背景下,中国的数据公司能通过开源做国际化,同时云能更容易加速商业化。如今,数据库领域里面发展得太迅速,存在各种各样的可能,未来也值得所有人一同前行,一起探索。
边栏推荐
猜你喜欢
Analysis of the idea of the complete knapsack problem
redis基础知识总结——数据类型(字符串,列表,集合,哈希,集合)
实至名归!九章云极DataCanvas公司荣获智能制造领域多项殊荣
Pixel mobile phone system
混动产品谁更吃香,看技术还是看市场?
干货!一种被称为Deformable Butterfly(DeBut)的高度结构化且稀疏的线性变换
[Star Project] Little Hat Plane Battle (9)
ETL data cleaning case in MapReduce
混合型界面:对话式UI的未来
Cross-chain bridge protocol Nomad suffers hacker attack, losing more than $150 million
随机推荐
mysql数据库定时备份占用大量线程,导致全局锁表,有啥好的解决方法么
QT with OpenGL(HDR)
MapReduce中ETL数据清洗案例
Skills required to be a good architect: How to draw a system architecture that everyone will love?What's the secret?Come and open this article to see it!...
numpy
跨链桥协议 Nomad 遭遇黑客攻击,损失超 1.5 亿美元
509. 斐波那契数
「全球数字经济大会」登陆 N 世界,融云提供通信云服务支持
numpy
Pixel mobile phone system
自定义实现乘风破浪的小船
全新的Uber App设计
被审稿人吐槽没有novelty!深度学习方向怎么找创新点?
CADEditorX ActiveX 14.1.X
一文带你弄懂 CDN 技术的原理
MATLAB程序设计与应用 2.7 结构数据与单元数据
Spinner文字显示不全解决办法
With strong network, China mobile to calculate excitation surging energy network construction
Classical Architecture and Memory Classification of Embedded Software Components
[Star Project] Little Hat Plane Battle (9)