当前位置:网站首页>数据库一席谈:打造开源的数据生态,支撑产业数字化浪潮
数据库一席谈:打造开源的数据生态,支撑产业数字化浪潮
2022-08-03 10:57:00 【开源头条】
嘉宾 | 刘松、吴海燕、王楠、潘娟
近年来,伴随着海量数据的膨胀和分析能力需求的日益增长,数据库需要不断适应市场需求的变化。开源作为一种跨越组织、公司边界的协同开发模式,正在帮助国内诸多企业在数字化浪潮中得到更好的发展。
7月27日,2022开放原子全球开源峰会数据库分论坛上,在平凯星辰副总裁刘松的主持下,华创资本管理合伙人吴海燕、IDC中国研究经理王楠、SphereEx联合创始人& CTO潘娟围绕“打造开源的数据生态支撑产业数字化浪潮”这一话题展开热烈讨论。
国内数据库现状:空前繁荣、异常火爆
刘松:近两年,中国数据库市场是一个空前繁荣、异常火热的状态。数据库其实是一个古老赛道,近年来它重新火爆的原因究竟是什么?
王楠:从分析师的角度来看,主要有两个层面。
一个是从宏观的技术层面。云计算、互联网技术,包括数据库技术的发展,使传统的数据库市场重新产生了活力。
另一个是国际环境层面。在政治、经济、文化方面,国家对于本土厂商扶持的力度更大,在一定程度上促进中国数据库市场的发展。
潘娟:除了技术和环境,我认为还有其他五个层面。
第一,数据本身独特的价值性。数据的价值很大程度上决定着公众的一些看法。例如数据的安全性、大数据的挖掘及意义、数据如何服务企业等,数据的价值让公众对数据有了更多的期待和思考。
第二,数据带来的需求的变化。众所周知,大数据出现后,数据的价值被认可。公众对数据的多样性、规模、查询速度等需求变得更高,强大的需求形成巨大助推力。
第三,技术的沉淀。许多一开始就专注在互联网领域的人,从最开始技术满足公司业务的发展,到之后通过积累实现产品功能、产品力上的爆发,更多的技术人员在原来的位置上实现更高的期待,不断地实现技术沉淀。
第四,云的出现。云的出现让公共的交付模式等发生了根本变化。
第五,开源热潮。现在,学生、社会、厂商等层面,有更多的人士拥护开源的热潮,而开源的力量也可以去促进数据的火热。
吴海燕:从需求的角度来看,近年来,除了腾讯、阿里、Amazon这些互联网公司,还有很多创业公司进入数据库的创业赛道里。如果没有数据大量且快速的增长或者数据多样化的出现,传统巨头公司仍会处于统治市场的地位。数据的变化给新型创业公司带来更多机会,因为技术架构和需求的改变,需要新东西来支撑。
从中国消费互联网的发展来看,给中国的创业公司去做开源数据库奠定了人才和需求的基础。在移动互联网时代,中国互联网公司在短视频、社交APP等方面吸引着其他国家互联网人员的学习。数据增长速度更快、需求变多,是消费互联网的极大繁荣和普及下的结果。同时,两者相互促进。中国的消费互联网为开源提供了大量免费的场景,也促使数据库公司不断打磨自身产品。
从投资者的角度来看,只有存在创业公司的时候才需要有早期投资人,新一代的开源数据库、云数据库的优秀成绩,在资本市场上都给VC(风险投资)和PE(私募股权投资)带来了巨大的ROI(投资回报率),吸引了更多投资人的目光,形成了创、投两热的闭环,也使得数据库市场更加繁荣。
用户如何选择:开源or闭源,云上or云下?
刘松:伴随着数据库市场的繁荣,大量的数据库为企业用户在选择上带来了很大的困难。在数据库行业,一直有经典二元的悖论,用户究竟选择开源数据库还是闭源数据库?
王楠表示,选择主要是依据企业自身,因为不同的企业的核心规划也不同。
在头部企业中,由于IT能力比较强,倾向于做自创数据库,愿意尝试用开源和新技术。但在核心系统里,它们却希望使用高性能、高稳定、高安全性、能为服务提供有效保障的数据库。
在一些创新型领域企业的偏用户侧和消费互联网的系统里,愿意尝试用新的数据库。
此外,其他因素也需要考虑。尤其是开源的MySQL、PostgreSQL两大体系遍布中国市场,在基本所有公司都宣称兼容这两类数据库时,用户企业将会更多地考虑行业内部是否有头部厂商成功的应用案例、先行经验等要素。其次,在做PoC(概念验证)时,要重点考核在未来业务的应用迁移上,具体需要的额外改造工作。同时,厂商的服务能力、是否有第三方服务的合作伙伴等要素也需要进行综合考虑。
潘娟:客户需求是数据库领域的创业者最关注的。
从开源和闭源来看,作为一个开源爱好者且公司属性是开源商业化公司,肯定会选开源。首先,某项目能去开源创业,一定在之前就得到了市场的认可。通过层层印证可用性后,再去提供商业化的服务,至少满足大部分场景的需求。其次,项目初期为了打造品牌和证明实力,都会投入极大的心血。此时,一些中小型公司会存在“占便宜”的现象;而对于大型公司来说,开源项目能站在巨人肩膀上做自主可控,并且能产生一定的社会价值。只有大家去认可开源项目的价值,开源商业化公司才能为客户企业提供最优质的一体化服务。
从云上和云下来看,应该从多方面考虑,例如企业能力、企业规模、成本、自主可控等。因为大厂会考虑到成本和自主可控问题,所以云最开始的客户是中小型企业。同时,政策、国情和市场接受度这些因素也需要考虑,因此云上和云下模式主要根据具体政策和公司规模,以及客户和市场等因素决定。
吴海燕:从宏观的数据来看,2021年全球数据库管理市场是800亿美元,云数据库392亿美元,占49%的市场。Gartner预测,2025年云数据库量将有75%的市场占比量。宏观的数据表明,上云成为不可阻挡的趋势。
从微观的数据来看,全球NoSQL数据库的先行者MongoDB经历了从云下到云上,在2021年,MongoDB Atlas全年收入占比已提升至半数以上。因此,上云肯定是趋势,数据库服务也要上云。未来,大概只有少数因为监管需求导致不能用的公有云。
关于开源和闭源,中国互联网公司如果要走全球化,开源是不可避免的一种方式。在2021年,数据库市场已有一个转折点,Database超过了50%。2021年中国的数据库市场估值大约是300亿元人民币,全球是大约800亿美元,因此,做全球化的估值更高。同时,中国企业客户为软件付费的能力、意愿和习惯还不够。付费能力并非直接问题,因为中美的GDP体量非常接近,中国用约300亿元人民币的支撑起跟美国付了300亿美元差不多大体量,由此可见,全球化是必然趋势。而走全球化,开源是一个更契合互联网发展的方式,开源社区能连接全球用户,闭源则无法使国外用户方便地尝试国内的产品。
数据库未来生态:竞争与合作中发展
刘松:IaaS层作为云厂商的初始阶段,如今已经告一段落。现在提及的多云实际代表云的2.0。在几大云平台的多云环境上层,会有越来越多的东西,包含数据库、新一代数据库的中间件、数据工具等。未来,数据生态将更多由新兴的创业公司来成为主角吗?而云厂商只守好自己的IaaS层吗?
王楠:在多云数据管理上,一方面开源的独立厂商会更有优势,它跟巨头公司没有太多竞争关系,大家都愿意将底层的资源给它;另一方面,客户希望在不止一个平台上也能使用云厂商的数据库。目前,数据管理团队愿意部署到其他家的平台上,底层的IaaS是不愿意的。IaaS认为数据库本来是给IaaS层引流的,将数据库部署到其他家,等于给其他家做了嫁衣。因此,现阶段的阻力来自于云厂商。但未来第三方开源独立厂商强大以后,头部的云厂商将展开这样的合作。
潘娟:由于客户害怕产生问题,所以一定会优先考虑相对中立的公司。从术业有专攻的角度来看,团队虽小,但有资本和其他方面的扶持,在整个层面都会涌现出不同的idea和产品。因此,我会更倾向于云中立的公司,我也认为它们的数量会越来越多。不过从提供基础组件的云厂商来考虑,它们提供了最基础的土壤,如果不允许自身收获额外的加成价值和产品,便会产生竞争。综合考虑,不能给结论,但是、我能看到的是良性博弈的局面。
吴海燕:这是技术架构变迁的过程,从上一代技术架构变到云架构中间留了很多工具上的缺口,导致工具和技术软件、DevOps也开始火了。我认为不能投公有云和小云,因为云需要非常大的资本投入。建设云就好像在建高速公路,高速公路上要跑各种各样的车,如果高速公路建好了没有车,也收不到过路费,这就需要许多独立第三方搭应用、做产品和服务。总而言之,对早期的股权投资机构来讲,肯定还是投轻资产的技术驱动的,日后是面向未来的满足用户需求的东西。因此,独立第三方软件公司面向下一代云架构去满足未来需求,将是未来重点的关注对象。
总结
数字化的爆发带来了数据价值,开源、多云、基础设施的演进,包括人工智能的介入让数据价值的发现变得容易。在互联网高速发展的背景下,中国的数据公司能通过开源做国际化,同时云能更容易加速商业化。如今,数据库领域里面发展得太迅速,存在各种各样的可能,未来也值得所有人一同前行,一起探索。
边栏推荐
- 【无标题】函数,对象,方法的区别
- CADEditorX ActiveX 14.1.X
- [Bubble sort and odd-even sorting]
- Activiti产生的背景和作用
- 科普大佬说 | 黑客帝国与6G有什么关系?
- 一文带你弄懂 CDN 技术的原理
- 玉溪卷烟厂通过正确选择时序数据库 轻松应对超万亿行数据
- DOM对象能干什么?
- [Explanation of JDBC and inner classes]
- Why is the new earth blurred, in-depth analysis of white balls, viewing pictures, and downloading problems
猜你喜欢
C#/VB.NET 从PDF中提取表格
Summary of redis basics - data types (strings, lists, sets, hashes, sets)
How to use outside the PHP command in the container
【LeetCode—第2题 两数之和 代码详解 】附有源码,可直接复制
Machine Learning (Chapter 1) - Feature Engineering
LyScript 实现对内存堆栈扫描
巴比特 | 元宇宙每日必读:玩家离场,平台关停,数字藏品市场正逐渐降温,行业的未来究竟在哪里?...
Pixel mobile phone system
Basic using MySQL database
Classical Architecture and Memory Classification of Embedded Software Components
随机推荐
成为优秀架构师必备技能:怎样才能画出让所有人赞不绝口的系统架构图?秘诀是什么?快来打开这篇文章看看吧!...
OS层面包重组失败过高,数据库层面gc lost 频繁
【输出一个整数的的每一位,由高到低输出。使用递归和不使用递归】
Matplotlib
BPMN和DMN基本概念和使用案例
[Detailed explanation of binary search plus recursive writing method] with all the code
机器学习(公式推导与代码实现)--sklearn机器学习库
synchronized
Babbitt | Metaverse daily must-read: Players leave, platforms are shut down, and the digital collection market is gradually cooling down. Where is the future of the industry?...
What is a smart contract?
QT with OpenGL(Shadow Mapping)(面光源篇)
下午见!2022京东云数据库新品发布会
全新的Uber App设计
从餐桌到太空,孙宇晨的“星辰大海”
跨链桥协议 Nomad 遭遇黑客攻击,损失超 1.5 亿美元
Machine Learning (Chapter 1) - Feature Engineering
玉溪卷烟厂通过正确选择时序数据库 轻松应对超万亿行数据
numpy
MySQL数据库基本使用
MapReduce中ETL数据清洗案例