当前位置:网站首页>【大咖秀】博睿数据眼中的AIOps,选择正确的赛道正确的人
【大咖秀】博睿数据眼中的AIOps,选择正确的赛道正确的人
2022-06-11 02:24:00 【BJ_Bonree】
风口总是偏向那些找对方向的人。
2021年创投的风向标便吹向了IT运维这个赛道。根据IT桔子的不完全统计,2021年IT运维行业相关融资事件共有24起,融资金额约54.7亿元。
据艾瑞咨询的数据显示,2021年中国IT服务突破万亿大关,其中IT运维市场规模达到2941.2亿元。预计2023 年将达到3236.4 亿元,2020-2023 年的年复合增长率为 11.7%。就智能运维赛道而言,全球智能运维的市场规模年复合成长率预计为30.6%,2027年达到400亿美元的规模。
毋庸置疑,IT运维正在成为继SaaS之外又一个被送上风口的赛道。在这个巨大的角斗场中,资本、企业、技术正在塑造行业发展的新逻辑。
选择正确的赛道和正确的人
在过去的数十年间,运维发展经历了数个阶段。从早期的手工运维到标准化运维、自动化运维,再到DevOps、AIOps,追溯整个历程不难发现,运维方式随着技术的不断发展,逐渐迈向智能化。
从2016年AIOps(智能运维)概念被提出,到2017、2018年全球市场出现商业化产品,在国内市场,2020年是AIOps的元年。博睿数据也是在2020年开始重兵投入智能运维赛道。
根据第三方评估机构预测,到2022年,40%的大中型企业将部署AIOps平台。不难猜测,智能运维将在很长一段时间成为IT运维的重点赛道。
博睿数据作为国内智能运维领域的排头兵,自然也不例外。2008年博睿数据以监控起家,经过多年的打磨,成为了IT运维行业的领军企业;2020年博睿数据凭借强大APM背景和强大数据分析/AI(人工智能)能力成为国内A股市场上的“APM监测第一股”;同年,博睿数据凭借独到的市场眼光锚定智能运维赛道,有理由相信,博睿数据在今后的智能运维赛道中也将行稳致远。也正是基于博睿数据每一次的正确选择,吸引了那些紧跟赛道和风口的优秀人才的目光。
现任博睿数据首席架构师李骅宸与博睿数据AIOps首席专家贺安辉便是其中的佼佼者。

李骅宸,此前在蚂蚁集团负责数据服务稳定性,从事数据服务、系统稳定性、AIOps智能监控告警平台等研发工作,曾赋能支付宝关键业务和系统指标秒级态势诊断和应急决策。

贺安辉,之前在蚂蚁集团负责可观测性平台 AntMonitor 产品集的产品规划和设计工作, 对于AIOps的产品、算法、场景有丰富的实践经验。
近日,我们采访了两位经验丰富的大咖,试图从博睿数据的视角窥探AIOps 的全貌。
关于AIOps 产品本身

就博睿数据而言,博睿数据的AIOps的核心是“数据+AI+产品+场景”四合一的综合解决方案。在一体化运维、告警管理、故障定位、应急快恢等高频运维场景中帮助用户更高效、更准确的达成业务目标。
就其优势而言,主要有5个方面:
门槛低:博睿数据的AI接入简单,开箱即用,算法支持可视化和自解释;
性能高:同等性能条件下资源消耗较少,1台4C8G机器可处理每分钟6.6万指标量,3台8C16G机器可处理每分钟48万指标量;
数据全:APM深耕多年,数据多而全,比如Trace核心基础能力,博睿数据支持多语言、多框架,也能和日志深度关联。这对AIOps做多模态数据联邦分析和挖掘有优势;
范围广:算法通用性强,适应范围广泛,针对不同行业进行了模型优化;
分析强:可观测数据、流程工单数据、配置管理数据汇总到数据中台,提供流批一体的在离线数据查询聚合能力,为任意指标、实体的关联分析提供独到见解支撑。
目前,博睿数据基于自研的大数据实时处理和分析平台 Zeus做数据挖掘,在异常检测、趋势预测、告警收敛、事件分析等应用场景方面已实现产品化落地。
具体来说,异常检测,主要应用于运维数据的无监督异常发现环节,不需要运维人员手工设置阈值即可做到异常的自主发现,大幅节省了人力投入;
趋势预测,主要应用于业务特性运维数据的预测场景,比如容量预测、访问量预测、硬件缺陷预测等等,对于运维人员的预算编制、业务规划和提前介入处置起到很大的参考作用;
告警收敛,主要应用于统一告警平台的事件管理场景,运维人员不再需要面对大量的无效告警,只需要关注收敛后的少量故障,应急处置的效率和精准度有了大幅提升;
事件分析,主要应用于一体化运维平台的问题管理场景,AI将指标、Trace、事件的异常信息汇聚到问题,从问题查找根因,从根因联动通知、自动化等处置步骤,问题分析的效率和精准度得到大幅改善。
在AIOps实践方面,博睿数据依托多年APM行业积累,已具备丰富的数据集合。依托IT运维监控能力,利用大数据和机器学习技术持续构建智能运维监控能力。
2021年,博睿数据在国内首次提出了“服务可达的数据链DNA”技术理念,D代表DEM(数字体验管理),N代表NPM(网络性能管理),A代表APM(应用性能管理),从而打通从代码到用户访问的全过程,进一步释放企业IT运维监控管理所有分支领域DEM、APM、ITIM、NPM和智能运维管理的能力。

目前,博睿数据算法中台 SwiftAI已赋能到新一代APM的Server产品、新一代的智能运维大数据平台DataView、“双模一体”智能应急中心OneAlert等,与博睿数据统一联邦数据中台 Zeus相辅相成,不断落地智能异常检测、趋势预测、智能告警、事件分析等场景,助力云原生时代服务可达。
2022年5月20日,博睿数据正式推出了一体化智能可观测平台ONE,该平台旨在建立一体化、智能化、面向业务与用户体验的统一运维平台,助力企业提高数字化体验,降低运维成本,提升工作效率,为数字化转型赋能升级。同时,这也是业界第一个将所有运维监控需求“All in ONE”的统一平台。博睿数据的AI 能力,比如告警收敛、根因分析、多维分析、影响分析等,也将在ONE 平台的观测洞察、应急管理等模块中逐步落地。

谈及博睿数据AIOps未来的发展,贺安辉表示:“未来,博睿数据在AIOps 方面将在根因定位、影响分析、NLP、算法实验室四个方面发力。”
同时,未来博睿数据也将继续发展多模态数据联邦“底座”和AI算法的广度和深度,支持全程服务可观测。
AIOps 未来已来
虽然AI技术给运维工作带来的价值显而易见,但需要明确的是AIOps 不是一个一蹴而就的实践,而是一个长期演进的过程,需要不断创新发展。
就当前国内智能运维的环境而言,李骅宸认为AIOps还存在以下几方面的挑战:
普适性:在不同的客户业务场景中,如何减少定制化和实施成本,又能更好的解决业务问题。
可解释:AI的结果如何自解释,如何验证。
效率:高度自动化地减少人工干预。
资源:在私有化或POC时,极致的技术应用到资源和性能优化中,以最小资源成就最大价值。
稳定:AI算法高度智能化和自动化。
在他看来,博睿数据今后要在智能运维方面持续发力。
首先,要打破数据孤岛,做DNA 数据的最大化融合,建立数据资产的统一管理仓库,产生联邦数据的次生价值。以博睿数据提出的数据链DNA 概念为例,AIOps是DNA中重要的一环,可助力APM产品和数据实现端到端打通,让DNA更加自动化和智能化。同时,DNA数据链也给AI提供场景和数据土壤,让AI通过信息整合、特征关联真正的跑出优质算法模型。
其次,要加强数据分析和数据挖掘,扩展AI产品能力,夯实算法基础能力,让AI支持轻量级的模块化和产品化。在算法可解释性和评价体系方面建立一套标准,引入不同的数据集进行数据加工分析,用真实故障注入的方式来不断锤炼AIOps能力,在商业化输出时能够以近乎开箱即用、极低适配成本的方式实现价值的最大化输出。
更为重要的是,AIOps本就是基于已有的运维数据,并通过机器学习的方式来进一步解决自动化运维没办法解决的问题。企业实现AIOps的前提是建立起全面获取IT数据的能力,这里的数据主要包括但不限于日志、指标和事件等。将这些数据输送给AIOps平台,为AIOps提供数据资产,以进行整合的更高级别的分析和洞察。如果没有这些大数据的支持,AIOps则是无源之水。所以对于企业来说,大数据采集工作至关重要。
两位大咖对AIOps的未来发展充满信心。总体而言,中国市场足够大,数据也足够丰富,而在国家战略和政策的支持下,传统制造业正向智能创造逐步发展,发展的过程中必然会涉及大量数据处理,而这也是AI技术的强项,当前在运维领域,AI技术的应用还是刚刚起步,慢慢成熟,在未来的3-5年内,AI技术会广泛应用到运维场景中,向自助式服务方向发展。
写在最后
每一个产品最需要的是被市场认可。
在标准制定方面,2021年博睿数据获信通院首批AIOps评估的异常检测全面级,同年博睿数据作为信通院组织的AIOps标准工作小组成员,多项建议纳入到规范标准。
在产学研方面,博睿数据也跟厦门大学成立联合实验室,开展机器学习、深度学习方面的合作。
在行业应用落地方面,博睿数据的AIOps解决方案已经落地到银行、保险、证券、教育、航空等行业中,如异常检测场景、告警收敛场景、趋势预测场景等,为客户的数字化转型加速赋能。
边栏推荐
- 逃离大城市的年轻人:扛住了房价和压力,没扛住流行病
- Navicat Premium 15 工具自动被杀毒防护软件删除解决方法
- AOSP ~ WiFi on by default + GPS off by default + Bluetooth off by default + rotary screen off
- Kotlin let method
- 微信模版消息errcode“:40165,“errmsg“:“invalid weapp pagepath
- ADVANCE. AI CEO Shoudong will share the compliance of cross-border e-commerce using AI technology at the 2022 emerging market brands online Summit
- 年金保险理财产品可以复利吗?利率是多少?
- Kotlin apply方法
- 【189. 轮转数组】
- 基于互联网架构演进, 构建秒杀系统
猜你喜欢

Why did those who left Beijing, Shanghai and Guangzhou with a smile cry in the end?

Uni app - one click access to user information
![[resolved] how to fix another update in progress WordPress upgrade error](/img/b1/7b9945c1a623c20288f0d232cbb0c4.jpg)
[resolved] how to fix another update in progress WordPress upgrade error

软件测试英语常见词汇

靠贴牌飞利浦冲击上市,德尔玛的自有品牌又该如何“起跳”?

弄懂了采矿业与碳中和的逻辑,就读懂了矿区无人驾驶的千亿市场

那些笑着离开“北上广”的人,为何最后都哭了?

Project load failed

Google Gmail mailbox marks all unread messages as read at once

Will your company choose to develop data center?
随机推荐
[Fibonacci series]
AOSP ~ Logcat Chatty 行过期
CPT 102_LEC 18
Problems with JDBC tool classes
Navicat Premium 15 工具自动被杀毒防护软件删除解决方法
How to use phpMyAdmin to optimize MySQL database
Byte beating | the first batch of written examination for game R & D post (question solution)
Flat data to tree and tree data flattening
PHP starts OpenSSL and reports OpenSSL support=> disabled (install ext/openssl)
Kotlin apply method
【面试题 17.04. 消失的数字】
Problèmes de classe d'outils JDBC
Can Xiaoxiang life become the "Yonghui" in the discount industry after the completion of the round a financing of tens of millions of yuan?
[189. rotation array]
Executeineditmode property details
Necessity for banks to choose electronic bidding procurement
Sd3.0 notes
Use of CIN and cout
ShaderGraphs
MySQL备份与恢复