当前位置:网站首页>阿里云易立:云原生如何破解企业降本提效难题?
阿里云易立:云原生如何破解企业降本提效难题?
2022-07-06 18:39:00 【InfoQ】
- 第一个阶段是应用架构的互联网化。2007 年起,随着互联网流量大爆发,阿里开始构建互联网规模分布式应用架构,自研微服务、消息、分布式数据库等核心中间件。
- 第二个阶段是基础设施云化。阿里云 2009 年开始自研飞天云操作系统,集团业务开始逐渐上云。同时,2011 年阿里集团开始探索落地容器技术,加速应用迁云,最大化利用云的弹性,通过离在线混部优化计算成本,到了 2019 年实现了核心系统全面上云。
企业降本增效之路上面临的难题
- 规划难。当业务迁移到容器场景后,需要对应用进行容量规划,过度分配资源会导致资源浪费,资源超售过度则会导致稳定性问题。
- 计费难。容器应用与传统应用相比具备更高的弹性和动态性,可以按需创建和释放资源,这也对费用估算带来更大的挑战。
- 分账难。与传统应用部署与资源绑定的方式不同。现在多个容器应用共享一个 K8s 集群。一个计算节点上可以运行多个 Pod,而且 Pod 可以弹性伸缩,在节点间动态迁移。应用层与资源层计量计费在空间、时间等多个维度都无法做到一对一对应,造成成本治理的复杂性。
- 优化难。云原生技术中例如:弹性、混部、Serverless、超卖等技术都有各自适合的典型场景。如果使用不当,比如弹性配置错误,可能带来意想不到的资源浪费甚至稳定性问题。
- 管理难。混合云已经成为企业 IT 架构的新常态。Kubernetes 可以帮助企业屏蔽基础差异。而不同环境财资管理能力参差不一,缺乏统一开放的用量数据模型进行管理,使得企业难以从全局的视角进行整体的成本分析与优化。
云原生企业 IT 成本治理方案:加速企业 FinOps 进程


多样化弹性能力:弹性容器实例可以在 30 秒内扩容 3000 Pod


混部能力升级:在 K8s 上提供对编排调度能力的增强

- 差异化 SLO保障:在 Kubernetes 之上抽象一套面向 QoS 的资源调度机制,比如延迟敏感型的在线类任务,和 Best effort 类型可抢占的计算任务。在提升资源利用率的通俗,让低优先级的任务,对延迟敏感型任务的影响 < 5%;
- 资源精细化调度:包括 CPU、GPU 拓扑感知、资源预留、交互式抢占、碎片整理、资源画像、热点打散等精细调度能力;
- 任务调度:大数据与 AI 相关的任务调度,比如 Gang、批量、优先级抢占以及弹性 Quota(队列间借用)等,从而更好地去应用整个集群资源。
边栏推荐
- Date processing tool class dateutils (tool class 1)
- Flir Blackfly S USB3 工业相机:白平衡设置方法
- CISP-PTE实操练习讲解(二)
- Analyze "C language" [advanced] paid knowledge [II]
- [server data recovery] data recovery case of a Dell server crash caused by raid damage
- Stm32f4 --- PWM output
- Processing image files uploaded by streamlit Library
- Threadlocalutils (tool class IV)
- Centos8 install MySQL 8.0 using yum x
- Flir Blackfly S 工业相机:配置多个摄像头进行同步拍摄
猜你喜欢

处理streamlit库上传的图片文件

云原生混部最后一道防线:节点水位线设计

Introduction to microservice architecture

3D激光SLAM:Livox激光雷达硬件时间同步
![[paper reading | deep reading] anrl: attributed network representation learning via deep neural networks](/img/06/17acf9958228cce5d80ada3275ad24.png)
[paper reading | deep reading] anrl: attributed network representation learning via deep neural networks

ROS learning (22) TF transformation

Twenty or thirty thousand a leaf? "Yang Mou" behind the explosion of plant consumption

新一代云原生消息队列(一)

Jacob Steinhardt, assistant professor of UC Berkeley, predicts AI benchmark performance: AI has made faster progress in fields such as mathematics than expected, but the progress of robustness benchma

go swagger使用
随机推荐
ROS learning (XIX) robot slam function package cartographer
argo workflows源码解析
大咖云集|NextArch基金会云开发Meetup来啦!
3D laser slam: time synchronization of livox lidar hardware
Stm32f4 --- general timer update interrupt
New generation cloud native message queue (I)
Flir Blackfly S 工业相机:自动曝光配置及代码
Cat recycling bin
Tips for web development: skillfully use ThreadLocal to avoid layer by layer value transmission
Threadlocalutils (tool class IV)
How to use strings as speed templates- How to use String as Velocity Template?
解密函数计算异步任务能力之「任务的状态及生命周期管理」
Yyds dry goods inventory # solve the real problem of famous enterprises: maximum difference
freeswitch拨打分机号源代码跟踪
Halcon实例转OpenCvSharp(C# OpenCV)实现--瓶口缺陷检测(附源码)
阿里云中间件开源往事
【论文阅读|深读】 GraphSAGE:Inductive Representation Learning on Large Graphs
centos8 用yum 安装MySQL 8.0.x
强化学习如何用于医学影像?埃默里大学最新《强化学习医学影像分析》综述,阐述最新RL医学影像分析概念、应用、挑战与未来方向
The boss is quarantined