当前位置:网站首页>阿里云易立:云原生如何破解企业降本提效难题?
阿里云易立:云原生如何破解企业降本提效难题?
2022-07-06 18:39:00 【InfoQ】
- 第一个阶段是应用架构的互联网化。2007 年起,随着互联网流量大爆发,阿里开始构建互联网规模分布式应用架构,自研微服务、消息、分布式数据库等核心中间件。
- 第二个阶段是基础设施云化。阿里云 2009 年开始自研飞天云操作系统,集团业务开始逐渐上云。同时,2011 年阿里集团开始探索落地容器技术,加速应用迁云,最大化利用云的弹性,通过离在线混部优化计算成本,到了 2019 年实现了核心系统全面上云。
企业降本增效之路上面临的难题
- 规划难。当业务迁移到容器场景后,需要对应用进行容量规划,过度分配资源会导致资源浪费,资源超售过度则会导致稳定性问题。
- 计费难。容器应用与传统应用相比具备更高的弹性和动态性,可以按需创建和释放资源,这也对费用估算带来更大的挑战。
- 分账难。与传统应用部署与资源绑定的方式不同。现在多个容器应用共享一个 K8s 集群。一个计算节点上可以运行多个 Pod,而且 Pod 可以弹性伸缩,在节点间动态迁移。应用层与资源层计量计费在空间、时间等多个维度都无法做到一对一对应,造成成本治理的复杂性。
- 优化难。云原生技术中例如:弹性、混部、Serverless、超卖等技术都有各自适合的典型场景。如果使用不当,比如弹性配置错误,可能带来意想不到的资源浪费甚至稳定性问题。
- 管理难。混合云已经成为企业 IT 架构的新常态。Kubernetes 可以帮助企业屏蔽基础差异。而不同环境财资管理能力参差不一,缺乏统一开放的用量数据模型进行管理,使得企业难以从全局的视角进行整体的成本分析与优化。
云原生企业 IT 成本治理方案:加速企业 FinOps 进程
多样化弹性能力:弹性容器实例可以在 30 秒内扩容 3000 Pod
混部能力升级:在 K8s 上提供对编排调度能力的增强
- 差异化 SLO保障:在 Kubernetes 之上抽象一套面向 QoS 的资源调度机制,比如延迟敏感型的在线类任务,和 Best effort 类型可抢占的计算任务。在提升资源利用率的通俗,让低优先级的任务,对延迟敏感型任务的影响 < 5%;
- 资源精细化调度:包括 CPU、GPU 拓扑感知、资源预留、交互式抢占、碎片整理、资源画像、热点打散等精细调度能力;
- 任务调度:大数据与 AI 相关的任务调度,比如 Gang、批量、优先级抢占以及弹性 Quota(队列间借用)等,从而更好地去应用整个集群资源。
边栏推荐
- 处理streamlit库上传的图片文件
- 豆瓣平均 9.x,分布式领域的 5 本神书!
- @Before, @after, @around, @afterreturning execution sequence
- Treadpoolconfig thread pool configuration in real projects
- Introduction to RC oscillator and crystal oscillator
- [paper reading | deep reading] graphsage:inductive representation learning on large graphs
- Livox激光雷达硬件时间同步---PPS方法
- ROS learning (21) robot slam function package -- installation and testing of orbslam
- #夏日挑战赛#数据库学霸笔记(下)~
- Twenty or thirty thousand a leaf? "Yang Mou" behind the explosion of plant consumption
猜你喜欢
Word wrap when flex exceeds width
使用Ceres进行slam必须要弄清楚的几个类和函数
#夏日挑战赛#数据库学霸笔记(下)~
强化学习如何用于医学影像?埃默里大学最新《强化学习医学影像分析》综述,阐述最新RL医学影像分析概念、应用、挑战与未来方向
15million employees are easy to manage, and the cloud native database gaussdb makes HR office more efficient
Dall-E Mini的Mega版本模型发布,已开放下载
【论文阅读|深读】RolNE: Improving the Quality of Network Embedding with Structural Role Proximity
Cisp-pte practice explanation (II)
Lidar: introduction and usage of ouster OS
Blackfly s usb3 industrial camera: buffer processing
随机推荐
freeswitch拨打分机号源代码跟踪
Errors made in the development of merging the quantity of data in the set according to attributes
Centos8 install MySQL 8.0 using yum x
ROS learning (XIX) robot slam function package cartographer
ROS learning (22) TF transformation
3D激光SLAM:Livox激光雷达硬件时间同步
Recognition of C language array
一片葉子兩三萬?植物消費爆火背後的“陽謀”
Why am I warned that the 'CMAKE_ TOOLCHAIN_ FILE' variable is not used by the project?
#yyds干货盘点# 解决名企真题:最大差值
最近小程序开发记录
STM32F4---通用定时器更新中断
Dall-E Mini的Mega版本模型发布,已开放下载
张平安:加快云上数字创新,共建产业智慧生态
[paper reading | deep reading] anrl: attributed network representation learning via deep neural networks
Flir Blackfly S 工业相机:配置多个摄像头进行同步拍摄
The GPG keys listed for the "MySQL 8.0 community server" repository are already ins
Lidar: introduction and usage of ouster OS
leetcode:5. 最长回文子串【dp + 抓着超时的尾巴】
开发中对集合里面的数据根据属性进行合并数量时犯的错误