当前位置:网站首页>线上故障突突突?如何紧急诊断、排查与恢复
线上故障突突突?如何紧急诊断、排查与恢复
2022-07-05 01:24:00 【InfoQ】
概述
1 分钟发现
监控
告警
- 集成事件后管理更高效。
- 告警管理默认支持一键化集成阿里云常见的监控工具,并支持更多的监控工具手动接入,方便统一维护。
- 事件接入模块稳定,能提供 7x24 小时的无间断事件处理服务。
- 处理海量事件数据时可以保证低延时。
- 及时准确地将告警通知给联系人。
- 配置通知规则,对事件合并后再发送告警通知,减少运维人员出现通知疲劳的情况。
- 根据告警的紧急程度选择邮件、短信、电话、钉钉等不同的通知方式,来提醒联系人处理告警。
- 通过升级通知对长时间没有处理的告警进行多次提醒,保证告警及时解决。
- 帮助您快速便捷地管理告警。
- 联系人能通过钉钉随时处理告警。
- 使用通用告警格式,联系人能更好的分析告警。
- 多个联系人通过钉钉协同处理。
- 统计告警数据,实时分析处理情况,改进告警处理效率。
5 分钟定位故障
服务实例隔离与诊断
- 实践
Arthas 诊断
- JVM 概览
- 线程耗时分析
- 方法执行分析
- 对象查看器
- 实时看板
- 性能分析
10 分钟恢复
离群实例摘除
服务熔断与降级
流控、扩容、重启、回滚
- 流量控制:根据流量、并发线程数、响应时间等指标,把随机到来的流量调整成合适的形状,即流量塑形。通过流控能力,为服务接口配置流控规则,让容量范围内的请求通过,多余的请求被拒绝,相当于安全气囊的作用。层层防护,在 Nginx/Ingress 网关层进行粗粒度保护,在微服务层进行 API、接口、方法、参数粒度控制。避免应用被瞬时的流量高峰冲垮,从而保障应用的高可用性。
- 扩容:水平横向扩容提升集群可用性
- 重启:重新启动 JVM 进程,从而暂时消除长时间运行累积的问题如内存泄露等
- 回滚:消除变更引入的问题
基于同可用区优先的一键切流
尾
边栏推荐
- Arbitrum: two-dimensional cost
- 大专学历,33岁宝妈又怎样?我照样销售转测试,月入13k+
- 107. Some details of SAP ui5 overflow toolbar container control and resize event processing
- 整理混乱的头文件,我用include what you use
- Single step debugging of master data reading of SAP commerce cloud products
- Take you ten days to easily complete the go micro service series (IX. link tracking)
- Global and Chinese markets of radiation linear accelerators 2022-2028: Research Report on technology, participants, trends, market size and share
- SAP UI5 应用开发教程之一百零六 - 如何提高 SAP UI5 应用路由 url 的可读性试读版
- Wechat applet: Xingxiu UI v1.5 WordPress system information resources blog download applet wechat QQ dual end source code support WordPress secondary classification loading animation optimization
- SAP UI5 应用开发教程之一百零七 - SAP UI5 OverflowToolbar 容器控件介绍的试读版
猜你喜欢
Wechat applet: exclusive applet version of the whole network, independent wechat community contacts
【海浪建模1】海浪建模的理论分析和matlab仿真
微信小程序:独立后台带分销功能月老办事处交友盲盒
[untitled]
To sort out messy header files, I use include what you use
Inventory of more than 17 typical security incidents in January 2022
实战模拟│JWT 登录认证
Introduction to redis (1)
Remote control service
Basic operation of database and table ----- phased test II
随机推荐
SAP UI5 应用的主-从-从(Master-Detail-Detail)布局模式的实现步骤
Grabbing and sorting out external articles -- status bar [4]
19. Delete the penultimate node of the linked list
ROS command line tool
107. SAP UI5 OverflowToolbar 容器控件以及 resize 事件处理的一些细节介绍
Research Report on the overall scale, major producers, major regions, products and application segmentation of agricultural automatic steering system in the global market in 2022
107. Some details of SAP ui5 overflow toolbar container control and resize event processing
La jeunesse sans rancune de Xi Murong
Introduction to redis (1)
【微处理器】基于FPGA的微处理器VHDL开发
Wechat applet: wechat applet source code download new community system optimized version support agent member system function super high income
Nebula importer data import practice
Call Huawei order service to verify the purchase token interface and return connection reset
微信小程序:全网独家小程序版本独立微信社群人脉
【大型电商项目开发】性能压测-性能监控-堆内存与垃圾回收-39
微信小程序:最新wordpress黑金壁纸微信小程序 二开修复版源码下载支持流量主收益
Intel sapphire rapids SP Zhiqiang es processor cache memory split exposure
Four pits in reentrantlock!
微信小程序;胡言乱语生成器
Basic operation of database and table ----- the concept of index