当前位置:网站首页>Analyse des risques liés aux liaisons de microservices
Analyse des risques liés aux liaisons de microservices
2022-06-30 21:44:00 【51CTO】
L'analyse des risques de liaison commence par les données historiques de la communication de liaison.,Analyser les risques actuels du lien,Réduire les risques de communication par liaison,Améliorer la stabilité globale du système.L'analyse des risques liés aux liens peut résoudre de nombreux problèmes.,Si le réglage du temps d'arrêt est raisonnable、Si le réglage des temps de retry est raisonnable、ServicesSLASi les paramètres de l'indicateur sont raisonnables、Si la dépendance forte ou faible du Service répond aux attentes, etc.,Une grande partie des défaillances liées aux communications de service sont dues au risque de liaison.,Peut être découvert et résolu à l'avance par l'analyse des risques de liaison,Éviter les défaillances.
Un.、Temps d'arrêt etSLARisques
Configuration du délai d'accès du client au serveur,Ne correspond pas à l'accès réel,Est un risque de liaison très courant.La configuration des temps d'arrêt du service en amont est trop petite,Cela peut entraîner un délai pour certaines demandes qui auraient pu être retournées normalement,Impact sur les servicesSLAEt une expérience de service normale;Configuration excessive du temps d'arrêt,Le temps d'attente du service en amont est trop long en cas de défaillance du service en aval,Si c'est grave, le système s'effondrera..Donc,,Le réglage du temps d'arrêt est directement lié à la stabilité du système.,Besoin d'un mécanisme approprié pour guider le réglage du temps d'arrêt du Service,Et découvrir en temps opportun les dangers cachés de la configuration des temps d'arrêt dans le système en ligne.
Il existe deux principaux types de risques liés à la configuration des temps d'arrêt.:L'un est que le temps d'arrêt ne correspond pas à la réalité.;Un autre est que les paramètres de temporisation en amont et en aval ne correspondent pas,Par exemple, il y aA、B、C 3Services,ServicesAServices d'accèsB,ServicesBServices d'accèsC,Mais les services sont souvent rencontrés dans les affaires réellesAServices d'accèsBPlus de temps d'arrêt que le serviceBServices d'accèsCAvec un temps d'arrêt plus court.
2.、Forte ou faible dépendance ou risque de retry
Communication entre microservices , Si la communication sur ce lien échoue, l'ensemble du traitement de la demande échouera. , La relation entre ces deux micro - services est généralement appelée forte dépendance , On appelle ça une faible dépendance. . Nous pouvons nous baser sur les dépendances fortes et faibles du service ,Pour déclasser、 Fusible, etc. .
Forte ou faible dépendance à l'égard du risque de service , Se réfère à la relation entre les communications de liaison et les attentes non conformes .Par exemple,,ServicesAAppeler le serviceB Le lien est faiblement dépendant , Mais au fur et à mesure que la logique opérationnelle de l'itération des exigences change , Le service peut être involontaire AAppeler le serviceB Le lien est en fait devenu une forte dépendance , Mais tout le monde suit toujours la connaissance préalable , Considérez - le comme une faible dépendance , C'est un grand risque . En particulier en cas de défaillance du lien , Lorsque des opérations telles que la rétrogradation sont effectuées sur la base d'une faible dépendance , Ça pourrait être une tragédie. ,Rendre l'ensemble du système indisponible. Il est donc nécessaire de disposer de mécanismes appropriés , Détecter périodiquement les points de risque de la relation de liaison actuelle .
Trois、 Risque de regroupement ou de topologie
Le risque de regroupement ou de topologie est une source importante d'analyse des risques. .Par exemple,, Certaines machines d'un Cluster en ligne sont temporairement déconnectées en raison de la garantie , Mais la machine n'a pas été montée après réparation , Provoque le ralenti de certaines machines ;ServicesAAppeler le serviceB À l'origine, c'était la même salle informatique. , Basculer temporairement la relation d'appel pour invoquer le Service d'une autre salle informatique en raison d'une défaillance ou d'un exercice de commutation de trafic BServices, Mais pas après. ,Cause serviceAAppeler le serviceB A été l'accès inter - salles , Impact sur l'expérience utilisateur et la stabilité du système ;Un serviceS Le déploiement en ligne ne tient pas compte de l'emplacement géographique , Déployer trop de noeuds de service sous le même commutateur , Plusieurs noeuds du service ne sont pas disponibles en même temps en raison d'une défaillance du commutateur , Une avalanche de service causée par un nombre insuffisant de noeuds disponibles .
Quatre、 Risque d'invocation du lien
Les données topologiques en temps réel de Link sont un trésor , Vous pouvez lentement découvrir de nombreux risques au niveau de l'invocation du lien .Par exemple,, L'appel de service actuel dépasse 20 Services en aval ,Ventilateur trop grand, Non - conformité aux critères de conception des microservices , La nécessité d'une séparation plus poussée peut être examinée. .
Dans l'architecture des microservices, Le lien d'une seule demande est particulièrement long , Il y a des problèmes de performance , Ainsi, à partir de la topologie globale des liens TOP10 Longue liaison , Ou la profondeur du lien dépasse 6 Liste des liens , Retour d'information au personnel d'affaires , Voir si des ajustements au niveau Architectural sont nécessaires .
Lors de la séparation et de la conception des microservices , Il est recommandé de ne pas créer deux scénarios d'interdépendance des microservices. , La topologie des liens vous permet de trouver s'il y a actuellement des liens en boucle ,Si les anneaux, Description les interdépendances entre les services se sont développées , Des risques similaires peuvent être renvoyés au personnel d'affaires pour rectification. .
L'analyse des risques liés aux liens est un processus de découverte des risques, d'abstraction des risques et de mise en place d'un mécanisme de détection automatisé. , Il s'agit essentiellement d'une ingénierie systématique pour une gestion fine des risques de stabilité. , Nécessité d'une construction durable à long terme .
La détection des risques est la première étape de l'analyse des risques liés aux liens , Pour être en mesure de détecter continuellement de nouveaux risques pour le système , Il est recommandé de combiner l'analyse des risques et l'anti - modèle de stabilité. :① En cas de défaillance majeure du système , Et quelques problèmes typiques qui se sont accumulés , Schéma inverse de stabilité , C'est - à - dire facile à commettre dans la pratique de la stabilité , Certains modèles qui ne devraient pas apparaître ;② Déterminer si ces antipodes peuvent être détectées automatiquement .
Entre - temps, afin de faciliter la détection des nouveaux risques , Un cadre d'analyse des risques solide pourrait être mis en place , Inclure l'état des risques 、 Boucle fermée d'amélioration des risques 、Rapport sur les risques、 Mécanisme automatique de notification des risques, etc. , L'analyse des risques supplémentaire est directement fondée sur le développement du cadre. , équivalent à ajouter des plug - ins , L'efficacité de l'analyse des risques peut être grandement améliorée .
边栏推荐
- A comprehensive understanding of gout: symptoms, risk factors, pathogenesis and management
- Markdown notes concise tutorial
- Can flinksql two Kafka streams join?
- 你我他是谁
- Reading notes of Clickhouse principle analysis and Application Practice (1)
- 1-13 express监听GET和POST请求&处理请求
- 的撒啊苏丹看老司机
- Introduce an online platform for multi omics integration and network visual analysis
- 1-7 Path路径模块
- PyTorch量化实践(2)
猜你喜欢

Bloom filter
笔记【JUC包以及Future介绍】

Rethink healthy diet based on intestinal microbiome
Understand what MySQL index push down (ICP) is in one article

asp.net core JWT传递

clickhouse原生监控项,系统表描述

Phoenix architecture: an architect's perspective

pytorch geometric torch-scatter和torch-sparse安装报错问题解决

It is urgent for enterprises to protect API security

興奮神經遞質——穀氨酸與大腦健康
随机推荐
Analysis and proposal on the "sour Fox" vulnerability attack weapon platform of the US National Security Agency
PyTorch量化实践(2)
兴奋神经递质——谷氨酸与大脑健康
ceshi deces
1-17 express Middleware
.netcore redis GEO类型
Upgrade Kube with unknown flag: --network plugin
1-21 JSONP接口
模板方法模式介绍与示例
布隆过滤器
The 16th Heilongjiang Provincial Collegiate Programming Contest
5G 在智慧医疗中的需求
興奮神經遞質——穀氨酸與大腦健康
《ClickHouse原理解析与应用实践》读书笔记(1)
Zaah Sultan looks at the old driver
Reading notes of Clickhouse principle analysis and Application Practice (3)
asp. Net core JWT delivery
Go Web 编程入门: 一探优秀测试库 GoConvey
1-12 preliminary understanding of Express
1-3 使用SQL管理数据库