当前位置:网站首页>Analyse des risques liés aux liaisons de microservices
Analyse des risques liés aux liaisons de microservices
2022-06-30 21:44:00 【51CTO】
L'analyse des risques de liaison commence par les données historiques de la communication de liaison.,Analyser les risques actuels du lien,Réduire les risques de communication par liaison,Améliorer la stabilité globale du système.L'analyse des risques liés aux liens peut résoudre de nombreux problèmes.,Si le réglage du temps d'arrêt est raisonnable、Si le réglage des temps de retry est raisonnable、ServicesSLASi les paramètres de l'indicateur sont raisonnables、Si la dépendance forte ou faible du Service répond aux attentes, etc.,Une grande partie des défaillances liées aux communications de service sont dues au risque de liaison.,Peut être découvert et résolu à l'avance par l'analyse des risques de liaison,Éviter les défaillances.
Un.、Temps d'arrêt etSLARisques
Configuration du délai d'accès du client au serveur,Ne correspond pas à l'accès réel,Est un risque de liaison très courant.La configuration des temps d'arrêt du service en amont est trop petite,Cela peut entraîner un délai pour certaines demandes qui auraient pu être retournées normalement,Impact sur les servicesSLAEt une expérience de service normale;Configuration excessive du temps d'arrêt,Le temps d'attente du service en amont est trop long en cas de défaillance du service en aval,Si c'est grave, le système s'effondrera..Donc,,Le réglage du temps d'arrêt est directement lié à la stabilité du système.,Besoin d'un mécanisme approprié pour guider le réglage du temps d'arrêt du Service,Et découvrir en temps opportun les dangers cachés de la configuration des temps d'arrêt dans le système en ligne.
Il existe deux principaux types de risques liés à la configuration des temps d'arrêt.:L'un est que le temps d'arrêt ne correspond pas à la réalité.;Un autre est que les paramètres de temporisation en amont et en aval ne correspondent pas,Par exemple, il y aA、B、C 3Services,ServicesAServices d'accèsB,ServicesBServices d'accèsC,Mais les services sont souvent rencontrés dans les affaires réellesAServices d'accèsBPlus de temps d'arrêt que le serviceBServices d'accèsCAvec un temps d'arrêt plus court.
2.、Forte ou faible dépendance ou risque de retry
Communication entre microservices , Si la communication sur ce lien échoue, l'ensemble du traitement de la demande échouera. , La relation entre ces deux micro - services est généralement appelée forte dépendance , On appelle ça une faible dépendance. . Nous pouvons nous baser sur les dépendances fortes et faibles du service ,Pour déclasser、 Fusible, etc. .
Forte ou faible dépendance à l'égard du risque de service , Se réfère à la relation entre les communications de liaison et les attentes non conformes .Par exemple,,ServicesAAppeler le serviceB Le lien est faiblement dépendant , Mais au fur et à mesure que la logique opérationnelle de l'itération des exigences change , Le service peut être involontaire AAppeler le serviceB Le lien est en fait devenu une forte dépendance , Mais tout le monde suit toujours la connaissance préalable , Considérez - le comme une faible dépendance , C'est un grand risque . En particulier en cas de défaillance du lien , Lorsque des opérations telles que la rétrogradation sont effectuées sur la base d'une faible dépendance , Ça pourrait être une tragédie. ,Rendre l'ensemble du système indisponible. Il est donc nécessaire de disposer de mécanismes appropriés , Détecter périodiquement les points de risque de la relation de liaison actuelle .
Trois、 Risque de regroupement ou de topologie
Le risque de regroupement ou de topologie est une source importante d'analyse des risques. .Par exemple,, Certaines machines d'un Cluster en ligne sont temporairement déconnectées en raison de la garantie , Mais la machine n'a pas été montée après réparation , Provoque le ralenti de certaines machines ;ServicesAAppeler le serviceB À l'origine, c'était la même salle informatique. , Basculer temporairement la relation d'appel pour invoquer le Service d'une autre salle informatique en raison d'une défaillance ou d'un exercice de commutation de trafic BServices, Mais pas après. ,Cause serviceAAppeler le serviceB A été l'accès inter - salles , Impact sur l'expérience utilisateur et la stabilité du système ;Un serviceS Le déploiement en ligne ne tient pas compte de l'emplacement géographique , Déployer trop de noeuds de service sous le même commutateur , Plusieurs noeuds du service ne sont pas disponibles en même temps en raison d'une défaillance du commutateur , Une avalanche de service causée par un nombre insuffisant de noeuds disponibles .
Quatre、 Risque d'invocation du lien
Les données topologiques en temps réel de Link sont un trésor , Vous pouvez lentement découvrir de nombreux risques au niveau de l'invocation du lien .Par exemple,, L'appel de service actuel dépasse 20 Services en aval ,Ventilateur trop grand, Non - conformité aux critères de conception des microservices , La nécessité d'une séparation plus poussée peut être examinée. .
Dans l'architecture des microservices, Le lien d'une seule demande est particulièrement long , Il y a des problèmes de performance , Ainsi, à partir de la topologie globale des liens TOP10 Longue liaison , Ou la profondeur du lien dépasse 6 Liste des liens , Retour d'information au personnel d'affaires , Voir si des ajustements au niveau Architectural sont nécessaires .
Lors de la séparation et de la conception des microservices , Il est recommandé de ne pas créer deux scénarios d'interdépendance des microservices. , La topologie des liens vous permet de trouver s'il y a actuellement des liens en boucle ,Si les anneaux, Description les interdépendances entre les services se sont développées , Des risques similaires peuvent être renvoyés au personnel d'affaires pour rectification. .
L'analyse des risques liés aux liens est un processus de découverte des risques, d'abstraction des risques et de mise en place d'un mécanisme de détection automatisé. , Il s'agit essentiellement d'une ingénierie systématique pour une gestion fine des risques de stabilité. , Nécessité d'une construction durable à long terme .
La détection des risques est la première étape de l'analyse des risques liés aux liens , Pour être en mesure de détecter continuellement de nouveaux risques pour le système , Il est recommandé de combiner l'analyse des risques et l'anti - modèle de stabilité. :① En cas de défaillance majeure du système , Et quelques problèmes typiques qui se sont accumulés , Schéma inverse de stabilité , C'est - à - dire facile à commettre dans la pratique de la stabilité , Certains modèles qui ne devraient pas apparaître ;② Déterminer si ces antipodes peuvent être détectées automatiquement .
Entre - temps, afin de faciliter la détection des nouveaux risques , Un cadre d'analyse des risques solide pourrait être mis en place , Inclure l'état des risques 、 Boucle fermée d'amélioration des risques 、Rapport sur les risques、 Mécanisme automatique de notification des risques, etc. , L'analyse des risques supplémentaire est directement fondée sur le développement du cadre. , équivalent à ajouter des plug - ins , L'efficacité de l'analyse des risques peut être grandement améliorée .
边栏推荐
猜你喜欢

根据肠道微生物组重新思考健康饮食

网络营销之四大误解

USBCAN分析仪的配套CAN和CANFD综合测试软件LKMaster软件解决工程师CAN总线测试难题

介绍一款|用于多组学整合和网络可视化分析的在线平台

A comprehensive understanding of gout: symptoms, risk factors, pathogenesis and management

Text recognition svtr paper interpretation

Nacos部署及使用

Reading notes of Clickhouse principle analysis and Application Practice (3)

Open the jupyter notebook/lab and FAQ & settings on the remote server with the local browser

AKK菌——下一代有益菌
随机推荐
NCAT detailed introduction (Reprint)
测试勋章1234
PyTorch量化感知训练(QAT)步骤
What does grade evaluation mean? What is included in the workflow?
的撒啊苏丹看老司机
【回溯】全排列 leetcode46
Document Layout Analysis: A Comprehensive Survey 2019论文学习总结
1-16 路由的概念
What happens when word encounters an error while trying to open a file?
1-14 express managed static resources
Bloom filter
激发新动能 多地发力数字经济
【无标题】第一次参加csdn活动
1-12 preliminary understanding of Express
It is urgent for enterprises to protect API security
ceshi deces
《ClickHouse原理解析与应用实践》读书笔记(2)
twelve thousand three hundred and forty-five
Can flinksql two Kafka streams join?
1-15 nodemon