PG Software - Votre distributeur IT

Blog

ameliorer surveillance reseau rca

Si vous gérez une entreprise, vous connaissez la valeur d'un réseau sain et vous savez à quel point une panne de réseau est préjudiciable à votre activité. Mais les problèmes de réseau sont inévitables. La forte dépendance à l'égard des réseaux pour répondre à l'évolution constante des besoins des clients et de l'utilisation interne pèse lourdement sur le résultat.

Cela rend les réseaux vulnérables à des problèmes courants tels que des temps d'arrêt brutaux et non planifiés, une forte utilisation des ressources et des dysfonctionnements matériels.

Ainsi, le fait d'être confronté à des goulets d'étranglement n'est pas nouveau pour un réseau, mais la clé réside dans la façon dont vous atténuez la fréquence des problèmes.

Deux axes pour réduire les problèmes de réseau

  • Temps moyen de réparation (MTTR) : Il s'agit d'une mesure du temps moyen nécessaire pour réparer une panne et rétablir le réseau à la normale. Une valeur MTTR élevée peut vous nuire financièrement et vous obliger à payer des pénalités pour non-respect des accords de niveau de service. Il est donc crucial de disposer d'un système de gestion des pannes de réseau efficace et robuste.

  • Trouver la cause première: Les réseaux sont des systèmes complexes composés d'une grande variété de dispositifs et d'interfaces, ce qui rend très difficile pour les administrateurs réseau de localiser précisément la cause première des goulets d'étranglement du réseau. Le temps écoulé pour localiser les problèmes de réseau signifie que le MTTR de votre réseau est en constante augmentation, ce qui peut affecter votre entreprise à terme.

La voie à suivre : L'analyse des causes initiales dans la supervision

L'identification des problèmes est le plus grand défi à relever lorsqu'on essaie de réduire le MTTR. En maintenant un MTTR faible, vous conserverez la confiance des clients dans votre entreprise et vous éviterez que celle-ci ne périclite.

Afin de vous permettre d'analyser en profondeur les performances du réseau, nous avons introduit la fonction d'analyse des causes profondes (RCA) dans OpManager.

Grâce à RCA, vous pouvez obtenir une visibilité complète des données de surveillance du réseau de tous vos appareils, interfaces et URL dans une console centralisée.

Grâce à une visibilité complète des informations de surveillance pertinentes, le temps nécessaire à l'analyse des performances et à la détermination de la cause initiale est considérablement réduit, ce qui se traduit par une diminution de la valeur globale du MTTR.

Caractéristiques importantes

Comparez les moniteurs graphiquement

Il suffit de faire glisser et de déposer les mesures de performance des appareils, interfaces ou URL sélectionnés et RCA construit automatiquement un graphique avec des courbes de performance, chacune représentant un moniteur. Comparez les performances de plusieurs appareils sur une seule mesure, ou plusieurs mesures pour un seul appareil, le tout dans une seule vue.

visuel graphique op manager

Enregistrez vos analyses

Pour trouver la cause initiale, il faut rassembler les données de surveillance nécessaires, les comparer et les analyser en profondeur, et enfin enregistrer vos analyses. Grâce à l'option d'annotation, vous pouvez enregistrer vos résultats et ajouter des notes de résolution une fois que vous avez trouvé la cause initiale. Si vous souhaitez interrompre votre analyse à mi-chemin, vous pouvez enregistrer vos interprétations jusqu'à ce point et les sauvegarder.

Lorsque vous revenez, vous pouvez reprendre là où vous vous étiez arrêté. Cela est également très utile lorsque plusieurs membres de l'équipe collaborent pour trouver la cause initiale. Par exemple, un administrateur réseau peut effectuer un RCA et enregistrer ses conclusions, et plus tard, un responsable de haut niveau peut lire les notes d'annotation et prendre des décisions basées sur des données concernant les changements de configuration du réseau.

Add annotation

Effectuez des RCA pour des groupes

Cette option est utile pour analyser collectivement les performances d'un ensemble de périphériques ou d'interfaces. Par exemple, lorsqu'un réseau particulier dans un site spécifique tombe en panne, vous pouvez sélectionner le réseau (groupe), ce qui fait apparaître automatiquement les périphériques spécifiques à ce groupe, et vous pouvez commencer à analyser les problèmes de performance immédiatement.

Comment RCA simplifie-t-il la surveillance du réseau ?

Sans RCA, l'identification de la cause première est un véritable casse-tête. Par exemple, imaginez qu'une alarme soit déclenchée lorsqu'un routeur central de votre réseau tombe en panne. Vous devez examiner en détail les données de l'alarme et visiter la page snapshot de l'appareil pour mieux comprendre le problème.

Cette méthode peut sembler simple lorsque vous devez effectuer une analyse des causes de défaillance pour un seul appareil. Mais que se passe-t-il si plusieurs appareils de votre réseau tombent en panne et que cela entraîne une défaillance complète du réseau ?

fonctionnalites RCA

Avec RCA, vous pouvez afficher les graphiques de performance de divers moniteurs dans un module centralisé et les comparer tous dans un seul volet. Avec un ensemble complet d'informations sur votre écran, l'analyse des performances et la localisation de la cause principale d'un problème deviennent une promenade de santé.

RCA sauve la mise : Un cas d'utilisation réel

Supposons que les utilisateurs signalent une vitesse de chargement lente lorsqu'ils accèdent à votre application. Pour résoudre complètement le problème, vous devez identifier la cause réelle et prendre des mesures correctives.

Tout d'abord, vous pouvez suivre l'utilisation de la CPU et de la mémoire de votre serveur d'application pour comprendre si la lenteur du chargement est due à une surcharge du serveur. En écartant cette possibilité, vous pourrez analyser les autres causes possibles.

Une vitesse de chargement lente peut également survenir lorsque votre serveur d'applications attend le périphérique de stockage qui abrite votre système de fichiers. Vous pouvez vérifier les IOPS, la latence, le débit et l'utilisation de votre périphérique de stockage pour comprendre si le problème est dû à un périphérique de stockage sous-performant et sur-utilisé.

Parfois, la lenteur du chargement peut également être due à des problèmes de bande passante dans les interfaces reliant le serveur et votre environnement de stockage. La surveillance des métriques Interface Rx et Interface Tx vous aidera à localiser les goulots d'étranglement, le cas échéant.

Ainsi, lorsque vous rencontrez un scénario complexe tel que celui évoqué ci-dessus, vous devez comparer les performances de plusieurs composants du réseau. RCA fournit la plateforme permettant de rassembler toutes les données en une seule vue, de les analyser, d'écarter les possibilités et de déterminer la cause exacte des problèmes en moins de temps.

En savoir plus sur OpManager, et télécharger une version d'essai gratuite de 30 jours. Vous pouvez également faire l'expérience d'une démo gratuite en ligne, ou programmer une démo gratuite et personnalisée avec nos experts qui pourront répondre à toutes vos questions sur le produit.