Jeżeli jesteś właścicielem organizacji, wiesz jaką wartość posiada zdrowa sieć i jak poważne konsekwencje dla Twojej firmy może wywołać jej awaria. Niestety, ale problemów z siecią nie jesteśmy w stanie uniknąć. Zarządzanie ciągle zmieniającym się środowiskiem sieciowym, sprostanie wymaganiom klientów oraz użytkowanie wewnętrzne nie należy do najłatwiejszych zadań.
Czynniki te sprawiają, że sieci często są podatne na różnego rodzaju problemy, takie jak nieplanowane, nagłe przestoje, wysokie wykorzystanie zasobów lub awaria sprzętu.
Rozwiazywanie tych problemów nie jest niczym nowym w sieci, natomiast kluczem jest to, jak dobrze i szybko jesteśmy w stanie takie problemy zniwelować. Analiza przyczyn źródłowych (RCA) w OpManager może Ci w tym pomóc!
Droga naprzód: wykorzystanie RCA w monitorowaniu
Zidentyfikowanie problemu jest największym wyzwaniem, któremu trzeba sprostać aby zmniejszyć MTTR. Utrzymanie niskiego poziomu MTTR pozwoli zachować zaufanie wśród klientów Twojej firmy oraz w pełni funkcjonować Twojej organizacji.
Aby umożliwić dogłębną analizę wydajności sieci, wprowadziliśmy w OpManager funkcję analizy przyczyn źródłowych (RCA).
Korzystając z RCA, możesz uzyskać kompleksowy wgląd w dane monitorowania sieci wszystkich urządzeń, interfejsów i adresów URL w jednym miejscu.
Dzięki pełnemu wglądowi w odpowiednie informacje z monitorowania, czas potrzebny na analizę wydajności i zawężenie pierwotnej przyczyny znacznie się skraca. Skutkuje to niższą ogólną wartością MTTR.
Graficzne porównanie monitorów
Dzięki rozwiązaniu drag and drop, które został zaimplementowane w OpManager ,wystarczy przeciągnąć i upuścić odpowiednie metryki wydajności wybranych urządzeń, interfejsów lub adresów URL, a RCA (Root cause analysis) automatycznie utworzy wykres z krzywymi wydajności. Każda krzywa reprezentuje inny monitor. Dzięki temu rozwiązaniu jesteśmy w stanie na jednym widoku weryfikować wydajność wielu wskaźników.
Zapisuj swoje analizy
Znalezienie pierwotnej przyczyny polega na zebraniu niezbędnych danych z monitorowanych urządzeń, porównanie ich oraz dokładną analizę oraz wyciągniecie wniosków aby dany problem rozwiązać. Korzystając z możliwości dodawania adnotacji, możesz rejestrować swoje przemyślenia i dodawać notatki dotyczące rozwiązania problemu po znalezieniu głównej przyczyny awarii. Dodatkowo, jeżeli z jakiegoś powodu musicie zatrzymać analizę, istnieje również możliwość zapisywania swoich szablonów, aby można było do nich później wrócić.
Takie rozwiązanie również pomaga, gdy wielu członków zespołu współpracuje w znalezieniu pierwotnej przyczyny. Na przykład administrator sieci może przeprowadzić RCA i zapisywać swoje wyniki. Następnie kierownik wyższego szczebla może czytać notatki adnotacji i podejmować oparte na danych decyzje dotyczące zmian konfiguracji w sieci.
Wykonaj RCA dla grup
Dzięki rozwiązaniu RCA w OpManager jesteśmy w stanie wykonywać również zbiorcze analizy urządzeń lub interfejsów. W przypadku, kiedy dana sieć w określonej lokalizacji przestanie działać, możemy wybrać odpowiednią grupę, aby automatycznie uzupełnić sprecyzowane dla niej urządzenia i rozpocząć analizę problemu z wydajnością.
Jak analiza przyczyn źródłowych (RCA) upraszcza monitorowanie sieci?
Bez RCA identyfikacja pierwotnej przyczyny problemu jest problematyczna. Na przykład wyobraź sobie, że alarm jest uruchamiany, gdy główny router w Twojej sieci przestanie działać. Musisz wtedy dokładnie przeanalizować wszystkie alarmy, a także sprawdzić samo urządzenie, aby dowiedzieć się więcej o problemie.
Taka metoda wydaje się prosta, gdy trzeba przeprowadzić analizę problemu tylko dla jednego urządzenia. Ale co się stanie, jeżeli wiele urządzeń w Twojej sieci ulegnie awarii?
Dzięki RCA możesz przeglądać wykresy wydajności różnych monitorów w jednym miejscu oraz porównywać je ze sobą. Obszerny zestaw informacji na ekranie pozwala na analizowanie wydajności i lokalizowanie pierwotnej przyczyny problemu w prosty sposób.
Analiza przyczyn źródłowych (RCA) ratuje sytuację: rzeczywisty przypadek użycia
- Załóżmy, że użytkownicy zgłaszają problem z prędkością ładowania się niektórych aplikacji. Aby ustalić rozwiązanie problemu należy wpierw wskazać jego przyczynę, a dopiero później podjąć działania naprawcze.
- W pierwszym kroku możesz zweryfikować wykorzystanie procesora oraz pamięci serwera aby zweryfikować czy wolny czas ładowania wynika z przeciążenia serwera. Wykluczenie tej możliwości pozwoli Ci przeanalizować kolejny zestaw możliwych scenariuszy.
- Niska prędkość ładowania może również nastąpić ze względu na dysk, na którym zainstalowana jest aplikacja. Możesz sprawdzić IOPS, opóźnienia, przepustowość i wykorzystanie urządzenia magazynującego, aby dowiedzieć się, czy problem jest spowodowany zbyt słabym i nadmiernie wykorzystywanym dyskiem.
Czasami niska prędkość ładowania może również wynikać z problemów z przepustowością w interfejsach łączących serwer ze środowiskiem pamięci masowej. Monitorowanie metryk Interface Rx i Interface Tx pomoże Ci zlokalizować ewentualne problemy z przesyłem danych.
Tak więc, gdy napotkasz złożony scenariusz, taki jak ten omówiony powyżej, będziesz musiał porównać wydajność wielu komponentów sieci. RCA zapewnia platformę do zgromadzenia wszystkich danych w jednym widoku, przeanalizowania ich, wykluczenia możliwości i zawężenia dokładnej przyczyny problemów w krótszym czasie.
12.07.2022
Autor: Daniel Kamiński
Kategorie: Aktualności Artykuł