Warum Wiederherstellungs-Metriken für die DR-Planung wichtig sind

APRIL 11TH, 2018
Übersetzung eines auf Englisch verfassten Artikels für die Recovery Zone. Den Originalartikel finden Sie hier.Der Harvard Business Review hat den Nagel auf den Kopf getroffen, wenn er von Metriken als „The True Measures of Success“ (der wahre Maßstab des Erfolges) spricht. Metriken spielen derzeit eine wichtige Rolle im Gesundheitswesen, im Sportbereich und in vielen anderen Branchen. Disaster Recovery (DR) ist dabei keine Ausnahme. Wenn es um die DR-Planung geht, messen Metriken nicht nur die Effektivität, sondern helfen Unternehmen, die Ziele zu erreichen, die für ihre Wiederherstellungsbemühungen so wichtig sind. Es gibt drei primäre Metriken, mit denen Unternehmen ihr Disaster Recovery-Programm steuern können:
  1. Wiederherstellungszeit (Recovery Time Objective, RTO):Legt fest, wie schnell IT-Systeme wiederhergestellt werden müssen, bevor ein Unternehmen irreparablen Schaden erleidet. Die Widerherstellungszeit wird normalerweise in Minuten, Stunden oder Tagen gemessen.
  2. Wiederherstellungspunkt (Recovery Point Objective, RPO):Bestimmt die maximale Datenmenge, die in einem Katastrophenszenario verlorengehen kann. RPO wird ebenfalls in Zeiteinheiten gemessen und basiert auf der Häufigkeit, mit der Backups durchgeführt werden und anderen Datensicherungsstrategien.
  3. Tatsächliche Wiederherstellungszeit (Recovery Time Actual, RTA):Die verifizierte Zeit, die für die Wiederherstellung von IT-Systemen nach einem Notfall benötigt wird. Dieses Ziel kann während einer Notfall- oder Wiederherstellungsübung ermittelt werden. Die RTA kann einer Organisation helfen, die RTO zu erfüllen oder festzustellen, ob zusätzliche Strategien oder Ressourcen erforderlich sind, um dieses Ziel zu erreichen.
Bestimmung Ihrer DR-Metriken nach ZielenObwohl Disaster Recovery-Metriken auf die Anforderungen eines Unternehmens zugeschnitten sein sollten, gibt es für jedes einzelne Ziel spezifische Faktoren zu berücksichtigen.RTO
inline
Standort und Ressourcenzuweisung spielen eine zentrale Rolle bei der Gestaltung Ihrer Recovery-Ziele. Nehmen wir einmal an, Sie müssen die Wiederherstellung in einem „Cold Site“-Szenario durchführen. Sie sind mit einer Basisinfrastruktur ausgestattet, die es erfordert, Daten und IT-Personal in die Einrichtung zu übertragen, zusätzliche Lizenzen zu erwerben und neue Software zu installieren, bevor die Wiederherstellung überhaupt beginnen kann. In diesem Szenario kann Ihre RTO von ein paar Tagen bis zu einer Woche reichen, da es sehr lange dauern kann, bis Ihre Systeme vollständig wiederhergestellt sind. In einem „Hot-Site“-Szenario ist der Recovery-Standort eingerichtet und einsatzbereit. In den meisten Fällen stellen Sie einfach auf das neue System um, was je nach Größe Ihrer Backups in wenigen Minuten erledigt werden kann. Da Ihre Daten jederzeit verfügbar sind, kann die IT-Abteilung sofort damit beginnen, Ihre Systeme wieder in Betrieb zu nehmen. Beide Beispiele zeigen, wie die RTO auf Kosten der Ressourcen ermittelt wird und wie sich diese Ressourcen auf die Wiederherstellungszeit auswirken.  RPO
inline
Ihre RPO- und Backup-Strategie gehen Hand in Hand. Das Sichern von Daten erfordert Ressourcen in Form von Zeit, Technologie und Personal, um sicherzustellen, dass alles reibungslos abläuft. Ein Unternehmen, das auf einen RPO nahe null abzielt, müsste kontinuierlich Daten an ein hochskalierbares Wiederherstellungsziel wie die Cloud senden. Dies ist ein ziemlich hoch gestecktes Ziel, das Ressourcen erfordert, um die Kapazität und den Netzwerkverkehr zu bewältigen, ohne das Kerngeschäft zu behindern. Eine allgemeine Faustregel ist es, RPO auf der Grundlage der Komplexität Ihrer Geschäftsfunktionen oder Anwendungen zu erstellen. Nehmen wir als Beispiel einen SQL-Server Die Geschwindigkeit und das Datenvolumen ändern sich in dieser dynamischen Umgebung ständig, so dass ein RPO von mindestens einer Stunde sicherstellen würde, dass Ihre Backup-Strategie genügend Daten schützt, um Ihre Wiederherstellungsziele zu erreichen. Dabei hilft es auch zu wissen, dass der RPO typischerweise am besten neben einer umfassenden Kosten-Nutzen-Analyse ermittelt wird. Unabhängig davon, ob Sie zwei Stunden oder 24 Stunden einplanen, ist es wichtig, die Kosten für den Datenverlust gegen die Kosten für die Datensicherung abzuwägen.  RTA
inline
Disaster Recovery ist eine komplexe Geschichte. Das Erreichen Ihrer vorgegebenen Ziele erfordert umfangreiche Ressourcen, Tests und Optimierungen. Ein umfassender Reaktionsplan ist zwar sinnvoll, aber die tatsächlichen Ergebnisse können von mehreren Faktoren beeinflusst werden. Es ist daher nicht ungewöhnlich, dass RTO und RTA stark variieren. Es ist aber wichtig, Erkenntnisse aus dieser tatsächlichen Wiederherstellungszeit zu gewinnen und diese zur weiteren Verbesserung Ihrer RTO- und DR-Fähigkeiten zu nutzen.  Das letzte Wort zum Thema MetrikenIn vielen Unternehmen trägt die IT-Abteilung die Verantwortung für die Implementierung und Verwaltung von Disaster Recovery-Strategien. Diese Last sollte die IT aber nicht alleine tragen. Ein effektives DR-Programm erfordert die koordinierte Zusammenarbeit mehrerer Parteien. Das Management, die IT-Abteilung und wichtige Entscheidungsträger müssen zusammenarbeiten, um die Wiederherstellungsziele mit den Ergebnissen der Analyse der geschäftlichen Auswirkungen und den individuellen Bedürfnissen des Unternehmens in Einklang zu bringen. Die Definition Ihrer Wiederherstellungs-Metriken vor einem Notfall kann entscheidend sein, wenn es darum geht, Ihren Reaktionsplan in Gang zu setzen.