Kadmy - Fotolia
Server-Troubleshooting: Fehlerbehebung als Auslaufmodell?
Kommt es bei einem Server mit geschäftskritischen Anwendungen zu Problemen, ist schnelles Handeln durch die IT erforderlich. Die Herangehensweisen haben sich da verändert.
Läuft auf einem Windows Server ein wichtiger Workload und kommt es dort zu Problemen, beginnt die Uhr gnadenlos zu ticken, bis der Fehler schnellstmöglich behoben ist.
Es gibt meist mehrere Möglichkeiten, um einen Server mit Problemen wieder ordnungsgemäß an den Start zu bekommen. Und meist lautet die Antwort auf die Frage, welches der richtige Ansatz ist, wie so häufig in der IT: Es kommt darauf an. Sich in dieser zugegebenermaßen stressigen Situation für den richtigen Ansatz zu entscheiden, ist nicht immer einfach.
Das ein Windows Server mal ausfällt oder ins Straucheln gerät, ist meist unvermeidlich und kann vielfältige Ursachen haben. Das reicht von einem problematischen Update bis zum abrupten, ungeplanten Herunterfahren aus vielfältigen Ursachen. Prinzipiell stehen drei Möglichkeiten zur Verfügung, einen defekten Server wieder in Betrieb zu nehmen. Dabei haben sich die Prioritäten in den vergangenen Jahren etwas von einer Fehlerbehebung zu anderen Ansätzen hin verschoben.
Ausfall ist nicht gleich Ausfall
Die Vorgehensweise bei einem Ausfall eines Systems hat sich in vielen Unternehmen in den vergangenen Jahren verändert. Lange Zeit hat man sich darauf konzentriert, unabhängig von dem vorliegenden Problem, die Fehlerbehebung auf dem betroffenen System durchzuführen. Ein System einfach auszutauschen, wurde meist aus Gründen der Hardwarekosten und des möglichen Datenverlustes vermieden.
Das hat sich bei Desktops schon länger geändert. Heutzutage, wo Anwendungen häufig nur auf Servern laufen und Cloud-Storage genutzt wird, sowie die Desktop-Hardware vergleichsweise preiswert ist, ist eine zeitaufwendige Fehlerbehebung auf einem Desktop-System oftmals nicht mehr zeitgemäß. Um dem Mitarbeiter ein zeitnahes Weiterarbeiten zu ermöglichen, ist es meist viel einfacher, auf die Schnelle mal eben ein Desktop-System auszutauschen.
Dieses Austauschprinzip funktioniert bei Desktop-Systemen bereits seit geraumer Zeit, und hat sich auch seit einigen Jahren bei Servern etabliert. Insbesondere dank der Virtualisierung ist es dort oftmals sogar sehr einfach. Und anders als bei Desktops findet bei Servern auch meist eine ordentliche Sicherung statt, so dass man gegebenenfalls zu einem bestimmten Zeitpunkt des vorherigen Zustands zurückkehren kann. So gibt es je nach Situation und Server unterschiedliche Ansätze, um ein Problem zu lösen: die klassische Fehlerbehebung auf dem System, ein Austausch oder einfach das Erstellen einer neuen Instanz dank Virtualisierung.
Option 1: Den Server wiederherstellen
Eine sehr traditionelle Methode beim Lösen von Serverproblemen ist die Wiederherstellung dessen, was fehlt oder beschädigt wurden. So kann eine Wiederherstellung des Servers ideal sein, um Updates oder andere Änderungen zurückzusetzen. Immer vorausgesetzt, der Server an sich läuft und der notwendige Softwareagent für die Wiederherstellung auch. Für kleine Reparaturen oder fehlende Dateien kann dieser Ansatz ideal sein. Selbst wenn der Server nicht vollständig funktioniert, sondern nur die Basisfunktionalität bietet, kann das Wiederherstellen eines früheren Zustandes ein guter Ausgangspunkt sein.
Dabei ist es von Vorteil, dass sich Admins mit keinem Konfigurationsaufwand und Änderungen beschäftigen müssen. Dafür nimmt der Wiederherstellungsprozess unter Umständen einige Zeit in Anspruch. Und eine erfolgreiche Wiederherstellung eines Servers heißt ja nicht, dass man in jedem Fall der Lösung des eigentlichen Problems näher ist.
Option 2: Den Server reparieren
Und dies führt zur zweiten wichtigen Möglichkeit: Den problematischen Server zu reparieren. Wenn Anwendungen oder Teile des Betriebssystems nicht mehr ordnungsgemäß funktionieren, lässt sich das ursächliche Problem unter Umständen beheben – wenn man es denn findet.
Betreibt man beispielsweise die Core-Version des Windows Servers, muss man gegebenenfalls sehr versiert auf der Befehlszeile agieren können, um etwaigen Problemen zu Leibe zu rücken. Im Ernstfall ist es wenig hilfreich, wenn hier erst langwierige Recherchen vonnöten sind. Besser ist es dann, sich dem Problem über entsprechende Verwaltungswerkzeuge mit grafischer Oberfläche anzunehmen. Vorausgesetzt, der betroffene Server ist in einem Zustand, in dem er remote aus der Ferne verwaltet werden kann.
Bis zu einem gewissen Punkt sind moderne Server eine Art Blackbox, die eher für den Austausch als für eine Reparatur konzipiert sind. Wie eingangs beim Desktop-Beispiel erwähnt, ist dann der Weg des geringsten Wiederstandes die Wiederherstellung oder ein Ersatz. Bestimme Anwendungen müssen so schnell wie möglich wieder zur Verfügung stehen, daher wird eine Entscheidung oft aus Sicht des Geschäftsbetriebs und nicht aus dem technologischen Blickwinkel getroffen.
Je weniger sich Administratoren mit entsprechender Fehlerbehebung beschäftigen, desto geringer ist auch der Erfahrungsschatz, den sie dort aufbauen. Gerade dieses Wissen und die Fertigkeit, Probleme zu lösen, kann im Falle eines Falles aber manchmal entscheidend sein. Gleiches gilt natürlich auch für entsprechende Werkzeuge zur Fehlerbehebung. Kommen diese nicht mehr zum Einsatz, dann wird der Bedarf daran geringer. Und natürlich auch hier die Fertigkeit im Umgang mit entsprechenden Tools. Dies führt schlussendlich dazu, dass man im Problemfall nur zwei alternative Ansätze hat.
Option 3: Den Server austauschen
Und das führt zur dritten Option: dem Austausch des Problemservers. Und für diesen Ansatz hat der zunehmende Einsatz von Virtualisierung eine große Bedeutung. Bevor die Virtualisierung flächendeckend zum Einsatz kam, kümmerten sich meist ganz bestimmte Server um ganz bestimmte Anwendungen und waren genau darauf ausgerichtet. Kam einer dieser Server ins Straucheln, war die Situation ungleich kritischer und man hatte nur die Option, diesen zu reparieren oder die Daten wiederherzustellen.
Mit der Einführung von Virtualisierung bekam der Punkt Skalierbarkeit eine ganz andere Bedeutung. Der Problematik des Single Point of Failure (SPoF) kann damit anders begegnet werden. Trotz des eventuellen Verlustes eines defekten Servers können die Anwendungen online gehalten werden. Dieser Ansatz macht den einfachen Austausch eines Servers gegenüber Reparatur oder Wiederherstellung zur attraktiven Option. Insbesondere mit einer Automatisierungsroutine, die einen virtuellen Ersatzserver mit minimalem Zeitaufwand bereitstellt.
Die Bereitstellung von Anwendungen über Container unterstützt dieses Konzept ebenfalls, so dass für viele Probleme dies der gängigste Ansatz sein dürfte und in Zukunft eher noch weiter verbreitet sein wird. Und wie immer gilt: Nicht für alle Workloads und Anwendungen eignen sich alle Ansätze gleichermaßen allgemein gültig.