cherezoff - stock.adobe.com
Hochverfügbarkeit mit vSphere HA Application Monitoring
Hochverfügbarkeit und fehlende Reaktionen von VMs vertragen sich nicht miteinander. Der VMware vSphere High Availability Service bietet mehrere Mittel dagegen.
Der Hochverfügbarkeitsdienst von VMware mit dem klangvollen Namen vSphere High Availability (HA) Service kann automatisch virtuelle Maschinen (VM) neu starten, wenn diese nicht mehr reagieren. Wenn Sie aber mehr über die Ursachen erfahren möchten, benötigen Sie einen tieferen Griff in den Werkzeugkasten. Das vSphere HA Application Monitoring kommt da gerade recht.
Der grundsätzliche Mechanismus, mit dem die Reaktivität einer VM überwacht wird, nennt sich Heartbeat. Ein Heartbeat ist nicht mehr als ein eigentlich ziemlich beliebiges, aber natürlich definiertes Signal der VMware Tools, das gezielt an den vSphere VM Monitoring Service gesendet wird mit dem einzigen Zweck, es überhaupt ankommen zu lassen. Bleibt der Empfang des Heartbeat-Signals über mehr als einen festgelegten Zeitraum hinweg aus, so hat die VM offensichtlich Probleme – vSphere betrachtet die VM dann als reaktionslos.
Normalerweise tritt ein solches Ausbleiben des Heartbeats auf, wenn es einen Fehler im Gast-Betriebssystem gegeben hat oder – etwa wegen unzureichender Zeitzuteilung durch die VM – die VMware Tools nicht richtig funktionieren. Egal, was die Ursache für das Ausbleiben ist, vSphere High Availability kann den Neustart der betroffenen VM einleiten.
Ein eintreffender VM Heartbeat ohne vSphere HA Application Monitoring oder Ergebnisse des VM Monitorings ist kein allzu perfektes Zeichen für den Zustand oder die Funktionalität einer VM. Es gibt Fälle, in denen der Heartbeat nicht mehr ausgesendet wird, die VM und ihre Anwendungen aber in aller Seelenruhe, fehlerfrei und ungestört vor sich hin werkeln. In solchen Fällen kann es dann vorkommen, dass vSphere HA diese VM unnötig neu starten würde, da ja der Heartbeat nicht angekommen ist.
Um eine solche Situation zu vermeiden und das VM Monitoring zu verbessern, kann der VM Monitoring Service in vSphere HA auch die I/O-Funktionalität der VM auf Laufwerks- oder Netzwerkaktivität prüfen. Beides sind untrügliche Hinweise auf Aktivität von Anwendungen.
Das VM Monitoring prüft die I/O-Aktivität der vergangenen zwei Minuten zusätzlich zum regulären Heartbeat. Bleibt der Heartbeat aus, während I/O-Aktivität zu verzeichnen ist, so könnte die VM auch weiterhin ausreichend funktionsfähig sein – kein Grund für vSphere, einen Neustart der Maschine einzuleiten. Fehlt hingegen der Heartbeat und auch I/O-Aktivitäten bleiben seit einer Weile aus (vordefiniert sind die schon erwähnten zwei Minuten), so kann der Master-Node des Clusters die betroffene VM neu starten.
Über Heartbeats und I/O-Aktivitätsmessung hinaus unterstützt VMware auch das vSphere HA Application Monitoring. Dieses ermöglicht die Konfiguration von Heartbeat-Signalen für ausgewählte Anwendungen. Die dafür vorgesehenen Anwendungen müssen zu diesem Zweck das vSphere Application Monitoring unterstützen oder für diesen Zweck ein Software Development Kit (SDK) einbinden – die Anwendung muss also dafür entwickelt sein.
Das vSphere Application Monitoring unterscheidet sich nahezu gar nicht vom VM Monitoring Service. Aktivieren Sie vSphere HA Application Monitoring und sendet die Anwendung ihren individuellen Heartbeat, ist alles bestens. Bleibt aber der individuelle Heartbeat der Anwendung aus, erreicht also das vSphere HA Application Monitoring nicht, so wird die VM nach einer festgelegten Zeitspanne ohne Signal neu gestartet.
Auch die Sensitivität des vSphere HA Application Monitorings ist konfigurierbar. Bei hoher Sensitivität wird alle 30 Sekunden mit dem Eintreffen eines Heartbeat-Signals gerechnet. Mittlere Sensitivität wird erst nach mehr als einer Minute ohne Signal nervös. Und bei niedriger Sensitivität kommt es erst nach 2 Minuten ohne Rückmeldung von der VM zur Einleitung von Maßnahmen.
Wenn Ihnen diese vorgegebenen Zeitfenster nicht passen – kein Problem. Sie können auch eigene Zeiträume definieren. Mit kleineren Zeitfenstern entdecken Sie in Not geratene VMs schneller, so dass diese schneller neu gestartet werden können, um ihren Dienst wieder ungestört anzutreten. Diesen Reaktionsvorteil bezahlen Sie jedoch mit einer höheren Gefahr falscher Alarme, in denen VMs heruntergefahren werden, obwohl dies eigentlich gar nicht notwendig gewesen wäre.