Definition

Autoscaling

Autoscaling ist eine Methode innerhalb von Cloud-Computing-Services, mit der sich Rechenressourcen automatisch hinzufügen oder entfernen lassen. Ob Ressourcen hinzugefügt oder entfernt werden, ist abhängig von der aktuellen Auslastung: Bei sehr hohem oder steigendem Bedarf wird der Workload von einer größeren Anzahl von Servern erledigt. Bei niedriger oder sinkender Last werden hingegen überflüssige Server automatisch heruntergefahren.

Autoscaling wird besonders in Cloud-Computing-Umgebungen eingesetzt, in denen starke Schwankungen in der Auslastung der Server auftreten. Ein typisches Szenario liegt zum Beispiel vor, wenn tagsüber wenig Besucher die Seiten aufrufen und am Abend sehr viele. Tagsüber ist daher die Auslastung gering und es stehen zu viele Server zur Verfügung. Abends reicht die Anzahl der Server hingegen nicht aus und es treten Performance-Probleme auf. Durch Autoscaling wird tagsüber bei geringer Besucherzahl die Anzahl der Server automatisch reduziert, am Abend werden bei hoher Besucheranzahl zusätzliche Server hinzugeschaltet.

Autoscaling hat für Unternehmen eine Reihe von Vorteilen: Durch die Reduzierung der Anzahl der eingesetzten Server bei geringer Serverlast können Kosten reduziert werden. Gleichzeitig lassen sich durch die Nutzung einer höheren Anzahl an Servern in Spitzenzeiten Performance-Probleme umgehen. Zudem werden DDoS-Attacken technisch nahezu unmöglich.

Der Begriff Autoscaling wurde von Amazon geprägt und wird häufig im Zusammenhang mit dem Produkt Amazon Elastic Compute Cloud (E2C) verwendet. Die automatische Skalierung wird manchmal auch als automatische Elastizität bezeichnet.

Diese Definition wurde zuletzt im Oktober 2019 aktualisiert

Erfahren Sie mehr über Cloud Computing