Getty Images
Erste Schritte mit SageMaker JumpStart
SageMaker JumpStart ist ein Tool für Anfänger und erfahrene Entwickler von Software für maschinelles Lernen. Erfahren Sie, wie das Tool den Lernprozess vereinfacht und beschleunigt.
Das Erstellen, Trainieren, Bereitstellen und Feinabstimmen von Modellen für maschinelles Lernen (Machine Learning, ML) ist ein Prozess, der eine Reihe zeitaufwendiger und komplexer Aufgaben umfasst. Amazon SageMaker vereinfacht zwar den gesamten Prozess der Ausführung von Modellen für maschinelles Lernen, aber die Entwicklung und Feinabstimmung dieser Modelle ist für praktisch jeden Softwareentwickler eine komplizierte Aufgabe.
Es gibt jedoch eine wachsende Bibliothek mit öffentlichen Algorithmen und vortrainierten Modellen, die von verschiedenen Quellen zur Verfügung gestellt werden. Folgen Sie dieser Schritt-für-Schritt-Anleitung, wie Sie mit Amazon SageMaker JumpStart beginnen können.
Was ist Amazon SageMaker JumpStart?
Amazon SageMaker JumpStart ist ein Hub für maschinelles Lernen, der Zugriff auf eine breite Palette von öffentlichen ML-Modellen bietet und diese nahtlos in die von SageMaker verwaltete AWS-Infrastruktur integriert. Besonders nützlich ist der Hub für Anwendungen, die allgemeine Anwendungsfälle implementieren müssen, die mit öffentlich verfügbaren Modellen gelöst werden können. Das Durchsuchen der gesamten Liste der Modelle ist auch für Teams empfehlenswert, die maschinelles Lernen in ihren Roadmaps nicht berücksichtigen, da es wertvolle Ideen für zukünftige Anwendungsverbesserungen liefern kann.
Die Jupyter-Notebook-API vereinfacht den Softwareentwicklungsprozess und die verfügbaren Modelle enthalten Kommentare zu jedem Schritt im Quellcode. Für spezifischere oder fortgeschrittenen Anwendungsfälle ist Erfahrung mit der Erstellung und dem Training von Machine-Learning-Modellen erforderlich. Da JumpStart nahtlos in die SageMaker-Infrastruktur integriert ist, vereinfacht das die Bereitstellung und Ausführung von Modellen.
JumpStart bietet den Anwendungseigentümern die Flexibilität, bereits trainierte Modelle einzusetzen oder verfügbare Algorithmen als Ausgangspunkt für die Entwicklung eigener Modelle zu verwenden. Auch wenn die Notebook-Oberfläche nicht unbedingt Programmierkenntnisse voraussetzt, sind Grundkenntnisse in der Programmiersprache Python für das Verständnis der in jeder Aufgabe ausgeführten Schritte sicherlich hilfreich. JumpStart ermöglicht auch die gemeinsame Nutzung von Modellen und Notizbüchern über mehrere Konten hinweg.
Verfügbare Modelle
Die in SageMaker JumpStart verfügbaren Modelle umfassen Bereiche wie Textklassifikation, Fragenbeantwortung, Bildklassifikation, Textzusammenfassung, Zeitreihenvorhersage und Anomalieerkennung. Diese Modelle lösen eine Reihe von Problemen, beispielsweise die Erkennung von Objekten in Bildern, die Vorhersage von Ergebnissen auf der Grundlage bestehender Trends, die Erstellung von Textzusammenfassungen und die Erkennung möglicher Betrugsszenarien.
Erste Schritte mit SageMaker JumpStart
Entwickler interagieren mit JumpStart über das SageMaker Python SDK oder über die AWS-Konsole. Das SDK ist die bevorzugte Option, sobald die Modelle automatisiert ausgeführt werden sollen. Eine Voraussetzung für die Verwendung der JumpStart-Benutzeroberfläche ist die Aktivierung von SageMaker Studio. Das erfordert die Erstellung einer SageMaker-Domäne, damit das Tool die erforderlichen Aktionen auf AWS-Ressourcen ausführen kann.
Schritt 1
Erstellen Sie eine SageMaker-Domäne, einen Domänennamen und ein Benutzerprofil und weisen Sie ihr eine Identitäts- und Zugriffsmanagementrolle zu.
Schritt 2
Starten Sie Studio über die SageMaker-Konsole.
Schritt 3
Um die SageMaker Studio UI zu öffnen, klicken Sie auf den Link Open Studio.
Schritt 4
Klicken Sie auf JumpStart, um die SageMaker-JumpStart-Oberfläche zu starten.
Schritt 5
Suchen Sie in der SageMaker-Benutzeroberfläche nach verfügbaren Modellen. Wenn Sie beispielsweise nach Bildklassifikation suchen, werden mehrere Optionen angezeigt.
Schritt 6
Wählen Sie ein Modell aus. JumpStart liefert eine Beschreibung und andere nützliche Informationen zu dem Modell. Benutzer können das Modell über dieselbe JumpStart-Oberfläche bereitstellen und Parameter konfigurieren, zum Beispiel den Instanztyp, den Endpunktnamen und andere Einstellungen.
Schritt 7
Sobald Sie die Konfigurationen festgelegt haben, klicken Sie auf die Schaltfläche Deploy. Dieser Schritt löst die Erstellung des SageMaker-Endpunkts aus, die einige Minuten in Anspruch nimmt.
Schritt 8
Öffnen Sie ein Notebook und führen Sie Aufgaben für das eingesetzte Modell aus. Das Notebook zeigt die relevanten Schritte und den Quellcode für wichtige Aufgaben an.
Für dieses spezielle Modell bietet das verfügbare Notebook den Quellcode zur Ausführung der Ersteinrichtung, zur Auswahl eines vorab trainierten Modells und zur Abfrage des Endpunkts. Dieser Quellcode bietet Entwicklern einen nützlichen Ausgangspunkt für die Verwendung des bereitgestellten Modells.
Sie trainieren das Modell mit einem Standarddatensatz oder mit einem benutzerdefinierten Datensatz. JumpStart bietet eine API zum Konfigurieren und Starten von Trainingsaufträgen.
Sobald eine Aufgabe abgeschlossen ist, beenden Sie alle gestarteten Ressourcen, insbesondere Endpunkte, da diese erhebliche Kosten verursachen können, wenn sie nicht benötigt werden. Stellen Sie sicher, dass Sie die richtige Instanzgröße für die anstehenden Aufgaben wählen und vermeiden Sie eine Überbelegung.