Elnur - stock.adobe.com
Machine-Learning-Modelle mit Valohai testen und entwickeln
Das Start-up Valohai stellt ein Tool zur Verfügung, das die Entwicklung von Machine-Learning-Modellen und die hierfür notwendige Datenerfassung automatisiert.
Machine Learning und Deep Learning stehen heute im Mittelpunkt vieler Projekte in Unternehmen. Anbieter wie Amazon Web Services (AWS), Google, Microsoft und PyTorch haben daher damit begonnen, schlüsselfertige Machine-Learning-Lösungen zur Verfügung zu stellen, damit Firmen Projekte schneller entwerfen, entwickeln und in Produktion bringen können.
Das im Oktober 2016 in Turku, Finnland, gegründete Start-up Valohai (Finnisch für leuchtender Hai) – welches inzwischen auch einen Standort in San Francisco hat – bietet ebenfalls ein spezielles Tool an, das Machine-Learning-Prozesse und die hierfür notwendige Datenerfassung automatisiert.
Der Managed Service ermöglicht es, dass Entwickler mehrere Varianten eines Machine-Learning-Projekts parallel entwickeln, testen und betreiben können.
Das Modell und die zugehörigen Anwendungen sowie Daten befinden sich in der vom Kunden gewählten Cloud-Computing-Umgebung, können aber auch On-Premises gespeichert sein. Welches Framework oder welche Programmiersprache für die Entwicklung des Modells verwendet wird, ist laut Valohai Gründer und CEO Eelo Laaksonen unerheblich.
Machine Learning funktioniert nicht ohne Modelle
„Machine Learning kann nicht ohne Modelle funktionieren. Diese Modelle müssen definiert und mit großen Datenmengen trainiert werden“, erklärt Laaksonen. Ein Problem ist, dass die Anwenderunternehmen diese Modelle häufig nicht kennen.
Als Beispiel nennt Laaksonen eine Bank, die mit einem Machine-Learning-Modell sich regelmäßig verändernde Vorschriften und Regulierungen überprüft und umsetzt. Die Bank ist allerdings verpflichtet, dieses Modell transparent und nachvollziehbar zu halten.
„Wenn ein Modell in Produktion ist, ist es schwierig, zurückzugehen und zu schauen, was zu einer Entscheidung geführt hat“, sagt der Firmengründer. „Dies einer der Gründe, warum es so schwierig ist, Machine-Learning-Modelle in den Produktivbetrieb zu übersetzen.“
Laaksonen erläutert vier Problemfelder, die den produktiven Einsatz von Machine-Learning-Modellen bremsen:
- Reproduzierbarkeit: Die identische Kombination von Code und Daten, mit denen das Modell trainiert wird, kann in der Regel nicht einfach reproduziert werden. Um die Entscheidungsfindung nachvollziehbar zu machen, ist dies aber ein Muss.
- Compliance: Machine Learning kann nicht ohne Regeln funktionieren. Organisationen und Aufsichtsbehörden müssen daher Gesetze und Vorschriften für die automatisierte Entscheidungsfindung erarbeiten. Europa hat zwar laut Laaksonen mit der EU-DSGVO gehandelt. Es ist allerdings kompliziert, die Vorschriften in der Machine-Learning-Entwicklung umzusetzen. Eine Bank muss zum Beispiel in der Lage sein, die Entscheidung, die vor sechs Monaten automatisch getroffen wurde, zu erklären.
- Schneller Einstieg: Unternehmen wollen ihre Entwicklungs- und Machine-Learning-Teams vergrößern, setzen aber unterschiedliche Datensätze und unterschiedlichen Code ein. Für neue Mitarbeiter ist es daher schwierig, an Bord zu kommen und zu erkennen, wo die Daten sind und wie ein Modell funktioniert. Data Scientists und Entwickler sind zudem Mangelware.
- Schnelle Tests und Experimente: Geschwindigkeit ist bei der Entwicklung häufig entscheidend, doch Machine Learning erfordert einen Trial-and-Error-Ansatz. Ein Weg, mehrere Dinge mit Machine Learning auszuprobieren, ist, bessere Hardware einzusetzen, was teuer ist. Jede Änderung im Code muss zudem mit großen Datenmengen getestet werden.
Valohai kann reproduzierbare Algorithmen erstellen
„Im Gegensatz zu vielen anderen Machine-Learning-Umgebungen kann die Valohai-Lösung Änderungen verfolgen, reproduzierbare Algorithmen erstellen und sicherstellen, dass Änderungen während des Experimentierprozesses den Live-Betrieb nicht beeinträchtigen.“
Durch die Arbeit mit Containern innerhalb von Amazon Web Services (AWS), Microsoft Azure oder der Google Cloud Platform bietet Valohai eine spezielle Machine Learning Pipeline, die die Integration der Lernschritte unabhängig vom Entwickler oder Autor, der Sprache oder dem verwendeten Framework ermöglicht. Laut Laaksonen lässt sich das Modelltraining auf diese Weise bis zu zehn Mal schneller abschließen.
Die Lösung integriert alle notwendigen Ressourcen für die Entwicklung und das Testen von Machine-Learning- und Deep-Learning-Modellen. Die Überwachung der eingesetzten Ressourcen (Hardware, Software und damit verbundene Kosten) ist Teil der Lösung.
Valohai stellt drei Preisvarianten bereit: Eine kostenlose Version erlaubt zum Beispiel das Modelltraining auf AWS, Microsoft Azure und Google Cloud Platform sowie die Vorverarbeitung von Trainingsdaten. Die Pro-Version für 649 Dollar erlaubt darüber hinaus die On-Premises Pipeline-Installation und kundenspezifische SLAs. Organisationen können ebenfalls auf ein individuelles Enterprise-Modell setzen, das den Einsatz in Private-Cloud-Umgebungen erlaubt.
Anmerkung der Redaktion: Valohai stellte seine Plattform im Rahmen der IT Press Tour vor, die mehrmals im Jahr Besuche bei Start-ups und IT-Unternehmen organisiert.