Elnur - stock.adobe.com
Angebote für Machine Learning as a Service im Vergleich
Machine Learning as a Service (MLaaS) ermöglicht es Unternehmen, Modelle zu trainieren, ohne eigene Anwendungen hierfür entwickeln zu müssen. Es gibt jedoch Einstiegsbarrieren.
Es ist noch nicht lange her, dass eine eigene Machine-Learning-Plattform ein Wettbewerbsvorteil war, wenn auch kein großer. Heute jedoch ist Machine Learning ein Muss für wettbewerbsfähige Unternehmen. Es gibt jedoch Barrieren bei der Implementierung, die den Entscheidungsprozess prägen.
Die größten davon sind Kosten und Benutzerfreundlichkeit. Plattformen für Machine Learning lassen sich oft nur schwer in unternehmensinterne Systeme integrieren, und viele sind schwer zu beherrschen. Machine Learning as a Service (MLaaS) ist jedoch eine Technologie, die in beiden Bereichen Erleichterungen verspricht.
MLaaS hat sich bereits als einer der am schnellsten wachsenden IT-Märkte etabliert. 2016 mit weniger als einer Milliarde Dollar bewertet, wird das Marktsegment 2021 voraussichtlich 3,7 Milliarden Dollar übersteigen. Ein großer Teil dieses Wachstums wird dem parallelen Aufschwung des Marktes für das Industrielle Internet der Dinge (Industrial Internet of Things, IIoT) zugeschrieben, wo die effektive Einführung oft von den Machine-Learning-Ressourcen abhängt.
Die größten Akteure unter den MLaaS-Anbietern sind bekannt – in dieser Zusammenfassung werden vier Schlüsselelemente analysiert, die Plattformen voneinander trennen: Kosten, Integration, integrierte Sprachkompatibilität und Benutzerfreundlichkeit.
IBM Watson Studio / Watson Machine Learning Cloud
Die Watson-Suite von IBM umfasst MLaaS-Funktionalität, die durch eine breite Palette von Entwicklungs- und Management-Tools ergänzt wird. Sie ist für die Verwendung durch Entwickler und Data Scientists gedacht und basiert auf Praxismodellen, die in Watson Studio erstellt und über OpenScale verwaltet werden. Cloud Pak kann separat erworben werden, um die Verwaltung des KI-Lebenszyklus zu automatisieren. Modelle können dynamisch umgeschult werden.
Mit den visuellen Modellierungsanwendungen von Watson Studio lassen sich schnell und einfach Einblicke generieren. R-, Python- und Scala-Tools erleichtern die Analyse für Data Scientists. Ein Modellierer für neuronale Netzwerke und ein Flow Editor unterstützen Entwickler, Machine Learning in Cloud-Anwendungen zu integrieren. Das Bluemix Dashboard unterstützt Entwickler und Data Scientists bei der gemeinsamen Arbeit an Modellen.
Die Watson Machine Learning Cloud arbeitet mit SPSS und vorhandenen Algorithmen in der Spark MLlib. Watson Machine Learning lässt sich relativ einfach in bestehende Systeme integrieren, die für komplexe Analysen und Anwendungsentwicklung vorgesehen sind und sich an professionelle Anwender richten. Analysten auf Unternehmensebene und Citizen Data Scientists können allerdings Probleme mit der Benutzeroberfläche und Benutzerfreundlichkeit haben.
Es gibt drei Preisstufen: Lite, Standard, Professional. Die ersten beiden Stufen sind Pay-as-you-go:
- Lite: Kostenlos, fünf Modelle / 5.000 Vorhersagen pro Monat / 50 Stunden Schulung, Batch-Bereitstellung;
- Standard: 0,50 Dollar pro 1.000 Vorhersagen pro Monat / 0,50 Dollar pro Kapazitätseinheitenstunde;
- Professional: 1.000 Dollar pro Monat / 2.000.000 Vorhersagen pro Monat / 1.000 Stunden.
Google Cloud Machine Learning Engine
Auf der Grundlage von TensorFlow nutzt die Google Cloud Machine Learning Engine die beträchtliche Software-as-a-Service-Fertigkeit (SaaS) des Technologiegiganten, wobei sich die Machine Learning Engine auf eine breite Palette von Diensten erstreckt. Die Google AI Platform ermöglicht die Verarbeitung natürlicher Sprache (Natural Language Processing, NLP), Übersetzung, Bilderkennung und andere KI-Anwendungen und bietet gleichzeitig eine Reihe von APIs. Die Google Cloud Machine Learning Engine ist in alle integriert.
Die größte Stärke des MLaaS-Anbieters liegt in der Modellierung neuronaler Netzwerke. Das Toolset ist dabei Plug-and-Play-fähig. Ein AI Hub ermöglicht die Erstellung von KI-Pipelines und umfasst einen umfangreichen Satz von Out-of-the-Box-Algorithmen, eine Reihe von KI-Bausteinen (für Bild-/Videoanalyse sowie Sprach- und Stimmungsanalyse) und erleichtert die Entwicklung von Anwendungen.
Die KI-Plattform für die Entwicklung und Implementierung von Machine Learning umfasst einen in JupyterLab integrierten Dienst für Notebooks zur Verwaltung des Frameworks für Machine Learning. Die AI Platform umfasst außerdem vorkonfigurierte Virtuelle Maschinen und Deep Learning Container für die schnelle Anwendungsentwicklung und kann Modelle als Prediction Engines hosten.
Zu den Integrationen der AI Platform gehören Compute-Engine-Instanzen, die neben TensorFlow eine Reihe beliebter Frameworks für Machine Learning hosten, darunter PyTorch und Scikit-Learn.
Der größte Nachteil der Services sind die Kosten. Nur der AI Hub und die Notebooks sind kostenlos, alles andere ist nur per Abonnement verfügbar, und viele der Gebühren werden vertraglich ausgehandelt. Die verwirrende Komplexität der Preisgestaltung wird teilweise durch einen Preisrechner auf der Google-Cloud-Website abgemildert.
Obwohl auf der Website einige stündliche Verarbeitungsraten angegeben sind – so werden zum Beispiel Trainigsjobs für Machine Learning in Europa mit 0,54 US-Dollar pro Stunde pro Trainingseinheit berechnet – , allerdings muss man sich für ein genaues Angebot an Google wenden.
Microsoft Azure Machine Learning Studio
Microsoft hat sich schon früh zu einem führenden Anbieter auf dem MLaaS-Markt entwickelt, der Ressourcen für Data Scientists, Entwickler und Geschäftsanwender gleichermaßen bereitstellt. Azure Machine Learning Studio ist auf flexible und erweiterbare praktische Entwicklung ausgelegt und kann das gesamte Spektrum an Benutzern und Anwendungen aufnehmen.
Die Philosophie von Microsoft, die ihren Ursprung in den Business-Intelligence-/Data-Warehouse-Angeboten innerhalb von SQL Server vor über 15 Jahren hat, verlangt von Benutzern auf allen Ebenen, dass sie die Schritte jedes Machine-Learning-Prozesses selbst leisten: Datenexploration und -bereinigung sowie die Auswahl der Lernmethode und Validierung müssen vom Benutzer selbst durchgeführt werden. Diese Philosophie kultiviert die Kompetenz von Nicht-Entwicklern und war für Microsoft erfolgreich, obwohl es seinen Konkurrenten einen Vorteil bei der Benutzerfreundlichkeit verschafft hat.
Machine Learning Studio verfügt über eine Reihe von sofort einsatzbereiten Algorithmen. Die Cortana Intelligence Gallery (eine Community-basierte Bibliothek mit Machine-Learning-Lösungen) ist als Entwicklungsressource verfügbar und bietet Vorlagen für Personalanalyseanwendungen im Einzelhandel, Kundenvorhersagemodelle, automatisierte Support-Ticket-Analyse, Betrugserkennungssysteme, Prognose der Lieferkettennachfrage und Hunderte anderer Angebote.
Wie bei der IBM-Plattform ist der größte Nachteil des Angebots die Lernkurve und die erforderliche Projektzeit. Trotz der Zugänglichkeit jeder Phase müssen weniger erfahrene Benutzer viel Zeit und Mühe investieren, um ein Projekt abzuschließen.
Machine Learning Studio ist für Benutzer mit einem Microsoft-Konto kostenlos. Dies beinhaltet einen Arbeitsbereich von bis zu zehn GB Speicherplatz, einschließlich Python- und R-Support und Predictive-Webdiensten. Einhundert Module pro Experiment sind erlaubt, und die Dauer des Experiments ist auf eine Stunde begrenzt.
Denjenigen, die ein Azure-Abonnement haben, steht ein Standard-Workspace zur Verfügung, der für 8,42 Euro pro Monat sowie 0,84 Euro pro Studio-Experimentstunde erhältlich ist. Der Speicherplatz ist unbegrenzt, die Daten können über SQL vor Ort gelesen werden, und eine Produktionsweb-API ist verfügbar.
AWS Machine Learning / Amazon SageMaker
Wie Google ist Amazon führend im SaaS-Bereich, was seinen MLaaS-Anbietern eine dominierende Marktstellung verschafft. Im Gegensatz zu Microsofts Machine Learning Studio ist es überaus einfach zu bedienen, mit vielen Assistenten und praktischen Tools, für deren Einsatz keine tiefgreifenden Kenntnisse oder Schulungen erforderlich sind. Die Modellerstellung wird angeleitet, und die resultierenden APIs sind einfach und leicht in Anwendungen zu implementieren.
AWS Machine Learning beziehungsweise Amazon SageMaker bieten eine beträchtliche Automatisierung, was es für Neulinge im Bereich des maschinellen Lernens noch attraktiver macht. Der Dienst wählt die besten Methoden aus und kann sogar kategoriale Spalten ohne Vorkonfiguration erforschen.
Der Nachteil des Services ist, dass keine unstrukturierten Lernmethoden zur Verfügung stehen, so dass seine Kapazität für Deep-Learning-Anwendungen begrenzt ist.
Die Preisgestaltung ist nutzungsabhängig, je nach verwendetem Dienst, was die Abrechnung komplex macht. Amazon bietet im Entwicklerhandbuch eine Übersicht über die verschiedenen Gebühren. Die Preise hängen dabei auch von den verwendeten Instanzentypen für die Speicherung, Verarbeitung sowie Modelltraining und Modellbereitstellung ab.