Wie aktives Lernen das Trainieren von KI-Modellen beschleunigt

Die repetitiven und manuellen Aufgaben des KI-Trainings kann die KI selbst übernehmen, wenn durch aktives Lernen ein intelligenter Workflow für die Datenannotation geschaffen wird.

von

Christian Heinrichs, UiPath

Zuletzt aktualisiert:12 Juni 2024

Ein KI-Modell zu trainieren, macht keinen großen Spaß. Die Vorteile sind jedoch unverkennbar. Die KI kann 24 Stunden am Tag ohne Pause in Höchstgeschwindigkeit arbeiten. Wenn sie jedoch keine Ahnung von dem Unternehmen hat, macht sie höchstwahrscheinlich selbst die grundlegendsten Dinge falsch. Untrainiert kann sie zum Beispiel nicht einmal zwischen einer Dankes-E-Mail und einer dringenden Kundenbeschwerde unterscheiden.

Wer schon einmal ein KI-Modell trainiert hat, kann dieses Beispiel nachempfinden. Die gute Nachricht ist, dass KI darauf trainiert werden kann, ein Unternehmen genau zu verstehen und die wichtigsten Prozesse auszuführen. Aber das erfordert Zeit und Mühe und in der Regel auch eine Menge Datenannotation.

Daten annotieren – das Nadelöhr

Das Beschriften oder auch das Labeln von Daten, auch Datenannotation genannt, hilft der KI, die geschäftsbezogenen Daten zu verstehen und sicher zu verarbeiten. Dabei handelt es sich um einen manuellen Prozess der Kennzeichnung von Rohdaten mit relevanten Parametern oder Etiketten. Dies ist ein entscheidender Teil im Prozess, KI-Modelle zu trainieren, damit diese Muster in Daten genau erkennen und korrekt darauf reagieren können. So kann ein Modell beispielsweise zwischen einer Dankes-E-Mail und einer dringenden Beschwerde unterscheiden. Oder es hilft, wichtige Daten aus einer Nachricht zu extrahieren, zum Beispiel eine Lieferadresse oder eine Kundennummer, was für viele wertvolle Automatisierungsvorhaben entscheidend sein kann.

Das Beschriften ist gewissermaßen das neue Programmieren geworden. Statt zu programmieren, was Maschinen tun sollen, beschriften Mitarbeiter immer häufiger Beispiele, um die KI-Modelle zu trainieren. Trotzdem ist das ein langwieriger und langweiliger Prozess für diejenigen, die ihn durchführen.

Auf die Beschriftung von Daten entfallen etwa 80 Prozent der Zeit, die für ein KI-Projekt aufgewendet wird. Große Teams aus Fachexperten verbringen in der Regel Hunderte von Stunden mit der Kennzeichnung von Tausenden von Einzelbeispielen. Da schleichen sich auch menschliche Fehler ein. Einige Datenannotationen werden unweigerlich falsch sein. Das wirkt sich auf das Verständnis der KI für die Daten aus und erfordert noch mehr Zeit, um den Schaden zu beheben.

Viele KI-Projekte kommen nur schwer in Gang, da Mitarbeiter oft nicht bereit sind, Daten zu beschriften. Selbst Menschen, die dafür bezahlt werden, KI-Modelle zu trainieren, wenden sich an KI, um die Daten für sie zu labeln. Und das ist eigentlich keine schlechte Idee. Schließlich ist einer der Hauptgründe für den Einsatz von KI in Unternehmen, dass sie Routineaufgaben abnimmt. Es gibt jedoch eine viel bessere Möglichkeit, KI schnell und präzise zu trainieren.

Aktives Lernen: bessere KI in kürzerer Zeit und zu geringeren Kosten

Die Beschriftung von Daten ist ein notwendiger Bestandteil des überwachten Lernens – einer der beliebtesten KI-Trainingsansätze. Beim überwachten Lernen lernt die KI aus einem vormarkierten Datensatz und verwendet diese Informationen, um neue Daten in der gewünschten Weise zu verarbeiten. Dies steht im Gegensatz zum unüberwachten Lernen, bei dem die KI unmarkierte Daten erhält und selbständig Muster erkennen muss.

Überwachtes Lernen erzeugt Modelle, die konsistenter und zuverlässiger arbeiten. Es ist die einzige Modellart, die in einer realen Geschäftsumgebung ohne Überwachung verwendet werden sollte. Überwachtes Lernen ist der Schlüssel zum Aufbau spezialisierter KI-Modelle, die eine bestimmte Aufgabe verstehen und ausführen sollen. Der Engpass bei der Datenannotation bedeutet jedoch, dass diese Modelle langsamer zu trainieren und einzusetzen sind als Modelle, die mit unüberwachtem Lernen erstellt wurden.

Was aber wäre, wenn die Genauigkeit des überwachten Lernens mit der Geschwindigkeit des unüberwachten Lernens kombiniert werden könnte?

Aktives Lernen ist eine ausgereifte Trainingsmethode für KI, wird aber erst seit kurzem für das Trainieren von KI-Modellen in Unternehmen eingesetzt. Es kombiniert Elemente des überwachten und des unüberwachten Lernens, um bessere KI-Modelle in kürzerer Zeit zu erstellen. Wie das überwachte Lernen erfordert auch das aktive Lernen kommentierte Stichproben für das Modelltraining. Anstatt jedoch einfach aus einem Datensatz zu lernen, trifft das Modell unbeaufsichtigte Entscheidungen darüber, was es als Nächstes lernen möchte.

Anschließend fragt das KI-Modell die Fachexperten aktiv ab, bittet sie aber nur um die Kommentierung von Beispielen, bei denen es sich unsicher ist oder von denen es glaubt, dass sie für sein Training am nützlichsten sind. Genau wie beim unüberwachten Lernen erkennt das Modell selbst Muster und entscheidet, welche Informationen es braucht, um besser zu lernen.

Aktives Lernen unterstützt dabei, einen intelligenten Workflow für die Beschriftung zu schaffen. Mit aktivem Lernen kann das KI-Modell den größten Teil des Trainings selbst absolvieren, entscheiden, was es als Nächstes lernen soll, und nur um Hilfe bitten, wenn es nicht weiterkommt. Diese Methode kommt den menschlichen Lernmustern sehr viel näher und bedeutet viel weniger Unterstützung und Arbeit für Fachexperten.

„KI-Modelle, die mit aktivem Lernen erstellt wurden, können schneller und mit weniger markierten Beispielen trainiert werden, ohne dass die Genauigkeit oder Leistung darunter leidet.“

Christian Heinrichs, UiPath

Was macht aktives Lernen so nützlich für Unternehmen, die ihre eigene KI trainieren wollen? Sie brauchen viel weniger kommentierte Beispiele, um ein Modell von Anfang bis Ende zu trainieren. Die KI übernimmt die Hauptarbeit beim Training und arbeitet mit den Fachexperten zusammen, um ihr Verständnis zu verbessern – sowohl während der Erstellung des Modells als auch später, wenn Mitarbeiter es nutzen und verfeinern.

KI-Modelle, die mit aktivem Lernen erstellt wurden, können schneller und mit weniger markierten Beispielen trainiert werden, ohne dass die Genauigkeit oder Leistung darunter leidet. Ein weiterer Vorteil des aktiven Lernens ist, dass sich weniger menschliche Fehler und Vorurteile einschleichen können. Deshalb ist es die ideale Methode, um Unternehmen dabei zu unterstützen, spezialisierte KI-Modelle zu trainieren, die zuverlässig und schnell einsatzbereit sind.

Schnellerer Einsatz von KI in der Praxis

Was die KI-Spitzenreiter wirklich von den Nachzüglern unterscheidet, ist die Tatsache, wie schnell sie KI in ihrem Unternehmen einsetzen können und wie schnell sie einen Mehrwert daraus ziehen. Im Moment nimmt die Datenannotation zum Trainieren eines KI-Modells noch zu viel Zeit in Anspruch. Das übt Druck auf die Mitarbeiter aus. Zum Glück bietet das aktive Lernen einen besseren Ansatz. Durch den Einsatz von überwachten und nicht überwachten Methoden reduziert aktives Lernen die Datenannotation und konzentriert sich nur auf die wichtigsten Beispiele. Mit diesem Ansatz verringert sich der Beschriftungsaufwand drastisch und führt so zu zufriedeneren Mitarbeitern und einer schnelleren Wertschöpfung durch KI.

Über den Autor:
Christian Heinrichs ist Senior Director Sales Engineering Central Europe bei UiPath.

Die Autoren sind für den Inhalt und die Richtigkeit ihrer Beiträge selbst verantwortlich. Die dargelegten Meinungen geben die Ansichten der Autoren wieder.

Wie aktives Lernen das Trainieren von KI-Modellen beschleunigt

Die repetitiven und manuellen Aufgaben des KI-Trainings kann die KI selbst übernehmen, wenn durch aktives Lernen ein intelligenter Workflow für die Datenannotation geschaffen wird.

Daten annotieren – das Nadelöhr

Aktives Lernen: bessere KI in kürzerer Zeit und zu geringeren Kosten

Schnellerer Einsatz von KI in der Praxis

Erfahren Sie mehr über Softwareentwicklung

Warum Netzwerkprofis zwingend KI-Kenntisse benötigen

Datenvorverarbeitung (Data Preprocessing)

5 Herausforderungen bei der KI-Implementierung

KI mit guten Daten und richtigem Storage erfolgreich umsetzen