Definition

Natural Language Processing (NLP)

Natural Language Processing (NLP) ist die Fähigkeit eines Computerprogramms, die menschliche Sprache so zu verstehen, wie sie gesprochen oder geschrieben wird. NLP ist eine Komponente der künstlichen Intelligenz (KI).

Die Entwicklung von NLP-Anwendungen stellt eine Herausforderung dar, da Computer normalerweise voraussetzen, dass sie in einer speziellen Programmiersprache angesprochen werden. Diese Sprachen sind präzise, eindeutig und strukturiert. Zwar lassen sich Computer auch durch Sprache steuern, aber nur mit einer begrenzten Anzahl klar ausgesprochener Befehle.

Die menschliche Sprache ist jedoch nicht immer präzise. Sie ist häufig mehrdeutig und die linguistische Struktur kann von vielen komplexen Variablen abhängen, einschließlich Slang, regionalen Dialekten und sozialem Kontext.

Einsatz von Natural Language Processing (NLP)

Bei den meisten Forschungsarbeiten zur Verarbeitung natürlicher Sprache geht es um Suchanfragen. Das bedeutet, dass Benutzer Datensätze eines Computers genauso abfragen möchten, wie sie die Frage an eine andere Person stellen würden. Die Maschine interpretiert die wichtigsten Elemente des menschlichen Satzes, zum Beispiel solche, die bestimmten Merkmalen in einem Datensatz entsprechen, und gibt eine Antwort zurück.

NLP kann verwendet werden, um freien Text zu interpretieren und ihn analysierbar zu machen. Es gibt eine enorme Menge an Informationen, die in Freitext-Dateien gespeichert sind, beispielsweise Patientenakten. Bevor es moderne, auf Deep Learning basierende NLP-Modelle gab, waren diese Informationen für eine computergestützte Analyse nicht zugänglich und konnten nicht systematisch ausgewertet werden. Mit NLP können Analysten jedoch riesige Mengen an freien Text durchsuchen, um relevante Informationen zu finden.

In diesem Video wird erklärt, wie NLP-Modelle mit Hilfe von Deep Learning erstellt werden:

Sentimentanalyse (Sentiment Mining) ist ein weiterer Hauptanwendungsbereich für NLP. Damit können Data Scientists die Kommentare auf Social-Media-Seiten automatisch bewerten. Auf diese Weise sehen sie, wie gut oder schlecht die Marke ihres Unternehmens bewertet wird. Es lassen sich auch Aufzeichnungen von Kundendienstteams analysieren, um festzustellen, wo sich das Unternehmen verbessern muss.

GoogleDeepL und verschiedene andere Suchmaschinen nutzen für ihre automatischen Übersetzungsfunktionen ebenfalls NLP und Deep Learning. Deren Algorithmen können zum Beispiel Texte auf einer Webseite lesen, ihre Bedeutung interpretieren und in eine andere Sprache übersetzen.

Wie funktioniert die Verarbeitung natürlicher Sprache?

Aktuelle Ansätze für NLP basieren auf Deep Learning, einem Teilbereich von KI, der Muster in Daten untersucht und verwendet, um das Verständnis eines Programms zu verbessern. Deep-Learning-Modelle erfordern große Mengen an gekennzeichneten Daten, um relevante Zusammenhänge zu trainieren und zu identifizieren. Der Aufbau eines entsprechend großen Datensatzes ist derzeit eine der Haupthürden für NLP.

Frühere Ansätze an NLP beinhalteten einen eher regelbasierten Ansatz, bei dem Machine-Learning-Algorithmen mitgeteilt wurde, nach welche Wörtern oder Phrasen im Text gesucht soll. Bestimmte Phrasen oder Wörter führten dann zu spezifischen Antworten. Deep Learning ist jedoch ein flexibler, intuitiver Ansatz, bei dem die Algorithmen an Hand von vielen Beispielen lernen, die Bedeutung eines Textes zu erkennen - ähnlich einem Kind, dass die menschliche Sprache erlernt.

Bedeutung von NLP

Der Vorteil der natürlichen Sprachverarbeitung zeigt sich in den beiden folgenden Aussagen: „Eine Cloud-Computing-Versicherung sollte Teil eines jeden Service-Level-Agreements sein“ und „Ein gutes SLA sorgt für einen ruhigeren Schlaf - auch in der Cloud.“ Wenn Sie die nationale Sprachverarbeitung für die Suche verwenden, erkennt das Programm, dass Cloud Computing eine Entität ist, dass Cloud eine abgekürzte Form von Cloud Computing ist und dass SLA ein Akronym für Service-Level-Agreement ist.

Dieses sind die Formen von vagen Elementen, die häufig in der menschlichen Sprache vorkommen. Ältere Machine-Learning-Algorithmen konnten diese Elemente schlecht interpretieren. Mit den Verbesserungen bei Deep Learning und KI können modernen Algorithmen diese Elemente besser interpretieren.

Das hat Auswirkungen auf die Art der Daten, die analysiert werden können. Mehr und mehr Informationen werden jeden Tag online generiert. Vieles davon ist natürliche menschliche Sprache. Bis vor kurzem konnten Unternehmen diese Daten nicht analysieren. Doch die Fortschritte in NLP machen es nun möglich, Daten aus einem breiten Spektrum von Datenquellen zu analysieren und daraus zu lernen.

Diese Definition wurde zuletzt im Juli 2018 aktualisiert

Erfahren Sie mehr über Datenanalyse