phonlamaiphoto - stock.adobe.com

KI-Sprachtechnologie forciert neue Trends und Anwendungsfälle

Die nächste Generation von KI-basierten Sprachtechnologie-Tools hat viel breitere, unternehmensweite Auswirkungen. Diese Tools dürfen nicht länger isoliert betrachtet werden.

Die Sprachtechnologie, ein breites Feld, das seit Jahrzehnten existiert, entwickelt sich schnell weiter, vor allem dank des Aufkommens der künstlichen Intelligenz (KI).

In diesem Bereich geht es nicht mehr in erster Linie um Spracherkennung und die Genauigkeit der Sprache-zu-Text-Transkription. Unterstützt durch KI ist die Sprache-zu-Text-Transkription heute so weit automatisiert, dass die Echtzeit-Transkription für die meisten geschäftlichen Anwendungsfälle ausreicht. Sprache-zu-Text wird nie zu hundert Prozent genau sein, aber sie ist der menschlichen Transkription ebenbürtig – und sie arbeitet viel schneller und zu einem Bruchteil der Kosten.

Für einige mag das der einzige interessante Anwendungsfall für KI-Sprachtechnologie sein, aber im Bereich Kommunikation und Collaboration am Arbeitsplatz ist das erst der Anfang. Lassen Sie uns drei Haupttrends bei der Sprachtechnologie untersuchen, die IT-Führungskräfte berücksichtigen sollten.

1. KI baut auf Sprachtechnologie auf

Die KI geht heute weit über die einfache Transkription hinaus. Viele KI-gesteuerte Anwendungen sind mittlerweile Standardfunktionen aller führenden UCaaS-Angebote (Unified Communications as a Service), darunter Echtzeit-Transkription, Echtzeit-Übersetzung, Meeting-Zusammenfassungen und Aktionspunkte nach dem Meeting. Einige Anwendungsfälle beziehen sich ausschließlich auf Sprache, andere wiederum sind sprachbasierte Aktivitäten, die mit anderen Anwendungen verknüpft sind, etwa mit Kalendern.

Neuere Anwendungen stützen sich auf generative KI, die automatisch zusammenhängende E-Mail-Antworten, Memos und Blog-Posts auf der Grundlage von Sprach- oder Texteingaben erstellen kann (die meisten Mitarbeiter werden wahrscheinlich ihre Stimme bevorzugen).

Der derzeitige Stand der Dinge basiert auf herkömmlichen Formen der Sprachtechnologie. Doch bei der KI sind die Anwendungsfälle breiter gefächert und werden in alle Arbeitsabläufe integriert, anstatt nur für die Spracherkennung verwendet zu werden.

IT-Führungskräfte sollten davon ausgehen, dass diese Funktionen zum Standard gehören, wenn sie potenzielle UCaaS-Angebote evaluieren oder überlegen, wie sie in ihren bestehenden Bereitstellungen auf dem neuesten Stand bleiben können. Alle diese KI-basierten Anwendungen befinden sich noch in der Entwicklung und dürften sich weiter verbessern – sowohl in Bezug auf die Sprachgenauigkeit als auch darauf, wie gut sie sich in andere Arbeitsplatz- und Produktivitäts-Tools integrieren lassen.

2. Kommende Anwendungen

Auch wenn IT-Verantwortliche diese neuen Möglichkeiten bewerten, dürfen sie das Gesamtbild nicht aus den Augen verlieren. Diese Anwendungen beziehen sich hauptsächlich auf die Art und Weise, wie Menschen heute arbeiten. Sie werden außerdem eher als punktuelle Produkte betrachtet, die eine bestimmte Reihe von Aufgaben sehr gut erledigen. KI schreitet jedoch schneller voran als alles andere zuvor. Während viele dieser Aufgaben bereits weitgehend gemeistert sind, wird die nächste Innovationswelle auf der Grundlage von KI-Sprachtechnologie auf einer höheren, organisationsweiten Ebene stattfinden.

Ein Beispiel dafür ist die konversationelle KI, die es Chatbots ermöglicht, sich besser mit Menschen zu unterhalten. Das macht sie zu einer viel angenehmeren Option für den Self Service im Contact Center. Die heutigen Chatbots sind bei weitem noch nicht perfekt, aber sie setzen sich immer mehr durch, auch in Unternehmen, wo sie von Mitarbeitern als digitale Assistenten eingesetzt werden.

Große Sprachmodelle (LLM, Large Language Model) sind die nächste bedeitende Phase der KI. Der Grundgedanke dabei ist, dass Unternehmen den Wert der Einbeziehung aller Formen der digitalen Kommunikation erkennen, um KI-Anwendungen effektiver zu machen. Text und Video sind zwar schon lange digitalisiert, viele Formen der Sprache jedoch noch nicht. Da die Mehrheit der alltäglichen Kommunikation sprachbasiert ist, besteht ein wachsendes Interesse an der Erfassung dieser Informationen, die auch als dunkle Daten bezeichnet werden, da sie eine wertvolle Datenquelle für KI darstellen.

Die Entwicklung und Verwaltung von LLMs entwickelt sich schnell, nicht nur aufgrund der Natur von KI, sondern auch, weil Führungskräfte das Potenzial von LLMs als Wettbewerbsvorteil sehen. Es gibt viele Arten von Sprachmodellen für KI, daher ist der Verweis auf LLMs hier eine zu starke Vereinfachung. Die meisten IT-Führungskräfte sind keine Datenwissenschaftler, deshalb ist dies ein Bereich, in dem externes Fachwissen von Nutzen wäre. Da Sprache bei diesem Trend eine so zentrale Rolle spielt, müssen IT-Führungskräfte einen strategischeren Blick auf die KI-Sprachtechnologie werfen.

3. Strategische Implikationen für die IT

Wichtiger ist es, zu erkennen, wie KI nun Sprachanwendungen mit allem anderen verbindet und in Arbeitsabläufe, Projektmanagement, persönliche Produktivität und teambasierte Ergebnisse integriert.

Es liegt auf der Hand, dass die IT-Abteilung das alte Modell der Sprachtechnologie hinter sich lassen muss, zumal KI einen Großteil der Innovationen im Bereich der Sprach- und sonstigen Kommunikation vorantreibt. Daher können Sprachtechnologietrends nicht länger in einem Vakuum betrachtet werden, in dem die Transkriptionsgenauigkeit als Maßstab für den Erfolg gilt.

Wichtiger ist es, zu erkennen, wie KI nun Sprachanwendungen mit allem anderen verbindet und in Arbeitsabläufe, Projektmanagement, persönliche Produktivität und teambasierte Ergebnisse integriert. Berufliche Gespräche, wo auch immer sie stattfinden, haben immer noch einen inhärenten Wert, aber mit KI wird ihr Wert als digitale Ströme, die mit anderen digitalen Strömen verschmelzen, noch größer werden.

Das macht die Sprachtechnologie im Unternehmen so strategisch. Diese Anwendungen werden auch in Zukunft eine wichtige Rolle bei der Unterstützung der Kommunikation und Collaboration von Mitarbeitern spielen, vor allem mit UCaaS. Aber im Großen und Ganzen geht es darum, herauszufinden, wo der Geschäftswert von KI wirklich liegt.

Daten sind der Sauerstoff, der KI zum Leben erweckt, und je mehr Daten Ihr Modell hat, desto größer ist der Nutzen. Die meisten Unternehmen erfassen nur einen kleinen Teil ihrer dunklen Daten, und genau hier kommt die Sprachtechnologie ins Spiel, wenn Sie Ihre Pläne für KI in Betracht ziehen.

Erfahren Sie mehr über Unified Communications