peopleimages.com - stock.adobe.c

Beispiele und Tools für generative KI aus der Praxis

Die Industrie nutzt generative KI auf verschiedene Weise, um neue Inhalte zu generieren. Erfahren Sie mehr über erfolgreiche KI-Beispiele und herausragende Tools.

Generative KI-Technologie erzeugt, wie der Name schon sagt, Ergebnisse auf der Grundlage einer Art von Eingabe – oft einer Eingabeaufforderung (Prompt) durch eine Person. Einige Tools arbeiten mit einem einzigen Medium, zum Beispiel verwandeln sie Texteingaben in Textausgaben. Andere wandeln zwischen den Medien um: Sie wandeln beispielsweise eine Texteingabe in eine grafische Ausgabe um oder eine akustische Eingabe in eine Textausgabe.

Die meisten Schlagzeilen betreffen die Texterstellung. Mit der Veröffentlichung von ChatGPT Ende November 2022 wurde der Welt eine KI-Anwendung vorgestellt, die in der Lage ist, Texte zu erstellen, die authentischer und weniger künstlich klingen als alle vorherigen Generationen von computergenerierten Texten. Die Menschen nahmen die App eifrig an und machten sie zur am schnellsten wachsenden App in der Geschichte, während sie sie für scheinbar endlose Textgenerierungszwecke nutzten, vom Schreiben von Hausarbeiten über das Ablegen einer Anwaltsprüfung bis hin zum Schreiben der Skripte für die Nachrichtenberichte über die Fähigkeiten von ChatGPT.

Die transformative Rolle von generativer KI

Text ist nicht der einzige Bereich, in dem generative KI Grenzen verschiebt. Hier sind einige Beispiele für ihre weitreichenden Auswirkungen.

Text-zu-Sprache. Ob eigene oder fremde Worte, generative KI treibt die Sprachsynthese voran und verbessert die Qualität künstlicher Vorleser für E-Books, synthetischer Moderatoren für Nachrichten und Werbung – einschließlich Clickbait-Posts in sozialen Medien –, synthetischer Charaktere in Videospielen und buchstäblicher Chatbots, die Telefonanrufe beantworten. Intonation, Kadenz und Lautstärkevariationen werden immer realistischer, subtiler und flexibler. Die Qualitätsverbesserung erhöht auch die Bedrohung durch Deepfake Audio.

Bildsynthese. Dall-E 2 von OpenAI und andere Produkte verwenden KI, um Bilder auf der Grundlage von Textbeschreibungen zu erstellen. Wenn Sie einem Produkt sagen, es solle ein lächerliches Bild von 14 Lemmingen und einer sprechenden Melone im Trenchcoat erstellen, die sich als Privatdetektiv ausgibt, wird es dies tun. Dall-E und seine vielen Konkurrenten haben einen großen Sprung nach vorne gemacht, sowohl was die Bildqualität als auch die Fähigkeit angeht, beliebigen Text in Bilder zu übersetzen. Solche Systeme finden ihren Weg in Werbung, Produktdesign, Filmproduktion und andere Branchen. Aber sie haben auch das Potenzial, Fehlinformationen und Desinformationen zu verbreiten, da sie Bilder von Ereignissen erzeugen können, die nie stattgefunden haben, oder Bilder von Ereignissen verändern können, die tatsächlich stattgefunden haben.

Weltraum-Synthese. Wie bei Bildern kann diese Art der Synthese auch bei 3D-Räumen und Objekten, sowohl realen als auch digitalen, stattfinden. In der realen Welt können Anwendungen wie Autodesk oder Spacemaker dabei unterstützen, Gebäude und die darin enthaltenen Räume oder Stadtlandschaften zu entwerfen, die bebaute und natürliche Elemente enthalten. In diesen Situationen ergänzt die KI die Arbeit menschlicher Designer, indem sie fehlende Details ergänzt oder Lösungen vorschlägt, die bestimmten gesetzlichen Anforderungen oder Platz- und Materialbeschränkungen gerecht werden. Viele Unternehmen – allen voran Meta und alle großen Spieleentwickler – entwickeln ebenfalls Anwendungen zur Generierung virtueller Räume für Spieledesigns. Diese KI-Systeme können ständig neue Räume generieren und sie möglicherweise sogar unendlich erweiterbar machen.

Praxisbeispiele für generative KI

Der Einsatz von generativer KI wird in Unternehmen immer häufiger und umfassender. Laut einer von Gartner durchgeführten Umfrage unter mehr als 1.400 Führungskräften gaben 43 Prozent an, dass sie dabei sind, generative KI-Produkte und -Tools zu erproben.

Die Anlässe für den Einsatz von generativer KI in diesem Umfeld können sehr unterschiedlich sein. Die Gartner-Umfrage ergab, dass 47 Prozent der Befragten in generative KI für kundenorientierte Funktionen wie Vertrieb, Marketing und Kundenservice investierten. IT-Funktionen waren ebenfalls ein häufiger Bereich, in dem generative KI-Investitionen getätigt wurden, einschließlich Softwareentwicklung, Infrastruktur und Betrieb.

Branchen, die mit generativen KI-Tools experimentieren

Pharmazeutische Industrie. Pharmazeutische Unternehmen und akademische Forscher arbeiten mit generativer KI in Bereichen wie der Entwicklung von Proteinen für Medikamente. Die Vorhersage der Faltung von Proteinen ist seit Jahrzehnten eine enorme Herausforderung für Genetiker und Pharmaentwickler. Deep-Learning-Modelle, wie Generative Adversarial Networks (GANs), verbessern die Fähigkeiten der Forscher, die Proteinsynthese zu verstehen und zu nutzen.

Genetische Forschung. Obwohl sich die generative KI in der Genforschung nicht besonders schnell durchsetzt, leistet sie einen Beitrag zu diesem Bereich. Ein häufiges Hindernis für den Einsatz dieser Technologie in der Genforschung ist der begrenzte Zugang zu genetischen Datenbanken, vor allem aufgrund von Bedenken hinsichtlich der Privatsphäre. Eine kürzlich durchgeführte Studie bestand jedoch darin, GANs und eingeschränkte Boltzmann-Maschinen – ein rekurrentes neuronales Netz (RNN), das nach dem österreichischen Wissenschaftler Ludwig Boltzmann benannt wurde – zu trainieren, um Verteilungen echter genomischer Datensätze zu lernen. Dies würde es ihnen dann ermöglichen, künstliche Genome zu erstellen.

Fertigung. In der Fertigung verwenden Autodesk, Creo und andere Produkte generative KI, um physische Objekte zu entwerfen. In einigen Fällen erstellen sie diese Objekte auch durch 3D-Druck oder computergesteuerte Bearbeitung und additive Fertigung. Generative KI kann zum Beispiel Maschinenteile und Unterbaugruppen größerer Objekte erstellen und manchmal Entwürfe im Hinblick auf die folgenden Aspekte des Herstellungsprozesses optimieren: Materialeffizienz (Minimierung von Abfall), Einfachheit (wenig Teile) und Produktionsgeschwindigkeit.

Unterhaltung. ChatGPT, Dall-E und andere Tools werden bereits bei der Erstellung von Konzeptkunst eingesetzt, um die Entwicklung von Szenarien und Umgebungen zu unterstützen, und es wird erwartet, dass sie in Zukunft zur Erstellung vollständiger Umgebungen eingesetzt werden. Generative KI-Tools werden auch zur Erzeugung von Hintergrundmusik für Spiele eingesetzt. Es ist erwähnenswert, dass Künstler und Unternehmen eine Reihe von Klagen wegen Verletzung des Urheberrechts und Diebstahls geistigen Eigentums einreichen. Sie argumentieren, dass die Verwendung ihres geschützten geistigen Eigentums in den Trainingsdaten in Verbindung mit der Möglichkeit, die Ausgabe im Stil einer bestimmten Person anzufordern, einer unlauteren Nutzung und einer Verletzung des Urheberrechts gleichkommt. Diese Art der rechtlichen Anfechtung bremst die Verwendung generativer Tools in einigen Kontexten.

Anmerkungen zur Anwendung generativer KI

Es ist wichtig, die Kehrseite generativer KI zu betonen. So gut die Textausgaben auch sein mögen, sie werden dennoch nicht immer den professionellen Standards in dem betreffenden Bereich entsprechen. Professoren können oft sofort erkennen, dass die Arbeit nicht von einem Studenten geschrieben wurde, so wie sie es auch konnten, als Studenten Arbeiten von entsprechenden Anbietern kauften – und Dozenten können selbst KI-Tools einsetzen, um Arbeiten zu erkennen, die von KI erstellt wurden. Richter und andere Anwälte können Schriftsätze auseinandernehmen, die von allgemeiner KI zusammengeschustert wurden, weil sie falsch argumentiert oder unzureichend begründet sind.

Der tragische Fehler (im Sinne der griechischen Tragödie) von generativen KI-Systemen tritt also deutlich zu Tage: Die Eigenschaften, die die aktuellen Tools bei der Erstellung von real klingenden Texten und anderen Inhalten so leistungsfähig machen, ermöglichen es ihnen auch, zu fabulieren. Das heißt, sie können Antworten erzeugen, die der Realität widersprechen.

Das Problem wird noch dadurch verschlimmert, dass die Tools in der Lage sind, unterstützendes Material zu erfinden, wenn sie aufgefordert werden, etwas zu unterstützen, das sie selbst erstellt haben. Wenn ein generatives KI-Tool beispielsweise aufgefordert wird, einen Punkt in einer Hausarbeit zu untermauern, kann es sein, dass es ein Zitat für eine reale oder eine erfundene Person zur Unterstützung generiert. Wenn ein KI-Tool aufgefordert wird, Rechtszitate zur Unterstützung eines Schriftsatzes zu liefern, kann es Gerichtsfälle und sogar ganze Gerichte erfinden.

Während die potenziellen Einsatzmöglichkeiten für die Tools im Grunde jeden Anwendungsfall umfassen, in dem ein Mensch Output in einem beliebigen Medium erzeugt, sind die Tools noch nicht so weit, dass sie alles gut genug – oder billig genug – erledigen, um überall eingesetzt zu werden. Unternehmen, die generative KI-Tools einsetzen möchten, müssen selektiv vorgehen und dabei erhebliche Einschränkungen in Kauf nehmen.

Beispiele für generative KI-Tools

Trotz der angesprochenen Nachteile sind generative KI-Tools immer noch äußerst nützliche Hilfsmittel für Fachleute, die mit Text arbeiten. ChatGPT ist der Goldstandard für die allgemeine Textsynthese. Ähnliche Tools wie Bloom können das aber genauso gut.

Abgesehen von den oben genannten Problemen ist es in diesem Zusammenhang wichtig, sich vor Augen zu halten, dass ein generatives KI-Tool durchaus in der Lage ist, einen Textblock auszugeben, der ganz oder teilweise aus einem seiner Trainingstexte besteht. In manchen Fällen ist dieser Text mit einem Copyright versehen, aber das Tool „weiß“ das nicht – oder wenn es das weiß, wird es Sie nicht darauf hinweisen. Es ist also gefährlich, den Text, den ein generatives KI-Tool ausgibt, in einem öffentlich zugänglichen Anwendungsfall zu verwenden, zum Beispiel in einem Artikel zur Veröffentlichung oder in einem Werbetext, ohne diese Möglichkeit in Betracht zu ziehen und eine gewisse Sorgfaltspflicht zu erfüllen. Und natürlich ist die Ausgabe solcher Tools derzeit nicht urheberrechtlich geschützt, so dass die Veröffentlichung des Textes bedeutet, dass er als gemeinfreier Text weitergegeben wird.

Abbildung 1: Eine Auflistung von erfolgreichen Beispielen für generative KI-Tools.
Abbildung 1: Eine Auflistung von erfolgreichen Beispielen für generative KI-Tools.

Erstellen von Zusammenfassungen

Einige Tools wurden speziell für das Zusammenfassen von Texten entwickelt, manchmal in bestimmten Bereichen. Der Schreibassistent Grammarly verfügt über einen universell einsetzbarer Zusammenfassungswerkzeug, ebenso wie Jasper, QuillBot und TLDR This. Tools wie Iris.ai und SciSummary konzentrieren sich auf akademische Arbeiten, LegalMind und Legalyze auf juristische Dokumente, und auch für andere spezifische Publikationsbereiche werden ähnliche Tools entwickelt.

Übersetzungen erstellen

Übersetzung ist ein Spezialfall der Text-zu-Text-Umwandlung, und Google Translate ist vielleicht das bekannteste in diesem Bereich. Darüber hinaus werden auch Deepl, Alexa Translations, Bing Translator und Metas SeamlessM4T sowie andere Allzweck-Tools wie ChatGPT verwendet. In Fachgebieten wie Medizin oder Recht setzen professionelle Übersetzer manchmal KI-Tools zu ihrer Unterstützung ein. Derzeit gibt es jedoch nur wenige KI-Tools, die auf bestimmte Fachgebiete spezialisiert sind.

Code erstellen

Generative KI-Tools eignen sich hervorragend für den Umgang mit sogenannten domänenspezifischen Sprachen, zu denen Netzwerkprotokolle und Programmiersprachen gehören. Domänenspezifische Sprachen haben einen strengen und kleinen Wortschatz sowie eine wohldefinierte und geordnete Syntax. Allgemeine Tools wie ChatGPT können dabei unterstützen. Es gibt auch spezialisierte Tools wie GitHub Copilot, Tabnine, CodeWP und Amazon CodeWhisperer, von denen sich einige direkt in die von einem Programmierer gewählte integrierte Entwicklungsumgebung integrieren lassen.

Dokumentation erstellen

Genauso wie sie zur Codegenerierung verwendet werden können, können KI-Tools auch zur Dokumentation von Code eingesetzt werden. Sie können zum Beispiel erklären, was eine Prozedur tut oder welche Arten von Daten ein Objekt enthält und manipuliert. Manchmal können sie sogar erklären, wofür eine Prozedur oder ein Modul im Rahmen eines größeren Programms verwendet wird. Auch wenn diese Tools nicht immer den Erklärungsgrad eines Algorithmus liefern, den ein Mensch leisten kann, können sie einen enormen Teil der mühsamen Arbeit der vollständigen Dokumentation einer Codebasis übernehmen.

Verwendung generativer KI zur Erstellung von Bildern

Generative KI hat mit der Einführung von ChatGPT einen enormen und überraschend positiven PR-Aufschwung erlebt. Dies lenkte von der vorangegangenen Kritik ab, die sich auf die Erstellung von KI-Bildern konzentrierten, und spülte diese in gewissem Maße sogar weg. Im Grunde genommen hatte sich die Diskussion über Bild-KI weitgehend auf das zerstörerische Potenzial von Deepfake-Bildern konzentriert: fiktive Konstruktionen, die wie echte Fotos von tatsächlichen Ereignissen und Personen aussehen sollen.

Der Aufstieg von Dall-E und Stable Diffusion um die Zeit der Veröffentlichung von GPT-3.5 trug ebenfalls dazu bei, die Diskussion zu erweitern. Alle negativen Aspekte, die mit Deepfakes verbunden sind, bleiben jedoch bestehen, und auch andere Probleme sind deutlich geworden.

Genau wie bei Texten gelten auch hier urheberrechtliche Überlegungen: Die Ausgaben können geschützte Eingaben enthalten, und die Ausgaben können nicht urheberrechtlich geschützt werden.

Bilder erstellen

Stable Diffusion, Midjourney und Dall-E/Dall-E 2 sind weiterhin wichtig. Ein Hinweis auf die Breite des Bereichs sind auch das kostenlose Fotowiederherstellungs-Tool GFPGAN und Lumen5, ein kommerzielles Produkt mit einer kostenlosen Community-Ebene, das eher Videoinhalte als Standbilder erzeugt. Bei Hugging Face, einer Community rund um freie KI-Modelle wie Llama und Stable Diffusion, finden Sie spezialisierte Tools für andere Arten der Bilderzeugung oder -manipulation, zum Beispiel für die Erstellung von Comics oder die Hochskalierung von Bildern.

Technische Zeichnungen erstellen

Generatives Design wendet generative KI auf die Probleme des computergestützten Designs und der Fertigung (CAD/CAM) an, indem es Designmodelle und Bilder erzeugt. Generatives Design wird in so unterschiedlichen Bereichen wie Architektur und Stadtplanung, Bauwesen, Maschinenbau und biomedizinische Geräteentwicklung eingesetzt. Autodesk Fusion 360 und Dassault CATIA Generative Design Engineering, langjährige CAD/CAM-Anbieter, sind bekannte Werkzeuge für generatives Design.

Erstellen von Logos und Symbolen

Jeder Bildgenerator kann ein Logo erzeugen, aber es gibt KIs, die sich speziell auf diese Tätigkeit konzentrieren, darunter Logo Diffusion, Designs.ai Logomaker und Looka Logo Maker.

Künftige generative KI-Beispiele

Obwohl sich nicht vorhersagen lässt, welche generativen KI-Beispiele und Anwendungsfälle in Zukunft am vielversprechendsten sein werden, gibt es einige – wie die Bilderzeugung und die Sprachsynthese –, die in den letzten Jahren enorme Fortschritte gemacht haben. Andere Bereiche, wie Medizin und Fertigung, haben sich ebenfalls als enorm vielversprechend erwiesen und zeigen die große Bandbreite an Bereichen, zu denen KI beitragen kann. Der Fortschritt bei physischen Anwendungsfällen scheint langsamer zu sein, was angesichts der inhärenten Grenzen, die durch die Manipulation von Materie anstelle von Daten gesetzt sind, Sinn macht.

Diese Fortschritte bauen auf sich selbst auf, eine Dynamik, die in den Jahren 2022 und 2023 voll zum Tragen kommt. Je billiger die Basiswerkzeuge werden, je weiter sie verbreitet sind und je einfacher sie zu benutzen sind, desto größer wird der Kreis derer, die sich diese Werkzeuge zunutze machen. Dadurch steigen die Anzahl und die Art der Situationen, für die diese Tools trainiert werden, was das Tempo des Wandels weiter beschleunigt.

Die Integration von generativer KI in andere KI-gestützte Tool-Suiten kann diese zu einem leistungsfähigeren Ganzen machen. Die derzeitigen Systeme zur Code- und Dokumentationsgenerierung sind zum Beispiel nicht besonders gut, aber wenn sie verbessert und mit anderen Arten von KI-Systemen kombiniert werden, die bereits vorhanden sind – zum Beispiel zur Erkennung von Programmierfehlern, häufigen Sicherheitslücken und der Verwendung von lizenziertem Code auf nicht-lizenzierte Weise –, wird das Entwickler-Toolset leistungsfähiger und produktiver werden.

Sie sollten jedoch nicht vergessen, dass es auch unsoziale und gefährliche Anwendungen von KI gibt, die auf die gleiche Weise einfacher werden.

Erfahren Sie mehr über Business-Software