Generative Adversarial Network (GAN)
Ein Generative Adversarial Network (GAN), zu Deutsch etwa erzeugendes gegnerisches Netzwerk, ist ein Machine-Learning-Modell, bei dem zwei neuronale Netze miteinander konkurrieren, um ihre Vorhersagen genauer zu machen. GANs laufen typischerweise unüberwacht ab und verwenden zum Lernen ein kooperatives Nullsummenspiel-Framework.
Die beiden neuronalen Netze, aus denen eine GAN besteht, werden als Generator und Diskriminator bezeichnet. Der Generator ist ein Convolutional Neural Network (zu Deutsch etwa faltendes neuronales Netzwerk) und der Diskriminator ein Deconvolutional Neural Network (entfaltendes neuronales Netz). Das Ziel des Generators ist die künstliche Herstellung eines Outputs, der leicht mit echten Daten verwechselt werden kann. Das Ziel des Diskriminators ist es, festzustellen, welcher Output künstlich erzeugt wurde.
Im Wesentlichen erzeugen GANs ihre eigenen Trainingsdaten. Wenn die Rückkopplungsschleife zwischen den gegnerischen Netzwerken weitergeht, beginnt der Generator, qualitativ hochwertigere Outputs zu produzieren, und der Diskriminator wird besser darin, künstlich erzeugte Daten zu kennzeichnen.
Wie GANs funktionieren
Der erste Schritt bei der Einrichtung einer GAN besteht darin, den gewünschten End-Output zu ermitteln und auf der Grundlage dieser Parameter einen ersten Trainingsdatensatz zusammenzustellen. Diese Daten werden dann randomisiert und in den Generator eingegeben, bis dieser die Grundgenauigkeit bei der Herstellung der Outputs erreicht hat.
Danach werden die erzeugten Bilder zusammen mit den tatsächlichen Datenpunkten aus dem ursprünglichen Konzept in den Diskriminator eingegeben. Der Diskriminator filtert die Informationen und gibt eine Wahrscheinlichkeit zwischen 0 und 1 zurück, um die Authentizität jedes Bildes darzustellen (1 korreliert mit echt und 0 mit gefälscht). Diese Werte werden dann manuell auf Erfolg überprüft und wiederholt, bis das gewünschte Ergebnis erreicht ist.
Beliebte Anwendungsfälle für GANs
GANs werden aufgrund ihrer Fähigkeit, visuelle Inhalte mit immer bemerkenswerterer Genauigkeit zu verstehen und neu zu erstellen, zu einem beliebten Machine-Learning-Modell für Online-Marktplätze.
Anwendungsfälle sind zum Beispiel:
- Erstellen von Bildern aus einem Entwurf;
- Generieren eines realistischen Bildes aus Text;
- Erstellung fotorealistischer Darstellungen von Produktprototypen;
- Umwandlung von Schwarz-Weiß-Bildern in Farbe.
Bei der Videoproduktion können GANs dazu verwendet werden:
- Modellierung von menschlichen Verhaltens- und Bewegungsmustern innerhalb eines Rahmens;
- Vorhersage nachfolgender Video-Frames;
- Erstellen eines Deepfake.