
Generative Adversarial Networks (GANs) sind eine Klasse von neuronalen Netzwerken im Bereich maschinelles Lernen, die darauf abzielen, realistische, neue Daten zu erzeugen, die von echten Daten kaum zu unterscheiden sind. Ein GAN besteht aus zwei Netzen – einem Generator und einem Diskriminator – die in einem gegnerischen („adversarialen“) Lernprozess trainiert werden.
Während der Generator versucht, realistische Beispiele zu erzeugen, lernt der Diskriminator, echte von gefälschten Daten zu unterscheiden. Durch diese Konkurrenz entsteht ein Modell, das zunehmend bessere generative Fähigkeiten entwickelt.
In einem GAN werden zwei Netzwerke gleichzeitig trainiert:
Im Training verbessert sich der Generator darin, den Diskriminator zu „täuschen“, während der Diskriminator besser darin wird, echte von generierten Daten zu unterscheiden. Dieser Wettbewerb führt dazu, dass der Generator zunehmend realistischere Beispiele erzeugt.
Tipp:
Wenn Sie mit GANs realistische oder synthetische Daten erzeugen wollen, sind hochwertige Trainingsdaten essenziell. Nutzen Sie hierfür annotierte Bilder, Videos oder Audiodaten – z. B. über die KI‑Trainingsdaten‑Services von clickworker.
Mehr über KI‑Trainingsdaten
Aktuelle Forschung fokussiert sich darauf:
Generative Modelle lernen die zugrunde liegende Datenverteilung eines Datensatzes, um neue Beispiele zu erzeugen, die statistisch ähnlich zur Trainingsmenge sind. GANs sind daher besonders leistungsfähig, da sie zwei Netzwerke nutzen, die sich gegenseitig verbessern.
GANs werden meist im unüberwachten Kontext trainiert, da der Diskriminator selbstständig lernt, echte von gefälschten Daten zu unterscheiden. Im überwachten Kontext können zusätzliche Label helfen, die Klassifikation zu unterstützen, aber klassische GAN‑Strukturen benötigen keine gelabelten Daten.
Diskriminative Modelle lernen, Daten zu klassifizieren (z. B. Katze vs. Hund). Generative Modelle hingegen erzeugen neue Datenpunkte nach gelerntem Muster. GANs verbinden beide Konzepte in einem spieltheoretischen Rahmen.
Der Generator nimmt meistens einen Zufallsvektor (z. B. Rauschen) und transformiert ihn in ein realistisches Datenbeispiel. Durch Feedback des Diskriminators lernt der Generator, bessere Ausgaben zu liefern.
Der Diskriminator bewertet Eingaben als „echt“ oder „gefälscht“ und liefert dem Generator Feedback. Ohne diese Rückkopplung kann der Generator nicht lernen, realistischer zu werden.
Oft werden CNNs im Aufbau von GANs eingesetzt, besonders bei bildbasierten Aufgaben, da sie lokal fokussierte Muster gut erfassen können. Die Kombination aus GAN‑Architektur und CNN‑Backbone ist bei der Bilderzeugung besonders leistungsfähig.
Bedingte GANs (cGANs) erzeugen Daten unter bestimmten Bedingungen (z. B. Bilder in einer gewünschten Kategorie oder mit spezifischen Eigenschaften). Sie eignen sich für Aufgaben wie Farbkodierung, Text‑Bild‑Synthese oder Stilübertragung.
GANs sind leistungsfähig, weil sie Daten nicht nur analysieren, sondern selbst erzeugen. Die gegenseitige Optimierung der Netzwerke führt zu Modellen, die realistisches und vielfältiges Output schaffen können.
GANs werden z. B. eingesetzt für die Erstellung synthetischer Trainingsdaten, Design und Kunst, medizinische Bildsynthese und realistische Simulationen für Forschung und Entwicklung.
Generative Adversarial Networks kombinieren kreative Datengenerierung mit tiefem Lernen und eröffnen vielfältige Anwendungsmöglichkeiten. Trotz Herausforderungen im Training gehören GANs heute zu den wichtigsten generativen Modellen im KI‑Bereich.