Ende-zu-Ende-Lernen – Kurze Begriffserklärung

Das Ende-zu-Ende-Lernen (E2E) ist ein Konzept der Künstlichen Intelligenz, bei dem alle für das Ergebnis notwendigen Zwischenschritte in einem einheitlichen Modell integriert sind. E2E spielt insbesondere eine Rolle beim Maschinellen Lernen mithilfe von Künstlichen Neuronalen Netzen (KNN).

Ende-zu-Ende-Lernen: Von der Eingabe bis zur Ausgabe

Unterschiedliche Datentypen und komplexe Aufgaben für Künstliche Intelligenz erfordern differenzierte Netzarchitekturen. Wichtig beim Maschinellen Lernen ist es vor allem, dass diese neuronalen Netze auf allen Stufen der Problemlösung trainiert werden. Beispiele hierfür sind das bestärkende Lernen, das in den Deep-Q-Networks für Entwicklung von Games und Robotern eingesetzt wird. Ende-zu-Ende-Lernen steht als Schlagwort dabei für das Konzept, umfassende Netze im Ganzen zu trainieren.

Deep Learning mit E2E (Ende-zu-Ende-Lernen)

Ende-zu-Ende-Lernen wird oft als das Nonplusultra des Deep Learnings bezeichnet – manchmal sogar als Allheilmittel für alle Probleme des Maschinellen Lernens. Dahinter steht die Tatsache, dass die Struktur der Künstlichen Neuronalen Netze aus mehreren Schichten besteht. Jede dieser Schichten ist spezialisiert und benutzt eigene Algorithmen, um bestimmte für das Endergebnis nötige Zwischenschritte zu lösen. Das führt zu Problemen, wie man am Beispiel des Autonomen Fahrens zeigen kann:

  • Unterschiedliche Layer sind für pracherkennung, die Einordnung visueller Signale, Vorhersagen und die Entscheidungsfindung verantwortlich.
  • Für die Optimierung der Ergebnisse müssen jeweils Änderungen an den Algorithmen der inneren Schichten vorgenommen werden.
  • Jede Änderung an einem einzelnen Algorithmus kann sich auf das Gesamtsystem auswirken.

Ende-zu-Ende-Lernen löst diese Probleme, indem es ein einheitliches Modell verwendet. Dieses stellt das gesamte Zielsystem dar und umgeht die Zwischenschritte. Der E2E-Ansatz wird aufgrund seiner Vereinfachung oft als Brute-Force-Methode des Deep Learnings bezeichnet. Er schafft aber langfristig eine kohärente und flexible Modellierungssprache für die Benutzung neuronaler Netze zur Lösung komplexer Aufgaben.