Video-Kennzeichnung für Maschinelles Lernen – Kurze Begriffserklärung

Video-Kennzeichnung (Video Labeling oder Video Annotation) bedeutet das Hinzufügen von Informationen zu Filmdatensätzen oder deren Klassifizierung. Video-Kennzeichnung spielt wie die Bildannotation eine große Rolle beim Trainieren von KI-Algorithmen.

Video-Kennzeichnung für KI-Algorithmen

Künstliche Intelligenz erkennt Muster in Texten, Bildern und Videos. Wenn zum Beispiel immer mehr Videos auf Online-Portalen hochgeladen werden, wächst die Notwendigkeit einer möglichst effizienten Überwachung und Klassifizierung. Das Labeling von Videos erfolgt heute zum größten Teilen maschinell. Gerade weil Videodaten komplexer sind als Texte und unbewegte Bilder, sind die Anforderungen an Maschinelles Lernen entsprechend größer.

Um einem Programm die Klassifikation bzw. das Labeling von Videodaten beizubringen, gibt es grundsätzlich zwei verschiedene Strategien:

  • Bei der überwachten Klassifikation von Eingangsdaten werden diese vorab gekennzeichnet. Beispiel: Ein Video zeigt ein sich bewegendes Auto oder nicht. Diese Information wird dem Programm im laufenden Training zusammen mit der Datei übergeben.
  • Unüberwachte Klassifikation trainiert Computerprogrammen die Video-Kennzeichnung unter Verwendung von Segmentierungs- oder Clustering-Algorithmen an. Das Programm erkennt in einer Vielzahl von Daten Muster, Unterschiede und Übereinstimmungen.

Trainingsdatensätze herstellen und kennzeichnen

Hochwertige KI-Trainingsdaten für Maschinelles Lernen erfüllen alle Anforderungen für ein bestimmtes Lernziel. An der Qualität der Trainingsdaten misst sich auch die Qualität der Ergebnisse, das heißt der Leistungsfähigkeit von trainierten KI-Algorithmen.

  • Für das Video-Labeling erstellen Crowdworker beispielsweise eine große Anzahl von Videos nach konkreten Vorgaben, damit diese von KI-Algorithmen für Trainingszwecke gekennzeichnet werden können.
  • Umgekehrt kennzeichnen Crowdworker auf der ganzen Welt bestehende Videos, damit diese als Datensätze für überwachtes oder bestärkendes Lernen genutzt werden können.

Der Nutzen von automatischer Video-Kennzeichnung liegt auf der Hand. Künstliche Intelligenz optimiert die Videoüberwachung. So lassen sich beispielsweise Feuer, eine ausbrechende Panik in einer Menschenmenge oder ungewöhnliche Fahrzeugbewegungen in Sekundenschnelle erfassen. Aber auch für differenziertere Videomerkmale wie Stimmungen ist Video Labeling für Maschinelles Lernen nützlich.