Beratungstermin
vereinbaren!

Foto-Datensätze zum Training einer Software zur automatisierten Online-Identitätsprüfung per Gesichtserkennung

Fallstudie – Bereitstellung Tausender Personenfoto-Sets von je einer Person, die einen Zeitraum von min. 5 bis max. 20 Jahren abdecken.

Tausende von Clickworkern aus diversen Kontinenten senden zahlreiche Fotos, auf denen jeweils ihr eigenes Gesicht gut zu erkennen ist, und die innerhalb eines Zeitraums von mind. 5 bis max. 20 Jahren in der Vergangenheit digital erstellt worden sind. Diese Foto-Sets ermöglichen es einem internationalen Softwarehersteller, ein KI-System zu trainieren, das in der Lage ist, Gesichter aller Ethnien und Geschlechter im Laufe eines Lebens eindeutig wiedererkennen und identifizieren zu können.

Die Herausforderung

KI-Systeme zur Gesichtserkennung werden immer häufiger eingesetzt, um die Einzigartigkeit eines Gesichts als biometrischen Faktor zur Identitätsprüfung und Authentifizierung bei Online-Anmeldevorgängen zu nutzen. Der zunehmende Einsatz der biometrischen Gesichtserkennung zur Authentifizierung beruht vor allem darauf, dass diese, anders als herkömmliche Lösungen wie z.B. Verifizierungsmails, Passwörter, Fingerabdrücke oder auch einfache Selfies, einzigartige mathematische und dynamische Muster nutzt. Das macht dieses Authentifizierungssystem zu einem der zuverlässigsten.

Die hinter einem solchen KI-System stehenden Algorithmen müssen mit einer enormen Anzahl von Daten in Form von Personen-Fotos und/oder Videos trainiert werden, bis sie über ein maschinelles Lernverfahren in der Lage sind, Personen anhand ihres Gesichtes eindeutig und ohne Fehler zu identifizieren.

Zur Verarbeitung der Trainingsdaten wird im Lernverfahren ein mehrschichtiges neuronales Netzwerk eingesetzt, das seine Parameter zur Gesichtserkennung so lange anpasst, bis eine Person eindeutig identifiziert wird. Für dieses Lernverfahren bedarf es nicht nur großer Mengen an Personen-Fotos und -Videos, sondern auch einer breiten Vielfalt an abgebildeten Personen, die der Diversität der Menschen in den Regionen, in denen das System eingesetzt werden soll, entsprechen. Zudem ist es für das Anlernen eines biometrischen Gesichtserkennungssystems nötig, Fotos von Personen als Trainingsdaten zu verwenden, auf denen man ihre Gesichter in unterschiedlichen Größen und aus diversen Perspektiven und Winkeln sieht. Beim Training des Systems ist ebenfalls zu bedenken, dass es beim Einsatz zur Authentifizierung von Personen in der Lage sein muss, ein Gesicht stets zu erkennen, auch wenn sich dieses im Laufe der Jahre natürlicherweise mal mehr oder mal weniger stark verändert.

Die Lösung

In enger Absprache mit dem Kunden setzen wir ein passgenaues Projekt auf unserer firmeneigenen Online-Plattform auf. Hieraus ergeben sich bezahlte Jobs/Aufgaben für unsere registrierten Crowdworker, sog. Clickworker. Diese Aufgaben sind für 850.000 Clickworker sichtbar, die den vom Kunden vorgegebenen demographischen Vorgaben entsprechen.

Gemäß der Aufgabenstellung aus dem prägnanten und anschaulichen Briefing arbeiten Tausende von Clickworkern an dem Projekt. Jeder Clickworker, der die Aufgabe angenommen hat, erstellt, nach Angabe seiner Ethnie, in einem ersten Schritt zwei neue, kurze Videos von sich. Er filmt sein Gesicht, 1x mit und 1x ohne Brille, bewegt seinen Kopf dabei langsam in alle Richtungen und spricht einen kurzen Satz.

Im zweiten Schritt laden die Clickworker die beiden Videos sowie pro Person 60 bis 200 digital bereits existierende Fotos von sich, auf denen ihr Gesicht gut zu erkennen ist, als Set auf unsere Plattform hoch. Keine der Fotos aus dem Set sind am gleichen Tag gemacht worden, kein Foto wiederholt sich, und insgesamt wird ein Zeitraum von mind. 5 bis max. 20 Jahren abgedeckt. Die Fotos unterscheiden sich hinsichtlich der Perspektive bzw. des Winkels, aus dem das Gesicht der Person zu sehen ist, dem Styling (z.B. Frisur, Kleidung, Bille, Make-up), dem Gesichtsausdruck und der Lichtverhältnisse.

Alle hochgeladenen Videos und Fotos werden von unserem Qualitätsmanagement-Team auf die korrekte Umsetzung der Vorgaben überprüft und entsprechend selektiert. Die einwandfreien Sets werden dem Kunden direkt nach der Prüfung über eine API-Anbindung überspielt.
So erhält der Softwarehersteller zeitnah und auf effiziente Weise über 300.000 Fotos von Gesichtern sowie über 6.000 Videos mit hoher Diversität. Diese Daten werden beim Hersteller als Trainingsdaten eingesetzt, um ein KI-System auf die eindeutige Gesichtserkennung zu trainieren, bis die Fehlerquote gegen Null geht und das System zur sicheren Online-Authentifizierung eingesetzt werden kann.

Mehr zum Service „Foto-Datensätze zum Training von Gesichtserkennungssoftware

Foto-Datensätze

Projektdaten

Anzahl Fotos: >300.000 Fotos (50 – 200 pro Clickworker/Set)

Zeitrahmen der Fotos: Die Fotos sollen pro Set einen Zeitraum von min 5 bis max. 20 Jahren und ca. 10 diverse Fotos pro Jahr abdecken.

Anzahl Videos: >6.000 (2 pro Clickworker/Set) à ca. 30 Sekunden Länge

Anteil der Clickworker nach Ethnien: Afrika 20%, Südasien 20%, Fernost 20%, Lateinamerika 20%, Kaukasien 10%, Sonstige 10%

Foto-Format und -Größe: Mindestgröße des abgebildeten Kopfs auf den Fotos: 200 x 200 Pixel, jpg oder heic, Quer- oder Hochformat

Oberflächenversionen der Jobs:
Clickworker-App (Smartphone-Version)
Clickworker-Workplace (Desktop-Version)

Aufgaben:
1. Angabe zur eigenen Ethnie (per Dropdownauswahl)
2. Erstellung von zwei kurzen Portrait-Selfie-Videos mit und ohne Brille (à ca. 30 Sekunden)
3. Bereitstellung/Hochladen von 60 – 200 Fotos aus dem genannten Zeitraum, auf denen ihr Gesicht gut zu erkennen ist
4. Lesebestätigung und Einverständniserklärung der Job-Bedingungen und -Konditionen

Qualitätssicherung: Überprüfung der Qualität durch das Qualitätsmanagement-Team von clickworker

Datenübermittlung: Datentransfer via API

Der Projektablauf – Kurz gefasst

  1. Projektbesprechung mit dem Kunden. Die daraus hervorgehenden Aufgaben werden definiert und in einem präzisen Briefing für die Clickworker festgehalten.
  2. Aufsetzen des Projektes durch clickworker. Die Aufgaben zur Fotoerstellung werden als einzelne Jobs auf der clickworker-Plattform für qualifizierte Clickworker sichtbar.
  3. Bearbeitung der Jobs durch Clickworker. Zahlreiche Clickworker der vorgegebenen Ethnien nehmen die Jobs parallel an, erstellen die Fotos und Videos nach Vorgabe und laden sie mit den geforderten Angaben auf die clickworker-Plattform hoch.
  4. Das Qualitätsmanagement-Team von clickworker überprüft die Fotos und Videos auf die Einhaltung der Vorgaben.
  5. Übermittlung aller korrekten Foto-Sets mit Videos über eine API-Anbindung an den Kunden.

Vorteile

  • Schnelle Beschaffung von anwendungsspezifischen KI-Trainingsdaten mit hoher Diversität und Qualität
  • Globale Datenbeschaffung und eine Marktabdeckung über alle Kontinente
  • Internationale Vielfalt an Personenfotos – Zugang zur breit aufgestellten Crowd aller ethnischen Herkünfte, Alter und Geschlechter
  • Kundenspezifische Projektsetzung und Durchführung im Managed Service
  • Persönlicher Ansprechpartner und Beratung
  • Qualitätsgesicherte Ergebnisse
  • Einfacher Datentransfer
  • Skalierbarer Durchsatz