Wie die Gesichtserkennung funktioniert

21.07.2021

Wie die Gesichtserkennung funktioniert

Die Gesichtserkennungstechnologie hat in den letzten Jahren einen langen Weg zurückgelegt. Von der Entsperrung Ihres iPhones durch Scannen Ihres Gesichts bis hin zur automatischen Markierung von Fotos sind die meisten von uns schon damit in Berührung gekommen und haben auf die eine oder andere Weise davon profitiert.

Aber es gibt noch viel mehr, was wir mit der Technologie machen können, als nur Gesichter zu erkennen. Zum Beispiel kann es als Werkzeug im Marketing eingesetzt werden, um den Verkauf und die Kundenerfahrung zu verbessern. Oder Sie können diese Technologie in Büros nutzen, um die Anwesenheit von Mitarbeitern zu markieren oder automatisch Zugang zu sicheren Bereichen zu gewähren.

Aber bevor wir an dieser Stelle bereits zu weit vorausgreifen, lassen Sie uns den Begriff „Gesichtserkennung“ definieren.

Was ist Gesichtserkennung?

Gesichtserkennungstechnologie ist genau das, wonach es klingt. Es handelt sich um eine Software, die mit Algorithmen der Künstlichen Intelligenz (KI) arbeitet, um die Identität einer Person zu überprüfen oder zu identifizieren. Dies geschieht durch die Verarbeitung einzelner Video- oder digitaler Bilder, auf denen Gesichter zu sehen sind.

In ihren Anfängen konnten wir Gesichtserkennungssoftware nur auf einem Computer verwenden. Heute findet die Technologie u.a. in mobilen Geräten, Robotern und intelligenten Brillen Verwendung. Die Entwicklungsfortschritte und vielfältigen Einsatzmöglichkeiten führen zu einer Explosion der Nachfrage aus immer mehr Branchen, aus dem Sicherheits- und Überwachungssektor, Marketing und der Robotik.

Wie funktionieren Gesichtserkennungs-Tools?

Tools zur Gesichtserkennung oder -wiedererkennung sind nicht alle gleich. Sie verwenden mehrere verschiedene Methoden, um Gesichtsmerkmale in einem Bild zu scannen und mit Bildern aus einer Datenbank abzugleichen.

In den meisten Fällen verwenden die Gesichtserkennungsprogramme jedoch intelligente Algorithmen, die Gesichtsmerkmale, die in Fotos und Videostandbildern erfasst wurden, biometrisch abbilden. Sobald alle biometrischen Merkmale eines Gesichts vollständig erfasst sind, werden sie mit einer umfangreichen Datenbank von Gesichtern und deren biometrische Merkmale abgeglichen.

Obwohl es viele Möglichkeiten gibt, dies zu tun, können wir im Allgemeinen Gesichter in vier einfachen Schritten erkennen:

Schritt 1: Gesichtserfassung

Zunächst nimmt eine Smart-Kamera ein Bild auf, sobald sie ein menschliches Gesicht erkennt und wiedererkennt. Dieses Gesicht kann sich in einer Menschenmenge befinden oder alleine stehen. Dieser Vorgang ist viel einfacher, wenn eine Person frontal in die Kamera blickt. Moderne Gesichtserkennungsprotokolle funktionieren jedoch auch, wenn das Gesicht der Person aus einem leichten Winkel zu sehen ist.

Schritt 2: Gesichtsanalyse

Sobald ein individuelles Gesicht fokussiert bzw. aufgenommen wurde, wird zur Analyse die Augenpositionen bestimmt. Anschließend wird das Bild automatisch in Graustufen umgewandelt und beschnitten. Die meisten heute auf dem Markt erhältlichen Lösungen zur Gesichtserkennung nutzen 2D-Bilder anstelle von 3D-Bildern, um Personen zu identifizieren und zu verifizieren. Der Grund dafür ist, dass 2D-Fotos leichter mit in Datenbanken gespeicherten Bildern (die in der Regel ebenfalls 2D sind) abgeglichen werden können.

Bei der Analyse trennt das Tool das Gesicht in unterscheidbare Orientierungspunkte, die sogenannten Knotenpunkte. Jedes menschliche Gesicht hat acht Knotenpunkte, die durch KI-gestützte Algorithmen analysiert werden. Zum Beispiel wird der Abstand zwischen den Augen gemessen und mit anderen Bildern in der Datenbank verglichen.

Schritt 3: Bilder in Daten umwandeln

Nach Abschluss der Gesichtsanalyse wird jeder Knotenpunkt zu einer Nummer, die in der Anwendungsdatenbank gespeichert wird. Alle acht Knotenpunkte zusammen werden als Gesichtsabdruck bezeichnet.

Schritt 4: Abgleich und Identifikation

Die Suche nach einer Gesichtsübereinstimmung ist der letzte Schritt des Prozesses. Ausgeklügelte Algorithmen vergleichen den neu erstellten Gesichtsabdruck mit anderen in der Datenbank gespeicherten und suchen nach Übereinstimmungen. Die Anzahl der Vergleiche hängt von der Größe der Datenbank ab.

Wenn es signifikante Übereinstimmung gibt, zeigt die Gesichtserkennungsanwendung die Übereinstimmung mit anderen relevanten Informationen wie Name, Geburtsdatum, Adresse usw. der Person an. Wenn es sich um eine kommerzielle Marketing-Datenbank handelt, werden auch Informationen wie die Vorlieben und Abneigungen der Person, frühere Einkäufe und mehr angezeigt.

Während das zuvor Genannte die grundlegenden Prozesse hinter der Technologie beschreibt, gibt es viele andere Möglichkeiten, das gleiche Ziel zu erreichen. Um die Genauigkeit zu verbessern, projizieren einige Tools beispielsweise 2D-Bilder auf 3D-Modelle. Dieser Ansatz hilft bei der Unterscheidung spezifischer Merkmale, die sonst in einem flachen 2D-Bild schwer zu erkennen wären.

Obwohl die Technologie zur Gesichtserkennung zweifellos immer besser wird, kommt es immer noch zu einigen falschen Ergebnissen. Insbesondere, wenn ältere technologische Versionen zur Gesichtserkennung eingesetzt werden, können unterschiedliche Fehler auftreten. Diese Versionen wurden zumeist nicht mit Datensätzen trainiert, die ausreichend verschiedene Ethnien, Altersgruppen und Geschlechter umfassten. Es ist daher wichtig auf aktuelle Tools zu setzen, die mit einer hohen Diversität an Daten trainiert wurden.

Optimieren von Tools zur Gesichtserkennung

Ein Gesichtserkennungs-Tool kann immer nur so gut sein, wie die Trainingsdatensätze mit denen die Algorithmen trainiert wurden. Das liegt daran, dass KI- und maschinelle Lernalgorithmen immer besser werden, wenn sie kontinuierlich mit mehr Gesichtern oder Bildern konfrontiert werden und trainieren können. Wenn Sie fehlerhafte Ergebnisse minimieren und eine höhere Genauigkeit erreichen möchten, hilft es, intelligente Algorithmen großen Datensätzen mit Menschen verschiedener Ethnien, Geschlechter und Altersgruppen als Lern-Input zu geben.

clickworker liefert genau diese benötigten Trainingsdatensätze. Sehen Sie hierzu auch das Fallbeispiel, indem clickworker einem Kunden Trainingsdatensätze geliefert hat mit dem ein Gesichtserkennungstool trainiert wird, das Gesichter als biometrische Faktoren für Online-Anmelde- und Authentifizierungsprotokolle verwendet. Hierzu werden die Algorithmen des Tools mit Fotos von Tausenden von Clickworkern, die über den ganzen Planeten verteilt sind, “gefüttert“.

Lesen Sie die ganze Fallstudie “Foto-Datensätze zum Online–Gesichtserkennung-Training”

Auch die Beauftragung von Trainingsdaten zum Training von Gesichtserkennungstechnologien die Emotionen erkennen können ist über clickworker möglich. Diese Technologien werden mitunter bereits im Vertrieb und Marketing eingesetzt und helfen Verkaufsteams dabei, Kunden in Einzelhandelsumgebungen besser anzusprechen.

Wenn sich die Branche weiterentwickelt, ergeben sich zahlreiche Möglichkeiten, den Umsatz, die Sicherheit und das Kundenerlebnis zu steigern. Die Zukunft der Gesichtserkennung ist unglaublich vielversprechend!

 

Dieser Artikel wurde am 21.July 2021 von Andrew Zola geschrieben.

avatar

Andrew Zola