Optimierung von Spracherkennungssystemen

post published 04.08.2014 post modified 07.10.2022

Optimierung von Spracherkennungssystemen

Immer mehr intelligente Systeme werden über Spracheingaben gesteuert – von Smartphones, Infotainmentsystemen für PKWs, Tablet- und Smartphoneanwendungen bis hin zu Haushaltsgeräten und Gebäudetechniken.
Viele der Sprachsteuerungssysteme sind heute jedoch noch sehr fehleranfällig. Nicht ausreichend bedacht wurde bei der Programmierung häufig der Faktor Mensch. Menschen folgen nicht immer einer einheitlichen Logik und drücken sich je nach Sprachfähigkeit, Nationalität, sozialem Umfeld und Bildungsstand unterschiedlich aus. Sobald das eingegebene Kommando in der Wortwahl, -reihenfolge oder -aussprache nicht mit dem vorgesehenen und programmierten Kommando des Systems übereinstimmt, wird der Nutzer nicht verstanden und der Befehl nicht ausgeführt. Abbrüche und erneute Spracheingaben kosten den Nutzer viel Zeit und können in einigen Situationen auch stark ablenken und gefährlich werden, wie z.B. während des Autofahrens.

Um Sprachsteuerungssysteme optimal auf das Verhalten und die Aussprache der Nutzer abzustimmen, müssen die Verhaltensmuster sehr vieler Menschen ermittelt und berücksichtigt werden. Wie gehen die verschiedenen Menschen vor, um die Systeme zu bedienen? Welche Kommandos geben sie via Spracherkennung ein, um gezielte Informationen abzurufen und welche Worte wählen sie hierfür in welcher Reihenfolge? Wie ist die Aussprache einzelner Wörter? Um hier schnell valide Daten zu erhalten, bietet sich Crowdsourcing by clickworker als ideales und effizientes Tool zur Datengewinnung an.

Detaillierte Informationen zu unserem Service „Audio-Datensätze zum Training von Spracherkennungssystemen

Befragen Sie unsere internationale und über 4,5 Mio. Clickworker starke Crowd, wie sie bei der Bedienung Ihres Systems vorgehen und welche Sprachkommandos sie erteilen würden, um gezielte Informationen abzurufen. Über den Einsatz unserer Crowdsourcing-Services erhalten Sie alle benötigten Daten von potenziellen Nutzern Ihres Systems in valider Menge und unter Berücksichtigung und Aufteilung von Nationalitäten und regionalen Sprachunterschieden. Zudem können die Ergebnisse bei Bedarf auch nach weiteren demographischen Daten unserer Clickworker wie beispielsweise der Altersgruppe oder dem Geschlecht unterteilt werden.

Wie Crowdsourcing dazu eingesetzt werden kann, um die Sprachsteuerungssysteme auf das menschliche Verhalten zu trainieren und damit intelligenter zu machen, möchten wir hier anhand eines Fallbeispiels kurz und praxisnah aufzeigen.

 

Optimierung von Spracherkennungssystemen mittels Crowdsourcing

Tausende von Clickworker zeichnen ihre Spracheingaben zur Steuerung eines PKW-Infotainmentsystems auf und liefern dem Hersteller damit wichtige Daten zur Programmierung und Optimierung des Systems.

 

Herausforderung Beispielhafter Arbeitsablauf
Sprachgesteuerte Systeme sind oftmals nur so gut wie ihre Spracherkennung. Die Spracherkennung dieser Systeme auf die individuell sehr unterschiedlichen Spracheingaben der Nutzer hin zu optimieren und trainieren, ist hierbei eine große Herausforderung.

Programmierung ohne die Faktoren „Menschlicher Verstand“ und „Menschliches Verhalten“ kann nicht zu einem optimalen Spracherkennungssystem führen. Die Spracheingaben der Nutzer werden häufig nicht erkannt oder falsch verstanden. Die Nutzer müssen ihre Befehle oft mehrmals eingeben, bis das System auf die Eingabe korrekt reagiert und die gewünschten Informationen anzeigt. Das kostet die Nutzer sowohl Zeit als auch Nerven und lenkt sie nicht selten zudem vom Verkehr ab.

Um das System auf eine ausreichende Spanne an individuellen Spracheingabemöglichkeiten potenzieller Nutzer hin zu optimieren, bedarf es der Sprachaufzeichnung tausender verschiedener Personen mit ihren individuellen Eingaben und Aussprachen.
  • Die Ziele und die jeweils benötigte Anzahl der Spracheingaben werden vom Kunden festgelegt.
  • Je nach Anforderung kann der Kunde festlegen, welche technischen Voraussetzungen er an die teilnehmenden Clickworker stellt und ein Briefing erstellen.
  • clickworker setzt das Projekt entsprechend der Kundenwünsche auf. Das Projekt wird in einzelne Microtasks aufgeteilt und getestet. Ein Microtask entspricht einer Sprachaufzeichnung. Die Microtasks werden ausschließlich den hierfür qualifizierten Clickworkern (unter Berücksichtigung der entsprechenden Zielregionen und Erfüllung technischer Voraussetzungen) online zur Bearbeitung zur Verfügung gestellt.
  • Die Clickworker lesen die Aufgabenstellung und zeichnen ihren individuellen Sprachbefehl zur Ausführung des vorgegebenen Ziels auf. Z.B.:
    Finden eines 4-Sternehotels in Stuttgart (Szenario: Sie sind im Pkw auf der Fahrt nach Italien, möchten in Stuttgart zwischenübernachten und suchen ein Hotel mit Hilfe Ihres Navigationssystems)
  • Die Sprachaufzeichnungen werden täglich stichprobenweise von clickworker geprüft und die gesammelten Aufzeichnungen über einen Cloudanbieter hochgeladen, wo sie dem Kunden zum Download zur Verfügung stehen.
Lösung
Tausende unserer Clickworker aus dem gesamten deutschsprachigen Raum zeichnen auf, wie sie ihren Befehl erteilen würden, um eine vorgegebene Reaktion X oder die Information Y über das Infotainmentsystem abzurufen. Jede Sprachaufzeichnung unterscheidet sich individuell durch die Wortwahl, die Wortreihenfolge sowie die Aussprache jedes einzelnen Clickworkers.
Mit Hilfe der Aufzeichnungen wird die Spracherkennung des Systems trainiert und das Infotainmentsystem auf den individuell unterschiedlichen Umgang der Nutzer mit dem System optimiert.

Projektangaben

Clickworker-Qualifikationen:
Deutsche Muttersprachler aus den Ländern DE, CH und AT.

Benötigte Clickworker-Ausstattung:
PC oder Laptop mit Mikrofon und Lautsprechern.

Datenübermittlung:
Audiofiles via Cloud.

Typische Anzahl der täglichen Sprachaufzeichnungen:
500 – 600 Aufzeichnungen.

Qualitätssicherung:
Injected Testing.

Projektvolumen:
40.000 Sprachaufzeichnungen (1.000 Sprachaufzeichnungen pro Aufgabe/Ziel; 40 Aufgaben/Ziel).

 

Wenn Sie weitere Fragen zu unseren Services haben oder an einem Angebot interessiert sind, dann schreiben Sie uns einfach eine E-Mail an: [email protected]
oder rufen Sie an unter: +49 201 959718-0.

 

avatar

Ines Maione