Die Verwendung von Spracherkennungssystemen für Menschen mit Behinderung

Spracherkennungssysteme

Dank des technischen Fortschritts können heute viele durch Behinderungen benachteiligte Menschen Technologien einsetzen, um ihr Leben komfortabler zu gestalten. Ein vielversprechender Bereich ist dabei die Spracherkennung. Diese Technologie ist die Kernfunktion persönlicher Sprachassistenten wie Siri, Amazon Echo und Google, die sich entweder auf Smartphones oder über Smart-Home-Speaker, intelligente Lautsprecher im Haus, verwenden lassen.

Spracherkennung hilft Computern, die gesprochene Sprache des Menschen zu verstehen. Das Gesagte wird in ein Format übersetzt, das Computer verarbeiten und entsprechend darauf reagieren können. Auf diese Weise lässt sich beispielsweise eine Suche nach dem lokalen Wetter schnell durchführen, indem einfach die Frage danach ausgesprochen wird.

Wie Spracherkennungstechnologien Menschen mit Behinderungen helfen können

Das Surfen im Internet ohne Maus und Tastatur oder bei Problemen mit dem Verwenden eines Touchscreens kann schwierig, wenn nicht sogar unmöglich sein. Ebenso können das Ändern von Fernsehkanälen oder das Beantworten eines Telefonanrufs, ohne sehen oder die Hände benutzen zu können, für einige Menschen unüberwindliche Hindernisse darstellen.

Automatische Spracherkennung hilft Computern, menschliche Wörter in eine maschinenlesbare Sprache zu übertragen, die von Computern verarbeitet werden kann. Indem sich diese Technologie weiterentwickelt, werden auch immer leistungssteigerndere Funktionen eingeführt, sodass diese Geräte zu echten digitalen Assistenten werden, die unsere Effizienz und Produktivität verbessern.

Während diese Funktionen für gesunde Menschen hilfreich sind, können sie für behinderte Menschen eine echte Lebensveränderung bedeuten. Da die Spracherkennungstechnologie das gesprochene Wort als Steuerung verwendet, kann sie besonders für Personen, die Probleme mit der Beweglichkeit ihrer oberen Extremitäten oder dem Sehvermögen haben, von Nutzen sein. Darüber hinaus kann Spracherkennungstechnologie auch Personen mit Sprach- und Hörbehinderungen sowie älteren Menschen helfen.
Wenn man die geschätzten 15 Millionen behinderten Menschen allein in den USA und Millionen weitere auf der ganzen Welt berücksichtigt, sind die potenziellen Vorteile der Spracherkennung enorm.

Verwendung von Spracherkennung

Spracherkennungstechnologie kann auf vielfältige Art und Weise eingesetzt werden, um das Leben behinderter Menschen zu verbessern. Mit einem Gerät mit Sprachassistent wie einem Smartphone oder einem Smart-Home-Lautsprecher lassen sich beispielsweise Anrufe ganz einfach tätigen. Nach dem Einrichten und Konfigurieren ist nur ein Sprachbefehl erforderlich, um eine bestimmte Person nach Namen oder Telefonnummer auszuwählen und anzurufen.

Genauso einfach ist es, Textnachrichten und sogar E-Mails auf einem Smartphone zu senden oder zu empfangen, wenn man die richtigen Apps installiert und konfiguriert hat. Die Spracherkennungstechnologie geht jedoch noch einen Schritt über die Kommunikation hinaus und trägt auch zur Verbesserung der Effizienz bei – das Festlegen von Erinnerungen oder das Erstellen von Einkaufslisten ist mit einem Assistenten so einfach wie Sprechen.

Die Spracherkennungstechnologie kann über eine spezielle Software auch auf Desktop- und Laptop-Computern verwendet werden. Diese Software vereinfacht es, Notizen und vieles mehr für verschiedene Programme zu diktieren, entweder sitzend vor dem PC oder mit Headset und Mikrofon herumlaufend.

Zahlreiche Audio-Datensätze mit vielen Nuancen der menschlichen Stimme zum optimalen Training Ihrer Spracherkennungssysteme erhalten Sie bei clickworker.

Die Entwicklung der Spracherkennung

Die Vorteile der Spracherkennung liegen auf der Hand, aber es war eine sehr beschwerliche Reise, an diesen Punkt zu gelangen. Spracherkennung wurde bereits in den 1950er Jahren erforscht, als Bell Laboraties ‚Audrey‘ erfand. Audrey konnte 9 Ziffern erkennen, was noch nicht besonders nützlich war. Es dauerte ein weiteres Dutzend Jahre, bis IBM ‚Shoebox‘ herausbrachte. Dieses Programm war in der Lage, Töne zu verarbeiten, um verschiedene Hinweise zu erhalten, anhand derer es bestimmen konnte, was gesagt wurde. Dies war jedoch kein leichter Prozess und konnte sehr zeitaufwändig sein. Nach einem weiteren Jahrzehnt war das US-Verteidigungsministerium an der Schaffung des Systems ‚Harpy‘ beteiligt. Dieses System konnte 1000 Wörter erkennen, was ungefähr dem Wortschatz eines kleinen Kindes entspricht. Und tatsächlich war es dieser Richtwert, auf den die Spracherkennung ursprünglich abgezielt hatte – in den 1970er und 80er Jahren wurden Spracherkennungssysteme in einer Vielzahl verschiedener Kinderspielzeuge eingesetzt, die auf unterschiedliche Weise mit sprechenden Benutzern interagieren konnten.

Zu diesem Zeitpunkt begann die Weiterentwicklung der Technologie abzuflachen, und bis 2010, als die Google Voice Search-App gestartet wurde, konnten wir keine wirklichen Fortschritte feststellen. Ein Jahr später folgte Apples Siri. Diese Technologien nutzten die Leistung von Cloud-basierten Rechenzentren, um die Datenverarbeitung zu verbessern. In den letzten zehn Jahren wurde die Spracherkennungstechnologie allmählich wesentlich leistungsfähiger und ausgefeilter und weist jetzt Genauigkeitsraten von beinahe 95 Prozent auf. Während die Fortschritte in erster Linie auf neuen Technologien wie Cloud-Computing und umfangreichen Datenerfassungsbemühungen beruhen, haben sie auch von der erhöhten Rechenleistung sowie von verbesserter Hardware profitiert, die zur Verbesserung der Sprachqualität beigetragen hat.

Die Zukunft der Spracherkennung

Spracherkennungssysteme verbessern sich im Hinblick auf Leistung und Qualität immer weiter. Heutzutage haben viele Systeme die Fähigkeit, durch verschiedene Akzente und Sprachen zu navigieren, und werden immer häufiger angewendet.

Speziell für Menschen mit Behinderungen sind Spracherkennungssysteme ein äußerst wertvolles Instrument, das im Laufe der Zeit immer nützlicher wird. Diese Leistungsfähigkeit und Nützlichkeit ist jedoch von den verfügbaren Apps und Softwareprodukte abhängig. Die weitere Entwicklung muss sich daher auf diesen Bereich konzentrieren, da der Wert der Spracherkennung sonst stagnieren wird.