Spracherkennungssoftware - auch für Blinde?

12. Mai 2011

Mit Spracherkennungssoftware kann man per Spracheingabe den Computer steuern und Texte direkt in ein Dokument diktieren. Erleichtert dies blinden Nutzern die Eingabe von Texten und die Computersteuerung? Und wie steht es um die Zugänglichkeit dieser Anwendungen in der Praxis?

Im deutschsprachigen Raum gibt es eigentlich nur das Produkt Dragon NaturallySpeaking der Firma Nuance. Zumindest konnten wir bei unseren Recherchen keine vergleichbaren Produkte ausmachen. Und wo noch vor einigen Jahren in der Fachöffentlichkeit über jede Menge Funktionsmängel berichtet wurde, haben wir aktuell überwiegend positive Testurteile gefunden (siehe PCWELT 12/2010 und CHIP online, Januar 2009). Alternativ bietet das Betriebssystem Windows 7 standardmäßig eine integrierte Spracherkennungsfunktion. Allerdings zurzeit nur mit englischer Sprachausgabe. Eine deutsche Version muss man sich dazukaufen. Die günstigste Variante ist für ca. 60 Euro erhältlich.

INCOBS hat Dragon NaturallySpeaking mit blinden Anwendern getestet. Parallel haben wir uns außerdem angesehen, was die Spracherkennung von Windows 7 zu bieten hat.

Die Spracherkennung von Windows 7

Die Funktionen der Spracherkennung

Wir haben eine praktische Erprobung der Windows-Spracherkennung mit JAWS durchgeführt. Im Hinblick auf die beiden Funktionen Eingabe von Texten und Steuerung des Computers machten wir recht unterschiedliche Erfahrungen. Während die Texteingabe, in unserem Fall in Word, recht gut funktionierte, war die Ausführung von Befehlen noch sehr fehleranfällig. Die Befehle wurden trotz intensivem Stimmtraining sehr oft gar nicht oder missverstanden. Für den Versuch, vom Desktop aus per Sprache eine Anwendung zu öffnen, benötigten wir mitunter bis zu zehn Versuche. Manchmal klappte es auch gar nicht. In der Textverarbeitung gab es Probleme, wenn Befehle eingesprochen wurden (z.B. "Text kopieren"), das Programm sie aber als Text interpretierte und aufschrieb. Wie eine Unterscheidung deutlich gemacht werden kann, wird in der Hilfe oder anderen Hinweisquellen nicht thematisiert.

Zur Zugänglichkeit für blinde Nutzer in der Praxis

Um die Zugänglichkeit und Bedienbarkeit bei der Windows-Spracherkennung steht es nicht gut. Dies beginnt schon bei den ersten Einführungstexten zur Anwendung, die mit JAWS nur teilweise erfassbar sind. Das Trainingsprogramm zur Stimmerkennung ist zur Nutzung der Spracherkennung unbedingte Voraussetzung. Die Texte, die der Anwender hierzu vorlesen muss, sind nur äußerst mühsam und mit sehr viel Geduld mit der Braillezeile erfassbar. Empfehlenswert ist hier der Einsatz einer sehenden Assistenz, die dem blinden Anwender die Texte einmalig vorliest.

Ist die Spracherkennung in Betrieb, erhält der Nutzer über Meldungen in einem schwebenden Statusfenster wichtige Hinweise darüber, ob ein Befehl verstanden wurde ("Wie bitte?") und in welchem Zustand sich die Anwendung befindet ("Ruhezustand", "Zuhören beenden"). Diese Statusmeldungen sind für JAWS-Nutzer nicht erfassbar. Der Anwender erhält akustische Signale bei Problemen, z.B. wenn gar nichts verstanden wurde, allerdings nicht differenziert nach Problemen. Falsch verstandene Eingaben bekommen Anwender nur per Zufall mit, beispielsweise wenn ein anderes Fenster offen ist als erwartet. Die gängigen Windows-Dialogfenster zur Einstellung der Spracherkennung sind relativ gut bedienbar. Ab und zu muss man Texte explizit abfragen, ein Mangel, der uns aus anderen Windows-Tests aber auch schon bekannt ist.

Die Spracherkennung Dragon NaturallySpeaking

Die Funktionen der Spracherkennung

Auch Dragon NaturallySpeaking haben wir in Kombination mit dem Screenreader JAWS erprobt. Als Experte stand uns die Firma Brandt Spracherkennung zur Seite.

Was die Funktionalität der Software angeht, waren wir positiv überrascht. Nach einer relativ kurzen Stimmtrainingsphase war es unserem Tester Carsten Albrecht möglich, eine zuverlässige Texteingabe in MS Word nur per Sprache vorzunehmen. Auch die Textverarbeitungsbefehle (Texte korrigieren, löschen, etc.) sowie die Steuerungsbefehle über Windows verliefen erstaunlich problemlos. Was der Anwendung bei blinden Nutzern besonders zugutekommt: Es gibt in den entscheidenden Momenten der Text- und Befehlseingabe keine Konflikte mit der Sprachausgabe des Screenreaders. Während der Screenreader Tastatureingaben durch die Sprachausgabe bestätigt, bleibt diese bei Spracheingaben still.

Man muss allerdings darauf hinweisen, dass die Anwendung stark an Microsoft-Programme angelehnt ist. Beispielsweise haben wir die Spracherkennung auch in dem E-Mail-Programm Thunderbird von Mozilla ausprobiert und mussten feststellen, dass es hier vermehrt zu Steuerungsproblemen und Missverständnissen bei der Befehlseingabe kam. Auch gibt es Bereiche, in denen die Steuerung des PCs per Tastatureingabe schneller und damit auch effektiver ist. So haben wir beim Aufruf bestimmter Dialoge (zum Beispiel dem Speicher-Dialog von Word) festgestellt, dass es um einiges mühsamer war, die richtigen Sprachbefehle aneinander zu reihen als ein oder zwei Shortcuts mit der Tastatur durchzuführen.

Zur Zugänglichkeit für blinde Nutzer in der Praxis

Dragon NaturallySpeaking ist (noch) nicht barrierefrei, eine Bedienung der Software ist aber zumindest Screenreadernutzern weitestgehend möglich. Selbst die programmeigene Bedienleiste, die quasi über einem Worddokument "schwebt", während die Texteingabe vorgenommen wird, ist mit einem Screenreader auffind- und bedienbar. Im Detail gibt es aber auch noch Probleme. Ein Beispiel: Das Programm schlägt bei vermeintlichen Schreibfehlern mehrere Alternativen vor, die in einer Art Kontextmenü als Liste über dem Wort aufgeklappt werden. Diese Funktion bleibt dem Screenreadernutzer verborgen.

Die Installation und Einstellung des Programms verlief relativ unproblematisch, die notwendige Registrierung im Internet war allerdings aufgrund eines scheinbar komplett unzugänglichen Internetauftritts schwierig. Das Stimmtraining ist für Blinde ähnlich wie bei der Spracherkennungsfunktion von Windows nur sehr mühsam ohne fremde Hilfe ausführbar. Auch hier sollte eine Assistenz blinde Nutzer in der Trainingsphase unterstützen, indem sie die Texte zunächst vorliest. Als alternative Möglichkeit kann man den Text als Datei speichern und in Abschnitten parallel mit dem Screenreader erfassen. Das Programm meldet sich, wenn die Spracheingabe ausreicht und das Vorlesen beendet werden kann.

Unser Fazit

Die beiden Anwendungen unterscheiden sich in ihrer Qualität erheblich. Die Spracherkennungsfunktion von Windows 7 können wir momentan nicht empfehlen. Sie ist zu barrierenbehaftet und in den Funktionalitäten noch nicht weit genug ausgereift, um blinden Anwendern eine Arbeitserleichterung zu bieten. Anders bei Dragon NaturallySpeaking. Mittlerweile ist diese Software auch als komfortable Zusatzsoftware für die Zielgruppe blinde Computernutzer interessant. Eine behinderungskompensierende Wirkung sehen wir nicht, sehr wohl aber die Möglichkeit einer effizienten Computernutzung, wenn die Spracherkennung gemeinsam mit einem Screenreader in einer sinnvollen Kombination genutzt wird. So gibt es auch nach wie vor Bereiche, in denen die Tastatureingabe vorzuziehen ist. Zu prüfen wäre noch, inwiefern es an diesen Stellen hilfreich ist, Tastenkombinationen über selbst definierte Sprachbefehle auszuführen. Bei der Texteingabe ist es in vielen Situationen aber eine Überlegung wert, die Spracherkennung als Unterstützung einzusetzen. Ähnlich wie bei Windows 7 wird Spracherkennungssoftware auch bei weiteren Anwendungen und Geräten immer häufiger als Zusatzfunktion integriert. So ist dieser Trend beispielsweise auch in mobilen Endgeräten erkennbar, beispielsweise plant Apple für das nächste iPhone eine integrierte Spracherkennungsfunktion und bietet bereits heute mit der Applikation DragonDictate von Dragon NaturallySpeaking an, E-Mails und SMS per Sprache zu diktieren und zu versenden. INCOBS wird diesen Trend weiter beobachten.

Autorin: Michaela Freudenfeld