Was taugt Spracherkennungssoftware?

By on 8. August 2008

Die Entwicklung von Spracherkennungssoftware ist in den letzten Jahren stark voran geschritten und soll in künftigen Windows-Version eine immer größere Rolle spielen. Bei Office-Programmen, vor allem in der Textverarbeitung, stellen Softwarepakete wie Dragon 10 der Firma Nuance mittlerweile voll funktionsfähige Alternativen zur Verfügung, die sich in das Betriebssystem integrieren lassen und mit der man alle wichtigen Anwendungsprogramme auch ohne Tastatur steuern kann. Das kann eine Menge Zeit sparen: Bei einer normalen Sprechgeschwindigkeit ist man schließlich wesentlich schneller als mit der Tastatur. Nuance verspricht in der aktuellen Version zudem eine Erkennungsrate von 99 Prozent. Dragon ist nach Herstellerangaben die weltweit meistverkaufte Spracherkennungssoftware. Die neue Version hat gegenüber der alten vor allem eine verbesserte Erkennungsrate bei einer gleichzeitig erhöhten Geschwindigkeit zu bieten. Die Software lässt sich auf Rechnern mit Betriebssystemen von Microsoft ab Windows 2000 und mit Pentium-Prozessoren (oder vergleichbaren AMD-CPUs) einsetzen. Außerdem braucht man ein Headset der Firma.

Kommandos zum Steuern des Programms lauten lauten sind zum Beispiel „Öffne Outlook Express“ ,“gehe zum Textfeld…“. Da fällt schon der erste Nachteil von Spracherkennungssystemen ins Auge: Man muss die Befehle kennen, bzw. die Art, wie sie eingegeben werden. Außerdem kann man zwar im Allgemeinen schneller sprechen als schreiben. Aber bei Herumklicken ist man wiederum möglicherweise mit der Maus und vor allem mit Shortcuts auf der Tastatur schneller. Schließlich muss man Klammern, Interpunktionszeichen und sonstige Nichtwörter im Text explizit angeben. Wer das ausprobiert merkt schnell, dass es schwierig ist: Schließlich ist man es nicht gewöhnt, beim Sprechen über die korrekte Anwendung dieser Zeichen nachzudenken. Hat man einmal einen Fehler gemacht, muss man im Text per Sprachbefehl zurücknavigieren und das richtige Zeichen setzen. Auch das geht normalerweise mit der Tastatur schneller. Wenn David Pogue von der New York Times in einer Besprechung die Software mit verbundenen Händen benutzt ist das also nicht ganz ernst zu nehmen: Im Allgemeinen muss man für diese und jene Kleinigkeit also durchaus die gute alte Tastatur zu Hilfe nehmen.

Probleme gibt es auch mit der Rechnerauslastung. Schließlich setzt die Spracherkennungssoftware auf den bereits vorhandenen Programmen auf, sie verbraucht also zusätzlich Rechenkapazitäten und Speicherplatz. Die Spracherkennung selbst ist für den Rechner um ein Vielfaches aufwändiger als die Erkennung von Tastatureingaben: Denn werden ja automatisch erkannt und müssen nicht vorgegebenen Mustern (z.B. Buchstaben)  zugeordnet werden. Nicht umsonst empfhielt Nuance den Einsatz auf Rechnern mit mindestens 2,4 GHz schnellen Prozessoren.

Und überhaupt: Nachdem man in jeder S-Bahn die Handy-Gespräche seiner Sitznachbarn belauschen muss, tragen Leute, die mit ihren Computern sprechen, nicht gerade zur allgemeinen Ruhe in öffentlichen Räumen bei. Tatsächlich sind die Einsatzmöglichkeiten der Spracherkennungssoftware deswegen von vornherein begrenzt. In Bibliotheken und im Büro könnte es damit arge Probleme geben.