Wie sag’ ich’s meinem Computer?
Sprachsteuerung Cortana statt Siri: Spätestens seit Windows 10 liest auch der PC seinem Nutzer jeden Wunsch von den Lippen ab.
Tobias Hanraths
Wir benötigen Ihre Zustimmung um BotTalk anzuzeigen
Unter Umständen sammelt BotTalk personenbezogene Daten für eigene Zwecke und verarbeitet diese in einem Land mit nach EU-Standards nicht ausreichenden Datenschutzniveau.
Durch Klick auf "Akzeptieren" geben Sie Ihre Einwilligung für die Datenübermittlung, die Sie jederzeit über Cookie-Einstellungen widerrufen können.
AkzeptierenMehr Informationen
Unter Umständen kann eine Sprachsteuerung Maus und Tastatur komplett ersetzen. Das braucht allerdings etwas Gewöhnungszeit – für Mensch und Maschine. "Richte mir bitte einen Termin ein." Oder: "Erinnere mich daran, heute Abend Oma anzurufen." Und: "Brauche ich morgen einen Regenschirm?" Solche Fragen und Befehle kann man nicht nur an sein Smartphone richten. Auch Windows hat seit Version 10 die Sprachassistentin und Alltagshelferin Cortana an Bord – benannt nach einer künstlichen Intelligenz aus der Spieleserie "Halo" von Microsoft.
Wer an seinem Windows-10-PC konsequent auf das Microsoft-Ökosystem setzt, also etwa E-Mails und Termine in den mitgelieferten Apps verwaltet, kann Cortana tatsächlich viele Alltagsaufgaben überlassen. Am Mac geht das noch nicht. Gut möglich allerdings, dass Siri demnächst den Sprung von mobilen Geräten auf den Computer schafft. Selbst für Linux gibt es mit Sirius einen Open-Source-Assistenten, der aber in Sachen Funktionsumfang noch ganz am Anfang steht.
Die Arbeit am PC beschleunigen die Assistenten nicht unbedingt. "Sprachsteuerung ist dann besonders attraktiv, wenn Augen und Hände beschäftigt sind, also etwa im Auto oder am Handy", sagt Alexander Waibel, Professor für Informatik am Karlsruhe Institute of Technology (KIT). "Am klassischen PC ist der Nutzen solcher Systeme eingeschränkt, die Leute sitzen ja in der Regel direkt davor."
Interessanter werden solche Assistenten erst, wenn das nicht mehr der Fall ist, sagt der Informatiker – etwa wenn der PC zur Steuerzentrale für die Wohnung wird und dann auf Kommando nach der Lieblingsserie sucht. "Mit Lösungen wie Amazon Echo gibt es das ja jetzt schon", sagt Waibel. "Gut möglich, dass sich die Definition des PC in den kommenden Jahren generell in diese Richtung verschiebt."
Bis es so weit ist, gibt es aber noch einige Hürden zu nehmen. Die größte davon ist eine Art Sprachbarriere zwischen Assistenten und Nutzer. "Eindeutige und einfach zu interpretierende Befehle zu geben, ist für Menschen fast unmöglich", sagt Waibel. "Selbst einfachste Kommandos sind sprachlich sehr komplex."
Zur Lösung dieses Problems setzen Assistenten wie Siri und Cortana auf Lernalgorithmen: Jeder Befehl aller Nutzer der ganzen Welt landet im Speicher der Systeme. Mit der Zeit entsteht so eine Datenbank aus Erfahrungswerten, aus denen die Programme lernen können. "Je mehr wir solche Assistenten nutzen, desto besser werden sie", erklärt Waibel.
Doch am PC gibt es noch andere Möglichkeiten der Sprachsteuerung. Wer will, kann seinem Computer etwa schon seit Jahren Texte diktieren. Diese Funktion ist bei aktuelleren Versionen von Windows und OS X integriert, alternativ gibt es Programme wie Dragon Naturally Speaking oder Voice Pro. Die kosten zwar, können aber auch mehr.
Ob Diktieren besser klappt als klassisch Tippen, ist Geschmacks- und Übungssache. "Klar und eindeutig zu diktieren, ohne sich zu versprechen, ist gar nicht so einfach", warnt Waibel. Tippen sei dagegen schneller, fehlerfreier und geräuscharmer – wichtig fürs Großraumbüro. "Beim Tippen können Sie außerdem ins Unreine schreiben und später editieren, das geht beim Diktieren nicht so leicht." Einige sind aber auch auf solche Systeme angewiesen. "Spracherkennung ist für alle Menschen mit irgendeiner Form der motorischen Einschränkung enorm wichtig", sagt Christian Hille vom Berliner Verein Zugangswerk, der barrierefreie Technologien fördert.
Gute Spracherkennungssoftware steuert zudem alles vom Browser bis zum System. "Wer damit umgehen kann, formatiert sogar Texte oder baut Tabellen", so Hille. Möglich machten dies Bordmittel der Betriebssysteme ebenso wie Kaufprogramme. Letztere lieferten aber deutlich bessere Ergebnisse: "Die sind anpassungsfähiger und bieten gerade für erfahrene Nutzer viel mehr Möglichkeiten."
Die Programme brauchen aber Gewöhnungszeit: Sie funktionieren erst richtig gut, wenn sie die Stimme ihres Besitzers kennen, sagt Jo Bager. Auch der Ton zählt: "Mit einem einfachen Mikrofon im Notebook klappt das nicht so gut, mit einem Headset aber deutlich besser."
Kommentare
Liebe Leserinnen und Leser,
leider können Artikel, die älter als sechs Monate sind, nicht mehr kommentiert werden.
Die Kommentarfunktion dieses Artikels ist geschlossen.
Viele Grüße von Ihrer BZ