Spracheingaben
Eingaben von Kommandos oder zusammenhängenden Texten sind nicht erst seit der Einführung von "Siri", "Alexa" und ihren Schwestern ein selbstverständlicher Bestandteil von Bedienkonzepten. Die Anfänge waren zum einen geprägt von unzureichender Leistungsfähigkeit der Spracherkenner, zum anderen von der gleichzeitigen Vorstellung, dass im Auto alles per Sprache bedient werden sollte. Einige grundlegende Studien aus den Anfängen der Sprachbedienung zeigen jedoch, dass es nicht sinnvoll ist, alles per Sprachkommando zu steuern. Auch wenn nicht auszuschließen ist, dass sich mit zunehmender Erkennensleistung der Systeme und verändertem Nutzerverhalten der nächsten Generation der Umfang von Sprachbedienung verändert, gelten aktuell noch eine Reihe von Erkenntnissen aus den frühen Studien. Sprachbedienung eignet sich vor allem für eindimensionale Informationen, die zudem eineindeutig sind und kein Kontextwissen über einen Systemzustand benötigen, beispielsweise die Eingabe einer Telefonnummer oder des Namens eines Teilnehmers, der angerufen werden soll bzw. die Eingabe einer Adresse in das Navigationssystem. Gar nicht geeignet sind Aktionen, die mit einem Fingertip erledigt werden können oder die zeitkritisch sind, wie beispielsweise Blinker setzen oder bremsen.
Weniger geeignet bis ungeeignet sind hingegen kurze Aktionen, die mit einer einfachen Eingabe zu erledigen sind, speziell wenn sie Kontextwissen oder Lernen durch das System erfordern. Beispiel für das Erfordernis von Kontextwissen „Fenster auf“: Wie weit soll das Fenster geöffnet werden? Wenn man in ein Parkhaus fährt und an der Schranke das Ticket ziehen will, würde „auf“ bedeuten, dass das Fenster komplett geöffnet werden soll. Auf der Autobahn bei Tempo 130 km/h und Regen würde ein menschlicher Beifahrer auf das Kommando „Fenster auf“ die Seitenscheibe vermutlich nur einen Spalt öffnen, denn er verfügt über Kontextwissen, das ihm sagt, dass in dieser Situation das komplette Öffnen des Fensters unangebracht ist.
Es ist anzunehmen, dass die Bedeutung von Sprachbedienung noch zunehmen wird, um die motorische und visuelle Ablenkung der Fahrer zu reduzieren. In welchem Umfang das geschieht, hängt von der Qualität der Spracherkenner und künftigen Nutzerbedürfnissen ab.
Sprachausgaben
Die Anfänge der Nutzung von Sprache im Kfz konzentrierten sich zunächst nicht auf die Sprachbedienung sondern auf Sprachausgaben. Dies hatte zwei Gründe: Durch Sprachausgaben soll der optische Kanal der Fahrer und Fahrerinnen entlastet werden und die visuelle Aufmerksamkeit nicht vom Verkehrsgeschehen abgelenkt werden. Technisch waren Spracherkenner in den 1980er Jahren noch so wenig leistungsfähig, dass eine Anwendung in den damals noch lauteren Kfz Innenräumen nicht sinnvoll war.
Die ersten „Gehversuche“ machte AUDI im Audi Quattro. Da es sich um ein erstes System handelte wurden Grundsätze der Gestaltung aus Human-Factors Sicht zu wenig berücksichtigt. Eine Sprachausgabe lautete zum Beispiel „Achtung Öldruck“ und sollte auf die Gefahr durch zu geringen Öldruck hinweisen. Bei einer Testfahrt mit einem Journalisten trat (wahrscheinlich) ein Sensordefekt auf, so dass das System während einer langen Strecke ständig wiederholte: „Achtung Öldruck, Achtung Öldruck...“. Systematische Versuche zur Erforschung von Sprachausgaben erbrachten grundlegende Erkenntnisse zu Einsatzmöglichkeiten und zur Gestaltung. Beispiel: In einem Feldversuch wurde vom Versuchsleiter die Handbremse leicht angezogen, ohne dass die Probanden dies bemerkten. Anschließend wurde die Sprachausgabe aktiviert: „Bitte lösen Sie die Handbremse“. Die Akzeptanz für diese (objektiv richtige und wichtige) Information war äußerst gering. Die Begründung ist im nachhinein einleuchtend: Die Fahrer fühlten sich durch die Sprachausgabe vor den Beifahrern bloßgestellt. Eine kleine Änderung der Sprachausgabe hat dem Rechnung getragen und die Akzeptanzprobleme beseitigt. Die Ausgabe lautete: „Bitte prüfen Sie die Handbremse“. Wie Umfragen regelmäßig zeigen, sind mindestens 80 % aller Autofahrer überzeugt, besser als der Durchschnitt zu fahren. Der Hinweis auf Fehler, den Andere mitbekommen, hat in diesem System keinen Platz.
Die häufigste Anwendung von Sprachausgaben findet sich bei Navigationssystemen, wobei sich gezeigt hat, dass eine rein akustische Ausgabe nicht ausreichend ist, sondern in komplexen Situationen (Kreisverkehr, komplexe Kreuzungen) eine Unterstützung durch Anzeigen hilfreich ist.
Die Bedeutung des Wortes „Bitte“ und Wiederholungen von Sprachausgaben
Das Wort „Bitte“ am Anfang jeder Ausgabe des Navigationssystems hat wenig mit Höflichkeit zu tun. Das Wort „Achtung“ ist für die Dringlichkeit der Ausgabe unangemessen und daher zu vermeiden. Es muss für besonders dringliche Ausgaben reserviert bleiben, z.B. für die Warnung vor Falschfahrern. Die Einleitung mit „Bitte“ (z.B. "Bitte rechts abbiegen") dient der Fokussierung der Aufmerksamkeit und der Anpassung des Ohrs an die Sprachausgabe. So kann die Verständlichkeit auf Seiten des Nutzers deutlich erhöht werden.
Sprachausgaben dürfen nicht ständig wiederholt werden um nicht zu nerven (s.o.). Auf der anderen Seite müssen Fahrerinnen und Fahrer die Möglichkeit haben, eine überhörte oder unvollständig gehörte Sprachausgabe erneut zu hören (siehe Wegleitung). Ein erster Prototyp eines Systems aus den 1980er Jahren, der an unserem Institut entworfen wurde , macht es möglich, gezielt Klassen von Sprachausgaben auf Knopfdruck erneut auszugeben.
Literatur: