Linguatronic 2.0: Der persönliche Assistent fürs Auto

Ich sitze gerade in einem barocken Konferenzsaal der Charles University in Prag und schaue mir die aktuellsten Forschungsthemen der Sprachbedienung an. Warum ich das mache? Ich bin Entwicklungsingenieur im Bereich Research&Development: meine Kollegen und ich entwickeln die Sprachbedienung unserer Mercedes-Benz PKW.

Deshalb bin ich auf der SIGdial-Konferenz in Prag, da es für uns Entwickler enorm wichtig ist, die aktuellsten Technologien und Trends der Sprachbedienung zu kennen. Auf dieser Konferenz treffen sich jährlich Sprachwissenschaftler aus dem vorwiegend universitären aber auch industriellen Bereich. In unserer täglichen Arbeit müssen wir Sprachdialoge designen, welche durch die aktuell zur Verfügung stehenden technischen Möglichkeiten umgesetzt werden können.

Wir müssen vorausschauend in die Zukunft blicken und zukünftige Technologien für unsere Zwecke bewerten. Somit versuchen wir stets das Maximum aus den bestehenden technologischen Limitierungen heraus zu kitzeln, denken aber auch gleichzeitig an die Sprachbedienung von morgen. Dies klingt spannend und einfach – ist es aber nicht: Eine unserer stetigen Herausforderungen ist der Umgang mit den internen Schnittstellen, sowie die Verfügbarkeit der Sprachbedienung in den unterschiedlichen Märkten.

Im Dialog für ein stimmiges Sprachbediensystem

Als Verantwortlicher für die Bedienung der Radio- und der Telefonfunktionen per Sprache bin ich regelmäßig mit den beteiligten Kollegen (z.B. Software-Entwicklern oder Designern) und den zuständigen Software-Lieferanten im Dialog. Um ein stimmiges Gesamtkonzept zu entwickeln, müssen zum Beispiel die Informationen, die während des Sprachdialogs auf dem Display der Mittelkonsole angezeigt werden, mit den Kollegen abgestimmt werden, die die manuelle Bedienung sowie das Design des Infotainmentsystems verantworten.

Nur wenn alle Teilprozesse/konzepte zusammen arbeiten, kann ein nutzerfreundliches und in sich stimmiges Sprachbediensystem entstehen. Da die Sprachbedienung in vielen Märkten und Sprachen verfügbar ist, müssen wir deren jeweiligen Bedürfnissen gerecht werden. Durch engen Kontakt zu unseren internationalen Kollegen – unter anderem in Sunnyvale, USA, in China oder in Korea – erfahren wir, was sich aktuell abspielt und gefordert wird.

Jede Sprache hat ihre Besonderheiten

Wenn die Sprachbedienung in vielen Märkten verfügbar sein soll, muss sie selbstverständlich auch in die jeweiligen Landessprachen übersetzt werden. Hier sind Übersetzungen in nicht-romanische Sprachen wie Japanisch besonders herausfordernd. Wussten Sie zum Beispiel, dass im Japanischen das Verb, welches für die Spracherkennung sehr wichtig ist, immer am Ende eines Satzes steht? Ich schon – zumindest mittlerweile.

Als Entwickler der Sprachbedienung ist es enorm wichtig, die grundsätzlichen Mechanismen und Unterschiede verschiedener Sprachen zu kennen und zu verstehen. Je mehr Sprachen unterstützt werden, desto mehr steigt der Aufwand für die Qualitätssicherung des Systems. Die Systeme müssen in jedem Markt und in jeder im Markt zur Verfügung stehenden Sprache getestet werden.

Um solche Tests durchzuführen, müssen Sprachdaten von Muttersprachlern gesammelt werden, was einen aufwendigen und zeitintensiven Arbeitsschritt darstellt. Darum arbeite ich gerade an einem Ansatz, mit dem man schnellstmöglich viele Sprachdaten sammeln kann. Die wissenschaftliche Komponente dieses Ansatzes wird auf dieser Konferenz veröffentlicht und vorgestellt und fließt dann direkt bei uns in die Entwicklungsprozesse ein.

LINGUATRONIC: Der Pionier

Der Besuch der Konferenz zeigt mir nicht nur den state-of-the-art der Sprachbedienung, sondern gibt mir gleichzeitig die Möglichkeit, gedanklich etwas auszuschweifen, den Entwicklungsprozessen der heimischen Arbeitsumgebung zu entfliehen und über Trends und Entwicklungen der Sprachbedienung nachzudenken.

Wenn ich mir die auf der Konferenz vorgestellten Prototypen und Forschungsthemen betrachte, wird mir klar, wie stark sich die Sprachbedienung in den letzten 20 Jahren weiterentwickelt hat. Die Anfänge habe ich zwar nicht miterlebt, aber ich weiß, dass die ersten Entwicklungen im PKW stattfanden.

Hier war eine Bedienung von Fahrzeugfunktionen, wie das Radio per Sprache, äußerst vorteilhaft, da dadurch die Fahrablenkung reduziert werden konnte. Mercedes-Benz war Pionier der Automobilbranche auf diesem Gebiet und brachte im Jahre 1996 die erste S-Klasse mit LINGUATRONIC-Sprachbedienung auf den Markt.

400 verschiedenen Kommandos

Mit der Sprachbedienung dieser S-Klasse war der Nutzer lediglich in der Lage sein Telefon durch die Verwendung einiger weniger Kommandos zu bedienen – an die Umsetzung einer Vielzahl verschiedener Kommandos war damals nicht zu denken. Nach und nach verbesserte sich die Spracherkennungstechnologie und die Anzahl an sprachbedienbaren Kommandos stieg mit den verfügbaren Funktionen des Infotainmentsystems.

Die Automobilhersteller trieben diese Technologie soweit voran, dass heutzutage der Fahrer z.B. sein Navigationsziel per Sprache eingeben, Musiktitel suchen oder einen bestimmen Kontakt aus dem Adressbuch anrufen kann. Im aktuellen System der C-Klasse stehen dem Fahrer ca. 400 Kommandos zur Verfügung.

Siri: die Schrittmacherin

Wenn ich jedoch über den aktuellen Stand der Sprachbedienung nachdenke, muss ich leider feststellen, dass die Automobilhersteller nicht mehr die treibende Kraft dieser Technologie sind. In den Sprachbediensystemen der Fahrzeuge spricht der Nutzer zu seinem Auto überwiegend im Kommando-Stil wie mit einer Maschine:

„Zieleingabe in Köln“, „Musiksuche“ – so würde ich mich nicht intuitiv mit einem Menschen unterhalten. Eine natürlichere Spracheingabe ist nur an wenigen Stellen möglich. Mit der Einführung von Siri auf dem iPhone 4S im Oktober 2011 hat Apple jedoch diese Art der Bedienung abgelöst und eine neue Trendrichtung in der Sprachbedienung vorgegeben. 

Mehr Mensch als Maschine

Aber was ist denn auf einmal neu und anders an Siri? Sie ist keine Maschine, Siri ist eine Persönlichkeit, hat Charakter. Dementsprechend spreche ich mit ihr auch wie mit einem Menschen. Siri reagiert sogar auf unkonventionelle Anfragen wie „Willst du mich heiraten?“ mit frechen Antworten, wie beispielsweise „Ich bin nicht für die Ehe geschaffen.“

Dieser Sprachdialog mit einem Gerät macht Spaß und löst Emotionen aus – und das, obwohl ich zu meinem HANDY spreche … diese Art der Bedienung wird durch den Einsatz von cloud-basierter Spracherkennung möglich, bei dem die Spracherkennung nicht auf dem Handy erfolgt, sondern auf einem Server.

Mit Siri hat Apple meiner Meinung ein neues Zeitalter der Sprachbedienung eingeleitet. Andere Smartphone-Hersteller folgten und sind nun die treibende Kraft, wenn es um Sprachbedienung geht. Jedoch hat sich nicht nur die Technologie oder die Art der Mensch-Maschine-Kommunikation drastisch verändert: Für mich war auch durchaus überraschend mit dem iPhone 4S, die erste Werbung zu sehen, in der Sprachbedienung thematisiert wird.

Sprachbedienung als Kaufkriterium

Auf einmal ist „Sprachbedienung in aller Munde“! Dass die Sprachbedienung eines Geräts zu einem Kaufkriterium avanciert ist, haben auch Hersteller anderer Produkte erkannt. Mittlerweile gibt es sprachbedienbare Fernseher, Lautsprecher mit denen ich mich unterhalten kann und sogar Kühlschränke, die mir sagen, was ich kaufen oder essen soll.

Der Mehrwert dieser Innovation ist an manchen Stellen selbstverständlich auch in Frage zu stellen…Was ich jedoch damit sagen will, ist, dass Sprachbedienung unsere Welt immer mehr durchdringt und aus unserer digitalen Welt nicht mehr wegzudenken ist.

Was steckt hinter Linguatronic?

Mit der Nutzung der Sprachbedienung in der Consumer Electronics Welt sind die Ansprüche und Erwartungen der Kunden gestiegen. Diese müssen wir erfüllen,  und deshalb ist es unsere Aufgabe, darauf zu reagieren und uns den aktuellen Trends anzunähern. Um unser Sprachbediensystem zunächst populärer zu machen und das Interesse für unsere Sprachbedienung zu erwecken, haben wir ein Video-Clip erstellen lassen, welcher die Funktionen der LINGUATRONIC des aktuellen CLS beschreibt.

In dem Video möchte ich euch zeigen, wie einfach doch unsere Sprachbedienung mittlerweile ist.

Wir möchten der Sprachbedienung der Zukunft wortwörtlich ein neues Gesicht geben und arbeiten täglich daran – LINGUATRONIC 2.0 sozusagen! In Zukunft wird der Mercedes dem Fahrer nicht mehr wie ein Dienstleister erscheinen, der auf Knopfdruck bereitsteht. Der Fahrer soll seinen Mercedes direkt ansprechen und sich auf natürliche Weise mit ihm unterhalten können.

Der Smartphone-Trend der natürlich-sprachlichen Bedienung, den Apple erfolgreich etabliert hat, wird somit aufgeholt und der Fahrer kann mit seinem Auto sprechen, als würde er mit seinem Nachbarn auf dem Beifahrersitz kommunizieren. Bei der Entwicklung orientieren wir uns an den aktuellen Trendgebern und berücksichtigen jedoch die automobilspezifischen Randbedingungen wie z.B. der Reduktion der Fahrerablenkung während der Fahrt.

Mitmachen! Vorschläge, Wünsche, Anregungen?

So, nun habe ich genug über die Sprachbedienung von gestern, heute und der Zukunft philosophiert. Zum Abschluss meines Beitrags möchte ich noch einen kleinen Aufruf starten.

Habt ihr Lust, die Sprachbedienung in unseren Fahrzeugen selbst mitzugestalten?

Denn um einem Auto noch mehr Persönlichkeit zu verleihen und den Spaß an der Bedienung des Autos per Sprache zu steigern, suche ich für die Sprachbedienung der Zukunft noch nette, witzige oder freche Dialoge, die man mit dem Auto führen könnte – und da kommt ihr ins Spiel!

Was würdet ihr euer Auto fragen wollen? Über welche Themen würdet ihr mit eurem Fahrzeug gerne sprechen? Und welche Antworten würdet ihr darauf erwarten?

  • Fahrer: „Hey Mercedes, wo gibt’s die besten Burger in Stuttgart?“
  • Mercedes: „Laut den Yelp-Bewertungen gibt es den besten Burger in…“
  • Fahrer: „Mercedes, lass uns zusammen shoppen gehen.“
  • Mercedes: „Gerne, die Rechnung bezahlst aber du. Wo sollen wir denn hinfahren?“
  • Fahrer: „Wie steht’s gerade beim VfB?“
  • Mercedes: „Frag lieber nicht…“

Teilt mir durch eure Kommentare eure Ideen mit und nehmt aktiv an der Entwicklung der Mercedes-Benz-Sprachbedienung teil.


Wie bewerten Sie diesen Artikel?
Bisher keine Bewertungen.
Bitte warten...

Tags: , , ,

drucken

Wollen Sie wirklich das Internet ausdrucken?

Sparen Sie Papier und schonen Sie die Umwelt! Nutzen Sie die Funktionen zum Bookmarking oder zur E-Mail-Weiterleitung.

Ihre Daimler AG

Erst wenn Sie klicken, wird die Schaltfläche aktiv und stellt eine direkte Verbindung mit dem jeweiligen sozialen Netzwerk her. Hierdurch werden Daten an das jeweilige soziale Netzwerk übertragen. Bitte lesen Sie unsere Datenschutzhinweise.

Dieser Artikel wurde von geschrieben. Als Entwicklungsingenieur bei Daimler entwickelt er neue Sprachbedien-Konzepte für die zukünftige Sprachsteuerung der Mercedes-Benz Fahrzeuge.

Lernen Sie weitere Autoren kennen oder lesen hier mehr über das Blog.

Die letzten 5 Kommentare

  1. One day without cash

    QiQi: Right, it’s not Fantasy world but daily life in China ! I was very surprised with...

  2. Good News: 5 Jahre „Film ohne Grenzen“

    Carsten: Liebe Kerstin, danke für deinen Beitrag – der macht mir richtig Lust auf die Filme!

  3. CAR Talk: Meine Auto-Rede-Fahrt mit Zetsche und Brecht

    Matthias Gröber: Lieber Stefanos. Ein super witziges Bewerbungsvideo und eine tolle Nachlese hier...

  4. Stephanie & Frank: Hochzeit mit S-Klasse

    Julien Christ - Hochzeitsfotograf Würzburg: Tolle Story :) Hat bestimmt riesigen Spaß gemacht.

  5. Kinderzimmerheld: Verbeulte Liebe

    Markus: Da sind einige dabei, bei denen ich bis heute der Überzeugung war, dass natürlich nur ICH...