DE EN

Talk to me!

Im zweiten Teil unserer Artikelserie „Einblicke bei Audi“ berichten Doreen Engelhardt, Entwicklerin Innovationen Bedienung, und die Computerlinguistin Manya Sahakyan über ihre Arbeit bei der Marke mit den vier Ringen. Zusammen haben sie die neue, intelligente Sprachsteuerung des Audi A8 in wesentlichen Zügen entwickelt. Im Interview erläutern sie, wie die Gesprächsführung im A8 funktioniert, welche Stärken sie hat und wie die Zukunft der Sprachsteuerung aussieht.

Der neue Audi A8 ist ein guter Zuhörer und ein intelligenter Gesprächspartner
Der neue Audi A8 ist ein guter Zuhörer und ein intelligenter Gesprächspartner

Manya, Doreen, was reizt euch am Thema Sprachbedienung?

Manya Sahakyan: Ich war schon früh an Sprachen und Mathematik interessiert. 2001 habe ich an der Uni Stuttgart mein Diplom  in Computerlinguistik gemacht, mit dem Schwerpunkt Automatische Spracherkennung. Wir waren damals eine kleine Gruppe Vertreter einer noch unbekannten Technologie im KI Bereich, die sich den Respekt der Anderen erst erarbeiten musste.

Doreen Engelhardt: Ich habe an der TU Ilmenau Angewandte Medienwissenschaften studiert – einen der ersten Studiengänge, die Technik mit Mensch-/Maschine-Kommunikation verbunden haben. 2009 habe ich bei der Volkswagen-Konzernforschung meine Diplomarbeit über Sprachdialogsysteme geschrieben. Auch damals noch war das Thema ziemlich unpopulär. Gereizt hat mich vor allem das unglaubliche Potenzial der Technologie, eine natürliche Interaktion mit Nutzern zu ermöglichen und zu erschaffen.

Manya Sahakyan und Doreen Engelhardt
Manya Sahakyan (l.) und Doreen Engelhardt

Doreen, du bist Spezialistin für das Konzept. Manya, du bist Expertin für seine Umsetzung. Wie habt ihr euch kennen gelernt?

Manya Sahakyan: Als ich 2012 zu Audi gegangen bin, habe ich mich dort mit der Einführung der SLM-Technologie beschäftigt, bei der es um statistische Sprachmodelle geht. Sie bildet den Grundstein für die natürlichsprachliche Bedienung, die wir 2015 mit der zweiten Generation des Audi Q7 in Serie gebracht haben – in enger Zusammenarbeit mit Doreen und ihrem Team, das die Konzepte und die Serienintegration verantwortet.

Doreen Engelhardt: Bei den Autos zuvor musste der Benutzer noch fixe Kommandos sprechen, der Ablauf war starr. Im Q7 haben wir als erster europäischer Automobilhersteller die Natürlichsprachlichkeit umgesetzt - der Benutzer kann mit dem Auto fast genauso reden, wie im Alltag, wie z.B. : „Fahr mich nach Köln zum Marriott Hotel“, „Ich muss nach Berlin in die Bodestraße 3“ oder "Ich will nach Hause".

Was kann er da alles sagen?

Doreen Engelhardt

Doreen Engelhardt verbrachte schon vor dem Abitur ein Jahr an einer US-Highschool in Milwaukie/Oregon. An der TU Ilmenau studierte sie Angewandte Medienwissenschaften, inklusive eines Semesters in Manila auf den Philippinen. Bei der Volkswagen-Konzernforschung schrieb sie ihre Diplomarbeit über Sprachdialogsysteme der Zukunft.

Von 2009 bis 2013 arbeitete Doreen Engelhardt in der Technischen Entwicklung von Audi als Beraterin für User Experience, 2013 wurde sie für die Konzepte und Serienintegration Sprachbedienung zuständig.


Seit 2017 arbeitet sie in der frühen Phase im Bereich Innovationen für User Interface und User Experience.

Manya Sahakyan: Im neuen Audi A8 umfasst die Sprachbedienung mit rund 200 Funktionen die Bereiche Navigation, Telefon, Medien, Radio, Klima und die Online-Dienste von Audi connect. Wenn man ein Restaurant in der Nähe sucht, genügt es zu sagen: „Ich habe Hunger.“ Wenn man einen bestimmten Kontakt anrufen will, kann man sagen: „Ich würde gern mit Michael telefonieren“ oder „Ruf‘ Michael an“. Wenn man die Klimaanlage bedienen will, sagt man vielleicht: „Stell‘ die Temperatur bitte auf 21 Grad ein.“ Und wenn einen der Wetterbericht interessiert, kann man fragen: „Wie wird das Wetter morgen in Stuttgart?“ Pro Funktion sind bis zu 300 unterschiedliche Variationen möglich.

Und wie funktioniert das?

Doreen Engelhardt: Sehr vereinfacht gesagt, wandeln wir die gesprochenen Phrasen in kleine Datensätze um und schicken sie an eine Erkennungs-Software. Allein im Telefonbereich gibt es 300 Phrasen, die erkannt werden, sogar den Satz: „Ich hab‘ Lust, mit Michael zu quatschen.“ Die Antworten werden wieder als Sprache ausgegeben. Die große Innovation im neuen A8 ist, dass wir auf zwei Wegen vorgehen – mit einer Onboard-Erkennung wie bisher und, ganz neu, online in der Cloud.  Diese hybride Lösung hat viele Vorteile. Die Onboard-Erkennung funktioniert auch dann, wenn das Auto keine Verbindung ins Mobilfunknetz hat, beispielsweise beim Losfahren in einer Tiefgarage. Die Cloud-Erkennung kann natürlich auf ein größeres Wissen zurückgreifen.

Manya Sahakyan

Manya Sahakyan kam als 21-jährige aus ihrem Heimatland Armenien nach Deutschland. 2001 schloss sie an der Universität Stuttgart einen Diplom-Studiengang Computerlinguistik ab.

Ihre berufliche Laufbahn startete sie bei Philips Speech Processing in Aachen (später Nuance). Bevor Manya Sahakyan 2012 zu Audi wechselte, war sie als Beraterin für Volkswagen tätig.

In Ingolstadt arbeitet sie innerhalb der Entwicklung der natürlichsprachlichen Sprachverarbeitung (NLU) vor allem an statistischen Sprachmodellen (SLM)

Manya Sahakyan: Eine ganz wichtige Neuerung im Konzept ist der Dialogmanager. Das ist eine Software, die die Ergebnisse, die von onboard und online kommen, permanent miteinander abgleicht, indem sie die Wahrscheinlichkeitswerte betrachtet, mit denen die Resultate versehen sind.

Eine weitere Stärke der Sprachbedienung im neuen A8 ist die Fähigkeit zum Dialog…

Doreen Engelhardt: Wir wollen, dass sich der Fahrer bei der Bedienung der Funktionen mit Sprache weiterhin auf das Fahren konzentriert und so wenig wie möglich auf das Display blickt. Deswegen bieten wir ihm für jeden Kontext einen Dialog an, der ihn rasch zu einer Lösung führt. Wenn ich zum Beispiel sage „Ruf‘ Michael an“ und das System drei Personen kennt, die so heißen,  wird es mir per Sprachausgabe denjenigen Michael vorschlagen, mit dem ich am häufigsten telefoniere.

Und was ist im Dialog noch alles möglich?

Doreen Engelhardt: Der Benutzer kann dem System ins Wort fallen, er kann bis zu einem gewissen Punkt nachfragen, er kann seine Ansage nachträglich ergänzen oder sich verbessern: „Anrufen bei Thomas Müll… äh, Schmidt.“ Bei der Zieleingabe kann er die Stadt, die Straße und die Hausnummer in beliebiger Reihenfolge nennen, das bringt sehr viel Komfort. Und er kann einen Kontakt anrufen und sich dann zu ihm navigieren lassen – alles per Sprachbedienung, ohne dass er einen Bedienschritt von Hand machen muss.

Ist das, speziell beim Dialogmanager, schon Künstliche Intelligenz?

Manya Sahakyan: Spracherkennung gehört zur KI, auch wenn wir noch immer regelbasiert vorgehen. Der nächste Schritt wird Machine Learning sein, dafür entwickeln wir gerade die Bausteine. Schon jetzt würde ich sagen, dass unsere Spracherkennung  in ihrem jeweiligen Kontext auf Augenhöhe mit Google, Apple und Amazon ist. In der Automobilindustrie haben wir auf alle Fälle die Vorreiterrolle inne, und das ist schon eine tolle Sache. Hier bei Audi kann ich jetzt alles Wissen anwenden, das ich mir im Lauf des Studiums und meiner Karriere erarbeitete habe. Mir macht es einfach sehr viel Spaß, in einem solch starken Team bei Audi arbeiten zu können.

Was wird die Zukunft der Sprachbedienung sein?

Doreen Engelhardt: Meine Vorstellung ist ein Sprachdialogsystem, das das Auto zu einem perfekten Assistenten macht, das für jede Situation und jede Aufgabe die passende Lösung kennt. Da spielt dann Künstliche Intelligenz eine zentrale Rolle – das System muss die Wünsche des Kunden intelligent antizipieren und die Antworten aus vielen verschiedenen Quellen kombinieren. Ein Schritt dorthin könnte ein System sein, das für einen Kunden, der viele Termine hat, die perfekte Routenplanung zusammenstellt, inklusive Tanken oder Stromladen.

---

Bei Audi warten jede Menge spannender Jobs auf dich. Eine kleine Auswahl stellen wir dir in unserer Serie „Einblicke bei Audi“ vor:

Teil 1: James Garrett, Leiter Recruiting, zum HR-Arbeitsalltag mit Tipps für Bewerber
Teil 3: Alexander Juling, Projektleiter Elektronische Fahrwerksplattform (EFP), über die Grenzen der Physik
Teil 4: Anne Greul, Doktorandin Innovationsmanagement, über eine neue, radikalere Definition des Begriffs Mobilität
Teil 5: Alessandro Monaci, Mitarbeiter Qualitätssicherung, zum Testcenter für Hochvolt-Trakionsbatterien
Teil 6: Christina Freitag, Danijela Vasic und Projektleiter Matthias Tauber über die neue myAudi App
Teil 7: Dr. Günther Mendl, Leiter Entwicklung E-Traktion/Hochvoltsysteme, zur E-Mobilität bei Audi 
Teil 8: Stefan Angermüller, Experte für die intelligente Vernetzung von Anlagen auf Datenbasis
​​​​​​​
Teil 9: Ming Zhu und Haiwei (Odin) Bai, Senior Research Analysten von Audi Innovation Research in Beijing

Become a careerloft member and apply for the online Scholarship Program

Benefit from attractive support services and make valuable contacts with top international employers! At careerloft you’ll be able to find the perfect job and employer for you.

Register for free Icon careerloft Icon arrows