IUI Logo

Automotive IUI


Die nachfolgend aufgeführten Dissertationen werden aktuell innerhalb der Automotive IUI Gruppe durchgeführt oder wurden innerhalb dieser abgeschlossen.

Robert Neßelreath: „An open platform for the model-based development of dialogue applications with distributed input and output in cyber-physical systems“

Cyber-Physical systems integrate computational elements into the physical world. An increasing number of interconnected human-computer interfaces, sensors and actuators in the intelligent environment enable new HCI concepts supporting multimodal distributed input and output.

The major contribution of the dissertation is the SiAM dialogue platform (SiAM-dp) that contains a fully tool-supported development environment for multimodal dialogue applications with high flexibility in the mode and number of connected devices. A model-based approach supports the rapid creation of new multimodal user interfaces independently from the domain and applied devices.

Introducing smart and modern interaction concepts requires a system that supports both the information from various input modalities as well as the description of physical acts. Additionally the actual context of the dialogue, participants, and the environment can provide valuable information for the resolution of uncertain, missing, or implicitly given content or can influence the course of the further interaction. The thesis analyzes how the semantic representation of knowledge, user intentions, and events can be exploited for the fusion of multimodal user input, physical acts, and context knowledge.

A further contribution of the thesis is the development of strategies for the situation dependent selection of adequate output devices and distribution of output acts.

M. Mehdi Moniri: „Real-Time Multimodal Reference Resolution in Indoor and Outdoor Environments“

In Rahmen der Dissertation von Herrn Mohammad Mehdi Moniri werden Algorithmen und Methoden für die Fahrerüberwachung, Fahrzeugpositionierung und Fusionierung von verschiedenen Sensor-Quellen entwickelt. Mit Hilfe dieses Systems wird es möglich sein, genau zu bestimmen, welche Objekte für den Fahrer wie lange sichtbar waren und wie lange das jeweilige Objekt die Aufmerksamkeit des Fahrers auf sich gezogen hat. Dieser Forschungsprototyp zielt darauf ab, eine deutliche Erhöhung der Sicherheit der Verkehrsteilnehmer sowie eine Verbesserung der Benutzerfreundlichkeit von Infotainment-Systemen zu erreichen.

Catalin Barbu: „Facilitation of Learning-While-Choosing as a Form of Choice Support“

Within computer science, many approaches to supporting choice and decision making have been developed, but one strategy has been almost entirely neglected: Given that many choices that people make are faced repeatedly, it makes sense not only to help a person make the choice that they are currently facing but also to learn how to make such choices better over time. Pursuing this strategy requires the development of forms of interaction and algorithms that are complementary to those that are already widespread. In his thesis, Catalin-Mihai Barbu is formulating a theoretical basis for this approach, building on the conceptual framework of “choosability engineering” being developed at DFKI by Dr. Anthony Jameson. He is instantiating this framework with choice support systems that represent various ways of supporting “learning while choosing”.

Sandro Castronovo (2013): „Das Pull Pardigma : Grundlagen benutzerzentrierter Fahrerassistenzsysteme basierend auf bidirektionaler Fahrzeug-zu-X Kommunikation“

In dieser Doktorarbeit werden Anwendungen für Fahrzeug Ad-hoc Netzwerke erarbeitet, die weit über die derzeit etablierten Bereiche der Fahrsicherheit und Verkehrseffizienz hinausgehen. Das Ad-hoc Netzwerk wird dabei als dynamische Informationsressource angesehen, die jedem Fahrzeug zu jedem Zeitpunkt zur Verfügung steht. Im Gegensatz zum derzeitigen Stand der Forschung geht das vorgestellte Pull Paradigma vom Fahrzeug des Benutzers und nicht von der Informationsquelle aus, z.B. einem bremsenden Fahrzeug. Für den Zugriff auf Informationen aus hochdynamischen Ad-hoc Netzen, spielen bidirektionale Kommunikation, Informationssuche und -rücktransport eine entscheidende Rolle. Im Verlauf der Arbeit wird deshalb die Anwendbarkeit des Pull Paradigmas auf etablierte Fahrzeug Ad-hoc Netze untersucht und fehlende Aspekte identifiziert. Es zeigt sich, dass eine Reihe an Erweiterungen auf fast allen Ebenen des Netzwerkstapels nötig sind damit die bestehende Technologie um das Pull Paradigma erweitert werden kann. Zentraler Punkt hierbei sind zwei neuartige Algorithmen zur Informationsverwaltung und -verbreitung in Ad-hoc Netzwerken die zunächst abstrakt aus Sicht der Graphentheorie formuliert werden. Mit Hilfe der gewonnenen Erkenntnisse wird PADE, eine Plattform zur Entwicklung von Anwendungen für Fahrzeug Ad-hoc Netze, entwickelt. Die entworfenen Algorithmen werden dann als Routingverfahren im Netzwerkstapel realisiert, in diesen integriert und auf großflächigen Stadtszenarien im Simulator evaluiert. Des Weiteren vereint PADE echte'' und simulierte Kommunikationstechnologien und abstrahiert von diesen, sodass Anwendungen mit minimalem Aufwand vom Labor in ein Testfahrzeug überführt werden können. Um dieses ambitionierte Ziel zu erreichen, wird auf einer Reihe bereits bestehender Simulations- und Kommunikationstechnologien aufgebaut. Die praktische Anwendbarkeit des Pull Paradigmas wird anschließend in zwei Demonstratoren implementiert und in ein BMW 5er Testfahrzeug integriert. Das Präsentationsmodul der PADE Plattform wurde im derzeit weltgrößten Feldversuch für Fahrzeug Ad-hoc Kommunikation von über 400 Fahrern in 120 Fahrzeugen im Alltag getestet.

Christoph Endres (2012): „PRESTK : situationsbewusste Präsentation von Nachrichten und Infotainment-Inhalten für Fahrer“

In den letzten Jahren hat die Menge der informationsanzeigenden Systeme im Auto drastisch zugenommen. Da sie potenziell unabhängig voneinander ablaufen, erhöhen sie die Gefahr, die Aufmerksamkeit des Fahrers abzulenken. Konflikte entstehen, wenn zwei oder mehr Systeme zeitgleich auf limitierte Ressourcen wie z. B. den Bildschirmplatz zugreifen. Ein erster Schritt, diese Konflikte zu vermeiden, ist die Orchestrierung dieser Systeme mittels Techniken aus dem Bereich Scheduling und Präsentationsplanung. In einem zweiten Schritt sollte die kognitive Kapazität des Fahrers als ebenfalls limitierte Ressource berücksichtigt werden.

Der Algorithmus, den ich zu Schritt 1 vorstelle und evaluiere, erfüllt alle diese Anforderungen. Zu Schritt 2 definiere ich das Konzept System Situation Awareness (SSA), basierend auf Endsley’s Konzept der Situation Awareness (SA). Dadurch wird erreicht, dass nicht nur der Fahrer sich seiner Umgebung bewusst ist, sondern auch das System (d.h. das Auto). Zu diesem Zweck m¨ussen zwei Bereiche untersucht werden:

  1. Die kognitive Belastbarkeit des Fahrers unaufdringlich ermitteln. Dazu schlage ich ein Modell vor, das auf Umgebungsinformationen basiert.
  2. Ein weiteres Modell soll die Komplexität der präsentierten Informationen bestimmen.

Drei Experimente stützen die Behauptungen in meinem konzeptuellen Beitrag. Ein Prototyp des situationsbewussten Präsentationsmanagement-Toolkits PresTK wird vorgestellt und in zwei Demonstratoren gezeigt.

Michael Feld (2011): „A Speaker Classification Framework for Non-intrusive User Modeling: Speech-based Personalization of In-Car Services“

1. Gutachter: Prof. Dr. Dr. h.c. mult. Wolfgang Wahlster
2. Gutachter: Prof. Dr. Bernd Möbius

Die Sprecherklassifikation, also die automatische Erkennung bestimmter Merkmale einer Person anhand ihrer Stimme, besitzt eine Vielzahl von Anwendungsmöglichkeiten in der modernen Computertechnik und Künstlichen Intelligenz: Als nicht-intrusive Wissensquelle für die Benutzermodellierung kann sie zur Personalisierung in vielen Bereichen eingesetzt werden. In dieser Dissertation wird ein fundierter Ansatz zum Entwurf eines neuartigen Sprecherklassifikationssystems zur automatischen Bestimmung von Alter und Geschlecht vorgestellt, welches diese Anforderungen erfüllt. Ausgehend von Literaturstudien werden Konzepte und Methoden zur Behandlung des zugrunde liegenden Mustererkennungsproblems entwickelt, welche zu einer inkrementell arbeitenden GMM-SVM-Supervector-Architektur mit diversen Optimierungen führen. Eine umfassende datengetriebene Experimentalreihe dient der Erforschung des Parameterraumes und zur Evaluierung der Komponente. Weitere Studien untersuchen die Sprachunabhängigkeit des Ansatzes. Als wesentlicher Bestandteil der Arbeit wird ein Framework entwickelt, das alle im Zusammenhang mit Entwurf und Evaluierung von Sprecherklassifikation anfallenden Aufgaben in einer integrierten Entwicklungsumgebung implementiert, welche effiziente Laufzeitmodule für verschiedene Plattformen erzeugen kann. Anwendungen aus dem Automobilbereich und weiteren Domänen demonstrieren den praktischen Nutzen der Technologie zur Personalisierung, z.B. indem die Vorlaufzeit von lokalen Gefahrenwarnungen für ältere Fahrer erhöht wird.

Christian Müller (2005): „Zweistufige kontextsensitive Sprecherklassifikation am Beispiel von Alter und Geschlecht“

In der vorliegenden Dissertation wird ein zweistufiger Ansatz zur Sprecherklassifikation am Beispiel Alter und Geschlecht vorgestellt. Dazu werden zunächst die Ergebnisse umfangreicher Korpusanalysen präsentiert, die als Referenzbasis humanwissenschaftlicher Studien geeignet sind. Es wird gezeigt, dass die Modelle, die mithilfe dieser Daten trainiert wurden, in der Lage sind, die genannten Sprechereigenschaften mit einer Genauigkeit zu erkennen, die teilweise das Fünffache des jeweiligen Zufallsniveaus beträgt. Darüber hinaus zeichnet sich der vorgestellte Ansatz vor allen Dingen durch die sogenannte Zweite Ebene aus, auf der mithilfe von Dynamischen Bayes'schen Netzen eine Fusion multipler Klassifikationsergebnisse unter Berücksichtigung des auditiven Kontextes erfolgt. In der Arbeit wird außerdem ein konkretes Sprecherklassifikationssystem beschrieben, welches für das Anwendungsszenario von mobilen, sprachbasierten Dialogsystemen entwickelt worden ist.