31
Multimodale Interfaces Jonas Tappolet, Domenic Benz

Multimodale Interfaces

  • Upload
    ted

  • View
    50

  • Download
    0

Embed Size (px)

DESCRIPTION

Multimodale Interfaces. Jonas Tappolet, Domenic Benz. Inhalt. Basics Definition multimodal interface Verschiedene Typen Designprinzipien Beispiel MATCH. Interface: Zweck. Kommunikation zwischen Mensch und Maschine. Human-Machine-Interface (HMI). Anwendungsbereiche - PowerPoint PPT Presentation

Citation preview

Page 1: Multimodale Interfaces

Multimodale Interfaces

Jonas Tappolet, Domenic Benz

Page 2: Multimodale Interfaces

Inhalt

Basics Definition multimodal interface Verschiedene Typen Designprinzipien Beispiel MATCH

Page 3: Multimodale Interfaces

Interface: Zweck

Kommunikation zwischen Mensch und Maschine

Page 4: Multimodale Interfaces

Human-Machine-Interface (HMI)

AnwendungsbereicheMensch und Maschine lösen Aufgabe

gemeinsam (Interaktion)Maschine löst Aufgabe selbständig, Mensch

überwachtMensch löst Aufgabe selbständig, Maschine

überwacht (-> Assisted Living)

Page 5: Multimodale Interfaces

Human-Machine-Interface (HMI)

Gedanken, Emotionen,interne Verarbeitung

Information

Daten

Sinnesorgane (Ohren, Augen, Nase...)Aktionen (Sprechen, Bewegung…)

Interne Verarbeitung

Information

Daten

Sensoren (Kamera, Mikrofon…)Aktoren (Lautsprecher, Bildschirm…)

Austausch physikalischer Signale

Mensch Maschine

Page 6: Multimodale Interfaces

Warum neue Arten der Interaktion?

Maus & Tastatur ist „Präferenz“ der Maschine, nicht intuitiv

Verschiedene Situationen erfordern unterschiedliche Interaktionsmöglichkeiten

Menschen mit Behinderungen brauchen ein Interface das mit den ihnen zur Verfügung stehenden Mittel bedienbar ist

Page 7: Multimodale Interfaces

Komponenten der natürlichen menschlichen Kommunikation Sprache (Grundkommunikation) Gestik (Verdeutlichen, Untermalen) Mimik (Emotionen) Blickrichtung (Emotion, Kontrolle) Lautstärke, Tonfall (Emotion) Lippenbewegung (Kontrolle) Gerüche (?, Emotion) Haptik (Berührungen, Emotionen)

Page 8: Multimodale Interfaces

Ziele eines HMI

Das Interface muss entsprechend der Anwendung ausgelegt sein

Möglichst intuitive Kommunikation des Menschen mit der Maschine

Verwischen der Unterschiede zwischen Mensch-Mensch und Mensch-Maschine Kommunikation

Page 9: Multimodale Interfaces

Gestenerkennung

Funktionsweise: Aufnahme von Gesten mithilfe einer Kamera und Erkennung der Geste mithilfe von SoftwarePro: - Technologie vorhanden- Fordert nicht volle Aufmerksamkeit des Anwenders

Contra:- Erkennungsgeste zum aktivieren des Systems- Eingeschränkter Aktionsbereich

Page 10: Multimodale Interfaces

Video: Gestenerkennung

Quelle: TU München, Lehrstuhl für Mensch-Maschine-Kommunikation,http://www.mmk.ei.tum.de/demo/carvis/carvis.avi

Page 11: Multimodale Interfaces

Spracherkennung

Funktionsweise: Aufnahme von gesprochener Sprache und anschliessende Umwandlung in Steuerbefehle und Text.Pro: - Keine spezielle Hardware nötig (Mikrofon)- Natürlichste Form der menschlichen Kommunikation

Contra:- Umgebungsgeräusche / Andere Personen die

Sprechen behindern die Spracherkennung stark

Page 12: Multimodale Interfaces

BCI: Brain-Computer-Interface

Auswerten von elektrischer Hirnaktivität zur Erkennung von Befehlen die der Mensch „denkt“

Pro: - Direktverbindung, kein Umweg über ein verlustbehaftetes

Medium- Keine Codierung vom Menschen, nur Decodierung von der

Maschine.

Contra: - Datenschutz

- Lernbedarf seitens des Menschen?

Page 13: Multimodale Interfaces

Video: BBCI - Berlin Brain-Computer Interface

Zur Anzeige wird der QuickTime™ Dekompressor „mpeg4“

benötigt.

Quelle: Fraunhofer Institut Rechnerarchitektur und Softwaretechnik (FIRST), http://www.youtube.com/watch?v=yhR076duc8M

Page 14: Multimodale Interfaces

Probleme von einzelnen Interfaces

Jedes Interface hat spezifische Nachteile Das menschliche Gehirn hat mehr

Leistungsfähigkeit als ein einzelner Kommunikationskanal

Nicht für jeden Anwendungsbereich ist jedes Interface gleich gut geeignet

Page 15: Multimodale Interfaces

Multimodale Interfaces

Definition:

Multimodale Systeme verarbeiten zwei oder mehrere kombinierte

Benutzereingabemethoden wie Sprache, Stift, Berührung (Touchscreen), Gesten,

Blickrichtung oder Kopf- und Körperbewegung.

Page 16: Multimodale Interfaces

Vorteile Multimodaler Interfaces

Verbesserte Erkennung (z.B. Sprache und Lippenbewegung)

Schneller Intuitiv / Natürlich

Page 17: Multimodale Interfaces

Verschiedene Typen

Page 18: Multimodale Interfaces

Aktive Interfaces

Benutzer will aktiv mit System kommunizieren. Benutzer gibt explizite Kommandos an das

System. Klassische Interaktionsform

Befehl äussern

Befehl erfasstBefehl

ausführenDone

Auf Befehl warten

Ablauf:

Page 19: Multimodale Interfaces

Passive Interfaces

System soll Benutzer unterstützen, ohne dass er dies explizit anfordert.

System „überwacht“ Benutzer durch verschiedene Sensoren und erkennt gewisse Muster. Das System reagiert somit auf den Benutzer

und seine Umgebung. Mögliche Anwendung: Intelligente Räume

Page 20: Multimodale Interfaces

Passive Interfaces II

Schwierig zu implementieren

Kein Muster erkannt

Umgebung/User

überwachenXOR

Befehl (Muster) erkannt

Befehl ausführen

DoneAblauf:

Page 21: Multimodale Interfaces

Gemischte multimodale Interfaces

Vereinen mind. Einen aktiven und einen passiven Input.

Beispiel: Sprache und Lippenbewegung

Befehl erhalten

Befehl erfasst

Befehl ausführen

DoneAuf Befehl

warten

XORBefehl

(Muster) erkannt

V Inputs vergleichen

Inputs verglichen, Ergebnis erhalten

Umgebung/User

überwachenAblauf:

Page 22: Multimodale Interfaces

Zeitlich abgestufte Interfaces

Verarbeiten verschiedene Modalitäten, welche zeitlich aufeinander folgen.

Beispiel: Blick – Gestik – Sprache

Ablauf:Objekt mit

Blick fixierenObjekt

gewählt

Mit Hand an Ort zeigen

Ort gewählt

Kommando sprechen

Kommandoerfasst

Vollständigen Befehl

ausführenDone

Auf Input warten

Page 23: Multimodale Interfaces

Prinzipien für das Design von MM Interfaces

Page 24: Multimodale Interfaces

Synchronisation

MM Interface muss Mechanismen haben, welche garantieren, dass die verschiedenen Input-Streams korrekt miteinander verknüpft werden.

Beispiel: Point and Talk. Wichtigste Dimension bei Sprachinput ist die

Zeit. Bei visueller Interaktion: Raum.

Page 25: Multimodale Interfaces

Abschwächung/Anpassung I

MM Interfaces müssen analog der zwischenmenschlichen Kommunikation abschwächbar sein.

Beispiel: Telefongespräch. Wegfall aller visuellen Kommunikationsmittel.

Bei multimodalen Systemen:z.B. Veränderung der Umgebung

Page 26: Multimodale Interfaces

Abschwächung/Anpassung II

Zusätzliche (redundante) Modalitäten führen zu anpassungsfähigen Systemen.

Vorsicht bei sich gegenseitig ergänzenden Modalitäten

Sich verändernde Möglichkeiten beachten V.a. bei mobilen Systemen ist zu berücksichtigen,

dass sich die dem User zur Verfügung stehenden Möglichkeiten sehr schnell ändern können.

Page 27: Multimodale Interfaces

Gemeinsamer Status für verschiedene Modalitäten Wenn verschiedene Modalitäten für das

Ausführen einer Aktion eingesetzt werden, benötigen alle beteiligten Input-Streams einen gemeinsamen Interaktionsstatus.

Wichtig z.B. bei:Wechsel der ModalitätHistory Funktion

Page 28: Multimodale Interfaces

„Lost in space“ Problem

Verwirrung durch zu grosse Funktionalität Problem besteht bereits bei

herkömmlichen GUIs besteht das Problem.

Verschärfung des Problems durch zusätzliche Modalitäten.Benutzer mit intelligenten, angepassten

Dialogen führen.

Page 29: Multimodale Interfaces

Context Awareness

MM Interfaces sollten sich der Umgebung des Users anpassenBedürfnisse und Möglichkeiten des BenutzersDirekte Umgebung des BenutzersBandbreite

Page 30: Multimodale Interfaces

Beispiel MATCH

Multimodal Access To City Help (AT&T Labs 2001), Quelle: http://www.research.att.com/projects/MultimodalAccessToCityHelp/

Zur Anzeige wird der QuickTime™ Dekompressor „YUV420 codec“

benötigt.

Page 31: Multimodale Interfaces

Fragen?