15
Fejmozgás alapú gesztusok felismerése Bertók Kornél, Fazekas Attila Debreceni Egyetem, Informatikai Kar Debreceni Képfeldolgozó Csoport KÉPAF 2013, Bakonybél 2013. január 29 – február 1.

Fejmozgás alapú gesztusok felismerése

Embed Size (px)

DESCRIPTION

Fejmozgás alapú gesztusok felismerése. Bertók Kornél, Fazekas Attila Debreceni Egyetem, Informatikai Kar Debreceni Képfeldolgozó Csoport KÉPAF 2013, Bakonybél 2013. január 29 – február 1. Bevezetés. Gesztusfelismerő rendszer Tudatos fejmozgások, mint mozdulatsorok felismerése - PowerPoint PPT Presentation

Citation preview

Page 1: Fejmozgás alapú gesztusok felismerése

Fejmozgás alapú gesztusok felismerése

Bertók Kornél, Fazekas AttilaDebreceni Egyetem, Informatikai Kar

Debreceni Képfeldolgozó Csoport

KÉPAF 2013, Bakonybél2013. január 29 – február 1.

Page 2: Fejmozgás alapú gesztusok felismerése

Bevezetés

Fejmozgás meghatározása

Fejmozgás detektálása

Fejmozgás iránya

Gesztus-felismerés

Gesztus adatbázis

DTW

Eredmények

KÉPAF 2013Bakonybél

2

Bevezetés

• Gesztusfelismerő rendszer– Tudatos fejmozgások, mint

mozdulatsorok felismerése– Valósidejű felismerés kameraképeken– Kis számú adat alapján

• Gesztus definiálása– Hatékony reprezentáció: térben és

időben• Gesztus adatbázis

– Rögzítés és elemzés– Felismerés javítása

Page 3: Fejmozgás alapú gesztusok felismerése

Bevezetés

Fejmozgás meghatározása

Fejmozgás detektálása

Fejmozgás iránya

Gesztus-felismerés

Gesztus adatbázis

DTW

Eredmények

KÉPAF 2013Bakonybél

3

Fejmozgás meghatározása

• Milyen jellegű gesztusokat szeretnénk felismerni?– Tudatos mozgás: 2-3 sec hosszúságú– Mozdulatok eltérő ütemben történő

végrehajtása• Fejmozgás behatárolása térben és

időben– MHI reprezentáció: időtől függő

sablon, ahol minden egyes pixel értéke a fejmozgás egy függvényeke

Page 4: Fejmozgás alapú gesztusok felismerése

Bevezetés

Fejmozgás meghatározása

Fejmozgás detektálása

Fejmozgás iránya

Gesztus-felismerés

Gesztus adatbázis

DTW

Eredmények

KÉPAF 2013Bakonybél

4

Fejmozgás detektálása

• MHI: képszekvencia mozgó objektumainak változásait írja le– Több egymást követő képkockán keresztül– Maszk: azokat a régiókat jelöli ki, ahol

mozgás volt az adott időpillanatban ()– Ahol mozgás volt, ott az összes pixel

értéket vesz fel,– A többi fokozatosan elhalványul, majd

törlődik.

Page 5: Fejmozgás alapú gesztusok felismerése

Bevezetés

Fejmozgás meghatározása

Fejmozgás detektálása

Fejmozgás iránya

Gesztus-felismerés

Gesztus adatbázis

DTW

Eredmények

KÉPAF 2013Bakonybél

5

Fejmozgás iránya

• MHI mozgás gradiens, fejpozíció megváltozásának iránya– Nem elég stabil, kicsi az arc felbontása

• Feladat: a mozgás tekintetében hasznos régiók meghatározása– FAST sarokdetektor

• Véges számú jellemzőpont az eredménye• Eredményét korlátozzuk az arcra

Page 6: Fejmozgás alapú gesztusok felismerése

Bevezetés

Fejmozgás meghatározása

Fejmozgás detektálása

Fejmozgás iránya

Gesztus-felismerés

Gesztus adatbázis

DTW

Eredmények

KÉPAF 2013Bakonybél

6

Fejmozgás iránya

• Optikai áramláshoz tartozó vektorok kiszámítása– FAST jellemzőpontok alapján, az

aktuális és a következő képkocka között

• Fejmozgás iránya: n db optikai folyam vektor számtani közepe– Irányszög: a vektornak az y tengely

pozitív oldalával bezárt szöge– Probléma: túl sok lehetséges érték a

[0,2] intervallumból– Megoldás: csoportosítsuk a szögeket

Page 7: Fejmozgás alapú gesztusok felismerése

Bevezetés

Fejmozgás meghatározása

Fejmozgás detektálása

Fejmozgás iránya

Gesztus-felismerés

Gesztus adatbázis

DTW

Eredmények

KÉPAF 2013Bakonybél

7

Fejmozgás iránya

Fejmozdulat értéke szögben. A teljes szögnek egy tizenhatodába sorolva.

Page 8: Fejmozgás alapú gesztusok felismerése

Bevezetés

Fejmozgás meghatározása

Fejmozgás detektálása

Fejmozgás iránya

Gesztus-felismerés

Gesztus adatbázis

DTW

Eredmények

KÉPAF 2013Bakonybél

8

Gesztusfelismerés

• Gesztus időbeli szegmentálása– MHI átlagintenzitás alapján

• Szegmens– Képkockák sorozata– Alacsony átlagintenzitással a

szekvencia elején és végén• Gesztus

– Szekvencia szomszédos tagjaira számított szögek sorozata

– {"fejrázás"; [90°,90°,90°,270°,270°,225°,135°]}

Page 9: Fejmozgás alapú gesztusok felismerése

Bevezetés

Fejmozgás meghatározása

Fejmozgás detektálása

Fejmozgás iránya

Gesztus-felismerés

Gesztus adatbázis

DTW

Eredmények

KÉPAF 2013Bakonybél

9

Gesztusadatbázis

• A mozdulatok eltérő ütemben kerülnek végrehajtásra

• Komplexebb döntések hozatala• Gesztus adatbázis

– Szögsorozatok gyűjteménye– Csoportok: egy gesztushoz, több

sorozat• Felismerés javítása

– Menet közben felvesszük a felismert gesztusokat az adatbázisba

– Igazodás a felhasználói szokásokhoz

Page 10: Fejmozgás alapú gesztusok felismerése

Bevezetés

Fejmozgás meghatározása

Fejmozgás detektálása

Fejmozgás iránya

Gesztus-felismerés

Gesztus adatbázis

DTW

Eredmények

KÉPAF 2013Bakonybél

10

Dinamikus idővetemítés

• A képszekvencia szegmenseihez számított szögsorozatot DTW segítségével illesztjük az adatbázis elemeihez– Felismert gesztus: átlagosan a

legkisebb távolság• DTW (din. idővetemítés)

– nD vektor illesztése egy mD vektorhoz

– Táblázat: (0,0)-ból eljutni (n,m)-be– Lépésenként hasonlítja össze a

mintákat– Cél: távolság minimalizálása

Page 11: Fejmozgás alapú gesztusok felismerése

Bevezetés

Fejmozgás meghatározása

Fejmozgás detektálása

Fejmozgás iránya

Gesztus-felismerés

Gesztus adatbázis

DTW

Eredmények

KÉPAF 2013Bakonybél

11

Dinamikus idővetemítés

Két eltérő ütemben elvégzett fejrázás gesztus illesztése egymáshoz. A lineáris illesztést a koordináta-rendszer (0,0) pontjából induló és (18,14) pontjában végződő átló jelentené. Az optimális nem lineáris illesztést a kék törött vonal jelzi.

Page 12: Fejmozgás alapú gesztusok felismerése

Bevezetés

Fejmozgás meghatározása

Fejmozgás detektálása

Fejmozgás iránya

Gesztus-felismerés

Gesztus adatbázis

DTW

Eredmények

KÉPAF 2013Bakonybél

12

Eredmények

• Minimális gesztushossz: >1 sec– A rövid gesztusok nem illeszkednek a

kicsit hasonlókra• Maximális gesztushossz

– ~5 sec, 30 FPS mellett: 150 hosszúságú szögsorozatok, mint gesztusok

– Mintavételezés csökkentése a harmadára• Főbb mozgáskomponensek

megmaradnak

• Maximális DTW hiba– Gesztusok közötti távolság– Empirikus úton. DTW távolság < 15

Page 13: Fejmozgás alapú gesztusok felismerése

Bevezetés

Fejmozgás meghatározása

Fejmozgás detektálása

Fejmozgás iránya

Gesztus-felismerés

Gesztus adatbázis

DTW

Eredmények

KÉPAF 2013Bakonybél

13

Eredmények

Fejrázás Bólintás Körkörös mozgás

0

10

20

30

40

50

42

27

10

43

32

9

45

33

6

5 db 10 db 15 db

Átl

agos

DTW

távols

ág

Az osztályonkénti átlagos DTW távolság 20 darab körkörös fejmozgásra. Látható, hogy javul a DTW szeparáló teljesítménye, ha bizonyos határok között növeljük az egyes osztályok számosságát.

Page 14: Fejmozgás alapú gesztusok felismerése

Bevezetés

Fejmozgás meghatározása

Fejmozgás detektálása

Fejmozgás iránya

Gesztus-felismerés

Gesztus adatbázis

DTW

Eredmények

KÉPAF 2013Bakonybél

14

Demó videó

Page 15: Fejmozgás alapú gesztusok felismerése

Köszönöm a figyelmet!