14
Fejmozgás alapú gesztusok felismerése Bertók Kornél, Fazekas Attila Debreceni Egyetem, Informatikai Kar Debreceni Képfeldolgozó Csoport KÉPAF 2013, Bakonybél 2013. január 29 – február 1.

Fejmozgás alapú gesztusok felismerése

  • Upload
    carson

  • View
    37

  • Download
    6

Embed Size (px)

DESCRIPTION

Fejmozgás alapú gesztusok felismerése. Bertók Kornél, Fazekas Attila Debreceni Egyetem, Informatikai Kar Debreceni Képfeldolgozó Csoport KÉPAF 2013, Bakonybél 2013. január 29 – február 1. Bevezetés. Gesztusfelismerő rendszer Tudatos fejmozgások, mint mozdulatsorok felismerése - PowerPoint PPT Presentation

Citation preview

Page 1: Fejmozgás alapú gesztusok felismerése

Fejmozgás alapú gesztusok felismerése

Bertók Kornél, Fazekas AttilaDebreceni Egyetem, Informatikai Kar

Debreceni Képfeldolgozó Csoport

KÉPAF 2013, Bakonybél2013. január 29 – február 1.

Page 2: Fejmozgás alapú gesztusok felismerése

Bevezetés

Fejmozgás meghatározása

Fejmozgás detektálása

Fejmozgás iránya

Gesztus-felismerés

Gesztus adatbázis

DTW

Eredmények

KÉPAF 2013Bakonybél

2

Bevezetés

• Gesztusfelismerő rendszer– Tudatos fejmozgások, mint

mozdulatsorok felismerése– Valós időben, kis számú adat alapján

• Gesztus definiálása– Hatékony reprezentáció: térben és

időben– Valósidejű felismerés kameraképeken

• Gesztus adatbázis– Rögzítés és elemzés– Felismerés javítása

Page 3: Fejmozgás alapú gesztusok felismerése

Bevezetés

Fejmozgás meghatározása

Fejmozgás detektálása

Fejmozgás iránya

Gesztus-felismerés

Gesztus adatbázis

DTW

Eredmények

KÉPAF 2013Bakonybél

3

Fejmozgás meghatározása

• Milyen jellegű gesztusokat szeretnénk felismerni?– Tudatos mozgás: 3-5 sec hosszúságú– Mozdulatok eltérő ütemben történő

végrehajtása• Fejmozgás behatárolása térben és

időben– MHI reprezentáció: időtől függő

sablon, ahol minden egyes pixel értéke a fejmozgás egy függvényeke

Page 4: Fejmozgás alapú gesztusok felismerése

Bevezetés

Fejmozgás meghatározása

Fejmozgás detektálása

Fejmozgás iránya

Gesztus-felismerés

Gesztus adatbázis

DTW

Eredmények

KÉPAF 2013Bakonybél

4

Fejmozgás detektálása

• MHI: képszekvencia mozgó objektumainak változásait írja le– Több egymást követő képkockán keresztül– Maszk: azokat a régiókat jelöli ki, ahol

mozgás volt az adott időpillanatban ()– Ahol mozgás volt, ott az összes pixel

értéket vesz fel,– A többi fokozatosan elhalványul, majd

törlődik.

Page 5: Fejmozgás alapú gesztusok felismerése

Bevezetés

Fejmozgás meghatározása

Fejmozgás detektálása

Fejmozgás iránya

Gesztus-felismerés

Gesztus adatbázis

DTW

Eredmények

KÉPAF 2013Bakonybél

5

Fejmozgás iránya

• MHI mozgás gradiens, fejpozíció megváltozásának iránya– Nem elég stabil, kicsi az arc felbontása

• Feladat: a mozgás tekintetében hasznos régiók meghatározása– FAST sarokdetektor

• A kép pixeleit és azok környezetét vizsgálja• Eredményét korlátozzuk az arcra

Page 6: Fejmozgás alapú gesztusok felismerése

Bevezetés

Fejmozgás meghatározása

Fejmozgás detektálása

Fejmozgás iránya

Gesztus-felismerés

Gesztus adatbázis

DTW

Eredmények

KÉPAF 2013Bakonybél

6

Fejmozgás iránya

• Optikai áramláshoz tartozó vektorok kiszámítása– FAST jellemzőpontok alapján, az

aktuális és a következő képkocka között

• Fejmozgás iránya: n db optikai folyam vektor számtani közepe– Irányszög: a vektornak az y tengely

pozitív oldalával bezárt szöge– Probléma: túl sok lehetséges érték a

[0,2] intervallumból– Megoldás: csoportosítsuk a szögeket

Page 7: Fejmozgás alapú gesztusok felismerése

Bevezetés

Fejmozgás meghatározása

Fejmozgás detektálása

Fejmozgás iránya

Gesztus-felismerés

Gesztus adatbázis

DTW

Eredmények

KÉPAF 2013Bakonybél

7

Fejmozgás iránya

Fejmozdulat értéke szögben. A teljes szögnek egy tizenhatodába sorolva.

Page 8: Fejmozgás alapú gesztusok felismerése

Bevezetés

Fejmozgás meghatározása

Fejmozgás detektálása

Fejmozgás iránya

Gesztus-felismerés

Gesztus adatbázis

DTW

Eredmények

KÉPAF 2013Bakonybél

8

Gesztusfelismerés

• Gesztus időbeli szegmentálása– MHI átlagintenzitás alapján

• Szegmens– Képkockák sorozata– Alacsony átlagintenzitással a

szekvencia elején és végén• Gesztus

– Szekvencia szomszédos tagjaira számított szögek sorozata

– {"fejrázás"; [90°,90°,90°,270°,270°,225°,135°]}

Page 9: Fejmozgás alapú gesztusok felismerése

Bevezetés

Fejmozgás meghatározása

Fejmozgás detektálása

Fejmozgás iránya

Gesztus-felismerés

Gesztus adatbázis

DTW

Eredmények

KÉPAF 2013Bakonybél

9

Gesztusadatbázis

• A mozdulatok eltérő ütemben kerülnek végrehajtásra

• Gesztus adatbázis– Szögsorozatok gyűjteménye– Csoportok: egy gesztushoz, több

sorozat• Komplexebb döntések hozatala• Felismerés javítása

– Menet közben felvesszük a felismert gesztusokat az adatbázisba

– Igazodás a felhasználói szokásokhoz

Page 10: Fejmozgás alapú gesztusok felismerése

Bevezetés

Fejmozgás meghatározása

Fejmozgás detektálása

Fejmozgás iránya

Gesztus-felismerés

Gesztus adatbázis

DTW

Eredmények

KÉPAF 2013Bakonybél

10

Dinamikus idővetemítés

• A képszekvencia szegmenseihez számított szögsorozatot DTW segítségével illesztjük az adatbázis elemeihez– Felismert gesztus: átlagosan a

legkisebb távolság• DTW (din. idővetemítés)

– nD vektor illesztése egy mD vektorhoz

– Táblázat: (0,0)-ból eljutni (n,m)-be– Lépésenként hasonlítja össze a

mintákat– Cél: távolság minimalizálása

Page 11: Fejmozgás alapú gesztusok felismerése

Bevezetés

Fejmozgás meghatározása

Fejmozgás detektálása

Fejmozgás iránya

Gesztus-felismerés

Gesztus adatbázis

DTW

Eredmények

KÉPAF 2013Bakonybél

11

Dinamikus idővetemítés

Egy futás alatti fejrázás gesztus illesztése az adatbázis egy fejrázás csoportjába tartozó elmére. A lineáris illesztést a koordináta-rendszer (0,0) pontjából induló és (18,14) pontjában végződő átló jelentené. Az optimális nem lineáris illesztést a kék törött vonal jelzi.

Page 12: Fejmozgás alapú gesztusok felismerése

Bevezetés

Fejmozgás meghatározása

Fejmozgás detektálása

Fejmozgás iránya

Gesztus-felismerés

Gesztus adatbázis

DTW

Eredmények

KÉPAF 2013Bakonybél

12

Eredmények

• Minimális gesztushossz: >1 sec– A rövid gesztusok nem illeszkednek a

kicsit hasonlókra• Maximális gesztushossz

– ~4 sec, 30 FPS mellett: 150 hosszúságú szögsorozatok, mint gesztusok

– Mintavételezés csökkentése a harmadára• Főbb mozgáskomponensek

megmaradnak

• Maximális DTW hiba– Gesztusok közötti távolság– Empirikus úton. DTW távolság < 15

Page 13: Fejmozgás alapú gesztusok felismerése

Bevezetés

Fejmozgás meghatározása

Fejmozgás detektálása

Fejmozgás iránya

Gesztus-felismerés

Gesztus adatbázis

DTW

Eredmények

KÉPAF 2013Bakonybél

13

Eredmények

Fejrázás Bólintás Körkörös mozgás

0

10

20

30

40

50

42

27

10

43

32

9

45

33

6

5 db 10 db 15 db

Átl

agos

DTW

távols

ág

Az osztályonkénti átlagos DTW távolság 20 darab körkörös fejmozgásra. Látható, hogy javul a DTW szeparáló teljesítménye, ha bizonyos határok között növeljük az egyes osztályok számosságát.

Page 14: Fejmozgás alapú gesztusok felismerése

Köszönöm a figyelmet!