76
Ανάλυση Εικόνας και Όραση Υπολογιστών : Θεωρία και Εφαρμογές στην Αποκατάσταση Αρχαίων Τοιχογραφιών Γεώργιος Παπανδρέου Ομάδα Όρασης Υπολογιστών, Επικοινωνίας Λόγου και Επεξεργασίας Σήματος Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Εθνικό Μετσόβιο Πολυτεχνείο http://cvsp.cs.ntua.gr Υποστήριξη διδακτορικής διατριβής

ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

Ανάλυση Εικόνας και Όραση Υπολογιστών: Θεωρία και Εφαρμογές στην Αποκατάσταση

Αρχαίων Τοιχογραφιών

Γεώργιος Παπανδρέου

Ομάδα Όρασης Υπολογιστών, Επικοινωνίας Λόγου και Επεξεργασίας ΣήματοςΣχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών ΥπολογιστώνΕθνικό Μετσόβιο Πολυτεχνείοhttp://cvsp.cs.ntua.gr

Υποστήριξη διδακτορικής διατριβής

Page 2: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

2

Περιεχόμενα διδακτορικής διατριβής

Έναρξη διατριβής: Νοέμβριος 2003Ανάλυση εικόνας και όραση υπολογιστών

Ενδοσυμπλήρωση και κατάτμηση με τεχνικές μερικώνδιαφορικών εξισώσεωνΠολυκλιμακωτές αναπαραστάσεις σημάτωνΣτατιστική μοντελοποίηση εικόνας στο πεδίο των κυματιδίωνΒασική εφαρμογή: Αποκατάσταση αρχαίων τοιχογραφιών

Συνδυασμένη οπτική-ακουστική μοντελοποίηση φωνήςΟπτική-ακουστική μοντελοποίηση ομιλίας και τεχνικές γιαβέλτιστη σύμμειξη πολυτροπικών σημάτωνΜοντέλα όρασης υπολογιστών για περιγραφή προσώπου

Page 3: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

3

(Μέρος Ι) Τοιχογραφίες στην Ανασκαφή Ακρωτηρίου Θήρας

Page 4: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

4

Πρόγραμμα ΠΕΝΕΔ

Συμμετέχοντα ιδρύματα και επικεφαλείς ερευνητέςΣΗΜΜΥ - ΕΜΠ

Π. Μαραγκός (Ε.Υ.), Κ. ΤζαφέσταςΑνασκαφή Θήρας

Χ. Ντούμας, Α. ΒλαχόπουλοςΑρχιτεκτονική Σχολή ΑΠΘ

Κ. ΠαλυβούΠανεπιστήμιο Ιωαννίνων, Τμήμα Ιστορίας & Αρχαιολογίας

Ι. Λώλος

Υποψήφιοι διδάκτορεςΓ. Παπανδρέου (ΕΜΠ): Ψηφιακή αποκατάσταση τοιχογραφιώνΜ. Αληφραγκής (ΕΜΠ): 3-Δ καταγραφή & ανακατασκευή κτιρίωνΦ. Γεώρμα (Ανασκαφή Θήρας & Πανεπιστήμιο Ιωαννίνων): Αρχαιολογική μελέτη τοιχογραφιών κτιρίου Β.K. Αθανασίου (ΑΠΘ): Ψηφιακές τεχνικές στην αρχιτεκτονική μελέτηπροϊστορικών μνημείων

Χρηματοδότηση από τη ΓΓΕΤ (ΠΕΝΕΔ-03)Ιστοσελίδα: http://cvsp.cs.ntua.gr/projects/AkrotiriThera

Page 5: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

5

Ανασκαφή Ακρωτηρίου Θήρας

Προϊστορικός οικισμός Ακρωτηρίου ΘήραςΚαταστροφή από έκρηξη ηφαιστείου το 17ο αιώνα π.Χ.

Ανασκαφές: Σ. Μαρινάτος (1967-74), Χ. Ντούμας (1974-σήμερα)

Ιδιαίτερα σημαντικά ευρήματα

ΤοιχογραφίεςΠοικίλος βαθμός διατήρησης/επίπονο έργο συντήρησης

Σειρά προβλημάτων με έντονο επιστημονικό ενδιαφέρον

Επίκεντρο έρευνας: ψηφιακή αποκατάσταση τοιχογραφιών μεενδοσυμπλήρωση εικόνας

Αντιλόπες Πυγμάχοι

Page 6: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

6

Φωτογραφική αποτύπωση τοιχογραφιών

Εργαστήριο τοιχογραφιών της ανασκαφής (Ξεστή 3 & Κτίριο Β)Σεπτέμβριος 2006, Μάιος 2007, Σεπτέμβριος 2008

Εθνικό Αρχαιολογικό Μουσείο (κτίριο Β)Νοέμβριος 2006

Αντιλόπες Πυγμάχοι

ΑκολουθίαΑνδρών

ΑκολουθίαΓυναικών

Κροκοσυλλέκτριες& Πότνια

Καλαμιώνας

Καθοδήγηση Φ. Γεώρμα, Α. Βλαχόπουλος. Βοήθεια Μ. Αληφραγκής, Μ. Χαμαουί

Page 7: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

7

Συνένωση φωτογραφικών στιγμιοτύπων

Σύνθεση φωτογραφικών μωσαϊκών υπερ-υψηλής ανάλυσης

6 M-Pixels (30 dpi)

40 M-Pixels (70 dpi)

250 M-Pixels (150 dpi)

Υπολογιστικήφωτογραφία

Page 8: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

8

Πολυκλιμακωτή τεχνική φωτογράφισης

3 επίπεδα ανάλυσης

3 στάθμες έκθεσης

Page 9: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

9

Διαδοχικά Στάδια Σύνθεσης Μωσαϊκών

Λήψη φωτογραφιώνσχετική θέση κάμερας-σκηνής, πηγή φωτισμούαλληλεπικάλυψη στιγμιοτύπων

Ευθυγράμμιση εικόνων με εύρεση αντιστοιχιώνχαρακτηριστικά σημείαεπιπλέον περιορισμοί

Συνένωση εικόνων και εξάλειψη ραφώνοπτικά «φαντάσματα»διαφορές έκθεσης

Διαδικασία διευκολύνεται από ελεύθερα διαθέσιμολογισμικό ανοιχτού κώδικα

Szeliski. Image alignment and stitching: A tutorial (2006)

Page 10: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

10

Αρχική καθολική άποψη

Page 11: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

11

Ανορθωμένη καθολική άποψη

Page 12: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

12

Αντιστοίχιση σημείων

SIFT descriptor: Lowe, Int. J. Comp. Vis, 2004

Page 13: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

13

Ευθυγράμμιση λήψεων μεσαίας κλίμακας

Page 14: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

14

Ευθυγράμμιση λήψεων λεπτομερούς κλίμακας

Page 15: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

15

Ευθυγραμμισμένες λήψεις

Page 16: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

16

Συρραφή μωσαϊκού

Page 17: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

17

Πλοήγηση σε συνενωμένες φωτογραφικές συνθέσεις

http://cvsp.cs.ntua.gr/projects/AkrotiriThera/DataSets

Page 18: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

18

Πίνακες από το Prado στο Google Earth

Φωτογραφίες (έκτασης gigapixel) διάσημων πινάκων τουμουσείου Prado (Ιανουάριος 2009)

Πηγή: Google Earth

Page 19: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

19

(Μέρος ΙΙ) Ενδοσυμπλήρωση εικόνων

Page 20: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

20

Page 21: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

21

Page 22: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

22

Page 23: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

23

Ενδοσυμπλήρωση εικόνων

Ενδοσυμπλήρωση (inpainting). Ορισμός:Παρεμβολή τιμών σε ελλειπούσες περιοχέςμιας εικόνας, δεδομένων των τιμών στιςορατές περιοχές της, με αξιοποίηση γνώσηςσχετικά με τη συνήθη μορφή φυσικών εικόνων.

Μοντέλα που ενσωματώνουν:Διαδικασία αλλοίωσης της εικόνας (μέτρηση)

Κανονικότητες φυσικών εικόνων (πρότερη γνώση)

Συγκερασμό μέτρησης & πρότερης γνώσης (σύμμειξη)

Page 24: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

24

Ενδοσυμπλήρωση & ανθρώπινη οπτική αντίληψη

Εικόνες: 2-Δ όψεις του φυσικού κόσμουΟπτική αντιστροφή έντονη αμφισημία

Μηχανισμοί κανονικοποίησης

Ασύνειδος συμπερασμός (Helmholtz, 19ος αι.)

Ανθρώπινη όραση & συμπλήρωσηπληροφορίας

Τυφλό σημείο/σκοτώματα αμφιβληστροειδούς

Απατηλά περιγράμματα/αντιληπτική οργάνωση

Κατανόηση/οικονομική περιγραφή εικόνας

Λειτουργίες χαμηλού-μέσου-υψηλού επιπέδουόρασης

κλείσιμο

τρίγωνο Kanizsa

τυφλό σημείο

Pessoa et al. Finding out about filling-in, Beh. Brain Sc, 1998

Page 25: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

25

Περιοχές εφαρμογής & σχετιζόμενες τεχνικές

Περιοχές εφαρμογήςΚινηματογράφος: αποκατάσταση φιλμ σε ταινιοθήκες και ύστερηεπεξεργασία ταινιών/ειδικά εφέ

Επανάγγιμα φωτογραφιών

Απόκρυψη σφαλμάτων μετάδοσης σε βιντεοροές

Ψηφιακή διαφύλαξη πολιτισμικής κληρονομιάς

Συγγενή προβλήματαΣύνθεση υφής

Ψηφιακή επαύξηση ανάλυσης εικόνας & αποψηφιδοποίηση

Εκδοχές 1-Δ & 3-Δ (ενδοσυμπλήρωση σημάτων ήχου/βίντεο)

Σημαντικό θεωρητικό ενδιαφέρον

Page 26: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

26

Ταξινόμηση τεχνικών ενδοσυμπλήρωσης

Μη-παραμετρικές δεδομενοστρεφείς τεχνικές βασισμένες σε υποδείγματαΕξανλητική αναζήτηση ομοειδών γειτονιών για «αντιγραφή & επικόλληση»εικονοστοιχείων ή μπλοκ της εικόναςΙδιαίτερα ικανοποιητικά οπτικά αποτελέσματα

Popat and Picard (1997), De Bonet (1997), Efros and Leung (1999), Criminisi et al. (2003), …

Τεχνικές μεταβολικού λογισμού και ΜΔΕΔιάχυση περιεχομένου εικόνας κατά μήκος δομικών της στοιχείων

Masnou and Morel (1998), Bertalmio et al. (2000), Chan and Shen (2001), …

Συνεισφορά: επιτάχυνση μεθόδων ΜΔΕ με πολυπλεγματικούςαλγορίθμους

Παραμετρικά πιθανοτικά μοντέλαΠεριγράφουν και αναπαράγουν βασικές στατιστικές ιδιότητες εικόνωνΠεριγραφή κυρίως στο πεδίο κάποιου μετασχηματισμού «κυματιδίων»

Zhu and Mumford (1997), Portilla and Simoncelli (2000), …Elad et al. (2005), Fadili and Starck (2005), Guleryuz (2006), Hua and Orchard (2007), …

Συνεισφορά: βελτιωμένο πιθανοτικό μοντέλο στο πεδίο κυματιδίων πουαξιοποιεί διακλιμακικές εξαρτήσεις μεταξύ συντελεστών κυματιδίων

Page 27: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

27

(Μέρος ΙΙΙ) Πολυπλεγματικοί Αλγόριθμοι για ΜΔΕΕνδοσυμπλήρωσης & Κατάτμησης

Page 28: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

28

Μοντέλα μερικών διαφορικών εξισώσεων στην όρασηυπολογιστών: Χώροι κλίμακας

div( )u

ut

∂= ∇

∂div( )

u ut u

∂ ∇=

∂ ∇

Gau

ssia

n απ

όγραμμική

διάχυση

Μη-γραμμική

ανομοιογενής

διάχυση

Μη-γραμμική

ολικής

μεταβολής

div( ( ) )u

g u ut

∂= ∇ ∇

Page 29: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

29

ΜΔΕ και ελαχιστοποίηση ενέργειας για ενδοσυμπλήρωση

Στενή σχέση ΜΔΕ & μεταβολικού λογισμού (Euler-Lagrange)

2 20min ( ) ( )Eu u u u dxμ

Ω= ∇ + −∫∫ 0div( ) ( )

uu u u

∂= ∇ − −

20min ( ) ( )TVu u u u dxμ

Ω= ∇ + −∫∫ 0div( ) ( )

u uu u

t uμ

∂ ∇= − −

∂ ∇

Ενδοσυμπλήρωση-Κανονικοποίηση: Το είδος του συναρτησιακούκαθορίζει τι θεωρούμε «τυπική εικόνα»

Ενέργεια «μεμβράνης»: ευνοεί ιδιαίτερα ομαλή ανακατασκευή

Συναρτησιακό ολικής μεταβολής: επιτρέπει ακμές στην εικόνα

Ενδοσυμπλήρωση-Μέτρησηανάλογα με ύπαρξη/πιστότητα παρατήρησης( , )x yμ μ=

όροικανονικο-ποίησης

όροιμέτρησης

Page 30: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

30

ΜΔΕ ανισοτροπικής διάχυσης

0div( ) ( )u

D u u ut

μ∂

= ∇ − −∂

Γενίκευση: από βαθμωτό συντελεστή διάχυσης σε τανυστή διάχυσηςΚαλύτερη συνέχιση ακμών σε ενδοσυμπλήρωση (+)

Ψεύδεργα «ιμπρεσιονιστικού» τύπου (+/-)

δομικόςτανυστής

τανυστήςδιάχυσης

Page 31: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

31

Κατάτμηση με ενεργά περιγράμματα και αναπαράστασηεπιπεδοσυνόλων

Εξέλιξη καμπύλης

συνάρτησηεμβύθισης

( , ) ( , )C p t VN p tt

∂ =∂

( , , )u x y tV u

t∂

= ∇∂

Εξέλιξη επιπεδοσυνόλου

Page 32: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

32

Κατάτμηση με γεωμετρικά ενεργά περιγράμματα

Γεωδαιτικά ενεργά περιγράμματα (ακμές):

Ενεργά περιγράμματα δίχως ακμές (περιοχές):

Ανταγωνισμός περιοχών & γεωδαιτικές ενεργές περιοχές:

Αρχικοποίηση σε μετασχηματισμό απόστασης

συνάρτησηεμβύθισης

Page 33: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

33

Συγγενής μορφή ΜΔΕ ενδοσυμπλήρωσης/κατάτμησης

Εξισώσεις γεωμετρικών ενεργών περιγραμμάτων

1ος όρος (εσωτερικές δυνάμεις/διάχυση)Παραβολικού τύπου / Αριθμητικά άκαμπτος

2ος όρος (εξωτερικές δυνάμεις/αντίδραση)Γραμμικός ή μη-γραμμικός / Αριθμητικά εύκαμπτος

εσωτερικέςδυνάμεις

εξωτερικέςδυνάμεις

Εξισώσεις ανισοτροπικής διάχυσης

0div( ) ( )u

D u u ut

μ∂

= ∇ − −∂

όροςδιάχυσης

όροςαντίδρασης

G. Papandreou and P. Maragos, IEEE Tr. IP, 2007

Page 34: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

34

Συνεχές πρόβλημα

Χωρική διακριτοποίηση (κεντρικές διαφορές)

Μορφή γινομένου πίνακα-διανύσματος

Ημι-διακριτοποιημένη μορφή:

Χωρική διακριτοποίηση

Page 35: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

35

Χρονική ολοκλήρωση

Εμπρόσθιο σχήμα

Απλό αλλά περιοριστικό:

Πλήρως οπίσθιο σχήμα

Ευσταθές αλλά δυσεπίλυτο (ισχυρά μή-γραμμικό)

Υβριδικό σχήμα (IMEX)

Ευσταθές, αλλά επίλυση γραμμικού συστήματος/βήμα:

, 2 , , ,t nτ τ τ= … …

πίνακας συστήματος

Επίλυση με πολυπλεγματικές τεχνικές!

Page 36: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

36

Πολυπλεγματικοί αλγόριθμοι

Αναδρομική επέκταση σε πολλά επίπεδα (V/W κύκλοι)Πολυπλεγματικά συστατικά:

ΕξομαλυντήςΠίνακες περιορισμού R και παρεμβολής PΠρόβλημα στο αδρό επίπεδο L2h

εξομάλυνσηυπολογισμός

περιορισμός

επίλυση

διόρθωση

παρεμβολή

Page 37: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

37

Υπολογιστικό κόστος

Ενδεικτικό υπολογιστικό κόστος (ανά χρονικό βήμα)

Βιβλιοθήκη GAC++. Πηγαίος κώδικας υπό GPL άδειαhttp://cvsp.cs.ntua.gr/software/GAC++

Ευρεία χρήση στο εργαστήριό μας και αλλού

Page 38: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

38

Γεωμετρικά ενεργά περιγράμματα: Πειράματακατάτμησης

Κατάτμηση με βάση ομοιογένεια υφής

Κατάτμηση με βάση ομοιογένεια φωτεινότητας

Page 39: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

39

Παράδειγμα ενδοσυμπλήρωσης με ΜΔΕ διάχυσης

Page 40: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

40

Λεπτομέρειες Αποτελέσματος Ενδοσυμπλήρωσης

αρχικό ενδιάμεσο τελικό

Επαναληπτική διαδικασία, ευνοεί συνέχιση ακμών

Πιθανή δημιουργία ψευδέργων (artifacts)

Page 41: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

41

(Μέρος IV) Ενδοσυμπλήρωση στο πεδίο τωνκυματιδίων (wavelets)

Page 42: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

42

Ανάλυση και επεξεργασία εικόνων με κυματίδια

Κυματίδια: πολυκλιμακωτή ανάλυση εικόνωνΓραμμικά, ζωνοπερατά, κατευθυντικά φίλτρα

Σημαντική επιτυχία σε εφαρμογέςΚωδικοποίηση εικόνωνΑποθορυβοποίησηΣυμπιεσμένη αίσθηση (compressed sensing)

Βάση για αποδοτικούς αλγορίθμουςΟ(Ν) ευθύς/αντίστροφος διακριτός μετασχ. κυματιδίων

Page 43: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

43

Δίδεντρος Μιγαδικός Κυματιδιακός Μετασχηματισμός

Kingsbury (2001), Selesnick et al. (2005), Portilla & Simoncelli (2000)

(DT-CWT)

Page 44: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

44

Διαμορφωμένος Μιγαδικός Αλληλεπικαλυπτόμενος Μετ/σμός

Malvar (1999)

(MCLT)

Page 45: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

45

Αναπαράσταση εικόνας με μιγαδικά κυματίδια

Ιδιότητες (DT-CWT και MCLT)Κατευθυντικότητα (6 μιγαδικές υποζώνες / κλίμακα)Συμμετρία μετατόπισηςΥπερ-πλήρη (4-φορές) πλαίσιαΑνάλυση χώρου-κλίμακας έναντι χώρου-συχνότητας

sx F y=N

4M

M= x τιμές εικόναςy συντ. κυματιδίων

sF IDWT

Page 46: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

46

Κυματίδια και στατιστική ενδοσυμπλήρωση

Αντίστροφο πρόβλημαΠιθανοτική προσέγγιση στο πεδίο κυματιδίων:

2. Πρότερο μοντέλοκυματιδίων ( )P y

1. Μετρήσεις (γνωστάσημεία) ( | )oP x y Κανόνας

Bayes

3. Συμπερασμός γιακυματίδια: ,( | )oP y x y

4. Ενδοσυμπλήρωση ˆ ˆsx F y=IDWT

Page 47: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

47

Μοντέλο μέτρησης

Παρατηρημένες/επικαλυμμένες τιμές

o sx WF y n Ay n= + = +

=

, o hx x x=( | ) ( ; , )o o nP x y N x Ay= Σ⇒

sA WF=

Page 48: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

48

2. Πρότερο μοντέλοκυματιδίων ( )P y

1. Μετρήσεις (γνωστάσημεία) ( | )oP x y Κανόνας

Bayes

3. Συμπερασμός γιακυματίδια ,( | )oP y x y

4. Ενδοσυμπλήρωση ˆ ˆsx F y=IDWT

Page 49: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

49

Στατιστική εικόνων στο πεδίο κυματιδίων

Ιδιότητα αποσυσχέτισης:Μη-γκαουσιανές στατιστικές ιδιότητεςΛεπτοκυρτωτικά περιθώρια ιστογράμματα

Field (1987), Mallat (1989) …

Αλληλεξαρτήσεις υψηλής τάξης σε γειτονιέςχώρου/κλίμακαςΑπό-κοινού ιστογράμματα «πεταλούδας»

Shapiro (1993), Simoncelli (1999), Portilla et al. (2003), …

i j ijE y y δ≈lo

g(co

unt)

Page 50: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

50

Μοντελοποίηση εικόνων στο πεδίο κυματιδίων

Λεπτοκυρτωτικές (αραιές) κατανομές συντελεστώνLaplacian ( ) / Student-t κατανομές

Μείγμα κατανομών Gaussians

Αλληλεξαρτήσεις μεταξύ κλιμάκωνΑλληλουχίες από Gaussian scale mixtures

Κρυφό δένδρο Markov

Σύγκριση με βιβλιογραφία που συνδυάζεικυματίδια & ενδοσυμπλήρωση:Προηγούμενες εργασίες: κυρτωτικές κατανομές

Συνεισφορά μας: + μοντελοποίηση εξαρτήσεων

1L

Page 51: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

51

Δομή κρυφού δέντρου Markov στο πεδίο μιγαδικώνκυματιδίων

Page 52: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

52

Δομή κρυφού δέντρου Markov στο πεδίο μιγαδικώνκυματιδίων

Page 53: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

53

Κρυφό δέντρο Markov (HMT) στο πεδίο κυματιδίων

0q

1q 2q

5q 6q4q3q 4y3y

1y

0y

2y

6y5y

tq διακριτή κρυφή μετα-βλητή/ενεργό μείγμα

ty συντελ. κυματιδίου

01

( )p tt

T

q q qt

P q π α=

= ∏

0

( | ) ( ; , ) ( ; , )t t

T

q q t q qt

P y q N y N yμ μ=

= Σ = Σ∏ , , , j iθ π α μ= Σ

παράμετροι μοντέλου

Crouse et al. (1998)

tp γονιός κόμβου t1T + πλήθος κόμβων

Q κρυφές καταστ.

2-Δ

1-Δ

Page 54: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

54

Κρυφά δέντρα Markov: Βασικές λειτουργίες

ˆ arg max ( ; )P yϑ ϑ=ˆ arg max ( | )q P q y=

0q

1q 2q

5q 6q4q3q 4y3y

1y

0y

2y

6y5y

tq διακριτή κρυφή μετα-βλητή/ενεργό μείγμα

ty Συντελ. κυματιδίου

Pearl (1988), Rabiner (1989), Bouman & Shapiro (1994), Crouse et al. (1998), Laferte et al. (2000), Willsky (2002)

1. Άνωαναδρομή

2. Κάτωαναδρομή

Αποδοτικοί αναδρομικοί ως προς την κλίμακα αλγόριθμοι:Αποτίμηση πιθανοφάνειας (άνω)Συμπερασμός (άνω-κάτω)Viterbi πιθανότερο μονοπάτι (άνω-κάτω)Παράμετροι μέγ. πιθανοφάνειας με EMΥπό-συνθήκη δειγματολ. (άνω-κάτω)

( | )tP q y

( | )sq P q y∼

( )P y

Page 55: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

55

Πειράματα σύνθεσης υφής με το ΗΜΤ μοντέλο

αρχική ασύμφωνηαρχική

σύνθεσηΗΜΤ

σύνθεσηΗΙΤ

Page 56: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

56

Πειράματα αποθορυβοποίησης με το ΗΜΤ μοντέλο

θορυβώδης HMT-DTCWT HIT-DTCWT

θορυβώδης HMT-DTCWT HMT-MCLT

Συστηματικήαξιολόγηση (7 εικόνεςαναφοράς, 4 επίπεδα

θορύβου):

(1) ΗΜΤ κέρδος +0.4 dB (μέσος όρος)

(2) MCLT κέρδος ως+0.7 dB (ορισμένες

εικόνες)

(3) Επιδόσεις κοντάστο state-of-art

Συνεισφορά: ΕΜ αλγόριθμος για εκπαίδευσηHMT μοντέλου από θορυβώδη δεδομένα

Page 57: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

57

2. Πρότερο μοντέλοκυματιδίων ( )P y

1. Μετρήσεις (γνωστάσημεία) ( | )oP x y Κανόνας

Bayes

3. Συμπερασμός γιακυματίδια ,( | )oP y x y

4. Ενδοσυμπλήρωση ˆ ˆsx F y=IDWT

Page 58: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

58

Συμπερασμός για Κυματιδιακούς Συντελεστές

Ακριβής συμπερασμός αδύνατος

all paths ( | ) ( | ) ( )o

q

P x y P y q P q= ∑( | ) ( | ) ( )o oP y x P x y P y∝ = άθροιση όλων των

μονοπατιών ( )TO Q

Όμως, δοσμένης της κρυφής κατάστασης, κυματιδιακήεκτίμηση εφικτή (πρόβλημα ελαχίστων τετραγώνων):

( | , ) ( | ) ( | )o oP y x q P x y P y q∝ =

| |( ; , )y q y qN y μ= Σ1 1

| | ( )Ty q y q q q n oA xμ μ− −= Σ Σ + Σ1 1 1|

Ty q q nA A− − −Σ = Σ + Σ

sA WF=

Page 59: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

59

Αλγόριθμος I: Εναλλασσόμενη βελτιστοποίηση

Block ICM τεχνικήΜονοτονική σύγκλιση σετοπικό μέγιστο

2. Δοσμένης εκτίμησης γιασυντελ. κυματιδίων, εύρεση τουπιο πιθανού (Viterbi) μονοπατιού

1 1| | ( )

i i i i

Ty q y q q q n oA xμ μ− −= Σ Σ + Σ

1 1 1| i i

Ty q q nA A− − −Σ = Σ + Σ

1iy −

1arg max ( | )i iq P q y −=

3. Δοσμένης εκτίμησης για τομονοπάτι, ενημέρωσησυντελεστών κυματιδίων

|argmax ( | , )ii i o y qy P y q x μ= =

( , | )oP y q x

1. Αρχικήεκτίμηση 0y

iq

4. Έξοδοςis sx F y∞=

Page 60: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

60

Αλγόριθμος ΙΙ: Δειγματοληψία Gibbs

Μπλοκ Gibbs δειγματο-ληψία τηςΠλήρης διερεύνηση τηςύστερης κατανομής

1 1| , ,( )

i i

Ts y q q u s n o sy y A x− −= Σ Σ + Σ

1 1 1| i i

Ty q q nA A− − −Σ = Σ + Σ

2. Δοσμένου δείγματος κυματιδίων , λήψη μπλοκ δείγματος μονοπατιού

1iy −

1( | )i iq P q y −∼

( , | )oP y q x

3. Δοσμένου μονοπατιού , λήψημπλοκ δείγματος συντελεστώνκυματιδίων

( | , )i i o sy P y q x y=∼

iq

1. Αρχικήεκτίμηση 0y

Page 61: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

61

Πειράματα ενδοσυμπλήρωσηςκαλυμμένη

ΜΔΕ

Lapl

ace

Προτ.

Μοντέλο

(Alt.

Opt

.)

PSNR20.6 dB

PSNR21.9 dB

PSNR22.0 dB

Προτ.

Μοντέλο

(Δειγμ

. Gib

bs)

Page 62: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

62

Πειράματα ενδοσυμπλήρωσης (μεγέθυνση)oc

clud

ed

Lapl

ace

PD

E

PSNR20.6 dB

PSNR21.9 dB

PSNR22.0 dB

Προτ.

Μοντέλο

(Alt.

Opt

.)

Προτ.

Μοντέλο

(Δειγμ

. Gib

bs)

Page 63: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

63

Αποτελέσματα σε Τοιχογραφίες Ακρωτηρίου

Page 64: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

64

Λεπτομέρειες Αποτελέσματος Ενδοσυμπλήρωσης

επικαλυμμένη αρχική συνθήκη λύση στη σύγκλιση

Ικανοποιητική συμπλήρωση ομαλών περιοχών/μικρών κενών

Χωρίς ψεύδεργα, αλλά αδυναμία συνένωση ακμών

Page 65: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

65

Ακολουθία Ανδρών

Page 66: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

66

Σύνοψη Τεχνικών ΜΔΕ και Κυματιδίων

Μοντέλα φυσικής

Χωρικό πεδίο (γεωμετρία)

Ντετερμινιστική επίλυση

Στατιστικά μοντέλα

Πεδίο κυματιδίων (στατιστική)

Στοχαστική επίλυση

Πολυκλιμακωτές αναπαραστάσεις

Αποδοτικοί O(N) αλγόριθμοι

Υβριδική προσέγγιση για το πρόβληματης ενδοσυμπλήρωσης

έναντι

ΜΔΕ Κυματίδια

Page 67: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

67

Περιοχές μελλοντικής έρευνας

Αυτόματη ανίχνευση ελλειπουσών περιοχών στιςτοιχογραφίες

Πιθανόν να επιβοηθάται από 3-Δ πληροφορία

Επιτρέπει εφαρμογή σε μεγαλύτερη κλίμακα στις τοιχογραφίεςΑκρωτηρίου

Πρακτική αξιοποίηση στο ΑκρωτήριΕργαλείο μελέτης και ανάδειξης των τοιχογραφιών

Αξιοποίηση στο πρόβλημα της εύρεσης επαφών

Ενδοσυμπλήρωση με τεχνικές κυματιδίωνΑνάπτυξη & ενσωμάτωση μοντέλου μιγαδικής φάσης

Ενσωμάτωση ιδεών από μέσο επίπεδο όρασης

Αντικειμενοστρεφή ιεραρχικά αναγεννητικά μοντέλα εικόνων

Page 68: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

68

Αναγνώριση Ομιλίας από Ακουστική καιΟπτική Πληροφορία

Page 69: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

69

Ομιλία: Πολύπλευρο φαινόμενο

οπτική προβολή

ακουστική προβολή

CVSP

Page 70: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

70

Αναγνώριση Ομιλίας από Ήχο και Εικόνα

Κύρια σημεία:Εξαγωγή οπτικών χαρακτηριστικών από το πρόσωποομιλητήΣύμμειξη οπτικής και ακουστικής πληροφορίας

ΉχοςΕικόνα

Page 71: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

71

Εξαγωγή Οπτικής Πληροφορίας

Σχήμα και υφή του προσώπου επιβοηθούν το διάβασμα των χειλιών

Μοντελοποίηση προσώπου με Ενεργά Μοντέλα Όψης (ΕΜΟ)Σχήμα και υφή αναλύονται σε χαμηλοδιάστατους υποχώρους

Οπτικά χαρακτηριστικά: Παράμετροι του ΕΜΟ

Προσαρμογή μοντέλου στον ομιλητή για εξαγωγή χαρακτηριστικών ομιλίας

μέσοδιάνυσμα

1ο ιδιο-διάνυσμα

2ο ιδιο-διάνυσμα

υφή

σχήμα

Papandreou and Maragos, IEEE CVPR (2008)

Page 72: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

72

Σύστημα πραγματικού χρόνου για οπτική-ακουστικήαναγνώριση ομιλίας

Λήψη βίντεο

Ανίχνευσηπροσώπου

HMMαποκωδικοποίηση

Παρακολούθησηπροσώπου & εξαγωγή ΕΜΟχαρακτηριστικών

(Επαν)αρχικοποίηση

Demo σε ΙΕΕΕ συνέδρια: MMSP, ICASSP, CVPRΕυχ.: Μ. Περακάκης, Α. Ποταμιάνος, Πολ. Κρήτης

GPU-επιταχυνόμενηεπεξεργασία καταγραφή

Page 73: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

73

Πολυτροπική σύμμειξη με αντιστάθμιση αβεβαιότητας

Η Προσέγγισήμας

ΣυμβατικήΆποψη

Κρυφές

Φανερές

Κρυφές

Φανερές

Λαμβάνοντας υπόψη την αβεβαιότητα μέτρησης χαρακτηριστικώνοδηγεί σε προσαρμοστικά πιθανοτικά μοντέλα σύμμειξης

C1

X1

C2

X2

C3

X3

C1

X1

Y1

C2

X2

Y2

C3

X3

Y3

G. Papandreou, A. Katsamanis, V. Pitsikalis, and P. Maragos, IEEE Tr. ASLP, 2009

Page 74: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

74

Βασικές συνεισφορές διατριβής

Ψηφιακή αποτύπωση τοιχογραφιών Ακρωτηρίου Θήραςμε τεχνικές υπολογιστικής φωτογραφίαςΑνάλυση εικόνας και όραση υπολογιστών

Πολυπλεγματική αριθμητική επίλυση μερικών διαφορικώνεξισώσεων όρασης υπολογιστών. Εφαρμογές:

Ενδοσυμπλήρωση με μοντέλα ανισοτροπικής διάχυσηςΚατάτμηση με μοντέλα γεωμετρικών ενεργών περιγραμμάτων

Στατιστικά μοντέλα για ενδοσυμπλήρωση στο πεδίο τωνκυματιδίωνΒασική εφαρμογή: Αποκατάσταση αρχαίων τοιχογραφιών

Συνδυασμένη οπτική-ακουστική μοντελοποίηση φωνήςΣύμμειξη πολυτροπικών σημάτων με αντιστάθμιση αβεβαιότηταςΜοντέλα όρασης υπολογιστών για περιγραφή προσώπου

Page 75: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

75

Δημοσιεύσεις διατριβής1. G. Papandreou and P. Maragos, Multigrid Geometric Active Contour

Models, IEEE Transactions on Image Processing, vol. 16, no. 1, pp. 229-240, Jan. 2007

2. G. Papandreou, A. Katsamanis, V. Pitsikalis, and P. Maragos, Adaptive Multimodal Fusion by Uncertainty Compensation with Application to Audio-Visual Speech Recognition, IEEE Transactions on Audio, Speech and Language Processing, vol. 17, no. 3, pp. 423-435, Mar. 2009

3. A. Katsamanis, G. Papandreou, and P. Maragos, Face Active Appearance Modeling and Speech Acoustic Information to Recover Articulation, IEEE Transactions on Audio, Speech and Language Processing, vol. 17, no. 3, pp. 411-422, Mar. 2009

4. S. Lefkimmiatis, P. Maragos, and G. Papandreou, Bayesian Inference on Multiscale Models for Poisson Intensity Estimation: Applications to Photon-Limited Image Denoising, IEEE Transactions on Image Processing, vol. 18, no. 8, pp. 1724-1741, Aug. 2009

5. G. Papandreou and P. Maragos, Image Inpainting with Transform Domain Hidden Markov Tree Models, προετοιμάζεται για υποβολή+ 13 δημοσιεύσεις σε διεθνή συνέδρια με κριτή+ 2 κεφάλαια σε βιβλίο

Page 76: ΑνάλυσηΕικόναςκαιΌρασηΥπολογιστών ...cvsp.cs.ntua.gr/gpapan/Papandreou_PhD_ntua-slides09.pdf · 2009-07-30 · Modeling and Speech Acoustic Information

76

Ευχαριστώ πολύ!