47
Απριλιος 2005 Πρωτόκολλο MPEG7 – Περιγραφή εικόνας βάσει του περιεχομένου Σ. Φωτόπουλος ΠΑΝΕΠ. ΠΑΤΡΩΝ Τμ. ΦΥΣΙΚΗΣΠΜΣ ΗΕΠ σ.1 MPEG7 Multimedia Content Description Interface

MPEG7 Multimedia Content Description Interface · 2018. 6. 8. · Απριλιος2005 ΠρωτόκολλοMPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένου

  • Upload
    others

  • View
    4

  • Download
    0

Embed Size (px)

Citation preview

Page 1: MPEG7 Multimedia Content Description Interface · 2018. 6. 8. · Απριλιος2005 ΠρωτόκολλοMPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένου

Απριλιος 2005Πρωτόκολλο MPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένουΣ. Φωτόπουλος ΠΑΝΕΠ. ΠΑΤΡΩΝ Τµ. ΦΥΣΙΚΗΣ– ΠΜΣ ΗΕΠ σ.1

MPEG7Multimedia Content

Description Interface

Page 2: MPEG7 Multimedia Content Description Interface · 2018. 6. 8. · Απριλιος2005 ΠρωτόκολλοMPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένου

Απριλιος 2005Πρωτόκολλο MPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένουΣ. Φωτόπουλος ΠΑΝΕΠ. ΠΑΤΡΩΝ Τµ. ΦΥΣΙΚΗΣ– ΠΜΣ ΗΕΠ σ.2

Αναφέρεται σε «βάσεις» εικόνων,video και ήχου

Page 3: MPEG7 Multimedia Content Description Interface · 2018. 6. 8. · Απριλιος2005 ΠρωτόκολλοMPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένου

Απριλιος 2005Πρωτόκολλο MPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένουΣ. Φωτόπουλος ΠΑΝΕΠ. ΠΑΤΡΩΝ Τµ. ΦΥΣΙΚΗΣ– ΠΜΣ ΗΕΠ σ.3

Πως ένα σύνολο εικόνων θα µπεί σε µία διάταξη κατά σειρά οµοιότητας;;

Οι 7 εικόνες στη 2η γραµµή έχουν τοποθετηθεί σύµφωνα µε την σειρά οµοιότητας µε την εικόνα αναζήτησης (1η γραµµή )

Query image

Page 4: MPEG7 Multimedia Content Description Interface · 2018. 6. 8. · Απριλιος2005 ΠρωτόκολλοMPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένου

Απριλιος 2005Πρωτόκολλο MPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένουΣ. Φωτόπουλος ΠΑΝΕΠ. ΠΑΤΡΩΝ Τµ. ΦΥΣΙΚΗΣ– ΠΜΣ ΗΕΠ σ.4

ContentContent--based image Retrieval based image Retrieval - ανάκτηση βάσει του περιεχοµένου

Τρόποι:

Με σχεδιάγραµα (query by sketch)

Με παράδειγµα µία εικόνα (query by example)

Με σύνολο εικόνων (query by group example)

Με «σχετική» ανατροφοδότηση (relevance feedback) (θετικά και αρνητικά παραδείγµατα σε αλληλεπίδραση µε τον χρήστη)

Με «semantics»

Page 5: MPEG7 Multimedia Content Description Interface · 2018. 6. 8. · Απριλιος2005 ΠρωτόκολλοMPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένου

Απριλιος 2005Πρωτόκολλο MPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένουΣ. Φωτόπουλος ΠΑΝΕΠ. ΠΑΤΡΩΝ Τµ. ΦΥΣΙΚΗΣ– ΠΜΣ ΗΕΠ σ.5

1.1. ΕπιλογήΕπιλογή χαρακτηριστικώνχαρακτηριστικών

2.2. Μέτρα οµοιότηταςΜέτρα οµοιότητας

Page 6: MPEG7 Multimedia Content Description Interface · 2018. 6. 8. · Απριλιος2005 ΠρωτόκολλοMPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένου

Απριλιος 2005Πρωτόκολλο MPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένουΣ. Φωτόπουλος ΠΑΝΕΠ. ΠΑΤΡΩΝ Τµ. ΦΥΣΙΚΗΣ– ΠΜΣ ΗΕΠ σ.6

Το πρωτόκολλο MPEG7

ΕισαγωγικάΤυποποιεί την περιγραφή του περιεχοµένου των πολυµέσων(video – audio)

∆εν επεξεργάζεται αλλά….

Συλλέγει χαρακτηριστικά πού χρειάζονται για περιγραφήδεδοµένων εικόνας-ήχου

Κάνει δόµηση της περιγραφής για δηµιουργία «κοινήςγλώσσας» ώστε να..

πραγµατοποιείται indexing – retrieval – browsing κλπ.

Page 7: MPEG7 Multimedia Content Description Interface · 2018. 6. 8. · Απριλιος2005 ΠρωτόκολλοMPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένου

Απριλιος 2005Πρωτόκολλο MPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένουΣ. Φωτόπουλος ΠΑΝΕΠ. ΠΑΤΡΩΝ Τµ. ΦΥΣΙΚΗΣ– ΠΜΣ ΗΕΠ σ.7

∆ιαδικασίες περιγραφής(Descriptors)

ΟπτικέςΟπτικές ((VisualVisual))Περιγραφή χρώµατοςΠεριγραφή ΥφήςΠεριγραφή ΣχήµατοςΠεριγραφή «κίνησης»Περιγραφή προσώπου (µε Βασικό εργαλείο: PCA)

ΑκουστικέςΑκουστικές ((AudioAudio))Ταξινόµηση ήχου και οµοιότηταΠεριεχόµενο προφορικού λόγου

Page 8: MPEG7 Multimedia Content Description Interface · 2018. 6. 8. · Απριλιος2005 ΠρωτόκολλοMPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένου

Απριλιος 2005Πρωτόκολλο MPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένουΣ. Φωτόπουλος ΠΑΝΕΠ. ΠΑΤΡΩΝ Τµ. ΦΥΣΙΚΗΣ– ΠΜΣ ΗΕΠ σ.8

Ποσοτική εκτίμηση της περιγραφής

ΒασίζεταιΒασίζεται στηστη διαδικασίαδιαδικασία ««retrieval retrieval -- ανάκτησηςανάκτησης»»

((QueryQuery--byby--example QBE)example QBE)

Λαµβάνει υπόψη:

Aν οι όµοιες εικόνες είναι πρώτες στη σειρά οµοιότητας

Αν παρουσιάζονται στην ανάκτηση «λάθος» εικόνες

Αν παραλείπονται εικόνες που είναι όµοιες µε την εικόνααναζήτησης

Query q

Page 9: MPEG7 Multimedia Content Description Interface · 2018. 6. 8. · Απριλιος2005 ΠρωτόκολλοMPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένου

Απριλιος 2005Πρωτόκολλο MPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένουΣ. Φωτόπουλος ΠΑΝΕΠ. ΠΑΤΡΩΝ Τµ. ΦΥΣΙΚΗΣ– ΠΜΣ ΗΕΠ σ.9

Ποσοτική εκτίμηση της περιγραφής(συνέχεια)

Query q

έχουµε δύο εκτιµητές: precision και recall

Όπου: q είναι η εικόνα αναζήτησης (query)

Q(q) o αριθµός των εικόνων που βρέθηκαν

και R(q) o πραγµατικός αριθµός των οµοίων εικόνων

γενικάγενικά

|)q(Q||)q(R)q(Q|precision ∩

=|)q(R|

|)q(R)q(Q|recall ∩=

Page 10: MPEG7 Multimedia Content Description Interface · 2018. 6. 8. · Απριλιος2005 ΠρωτόκολλοMPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένου

Απριλιος 2005Πρωτόκολλο MPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένουΣ. Φωτόπουλος ΠΑΝΕΠ. ΠΑΤΡΩΝ Τµ. ΦΥΣΙΚΗΣ– ΠΜΣ ΗΕΠ σ.10

Kλασσικός εκτιµητής: Retrieval Rank,

Όπου: q είναι η εικόνα αναζήτησης (query)

NF(a,q) o αριθµός των «σωστών» εικόνων που βρέθηκαν σε aNG(q) επιλογές (a>1)

και NG(q) o πραγµατικός αριθµός των οµοίων εικόνων

Ποσοτική εκτίμηση της περιγραφής (συνέχεια)

Query q

)(),()(

qNGqaNFqRR =

ΓιαΓια το το MPEG7MPEG7

Page 11: MPEG7 Multimedia Content Description Interface · 2018. 6. 8. · Απριλιος2005 ΠρωτόκολλοMPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένου

Απριλιος 2005Πρωτόκολλο MPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένουΣ. Φωτόπουλος ΠΑΝΕΠ. ΠΑΤΡΩΝ Τµ. ΦΥΣΙΚΗΣ– ΠΜΣ ΗΕΠ σ.11

Μικρές τιµές του MRR καλή συµπεριφορά

)(

)(*)(

)(

qNG

kRankqAVR

qNG

1k∑==

Modified Retrieval Rank MRR=AVR(q)-0.5[1+NG(q)]

Ποσοτική εκτίμηση της περιγραφής (συνέχεια)

Μέση τιµή του RR: ∑=

=NQ

1qqRR

NQ1ARR )(

Βελτίωση AVR(q):

Όπου rank η σειρά οµοιότητας των εικόνων (1 πλέον όµοια)

Page 12: MPEG7 Multimedia Content Description Interface · 2018. 6. 8. · Απριλιος2005 ΠρωτόκολλοMPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένου

Απριλιος 2005Πρωτόκολλο MPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένουΣ. Φωτόπουλος ΠΑΝΕΠ. ΠΑΤΡΩΝ Τµ. ΦΥΣΙΚΗΣ– ΠΜΣ ΗΕΠ σ.12

Περιγραφή του χρώματος(Color descriptors)

Χρωματικοί χώροι (color spaces)Επικρατούντα χρώματα (dominant colors)Χρωματική δομή (color structure)Χρωματικός σχεδιασμός (color layout)Κλιμακωτή περιγραφή χρωμάτων (scalable color)

Color descriptors

Dominant color

Scalable color

Color structure

Color layout

Χρωµατικοίχώροι

YCbCrRGBHSVHMMD

Page 13: MPEG7 Multimedia Content Description Interface · 2018. 6. 8. · Απριλιος2005 ΠρωτόκολλοMPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένου

Απριλιος 2005Πρωτόκολλο MPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένουΣ. Φωτόπουλος ΠΑΝΕΠ. ΠΑΤΡΩΝ Τµ. ΦΥΣΙΚΗΣ– ΠΜΣ ΗΕΠ σ.13

Χρωματικοί χώροι

Οι χρωματικοί χώροι που χρησιμοποιούνται στο πρωτόκολλοMPEG7 είναι:

RGBRGBYCbCrYCbCr (από τα πρωτόκολλα ΜPEG 1/2/4)

Val

SatHue

HSVHSV Σχετίζεται:

µε την περιγραφή ιστογράµµατος συνόλουστιγµιότυπων (group of frames histogram descriptor)

µε την κλιµακωτή περιγραφή χρωµάτων(scalable color descriptor)

Page 14: MPEG7 Multimedia Content Description Interface · 2018. 6. 8. · Απριλιος2005 ΠρωτόκολλοMPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένου

Απριλιος 2005Πρωτόκολλο MPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένουΣ. Φωτόπουλος ΠΑΝΕΠ. ΠΑΤΡΩΝ Τµ. ΦΥΣΙΚΗΣ– ΠΜΣ ΗΕΠ σ.14

HSVHSV κβάντιση κβάντιση του χώρουτου χώρου

44441616256256448128428642283222416

αριθµός bins για το VV

αριθµός bins για το SS

αριθµός bins για το HH

Συνολικόςαριθµός bins

Χρωµατικοί χώροι (συνέχεια)

Hue

Sat

Val

Page 15: MPEG7 Multimedia Content Description Interface · 2018. 6. 8. · Απριλιος2005 ΠρωτόκολλοMPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένου

Απριλιος 2005Πρωτόκολλο MPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένουΣ. Φωτόπουλος ΠΑΝΕΠ. ΠΑΤΡΩΝ Τµ. ΦΥΣΙΚΗΣ– ΠΜΣ ΗΕΠ σ.15

Χρωµατικοί χώροι (συνέχεια)

HMMDHMMD1. Είναι πιο κοντά στο χώρο ομοιόμορφης αντίληψης

(perceptually uniform color space) 2. H ονομασία του οφείλεται στα μεγέθη:

Hue, Max, Min, Diff (Sum)που σχετίζονται με τα αντίστοιχα RGB ως εξής:Max=max(R,G,B)Min=min(R,G,B)Diff=Max-MinSum=(Max+Min)/2

Page 16: MPEG7 Multimedia Content Description Interface · 2018. 6. 8. · Απριλιος2005 ΠρωτόκολλοMPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένου

Απριλιος 2005Πρωτόκολλο MPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένουΣ. Φωτόπουλος ΠΑΝΕΠ. ΠΑΤΡΩΝ Τµ. ΦΥΣΙΚΗΣ– ΠΜΣ ΗΕΠ σ.16

Χρωµατικοί χώροι (συνέχεια)

Ο χώρος HMMDHMMD µε άξονες Diff, Sum,Hue

1

1

4

8

S

1

2

4

4

8

S

4

4

4

4

16

S

4

4

4

8

32

S

488164

488163

481624

4441

11110

HHHHΥπο-διάστηµα

3264128256# bins

Κβάντιση του HMMD χώρου

Ο άξονας Diff διαµερίζεται στα εξής 5 διαστήµατα:

[0,6),[6,20),[20,60),[60,110), και [110,255)

Page 17: MPEG7 Multimedia Content Description Interface · 2018. 6. 8. · Απριλιος2005 ΠρωτόκολλοMPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένου

Απριλιος 2005Πρωτόκολλο MPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένουΣ. Φωτόπουλος ΠΑΝΕΠ. ΠΑΤΡΩΝ Τµ. ΦΥΣΙΚΗΣ– ΠΜΣ ΗΕΠ σ.17

Περιγραφή µε τα επικρατούντα χρώµατα (dominant color descriptor)

Προσφέρει µία περιγραφή των βασικών χρωµάτων µίαςεικόνας µε σκοπό την εύρεση (απόκτηση) των οµοίων εικόνων

Ορισµός: F=(ci, pi,υi),s i=1,2,..N

Ν ο αριθµός των (επικρατούντων) χρωµάτων. Ορίζεται ίδιος γιαόλη την βάση (συνήθης τιµή Ν=8)

ci είναι το χαρακτηριστικό διάνυσµα (πχ. RGB) της οµάδας (3bits)pi είναι το ποσοστό των pixels που αντιστοιχούν στην οµάδα iυi είναι η διακύµανση των pixels της οµάδας i.s αριθµός που περιγράφει την χωρική οµοιοµορφία

RGB είναι ο συνήθης χρωµατικός χώρος

Page 18: MPEG7 Multimedia Content Description Interface · 2018. 6. 8. · Απριλιος2005 ΠρωτόκολλοMPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένου

Απριλιος 2005Πρωτόκολλο MPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένουΣ. Φωτόπουλος ΠΑΝΕΠ. ΠΑΤΡΩΝ Τµ. ΦΥΣΙΚΗΣ– ΠΜΣ ΗΕΠ σ.18

Οµαδοποίηση των pixels και υπολογισµός των ci

Προτείνεται µία παραλλαγή τού Lloyd αλγόριθµου. ( Μπορεί ναχρησιµοποιηθεί ο fcmfcm)

Υπολογισµός των ποσοστών pi (Σpi=1)

Υπολογισµός της διακύµανσης υi κάθε οµάδας

Υπολογισµός της συνεκτικότητας για εύρεση οµάδων pixels µε ίδιο χρώµα στο επίπεδο της εικόνας. Η τιµή s είναι η µέσητιµή όλων των οµάδων

F=(ci, pi,υi),s Υπολογισµοί

Page 19: MPEG7 Multimedia Content Description Interface · 2018. 6. 8. · Απριλιος2005 ΠρωτόκολλοMPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένου

Απριλιος 2005Πρωτόκολλο MPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένουΣ. Φωτόπουλος ΠΑΝΕΠ. ΠΑΤΡΩΝ Τµ. ΦΥΣΙΚΗΣ– ΠΜΣ ΗΕΠ σ.19

Ο χώρος των χαρακτηριστικών -Οµαδοποίηση

Page 20: MPEG7 Multimedia Content Description Interface · 2018. 6. 8. · Απριλιος2005 ΠρωτόκολλοMPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένου

Απριλιος 2005Πρωτόκολλο MPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένουΣ. Φωτόπουλος ΠΑΝΕΠ. ΠΑΤΡΩΝ Τµ. ΦΥΣΙΚΗΣ– ΠΜΣ ΗΕΠ σ.20

pi

υι

R

G

F=(ci, pi,υi),s

Yπολογισµός των ci, pi,υi

Ci

Τα pixels της εικόνας οµαδοποιούνται στο χώρο χώρο των χαρακτηριστικώντων χαρακτηριστικών ( RGB) σε (Ν=8) οµάδες

Page 21: MPEG7 Multimedia Content Description Interface · 2018. 6. 8. · Απριλιος2005 ΠρωτόκολλοMPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένου

Απριλιος 2005Πρωτόκολλο MPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένουΣ. Φωτόπουλος ΠΑΝΕΠ. ΠΑΤΡΩΝ Τµ. ΦΥΣΙΚΗΣ– ΠΜΣ ΗΕΠ σ.21

F=(ci, pi,υi),s Yπολογισµός του s

Συνεκτικότητα:

∆είχνει την σχέση µεταξύ χώρου χαρακτηριστικών και επιπέδου εικόνας

pi

Η µέση τιµή των τµηµάτων που «χωρίζεται» το pi στο επίπεδο της εικόνας εκφράζει την τιµή s

Page 22: MPEG7 Multimedia Content Description Interface · 2018. 6. 8. · Απριλιος2005 ΠρωτόκολλοMPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένου

Απριλιος 2005Πρωτόκολλο MPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένουΣ. Φωτόπουλος ΠΑΝΕΠ. ΠΑΤΡΩΝ Τµ. ΦΥΣΙΚΗΣ– ΠΜΣ ΗΕΠ σ.22

j2i1

N

1i

N

1jj2,i1

N

1j

2j2

N

1i

2i121

2 ppa2pp)F,F(D1 221

∑∑∑∑= ===

−+=

⎭⎬⎫

⎩⎨⎧

>≤−

=dkl

dklmaxklkl Td0

Tdd/d1a dmax =aΤd

Μέτρα οµοιότητας

F1 F2ci1 pi1 υi1 ci2 pi2 υi2

Page 23: MPEG7 Multimedia Content Description Interface · 2018. 6. 8. · Απριλιος2005 ΠρωτόκολλοMPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένου

Απριλιος 2005Πρωτόκολλο MPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένουΣ. Φωτόπουλος ΠΑΝΕΠ. ΠΑΤΡΩΝ Τµ. ΦΥΣΙΚΗΣ– ΠΜΣ ΗΕΠ σ.23

Παραλλαγές1. Για χωρική συνάφεια

Ds=w1abs(s1-s2)D+w2

2. Για να συμπεριληφθεί και η υs

Μέτρα οµοιότητας

Page 24: MPEG7 Multimedia Content Description Interface · 2018. 6. 8. · Απριλιος2005 ΠρωτόκολλοMPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένου

Απριλιος 2005Πρωτόκολλο MPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένουΣ. Φωτόπουλος ΠΑΝΕΠ. ΠΑΤΡΩΝ Τµ. ΦΥΣΙΚΗΣ– ΠΜΣ ΗΕΠ σ.24

Περιγραφή Χρωματικής δομής (Color Structure Descriptor)

Τα ιστογράµµατα των δύο τµηµάτων είναι ίδια άλλα η χρωµατική δοµή διαφορετική

Είναι ένα έγχρωµο ιστόγραµµα µε πληροφορία και για την δοµή του χρώµατος. Για τον υπολογισµό χρησιµοποιείται ένα δοµικό στοιχείο

Page 25: MPEG7 Multimedia Content Description Interface · 2018. 6. 8. · Απριλιος2005 ΠρωτόκολλοMPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένου

Απριλιος 2005Πρωτόκολλο MPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένουΣ. Φωτόπουλος ΠΑΝΕΠ. ΠΑΤΡΩΝ Τµ. ΦΥΣΙΚΗΣ– ΠΜΣ ΗΕΠ σ.25

)m(hs m∈1,… M

s = το µέγεθος του δοµικού στοιχείου (πχ s=32)

M = το µέγεθος του κβαντισµένου χρωµατικού χώρου πουείναι ο HMMD ( Μ=256,128, 64, 32)

Η περιγραφή της χρωµατικής δοµής µίας εικόναςαναφέρεται στη κατανοµή του χρώµατος αφενός και στηχωρική δοµή αφετέρου

Μοιάζει µε έγχρωµο ιστόγραµµα

Color Structure Descriptor (συνέχεια)

Page 26: MPEG7 Multimedia Content Description Interface · 2018. 6. 8. · Απριλιος2005 ΠρωτόκολλοMPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένου

Απριλιος 2005Πρωτόκολλο MPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένουΣ. Φωτόπουλος ΠΑΝΕΠ. ΠΑΤΡΩΝ Τµ. ΦΥΣΙΚΗΣ– ΠΜΣ ΗΕΠ σ.26

Υπολογισµός του

1. Ορίζεται ο αριθµός των bins πχ 256

2. Γίνεται κβάντιση του χρωµατικού χώρου ΗΜΜD µέσα απόδιαδικασίες οµαδοποίησης

3. Ορίζεται ένα δοµικό στοιχείο (structuring element) δηλ έναπαράθυρο (συνήθως 8x8 ) που διατρέχει την εικόνα

4. Σε κάθε σηµείο του παραθύρου εντοπίζονται τα υπάρχοντα

χρώµατα και για κάθε ένα (χρώµα όχι pixel) προστίθεται µίαµονάδα στο αντίστοιχο bin

)m(hs

Color Structure Descriptor

Page 27: MPEG7 Multimedia Content Description Interface · 2018. 6. 8. · Απριλιος2005 ΠρωτόκολλοMPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένου

Απριλιος 2005Πρωτόκολλο MPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένουΣ. Φωτόπουλος ΠΑΝΕΠ. ΠΑΤΡΩΝ Τµ. ΦΥΣΙΚΗΣ– ΠΜΣ ΗΕΠ σ.27

Υπολογισµός του -παράδειγµα)m(hs

Color Structure Descriptor

Page 28: MPEG7 Multimedia Content Description Interface · 2018. 6. 8. · Απριλιος2005 ΠρωτόκολλοMPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένου

Απριλιος 2005Πρωτόκολλο MPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένουΣ. Φωτόπουλος ΠΑΝΕΠ. ΠΑΤΡΩΝ Τµ. ΦΥΣΙΚΗΣ– ΠΜΣ ΗΕΠ σ.28

Περιγραφή Χρωµατικoύ σχεδιασµού (Color Layout Descriptor-CLD)

Ενδείκνυται για γρήγορη ανάκτηση

Είναι ανεξάρτητος της ανάλυσης

Αναδεικνύει την χωρική κατανοµή του χρώµατος

Χρησιµοποιείται ο YCbCr χρωµατικός χώρος

Υλοποιείται σύµφωνα µε το διάγραµµα:

Εικόναεισόδου

Κατάτµηση σε 64 blocks

Επιλογή ενός χαρακτηριστικού χρώµατος για κάθεblock

DCTZigzag scanning and weighting

CLD

Page 29: MPEG7 Multimedia Content Description Interface · 2018. 6. 8. · Απριλιος2005 ΠρωτόκολλοMPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένου

Απριλιος 2005Πρωτόκολλο MPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένουΣ. Φωτόπουλος ΠΑΝΕΠ. ΠΑΤΡΩΝ Τµ. ΦΥΣΙΚΗΣ– ΠΜΣ ΗΕΠ σ.29

AijAijΑρχική εικόνα 64 blocks Εξαγωγή 64

διανυσµάτων

64 συντελεστές DCT για κάθε συνιστώσα, Y, Cb, Cr

Zig-zag scanning και επιλογή 12 συντελεστών - κβάντιση

Page 30: MPEG7 Multimedia Content Description Interface · 2018. 6. 8. · Απριλιος2005 ΠρωτόκολλοMPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένου

Απριλιος 2005Πρωτόκολλο MPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένουΣ. Φωτόπουλος ΠΑΝΕΠ. ΠΑΤΡΩΝ Τµ. ΦΥΣΙΚΗΣ– ΠΜΣ ΗΕΠ σ.30

Σύγκριση δύο εικόνων µε CLDs DY,DCb,DCr καιDY΄,DCb΄,DCr΄ γίνεται µε την εξής σχέση:

∑∑∑ −−+−=i

2΄iir

i

2΄iib

i

2΄iiy )DCrDCr(w)DCbDCb(w)DYDY(wD

Μέτρα οµοιότητας

Με τα βάρη w δίνεται έµφαση στις χαµηλές συχνότητες

Η σειρά των συντελεστών καθορίζεται από το διάνυσµα του zig-zag

Page 31: MPEG7 Multimedia Content Description Interface · 2018. 6. 8. · Απριλιος2005 ΠρωτόκολλοMPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένου

Απριλιος 2005Πρωτόκολλο MPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένουΣ. Φωτόπουλος ΠΑΝΕΠ. ΠΑΤΡΩΝ Τµ. ΦΥΣΙΚΗΣ– ΠΜΣ ΗΕΠ σ.31

Κλιµακωτή περιγραφή χρωµάτων(scalable color descriptor)

Ο περιγραφέας SCD ορίζεται στον χρωµατικό χώρο HSV

Χρησιµοποιεί το σχήµα κωδικοποίησης του µετασχηµατισµού Haar στο έγχρωµο ιστόγραµµα.

Ο µετασχηµατισµός Haar δηµιουργεί την κλιµακωτή περιγραφή που αποτελεί και το χαρακτηριστικό για διαδικασίες σύγκρισης εικόνων.

Ο περιγραφέας αυτός επεκτείνεται σε οµάδες εικόνων ή οµάδες στιγµιοτύπων σε δεδοµένα video (group of frames-GoF /group of pictures - GoP)

Page 32: MPEG7 Multimedia Content Description Interface · 2018. 6. 8. · Απριλιος2005 ΠρωτόκολλοMPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένου

Απριλιος 2005Πρωτόκολλο MPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένουΣ. Φωτόπουλος ΠΑΝΕΠ. ΠΑΤΡΩΝ Τµ. ΦΥΣΙΚΗΣ– ΠΜΣ ΗΕΠ σ.32

scalable color descriptor (συνέχεια)

Η βασική µονάδα του SCD αποτελείται από µία πράξη άθροισης και µία διαφοράς

Εφαρµόζεται σε διαδοχικές τιµές του (ακεραίας τιµής 4-bit) ιστογράµµατος.

Η κλιµάκωση γίνεται µε την άθροιση όπου σε διαδοχικά βήµατα λαµβάνουµε 256,128,64 ή 32 bin

Η διαφορά δεν έχει σηµαντική πληροφορία και γιαυτό χρησιµοποιεί µικρό αριθµό bits

Page 33: MPEG7 Multimedia Content Description Interface · 2018. 6. 8. · Απριλιος2005 ΠρωτόκολλοMPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένου

Απριλιος 2005Πρωτόκολλο MPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένουΣ. Φωτόπουλος ΠΑΝΕΠ. ΠΑΤΡΩΝ Τµ. ΦΥΣΙΚΗΣ– ΠΜΣ ΗΕΠ σ.33

(συνέχεια)

Page 34: MPEG7 Multimedia Content Description Interface · 2018. 6. 8. · Απριλιος2005 ΠρωτόκολλοMPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένου

Απριλιος 2005Πρωτόκολλο MPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένουΣ. Φωτόπουλος ΠΑΝΕΠ. ΠΑΤΡΩΝ Τµ. ΦΥΣΙΚΗΣ– ΠΜΣ ΗΕΠ σ.34

group of frames-GoFgroup of pictures - GoP

010

2030

4050

6070

8090

1ο Τρ. 2ο Τρ. 3ο Τρ. 4ο Τρ.

010

2030

4050

6070

8090

1ο Τρ. 2ο Τρ. 3ο Τρ. 4ο Τρ.

010

2030

4050

6070

8090

1ο Τρ. 2ο Τρ. 3ο Τρ. 4ο Τρ.

010

2030

4050

6070

8090

1ο Τρ. 2ο Τρ. 3ο Τρ. 4ο Τρ. 010

2030

4050

60

7080

90

1ο Τρ. 2ο Τρ. 3ο Τρ. 4ο Τρ.0

1020

3040

5060

7080

90

1ο Τρ. 2ο Τρ. 3ο Τρ. 4ο Τρ.0

1020

3040

5060

7080

90

1ο Τρ. 2ο Τρ. 3ο Τρ. 4ο Τρ.

010

2030

4050

6070

80

90

1ο Τρ. 2ο Τρ. 3ο Τρ. 4ο Τρ.

Αρχικά frames εξαγωγή ιστογραµµάτων «άθροιση»

Η «άθροιση» γίνεται:

Με µέση τιµή των ιστογραµµάτων (σε κάθε bin)

Με διάµεση τιµή (σε κάθε bin)

Με επιλογή του ελάχιστου (σε κάθε bin) -intersection

Page 35: MPEG7 Multimedia Content Description Interface · 2018. 6. 8. · Απριλιος2005 ΠρωτόκολλοMPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένου

Απριλιος 2005Πρωτόκολλο MPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένουΣ. Φωτόπουλος ΠΑΝΕΠ. ΠΑΤΡΩΝ Τµ. ΦΥΣΙΚΗΣ– ΠΜΣ ΗΕΠ σ.35

Περιγραφή υφής

Περιγραφέας οµοιογένειας (homogeneous texture descriptor)

Περιγραφέας ………….. (texture browsing descriptor)

Περιγραφέας ιστογράµµατος ακµών (edge histogram descriptor)

Page 36: MPEG7 Multimedia Content Description Interface · 2018. 6. 8. · Απριλιος2005 ΠρωτόκολλοMPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένου

Απριλιος 2005Πρωτόκολλο MPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένουΣ. Φωτόπουλος ΠΑΝΕΠ. ΠΑΤΡΩΝ Τµ. ΦΥΣΙΚΗΣ– ΠΜΣ ΗΕΠ σ.36

Περιγραφή ιστογράµµατος ακµών (edge histogram descriptor -EHD)

Τα βήµατα:Χωρίζεται η εικόνα σε 4x4=16υποεικόνεςΚάθε υποεικόνα χωρίζεται σε τετραγωνικά blocks (~1100)Και κάθε block χαρακτηρίζεται µε ένα τύπο ακµής: οριζόντια

κάθετη διαγώνια 45 διαγώνια 135 χωρίς κατεύθυνση

Page 37: MPEG7 Multimedia Content Description Interface · 2018. 6. 8. · Απριλιος2005 ΠρωτόκολλοMPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένου

Απριλιος 2005Πρωτόκολλο MPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένουΣ. Φωτόπουλος ΠΑΝΕΠ. ΠΑΤΡΩΝ Τµ. ΦΥΣΙΚΗΣ– ΠΜΣ ΗΕΠ σ.37

Το ιστόγραµµα των ακµών υπολογίζεται ως εξής:h(0)=σχετικός αριθµός καθέτων ακµών στην υποεικόνα (0,0)

h(1)=σχετικός αριθµός οριζοντίων ακµών στην υποεικόνα (0,0)

h(2)=σχετικός αριθµός 45ο ακµών στην υποεικόνα (0,0)

h(3)=σχετικός αριθµός 135ο ακµών στην υποεικόνα (0,0)

h(4)=σχετικός αριθµός ακµών χωρίς κατεύθυνση στην υποεικόνα (0,0)

……………………………………………………………………………….

………………………………………………………………………………..

h(79)=σχετικός αριθµός ακµών χωρίς κατεύθυνση στην υποεικόνα (3,3)

0,0 0,1 0,2 0,3

1,0 1,1 1,2 1,3

2,0 2,1 2,2 2,3

3,0 3,1 3,2 3,3

Page 38: MPEG7 Multimedia Content Description Interface · 2018. 6. 8. · Απριλιος2005 ΠρωτόκολλοMPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένου

Απριλιος 2005Πρωτόκολλο MPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένουΣ. Φωτόπουλος ΠΑΝΕΠ. ΠΑΤΡΩΝ Τµ. ΦΥΣΙΚΗΣ– ΠΜΣ ΗΕΠ σ.38

Η µέγιστη τιµή εφόσον είναι µεγαλύτερη από ένα κατώφλιο χαρακτηρίζει το block

Τελεστές για αναγνώριση των ακµών.

Page 39: MPEG7 Multimedia Content Description Interface · 2018. 6. 8. · Απριλιος2005 ΠρωτόκολλοMPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένου

Απριλιος 2005Πρωτόκολλο MPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένουΣ. Φωτόπουλος ΠΑΝΕΠ. ΠΑΤΡΩΝ Τµ. ΦΥΣΙΚΗΣ– ΠΜΣ ΗΕΠ σ.39

Εφαρµογές – ∆ιαχείριση δεδοµένων φυτών

Φύλλα

Άνθη

Βλαστοί

Page 40: MPEG7 Multimedia Content Description Interface · 2018. 6. 8. · Απριλιος2005 ΠρωτόκολλοMPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένου

Απριλιος 2005Πρωτόκολλο MPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένουΣ. Φωτόπουλος ΠΑΝΕΠ. ΠΑΤΡΩΝ Τµ. ΦΥΣΙΚΗΣ– ΠΜΣ ΗΕΠ σ.40

Περιγραφή φύλλων

Σχήµα

Νεύρωση

Page 41: MPEG7 Multimedia Content Description Interface · 2018. 6. 8. · Απριλιος2005 ΠρωτόκολλοMPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένου

Απριλιος 2005Πρωτόκολλο MPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένουΣ. Φωτόπουλος ΠΑΝΕΠ. ΠΑΤΡΩΝ Τµ. ΦΥΣΙΚΗΣ– ΠΜΣ ΗΕΠ σ.41

Περιγραφή φύλλων (συνέχεια)

κώδικες αλυσίδαςµετασχ. «medial axis»Fourier descriptorsΚαµπύλη αποστάσεων Καµπύλη αποστάσεων από το κέντρο βάρουςαπό το κέντρο βάρους(centroid contour distance)

ΚυκλικότηταΚυκλικότητα

Ιστόγραµµα κώδικα γωνίαςΙστόγραµµα κώδικα γωνίας

Εκκεντρότητα (Εκκεντρότητα (eccentricity)eccentricity)

C

PRα

2)µετροςίπερ()όεµβαδ(π4α =

Α. Εξαγωγή Χαρακτηριστικών σχήµατος

ήιδιοτιµτερηύµεγαλήιδιοτιµτερηόµικρε =

Page 42: MPEG7 Multimedia Content Description Interface · 2018. 6. 8. · Απριλιος2005 ΠρωτόκολλοMPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένου

Απριλιος 2005Πρωτόκολλο MPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένουΣ. Φωτόπουλος ΠΑΝΕΠ. ΠΑΤΡΩΝ Τµ. ΦΥΣΙΚΗΣ– ΠΜΣ ΗΕΠ σ.42

Β1. Καµπύλης αποστάσεων (από το κέντρο βάρους) -CCD

Β2. Ιστογράµµατος κώδικα γωνίας –ACH

B3. Εκκεντρότητα - Eccentricity

Περιγραφή φύλλων (συνέχεια)

Β. Μέτρα οµοιότητας σχήµατος

mj21c

n

1i21

D,...D,..D,DminDn

)i(f)i(fD =

−=∑=

∑=

−=m

1iiih )J(H)I(H)J,I(D

JIe ee)J,I(D −=

Page 43: MPEG7 Multimedia Content Description Interface · 2018. 6. 8. · Απριλιος2005 ΠρωτόκολλοMPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένου

Απριλιος 2005Πρωτόκολλο MPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένουΣ. Φωτόπουλος ΠΑΝΕΠ. ΠΑΤΡΩΝ Τµ. ΦΥΣΙΚΗΣ– ΠΜΣ ΗΕΠ σ.43

Περιγραφή ανθέων

Βασικό χαρακτηριστικό: Χρώµα – περιοχή χρώµατος

Αλλα χαρακτηριστικά: Σχήµα - Υφή

Page 44: MPEG7 Multimedia Content Description Interface · 2018. 6. 8. · Απριλιος2005 ΠρωτόκολλοMPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένου

Απριλιος 2005Πρωτόκολλο MPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένουΣ. Φωτόπουλος ΠΑΝΕΠ. ΠΑΤΡΩΝ Τµ. ΦΥΣΙΚΗΣ– ΠΜΣ ΗΕΠ σ.44

A1. Εγχρωµο ιστόγραµµα

A2. Οµαδες χρωµάτων (clustering)

A3. Χωρική κατανοµή χρωµάτων

Α. Εξαγωγή Χαρακτηριστικών

Περιγραφή ανθέων (συνέχεια)

Β. Μέτρα οµοιότηταςΒ1. Απόσταση εγχρώµων ιστογραµµάτων

Β2. Απόσταση “χωρικών” ιστογραµµάτων

B3. Απόσταση βασικών χρωµατων (DCD)

Page 45: MPEG7 Multimedia Content Description Interface · 2018. 6. 8. · Απριλιος2005 ΠρωτόκολλοMPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένου

Απριλιος 2005Πρωτόκολλο MPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένουΣ. Φωτόπουλος ΠΑΝΕΠ. ΠΑΤΡΩΝ Τµ. ΦΥΣΙΚΗΣ– ΠΜΣ ΗΕΠ σ.45

Μια µορφή αναπαράστασης εικόνων στο διδιάστατο χώρο. Κάθε µία εικόνα παριστάνεται µε ένα διάνυσµα χαρακτηριστικών. Και όλη η βάση µε ένα πίνακα αποστάσεων. Ελαττώνοντας τη διάσταση του χώρου σε 2 «βλέπουµε» την βάση στο επίπεδο

Χώρος των Χαρακτηριστικών και ελάττωση διάστασης

Page 46: MPEG7 Multimedia Content Description Interface · 2018. 6. 8. · Απριλιος2005 ΠρωτόκολλοMPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένου

Απριλιος 2005Πρωτόκολλο MPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένουΣ. Φωτόπουλος ΠΑΝΕΠ. ΠΑΤΡΩΝ Τµ. ΦΥΣΙΚΗΣ– ΠΜΣ ΗΕΠ σ.46

1. Introduction to MPEG7, B.Smanjunath, P. Salembier and T. Sikora Eds,J.Wiley&Sons, Ltd, ENGLAND, 2002, Chapter13

2. B. S. Manjunath, Jens-Rainer Ohm, Vinod V. Vasudevan and Akio Yamada Color and Texture Descriptors IEEE Trans. On Circuits and Systems for Video Technology, VOL.11, NO. 6, JUNE 2001

3. http://www.lgcit.com/MIGR/cmip/hmmd/hmmd.html

4. http://www.lis.ei.tum.de/research/bv/topics/mmdb/e_mpeg7.html

5. Text of ISO/IEC 15 938-3 Multimedia Content Description Interface- Part 3:Visual. Final Committee Draft, ISO/ IEC/ JTC1/ SC29/WG11, Doc. N4062,Mar. 2001.

6. MPEG-7 Visual Experimentation Model (XM), Version 10. ISO/IEC/JTC1/SC29/WG11, Doc. N4063, Mar. 2001

Βιβλιογραφία

Page 47: MPEG7 Multimedia Content Description Interface · 2018. 6. 8. · Απριλιος2005 ΠρωτόκολλοMPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένου

Απριλιος 2005Πρωτόκολλο MPEG7 – Περιγραφή εικόνας βάσει του περιεχοµένουΣ. Φωτόπουλος ΠΑΝΕΠ. ΠΑΤΡΩΝ Τµ. ΦΥΣΙΚΗΣ– ΠΜΣ ΗΕΠ σ.47

MPEG7 Ασκήσεις - εργασίες1. Υλοποίηση face descriptor

2. Υλοποίηση texture descriptor

3. Shape descriptor

4. ∆ιαχείριση δεδοµένων σε φυτά

α) κλασσικά εργαλεία διαχείρισης( Lucid, Uconn, CALFORA)

β) υπολογιστικά (computer aided) εργαλεία διαχείρισης

5. Επεξεργασία εικόνας και ανάκτηση α) «φύλλα», β) άνθη

εφαρµογή στη βάση του Corel

6. Ανάκτηση (βάσει περιεχοµένου) ιατρικών δεδοµένων

1ας, 2, 3 και 4 διαστάσεων