37
Αναγνώριση Προτύπων

Αναγνώριση Προτύπων

Embed Size (px)

DESCRIPTION

Αναγνώριση Προτύπων. Σήμερα! . Περιεχόμενο μαθήματος Διαδικαστικά Απαλλακτικές Εργασίες Εισαγωγή στο αντικείμενο του μαθήματος. Περιεχόμενο μαθήματος. Θεωρία Bayes Ταξινομητές (classification) Συναρτήσεις Κόστους Εξαγωγή Χαρακτηριστικών Μείωση διαστάσεων Επιλογή Χαρακτηριστικών - PowerPoint PPT Presentation

Citation preview

Page 1: Αναγνώριση Προτύπων

Αναγνώριση Προτύπων

Page 2: Αναγνώριση Προτύπων

Σήμερα!

Περιεχόμενο μαθήματοςΔιαδικαστικάΑπαλλακτικές ΕργασίεςΕισαγωγή στο αντικείμενο του

μαθήματος

Page 3: Αναγνώριση Προτύπων

Περιεχόμενο μαθήματος

Θεωρία Bayes Ταξινομητές (classification) Συναρτήσεις Κόστους Εξαγωγή Χαρακτηριστικών Μείωση διαστάσεων Επιλογή Χαρακτηριστικών Ταίριασμα Προτύπου Κρυμμένα Μοντέλα Markov Ομαδοποίηση (clustering) Εφαρμογές Και…Matlab

Page 4: Αναγνώριση Προτύπων

Βαθμολόγηση Μαθήματος

1. Εργαστηριακές ασκήσεις σε Matlab 20%.

2. Συγγραφή εργασίας και παράδοση έως 28/11/2010 20%.

3. Παρουσίαση και εξέταση εργασίας 29/11/2010 20%.

4. Υλοποίηση συμφωνημένου τμήματος σε Matlab και εξέταση 40%.

Page 5: Αναγνώριση Προτύπων

Απαλλακτικές Εργασίες

Η εξέταση στο μάθημα γίνεται με εργασία.

Κάθε ομάδα εργασίας μπορεί να αποτελείται από 1-2 άτομα.

Η ομάδα οφείλει να δηλώσει τη συμμετοχή της μέσω e-mail, μέχρι 12/10 καθώς και δύο επιλογές από τα πιο κάτω θέματα, με σειρά προτίμησης.

Το κάθε θέμα θα δοθεί μόνο μία φορά και θα τηρηθεί σειρά προτεραιότητας.

Page 6: Αναγνώριση Προτύπων

Θέματα 2010-2011

1.     Αναγνώριση δυσδιάστατου σχήματος2.     Εκτίμηση κίνησης από δορυφορική λήψη3.     Ανίχνευση ηχητικού σήματος4.     Ταξινόμηση και ανάκτηση video5.     Ανίχνευση κίνησης αντικειμένου6.     Μείωση διαστάσεων7.     Ανίχνευση και διάγνωση με χρήση Η/Υ8.     Ανίχνευση και αναγνώριση

αντικειμένων9.     Ανάκτηση 3D σχήματος10.   Κατάτμηση εικόνων εγγράφων

Page 7: Αναγνώριση Προτύπων

Βιβλία

1.     Εισαγωγή στην αναγνώριση προτύπων με Matlab

Κωδικός Βιβλίου στον Εύδοξο: 45214 Έκδοση: 1η έκδ. Συγγραφείς: Θεοδωρίδης Σέργιος,Πικράκης

Α.,Κουτρουμπάς Κωνσταντίνος Σ.,Κάβουρας Δ.  2.     Αναγνώριση προτύπων Κωδικός Βιβλίου στον Εύδοξο: 6378 Έκδοση: 1/2007 Συγγραφείς: ΣΤΡΙΝΤΖΗΣ ΜΙΧΑΛΗΣ

Page 8: Αναγνώριση Προτύπων

Matlab

Το MATLAB (matrix laboratory) είναι ένα περιβάλλον αριθμητικής υπολογιστικής και μια προγραμματιστική γλώσσα τέταρτης γενιάς.

Αποθηκεύει και κάνει τις πράξεις με βάση την άλγεβρα πινάκων.

Η τρέχουσα έκδοσή του είναι η R2010b η οποία κυκλοφόρησε στις 3 Σεπτεμβρίου του 2010.

Χρησιμοποιείται κατά κύριο λόγο για την επίλυση μαθηματικών προβλημάτων, ωστόσο είναι πολύ "ισχυρό" και μπορεί να χρησιμοποιηθεί και για προγραμματισμό καθώς περιέχει εντολές από την C++ όπως την while, την switch και την if.

Page 9: Αναγνώριση Προτύπων

Matlab links

Εισαγωγή στην Matlab των Γ. Γεωργίου και Χ. Ξενοφώντος

http://www2.ucy.ac.cy/~georgios/bookfiles/MATLABbook.pdf

Ιστοσελίδα Matlab

http://www.mathworks.com/products/matlab/tryit.html

Page 10: Αναγνώριση Προτύπων

Αναγνώριση Προτύπων από Άνθρωπο

Αναγνωρίζουμε ένα πρόσωπο Αντιλαμβανόμαστε τον προφορικό

λόγο Διαβάζουμε χειρόγραφα κείμενα Αναγνωρίζουμε τα κλειδιά του

αυτοκινήτου στην τσέπη μας Αποφασίζουμε αν ένα μήλο έχει

σαπίσει από τη μυρωδιά του

Η διαδικασία κατά την οποία παρατηρούμε απλά δεδομένα και λαμβάνουμε αποφάσεις βασιζόμενες στην «κατηγορία» του προτύπου.

Page 11: Αναγνώριση Προτύπων

Αναγνώριση Προτύπωναπό υπολογιστικά συστήματα

Η αυτόματη αναγνώριση φωνής Η αναγνώριση μέσω δαχτυλικών

αποτυπωμάτων Η οπτική αναγνώριση χαρακτήρων

κειμένου Η αναγνώριση ακολουθιών DNA

Για κάποια προβλήματα όπως είναι η ομιλία και η οπτική αναγνώριση, οι προσπάθειες σχεδιασμού μπορεί να εμπνευστούν από τη γνώση του πώς αυτά επιλύονται-λειτουργούν στη φύση.

Page 12: Αναγνώριση Προτύπων

Παράδειγμα - Πρόβλημα

Υποθέστε ότι ένα εργοστάσιο πακεταρίσματος επιθυμεί να αυτοματοποιήσει τη διαδικασία ταξινόμησης των εισερχομένων ψαριών επάνω σε έναν ιμάντα μεταφοράς, ανάλογα με το είδος του ψαριού.

Συγκεκριμένα θέλουμε να διαχωρίζονται μέσω οπτικών αισθητήρων τα ψάρια «σολομός» και «πέρκα».

Page 13: Αναγνώριση Προτύπων

Παράδειγμα - Διαδικασία

Στήνουμε μια κάμερα Παίρνουμε κάποιες εικόνες

δειγματοληπτικά Αρχίζουμε να παρατηρούμε κάποιες

φυσικές διαφορές μεταξύ των δύο αυτών ειδών ψαριού (χαρακτηριστικά features):– Μήκος– Χρωματισμός – Πλάτος – Ο αριθμός και το σχήμα των

λεπιών τους

Page 14: Αναγνώριση Προτύπων

Παράδειγμα - Διαδικασία

Παρατηρείται η ύπαρξη ανεπιθύμητου θορύβου και κάποιων διαταραχών στις εικόνες:– διαφορές στο χρωματισμό – στη θέση των ψαριών στον

ιμάντα μεταφοράς

Page 15: Αναγνώριση Προτύπων

Παράδειγμα - Μοντελοποίηση

Κάθε τεχνική που βοηθάει και συντελεί στην καλύτερη ολοκλήρωση του τελευταίου μέρους πρέπει να ληφθεί υπόψη από το σχεδιαστή συστημάτων αναγνώρισης προτύπων.

Υπάρχουν διαφορές μεταξύ των

πληθυσμών της πέρκας και του σολομού;

έχουν διαφορετικά μοντέλα (models):

διαφορετική περιγραφή με μαθηματικό τύπο.

Κάθε πρότυπο το αντιστοιχούμε στο

μοντέλο που το περιγράφει καλύτερα

Επεξεργαζόμαστε τα δεδομένα που

λαμβάνουμε από τους αισθητήρες

Υποθέτουμε τις διάφορες κλάσεις

των μοντέλων

Page 16: Αναγνώριση Προτύπων

Σύστημα Αναγνώρισης Προτύπων

Η κάμερα λαμβάνει μια εικόνα από το ψάρι

Η εικόνα προεπεξεργάζεται (preprocessed) για να απλοποιηθούν οι επόμενες πράξεις χωρίς να χαθούν όμως ζωτικές πληροφορίες: – τμηματοποίηση (segmentation):

εικόνες από διαφορετικά ψάρια κατά κάποιο τρόπο απομονώνονται η μια από την άλλη και από το φόντο (background).

Page 17: Αναγνώριση Προτύπων

Σύστημα Αναγνώρισης Προτύπων

H πληροφορία από ένα μόνο ψάρι στέλνεται σε ένα εξαγωγέα χαρακτηριστικών (feature extractor): – η λειτουργία του επικεντρώνεται

στο να μειώσει τον όγκο των δεδομένων, λαμβάνοντας υπόψη του μόνο κάποια σημαντικά «χαρακτηριστικά» ή «ιδιότητες».

Οι τιμές αυτών των χαρακτηριστικών περνάνε σε ένα ταξινομητή που παίρνει την τελική απόφαση

Page 18: Αναγνώριση Προτύπων
Page 19: Αναγνώριση Προτύπων

Επιλογή Χαρακτηριστικών

Ένας υπάλληλος στο τμήμα διαχωρισμού των ψαριών μας αποκάλυψε ότι γενικά η πέρκα είναι μεγαλύτερη σε μήκος από το σολομό.

Αυτό μας δίνει κάποια δοκιμαστικά μοντέλα για τα ψάρια: Οι πέρκες έχουν κάποιο τυπικό μήκος και αυτό είναι μεγαλύτερο από το μήκος των σολομών.

Το μήκος είναι ένα προφανές χαρακτηριστικό και μπορούμε να προσπαθήσουμε να ταξινομήσουμε ένα ψάρι ανάλογα με το μήκος του

Για να επιλέξουμε το κατώφλι l* θα μπορούσαμε να πάρουμε κάποια δείγματα εκπαίδευσης ή σχεδίασης από ψάρια των δύο ειδών, να κάνουμε μετρήσεις και να επιθεωρήσουμε τα αποτελέσματα.

Page 20: Αναγνώριση Προτύπων

Επιλογή ΧαρακτηριστικώνΑνεξάρτητα από το l*, δεν μπορούμε αξιόπιστα να ξεχωρίσουμε την πέρκα από το σολομό μόνο βάση του μήκους

Page 21: Αναγνώριση Προτύπων

Επιλογή Χαρακτηριστικών

Προχωράμε στην επιλογή άλλου χαρακτηριστικού πχ.– ο μέσος όρος φωτεινότητας του

χρώματος του ψαριού

Τώρα πρέπει να είμαστε πολύ προσεκτικοί ώστε να εξαλείψουμε τις αποκλίσεις της φωτεινότητας

Page 22: Αναγνώριση Προτύπων

Επιλογή Χαρακτηριστικών

Page 23: Αναγνώριση Προτύπων

Επιλογή Χαρακτηριστικών & Κόστος Απόφασης

Αποφασίζοντας πέρκα αντί για το σωστό (σολομός) έχει το ίδιο κόστος με το αντίστροφο

Φανταστείτε το παράδειγμα ενός ταξινομητή για νάρκες ενεργές ή μη

Έστω ότι μια εταιρεία γνωρίζει ότι οι πελάτες της δέχονται κομμάτια σολομού στις κονσέρβες τους «πέρκα», όμως δυσανασχετούν για κομμάτια πέρκας στην κονσέρβα τους «σολομός».

Πρέπει να μεταφερθεί το όριο απόφασης σε χαμηλότερες τιμές φωτεινότητας

Page 24: Αναγνώριση Προτύπων

Θεωρία Αποφάσεων

Ασχολείται με το συνολικό κόστος που σχετίζεται με την απόφασή μας και τη δημιουργία ενός κανόνα απόφασης τέτοιο ώστε να ελαχιστοποιηθεί το κόστος αυτό.

Page 25: Αναγνώριση Προτύπων

Επιλογή Χαρακτηριστικών

Ακόμη και αν γνωρίζουμε το κόστος το οποίο συνδέεται με τις αποφάσεις μας και διαλέξουμε το κρίσιμο σημείο x*, μπορεί να απογοητευτούμε με το ανακριβές αποτέλεσμα που θα προκύψει.

Η πρώτη μας προσπάθεια τότε είναι να ψάξουμε για κάποιο άλλο διαφορετικό χαρακτηριστικό πάνω στο οποίο θα στηριχτούμε για να διαχωρίσουμε τα ψάρια.

Ας υποθέσουμε όμως ότι κανένα άλλο οπτικό χαρακτηριστικό από μόνο του δεν λειτουργεί καλύτερα από τη φωτεινότητα.

Για να βελτιώσουμε την αναγνώριση, τότε πρέπει να καταφύγουμε στη χρήση περισσότερων του ενός χαρακτηριστικών.

Page 26: Αναγνώριση Προτύπων

Επιλογή Χαρακτηριστικών Μπορούμε να στηριχθούμε στο γεγονός ότι η

πέρκα είναι γενικά πιο μεγάλη σε πλάτος από το σολομό.

Τώρα έχουμε δύο χαρακτηριστικά: – την φωτεινότητα x1 – το πλάτος x2

Τότε ο εξαγωγέας χαρακτηριστικών έχει «μειώσει» την εικόνα για κάθε ψάρι σε ένα σημείο ή αλλιώς σε ένα διάνυσμα χαρακτηριστικών x, σε ένα δύο διαστάσεων χώρο χαρακτηριστικών:

2

1

x

xx

Page 27: Αναγνώριση Προτύπων

Ταξινόμηση To πρόβλημα μας στη συνέχεια, έγκειται στο να

διαχωρίσουμε αυτό το χώρο χαρακτηριστικών σε δύο περιοχές:– Αυτές οι περιοχές θα είναι διαχωρισμένες έτσι

ώστε για όλα τα σημεία εντός της μίας περιοχής να ονομάζουμε το ψάρι «πέρκα» και εντός της άλλης περιοχής να το ονομάζουμε «σολομό».

Aς υποθέσουμε ότι μετράμε τα διανύσματα των χαρακτηριστικών για τα δείγματα μας

Ταξινομούμε τα ψάρια ως «πέρκα» αν το διάνυσμα των χαρακτηριστικών του είναι πάνω από το όριο απόφασης και ως «σολομό» διαφορετικά.

Page 28: Αναγνώριση Προτύπων

Ταξινόμηση

Page 29: Αναγνώριση Προτύπων

Προβλήματα στην επιλογή Χαρακτηριστικών

Εκτός από τη φωτεινότητα και το πλάτος των ψαριών μπορούμε ακόμη να συμπεριλάβουμε κάποια σχηματική παράμετρο:– όπως είναι η κυρτή γωνία του ραχιαίου

πτερυγίου – την τοποθεσία των οφθαλμών

Κάποια χαρακτηριστικά μπορεί να είναι πλεονάζοντα. – Για παράδειγμα, αν το χρώμα των

ματιών των ψαριών σχετίζεται άψογα και με το πλάτος τους, τότε η επιλογή του χρώματος του ματιού ως χαρακτηριστικό θα είναι πλεονάζουσα.

Page 30: Αναγνώριση Προτύπων

Προβλήματα στην επιλογή Χαρακτηριστικών

Πως γνωρίζουμε εκ των προτέρων ποιο από τα χαρακτηριστικά θα δουλέψει καλύτερα;

Κάποια χαρακτηριστικά είναι δύσκολο (ή ακριβό) να μετρηθούν ή απλώς προσφέρουν μικρή βελτίωση στον ταξινομητή ή ακόμη χειροτερεύουν την ταξινόμηση.

Μια άλλη προσέγγιση θα ήταν να πάρουμε όσο το δυνατόν περισσότερα δείγματα εκπαίδευσης για να έχουμε την όσο το δυνατόν καλύτερη εκτίμηση των σχετικών χαρακτηριστικών. Σε κάποια προβλήματα όμως, το πλήθος των δεδομένων είναι περιορισμένο.

Page 31: Αναγνώριση Προτύπων

Προβλήματα στην επιλογή Χαρακτηριστικών

Αν τα μοντέλα μας ήταν πολύ περίπλοκα, ο ταξινομητής μας θα είχε όριο απόφασης πιο πολύπλοκο από την απλή ευθεία γραμμή.

Ο κεντρικός σκοπός μας, όταν κατασκευάζουμε ένα ταξινομητή, είναι να μας προτείνει δράσεις όταν παρουσιάζονται σε αυτόν νέα πρότυπα όπως π.χ. κάποιο ψάρι που δεν έχει ξαναδεί. Αυτό είναι γνωστό με τον όρο γενίκευση.

Page 32: Αναγνώριση Προτύπων

Προβλήματα στην επιλογή Χαρακτηριστικών

Page 33: Αναγνώριση Προτύπων

Προβλήματα στην επιλογή Χαρακτηριστικών

Ψάχνουμε να απλοποιήσουμε τον ταξινομητή μας και το όριο απόφασης

Συμβιβαζόμαστε με μια πιο χαμηλή απόδοση του ταξινομητή μας στα δεδομένα εκπαίδευσης, αν αυτό οδηγήσει σε έναν ταξινομητή με καλύτερη απόδοση σε καινούρια πρότυπα

Page 34: Αναγνώριση Προτύπων

Ταξινόμηση

Η ταξινόμηση είναι μια διαδικασία εύρεσης του μοντέλου που γεννάει τα πρότυπα

Διάφορες τεχνικές αναγνώρισης είναι χρήσιμες ανάλογα με το είδος των υποψηφίων μοντέλων

Στην Στατιστική Αναγνώριση Προτύπων επικεντρωνόμαστε στις στατιστικές ιδιότητες των προτύπων

Στην Συντακτική Αναγνώριση Προτύπων το μοντέλο μας αποτελείται από ένα σύνολο από λογικούς κανόνες

Page 35: Αναγνώριση Προτύπων

Χρήση Ταξινομητή

Διαφορετικές αποφάσεις μπορεί να απαιτούν διαφορετικά χαρακτηριστικά και όρια – αν θέλουμε να κατατάσσει τα ψάρια

ανάλογα με το φύλο τους – αν θέλουμε να επιλέξουμε τα

αλλοιωμένης εμφάνισης ψάρια Για τα ίδια εισαγόμενα στον ταξινομητή

πρότυπα χρησιμοποιούμε άλλη συνάρτηση κόστους ή κάνουμε διαφορετικό διαχωρισμό.

Page 36: Αναγνώριση Προτύπων

Συμπεράσματα

Ο άνθρωπος έχει την ικανότητα να «δουλεύει» καλά σε διαφορετικά προβλήματα αναγνώρισης προτύπων και να εναλλάσσεται στιγμιαία μεταξύ τους

Η δημιουργία μοντέλου αναγνώρισης προτύπων για γενική χρήση είναι δύσκολο εγχείρημα

Κατά τη σχεδίαση του μοντέλου οι αποφάσεις μας βασίζονται στο κόστος και την εργασία που επιθυμούμε

Page 37: Αναγνώριση Προτύπων

Συμπεράσματα Είναι σημαντικό σε κάθε πρόβλημα αναγνώρισης

προτύπων να κατασκευάσουμε μια «επιτυχή» αναπαράσταση, με απλές δομικές σχέσεις ανάμεσα στα χαρακτηριστικά

Πρέπει μέσω της αναπαράστασης να εκφράζεται το πραγματικό μοντέλο των προτύπων

Τα πρότυπα που οδηγούν στην ίδια απόφαση πρέπει να είναι κοντά και όσο γίνεται πιο μακριά από τα πρότυπα που οδηγούν σε διαφορετική απόφαση.

Επιλέγουμε έναν μικρό αριθμό χαρακτηριστικών που:– να οδηγήσουν σε απλούστερες περιοχές

απόφασης – να απλοποιήσουν το χρόνο εκπαίδευσης του

ταξινομητή