Αποθήκες δεδομένων και εξόρυξη γνώσης

Αποθήκες δεδομένων και εξόρυξη γνώσης

Data Mining Using Learning Automata

Γιαννάκης Κωνσταντίνος27/4/2011

Εισαγωγή

• προτείνεται ένας νέος αλγόριθμος για το ζήτημα της κατηγοριοποίησης στην εξόρυξη γνώσης (τον ονομάζουν LA-miner )

• βασίζεται σε έναν αλγόριθμο βελτιστοποίησης που χρησιμοποιεί learning automata (LA, στα ελληνικά αυτόματα μάθησης)

• Γίνεται σύγκρισή του με δύο άλλους αλγόριθμους (τον Ant-miner και τον CN2)

• η γνώση που εξάγεται από τον LA-miner εκφράζεται με την μορφή κανόνων “IF-THEN”• Στο πρώτο σκέλος έχουν ένα σύνολο συνθηκών (ή όρων)

που συνδέεται με λογικούς τελεστές συνένωσης (π.χ. AND)

• το δεύτερο καθορίζει την κλάση που προβλέπει για περιπτώσεις των οποίων τα προβλεπόμενα χαρακτηριστικά ικανοποιούν που ορίστηκαν στο “IF…”

IF < term1 AND term2 AND ...> THEN <class>

Learning automata

• Είναι προσαρμοστικές μονάδες λήψης αποφάσεων

• Μπορούν να «μάθουν» να επιλέγουν την βέλτιστη λειτουργία από ένα σετ ενεργειών «επικοινωνώντας» με ένα περιβάλλον (χώρος αναζήτησης ή search space)

• Με άλλα λόγια είναι στοχαστικά αυτόματα που αλληλεπιδρούν με ένα τυχαίο περιβάλλον.

Learning automata(συνέχεια…)

• Δεν χρειάζονται ιδιαίτερη γνώση για το περιβάλλον ή τις υπό βελτιστοποίηση λειτουργίες!

• Χαρακτηρίζονται από:– Ένα σύνολο καταστάσεων, ενέργειες εισόδου,

κατανομές πιθανοτήτων για τις καταστάσεις και ένα σχέδιο ενίσχυσης (feedback στο περιβάλλον)

Το σχήμα ενός LA που αλληλεπιδρά με το περιβάλλον

A R

Ορισμός LA και περιβάλλοντος

• Ορίζονται ως τα σύνολα < A,Q, R, L > και < A, R,D > αντίστοιχα

– A = {α1,α2 ,…,αr } είναι το πλήθος των ενεργειών του αυτόματου όπου α(k) είναι το αυτόματο τη στιγμή k με α(k) A ∈ για k = 0,1,2,... και r είναι ο συνολικός αριθμός των ενεργειών. Στην πραγματικότητα, το A είναι το σύνολο των εξόδων του αυτομάτου, άρα και σύνολο των εισόδων του περιβάλλοντος

– R είναι το πεδίο ορισμού των αποκρίσεων του περιβάλλοντος- Έστω ότι το β(k) δηλώνει την απόκριση που λαμβάνει το αυτόματο τη στιγμή k,

όπου β(k)∈ R ∀k. Αντίθετα από το A, αποτελεί την έξοδο του περιβάλλοντος και την ταυτόχρονη είσοδο του αυτόματου

Ορισμός LA και περιβάλλοντος(συνέχεια)

• D = {d1, d2 ,…, dr } είναι το σύνολο των πιθανοτήτων ανταμοιβής (reward probabilities), όπου di(k) = E[β(k) |α(k) =αi ]. Οι πιθανότητες ανταμοιβής είναι άγνωστες για το αυτόματο.

• Q είναι κατάσταση του αυτόματου που ορίζεται από την συνάρτηση Q(k) = [P(k), Ď(k)] όπου:

– P(k) = [ p1(k), p2(k),…, pr(k)] είναι το διάνυσμα των πιθανοτήτων ενέργειας (action

probability) ( 0 ≤ p1(k) ≤ 1 και ) και

– Ď(k) = [ď1(k), ď2(k), , ďr(k)] είναι το διάνυσμα των εκτιμήσεων των πιθανοτήτων

ανταμοιβής τη στιγμή k

• L είναι ο αλγόριθμος μάθησης ή το σχέδιο ενίσχυσης που χρησιμοποιεί το αυτόματο για να ενημερώσει τις καταστάσεις του. Στην πραγματικότητα:

Q(k +1) = L(Q(k),α(k),β(k))

LA (συνοπτικά)

• Κάθε στιγμή k, το αυτόματο επιλέγει ένα α(k) από το A ανάλογα με το P(k). Το α(k) γίνεται η είσοδος του περιβάλλοντος και αυτό με τη σειρά του δίνει μια τυχαία απάντηση β(k) σαν είσοδο πίσω στο αυτόματο με αναμενόμενη τιμή di(k) αν α(k) = αi . Έπειτα υπολογίζει το Q(k +1) χρησιμοποιώντας το L.

• Αυτή η διαδικασία συνεχίζεται μέχρι να βρεθεί η βέλτιστη ενέργεια (action) προς το περιβάλλον– Βέλτιστη ενέργεια δηλώνουμε ως αm με αναμενόμενη τιμή

dm = Max{di} για όλα τα i =1,2,...,r . Το ιδανικό είναι το αm να φτάνει την μονάδα όσο ο χρόνος k πάει στο άπειρο.

Ο αλγόριθμος «Function Optimization Using LA»(1/2)

Διαίρεση του συνόλου των λύσεων σε r υπερκύβους με κάθε ένα να αντιστοιχίζεται σε μια ενέργεια του αυτόματου

Με χρήση του αλγορίθμου εξαντλητικής αναζήτησης (continuous Pursuit) , οι action probabilities και οι εκτιμήσεις των reward probabilities ενημερώνονται σε κάθε περίοδο υπολογίζοντας την συναρτησιακή τιμή ενός τυχαίου δείγματος της τρέχουσας ενέργειας.

Αν η εκτίμηση μιας reward probability είναι μικρότερη από ένα προκαθορισμένο κατώφλι, τότε ο αντίστοιχος υπερκύβος αποτιμάται σύμφωνα με τα δείγματα των οποίων οι συναρτησιακές τιμές έχουν υπολογιστεί

Αν η μέση τιμή και η διακύμανση αυτών των συναρτησιακών τιμών είναι αρκετά μικρές, ο υπερκύβος θεωρείται ως ευσταθής και άχρηστος. Τότε, απομακρύνεται και συνεχίζεται η βελτιστοποίηση με τους εναπομείναντες r-1 υπερκύβους

Αλλιώς, ο υπερκύβος αυτός θεωρείται ως μη ευσταθής και οι κορυφές και οι κοιλάδες της συνάρτησης υπολογίζονται σε αυτόν τον υπερκύβο από τα δείγματα που περιέχει

Ο αλγόριθμος «Function Optimization Using LA»(2/2)

Έπειτα αυτός ο υπερκύβος διαιρείται σε έναν αριθμό υπο-υπερκύβων με κάθε έναν να περιέχει τα αύξοντα ή τα φθίνοντα δείγματα και ο αρχικός υπερκύβος αντικαθιστάται από τον υπο-υπερκύβο με τη μέγιστη «ανταμοιβή»(reward)

Οι υπόλοιποι υπο-υπερκύβοι θεωρούνται ως άχρηστοι και απομακρύνονται. Έτσι, ο αριθμός των ενεργειών δεν αλλάζει.

Η διαδικασία επαναλαμβάνεται μέχρι να ικανοποιηθεί μια προκαθορισμένη συνθήκη.

Έπειτα, οι αρχικοί υπερκύβοι είτε απομακρύνονται είτε συγκλίνουν σε μερικές τιμές στις οποίες περιλαμβάνονται ένα ημι-καθολικό βέλτιστο, δηλαδή μια λύση της οποίας η συναρτησιακή τιμή είναι σχεδόν κοντά σε ένα καθολικό βέλτιστο

Όπως άλλοι στοχαστικοί αλγόριθμοι, αυτή η μέθοδος στοχεύει στο να βρει ένα «συμβιβασμό» ανάμεσα στην εξερεύνηση(exploration ) και στην αξιοποίηση (exploitation), συγκλίνοντας, δηλαδή, στο κοντινότερο τοπικό βέλτιστο και εξερευνώντας την συμπεριφορά της συνάρτησης ώστε να ανακαλύψει καθολικό βέλτιστο πεδίο

LA-miner(1/3)

• Αρχικά ας σκεφτούμε τη δομή των κανόνων “IF-THEN” ως:

IF (att1 είναι quant1 ) AND (att2 είναι quant2 ) AND ... (attn είναι quantn) THEN x ανήκει στην Κλάση j

– Όπου atti ( i = 1,2,...,n ) είναι το i-οστό χαρακτηριστικό του στοιχείου που «δοκιμάζουμε» και x = (att1, att2 ,..., attn ) το στοιχείο που δοκιμάζουμε

LA-miner(2/3)

Οι τιμές του quanti είναι οι λογικές εκφράσεις αριθμητικών ποσοτήτων του i-οστού χαρακτηριστικού, γι’ αυτό έχουμε:

Έστω Maxi and Mini η μεγαλύτερη και η μικρότερη τιμή αντίστοιχα του atti ,κωδικοποιούμε το quantity του atti χρησιμοποιώντας τις παρακάτω σχέσεις:

LA-miner(3/3)

• Αυτό που κάνει βασικά ο LA-miner είναι να εξάγει K ξεχωριστούς κανόνες κατηγοριοποίησης M κλάσεων αναφοράς στο n-διάστατο χώρο γνωρισμάτων. Στην πραγματικότητα ,για κάθε κανόνα υπάρχουν (n +1) άγνωστες παράμετροι (n λογικές εκφράσεις του quanti και j είναι ο δείκτης μιας κλάσης αναφοράς)

• Για K κανόνες εξάγει K × (n +1) άγνωστες παραμέτρους και συνεπώς ψάχνει για άγνωστα σύνολα της μορφής:– Rule_Set ={ quant11 , quant12 ,..., quant1n ,j1 ,

{ quant21 , quant22 ,..., quant2n ,j2,

…{ quantk1 , quantk1 ,..., quantkn ,jk }

– Για να υπολογίσουμε κάθε Rule_Set, ορίζουμε μια συνάρτηση fitness, fit(Rule _ Set) = T − miss όπου T ο συνολικός αριθμός των στοιχείων που «δοκιμάζουμε» και miss ο αριθμός των σημείων που κατηγοριοποιήθηκαν λανθασμένα

• Τελικά, ο LA-miner χρησιμοποιεί τον αλγόριθμο Function Optimization Using LA και μεγιστοποιεί την συνάρτηση που μόλις ορίσαμε. Το αποτέλεσμα του αλγορίθμου είναι ένα Rule_Set με τα ελάχιστα λάθος κατηγοριοποιημένα στοιχεία.

Ant-miner και CN2

• Ο αλγόριθμος Ant-miner βασίζεται στον αλγόριθμο Ant Colony Optimization και χρησιμοποιεί stochastic search

• Ο CN2 συνδυάζει τον ID3 με τον AQ αναζητώντας μια λίστα κανόνων κατά αύξοντα τρόπο και χρησιμοποιεί deterministic search

(πηγές: «Data Mining with an Ant Colony Optimization Algorithm»«The CN2 Induction Algorithm»)

Πειραματικά αποτελέσματα• Χρησιμοποιήθηκαν 3 data sets

– Iris : 50 μετρήσεις τεσσάρων χαρακτηριστικών καθενός από τα 3 είδη– Wine : 13 χαρακτηριστικά, 3 κλάσεις με αντίστοιχα στιγμιότυπα 59, 71 και 48– Cancer : 683 δείγματα με δύο κλάσεις με χώρο κατηγορημάτων 9 διαστάσεων

• 50% θεωρήθηκαν δεδομένα εκπαίδευσης και το υπόλοιπο 50% δεδομένα προς δοκιμή• Το πείραμα εκτελέστηκε 10 φορές για κάθε δοκιμή και γίνεται αναφορά για τον μέσο όρο των

αποτελεσμάτων

Μ.Ο. recognition score (%) και αριθμός κανόνων των δοκιμών κατά τη φάση της εκπαίδευσης

Πειραματικά αποτελέσματα(συνέχεια)

Μ.Ο. recognition score (%) των δοκιμών κατά τη φάση της δοκιμής

Συμπέρασμα

• Ο LA-miner δείχνει να υπερέχει των άλλων ως προς τον αριθμό των κανόνων(number of rules), αφού σε κάθε περίπτωση είναι μικρότερος από τα αποτελέσματα των άλλων αλγορίθμων. Τα παραπάνω ισχύουν την φάση της εκπαίδευσης αλλά και της δοκιμής. Σχετικά με το Μ.Ο. του recognition score, υπερέχει και πάλι ο LA-miner πλην των cancer data της φάσης δοκιμής και των wine data της φάσης εκπαίδευσης όπου οριακά «νικάει» ο Ant-miner.

Πηγή

• Data Mining Using Learning Automata– M. R. Aghaebrahimi, S. H. Zahiri, and M. Amiri

Τέλος παρουσίασης

Ευχαριστώ πολύ

Ερωτήσεις ;

Documents

Αποθήκες δεδομένων και εξόρυξη γνώσης