View
44
Download
0
Category
Preview:
DESCRIPTION
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ-ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ ΠΜΣ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ: ΔΙΟΙΚΗΣΗ ΚΑΙ ΟΡΓΑΝΩΣΗ ΒΙΒΛΙΟΘΗΚΩΝ ΜΕ ΕΜΦΑΣΗ ΣΤΙΣ ΝΕΕΣ ΤΕΧΝΟΛΟΓΙΕΣ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ. «Τεχνικές Σημασιολογικού Ιστού για πολλαπλές προβολές σε ετερογενείς συλλογές Ινστιτούτων Πολιτιστικής Κληρονομιάς» - PowerPoint PPT Presentation
Citation preview
ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟΤΜΗΜΑ ΑΡΧΕΙΟΝΟΜΙΑΣ-ΒΙΒΛΙΟΘΗΚΟΝΟΜΙΑΣ
ΠΜΣ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ:ΔΙΟΙΚΗΣΗ ΚΑΙ ΟΡΓΑΝΩΣΗ ΒΙΒΛΙΟΘΗΚΩΝ ΜΕ ΕΜΦΑΣΗ ΣΤΙΣ ΝΕΕΣ ΤΕΧΝΟΛΟΓΙΕΣ ΤΗΣ
ΠΛΗΡΟΦΟΡΙΑΣ
«Τεχνικές Σημασιολογικού Ιστού για πολλαπλές προβολές σε ετερογενείς συλλογές Ινστιτούτων Πολιτιστικής
Κληρονομιάς»
Σοφία Καρδαμύλα
Εργασία στο μάθημα: Ηλεκτρονική ΔημοσίευσηΔιδάσκον καθηγητής: Σαράντος Καπιδάκης
Αθήνα 2007
Επισκόπηση ΘεμάτωνΣυλλογή Illuminated Manuscript
Συλλογή ARIA Masterpieces
Μεθοδολογία πρόσβασης στις συλλογές
χρησιμοποιώντας τις δυνατότητες & τα όρια της
τρέχουσας τεχνολογίας του Σημασιολογικού Ιστού
Αποτελέσματα
Συμπεράσματα
Προβληματισμοί
Τα Ινστιτούτα Πολιτιστικής Κληρονομιάς (CH) φέρουν σημαντικές πληροφορίες για την
ανάπτυξη του πολιτισμού.
Οι συλλογές των Ινστιτούτων Πολιτιστικής Κληρονομιάς (CH) είναι ετερογενείς:
Περιέχουν διαφορετικά είδη αντικειμένων, με διαφορετική θεματολογία, περιγράφονται
με
την χρήση διαφορετικών σχημάτων περιγραφής και ελεγχόμενων λεξιλογίων και μπορεί
να έχουν αποθηκευτεί και είναι προσιτές μέσω διαφορετικών πληροφοριακών
συστημάτων.
Πρότυπα, πρωτόκολλα και κοινά σχήματα μεταδεδομένων Ενοποίηση συλλογών
Δημιουργία πύλης Πρόσβαση στις ενοποιημένες συλλογές
Τα Ινστιτούτα Πολιτιστικής Κληρονομιάς (CH) φέρουν σημαντικές πληροφορίες για την
ανάπτυξη του πολιτισμού.
Οι συλλογές των Ινστιτούτων Πολιτιστικής Κληρονομιάς (CH) είναι ετερογενείς:
Περιέχουν διαφορετικά είδη αντικειμένων, με διαφορετική θεματολογία, περιγράφονται
με
την χρήση διαφορετικών σχημάτων περιγραφής και ελεγχόμενων λεξιλογίων και μπορεί
να έχουν αποθηκευτεί και είναι προσιτές μέσω διαφορετικών πληροφοριακών
συστημάτων.
Πρότυπα, πρωτόκολλα και κοινά σχήματα μεταδεδομένων Ενοποίηση συλλογών
Δημιουργία πύλης Πρόσβαση στις ενοποιημένες συλλογές
Illuminated Manuscript Συλλογή Εθνικής Ολλανδικής Βιβλιοθήκη (KB) Περιέχει: 10.000 μεσαιωνικές εικονογραφήσεις οι οποίες εκτός από
τις πρότυπες βιβλιογραφικές πληροφορίες σχολιάζονται και από θεματικά ευρετήρια που περιγράφουν
το περιεχόμενο της εικόνας Τα ευρετήρια ακολουθούν το Σχήμα Ταξινόμησης Iconclass Iconclass: Λεξιλόγιο 25.000 στοιχείων με κύριο σκοπό την
εικονογραφική ανάλυση Ένα αντικείμενο στο Iconclass αποτελείται από:
Μία Υποσημείωση (25F9) Μία συσχέτιση κειμένου (=παραμορφωμένα ζώα: τέρατα) Συνδέσμους θεματικών παραπομπών (cross-reference) Μηχανισμούς εξειδίκευσης θέματος (keys) Λέξεις κλειδιά (keywords)
Τα θέματα είναι οργανωμένα σε 9 ιεραρχικά επίπεδα
Δομή Iconclass
Αποτελέσματα αναζήτησης στη συλλογή «Illuminated Manuscript» της KB
ARIA Masterpieces Συλλογή Μουσείου Rijks στο Άμστερνταμ Περιέχει: 700 αντικείμενα (πίνακες & γλυπτά) Τα θέματα στα ευρετήρια δημιουργούνται με βάση τον κατάλογο Aria Aria: ελεγχόμενο λεξιλόγιο, αποτελούμενο από 500 όρους και 3
υπολεξιλόγια, θεωρούμενο κυρίως ως πηγή αναζήτησης
1ο Υπολεξιλόγιο: προορίζεται για μη ειδικούς. Περιέχει θέματα όπως π.χ. ο Άντρας
2ο Υπολεξιλόγιο: προορίζεται για πιο εξειδικευμένους χρήστες. Περιέχει παρόμοια αλλά πιο υψηλής ποιότητας θέματα π.χ. Αντρικά πορτραίτα
3ο Υπολεξιλόγιο: Περιέχει μία πιο μικρή λίστα με 6 κατηγορίες αντικειμένων όπως π.χ. Γλυπτική
Η μοναδική σημασιολογική πληροφορία που υπάρχει στον κατάλογο είναι κάποιοι εξειδικευμένοι σύνδεσμοι μεταξύ των δύο πρώτων λεξιλογίων (σχέσεις ευρύτερης έννοιας)
Οι ιεραρχίες είναι δύο επιπέδων
Βήμα 1οΤυποποίηση συλλογής
Βήμα 2οΕνοποίηση συλλογής
Βήμα 3οΠρόσβαση στη
συλλογή
Μεθοδολογία
1ο βήμα: Τυποποίηση συλλογής Μετατροπή ελεγχόμενων λεξιλογίων Μετατροπή στοιχείων συλλογών
Αρχικά ΛεξιλόγιαIconclass
ARIA
Αρχικά ΛεξιλόγιαIconclass
ARIA
Πρότυπη SW απεικόνιση λεξιλογίων
Πρότυπη SW απεικόνιση συλλογών
1. Τυποποίηση συλλογής
Συντακτική διαλειτουργικότη
τα λεξιλογίων
Συντακτική και σημασιολογική
διαλειτουργικότητα δομής μεταδεδομένων
Αρχικές συλλογέςARIA Masterpieces
KB Manuscripts
Αρχικές συλλογέςARIA Masterpieces
KB Manuscripts
Μετατροπή ελεγχόμενων λεξιλογίων
Ανάλυση στοιχείων Τυποποίηση γνώσης που περιέχουν
Πρότυπη τυποποίηση: Επιλογή πρότυπου μοντέλου κωδικοποίησης λεξιλογίων
σε γλώσσες SW Πρωτοβουλία SKOS (Simple Knowledge Organization
System): Παρέχει ένα πρότυπο μοντέλο κωδικοποίησης
των πιο διαδεδομένων πλάνων οργάνωσης της γνώσης
(θησαυροί, ταξ. Συστήματα) σε γλώσσες SW.
SKOS: rdf λεξιλόγιο (W3C SW)
Μετατροπή στοιχείων συλλογών
Διατήρηση αρχικών δομών συλλογών Μη χρησιμοποίηση κοινού σχήματος
περιγραφής μεταδεδομένων Κατασκευή μικρών οντολογιών
μεταδεδομένων σε σχήμα rdf
Title: Mary Magdalene Year: 1487 Artist: Carlo Crivelli
2ο βήμα: Ενοποίηση συλλογής
Προβλήματα Η σύνθετη φύση της γραφικής παράστασης RDF Η ετερογένεια στις δομές και την γλωσσολογία (ετικέτες)
Λύση Εφαρμογή χαρτογράφων
οντολογιώνΓνώση
Χαρτογράφησης
Γνώση Χαρτογράφηση
ς
2. Ενοποίηση συλλογής
Σημασιολογική διαλειτουργικότητα των
λεξιλογίων
Αποθήκευση SW περιγραφής σε
ένα κοινό interface και αναζήτηση
πληροφοριών μέσω αυτού
1. Τυποποίηση συλλογής
Χαρτογράφος Falcon
Εργαλείο ευθυγράμμισης πολύπλοκων rdf/owl οντολογιών
Αναπτύχθηκε από το South East University of ChinaΕνσωματώνει δύο χαρτογράφους: τους LMO & GMO
LMO: Η ευθυγράμμιση στηρίζεται στο γλωσσικό ταίριασμα (σύγκριση συνώνυμων όρων κ.ά)
GMO: Η ευθυγράμμιση στηρίζεται στο δομικό ταίριασμα των γραφικών παραστάσεων.
Ο χαρτογράφος Falcon ενσωματώνει τις ευθυγραμμίσεις των LMO και GMO για να εξάγει αποτελέσματαΠροσδοκούμενα αποτελέσματα: Δημιουργία ισοδύναμων συνδέσμων μεταξύ των εννοιών και των σχέσεων των οντολογιών που συγκρίνονται
Χαρτογράφος S-Match Γενικός χαρτογράφος ο οποίος χρησιμοποιείται για
ευθυγράμμιση λεξιλογίων με δενδροειδή δομή Αναπτύχθηκε από το University of Trento (Italy) Χρησιμοποιεί το πλήρες μονοπάτι ενός δενδροειδές
λεξιλογίου για την χαρτογράφησή του. ‘Έτσι η απόδοση σχεδόν πάντα αποτελείται από συνδέσμους εξειδίκευση από τις Iconclass έννοιες στις aria έννοιες
Οι χαρτογραφήσεις υπολογίζονται με την επιλογή της ισχυρότερης σημασιολογικής σχέσης, η οποία ανακαλύπτεται με έναν αλγόριθμο μεταξύ των εννοιών μίας οντολογίας
Δεν παρέχει ένα βαθμό ομοιότητας μεταξύ των εννοιών της οντολογίας αλλά τις σημασιολογικές τους σχέσεις (ισοδυναμία, πιο γενικός, λιγότερο γενικός, επικάλυψη κ.α)
IC Notation Λεξική συσχέτιση Iconclass Σχέση Ετικέτα ARIA
23 Η “seasons of the year represented by concepts other than […] landscapes
[…]”
Λιγότερο γενική “Landscapes”
Χαρτογράφηση με S-Match
3ο βήμα: Πρόσβαση στη συλλογή Χρήση multi-faceted browsing
Η mfb περιλαμβάνει τον προσδιορισμό των τμημάτων μίας συλλογής
Για αναζήτηση στις ενοποιημένες συλλογές, χρησιμοποιούνται 3 όψεις: απλή, συνδυασμένη και ενοποιημένη
Ορισμός προσδιοριστικών
τμημάτων (φασέτες)
Ορισμός προσδιοριστικών
τμημάτων (φασέτες)
3. Πρόσβαση στη συλλογή
Εκτίμηση προδιαγραφών
2. Ενοποίηση συλλογής
Αναζήτηση
Απλή όψη αναζήτησης Παρουσιάζει τις ενοποιημένες συλλογές από την πλευρά
της μίας συλλογής Τα στοιχεία της άλλης συλλογής είναι προσβάσιμα μέσω
την αντιστοίχησης των θεματικών τους σχολιασμών και των εννοιών με την τρέχουσα συλλογή
Αναζήτηση στις ενοποιημένες συλλογές με την χρησιμοποίηση του καταλόγου ARIA
Ευθυγράμμιση έννοιας «Animal Pieces» του ARIA και έννοιας «25F:animals» του Iconclass
Συνδυασμένη όψη αναζήτησης Παρέχει ταυτόχρονη πρόσβαση στις συλλογές μέσω της
αντιστοίχησης των λεξιλογίων τους αναζητάμε στις ενοποιημένες συλλογές σαν να είναι μία συλλογή χρησιμοποιώντας δύο ευρετήρια
Αναζήτηση στις ενοποιημένες συλλογές με την χρησιμοποίηση των καταλόγων ARIA και IconclassΑναζήτηση στον ARIA με την έννοια «Animal Pieces» και περιορισμός αναζήτησης στο θέμα από τον Iconclass με «Classical Mythology and Ancient History» (βιολογικό & μυθολογικό κριτήριο)
Ενοποιημένη όψη αναζήτησης Παρέχει πρόσβαση στις ενοποιημένες συλλογές μέσω ενός
συγχωνευμένου λεξιλογίου Η αυτόματη διαδικασία χαρτογράφησης δημιουργεί
συνδέσμους μεταξύ των δύο λεξιλογίων
Η ενοποιημένη όψη παρέχει και Aria έννοιες όπως “Birds” και μία έννοια Iconclass “29A: animals acting as human beings” για την περαιτέρω βελτίωση της αναζήτησης
Λεπτομέρειες Browser
Το σχέδιο του browser εμπνεύστηκε από το περιβάλλον αναζήτησης Flamenco
Δοκιμή στον browser: http://stitch.cs.vu.nl/demo.html
STITCH (SemanTic Interoperability To access Cultural Heritage)
Ερευνητικό πρόγραμμα
Χρηματοδοτείται από τον Ολλανδικό Οργανισμό για την Επιστημονική Έρευνα (Netherlands Organisation for Scientific Research )
Στόχος: Η αξιολόγηση της εφαρμογής τεχνικών και εργαλείων του Σημασιολογικού Ιστού για την ενοποίηση ετερογενών συλλογών CH
Αποτελέσματα
Αποτελέσματα ΧαρτογράφησηςS-Match 46%
Falcon 16%
ΑποτελέσματαΑποτελέσματα πρότυπης τυποποίησης ARIAARIA SKOS
Iconclass SKOS γραφική αναπαράσταση κλειδιών
ακρίβεια
ακρίβεια
Σχεδόν πλήρως συμβατή
Εν μέρει συμβατή
Συμπεράσματα Η μετατροπή λεξιλογίων χρησιμοποιώντας τυποποιημένα πρότυπα είναι δυνατή και βοηθά στην
ανάπτυξή τους
Αν όλες οι συλλογές και τα λεξιλόγιά τους ήταν διαθέσιμα σε τυποποιημένη μορφή π.χ. skos,rdf, το
περιβάλλον θα μας παρείχε έναν πολύ πιο εύκολο τρόπο ενοποίησης ετερογενών συλλογών
Προβλήματα τυποποίησης (απώλεια πληροφοριών)
Βασιζόμενοι σε τέτοιες απεικονίσεις και σε αυτόματες χαρτογραφήσεις, μπορούμε να εκτελέσουμε
αναζήτηση μέσω ενός κοινού interface σε ετερογενείς συλλογές
Δύσκολη χαρτογράφηση και όχι πάντα ακριβής
Για την εκτέλεση σημασιολογικής ενοποίησης CH συλλογών με τον τρόπο που αναφέραμε στο
πείραμα, οι αυτόματες τεχνικές χαρτογράφησης είναι απαραίτητες, αλλά πρέπει οπωσδήποτε να
προσαρμοστούν
Η χρήση του Multi-Faceted Browsing παρέχει πολλαπλές προβολές ή σημεία πρόσβασης για το ίδιο
σετ μεταδεδομένων. Έτσι οι χρήστες μπορούν να επιλέξουν το λεξιλόγιο με το οποίο είναι
περισσότερο άνετοι και έτσι η ολοκληρωμένη πρόσβαση είναι δεδομένη
Προβληματισμοί
Τελικά αξίζει να χρησιμοποιήσουμε τις αυτόματες τεχνικές
χαρτογράφησης για τα CH λεξιλόγια;
Κατά πόσο είναι εύκολο να χρησιμοποιηθεί η ίδια
μεθοδολογία για ενοποίηση περισσότερων των δύο συλλογών;
Τι αποτελέσματα θα έχουμε;
Recommended