42
1 Συστήματα Θεματικής Πρόσβασης Χ. Παπαθεοδώρου ([email protected]) Εργαστήριο Ψηφιακών Βιβλιοθηκών και Ηλεκτρονικής Δημοσίευσης Τμήμα Αρχειονομίας – Βιβλιοθηκονομίας Ιόνιο Πανεπιστήμιο

Συστήματα Θεματικής Πρόσβασης

  • Upload
    dieter

  • View
    43

  • Download
    0

Embed Size (px)

DESCRIPTION

Χ. Παπαθεοδώρου ([email protected]) ‏ Εργαστήριο Ψηφιακών Βιβλιοθηκών και Ηλεκτρονικής Δημοσίευσης Τμήμα Αρχειονομίας – Βιβλιοθηκονομίας Ιόνιο Πανεπιστήμιο. Συστήματα Θεματικής Πρόσβασης. Περιεχόμενα. ορολογία, χαρακτηριστικά και κατηγορίες όρων θεµατική ανάλυση, θεματικές γλώσσες - PowerPoint PPT Presentation

Citation preview

Page 1: Συστήματα Θεματικής Πρόσβασης

1

Συστήματα Θεματικής ΠρόσβασηςΧ. Παπαθεοδώρου

([email protected])Εργαστήριο Ψηφιακών Βιβλιοθηκών

και Ηλεκτρονικής ΔημοσίευσηςΤμήμα Αρχειονομίας –

ΒιβλιοθηκονομίαςΙόνιο Πανεπιστήμιο

Page 2: Συστήματα Θεματικής Πρόσβασης

2

Περιεχόμενα• ορολογία, χαρακτηριστικά και κατηγορίες

όρων • θεµατική ανάλυση, θεματικές γλώσσες• UNIMARC AUTHORITIES• ταξινόµηση ταξινοµικά συστήµατα, Dewey,

UDC, LCC, άλλα• ευρετηρίαση, ευρετήρια τίτλων KWIC, KWOC,

ευρετήρια παραποµπών• προσυνδυασµένη και υστεροσυνδυασµένη

ευρετηρίαση• θεµατικές επικεφαλίδες, θεµατικοί όροι• θεµατικές επικεφαλίδες Βιβλιοθήκης του

Κογκρέσσου (LCSH), Sears, άλλες• Θησαυροί• πρότυπα τεκµηρίωσης για τη θεµατική

ανάλυση και την ορολογία

Page 3: Συστήματα Θεματικής Πρόσβασης

3

Πρότυπα• ΕΛΟΤ 402. Αρχές και µέθοδοι ορολογίας• ΕΛΟΤ 414. Περιλήψεις για τις δηµοσιεύσεις και την τεκµηρίωση• ΕΛΟΤ 561-1. Λεξιλόγιο Ορολογίας• ΕΛΟΤ 720 :1993. Φύλλα περιλήψεων σε περιοδικές εκδόσεις. (ISO

5122-1979)• ΕΛΟΤ 743. Μετατροπή του ελληνικού αλφαβήτου µε λατινικούς

χαρακτήρες• ΕΛΟΤ 1213:1994. Ευρετήριο ενός δηµοσιεύµατος. ( ISO 999-

1996)• ΕΛΟΤ 1312:1993 (ΣΕΠ). Θεµατική ανάλυση τεκµηρίων : Μέθοδοι

εξέτασης τεκµηρίων, προσδιορισµού των θεµάτων τους και επιλογής των όρων ευρετηρίασης (ISO 5963-1985)

• ΕΛΟΤ 1321:1993 (ΣΕΠ) Κατευθυντήριες οδηγίες για τη συγκρότηση και ανάπτυξη µονόγλωσσων θησαυρών. (ISO 2788-1986)

• ΕΛΟΤ 1381-1 (ΣΕΠ). Λεξιλόγιο - Μέρος 1 : Βασικές έννοιες. (ISO 5127/1-1983)

• ΕΛΟΤ 1381-2-1997(ΣΕΠ) Λεξιλόγιο - Μέρος 2 : Παραδοσιακά τεκµήρια. (ISO 5127/2-1983)

Page 4: Συστήματα Θεματικής Πρόσβασης

4

Διαχείριση τεκμηρίων• Περιγραφή τεκμηρίων

– Τίτλος, πνευματική υπευθυνότητα, επιμέλεια (edition), έκδοση (publication), φυσική περιγραφή (αρ. σελίδων, μέγεθος), σχετικός εξοπλισμός κλπ

• Σημεία πρόσβασης καταλόγου– Ευρετήρια με βάση τα οποία γίνεται η αναζήτηση

στον κατάλογο– Δημιουργία/χρήση αρχείου καθιερωμένων όρων

(authority file)– τίτλοι – εναλλακτικοί τίτλοι – τίτλοι σειρών,

ονόματα, συλλογικά όργανα

• Θεματική ανάλυση - ταξινόμηση– Προσδιορισμός θεμάτων-εννοιών που καλύπτει ένα

τεκμήριο– Ανάθεση θεματικών επικεφαλίδων– Ταξινόμηση τεκμηρίου σε θεματικές κατηγορίες με

τη χρήση ταξινομικού συστήματος

Page 5: Συστήματα Θεματικής Πρόσβασης

5

Ταξινομημένη – αλφαβητική πληροφόρηση

• Κατά τη διαδικασία της ταξινόμησης κάθε τεκμήριο εντάσσεται σε μία κατηγορία

• Κατά τη θεματική ανάλυση σε ένα τεκμήριο αποδίδονται περισσότερα του ενός θέματα

• Απαιτείται θεματικός κατάλογος• Τα τεκμήρια τακτοποιούνται συνήθως ταξινομικά

(ιεραρχική ή κάθετη τακτοποίηση) ή αλφαβητικά (οριζόντια τακτοποίηση)

• Στην ταξινομημένη τακτοποίηση υπάρχει ανάλυση σε βάθος και ακριβής εντοπισμός τεκμηρίων (όλα τα τεκμήρια είναι συναφή μεταξύ τους)

• Στην αλφαβητική τακτοποίηση ο εντοπισμός είναι άμεσος, χωρίς δυσκολίες

Page 6: Συστήματα Θεματικής Πρόσβασης

6

Τρόποι θεματικής ανάλυσης• Εύρεση σκοπού του συγγραφέα

– Πολλαπλοί σκοποί, ιεράρχηση σκοπών (κάποιοι από το διάβασμα αναδεικνύονται πρωτεύοντες)

– Βασικό αντικείμενο (κυρίαρχο αντικείμενο – item - ή ομάδα αντικειμένων)

• Αντικειμενική μέθοδος, μέτρηση αναφορών σε αντικείμενα και πρόσωπα, ακόμα και αυτών που δεν αναφέρονται ξεκάθαρα

• Προσδιορισμός συνόλου ή κανόνων κριτηρίων επιλογής ή απόρριψης θεμάτων

• Συμπέρασμα: ο προσδιορισμός των θεμάτων που αφορούν σε ένα τεκμήριο είναι υποκειμενική διαδικασία, εξαρτάται από τον αναγνώστη

Page 7: Συστήματα Θεματικής Πρόσβασης

7

Αρχεία Καθιερωμένων όρων

• Καθιερωμένες εγγραφές (authorities)– Ονόματα, τίτλοι, θέματα που χρησιμοποιούνται

στον κατάλογο– Άλλοι όροι και πηγές που χρησιμοποιούνται για τον

προσδιορισμό των θεμάτων των τεκμηρίων

• Τα αρχεία καθιερωμένων όρων συσχετίζουν τις βιβλιογραφικές εγγραφές του καταλόγου– Συγκεντρώνουν τις διαφορετικές εκφάνσεις

(manifestations, μεταφράσεις, εκδόσεις κα) των τεκμηρίων

– Ομαδοποιούν εγγραφές με ίδια θέματα

• Ανάγκη ενιαίας αναπαράστασης των θεμάτων των βιβλιογραφικών εγγραφών – ενιαία γλώσσα

Page 8: Συστήματα Θεματικής Πρόσβασης

8

Γλώσσες• Φυσικές γλώσσες

– πχ ελληνικά, αγγλικά– Πιο δύσκολη η ανάκτηση πληροφοριών στο πλήρες κείμενο. Σύγκριση

ερώτησης χρήστη με το πλήρες κείμενο

• Τεχνητές γλώσσες–Esperanto, γλώσσες προγραμματισμού– Γλώσσες θεμάτων (indexing, subject)

• Πιο απλές γλώσσες, λίγοι τύποι και σχεδόν καθόλου γραμματική• Αποδίδουν σημασιολογικά το περιεχόμενο και τις σχέσεις• Παρέχουν στο χρήστη ισοδύναμες εκφράσεις για τις ίδιες έννοιες – ο

χρήστης πρέπει να γνωρίζει αυτές τις γλώσσες για να εντοπίσει τεκμήρια που αναζητά

• Την περιγραφή μιας γλώσσας την κάνει ο θεματικός καταλογογράφος / ταξινόμος

• σχήματα ταξινόμησης, θησαυροί, λίστες θεματικών κεφαλίδων

• Σκοπός– Χρησιμοποιούνται από καταλογογράφους και χρήστες για τη θεματική

απόδοση των τεκμηρίων– Για την επιτυχή ανάκτηση πληροφορίας οι καταλογογράφοι και οι

χρήστες πρέπει να μιλούν κοινή γλώσσα. Έτσι τα τεκμήρια και οι πληροφοριακές ανάγκες των χρηστών εκφράζονται με κοινό τρόπο και προσδιορίζονται με ακρίβεια

Page 9: Συστήματα Θεματικής Πρόσβασης

9

Γλώσσες (συνέχεια)

• Μια γλώσσα έχει τα ακόλουθα συστατικά:– Λεξιλόγιο (vocabulary)– Σημασιολογία (semantics)– Συντακτικό (syntax)

Page 10: Συστήματα Θεματικής Πρόσβασης

10

Θεματικές γλώσσες

• Δηλώσεις θεμάτων: σύνολο ζευγών facet/concept– π.χ. <τύπος γεύματος, δείπνο>

• Κάθε έννοια (concept) είναι μια τάξη (class), στην οποία ένα σύνολο από τεκμήρια είναι μέλη

• Κάθε έννοια αναπαρίσταται από ένα όρο (term) ή ετικέτα (label)– π.χ. ο όρος «δείπνο» όταν χρησιμοποιείται σε μια δήλωση

θέματος είναι μια ετικέτα για την τάξη των τεκμηρίων που το περιεχόμενό τους περιστρέφεται γύρω από δείπνα

• Ένας όρος μπορεί να αποτελείται από μία ή περισσότερες λέξεις

• Κάθε φασέτα (οπτική γωνία) είναι μια κατηγορία (category) εννοιών (concepts)– π.χ. ο «τύπος γεύματος» είναι μια ετικέτα (label) κατηγορίας

και το «δείπνο» μια έννοια της κατηγορίας «τύπος γεύματος»

Page 11: Συστήματα Θεματικής Πρόσβασης

11

Είδη γλωσσών

• Υπάρχουν φασέτες; Συνθετική γλώσσα (synthetic ή facetic)

• Δεν υπάρχουν; Γλώσσα απαρίθμησης (enumerative)

• Οι συσχετίσεις μεταξύ των κατηγοριών ονομάζονται «συνταγματικές»

Page 12: Συστήματα Θεματικής Πρόσβασης

12

Ορισμοί• Εννοια (concept) είναι η νοητική αντιπροσώπευση ενός

ιδιαίτερου αντικειµένου ή ενός συνόλου ιδιαίτερων αντικειµένων που έχουν ορισµένες κοινές ιδιότητες

• Ορος (term) είναι µια λέξη ή φράση που αντιπροσωπεύει και προσδιορίζει µια έννοια.

• Πλάτος (έκταση) µίας έννοιας: το σύνολο όλων των αντικειµένων στα οποία αντιστοιχεί µία έννοια– π.χ. {ακαδηµαϊκές, σχολικές, ειδικές, …} βιβλιοθήκες

• Βάθος (ένταση) µίας έννοιας: το σύνολο των ουσιωδών χαρακτηριστικών που συνιστούν την έννοια– π.χ. στην έννοια {ξύλινο τραπέζι} το χαρακτηριστικό της

σύνθεσης (ξύλινο) αποτελεί ουσιώδες χαρακτηριστικό και διακρίνει την έννοια τραπέζι

• Ατοµική έννοια: αντιστοιχεί σε ένα µόνο αντικείµενο {νήσος Κέρκυρα}

• Γενική έννοια: αντιστοιχεί σε δύο ή περισσότερα αντικείµενα που αποτελούν οµάδα µε κοινές ιδιότητες {νήσος}

Page 13: Συστήματα Θεματικής Πρόσβασης

13

Ορισμοί (συνέχεια)• Χαρακτηριστικό (attribute, characteristic)

µιας έννοιας είναι οποιαδήποτε από τις ιδιότητες ή σχέσεις που συνιστούν µία έννοια – (π.χ. ένα χαρακτηριστικό της έννοιας δέντρο είναι

ο ξυλώδης κορµός)

• Ενδογενή χαρακτηριστικά (σχήµα, µέγεθος, υλικό, χρώµα)– π.χ. οδοντωτός (τροχός), κόκκινο (φως), ξύλινο

(τραπέζι)

• Εξωγενή χαρακτηριστικά (προέλευση, προορισµός, λειτουργία, θέση, εφευρέτης, τοποθέτηση)– π.χ. πεντελικό (µάρµαρο), ευκλείδεια (γεωµετρία),

δοκιµαστικός (σωλήνας)

Page 14: Συστήματα Θεματικής Πρόσβασης

14

Ορισμοί εννοιών• Ορισµός µιας έννοιας είναι η λεκτική

περιγραφή της έννοιας για διαφοροποίηση από συναφείς έννοιες

• Εντατικός: περιγράφει το βάθος µιας έννοιας– π.χ ισόπλευρο τρίγωνο είναι το τρίγωνο που έχει

και τις 3 πλευρές ίσες

• Εκτατικός: απαρίθµηση των υποτασσόµενων εννοιών, πλάτος– π.χ. τρίγωνο: ισόπλευρο, ισοσκελές, σκαληνό

• Εµµεσος: ορισµός µέσω παραδείγµατος

Page 15: Συστήματα Θεματικής Πρόσβασης

15

Λεξιλόγιο• Σύνολο όρων• Στις γλώσσες θεμάτων το λεξιλόγιο είναι

ελεγχόμενο (controlled vocabulary) δηλ. μόνο συγκεκριμένοι όροι ή είδη όρων επιτρέπεται να συμμετέχουν στις δηλώσεις θεμάτων– Ονομάζονται περιγραφείς (descriptors) ή προτιμώμενοι

όροι (preferred terms)

• Αναφορές (references, “see” or “use”) από μη προτιμώμενους όρους σε προτιμώμενους

• Κριτήρια επιλογής προτιμώμενων όρων– Από κάτω προς τα πάνω (bottom-up)

• Συχνότητα χρήσης από τους συγγραφείς• Συχνότητα χρήσης στις αναζητήσεις των χρηστών

– Από πάνω προς τα κάτω• με τη χρήση εργαλείων (Dewey, Ranganathan)

Page 16: Συστήματα Θεματικής Πρόσβασης

16

Αναπαράσταση λεξιλογίου• Λεκτική, οι θεματικές δηλώσεις εκφράζονται

από διατάξεις όρων– Π.χ. Θεματικές επικεφαλίδες της Βιβλιοθήκης του

Κογκρέσου (LCSH)

• Κωδικοποιημένη, θεματικές δηλώσεις εκφράζονται από αριθμούς– Π.χ. κωδικοί του Dewey Classification System (DCC)

• Οι όροι διατάσσονται στην περιγραφή της γλώσσας – Αλφαβητικά (π.χ. LCSH)– Συστηματικά (π.χ. DCC)

• Συνήθως οι τα συστηματικά ταξινομικά συστήματα έχουν αλφαβητικά ευρετήρια και οι αλφαβητικοί θησαυροί έχουν ιεραρχικές απεικονίσεις

Page 17: Συστήματα Θεματικής Πρόσβασης

17

Είδη όρων

• απλός όρος: όρος που περιλαµβάνει µόνο µία ρίζα– ήχος, φως

• σύµπλοκος όρος: όρος που περιλαµβάνει δύο ή περισσότερες ρίζες– ηχοαπορρόφηση, ταχύτητα του ήχου, φωτοβολία,

υπέρυθρο φως

• δάνειος όρος: όρος που έχει ληφθεί από άλλη γλώσσα ή από άλλο θεµατικό πεδίο

• νεολογισµός: µονολεκτικός όρος – απλός ή σύµπλοκος – που σχηµατίζεται και χρησιµοποιείται για πρώτη φορά στη γλώσσα για την απόδοση δεδοµένης έννοιας

Page 18: Συστήματα Θεματικής Πρόσβασης

18

Μορφές όρων

• Μορφή του όρου είναι η εικόνα µε την οποία απεικονίζεται

• Εσωτερική µορφή (νοητική, λογική υπόσταση, µνηµονική εικόνα)

• Εξωτερική µορφή (φυσική, υλική υπόσταση)

• Φωνητική µορφή• Γραπτή µορφή

– κλίµα και κλήµα

Page 19: Συστήματα Θεματικής Πρόσβασης

19

Γραµµατική ανάλυση όρων

• Κατάληξη (ending): Το τελικό µόρφηµα που εκφράζει τη γραµµατική κλίση

• Ρίζα (root): Το ορολογικό µόρφηµα που µπορεί να χρησιµοποιηθεί ως λέξη, µόνο του ή µε κατάληξη

• Πρόσφυµα (affix): Προσθήκη σε ρίζα• Πρόθεµα (prefix): προηγείται της ρίζας• Επίθεµα (suffix): ακολουθεί τη ρίζα

Page 20: Συστήματα Θεματικής Πρόσβασης

20

Συντόμευση εξωτερικής μορφής

• Μη προφερόµενες συντοµοµορφές (µόνο στη γραπτή µορφή, δεν αποτελεί όρο), π.χ. κ. (=κύριος)

• Συντοµοµορφές (στη γραπτή και φωνητική µορφή)– Συνοπτικοί όροι, π.χ. η ευθεία (=η ευθεία γραµµή)– Aρκτικόλεξο, σχηµατίζεται από τα αρχικά γράµµατα

και προφέρεται γράµµα – γράµµα, π.χ. ΙΧ (=Ιδιωτικής χρήσης)

– Ακρώνυµα, σχηµατίζεται από τα αρχικά γράµµατα και προφέρεται συλλαβικά π.χ. ΔΕΗ(Δηµόσια Επιχείρηση Ηλεκτρισµού)

Page 21: Συστήματα Θεματικής Πρόσβασης

21

Ξενόγλωσσοι όροι• Εισαγωγή ξενόγλωσσων όρων

– Απόδοση στην ελληνική, π.χ. online γίνεται επιγραµµικός

– Δανεισµός, π.χ. πιγµέντο (από pigment=χρωστική)

– Μεταγραφή, π.χ. µάρκετινγκ, µάνατζµεντ

• Μετατροπή ξενόγλωσσων όρων– Μεταγραφή (µετατροπή – απόδοση – των

χαρακτήρων του αλφαβήτου µιας γλώσσας σε χαρακτήρες του αλφαβήτου άλλης γλώσσας)

– Μεταγραµµατισµός (ΕΛΟΤ 743) (µετατροπή γράµµα προς γράµµα ανεξάρτητα από προφορά)

Page 22: Συστήματα Θεματικής Πρόσβασης

22

Αντιστοιχία όρου και έννοιας• Οµωνυµία (homonyms), ίδια εξωτερική µορφή

– Οµόφωνα (homophones), π.χ. λιµός – λοιµός, τοίχος - τείχος

– Οµόγραφα (homographs)– Ταυτώνυµα (polysemy), π.χ. λόγος (=αιτία, οµιλία)

• Πολυσηµία, (polysemy),– π.χ. κλάδος (δέντρου) – κλάδος (επιστηµονικός)

• Συνωνυµία (synonyms)• Ταυτόσηµα (full synonyms), π.χ ικεσία -

παράκληση• Ηµισυνώνυµα (quasi-synonyms), π.χ. καφενείο

- κυλικείο.

Page 23: Συστήματα Θεματικής Πρόσβασης

23

Σημασιολογία• Σημασιολογία κατηγοριών

– Η κατηγοριοποίηση των εννοιών σε κατηγορίες

• Σημασιολογία αναφοράς– Η αντιστοίχηση των όρων σε έννοιες έτσι ώστε:

• Να προσδιορίζονται τα συνώνυμα και να ομαδοποιούνται μαζί και

• Να αποσαφηνίζονται τα ομώνυμα (homonyms, λέξεις με ίδια προφορά αλλά διαφορετική ορθογραφία και σημασία, scene, seen)

• Αναφορές από προτιμώμενους σε μη προτιμώμενους όρους και αντίστροφα με τις σχέσεις USE (βλέπε) και UF (use for, βλέπε επίσης) )

• Σημασιολογία συσχέτισης– Ο προσδιορισμός των συσχετίσεων μεταξύ των

εννοιών (paradigmatic relationships)– Ευρύτεροι, στενότεροι όροι, ισοδύναμοι κλπ

Page 24: Συστήματα Θεματικής Πρόσβασης

24

Σχέσεις µεταξύ εννοιών

• Ιεραρχική σχέση: Σχέση µεταξύ δύο εννοιών όταν η µία ευρίσκεται σε υψηλότερη στάθµη από την άλλη– γένους – είδους (ειδογονική):

υπερτασσόµενη και υποτασσόµενες έννοιες• π.χ. άνθρωπος και άνδρας, γυναίκα, όχηµα και

αυτοκίνητο, ποδήλατο

– όλου – µέρους (µεριστική): Η υπερτασσόµενη έννοια αποτελεί το όλον και η υποτασσόµενη µέρος του όλου• π.χ. αίθουσα θεάτρου και πλατεία, εξώστης,

θεωρεία, αυλαία, βίδα και µπουλόνι, ροδέλα, παξιµάδι

Page 25: Συστήματα Θεματικής Πρόσβασης

25

Σχέσεις μεταξύ ενοιών

• Μη ιεραρχική σχέση - πραγµατολογική σχέση: συνάφεια στο χρόνο, στο χώρο, αιτιακή, εννοιολογική σύνδεση– π.χ. εκδότης και βιβλίο, εκπαίδευση και διδασκαλία– αυτοκίνητο, τροχός αυτοκινήτου, λάστιχο τροχού αυτοκινήτου– βιοχηµεία και βιολογία, χηµεία– παιδί και αγόρι, κορίτσι

• ακολουθιακή σχέση (π.χ. «παραγωγή» και «κατανάλωση»)

• χρονική σχέση (π.χ. «άνοιξη», «καλοκαίρι», «φθινόπωρο», «χειµώνας»)

• αιτιακή σχέση (π.χ. «πυρηνική έκρηξη» και «ραδιενεργός µόλυνση του περιβάλλοντος»

Page 26: Συστήματα Θεματικής Πρόσβασης

26

Ειδογονική σχέση – συστηµατική διάταξη

(Πηγή: Βαλεοντής Κ. Οι σύγχρονες διαγλωσσικές αρχές της Ορολογίας)

1 Όργανο γραφής1.1 µολύβι (γραφίτη)

1.1.1 (Υποδιαίρεση µε βάση το κριτήριο 1)1.1.1.1 (κοινό) µολύβι1.1.1.2 µηχανικό µολύβι

1.1.2 (Υποδιαίρεση µε βάση το κριτήριο 2)1.1.2.1 µολύβι γραφείου1.1.2.2 µολύβι µαραγκού

1.2 στυλό1.3 µαρκαδόρος1.4 …

Page 27: Συστήματα Θεματικής Πρόσβασης

27

Μεριστική σχέση – συστηµατική διάταξη

1 µηχανικό µολύβι1.1 περίβληµα

1.1.1 σώµα1.1.2 συνδετήρας εξάρτησης1.1.3 λαβή δακτύλων

1.2 µηχανισµός προώθησης της µύτης1.3 µύτη από γραφίτη1.4 γοµολάστιχα

Page 28: Συστήματα Θεματικής Πρόσβασης

28

Σχέση συνάφειας

μολύβι

γραφή

γράμμα

Διεύθυνση αποστολέα

φάκελος

ταχυδρόμηση

Διεύθυνση παραλήπτη

γραμματόσημο

Όργανο-ενέργεια-εργαλείο Χωρική-χρονική

Αίτιο-αποτέλεσμα

Περιεχόμενο-περιέκτης

Αιτιατική

Χωρική

Ενέργεια-αντικείμενο ενέργειας χρονική

Είδος συσχέτισης

Φέρον-φερόμενοΧωρική

Χωρική

Page 29: Συστήματα Θεματικής Πρόσβασης

29

Συσχετίσεις - ανακεφαλαίωση

• Ιεραρχία– Όροι που περιγράφουν ένα φαινόμενο από τα μέρη του

(πλοίο, αυτοκίνητο, τραίνο – μέσα μαζικής μεταφοράς)

– Πολύ-ιεραρχία: μεταλλική καρέκλα έπιπλο και μεταλλική κατασκευή

• Ισοδυναμία (συνώνυμα)– Πλοίο, καράβι– Σχετική ισοδυναμία (quasi-synonyms)

κληρονομικότητα – γενετική, journalist-reporter– Πολυσημεία π.χ. συγκέντρωση: κοινωνικό γεγονός,

χημικό φαινόμενο, ψυχολογικό φαινόμενο

• Συνάφεια– Αθλήματα, εκπαίδευση

Page 30: Συστήματα Θεματικής Πρόσβασης

30

Σύνταξη• Κανόνες συνδυασμού των όρων (και από διαφορετικές

κατηγορίες) κατά τις δηλώσεις θεμάτων• Προ-συνδυασμένες δηλώσεις θεμάτων (pre-

coordination)= συνδυασμός όρων που έγινε πριν την αναζήτηση τεκμηρίων (δηλ. από τον θεματικό καταλογογράφο ή τον ταξινόμο)– ακρίβεια

• Yστερο-συνδυασμένες δηλώσεις θεμάτων (post-coordination) = συνδυασμός όρων που έγινε μετά την ευρετηρίαση (δηλ. στη διαδικασία αναζήτησης ο χρήστης μπορεί να συσχετίζει όρους σχηματίζοντας θεματικές δηλώσεις με λογικούς τελεστές)– ευελιξία

• Τα ταξινομικά συστήματα είναι προ-συνδυασμένες γλώσσες (έγιναν από τον ταξινόμο), απαρίθμησης (χωρίς φασέτες, DDC) ή συνθετικές (με φασέτες UDC)

Page 31: Συστήματα Θεματικής Πρόσβασης

31

Σύνοψη• Περιγραφείς (descriptors): ονόματα ή σύνολα ονομάτων

ουσιαστικών σε απλή γραμματική μορφή (ονομαστική ενικού)

• Προσδιοριστές (specifiers): δεν απαντώνται μόνοι τους ορίζουν τη σημασία των περιγραφέων

• Λέξεις σχετικές με τους περιγραφείς (π.χ. περιγραφέας σχέδιο – όρος σκίτσο)

• Σχέσεις μεταξύ των περιγραφέων (ιεραρχικές, ισοδυναμίας κλπ)

• Σύμβολα αριθμητικά ή αλφαριθμητικά (π.χ. 110, Β15, Αa)

• Συντακτικό: ρυθμίζει τη σειρά των περιγραφέων• Σημειώσεις: που, πώς, πότε χρησιμοποιούνται οι

περιγραφείς• Τακτική συντήρηση θεματικών γλωσσών, τα λεξιλόγια

εξελίσσονται όπως στις φυσικές γλώσσες

Page 32: Συστήματα Θεματικής Πρόσβασης

32

Παράδειγμα

DRAWINGUF SketchBT GRAPHIC ARTSNT TECHNICAL DRAWING

SketchUSE DRAWING

Page 33: Συστήματα Θεματικής Πρόσβασης

33

Κατηγορίες γλωσσών• Ταξινομίες

– Προ-συνδυασμένες γλώσσες– Περιγράφουν τις έννοιες σε ένα γνωστικό πεδίο– Οι περιγραφείς τους είναι συστηματικά

διατεταγμένοι σε ιεραρχίες με συγκεκριμένα κριτήρια που βασίζονται είτε στις λογικές συσχετίσεις τους, είτε στις συσχετίσεις του υλικού

– Αντιστοίχιση του περιγραφέα με ένα αριθμό

• Ταξινομικά συστήματα (DDC, UDC, LC)– Καλύπτουν όλο το φάσμα της γνώσης με ιεραρχικό

τρόπο– Σε ορισμένα πεδία γνώσης η θεματική απόδοση

γίνεται από πολύ μακριά αριθμοδότηση

Page 34: Συστήματα Θεματικής Πρόσβασης

34

Κατηγορίες γλωσσών (συνέχεια)

• Φασετική ταξινομηση (Colon classification, 1933)– Πολυδιάστατη τακτοποίηση εννοιών και αντικειμένων– Κάθε κατηγορία αντιστοιχεί σε διαφορετική οπτική

γωνία από την οποία επισκοπείται το γνωστικό αντικείμενο. Π.χ. τα κτίρια κατατάσσονται στην κατηγορία «Τεχνικές»

• Τεχνικές– Υλικό: ξύλα, τούβλα, πέτρα– Χρήση: βιομηχανικά, εμπορικά, κατοικίες– Ύψος: ισόγεια, …, πολυ-όροφα– Τοποθεσία: (αγροικίες, αστικές κατοικίες)

– Οι φασέτες μπορεί να προσαρμόζονται σε κάθε θεματική κατηγορία ή να είναι προκαθορισμένες για όλες τις κατηγορίες (personality-matter, energy, place, time)

Page 35: Συστήματα Θεματικής Πρόσβασης

35

Κατηγορίες γλωσσών (συνέχεια)

• Συστηματικές λίστες– Τα αντικείμενα (items) διατάσσονται

ιεραρχικά με βάση κάποια χαρακτηριστικά τους που προκύπτουν από την παρατήρηση

– Π.χ. συστηματική βοτανική-κλείδες φυτών, συστηματική ζωολογία, ορυκτολογία

– Αυτή η ταξινόμηση και χρησιμοποιείται στη θεματική απόδοση των τεκμηρίων

Page 36: Συστήματα Θεματικής Πρόσβασης

36

Κατηγορίες γλωσσών (συνέχεια)

• Θεματικές (επι)κεφαλίδες – Περιγραφείς που σχηματίζονται από μοναδικές λέξεις ή ομάδες

λέξεων, συνήθως εμπειρικά επιλεγμένες από το κείμενο ενός τεκμηρίου, με σκοπό την θεματική περιγραφή του τεκμηρίου με τη μεγαλύτερη δυνατή ακρίβεια

– Στη γενική τους μορφή συνδέονται μεταξύ τους με οριζόντιες σχέσεις διασταύρωσης (cross-reference, see also)

– Δευτερεύουσες επικεφ/δες: συνδυασμός επικεφ/δων• Balance of payment (payments, balance of), developing countries

=> balance of payment-developing countries , developing countries-balance of payment

– Αλφαβητική διάταξη επικεφαλίδων μαζί με τις σχέσεις διασταύρωσης και τις εγγραφές των τεκμηρίων που χαρακτηρίζονται θεματικά από αυτές

– Πολύ ευέλικτος τρόπος θεματικής περιγραφής, πολλές όμως κεφαλίδες σε ένα τεκμήριο μεγαλώνουν το χρόνο αναζήτησης και δυσκολεύουν τη διαχείριση και τον έλεγχο

– Κανόνας: λίγες και όσο πιο γενικές επικεφαλίδες γίνεται ανά τεκμήριο

Page 37: Συστήματα Θεματικής Πρόσβασης

37

Κατηγορίες γλωσσών (συνέχεια)

• Λίστες με λέξεις-κλειδιά– Λέξη κλειδί: μια λέξη από τη φυσική γλώσσα των

τεκμηρίων– Πρόβλημα συνέπειας στη θεματική περιγραφή,

απαιτείται επιλογή περιγραφέων– Αλφαβητική παράθεση

• Λίστες περιγραφέων– Περιγραφέας: λέξη που έχει επιλεγεί από τη φυσική

γλώσσα των τεκμηρίων, αφού έχουν εξαχθεί όλοι οι όροι από ένα τεκμήριο

– Συνοδεύονται με τα συνώνυμά τους– Μπορεί να έχουν συσχετίσεις μεταξύ τους– Δημιουργούν ένα ελεγχόμενο λεξιλόγιο (controlled

vocabulary)

Page 38: Συστήματα Θεματικής Πρόσβασης

38

Κατηγορίες γλωσσών (συνέχεια)

• Θησαυροί– Ελεγχόμενο λεξιλόγιο, οι όροι (περιγραφείς) του

οποίου επικεντρώνονται σε μια συγκεκριμένη γνωστική περιοχή και είναι συνδεμένοι με συσχετίσεις ιεραρχικές, συνάφειας και σχέσεις ισοδυναμίας με άλλους όρους φυσικής γλώσσας

– Κάθε περιγραφέας έχει μια μοναδική και αναμφισβήτητη ερμηνεία ελαχιστοποιώντας την πολυσημία και ελέγχοντας τα συνώνυμα

– Αποτελείται από ένα συστηματικό μέρος, όπου οι περιγραφείς οργανώνονται σε υποσύνολα και ένα αλφαβητικό κατάλογο

Page 39: Συστήματα Θεματικής Πρόσβασης

39

Συμβατότητα γλωσσών

Hospital

HospitalHospitalMedical buildings

Health services

Medical facilities

HospitalPublic buildings

Public healthConstructionBuildingsBuildings

ΔΓΒΑ

• Ένα τεκμήριο που περιγράφεται σε μια γλώσσα Α, μπορεί να εισαχθεί σε μια βάση δεδομένων που χρησιμοποιεί μια διαφορετική γλώσσα;

• Τυπική συμβατότητα: ίδιοι ή ταυτόσημοι όροι σε διαφορετικές γλώσσες

• Στις γλώσσες Α και Β ο όρος hospital ανήκει στην ίδια κατηγορία (buildings) αν και σε διαφορετικά επίπεδα

• Στη γλώσσα Γ ο όρος ανήκει σε πιο γενική κατηγορία αν και περιστρέφεται γύρω από κατασκευές

• Στη γλώσσα Δ ο όρος σχετίζεται με δραστηριότητα

Page 40: Συστήματα Θεματικής Πρόσβασης

40

Συμβατότητα γλωσσών (συνέχεια)

• Μεταγλώσσες– δεν περιγράφουν πληροφορία και τεκμήρια αλλά διασυνδέουν

διαφορετικές γλώσσες– Ολοκληρώνουν τη δομή των θεματικών γλωσσών σε μια

μοναδική δομή και αναδιατάσσουν τους περιγραφείς τους προσδιορίζοντας ισοδυναμίες ή ενσωματώνοντάς τους σε ομάδες

• Μακρο-θησαυροί– Καλύπτουν πολλά γνωστικά πεδία, αλλά περιέχουν μόνο τις

βασικές έννοιες των πιο εξειδικευμένων γλωσσών– Δημιουργούνται πριν ή και μετά από τις γλώσσες που καλούνται

να ολοκληρώσουν– Αποτελούν το βασικό κορμό και τα μεγάλα κλαριά που

στηρίζουν τα επιμέρους κλαδιά που παράγουν τα επιμέρους γνωστικά πεδία

– Αποτελούνται από γενικούς όρους, έτσι ώστε να γίνουν απαρχή για μια γλώσσα

– Παρέχουν και σχέσεις συνάφειας μεταξύ των βασικών όρων υψηλού επιπέδου του μακρο-θησαυρού

Page 41: Συστήματα Θεματικής Πρόσβασης

41

Επιλέγοντας γλώσσα• Κριτήριο οι χρήστες

– Πλήθος, ποιες οι ανάγκες τους, ποιες οι επερωτήσεις τους, με ποιο τρόπο

• Μέσο ο οργανισμός πληροφόρησης– Τι υπηρεσίες προσφέρει, τι μέσα έχει, τι

προσωπικό, τι υποδομή, πόση πληροφορία παράγει και επεξεργάζεται, τι δυνατότητες ανάκτησης και αποθήκευσης πληροφορίας προσφέρει, ποιες οι σχέσεις τους με άλλους φορείς πληροφόρησης

• Ερώτημα: υπάρχει γλώσσα που καλύπτει τις ανάγκες ή πρέπει να δημιουργηθεί καινούργια γλώσσα;

Page 42: Συστήματα Θεματικής Πρόσβασης

42

Επεξεργασία θεματικής γλώσσας• Η προσαρμογή/δημιουργία μια θεματικής γλώσσας στις

ανάγκες ενός οργανισμού απαιτεί χρόνο και προσπάθεια από ειδικών στη θεματική περιοχή και επιστήμονες πληροφόρησης

• Προσεγγίσεις προσδιορισμού ορολογίας– A priori: Επεξεργασία ορολογίας από υπάρχοντα ευρετήρια,

λεξικά, ταξινομίες και καταρτίζοντας λίστες όρων από ειδικούς στο γνωστικό αντικείμενο

– Post priori (analytic): Εξαγωγή όρων από αντιπροσωπευτικές συλλογές τεκμηρίων

– Συνήθως χρησιμοποιούμε και τις δύο προσεγγίσεις

• Επιλογή περιγραφέων και της μορφής τους: Με βάση λεξικογραφικά δεδομένα προσδιορίζουμε δυνητικούς περιγραφείς και τις σχέσεις τους, ομαδοποίηση περιγραφέων με βάση τη σπουδαιότητά τους

• Προσδιορισμός σχέσεων περιγραφέων• Έλεγχος από ειδικούς πριν τη δημοσίευση της γλώσσας• Μέγεθος γλώσσας: εξαρτάται από το γνωστικό πεδίο