Upload
mrtncz
View
1.055
Download
2
Embed Size (px)
DESCRIPTION
Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig
Citation preview
Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig103. Bibliothekartag, Bremen, 5.6.2014
Martin Czygan, Universitätsbibliothek LeipzigAnke Hofmann, Bibliothek der Hochschule für Musik und Theater „Felix Mendelssohn Bartholdy“ Leipzig
Normdatenimplementierung als finc Milestone
Normdaten = PotentialeGroßer Bestandteil klassischer Katalogisierungsarbeit
Normdaten = PotentialeEnorme Datensammlungen
http://d-nb.info/gnd/118576291
Normdaten = PotentialeGND als übergreifendes Normierungssystem
https://wiki.dnb.de/display/ILTIS/Informationsseite+zur+GND+neu
Normdaten = PotentialeInteressant auch für nicht-bibliothekarische Projekte
http://de.wikipedia.org/wiki/Gustav_Mahler
Normdaten = Potentiale
Steigerung des Suchkomforts für unsere Nutzer/innen!
Bisherige Anwendungsfelder„klassische“ Datenauswertung: Verweissysteme•Personennamen und Körperschaften•Schlagworte•(musikalische) Werktitel
Weitere Datenauswertung•Länderbezug für Autor/innen und Komponist/innen•Geofacette
Personennamen und KörperschaftenAnreicherung des Titelsatzes mit den Verweisungsformen der verknüpften Personen
https://katalog.hmt-leipzig.de/Record/0003347345 fincMARC 900
SchlagworteAnreicherung des Titelsatzes mit Synonymverweisungen und Oberbegriffen der verknüpften Schlagworte
https://katalog.hmt-leipzig.de/Record/0000525350 fincMARC 950
(musikalische) WerktitelAnreicherung des Titelsatzes mit Informationen aus Werktitel: alternative Titel, Tonart, Werkverzeichnisnummer (Besetzung)
fincMARC 920https://katalog.hmt-leipzig.de/Record/0008964807
EST: Konzerte, Vc Orch, G 479Violoncellokonzert, Nr. 2Cellokonzert, D-Dur
EST: Quartette, Vl 1 2 Va Vc, H 3, 31-36Streichquartette, op. 20
(musikalische) WerktitelAnreicherung des Titelsatzes mit Informationen aus Werktitel: alternative Titel, Tonart, Werkverzeichnisnummer (Besetzung)
LänderbezugAuswertung der DIN-Ländercodes am Personen-Normsätzen --> Facettenbildung
„Haben Sie Noten von Komponisten Rumänischer Herkunft?“
“Geofacette“ der TU Freiberg Umsetzung einer Idee von Wiesenmüller, Maylein, Pfeffer:
http://www.ub.uni-heidelberg.de/archiv/12555
Auswertung und Indexierung der geografischen Codes an
Schlagwort-Normsätzen
Grenzen?!• Bislang nur für lokale Bibliotheksdaten (SWB) –
externe Quellen im Discovery System werden bislang nicht berücksichtigt
• Relativ simples Verwendungsmuster: Synonymverweisungen
• Keine visuelle Umsetzung der Inhalte eines Normsatzes
• GND als einziger Datenpool
Vier Beispiele
• Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT.• 05.06.2014 1000
Überblick
• Intro – 1
• Namensvarianten via GND – 7
• Alternative Sucheinstiege – 1
• Knowledge Graph – 2
• Querschnittssuche – 5
• Ausblick – 3
Intro
• Ein rotes Band – die GND
• Ein anderes – Nutzung von Indizes als (NoSQL) Datenbanken
GND-Anreicherung externer Quellen
Datensatz der externen Quelle „Naxos Music Library“
http://d-nb.info/gnd/118638157
Namensvarianten 1
• GND basierte Erweiterung von MARC-Records um Namensvarianten
• gnd.es:variantNameForThePerson
• Angewendet auf: Naxos Music Library, Gallica, RISM, IMSLP
Namensvarianten 2
• Nutzung eines Normdatenindex für Kandidatensuche
• Nutzung einer minimalen HTTP–API für Taxonomieabfragen
Namensvarianten 3
• Suche aller MARC 100.a Einträge der externen Quelle im Normdatenindex
• Für alle Kandidaten–GNDs, überprüfe, ob Beruf unter den Oberbegriff Musikerin (4040841-3) oder Musiker (4170818-0) fällt
• Für alle Kandidaten–GNDs, überprüfe, ob Lebensdaten in den Normdaten hinterlegt sind
Namensvarianten 4
• Naxos - 71815
• RISM - 11241
• IMSLP - 51722
• Gallica - 23754
Namensvarianten 5
• 54339 Name insgesamt
• 5051 Namen in Naxos und GND
• 719 Namen konnten zugeordnet werden
Namensvarianten 6
• Naxos – 719 Namen mit hoher Wahrscheinlichkeit korrekt
• RISM – 415
• IMSLP – variabel
• Gallica – 268
• generelle Frage der Qualitätsprüfung
Namensvarianten 7
• Alternative Implementierung – zum Beispiel über eine Abfrage der Normdaten vor der eigentlichen Suche
Sucheinstiege 1
• API um die GND–Daten
• narrower terms, broader terms, [synonyms]
• siehe Namesvarianten (gehört Musikerin zu den Oberbegriffen?)
• Anzeige von ähnlichen Begriffen in der Art von Facetten – mit Größenabschätzung (und anderen Metriken)
Optimierte Datennutzung für Suchanfragenoptimierte Nutzung der Taxonomie der SchlagwörterDarstellung der semantischer Beziehungen von GND-Einträgen untereinander
http://melvil.d-nb.de/swd-search?term=oboenrohr
Knowledge Graph 1
• Inspiration – Google Knowledge Graph
• Indexierung von GND, VIAF und DBPedia
• technische Herausforderungen (Dokumentenanzahl, Konvertierung, Kompression)
Knowledge Graph 2
• Beispiel Goethe
• Lebensdaten, Wirkungsort, Einflüsse, Werke, ...
• {“birthDate”: “…”, “deathDate”: “…”, “placeOfBirth”: “…”, “placeOfDeath”: “image”, …}
Querschnittssuchen 1
• Menschen gruppieren Dinge auch außerhalb von Facetten
• Wikipedia–Kategorien
Weitere Datenpools und Services:„Wikipedia-Querschnittssuche“
http://de.wikipedia.org/wiki/Kategorie:Komponist_(Romantik)
Querschnittssuche 2
• Zutaten: GND–Index, Wikipedia–Normdaten–Index, Wikipedia–Category–Index
Querschnittssuche 3
• {"p": "dnb.es:placeOfBusiness", "s": "gnd:63067-6", "o": "gnd:4005728-8"}
• {"ndl": "00575178", "gnd": "4191405-3", "lccn": "sh/85/004443", "title": "Americium", "typ": "s"}
• {"category": "Carbonylkomplex", "pages": ["Chromhexacarbonyl", "Metallcarbonyle", “...”]}
Querschnittssuche 4
• {"p": "dnb.es:placeOfBusiness", "s": "gnd:63067-6", "o": "gnd:4005728-8"}
• {"ndl": "00575178", "gnd": "4191405-3", "lccn": "sh/85/004443", "title": "Americium", "typ": "s"}
• {"category": "Carbonylkomplex", "pages": ["Chromhexacarbonyl", "Metallcarbonyle", “...”]}
Querschnittssuche 5
• Beispiel – Kategorie:Romantik_(Musik)
• 1225 Seiten unter der Kategorie
• 1082 GNDs
• Mit diesen GNDs kann man eine Suchabfrage auf einen Katalog absetzen
Ausblick 1
• verwendete Daten – GND, VIAF, DBPedia
• noch nicht einbezogen: Freebase, Authoritydaten anderer Nationalbibliotheken, datahub.io, ISNI, ...
• Ansätze sind nicht unbedingt allgemein anwendbar (z.B. Berufsbezeichnung)
Ausblick 2
• Index – Elasticsearch*
• Workflowmanagement – luigi*, gluish*
• Konverter – gomarckit*, nttoldj*, wptoldj*
• SQL für TSV: textql*
• Unix – awk*, cat*, cut*, grep*, sed*
Ausblick 3
• * Open source
• Linked Data schafft neue Verbindungen
Normdaten = Potentiale!Voraussetzungen und Perspektiven• Übernahme der VIAF-IDs in die Datensätze der GND• Bereitstellung von IDs in Initiativen zur
Datenfreigabe• Konsistentere Nutzung der GND in Bibliotheken• Projekte zur rückwirkenden Anreicherung in
Bibliotheken• Nachnutzung der GND / VIAF auch in
nichtbibliothekarischen Projekten
Übernahme der VIAF-IDs in die Datensätze der GND
http://viaf.org/viaf/99258155
Bereitstellung von IDs in Initiativen zur Datenfreigabe
https://opac.rism.info/search?id=653004096&db=251&View=rism
https://opac.rism.info/id/rismid/653004096?format=marc
Konsistentere Nutzung der GND in BibliothekenSacherschließungsquote im Buchbestand der HMT: 42,4%
Nachnutzung der GND in nicht-bibliothekarischen Projekten
http://pdr.bbaw.de/projekt
http://in2n.de/
Danke für Ihre Aufmerksamkeit!
http://blog.finc.info
Martin [email protected]
Anke [email protected]