Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Preview:

DESCRIPTION

Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Citation preview

Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig103. Bibliothekartag, Bremen, 5.6.2014

Martin Czygan, Universitätsbibliothek LeipzigAnke Hofmann, Bibliothek der Hochschule für Musik und Theater „Felix Mendelssohn Bartholdy“ Leipzig

Normdatenimplementierung als finc Milestone

Normdaten = PotentialeGroßer Bestandteil klassischer Katalogisierungsarbeit

Normdaten = PotentialeEnorme Datensammlungen

http://d-nb.info/gnd/118576291

Normdaten = PotentialeGND als übergreifendes Normierungssystem

https://wiki.dnb.de/display/ILTIS/Informationsseite+zur+GND+neu

Normdaten = PotentialeInteressant auch für nicht-bibliothekarische Projekte

http://de.wikipedia.org/wiki/Gustav_Mahler

Normdaten = Potentiale

Steigerung des Suchkomforts für unsere Nutzer/innen!

Bisherige Anwendungsfelder„klassische“ Datenauswertung: Verweissysteme•Personennamen und Körperschaften•Schlagworte•(musikalische) Werktitel

Weitere Datenauswertung•Länderbezug für Autor/innen und Komponist/innen•Geofacette

Personennamen und KörperschaftenAnreicherung des Titelsatzes mit den Verweisungsformen der verknüpften Personen

https://katalog.hmt-leipzig.de/Record/0003347345 fincMARC 900

SchlagworteAnreicherung des Titelsatzes mit Synonymverweisungen und Oberbegriffen der verknüpften Schlagworte

https://katalog.hmt-leipzig.de/Record/0000525350 fincMARC 950

(musikalische) WerktitelAnreicherung des Titelsatzes mit Informationen aus Werktitel: alternative Titel, Tonart, Werkverzeichnisnummer (Besetzung)

fincMARC 920https://katalog.hmt-leipzig.de/Record/0008964807

EST: Konzerte, Vc Orch, G 479Violoncellokonzert, Nr. 2Cellokonzert, D-Dur

EST: Quartette, Vl 1 2 Va Vc, H 3, 31-36Streichquartette, op. 20

(musikalische) WerktitelAnreicherung des Titelsatzes mit Informationen aus Werktitel: alternative Titel, Tonart, Werkverzeichnisnummer (Besetzung)

LänderbezugAuswertung der DIN-Ländercodes am Personen-Normsätzen --> Facettenbildung

„Haben Sie Noten von Komponisten Rumänischer Herkunft?“

“Geofacette“ der TU Freiberg Umsetzung einer Idee von Wiesenmüller, Maylein, Pfeffer:

http://www.ub.uni-heidelberg.de/archiv/12555

Auswertung und Indexierung der geografischen Codes an

Schlagwort-Normsätzen

Grenzen?!• Bislang nur für lokale Bibliotheksdaten (SWB) –

externe Quellen im Discovery System werden bislang nicht berücksichtigt

• Relativ simples Verwendungsmuster: Synonymverweisungen

• Keine visuelle Umsetzung der Inhalte eines Normsatzes

• GND als einziger Datenpool

Vier Beispiele

• Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT.• 05.06.2014 1000

Überblick

• Intro – 1

• Namensvarianten via GND – 7

• Alternative Sucheinstiege – 1

• Knowledge Graph – 2

• Querschnittssuche – 5

• Ausblick – 3

Intro

• Ein rotes Band – die GND

• Ein anderes – Nutzung von Indizes als (NoSQL) Datenbanken

GND-Anreicherung externer Quellen

Datensatz der externen Quelle „Naxos Music Library“

http://d-nb.info/gnd/118638157

Namensvarianten 1

• GND basierte Erweiterung von MARC-Records um Namensvarianten

• gnd.es:variantNameForThePerson

• Angewendet auf: Naxos Music Library, Gallica, RISM, IMSLP

Namensvarianten 2

• Nutzung eines Normdatenindex für Kandidatensuche

• Nutzung einer minimalen HTTP–API für Taxonomieabfragen

Namensvarianten 3

• Suche aller MARC 100.a Einträge der externen Quelle im Normdatenindex

• Für alle Kandidaten–GNDs, überprüfe, ob Beruf unter den Oberbegriff Musikerin (4040841-3) oder Musiker (4170818-0) fällt

• Für alle Kandidaten–GNDs, überprüfe, ob Lebensdaten in den Normdaten hinterlegt sind

Namensvarianten 4

• Naxos - 71815

• RISM - 11241

• IMSLP - 51722

• Gallica - 23754

Namensvarianten 5

• 54339 Name insgesamt

• 5051 Namen in Naxos und GND

• 719 Namen konnten zugeordnet werden

Namensvarianten 6

• Naxos – 719 Namen mit hoher Wahrscheinlichkeit korrekt

• RISM – 415

• IMSLP – variabel

• Gallica – 268

• generelle Frage der Qualitätsprüfung

Namensvarianten 7

• Alternative Implementierung – zum Beispiel über eine Abfrage der Normdaten vor der eigentlichen Suche

Sucheinstiege 1

• API um die GND–Daten

• narrower terms, broader terms, [synonyms]

• siehe Namesvarianten (gehört Musikerin zu den Oberbegriffen?)

• Anzeige von ähnlichen Begriffen in der Art von Facetten – mit Größenabschätzung (und anderen Metriken)

Optimierte Datennutzung für Suchanfragenoptimierte Nutzung der Taxonomie der SchlagwörterDarstellung der semantischer Beziehungen von GND-Einträgen untereinander

http://melvil.d-nb.de/swd-search?term=oboenrohr

Knowledge Graph 1

• Inspiration – Google Knowledge Graph

• Indexierung von GND, VIAF und DBPedia

• technische Herausforderungen (Dokumentenanzahl, Konvertierung, Kompression)

Knowledge Graph 2

• Beispiel Goethe

• Lebensdaten, Wirkungsort, Einflüsse, Werke, ...

• {“birthDate”: “…”, “deathDate”: “…”, “placeOfBirth”: “…”, “placeOfDeath”: “image”, …}

Querschnittssuchen 1

• Menschen gruppieren Dinge auch außerhalb von Facetten

• Wikipedia–Kategorien

Weitere Datenpools und Services:„Wikipedia-Querschnittssuche“

http://de.wikipedia.org/wiki/Kategorie:Komponist_(Romantik)

Querschnittssuche 2

• Zutaten: GND–Index, Wikipedia–Normdaten–Index, Wikipedia–Category–Index

Querschnittssuche 3

• {"p": "dnb.es:placeOfBusiness", "s": "gnd:63067-6", "o": "gnd:4005728-8"}

• {"ndl": "00575178", "gnd": "4191405-3", "lccn": "sh/85/004443", "title": "Americium", "typ": "s"}

• {"category": "Carbonylkomplex", "pages": ["Chromhexacarbonyl", "Metallcarbonyle", “...”]}

Querschnittssuche 4

• {"p": "dnb.es:placeOfBusiness", "s": "gnd:63067-6", "o": "gnd:4005728-8"}

• {"ndl": "00575178", "gnd": "4191405-3", "lccn": "sh/85/004443", "title": "Americium", "typ": "s"}

• {"category": "Carbonylkomplex", "pages": ["Chromhexacarbonyl", "Metallcarbonyle", “...”]}

Querschnittssuche 5

• Beispiel – Kategorie:Romantik_(Musik)

• 1225 Seiten unter der Kategorie

• 1082 GNDs

• Mit diesen GNDs kann man eine Suchabfrage auf einen Katalog absetzen

Ausblick 1

• verwendete Daten – GND, VIAF, DBPedia

• noch nicht einbezogen: Freebase, Authoritydaten anderer Nationalbibliotheken, datahub.io, ISNI, ...

• Ansätze sind nicht unbedingt allgemein anwendbar (z.B. Berufsbezeichnung)

Ausblick 2

• Index – Elasticsearch*

• Workflowmanagement – luigi*, gluish*

• Konverter – gomarckit*, nttoldj*, wptoldj*

• SQL für TSV: textql*

• Unix – awk*, cat*, cut*, grep*, sed*

Ausblick 3

• * Open source

• Linked Data schafft neue Verbindungen

Normdaten = Potentiale!Voraussetzungen und Perspektiven• Übernahme der VIAF-IDs in die Datensätze der GND• Bereitstellung von IDs in Initiativen zur

Datenfreigabe• Konsistentere Nutzung der GND in Bibliotheken• Projekte zur rückwirkenden Anreicherung in

Bibliotheken• Nachnutzung der GND / VIAF auch in

nichtbibliothekarischen Projekten

Übernahme der VIAF-IDs in die Datensätze der GND

http://viaf.org/viaf/99258155

Bereitstellung von IDs in Initiativen zur Datenfreigabe

https://opac.rism.info/search?id=653004096&db=251&View=rism

https://opac.rism.info/id/rismid/653004096?format=marc

Konsistentere Nutzung der GND in BibliothekenSacherschließungsquote im Buchbestand der HMT: 42,4%

Nachnutzung der GND in nicht-bibliothekarischen Projekten

http://pdr.bbaw.de/projekt

http://in2n.de/

Danke für Ihre Aufmerksamkeit!

http://blog.finc.info

Martin Czyganmartin.czygan@uni-leipzig.de

Anke Hofmannanke.hofmann@hmt-leipzig.de

Recommended