45
Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig 103. Bibliothekartag, Bremen, 5.6.2014 Martin Czygan, Universitätsbibliothek Leipzig Anke Hofmann, Bibliothek der Hochschule für Musik und Theater „Felix Mendelssohn Bartholdy“ Leipzig

Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

  • Upload
    mrtncz

  • View
    1.055

  • Download
    2

Embed Size (px)

DESCRIPTION

Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Citation preview

Page 1: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig103. Bibliothekartag, Bremen, 5.6.2014

Martin Czygan, Universitätsbibliothek LeipzigAnke Hofmann, Bibliothek der Hochschule für Musik und Theater „Felix Mendelssohn Bartholdy“ Leipzig

Page 2: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Normdatenimplementierung als finc Milestone

Page 3: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Normdaten = PotentialeGroßer Bestandteil klassischer Katalogisierungsarbeit

Page 4: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Normdaten = PotentialeEnorme Datensammlungen

http://d-nb.info/gnd/118576291

Page 5: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Normdaten = PotentialeGND als übergreifendes Normierungssystem

https://wiki.dnb.de/display/ILTIS/Informationsseite+zur+GND+neu

Page 6: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Normdaten = PotentialeInteressant auch für nicht-bibliothekarische Projekte

http://de.wikipedia.org/wiki/Gustav_Mahler

Page 7: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Normdaten = Potentiale

Steigerung des Suchkomforts für unsere Nutzer/innen!

Page 8: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Bisherige Anwendungsfelder„klassische“ Datenauswertung: Verweissysteme•Personennamen und Körperschaften•Schlagworte•(musikalische) Werktitel

Weitere Datenauswertung•Länderbezug für Autor/innen und Komponist/innen•Geofacette

Page 9: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Personennamen und KörperschaftenAnreicherung des Titelsatzes mit den Verweisungsformen der verknüpften Personen

https://katalog.hmt-leipzig.de/Record/0003347345 fincMARC 900

Page 10: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

SchlagworteAnreicherung des Titelsatzes mit Synonymverweisungen und Oberbegriffen der verknüpften Schlagworte

https://katalog.hmt-leipzig.de/Record/0000525350 fincMARC 950

Page 11: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

(musikalische) WerktitelAnreicherung des Titelsatzes mit Informationen aus Werktitel: alternative Titel, Tonart, Werkverzeichnisnummer (Besetzung)

fincMARC 920https://katalog.hmt-leipzig.de/Record/0008964807

Page 12: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

EST: Konzerte, Vc Orch, G 479Violoncellokonzert, Nr. 2Cellokonzert, D-Dur

EST: Quartette, Vl 1 2 Va Vc, H 3, 31-36Streichquartette, op. 20

(musikalische) WerktitelAnreicherung des Titelsatzes mit Informationen aus Werktitel: alternative Titel, Tonart, Werkverzeichnisnummer (Besetzung)

Page 13: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

LänderbezugAuswertung der DIN-Ländercodes am Personen-Normsätzen --> Facettenbildung

„Haben Sie Noten von Komponisten Rumänischer Herkunft?“

“Geofacette“ der TU Freiberg Umsetzung einer Idee von Wiesenmüller, Maylein, Pfeffer:

http://www.ub.uni-heidelberg.de/archiv/12555

Auswertung und Indexierung der geografischen Codes an

Schlagwort-Normsätzen

Page 14: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Grenzen?!• Bislang nur für lokale Bibliotheksdaten (SWB) –

externe Quellen im Discovery System werden bislang nicht berücksichtigt

• Relativ simples Verwendungsmuster: Synonymverweisungen

• Keine visuelle Umsetzung der Inhalte eines Normsatzes

• GND als einziger Datenpool

Page 15: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Vier Beispiele

• Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT.• 05.06.2014 1000

Page 16: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Überblick

• Intro – 1

• Namensvarianten via GND – 7

• Alternative Sucheinstiege – 1

• Knowledge Graph – 2

• Querschnittssuche – 5

• Ausblick – 3

Page 17: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Intro

• Ein rotes Band – die GND

• Ein anderes – Nutzung von Indizes als (NoSQL) Datenbanken

Page 18: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

GND-Anreicherung externer Quellen

Datensatz der externen Quelle „Naxos Music Library“

http://d-nb.info/gnd/118638157

Page 19: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Namensvarianten 1

• GND basierte Erweiterung von MARC-Records um Namensvarianten

• gnd.es:variantNameForThePerson

• Angewendet auf: Naxos Music Library, Gallica, RISM, IMSLP

Page 20: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Namensvarianten 2

• Nutzung eines Normdatenindex für Kandidatensuche

• Nutzung einer minimalen HTTP–API für Taxonomieabfragen

Page 21: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Namensvarianten 3

• Suche aller MARC 100.a Einträge der externen Quelle im Normdatenindex

• Für alle Kandidaten–GNDs, überprüfe, ob Beruf unter den Oberbegriff Musikerin (4040841-3) oder Musiker (4170818-0) fällt

• Für alle Kandidaten–GNDs, überprüfe, ob Lebensdaten in den Normdaten hinterlegt sind

Page 22: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Namensvarianten 4

• Naxos - 71815

• RISM - 11241

• IMSLP - 51722

• Gallica - 23754

Page 23: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Namensvarianten 5

• 54339 Name insgesamt

• 5051 Namen in Naxos und GND

• 719 Namen konnten zugeordnet werden

Page 24: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Namensvarianten 6

• Naxos – 719 Namen mit hoher Wahrscheinlichkeit korrekt

• RISM – 415

• IMSLP – variabel

• Gallica – 268

• generelle Frage der Qualitätsprüfung

Page 25: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Namensvarianten 7

• Alternative Implementierung – zum Beispiel über eine Abfrage der Normdaten vor der eigentlichen Suche

Page 26: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Sucheinstiege 1

• API um die GND–Daten

• narrower terms, broader terms, [synonyms]

• siehe Namesvarianten (gehört Musikerin zu den Oberbegriffen?)

• Anzeige von ähnlichen Begriffen in der Art von Facetten – mit Größenabschätzung (und anderen Metriken)

Page 27: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Optimierte Datennutzung für Suchanfragenoptimierte Nutzung der Taxonomie der SchlagwörterDarstellung der semantischer Beziehungen von GND-Einträgen untereinander

http://melvil.d-nb.de/swd-search?term=oboenrohr

Page 28: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Knowledge Graph 1

• Inspiration – Google Knowledge Graph

• Indexierung von GND, VIAF und DBPedia

• technische Herausforderungen (Dokumentenanzahl, Konvertierung, Kompression)

Page 29: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Knowledge Graph 2

• Beispiel Goethe

• Lebensdaten, Wirkungsort, Einflüsse, Werke, ...

• {“birthDate”: “…”, “deathDate”: “…”, “placeOfBirth”: “…”, “placeOfDeath”: “image”, …}

Page 30: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Querschnittssuchen 1

• Menschen gruppieren Dinge auch außerhalb von Facetten

• Wikipedia–Kategorien

Page 31: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Weitere Datenpools und Services:„Wikipedia-Querschnittssuche“

http://de.wikipedia.org/wiki/Kategorie:Komponist_(Romantik)

Page 32: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig
Page 33: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Querschnittssuche 2

• Zutaten: GND–Index, Wikipedia–Normdaten–Index, Wikipedia–Category–Index

Page 34: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Querschnittssuche 3

• {"p": "dnb.es:placeOfBusiness", "s": "gnd:63067-6", "o": "gnd:4005728-8"}

• {"ndl": "00575178", "gnd": "4191405-3", "lccn": "sh/85/004443", "title": "Americium", "typ": "s"}

• {"category": "Carbonylkomplex", "pages": ["Chromhexacarbonyl", "Metallcarbonyle", “...”]}

Page 35: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Querschnittssuche 4

• {"p": "dnb.es:placeOfBusiness", "s": "gnd:63067-6", "o": "gnd:4005728-8"}

• {"ndl": "00575178", "gnd": "4191405-3", "lccn": "sh/85/004443", "title": "Americium", "typ": "s"}

• {"category": "Carbonylkomplex", "pages": ["Chromhexacarbonyl", "Metallcarbonyle", “...”]}

Page 36: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Querschnittssuche 5

• Beispiel – Kategorie:Romantik_(Musik)

• 1225 Seiten unter der Kategorie

• 1082 GNDs

• Mit diesen GNDs kann man eine Suchabfrage auf einen Katalog absetzen

Page 37: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Ausblick 1

• verwendete Daten – GND, VIAF, DBPedia

• noch nicht einbezogen: Freebase, Authoritydaten anderer Nationalbibliotheken, datahub.io, ISNI, ...

• Ansätze sind nicht unbedingt allgemein anwendbar (z.B. Berufsbezeichnung)

Page 38: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Ausblick 2

• Index – Elasticsearch*

• Workflowmanagement – luigi*, gluish*

• Konverter – gomarckit*, nttoldj*, wptoldj*

• SQL für TSV: textql*

• Unix – awk*, cat*, cut*, grep*, sed*

Page 39: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Ausblick 3

• * Open source

• Linked Data schafft neue Verbindungen

Page 40: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Normdaten = Potentiale!Voraussetzungen und Perspektiven• Übernahme der VIAF-IDs in die Datensätze der GND• Bereitstellung von IDs in Initiativen zur

Datenfreigabe• Konsistentere Nutzung der GND in Bibliotheken• Projekte zur rückwirkenden Anreicherung in

Bibliotheken• Nachnutzung der GND / VIAF auch in

nichtbibliothekarischen Projekten

Page 41: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Übernahme der VIAF-IDs in die Datensätze der GND

http://viaf.org/viaf/99258155

Page 42: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Bereitstellung von IDs in Initiativen zur Datenfreigabe

https://opac.rism.info/search?id=653004096&db=251&View=rism

https://opac.rism.info/id/rismid/653004096?format=marc

Page 43: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Konsistentere Nutzung der GND in BibliothekenSacherschließungsquote im Buchbestand der HMT: 42,4%

Page 44: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Nachnutzung der GND in nicht-bibliothekarischen Projekten

http://pdr.bbaw.de/projekt

http://in2n.de/

Page 45: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Danke für Ihre Aufmerksamkeit!

http://blog.finc.info

Martin [email protected]

Anke [email protected]