Normdaten - die Aggregatoren im Web

Preview:

DESCRIPTION

Verlage bieten ihren Autoren eine Unterstützung bei der Aufnahme ihrer Veröffentlichungen in nationalen und internationalen Bibliothekskatalogen sowie dem Nachweis in Buchhandels- und Internetverzeichnissen. Der Vortrag zeigt auf, wie Verlage sicherstellen können, dass ihre Veröffentlichungsnachweise in der Fülle von Informationen des Internets tatsächlich eine hohe Sichtbarkeit erhalten und vor allem dem Autor sowie dem Verlag eindeutig zuordenbar sind. Hierfür gibt der Vortragende einen Exkurs in den Umgang mit Normdaten und verdeutlicht welche Möglichkeiten durch die Etablierung des Semantic Webs hinsichtlich einer verbesserten Datennachnutzbarkeit und –vernetzung erwachsen. Über das Wirken der Verlage hinaus, wird auch die Rolle von sozialen Netzwerken wie Wikipedia oder MusicBrainz für die Bereitstellung bzw. Nachnutzung von bibliografischen Daten und Normdaten innerhalb des semantischen Netzes diskutiert.

Citation preview

1

Alexander Haffner

Normdaten - die Aggregatoren im Web

…and nobody else

Was können Sie für Ihren

Kunden tun?

– Sichtbarkeit und Verkaufszahlen der Publikation im Internet erhöhen

- Vertrieb in einer großen Zahl von Online-Shops

- PR über Social-Media-Kanäle

– Nachweis der eindeutigen Verfasserschaft- den Autor als „Web-Ressource“ etablieren

- Einbinden der Veröffentlichungen in zur Web-Ressource

gehörenden Publikationsliste

5

7

Online-Shops

The Power of Social Networks

– Dan Brown hat über 2 Mio. „likes“

Wikipedia

– Benutzer pflegen Informationen über Persönlichkeiten und Institutionen des öffentlichen Lebens

– Lebensdaten strukturiert abgelegt und in Infoboxen dargestellt

– Vollständiger Bibliographie-nachweis

– Artikel sind mit Informations-nachweisen auf anderen Plattformen verlinkt

9

Wikipedia

10

163 Nach-

weise

Verknüpfung

mit Wikipedia

11

12

MusicBrainz

MusicBrainz

13

14

MusicBrainz

- bietet die Infrastruktur für eine neue Qualität des Umgangs mit Information hinsichtlich Beschaffung wie auch Bereitstellung

- hohe Verfügbarkeit- hohe Aktualität- geringe Kosten

- Probleme des Web- Fülle an Informationen- ausgerichtet auf Menschen als Endnutzer- Lokalisierung von Information problematisch- heutige Suchmaschinen gut, aber stichwortbasiert

- wünschenswert:- inhaltliche, semantische Suche

Das Web

15

Semantic WebDas Web für die Maschine

- Ziele:

- Strukturierung der Web-Informationen zur Erleichterung der

automatisierten Auswertung durch die Maschine

- offene und weitverbreitete Standards zur Beschreibung von

Informationen / Wissen

- Anbieterübergreifende Vernetzung von Wissen

- Methoden zur Gewinnung von weiteren Informationen aus

existierenden Beschreibungen

16

- Grundprinzipien - Linked Data:

1. Benutzung von URIs, um Objekte zu identifizieren

2. Vergabe von HTTP-URIs, so dass Objekte nachgeschlagen werden

können

3. Wenn eine URI nachgeschlagen wird, müssen zweckdienliche

Informationen gemäß Semantic-Web-Standards bezogen werden

können

4. Verknüpfung von Objektbeschreibungen mit anderen Objekten (Link

zu deren URI)

18

Semantic WebDas Web für die Maschine

– Linked Data:- Kodierung und Verlinkung der Daten durch Resource Description

Framework (RDF)

- Subjekt-Prädikat-Objekt-Ausdrücke

Resource

Resource

Resource

Literal

Property

Property

Subjekt ObjektPrädikat

Linked Data und Semantic Web

19

Ein einfaches Beispiel

20

http://d-nb.info/971564396

Illuminati

http://purl.org/dc/elements/1.1/creator

Dan Brown

http://purl.org/dc/elements/1.1/title

<rdf:RDF

xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"

xmlns:dc="http://purl.org/dc/elements/1.1/">

<rdf:Description rdf:about="http://d-nb.info/971564396">

<dc:title>Illuminati</dc:title>

<dc:creator>Dan Brown</dc:creator>

</rdf:Description>

</rdf:RDF>

Ein einfaches Beispiel

21

http://d-nb.info/971564396

Illuminati

http://purl.org/dc/elements/1.1/creator

http://d-nb.info/gnd/124429548

http://purl.org/dc/elements/1.1/title

<rdf:RDF

xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"

xmlns:dc="http://purl.org/dc/elements/1.1/">

<rdf:Description rdf:about="http://d-nb.info/971564396">

<dc:title>Illuminati</dc:title>

<dc:creator rdf:resource="http://d-nb.info/gnd/124429548 " />

</rdf:Description>

</rdf:RDF>

22

DBpedia

Warum Normdaten?

– normierte Sucheinstiege zu bibliografischen Einheiten- erhöhte Benutzerfreundlichkeit bei der Recherche in

Bibliothekskatalogen

– alles an einer Stelle- zentrale Datenverwaltung- einmalige Charakterisierung von

Normdatenentitäten (Vorzugsbenennung, Verweisungsformen etc.)

– kooperative Erstellung und Nutzung- Daten sind allen Bibliotheken zugänglich

23

– PND: PersonennamendateiPersonen der Formal- und Sacherschließung

– GKD: Gemeinsame KörperschaftsdateiKörperschaften der Formalerschließung einschl. Gebietskörperschaften und Kongresse

– SWD: SchlagwortnormdateiSchlagwörter - alle sekundär behandelten Entitäten einschl. Körperschaften, Geografika, Veranstaltungen, Werke, Schriftdenkmäler etc.

– DMA-EST: Einheitssachtitel musikalischer Werke einschl. Expressionen

24

Ausgangssituation - Getrennte Normdateien

Datensätze in Zahlen

25

•PND7 mio

•SWD600.000

•GKD1.6 mio

•DMA-EST

100.000

9.3 mio

Gemeinsame Normdatei (GND)

– Beschreibung von Personen, Körperschaften, Kongressen, Geografika, Schlagwörtern und Werken

– Integration der Normdateien (PND, GKD, SWD, DMA-EST) in objektorientierter Struktur

- Entitätenbasierte Repräsentation- Aufhebung von Redundanzen- einheitliches Datenformat und Regelwerk- Bereinigung ungeeigneter Datenstrukturen- Möglichkeit der Eingabe von Originalschrift

– Angleichung an internationale Standards- Austauschformat MARC 21 Authority- Berücksichtigung von RDA, FRBR und FRAD

– Zukunftsfähig- Linked-Data-Repräsentation im Semantic Web- für automatische Verfahren geeignet

26

– Projektziel

– Kostensenkung bibliothekarischer Normdaten bei gleichzeitiger Steigerung ihres Nutzens

– verlinkte Daten im Web zugänglich machen

– Abgleich und Verlinkung nationaler Normdateien

– 22 Normdateien von 19 Einrichtungen

– derzeit noch auf Personendaten beschränkt

– Gemeinschaftsprojekt von Nationalbibliotheken, das von OCLC implementiert und gehosted wird

Virtual International Authority File

27

Virtual International Authority File

28

Portalansicht der DNB

29

Mission

ORCID aims to solve the author/contributor name ambiguity problem in scholarly communications by creating a central registry of unique identifiers for individual researchers and an open and transparent linking mechanism between ORCID and other current author ID schemes. These identifiers and the relationships among them can be linked to the researcher’s output to enhance the scientific discovery process and to improve the efficiency of research funding and collaboration within the research community.

Participant Organizations

Was können Sie tun um Teil der Cloud

zu werden?

Was können Sie tun um Teil der Cloud

zu werden?

…und noch wichtiger,

was haben Sie davon?

Benefits der Cloud

34

– Daten stehen weiteren Akteuren zur Nachnutzung bzw. gemeinsamen Pflege zur Verfügung

– Lizenzfestlegung notwendig

– Online-Shops können bibliografische Daten ohne Zutun des Verlages in ihr Angebot aufnehmen

– Web 2.0 Plattformen können Inhalte in ihr Angebot aufnehmen

– Sicherung der Korrektheit der Angaben seitens des Verlages

– Sie nutzen Daten nach, die von Dritten bereits in der Cloud bereitgestellt wurden

Was bedeutet das für Sie?

– Erschließung bibliografischer Ressourcen mit Verknüpfung zu Normdaten

– eindeutige Identifier für Verlag und Autoren/Mitwirkende

– Aufbau eines semantischen Netzes

– Anlegen bzw. Nachnutzen von Normdateneintragungen

– Pool von Akteuren kollaborativ pflegen

– Einbeziehung bereits existierender Normdatennachweise

– Rollenangabe für Mitwirkende spezifizieren

35

…Gegenwart und nahe Zukunft in der Deutschen Nationalbibliothek

36

– kollaborative GND-Erschließung mit Bibliotheken und bibliotheksfremden Organisationen weiter verstärken

– Workflows für regelmäßige maschinelle Abgleichverfahren zu Fremddaten etablieren

– gezielte Einbeziehung von ausgewählten Fremddaten bei der Erschließung

– semi-automatisch vs. voll-automatisch

– Ausbau von Qualität und Quantität der GND-Datenbasis

– freie Bereitstellung der Daten sowie der Verknüpfungen zu Fremdbeständen im Semantic Web

Vielen Dank!

discussion is welcome…

Alexander Haffner Deutsche Nationalbibliothek

Adickesallee 1, 60322 Frankfurt am Main Telefon: +49-69-1525-1766 Telefax: +49-69-1525-1799

a.haffner@dnb.de http://www.dnb.de

37

Recommended