WissKom 2012 – Jülich - Julia Iwanowa, Maxi Kindling, Sammy David
OA-Netzwerk - semantische Anreicherung undVernetzung von wissenschaftlichen OA-Inhalten
Initiiert durch Gefördert durch
Projektpartner
Ziele
Förderung der Sichtbarkeit deutscher Repositorieninhalte (textbasierte)
Nationaler Aggregationsknoten (Infrastrukturaufbau)
Förderung des „DINI-Zertifikat für Dokumenten- und Publikationsservices“
Stärkung des Kooperationsnetzes aus OA-Projekten
WissKom 2012 – Jülich - Julia Iwanowa, Maxi Kindling, Sammy David
Herausforderungen
WissKom 2012 – Jülich - Julia Iwanowa, Maxi Kindling, Sammy David
Steigerung der Anzahl DINI-zertifizierter Repositorien
Heterogenität der Metadaten (teilweise trotz DINI-Zertifikats)
Trainingsdaten für DDC-Klassifikation
flaches Metadatenformat Dublin Core
Aktueller Schwerpunkt
WissKom 2012 – Jülich - Julia Iwanowa, Maxi Kindling, Sammy David
semantische Anreicherung der Metadaten
Vernetzung mit externen Datenquellen im Sinne des Linked Data
Aggregation von Enhanced Publications
Beispiel: Vernetzung mit der DNB ohne Personenidentifikator
WissKom 2012 – Jülich - Julia Iwanowa, Maxi Kindling, Sammy David
1. Erzeugung eines RDF-Dumps mithilfe des D2R-Servers
2. Verwendung des DNB RDF-Dumps als externe Datenquelle
3. Einsatz des Kontextualisierungstools „SILK“
4. Nutzung des Vor- und Nachnamens als Matching-Kriterium
→ Erzeugung von 80.000 owl:sameAs Links von OAN zur DNB
Beispiel: Vernetzung mit der DNB ohne Personenidentifikator
WissKom 2012 – Jülich - Julia Iwanowa, Maxi Kindling, Sammy David
Ergebnis: Personennamen-Matching nicht ausreichend
5. zusätzliches Titeldaten-Matching (2nd Level Comparison)
→ knapp 18.000 verifizierte Links jedoch auch jetzt keine 100% Bestätigung
Optional: weitere Felder in die Verifizierung einbeziehen
Ergebnisse
Ausführliche Informationen und Ratgeber für angehende Repositorienbetreiber
Infrastruktur für Aggregationsknoten (Open Source)
Mehrwertdienste für Wissenschaftler (Rechercheplattform)
Mehrwertdienste für OA-Institutionen (Validator)
Offener Datenpool für Entwickler/OA-Projekte (REST-API, LOD)
Technische Dienste für spezifische Problemfelder (Metadatenanreicherung, Metadatengenerierung, semantische Vernetzung)
WissKom 2012 – Jülich - Julia Iwanowa, Maxi Kindling, Sammy David
Zahlen, bitte!
OAN-Datenraum
41 DINI-zertifizierte Repositorien
268.000 Datensätze
Volltextsuche über 160.000 OA-Publikationen
~ 35% des nationalen Datenraums (OAI-PMH) (basierend auf „2012 Census of Open Access Repositories in Germany“)
voraussichtliche Verdopplung des Datenraums bis zum Jahresende
Ausblick
Ausweitung des Datenraums
Sammeln von Kontextdaten zu Compound Objects
Identifikatoren für Autoren
Anbindung an höhere Datenquellen (Europeana, DDB, Bibliotheksverbünde)
WissKom 2012 – Jülich - Julia Iwanowa, Maxi Kindling, Sammy David
Vielen Dank für die Aufmerksamkeit!
WissKom 2012 – Jülich - Julia Iwanowa, Maxi Kindling, Sammy David