Das zweite Leben der Forschungsdaten. - E-Science-Tage · in der Daten(nach)nutzung? Archivierung...

Preview:

Citation preview

Das zweite Leben der Forschungsdaten. Die Gewährleistung von Förderauflagen zu

Open Access am Beispiel von Horizon 2020.

Sebastian Netscher

GESIS - Leibniz Institute for the Social Sciences

E-Science-Tage 2017: Forschungsdaten managen

17 April 2017, Heidelberg

Recherche

Studienplanung

DatengenerierungDatenanalyse

Langfristsicherung & Verfügbarkeit

Welche Daten, zu welchem Zweck?

Nachnutzung bereits existierender Daten?

Nachnutzungspotential der eigenen Daten?

Welche Informationen über wen oder was

in welcher Form (Dokumentation)?

Urheberschaft an den Daten?

Datenschutzrechtliche Einschränkungen

in der Daten(nach)nutzung?

Archivierung und Verfügbarmachung?

Der Lebenszyklus von Forschungsdaten

Herrema, A. (2014): FOSTER Cartoon: Do not be so 2014 - Share. FOSTER-Project (EU-Funding 612425).

Available at: https://www.fosteropenscience.eu/foster-taxonomy/research-data-management. (CC-by)

Open Access und

die Verfügbarkeit

von Forschungsdaten

Die Verfügbarkeit von Forschungsdaten

EU-Horizon 2020: Grant Agreement, Art. 29.3

Bild: Herrema, A. (2014): FOSTER Cartoon: CC-0. FOSTER-Project (EU-Funding 612425). Available at:

https://www.fosteropenscience.eu/foster-taxonomy/research-data-management. (CC-by)

• Reproduktion der Forschungsergebnisse

und Replikation der Forschungsdaten

• Nachnutzung der Forschungsdaten

in neuen Forschungskontexten

⇒ Open Access: Möglichkeit Dritter

“to access, mine, exploit, reproduce

and disseminate (…) the data”

Bild: Herrema, A. (2014): FOSTER Cartoon: Data Sharing. FOSTER-Project (EU-Funding 612425).

Available at: https://www.fosteropenscience.eu/foster-taxonomy/research-data-management. (CC-by)

Open Access, warum?

• Förderung von Wissenschaft und Forschung

⇒ Ausschöpfen des Potenzials

von Forschungsdaten

• Gute wissenschaftliche Praxis

⇒ Transparenz im Forschungsprojekt

• Steigerung der eignen Reputation

⇒ Zitation der Datenproduzenten

• Effiziente Nutzung öffentlicher Gelder

⇒ Förderauflagen von Drittmittelgebern

• “Regarding the (…) research data

generated (…), the beneficiaries must

(…) deposit in a research data repository

(…) draw up a ‘data management plan.”

(EU-Horizon 2020, 2016)

• „Die Antragstellenden verpflichten sich,

die (…) gewonnenen (…) zur Verfügung

zu stellen (…) ein eigenes Forschungsdaten-

management betreiben“ (BMBF, 2016)

Förderauflagen zu Open Access

EU-Horizon 2020: Grant Agreement, Art. 29.3

Bundesanzeiger, Bekanntmachung des BMBF vom 29.03.2016

Was die Förderauflage bedeutet

Förderer

Forschungsprojekt

verfügbare Forschungsdaten

Forschungsdatenmanagement

Ziel

Aktivität

GewährleistungDokumentation

Force 11 (2016): The FAIR Data Principles. Availible at: https://www.force11.org/group/fairgroup/fairprinciples.

Icons: Pixabay (2016). Availible at: www.pixabay.com (CC-0).

Die Prinzipien FAIRer Forschungsdaten

Findable:

Accessible:

Interoperable:

Re-useable:

Auffindbarkeit der Forschungsdaten

⇒ kontrolliertes Vokabular, Metadaten

(-standards), persistente Identifikatoren etc.

Zugänglichkeit der Forschungsdaten

⇒ Zugangs- und Nachnutzungsbedingungen

technische Nachnutzbarkeit

⇒ Dateiformate, genutzte Software etc.

analytische Nachnutzbarkeit

⇒ Verständlichkeit und Interpretierbarkeit

“Open” ist nicht unbedingt “frei”

offene

Datengeschlossene

DatenVerfügbarkeit

nationale Sicherheitamtliche Statistik Forschungsdaten

rechtlich

projekt-intern

⇒ so offen wie möglich, so geschlossen wie nötig

EU-EU-Horizon 2020: Grant Agreement, Art. 29.3

Forschungsdaten-

management

und verfügbare

Forschungsdaten

Bild: Herrema, A. (2014): FOSTER Cartoon: Data for Future Generations. FOSTER-Project (EU-Funding 612425).

Available at: https://www.fosteropenscience.eu/foster-taxonomy/research-data-management. (CC-by)

Forschungsdatenmanagement (FDM)

• FDM umfasst alle Prozesse und Maßnahmen zum Erhalt

und zur (Nach-)Nutzbarkeit von Forschungsdaten

– orientiert sich am Lebenszyklus

von Forschungsdaten

– verfolgt unterschiedliche Ziele

• Qualitätssicherung

im Forschungsprojekt

• Replizierbarkeit über das

Forschungsprojekt hinaus

• Nachnutzbarkeit der

Forschungsdaten durch Dritte

Bild: Hochstenbach, P. (2015): FOSTER Cartoon: Re-Use. FOSTER-Project (EU-Funding 612425).

Available at: https://www.fosteropenscience.eu/foster-taxonomy/research-data-management. (CC-by)

Bereiche des FDM

1. Handhabung der Forschungsdaten

⇒ Dateigenerierung, -dokumentation

und -organisation

2. forschungsethische und rechtliche Aspekte

⇒ Datenschutz (personenbezogene Daten)

und Urheberrechte (Dritter)

3. Längerfristige Sicherung der Forschungsdaten

⇒ Replikation und Nachnutzung

Icons: Pixabay (2016). Availible at: www.pixabay.com (CC-0).

1. Handhabung von Forschungsdaten

• Generierung der Forschungsdaten

– Sammlung und Aufbereitung

der Rohdaten

– Bereinigung der Forschungsdaten

• Dokumentation

– Datengenerierung

– Forschungsdaten

• Datenadministration

– Organisation von Daten und Dateien

– Sicherung der Daten (Backups)

accessible

interoperable

re-useable

findable

2. Ethische und Rechtliche Aspekte

• Datenschutz

(personenbezogene Informationen)

– informierte Einwilligung

– Anonymisierung

– Schutz vor unautorisiertem Zugriff

• Urheberrecht

(Recht am geistigen Eigentum)

– an den Forschungsdaten

– Urheberechte Dritter

accessible

3. Längerfristige Sicherung

• Replikation der Forschungsdaten

⇒ längerfristige (interne) Sicherung der

Forschungsdaten

⇒ Verfügbarkeit zu Replikationszwecken

• Verfügbarkeit der Forschungsdaten

⇒ Bereitstellung der Forschungsdaten

findable

accessible

interoperable

re-useable

Der Datenmanagementplan (DMP)

• zweckorientierte Dokumentation des FDM

– Dokumentation

• immer projekt-spezifisch

• lebendes Dokument

„needs to be updated over the course of the project“

– zweckorientiert

• Entwicklung und Beschreibung einer Strategie zur

o projekt-internen Qualitätssicherung

o Replikation der Forschungsdaten

o Verfügbarmachung der Forschungsdaten für Dritte

EU-Horizon 2020: Grant Agreement, Art. 29.3

Eine Strategie

zur Generierung

verfügbarer

Forschungsdaten

Bild: Herrema, A. (2014): FOSTER Cartoon: Open Data. FOSTER-Project (EU-Funding 612425).

Available at: https://www.fosteropenscience.eu/foster-taxonomy/research-data-management. (CC-by)

Entwicklung einer Strategie

1. Planung des FDM

– Forschungsdaten &

Verfügbarkeit

– Einschränkungen der

Verfügbarkeit

– Archivierung &

Verfügbarkeit

2. Erstellung eines DMP

– vom erste Entwurf zum Abschlussbericht

– Aufbau des DMP

Bild: Pixabay (2016). Availible at: www.pixabay.com (CC-0).

1. Planung: Forschungsdaten & Verfügbarkeit

Werden im Forschungsprojekt Forschungsdaten generiert?

Welche Forschungsdaten werden generiert?

Wie sieht das Nachnutzungspotential der Forschungsdaten aus?

Ist die Verfügbarmachung der Forschungsdaten möglich?

Ist die interne Sicherung möglich? Ist ein freier Zugang für jeden möglich?

Welche

Restriktionen

bestehen warum?

keine Daten,

d. h. kein FDM & kein DMP

CC-0 oder

CC-by?

Wie werden die

Daten intern

gesichert?

nein

nein

nein ja

ReplikationVerfügbarmachung

(Lizensierung)

ja

„opt out“

„opt out“

Forschungsprojekt

ja

ja

nein

• Gründe für Einschränkungen

– projektinterne Einschränkungen, z. B. Erreichen der

Projektziele, Abschluss von Forschungs-

arbeiten und Qualifikationen

– rechtliche Einschränkungen, z. B.

aufgrund des Datenschutz, des

Urheberrechts oder sonstiger

rechtliche Vorgaben

• Handhabung der Einschränkungen

– (zeitliches) Embargo

– Zugangs- und Nachnutzungsbedingungen (Lizenz)

1. Planung: Einschränkungen der Verfügbarkeit

Bild: Pixabay (2016). Availible at: www.pixabay.com (CC-0).

1. Planung: Archivierung & Verfügbarkeit

Welche Forschungsdaten sollen langfristig gesichert bzw. bereitgestellt werden?

Wie sollen die Daten langfristig gesichert bzw. bereitgestellt werden?

Archive machen Daten

auffindbar und zugänglich

Disziplin, Region, Datentyp, Dauer der Archivierung etc.

Wie und wie lange soll die Daten verfügbar sein?

Wie werden die Date auffindbar und zugänglich?

Langfristige Sicherung und Bereitstellung der Forschungsdaten

durch ein Archiv / Repositoriumdurch das Forschungsprojekt

Archiv / Repositorium

1. Planung: Archivierung der Forschungsdaten

• “Open access (…) via a research data repository (… )

an online archive for research data”

• Archive machen Forschungsdaten

– auffindbar, z. B. über persistente Identifikatoren,

Publikation von Metadaten in Suchmaschinen etc.

– zugänglich, z. B. über Lizenzen (Definition von

Zugangs- und Nachnutzungsbedingungen)

• Archive unterstützen die Generierung

interoperabler und nachnutzbarer Daten

EU-Horizon 2020: Grant Agreement, Art. 29.3

2. Erstellen eines DMP

• erster Entwurf: Strategie zur Generierung

verfügbarer Forschungsdaten

– EU: innerhalb der ersten 6 Projektmonaten

– BMBF: Teil des Förderantrags

• aktualisierter DMP in den Zwischenberichten:

Sicherstellung der Umsetzung der Strategie

• Abschlussbericht: Erklärung, wann die Daten

archiviert werden bzw. wurden

⇒ „Forschungsdaten sind auffindbar über …, zugänglich durch …,

interoperabel und nachnutzbar entsprechend disziplin-

spezifischer Standards“

2. Erstellen eines DMP: Aufbau des DMP

1. Beschreibung der Forschungsdaten:

⇒ Projektkontext, Art der Daten, Datengenerierung, Verfügbarkeit der generierten Daten etc.

2. Einschränkungen in der Verfügbarkeit der Daten

⇒ projektinterner und/oder rechtlicher Aspekte

3. Verfügbarkeit und Gewährleistung des FAIR-Prinzips

⇒ (Dauer der) Auffindbarkeit und Zugänglichkeit, Interoperabilität und Nachnutzbarkeit

4. Verantwortlichkeiten und Ressourcen für das FDM

Horizon 2020 & DMP-Vorlagen

H2020 Programme:

Guidelines on FAIR Data

Management in Horizon

2020.

Annex 1: FAIR Data

Management at a Glance:

Issues to Cover in Your

Horizon 2020 DMP.

Version 3.0.

26 July 2016

Humboldt Universität

zu Berlin:

Muster-DMP

Horizon 2020.

Version 3.0.

Vielen Dank für Ihre Aufmerksamkeit

Literatur

• Force 11 (2016): The FAIR Data Principles.

• Bundesanzeiger (2016): Bekanntmachung des BMBF. 29.03.2016.

• Horizon 2020 Programme (2016): Annotated Model Grant Agreement. Version

2.1.1. 1. July 2016.

• Horizon 2020 Programme (2016): Guidelines on FAIR Data Management in

Horizon 2020. Version 3.0. 26 Juli 2016.

• Horizon 2020 Programme (2016): Guidelines on Open Access to Scientific

Publications and Research Data in Horizon 2020. Version 3.1. 25 August 2016.

• Horizon 2020 Programmme (2016): Guidelines on the Implementation of Open

Access to Scientific Publications and Research Data in Projects supported by the

European Research Council under Horizon 2020. August 2016.

Recommended