18
Infrastructure de recherche PNDB (Pôle National de Données de Biodiversité) Yvan LE BRAS, Chef de projet (UMS PatriNat) Anne-Sophie ARCHAMBEAU, GBIF-France (UMS PatriNat) Cécile CALLOU, Dir UMS BBEES (CNRS-MNHN) Aurélie DELAVAUD (FRB) Dominique JOLY, DAS CNRS (INEE) Laurent PONCET, Dir. Adj., en charge du Centre de données (UMS PatriNat) Jean-Denis VIGNE, DGD-Recherche, expertise, valorisation, enseignement (MNHN) Séminaire SIST 5-8 nov. 2019

Infrastructure de recherche PNDB - Sciencesconf.org · 2019. 11. 25. · Yvan LE BRAS, Chef de projet (UMS PatriNat) Anne-Sophie ARCHAMBEAU, GBIF-France (UMS PatriNat) Cécile CALLOU,

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Infrastructure de recherche PNDB - Sciencesconf.org · 2019. 11. 25. · Yvan LE BRAS, Chef de projet (UMS PatriNat) Anne-Sophie ARCHAMBEAU, GBIF-France (UMS PatriNat) Cécile CALLOU,

Infrastructure de recherche PNDB

(Pôle National de Données de Biodiversité)

Yvan LE BRAS, Chef de projet (UMS PatriNat)

Anne-Sophie ARCHAMBEAU, GBIF-France (UMS PatriNat)

Cécile CALLOU, Dir UMS BBEES (CNRS-MNHN)

Aurélie DELAVAUD (FRB)

Dominique JOLY, DAS CNRS (INEE)

Laurent PONCET, Dir. Adj., en charge du Centre de données (UMS PatriNat)

Jean-Denis VIGNE, DGD-Recherche, expertise, valorisation, enseignement (MNHN)

Séminaire SIST 5-8 nov. 2019

Page 2: Infrastructure de recherche PNDB - Sciencesconf.org · 2019. 11. 25. · Yvan LE BRAS, Chef de projet (UMS PatriNat) Anne-Sophie ARCHAMBEAU, GBIF-France (UMS PatriNat) Cécile CALLOU,

1. Hétérogénéité des données (et des communautés scientifiques)

• En fonction du domaine• En fonction des technologies• En fonction des usages

2. Dispersion de la donnée • Au niveau des Infrastructures• Au niveau des organismes de recherche• Au niveau des laboratoires et projets

3. Interactions complexe entre• Les différents niveaux d’organisation du vivant• Les facteurs abiotiques• Les pressions d’origines variées

Enjeux, Objectifs Stratégie GouvernanceCahier des

charges

Analyse de la situation

WIP

Séminaire SIST 5-8 nov. 2019

Page 3: Infrastructure de recherche PNDB - Sciencesconf.org · 2019. 11. 25. · Yvan LE BRAS, Chef de projet (UMS PatriNat) Anne-Sophie ARCHAMBEAU, GBIF-France (UMS PatriNat) Cécile CALLOU,

Mettre à la disposition de la communauté scientifique des voie d’accès simples et directes aux données/métadonnées

Rendre les données Facile à trouver, Accessibles, Interopérables et Ré-utilisables(FAIRisation des données de biodiversité)

Accompagner la structuration en cours des communautés scientifiques concernées,

Développer les interfaces avec les autres composantes du « Système Terre »

Enjeux, Objectifs Stratégie GouvernanceCahier des

charges

Défis

WIP

Séminaire SIST 5-8 nov. 2019

Page 4: Infrastructure de recherche PNDB - Sciencesconf.org · 2019. 11. 25. · Yvan LE BRAS, Chef de projet (UMS PatriNat) Anne-Sophie ARCHAMBEAU, GBIF-France (UMS PatriNat) Cécile CALLOU,

1. Contribuer aux recherches concernant l’état et la dynamique de la biodiversité,

2. Répondre aux besoins des communautés scientifiques au jour le jour :

3. Faire progresser la consolidation de toutes les connaissances

Enjeux, Objectifs Stratégie GouvernanceCahier des

charges

Objectifs opérationnels

en tenant compte :- De tous niveaux d’organisation du vivant, du génome aux communautés,- Des facteurs abiotiques (IR Syst. Terre-Env. : surf. continentale, océans, atmosphère, terre interne),- Des pratiques et comportements des sociétés humaines (socio-écosystèmes),- Des échelles de temps emboitées (collections d’histoire naturelle, bioarchéologie, paléontologie).

Privilégier la qualité (quality data) au-delà de la quantité

WIP

Séminaire SIST 5-8 nov. 2019

Page 5: Infrastructure de recherche PNDB - Sciencesconf.org · 2019. 11. 25. · Yvan LE BRAS, Chef de projet (UMS PatriNat) Anne-Sophie ARCHAMBEAU, GBIF-France (UMS PatriNat) Cécile CALLOU,

1. Contribuer aux recherches concernant l’état et la dynamique de la biodiversité,

2. Répondre aux besoins des communautés scientifiques au jour le jour :

3. Faire progresser la consolidation de toutes les connaissances

Enjeux, Objectifs Stratégie GouvernanceCahier des

charges

Objectifs opérationnels

- Accéder aux métadonnées et, autant que possible, aux données, adaptées à la question posée (y compris données « expertise »),

- Faciliter la mise à disposition, la validation et l’analyse des métadonnées/données en dépassant leurs hétérogénéité, dispersion et provenance,

- Accroître la caractérisation et la fiabilité des données en améliorant la documentation et les formats des métadonnées (équilibre entre « big data » et « quality data ») ,

- Favoriser la réutilisation et le couplage des données dans une approche intégrée.

Promouvoir la flexibilité des services

Articuler avec les autres SI et IR

Privilégier la qualité (quality data) au-delà de la quantité

WIP

Séminaire SIST 5-8 nov. 2019

Page 6: Infrastructure de recherche PNDB - Sciencesconf.org · 2019. 11. 25. · Yvan LE BRAS, Chef de projet (UMS PatriNat) Anne-Sophie ARCHAMBEAU, GBIF-France (UMS PatriNat) Cécile CALLOU,

1. Contribuer aux recherches concernant l’état et la dynamique de la biodiversité,

2. Répondre aux besoins des communautés scientifiques au jour le jour :

3. Faire progresser la consolidation de toutes les connaissances disponibles,

Enjeux, Objectifs Stratégie GouvernanceCahier des

charges

Objectifs opérationnels

Promouvoir la flexibilité des services

notamment en promouvant : - La bancarisation des données de recherche (information, formation, accompagnement),- Les approches intégrées (réutilisation, couplage),- L’animation des communautés scientifiques concernées, en lien avec les dispositifs internationaux.

Offrir des services à valeurs ajoutées

Articuler avec les autres SI et IR

Contribuer à l’animation et structuration

des communautés scientifiques

Privilégier la qualité (quality data) au-delà de la quantité

WIP

Séminaire SIST 5-8 nov. 2019

Page 7: Infrastructure de recherche PNDB - Sciencesconf.org · 2019. 11. 25. · Yvan LE BRAS, Chef de projet (UMS PatriNat) Anne-Sophie ARCHAMBEAU, GBIF-France (UMS PatriNat) Cécile CALLOU,

1. S’appuyer sur bases de métadonnées/données et systèmes d’information existant :

2. Contribuer à étendre l’existant avec d’autres BdD de recherche ou d’expérimentation :

3. Potentialiser les données à travers la mise à disposition d’outils (y compris existant) :

4. Générer une dynamique d’animation et d’échanges entre chercheurs/communautés :

5. Veiller à la cohérence avec les efforts nationaux, européens et internationaux

Enjeux, Objectifs Stratégie GouvernanceCahier des

charges

- en les mettant en relation et en générant des synergies (notamment référentiels et ontologies)- en contribuant à renforcer leur visibilité et leur cohérence les uns par rapport aux autres

GBIF, SINP-INPN, INDOR, SIB-SIMM, SISMER, INFOTERRE…Data-Terra, ReColNat, RARe, AnaEE, RZA…iBOL2…

Développer, faciliter et favoriser la

description fine des données

BARcoding, « omiques », communautés, socio-écosystèmes, pressions, temps long…

- d’aide à la bancarisation (e.g. ajout de métadonnées ; format et correspondance des métadonnées)- de traitement/croisement des jeux de données et d’accès aux plateformes de calcul intensif,

- en s’appuyant sur l’existant et le valorisant (e-learning GBIF, CES, CESAB…)- par une stratégie de communication, d’information, de rencontres/colloques- en sensibilisant toutes les communautés aux enjeux de l’open data et de leur FAIRisation

WIP

Séminaire SIST 5-8 nov. 2019

Page 8: Infrastructure de recherche PNDB - Sciencesconf.org · 2019. 11. 25. · Yvan LE BRAS, Chef de projet (UMS PatriNat) Anne-Sophie ARCHAMBEAU, GBIF-France (UMS PatriNat) Cécile CALLOU,

An

aEE

Eco

tro

n

So

cio

-éco

syst

RZ

A

An

aEE

Nat

ura

BDD

RZA

BDD AnaEE

France

eLTER

2018

e-IR : « Pôle de données de Biodiversité »

An

aEE

e-IR : « Data Terra »

Enjeux, Objectifs Stratégie GouvernanceCahier des

chargesWIP

Séminaire SIST 5-8 nov. 2019

Page 9: Infrastructure de recherche PNDB - Sciencesconf.org · 2019. 11. 25. · Yvan LE BRAS, Chef de projet (UMS PatriNat) Anne-Sophie ARCHAMBEAU, GBIF-France (UMS PatriNat) Cécile CALLOU,

An

aEE

Eco

tro

n

So

cio

-éco

syst

RZ

A

An

aEE

Nat

ura

BDD

RZA

BDD AnaEE

France

eLTER

2018

e-IR : « Pôle de données de Biodiversité »

An

aEE

e-IR : « Data Terra »

Interface « terre vivante » IR

Enjeux, Objectifs Stratégie GouvernanceCahier des

chargesWIP

Séminaire SIST 5-8 nov. 2019

Page 10: Infrastructure de recherche PNDB - Sciencesconf.org · 2019. 11. 25. · Yvan LE BRAS, Chef de projet (UMS PatriNat) Anne-Sophie ARCHAMBEAU, GBIF-France (UMS PatriNat) Cécile CALLOU,

An

aEE

Eco

tro

n

So

cio

-éco

syst

RZ

A

An

aEE

Nat

ura

BDD

RZA

BDD AnaEE

France

eLTER

2018

e-IR : « Pôle de données de Biodiversité »

An

aEE

Co

mm

un

au

tés d

e

la r

ech

erc

he

(et d

e l’e

xp

ert

ise

)

e-IR : « Data Terra »

Interface « terre vivante » IR + chercheurs surtout via organismes + SI fédérateurs AFB

Enjeux, Objectifs Stratégie GouvernanceCahier des

charges

SIMM

SIO

SIB

WIP

Séminaire SIST 5-8 nov. 2019

Page 11: Infrastructure de recherche PNDB - Sciencesconf.org · 2019. 11. 25. · Yvan LE BRAS, Chef de projet (UMS PatriNat) Anne-Sophie ARCHAMBEAU, GBIF-France (UMS PatriNat) Cécile CALLOU,

An

aEE

Eco

tro

n

So

cio

-éco

syst

RZ

A

An

aEE

Nat

ura

BDD

RZA

BDD AnaEE

France

eLTER

2018

e-IR : « Pôle de données de Biodiversité »

An

aEE

Co

mm

un

au

tés d

e

la r

ech

erc

he

(et d

e l’e

xp

ert

ise

)

e-IR : « Data Terra »

Interface « terre solide » IR

Enjeux, Objectifs Stratégie GouvernanceCahier des

chargesWIP

Séminaire SIST 5-8 nov. 2019

Page 12: Infrastructure de recherche PNDB - Sciencesconf.org · 2019. 11. 25. · Yvan LE BRAS, Chef de projet (UMS PatriNat) Anne-Sophie ARCHAMBEAU, GBIF-France (UMS PatriNat) Cécile CALLOU,

An

aEE

Eco

tro

n

So

cio

-éco

syst

RZ

A

An

aEE

Nat

ura

BDD

RZA

BDD AnaEE

France

eLTER

2018

e-IR : « Pôle de données de Biodiversité »

An

aEE

Co

mm

un

au

tés d

e

la r

ech

erc

he

(et d

e l’e

xp

ert

ise

)

e-IR : « Data Terra »

EBVs operationalization pilot

PNDB - French BON

FAIR WGs

Biodiversity & Ecosystem

EuroGEOSS Action Group

GO-FAIR IN BiodiFAIRse

RDA

GO FAIR

EuroGEOSS

GEO BON

GBIF France - PNDBGBIF

EOSC Pillar infraeosc

H2020 GAPARS SwafS

Monitoring ecosystems through research, innovation

and technology CSA SC5-33-2020 début échanges

BOLD France - PNDBiBOL2

VRE pilot en discussionNextGEOSS

Enjeux, Objectifs Stratégie GouvernanceCahier des

charges

Cohérence avec les dispositifs internationaux

WIP

Séminaire SIST 5-8 nov. 2019

Page 13: Infrastructure de recherche PNDB - Sciencesconf.org · 2019. 11. 25. · Yvan LE BRAS, Chef de projet (UMS PatriNat) Anne-Sophie ARCHAMBEAU, GBIF-France (UMS PatriNat) Cécile CALLOU,

lignes de force1. Orientation FAIR (aussi FAIR et Open que possible)

2. Relier/mutualiser avec les composantes existantes du Syst. Terre-Env.

3. Articuler/mutualiser avec le SIB-SIMM

4. Offrir des services à valeur ajoutée

5. Privilégier la qualité (quality data), au-delà de la quantité (big data),

6. Promouvoir la flexibilité des services (« à la carte »)

7. Développer, faciliter et favoriser la description fine des données

8. Viser une portée internationale (couverture & utilisation)

9. Articuler le PNDB avec les initiatives européennes et internationales

10. Pour commencer, s’appuyer sur un petit nombre de cas d’étude

(preuve de concept)

volets

1. Accès aux métadonnées et données

2. Accès aux outils de traitement, de couplage, d’analyse (calcul)

3. Animation et accompagnement

10

3

Enjeux, Objectifs Stratégie GouvernanceCahier des

charges

Séminaire SIST 5-8 nov. 2019

WIP

Page 14: Infrastructure de recherche PNDB - Sciencesconf.org · 2019. 11. 25. · Yvan LE BRAS, Chef de projet (UMS PatriNat) Anne-Sophie ARCHAMBEAU, GBIF-France (UMS PatriNat) Cécile CALLOU,

• Volet « Animation et accompagnement »

– Formations • Structuration des données via métadonnées et ontologies• Accès et traitement de données de biodiversité via services PNDB

– Workshops / ateliers • PNDB (produits et services / communautés utilisateurs PNDB / Partenaires PNDB)• EBVs• Collaboration IR PNDB/Data Terra• Collaboration PNDB/CESAB

– Hackathon• Métadonnées en écologie• Développement de matériel de formation (gestion des métadonnées et le traitement)• Développement d’outils de traitement de la donnée en écologie

– CESAB et positionnement lié au traitement de la donnée – Entrées CESAB/GBIF/PNDB & synergie à mettre en place avec instituts partenaires

Enjeux, Objectifs Stratégie GouvernanceCahier des

chargesWIP

Séminaire SIST 5-8 nov. 2019

Page 15: Infrastructure de recherche PNDB - Sciencesconf.org · 2019. 11. 25. · Yvan LE BRAS, Chef de projet (UMS PatriNat) Anne-Sophie ARCHAMBEAU, GBIF-France (UMS PatriNat) Cécile CALLOU,

Enjeux, Objectifs Stratégie Gouvernance WIPCahier des

charges

Séminaire SIST 5-8 nov. 2019

Chemin de la donnée

Communautés de la recherche (et de l’expertise)

SIMM

SIO

SIB

PNDB via pivot de métadonnées :

Ecological Metadata Language

Données « terre vivante »

Données « terre solide et fluide »

Autres données d’intérêt

Aut

res

SI «

biod

iv»

d’un

ité,

labo

(65

MO

, BB

EE

S,…

)

SI o

rgan

ism

es d

e re

cher

ches

part

enai

res

(dat

a.in

ra.fr

,

data

.ifre

mer

.fr,

…)

EM

L

(Meta)data

Replication

Data + Metadata

Replication

EM

L

Page 16: Infrastructure de recherche PNDB - Sciencesconf.org · 2019. 11. 25. · Yvan LE BRAS, Chef de projet (UMS PatriNat) Anne-Sophie ARCHAMBEAU, GBIF-France (UMS PatriNat) Cécile CALLOU,

• Volet « Données et métadonnées »

Enjeux, Objectifs Stratégie Gouvernance WIPCahier des

charges

Application R Shiny consultation et saisie EML en cours de réalisation par Elie Arnaud :

https://github.com/earnaud/MetaShARK-v2

Séminaire SIST 5-8 nov. 2019

Implémentation technique

Page 17: Infrastructure de recherche PNDB - Sciencesconf.org · 2019. 11. 25. · Yvan LE BRAS, Chef de projet (UMS PatriNat) Anne-Sophie ARCHAMBEAU, GBIF-France (UMS PatriNat) Cécile CALLOU,

•Volet « Outils de traitement / couplage / analyse (calcul)

Enjeux, Objectifs Stratégie Gouvernance WIPCahier des

charges

Outils Galaxy-E, datatypes, training-material, Interactivetools (Rstudio, Shiny apps, Jupyter Notebook,… ):Alan Amossé, Simon Bénateau, Benjamin Yguel, Valentin Chambon, Thimothée Virgoulay, Eloïse Trigodet, Elisa Michon

Codes sources :https://github.com/65MO/Galaxy-E

https://github.com/galaxyecology/tools-ecology

Training material: https://training.galaxyproject.org/

European Galaxy for Ecology instance:https://ecology.usegalaxy.eu/

Séminaire SIST 5-8 nov. 2019

Implémentation technique

Page 18: Infrastructure de recherche PNDB - Sciencesconf.org · 2019. 11. 25. · Yvan LE BRAS, Chef de projet (UMS PatriNat) Anne-Sophie ARCHAMBEAU, GBIF-France (UMS PatriNat) Cécile CALLOU,

Merci de votre attention