33
HAL Hyper Article en Ligne Initiation aux services et fonctionnalités de l’archive ouverte HAL-SHS… Odile Contat CNRS - Institut des Sciences Humaines et Sociales Octobre 2016 – Formation HAL - ANF de l’InSHS

HAL Hyper Article en LigneInitiation aux services et fonctionnalités de l’archive ouverte HAL-SHS…

Embed Size (px)

Citation preview

HAL Hyper Article en Ligne

Initiation aux services et fonctionnalités de l’archive ouverte HAL-SHS…

Odile Contat CNRS - Institut des Sciences Humaines et Sociales

Octobre 2016 – Formation HAL - ANF de l’InSHS

archive ouverte nationale…

Hyper Article en Ligne… archive ouverte internationale et multidisciplinaire, recueille et diffuse les documents scientifiques, donnant un accès libre et gratuit aux résultats

de la recherche, s’inscrit dans le mouvement du libre accès 1 I HAL est né en 2001 au CNRS, au sein du CCSD la convention de partenariat archives ouvertes autour de HAL signée le 02 avril 2013 par 25

partenaires dont l'AMUE, l’A.N.R., la B.N.F., la C.D.E.F.I., le C.E.A., le C.E.E., la C.G.E., le CIRAD, le C.N.R.S., la C.P.U., l’IFREMER, l’INRA, l’INRIA, l’INSERM, l’I.R.D., l’I.R.S.N., l’IRSTEA, l’Institut Pasteur…et aujourd’hui dans la feuille de route du Ministère sur les infrastructures de recherche

une plateforme commune de dépôt à vocation nationale et transdisciplinaire, une archive ouverte - un réservoir de données (repository) sous la forme d’un site web - pour l’ensemble des communautés scientifiques françaises

Le CCSD et une unité mixte CNRS INRIA et Université de Lyon : la feuille de route du CCSD

Aujourd’hui HAL c’est http://hal.archives-ouvertes.fr Plus de 405 000 documents dont 57 000 thèses

26 000 images sur MediHAL, 600 000 auteurs référencés

Les dépôts de documents dans HAL ont progressé d’environ 18 à 20% par an sur les dernières années

47 965 dépôts en texte intégral en 2014 (3997 par mois)

46 205 dépôts en texte intégral en 2015 (3850 par mois)

En 2015 46 205 dépôts en texte intégral • 14 338 articles publiés dans des revues • 9 738 communications dans des colloques • 7 831 thèses (dont 5752 déposées via STAR) • 284 HDR • 1 494 chapitres d’ouvrages et 132 ouvrages • 3 334 images • 478 posters • nombre de transferts vers ArXiv : 4392 • nombre de dépôt à disposition RePec : 5001 • Nombre total d’IdHAL créés : 7144 • Nombre total de CV configurés : 2901

HAL-SHS (Hyper Article en Ligne - Sciences de l'Homme et de la Société) un portail disciplinaire - https://halshs.archives-ouvertes.fr

une interface personnalisée, des métadonnées propres – plus de 100 000 documents en texte intégral - 24% de l’ensemble des dépôts de HAL - 1000 dépôts mensuels en moyenne

Des collections ou des portails personnalisés à la demande – des vues thématiques ou sur un programme ANR : Hal Sciences de l’environnement -

les études urbaines - un programme ANR - – des vues institutionnelles pour préserver l’identité d’un laboratoire ou d’une université :

le centre chine - l’Université Lille3 - MMSH - l’ENS de Lyon

un portail disciplinaire…

Géographie 11%

Économies et finances

11%

Archéologie et Préhistoire

10%

Sociologie 7%

Linguistique 7% Histoire

6% Éducation

6%

Gestion et management

5%

Anthropologie sociale et ethnologie

5%

Science politique 5%

Sciences de l'information 4%

Architecture, 3%

Littératures 3%

Histoire des sciences 2%

Philosophie 2%

Droit 2%

Musique arts 1%

muséologie 1%

Art et histoire de l'art 1%

Psychologie 1% Études de

l'environnement 1%

Religions 1%

Méthodes et statistiques

1% Démographie 1%

des documents validés…

Les documents déposés sur HAL ne sont pas soumis à évaluation scientifique par les pairs mais…Les textes doivent être d’une qualité comparable aux manuscrits que les chercheurs soumettent aux comités de lecture de revues scientifiques

Articles dans des revues 32,8%

Communications dans un congrès

22,7% Chapitres d'ouvrages

scientifiques 11,8%

Ouvrages scientifiques

1,0%

Directions d'ouvrages

0,2%

Autres publications 5,0%

Pré-publication, documents de

travail 11,5%

Rapports 2,3%

Thèses 11,7%

HDR 0,6% Poster

0,3% Cours 0,2%

aujourd’hui…accélération ! 1 I Recommandation de la Commission européenne juill 2012 et communiqué Horizon 2020 déc 2013 Objectif : 60% en 2016, 100% en 2020 - Recommandations aux Etats membres pour la mise en place de politiques d’open access 2 I Geneviève Fioraso janv 2013 : L'information scientifique est un bien commun qui doit être disponible pour tous - 7 recommandations dont soutien archives ouvertes et convention HAL 3 I G8 juin 2013 : Libre accès accélère le processus de recherche et l’innovation, et favorise l’économie 4 I Europe mai 2016 conseil de compétitivité « Tous les articles scientifiques européens en libre accès à partir de 2020 » et août 216 la Commission européenne étend le principe de libre accès, déjà appliqué aux publications, aux données de la recherche

En savoir plus :

Point sur les politiques publiques en faveur du Libre Accès -

http://openaccess.inist.fr/

Etudes et dossiers : Informations sur la loi et Etude d’impact de la loi par l’assemblée nationale

DIST-CNRS : dossier d'information sur cette loi - Livre blanc — Une Science ouverte dans une République numérique

aujourd’hui…en France ! Article 17 de la loi numérique adopté le 28 sept 2016 - Article 30 de la Loi du 7 octobre 2016 pour une République numérique : Légifrance Lorsqu'un écrit scientifique issu d'une activité de recherche financée au moins pour moitié par des dotations de l'État, des collectivités territoriales ou des établissements publics, par des subventions d'agences de financement nationales ou par des fonds de l'Union européenne est publié dans un périodique paraissant au moins une fois par an, son auteur dispose, même après avoir accordé des droits exclusifs à un éditeur, du droit de mettre à disposition gratuitement dans un format ouvert, par voie numérique, sous réserve de l'accord des éventuels coauteurs, la version finale de son manuscrit acceptée pour publication, dès lors que l'éditeur met lui-même celle-ci gratuitement à disposition par voie numérique ou, à défaut, à l'expiration d'un délai courant à compter de la date de la première publication. Ce délai est au maximum de six mois pour une publication dans le domaine des sciences, de la technique et de la médecine et de douze mois dans celui des sciences humaines et sociales

Pourquoi diffuser en libre accès?

1 I Pour garantir un accès libre et gratuit aux résultats de la recherche coût des abonnements (+302% de 1986 à 2005) = Elsevier, Wiley,

Springer des taux d’augmentation annuels entre 5 et 7% et des taux de rentabilité supérieurs à 30% (The Economist, 26/05/2011)

Les dépenses d'abonnements documentaires 2012 de niveau

recherche de l'Université de Rennes 1 sont de 1,4 million d'euros, soit environ 1000 euros par enseignant-chercheur et chercheur

Même l’Université d’Harvard a annoncé en 2012 qu’elle n’avait

plus les moyens de renouveler ses abonnements et qu'elle incite ses chercheurs à déposer leurs travaux dans l'archive ouverte institutionnelle (DASH)

2 I Pour élargir la visibilité nationale et internationale des travaux scientifiques

HAL présente de nombreux avantages par rapport à une archive locale ou à un site Web personnel… une meilleure diffusion : accès au texte intégral et à des

documents non publiés (communications, séminaires)

une visibilité élargie : indexés par les moteurs de recherche (Google, Google Scholar, BASE; Isidore...), répertoriés dans les bases de données

un lien avec les systèmes d’archivage de référence : Arxiv mathématiques, RePEC économie, PubMed Central pour les sciences du vivant…

Pourquoi diffuser en libre accès?

Téléchargements de documents fév 2014 Nov 2015 – HAL-SHS

0

550000

1100000

1650000

2200000

2750000

février mars avril mai juin juillet août septembre octobre novembre

La visibilité !

La visibilité !

Nombre de téléchargement Etudes de genre 15031 (48) Archéologie 170 383 (1590) Géographie 236 088 (3358) Sociologie 281 176 (2772) Economie 381 675 (6870)

Merci au CCSD pour les données chiffrées

HAL-SHS : Ranking web of world repositories (2016) 15ème dans classement institutionnels 8ème dans classement Europe 20ème dans classement mondial

Visibilité du Centre d’économie de la Sorbonne dans HAL 80 % des consultations d'articles des archives ouvertes sont faites à partir de Google et Google Scholar 5593 documents - 365 319 téléchargements en 1 an d’oct 2015 à oct 2016 :

27% France (98 000) 12% Etats-Unis (44 000) 8% Allemagne (29 000) 7% Europe (28 000) 7% Magreb (27 000) 5% Afrique (18 000) 5% Chine (17 000) 4% Asie (16 000)

3 I Pour augmenter l’impact des travaux scientifiques : Des études scientifiques établissent une corrélation entre taux de citations et diffusion en libre accès

une étude de Science-Metrix et 1science basée sur l’analyse des citations de 3,35 millions d’articles publiés entre 2007 et 2009 et indexés dans le Web of Science = les articles en libre accès reçoivent 52% plus de citations que les autres (le dépôt en archives ouvertes qui contribue le plus à cet avantage - http://openaccess.inist.fr/?Etude-sur-les-citations-l-avantage)

une étude comparative (Scientometrics 84 (2) - 2010) : 4839 articles publiés dans 5 revues de référence en physique 14 citations pour les articles déposés dans ArXiv contre moins de 4 pour les non déposés

une étude de l’Université de Liège : nombre de citations des articles référencés dans le Web of Science et Scopus, déposés ou non dans l'archive ouverte Orbi de l'institution : un article visible dans une archive ouverte est 2 fois plus cité qu'un article non déposé (diapositive 22)

Une étude de l’IPP publiée en juillet 2015 un article diffusé seulement à des abonnés subit un préjudice de visibilité impossible à rattraper à partir de 12 mois de barrière mobile

Une étude de l’école des ponts « Impact de l'Open Access sur les citations : une étude de cas » : https://hal-enpc.archives-ouvertes.fr/hal-01372684v1

4 I Pour gagner du temps : un dépôt unique et une saisie simplifié une alimentation des bases de données

institutionnelles = rapports d'activité (CRAC, RIBAC)…mais aussi page web, CV, etc.

une mise en ligne rapide et simple et des données disponibles, consultables et extractibles à partir d’un accès Internet

6 I Pour garantir la pérennité des fichiers et des accès liens et URL uniques et pérennes permettant des citations stables pérennité des fichiers et des formats : dupliqués sur les serveurs du CINES

(accès à long terme aux fichiers et pérennité des formats) → dépôt définitif : pérennité, citation…et versions successives

5 I Pour apporter une protection juridique aux travaux une conservation des droits d'auteur et une

datation certifiée : HAL permet d’établir l’antériorité scientifique (date du dépôt) et la paternité du document (identifiant unique) = moins de plagiat

→ dépôt définitif : responsabilité, qualité, moins de fraude

7 I Pour bénéficier de services à haute valeur ajoutée …pour le chercheur…et l’institution

gérer des listes de publications…pour un cv, un rapport, une page web, etc. = HAL-SHS -

SAMM - Paris1 - Triangle - CV1 – CV2 – CV3 recenser la totalité de la production scientifique, en améliorer la diffusion grâce à une

collection (interface personnalisée) et constituer des archives institutionnelles d’établissements pérennes Centre Koyré - Univ Grenoble Alpes - MSH de Dijon - ENS Lyon

valoriser les publications : exports pour le site, la lettre d’infos, les pages chercheurs avec des listes de publications et des pages Web où la mise à jour est automatique Ireman - Pacte - PSE – Modyco

générer des listes bibliographiques pour le rapport quadriennal : gain de temps, exportation automatique par type de document, par date et avec plusieurs formats…

Les questions de droit ??

Les lois du copyright des éditeurs doivent être respectées. Le droit d’archivage : quelle version du texte déposé et quand??

AVANT publication l’auteur reste détenteur des droits sur son texte

APRES publication SOUS contrat

1 I Si le contrat ne prévoit pas de cession à titre exclusif des droits, pour tout support ou pour le support électronique : l’auteur est libre de déposer 2 I Si le contrat prévoit une diffusion en libre accès après un délai : l’auteur est libre de déposer après ce délai (respect de l’embargo) 3 I Si le contrat prévoit la cession à titre exclusif des droits pour tout support ou pour le support électronique : l’auteur doit demander l’autorisation de dépôt à l’éditeur

APRES publication SANS contrat l’auteur peut diffuser son document, le copyright n’est pas un

frein – informer votre éditeur

La page de la DAJ du CNRS - Je publie, quels sont mes droits ?

Les éditeurs acceptent, sous certaines conditions, le dépôt d’une version auteur…

1 I Le pre-print : version envoyée à l’éditeur, avant le comité de lecture 2 I Le post-print : version après les corrections du comité de lecture révisions intégrées – version finale avant publication 3 I La version éditeur : la mise en page de l’éditeur est sa propriété, impossible de mettre en ligne cette version sans son autorisation…

http://www.sherpa.ac.uk/romeo.php - http://heloise.ccsd.cnrs.fr/

Le délai de diffusion : HAL autorise la diffusion en mode caché du document lorsque l’éditeur stipule un délai de diffusion (6 mois/2 ans après publication) – respect de la confidentialité…

Le dépôt doit être fait par l’auteur, par l'un des coauteurs ayant l'accord des autres, par une personne autorisée

La propriété intellectuelle reste celle du ou des auteurs. Les règles de bon usage : respect des travaux originaux, citation des travaux antérieurs, interdiction du pillage intellectuel, etc.

Pour les ouvrages et les chapitres d’ouvrages il est préférable de vérifier auprès de l’éditeur

http://www.ccsd.cnrs.fr/support.html#guide_bon_usage_hal

Les questions de droit ??

Les licences Creative Commons sont un complément au droit d’auteur

1 I partager et faciliter l’utilisation de leur création par d’autres 2 I autoriser gratuitement la reproduction et la diffusion (sous conditions) 1 I si vous déposez un document non publié (pas de soumission à un éditeur) 2 I si votre publication est déjà en libre accès : appliquer la même licence que l’éditeur

En savoir plus – un exemple

1 I ne constituent pas un renoncement au droit d’auteur 2 I sont valides juridiquement et opposables en justice 3 I ne constituent pas une incitation au plagiat 4 I sont compatibles avec une publication chez un éditeur commercial 5 I peuvent permettre de construire des modèles économiques Archives ouvertes et licences Creative Commons des synergies à conforter – Lionel Maurel (blog S.I.lex)

1 I Favoriser la republication des articles 2 I Favoriser les rematérialisations et les réimpressions 3 I Favoriser les traductions 4 I Développer le Text and Data Mining, sans attendre une exception législative 5 I Favoriser le travail collaboratif

Les licences Creative Commons Le libre accès et l’accès ouvert

Les réseaux sociaux recherche… Academia.edu : 42 millions de comptes 15 millions d’articles 36 millions de

visiteurs par mois Research Gate : 10 millions de membres

entre le printemps 2015 et le printemps 2016 + 150 % chacun A lire : #DeleteAcademicSocialNetworks ? Les réseaux sociaux

académiques en 2016

Les réseaux sociaux appellent à une science ouverte (open research) et au partage des connaissances par la mise en ligne du texte intégral des

articles

« Je n’ai pas besoin de déposer dans HAL j’ai tout mis sur Academia!! » - parole de chercheur…

Propriété et pérennité des données !!

Cela n’est pas du libre accès et cela pose des problèmes en termes de sécurité des données, d’accès et d’usage, de pérennité

pas d’archivage pérenne…une simple mise en ligne de documents où sont stocker les données et quelle est la pérennité des plateformes

(rachat, disparition) = pas de garanti d’accès

Attention : déposer vos fichiers sur ces réseaux cela signifie donner des droits à des entreprises privées sur vos données !!

Christophe Benech "Protection et propriété des données sur Academia.edu et ResearchGate"

Visibilité des réseaux sociaux recherche… A lire l'expérience de Frédéric Clavert qui a choisi de fermer son compte

Academia.edu : http://histnum.hypotheses.org/2589 Et celle relatée par Eric Verdeil en prenant comme exemple un de ces

collègues M. Denis Bocquet : http://rumor.hypotheses.org/3890#identifier_0_3890

Il faudrait bien sûr faire des études à plus grande échelle mais ces deux

exemples montrent bien que les consultations sur ces réseaux sont bien moindre que sur HAL, "la raison essentielle réside dans le mauvais

référencement de ces sites (via Google Scholar en particulier), fermés, pour lesquels il faut être inscrits."

Modèle économique et prédation !! Attention : Quel modèle économique pour ces réseaux sociaux : Quelle réutilisation? Revente des données

et des interactions ? tentation d'exploiter les contenus que les chercheurs y déposent...un véritable risque de prédation...voir le rachat de Mendeley et de SSRN par Elsevier

G. Geltner professeur d’histoire médiévale à l’université d’Amsterdam, a publié un billet “Upon leaving

Academia.edu” sur les raisons qui l’ont poussé à fermer son compte sur Academia.edu – système « pay to play » : stratégie de monétarisation (option de renvoyer un papier à ses « followers ») – s’orienter vers une introduction en bourse : suppose que les nouveaux services d’édition seront financés par l’introduction de frais de

publication (APC)

"Scott Johnson, professeur de lettres classiques à l’université d’Oklahoma, a publié sur Twitter une copie d’un mail envoyé par le chef de produit du réseau Academia.edu. Ce dernier demandait au chercheur s’il

accepterait de payer si ses papiers étaient recommandés sur AcademiaEdu. Un hashtag a été lancé sur Twitter, #DeleteAcademiaEdu

Archives ouvertes et réseaux sociaux…la confusion

Le dépôt dans HAL est sécurisé et contrôlé, il garantit de rester dans le cadre de la recherche publique, il permet une description plus complète et plus riche des travaux scientifiques (qualité des métadonnées) et surtout il assure réellement un accès libre, gratuit et pérenne à ses données (stabilité des url et des formats) Un conseil : utiliser les réseaux sociaux avec prudence et pour ce qu'ils sont, c'est-à-dire des outils de diffusion et de mise en relation. Utilisez les réseaux sociaux pour leurs fonctions sociales uniquement et HAL pour la pérennité des données et le libre accès ! Préférez le lien vers vos publications déposées sur Hal plutôt que le dépôt sur le site du réseau social !! http://www.cnrs.fr/inshs/recherche/ist/HAL-SHS/reseaux-sociaux.htm A lire Utiliser les réseaux avec modération : http://openarchiv.hypotheses.org/2582

Droits Référent structure Gestionnaire de collection Modifier un dépôt

Structure + structures filles

Partager la propriété d’un dépôt

Structure + structures filles

Tamponner un dépôt

Collection + sous-collections

Site web collection

Collection + sous-collections

Statistiques

Structure + structures filles

Collection + sous-collections

AureHAL : modifier structure

Structure + structures filles

Les rôles de référent structure et de gestionnaire de collection

Les rôles de responsable portail et de gestionnaire de collection

Fonctionnalité Portail Collection

Interface de dépôt X

Personnalisation graphique (logos, couleurs) X X

Choix des onglets du menu X X

Gestion des actualités X X

Création de collections X

Gestion des collections X

Gestion des utilisateurs, gestion des privilèges X

Gestion des référentiels dans AuréHAL : créer, modifier, fusionner X Statistiques X X Gestion de métadonnées X (LocHAL)

Quels document déposés : tous les écrits produits par les chercheurs ou sur lesquels ils disposent du copyright

– Un document en texte intégral dont le (les) fichier(s) seront téléchargés sur HAL

– Une simple référence bibliographique, avec les références de publication

– les travaux et publications les plus récents, Hal est avant tout une vision de la recherche en train de se faire

– des documents plus anciens. Le laboratoire de rattachement doit être celui auquel vous apparteniez au moment de la production du document

− Déposer le texte intégral chaque fois que c'est possible…et les références bibliographiques lorsque vous n’avez pas le texte intégral

− Faites d’abord le point sur vos publications, sélectionnez ce que vous voulez déposer dans HAL et…trouvez la bonne version !!!

− Un conseil : préparez à l’avance un document avec toutes les caractéristiques de votre dépôt (titre, auteur, laboratoire, résumé, mots clés, références de publications) et travaillez en copier coller

− Vérifiez que la référence ne soit pas déjà dans HAL…un co-auteur a pu déposer sans vous avertir… − Un document peut appartenir à plusieurs disciplines en Sciences Humaines ou en dehors (Droit et

Science politique par exemple) − Un truc : une fois le premier dépôt effectué penser à vous servir de la fonction « utiliser comme modèle »,

onglet Mon espace, Mes dépôts

Attention à la qualité des données et de la saisie Le chercheur est l’acteur principal du système : responsable et acteur du devenir de sa production

scientifique

– L’idHAL est un identifiant unique géré dans HAL. Il permet à un utilisateur authentifié, connu comme auteur dans HAL, de regrouper les différentes formes sous lesquelles son nom a pu être saisi (ex : Marie Dupont, M. Dupont, Marie Dupont-Martin, etc) et d’en choisir une par défaut

– L’idHAL regroupe les différentes formes auteur mais ne les fusionne pas. Par défaut, les

prénom et nom du compte sont proposés sous la forme prénom-nom

– L’idHAL est associé au profil : la forme auteur par défaut choisie pour l’idHAL sera proposée lors du dépôt si dans le profil la case « auteur par défaut » est renseignée par « oui »

– L’idHAL est utilisé pour créer son CV : Le choix de l’identifiant pour l’IdHAL est important et irréversible puisqu’il composera l’url de votre page chercheur (https://cv.archives-ouvertes.fr/prenom-nom)

Le CV chercheur avec 3 parties - un titre et du texte - la liste des publications déposées dans HAL - des métadonnées extraites des publications

déposés dans HAL (disciplines, mots-clés, co-auteurs, revues), extraite du compte (photo), des widgets extérieurs (twitter, facebook,…)

- Le choix de l’affichage du contenu de ces parties se fait lors de la création du CV et peut être modifié

- Le CV est doté d’une url de format http://cv.archives-ouvertes.fr/idHAL et est consultable par tous