32
theses.fr Tutoriel Isabelle Mauger Perez et Aurélien Charot, ABES Tutoriel - Journées ABES 20 juin 2012

Tutoriel theses.fr : support pour diffusion sur le webQue trouve-t-on aujourd’hui dans theses.fr ? •Toutes les données validées dans STAR –Description de 11 397 thèses soutenues

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Tutoriel theses.fr : support pour diffusion sur le webQue trouve-t-on aujourd’hui dans theses.fr ? •Toutes les données validées dans STAR –Description de 11 397 thèses soutenues

thesesfr

Tutoriel

Isabelle Mauger Perez et Aureacutelien Charot ABES

Tutoriel - Journeacutees ABES ndash 20 juin 2012

UNE APPLICATION EN PRODUCTION DEPUIS LE 11 JUILLET 2011

thesesfr des donneacutees une interface des services

Que trouve-t-on aujourdrsquohuidans thesesfr

bull Toutes les donneacutees valideacutees dans STARndash Description de 11 397 thegraveses soutenues agrave partir de 2006

ndash Indexation du texte inteacutegral

ndash Accegraves au texte inteacutegral dans 70 des cas (8 019 thegraveses)

bull Toutes les donneacutees de STEP lorsqursquoune certaine finesse de description est atteintendash Description de 64 812 thegraveses en preacuteparation depuis 2002

bull 131 335 personnesndash Une base de donneacutees de personnes qualifieacutees par les thegraveses qui

leur sont lieacutees

ndash Exemple jazz Breacutesil

bull Les pages de thegraveses soutenues

bull Les pages de thegraveses en preacuteparation

bull sous reacuteserve drsquoun lien IdRef-autoriteacutes Sudoc ndash Les pages de personnes

ndash Les pages drsquoorganismes

Les pages laquo finales raquo

bull Les pages de thegraveses soutenues

bull Les pages de thegraveses en preacuteparation

bull sous reacuteserve drsquoun lien IdRef-autoriteacutes Sudoc ndash Les pages de personnes

ndash Les pages drsquoorganismes

Les pages laquo finales raquo

httpwwwthesesfr2011REN20056

bull Les pages de thegraveses soutenues

bull Les pages de thegraveses en preacuteparation

bull sous reacuteserve drsquoun lien IdRef-autoriteacutes Sudoc ndash Les pages de personnes

ndash Les pages drsquoorganismes

Les pages laquo finales raquo

httpwwwthesesfr2011REN20056

httpwwwthesesfrs57810

bull Les pages de thegraveses soutenues

bull Les pages de thegraveses en preacuteparation

bull sous reacuteserve drsquoun lien IdRef-autoriteacutes Sudoc ndash Les pages de personnes

ndash Les pages drsquoorganismes

Les pages laquo finales raquo

httpwwwthesesfr2011REN20056

httpwwwthesesfrs57810

httpwwwthesesfr154887528

httpwwwthesesfr 079486304

Les trois onglets de recherche

bull Toutes les thegraveses

ndash Deux restrictions possibles bull uniquement les thegraveses soutenues

bull uniquement les thegraveses soutenues accessibles en ligne

bull Thegraveses en preacuteparation

ndash Restriction possible uniquement les thegraveses en preacuteparation dont

la soutenance est preacutevue dans les 6 prochains mois

bull Personnes docteurs directeurs de thegravese membres du jury

ndash Restriction possible uniquement les personnes en lien avec une thegravese soutenue ou en preacuteparation depuis moins de 5 ans

Au choix de lrsquoutilisateur

bull Consultation par lrsquoencart de recherche

ndash Requecircte sur les meacutetadonneacutees et le texte inteacutegral

bull Consultation par lrsquoencart de recherche puis raffinement par utilisation des facettes

date de soutenance eacutetablissement

discipline eacutecole doctorale

langue de la thegravese directeur de thegravese

domaine

bull Consultation par navigation pure via les facettes

Page drsquoaccueil wwwthesesfr

Page de reacutesultats obtenue apregraves utilisation de lrsquoencart de recherche

Page de reacutesultats obtenue apregraves raffinement par la facette Etablissement

Page de la thegravese soutenue obtenue en cliquant sur le titre

Page drsquoun organisme obtenue en cliquant sur le nom de lrsquoorganisme

Page de la thegravese en preacuteparation obtenue en cliquant sur le titre

Page drsquoune personne obtenue en cliquant sur le nom de la personne

Les servicesbull Rebonds vers des applications du web 20 via AddThis

bull Recommandations

bull

ndash des flux ATOM par deacutefautbull thegraveses soutenues reacutecemment

bull soutenues reacutecemment accessibles en ligne

bull nouvelles thegraveses en preacuteparation

bull annonces de soutenance

ndash et des flux personnalisables flux de recherche

bullndash Zotero

ndash format txt

ndash format csv

ndash formats laquo machines raquo

Un service particulier

bull Rendre possible un cercle vertueux lrsquoutilisateur entre en contact avec le producteur pour signaler une erreur

16 7 10

9576

4558

6848

37 28

147154

0

20

40

60

80

100

120

140

160

180

200

juil-11 aoucirct-11 sept-11 oct-11 nov-11 deacutec-11 janv-12 feacutevr-12 mars-12 avr-12 mai-12

Assistance de thesesfr

signaler une erreur

ABESstp

bull Depuis avril 2012

bull Mail aucorrespondant STEP ou au correspondant STAR

Les donneacutees brutes

bull Ouvertes reacuteutilisables via une APIndash pour une liste de reacutesultats ajouter ampformat=xml ou

ampformat=json ou ampformat=atom ou ampformat=csv ou ampformat=txt en paramegravetre de lrsquourl de recherche

ndash pour une page finale ajouter xml (ou rdf ) agrave lrsquourl de la page

bull Ce principe permet drsquoajouter autant de formats que neacutecessaire

bull Exemple reacutecupeacuterer la description de la thegravese 2010MON30067

ndash dans lrsquointerfacendash en rdfxml

bull Exemple reacutecupeacuterer la liste de toutes les thegraveses soutenues agrave Toulouse 2 et accessibles en ligne dans lrsquoED Science du langage

ndash dans lrsquointerfacendash en xml (solr)ndash en json

thesesfr et Google

bull Description de toutes les pages de thesesfr dans un fichier sitemap pour faciliter lrsquoindexation des robots

bull 77 du trafic provient des moteurs de recherche

99 674

13 218

10 6710

20 000

40 000

60 000

80 000

100 000

120 000

Source de trafic (nb de visites)

trafic de recherche

sites reacutefeacuterents

acceacutes directs

77

14

9

Source de trafic ( du nb de visites)

juillet 2011-mai 2012

trafic de recherche

sites reacutefeacuterents

acceacutes directs

12 711

11 86815 961

61 815

73 306

66 891

91 055

95 25999 652

93 250

97 161

0

20 000

40 000

60 000

80 000

100 000

120 000

Visiteurs uniques

Quelques chiffres

86 810 75 383116 255

402 331399 129

349 976

427 499440 975

467 914

426 059

427 365

0

50 000

100 000

150 000

200 000

250 000

300 000

350 000

400 000

450 000

500 000

Pages vues

Plus de deacutetails

bull Le cercle vertueux de thesesfr mise en relation de lrsquoutilisateur et du producteur de donneacutees Punktokomo 10 avril 2012

bull thesesfr comment fonctionne lrsquoonglet laquo personnes raquo Punktokomo 19 janvier 2012

bull thesesfr lrsquoAPI XML de recherche Punktokomo 22 juillet 2011

bull thesesfr lrsquoAPI XML des personnes Punktokomo 12 juillet 2011

bull thesesfr lrsquoAPI XML des thegraveses Punktokomo 12 juillet 2011

bull thesesfr les technologies utiliseacutees Punktokomo 12 juillet 2011

UN PROJET DOTEacute DE MOYENS SPEacuteCIFIQUES JUSQUrsquoA FIN 2012

thesesfr les prochains deacuteveloppements

Quelles fonctionnaliteacutes demain dans thesesfr (1)

bull Une interface en trois langues

ndash Franccedilais anglais italien

bull Un module de recherche avanceacutee

ndash exclure la recherche dans le texte inteacutegral

ndash ne pas tenir compte de la pertinence deacutefinie par deacutefaut (pondeacuteration des index)

ndash faciliter la recherche exacte

bull Calendrier fin septembre 2012

Quelles fonctionnaliteacutes demain dans thesesfr (2)

bull Des services accessibles sur authentificationndash paniersndash alerte mailndash hellip

bull Des services speacutecifiques pour les personnes reconnues comme eacutetant lrsquoauteur drsquoune thegravesendash mise en relation ecirctre contacteacute via thesesfrndash accegraves aux statistiques de sa page de thegravesendash hellip

bull Impossibiliteacute drsquooffrir de tels services pourles directeurs de thegravese

bull Calendrier fin 2012

Que trouvera-t-on demaindans thesesfr (1)

bull Toutes les donneacutees du Sudoc relatives aux thegraveses de doctorat franccedilaises soutenues depuis 1985

bull Toutes Non Celles qui passent avec succegraves lrsquoalgorithme de chargement qui a pour but de les laquo FRBriser raquo

bull Regroupement des notices Sudoc en familles composeacutees de ndash la notice megravere (la notice de la thegravese originelle telle que valideacutee par le

jury zone 105$m)

ndash Eacuteventuellement les notices enfants (les notices de reproduction zone 105$bv)

bull Chaque famille aura une page propre wwwthesesfrNNT

bull Conseacutequence pour thesesfr recherche de lrsquoexhaustiviteacute depuis 1985

bull Calendrier fin septembre 2012

Que trouvera-t-on demaindans thesesfr (2)

bull Toutes les donneacutees de TEL et lrsquoindexation du texte inteacutegral sous reacuteserve que le lien agrave la thegravese originelle ait eacuteteacute trouveacute

bull Principe chargement de toutes les donneacutees de TEL dans le Sudoc par moissonnage oai-pmh de TELndash Creacuteation de notices probablement assez pauvres (pas de liens

IdRef) mais avec lrsquoaccegraves au texte inteacutegral

bull Algorithme laquo FRBrisateur raquo de chargement dans thesesfrndash Si la notice megravere est trouveacutee ajout dans thesesfr de lrsquoaccegraves au

texte inteacutegral

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral sur le web

bull Calendrier fin 2012

Que trouvera-t-on demaindans thesesfr (3)

bull Des liens vers le catalogue des laquo thegraveses agrave la carte raquo de lrsquoANRT de Lille

bull Principe envoi reacutegulier (mensuel ) de la liste de NNTdisponibles dans laquo thegraveses agrave la carte raquo

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral avec la possibiliteacute de commander un fac-simileacute de la thegravese

bull Calendrier soumis aux contraintes de lrsquoANRT sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (4)

bull Les donneacutees de Theacutesa pour les thegraveses en preacuteparation au sein drsquoeacutetablissements relevant de la CGE et non utilisateurs de STEP

bull Principe envoi reacutegulier (mensuel ) des donneacutees par lrsquoINIST

bull Conseacutequence pour thesesfr recenser toutes les thegraveses en preacuteparation

bull Calendrier soumis aux contraintes de lrsquoINIST sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (5)

bull Des liens vers les donneacutees non-documentaires issus des partenaires associatifs du projet IntellirsquoAgence-ABG par exemplendash Cvthegraveque

ndash Offres drsquoemploi

ndash hellip

bull Conseacutequence pour thesesfr servir les docteurs et les doctorants au-delagrave de leur travail acadeacutemique

bull Calendrier soumis aux contraintes de lrsquo IntellirsquoAgence-ABG sans doute fin 2012

Journeacutees ABES ndash 20 juin 2012

Page 2: Tutoriel theses.fr : support pour diffusion sur le webQue trouve-t-on aujourd’hui dans theses.fr ? •Toutes les données validées dans STAR –Description de 11 397 thèses soutenues

UNE APPLICATION EN PRODUCTION DEPUIS LE 11 JUILLET 2011

thesesfr des donneacutees une interface des services

Que trouve-t-on aujourdrsquohuidans thesesfr

bull Toutes les donneacutees valideacutees dans STARndash Description de 11 397 thegraveses soutenues agrave partir de 2006

ndash Indexation du texte inteacutegral

ndash Accegraves au texte inteacutegral dans 70 des cas (8 019 thegraveses)

bull Toutes les donneacutees de STEP lorsqursquoune certaine finesse de description est atteintendash Description de 64 812 thegraveses en preacuteparation depuis 2002

bull 131 335 personnesndash Une base de donneacutees de personnes qualifieacutees par les thegraveses qui

leur sont lieacutees

ndash Exemple jazz Breacutesil

bull Les pages de thegraveses soutenues

bull Les pages de thegraveses en preacuteparation

bull sous reacuteserve drsquoun lien IdRef-autoriteacutes Sudoc ndash Les pages de personnes

ndash Les pages drsquoorganismes

Les pages laquo finales raquo

bull Les pages de thegraveses soutenues

bull Les pages de thegraveses en preacuteparation

bull sous reacuteserve drsquoun lien IdRef-autoriteacutes Sudoc ndash Les pages de personnes

ndash Les pages drsquoorganismes

Les pages laquo finales raquo

httpwwwthesesfr2011REN20056

bull Les pages de thegraveses soutenues

bull Les pages de thegraveses en preacuteparation

bull sous reacuteserve drsquoun lien IdRef-autoriteacutes Sudoc ndash Les pages de personnes

ndash Les pages drsquoorganismes

Les pages laquo finales raquo

httpwwwthesesfr2011REN20056

httpwwwthesesfrs57810

bull Les pages de thegraveses soutenues

bull Les pages de thegraveses en preacuteparation

bull sous reacuteserve drsquoun lien IdRef-autoriteacutes Sudoc ndash Les pages de personnes

ndash Les pages drsquoorganismes

Les pages laquo finales raquo

httpwwwthesesfr2011REN20056

httpwwwthesesfrs57810

httpwwwthesesfr154887528

httpwwwthesesfr 079486304

Les trois onglets de recherche

bull Toutes les thegraveses

ndash Deux restrictions possibles bull uniquement les thegraveses soutenues

bull uniquement les thegraveses soutenues accessibles en ligne

bull Thegraveses en preacuteparation

ndash Restriction possible uniquement les thegraveses en preacuteparation dont

la soutenance est preacutevue dans les 6 prochains mois

bull Personnes docteurs directeurs de thegravese membres du jury

ndash Restriction possible uniquement les personnes en lien avec une thegravese soutenue ou en preacuteparation depuis moins de 5 ans

Au choix de lrsquoutilisateur

bull Consultation par lrsquoencart de recherche

ndash Requecircte sur les meacutetadonneacutees et le texte inteacutegral

bull Consultation par lrsquoencart de recherche puis raffinement par utilisation des facettes

date de soutenance eacutetablissement

discipline eacutecole doctorale

langue de la thegravese directeur de thegravese

domaine

bull Consultation par navigation pure via les facettes

Page drsquoaccueil wwwthesesfr

Page de reacutesultats obtenue apregraves utilisation de lrsquoencart de recherche

Page de reacutesultats obtenue apregraves raffinement par la facette Etablissement

Page de la thegravese soutenue obtenue en cliquant sur le titre

Page drsquoun organisme obtenue en cliquant sur le nom de lrsquoorganisme

Page de la thegravese en preacuteparation obtenue en cliquant sur le titre

Page drsquoune personne obtenue en cliquant sur le nom de la personne

Les servicesbull Rebonds vers des applications du web 20 via AddThis

bull Recommandations

bull

ndash des flux ATOM par deacutefautbull thegraveses soutenues reacutecemment

bull soutenues reacutecemment accessibles en ligne

bull nouvelles thegraveses en preacuteparation

bull annonces de soutenance

ndash et des flux personnalisables flux de recherche

bullndash Zotero

ndash format txt

ndash format csv

ndash formats laquo machines raquo

Un service particulier

bull Rendre possible un cercle vertueux lrsquoutilisateur entre en contact avec le producteur pour signaler une erreur

16 7 10

9576

4558

6848

37 28

147154

0

20

40

60

80

100

120

140

160

180

200

juil-11 aoucirct-11 sept-11 oct-11 nov-11 deacutec-11 janv-12 feacutevr-12 mars-12 avr-12 mai-12

Assistance de thesesfr

signaler une erreur

ABESstp

bull Depuis avril 2012

bull Mail aucorrespondant STEP ou au correspondant STAR

Les donneacutees brutes

bull Ouvertes reacuteutilisables via une APIndash pour une liste de reacutesultats ajouter ampformat=xml ou

ampformat=json ou ampformat=atom ou ampformat=csv ou ampformat=txt en paramegravetre de lrsquourl de recherche

ndash pour une page finale ajouter xml (ou rdf ) agrave lrsquourl de la page

bull Ce principe permet drsquoajouter autant de formats que neacutecessaire

bull Exemple reacutecupeacuterer la description de la thegravese 2010MON30067

ndash dans lrsquointerfacendash en rdfxml

bull Exemple reacutecupeacuterer la liste de toutes les thegraveses soutenues agrave Toulouse 2 et accessibles en ligne dans lrsquoED Science du langage

ndash dans lrsquointerfacendash en xml (solr)ndash en json

thesesfr et Google

bull Description de toutes les pages de thesesfr dans un fichier sitemap pour faciliter lrsquoindexation des robots

bull 77 du trafic provient des moteurs de recherche

99 674

13 218

10 6710

20 000

40 000

60 000

80 000

100 000

120 000

Source de trafic (nb de visites)

trafic de recherche

sites reacutefeacuterents

acceacutes directs

77

14

9

Source de trafic ( du nb de visites)

juillet 2011-mai 2012

trafic de recherche

sites reacutefeacuterents

acceacutes directs

12 711

11 86815 961

61 815

73 306

66 891

91 055

95 25999 652

93 250

97 161

0

20 000

40 000

60 000

80 000

100 000

120 000

Visiteurs uniques

Quelques chiffres

86 810 75 383116 255

402 331399 129

349 976

427 499440 975

467 914

426 059

427 365

0

50 000

100 000

150 000

200 000

250 000

300 000

350 000

400 000

450 000

500 000

Pages vues

Plus de deacutetails

bull Le cercle vertueux de thesesfr mise en relation de lrsquoutilisateur et du producteur de donneacutees Punktokomo 10 avril 2012

bull thesesfr comment fonctionne lrsquoonglet laquo personnes raquo Punktokomo 19 janvier 2012

bull thesesfr lrsquoAPI XML de recherche Punktokomo 22 juillet 2011

bull thesesfr lrsquoAPI XML des personnes Punktokomo 12 juillet 2011

bull thesesfr lrsquoAPI XML des thegraveses Punktokomo 12 juillet 2011

bull thesesfr les technologies utiliseacutees Punktokomo 12 juillet 2011

UN PROJET DOTEacute DE MOYENS SPEacuteCIFIQUES JUSQUrsquoA FIN 2012

thesesfr les prochains deacuteveloppements

Quelles fonctionnaliteacutes demain dans thesesfr (1)

bull Une interface en trois langues

ndash Franccedilais anglais italien

bull Un module de recherche avanceacutee

ndash exclure la recherche dans le texte inteacutegral

ndash ne pas tenir compte de la pertinence deacutefinie par deacutefaut (pondeacuteration des index)

ndash faciliter la recherche exacte

bull Calendrier fin septembre 2012

Quelles fonctionnaliteacutes demain dans thesesfr (2)

bull Des services accessibles sur authentificationndash paniersndash alerte mailndash hellip

bull Des services speacutecifiques pour les personnes reconnues comme eacutetant lrsquoauteur drsquoune thegravesendash mise en relation ecirctre contacteacute via thesesfrndash accegraves aux statistiques de sa page de thegravesendash hellip

bull Impossibiliteacute drsquooffrir de tels services pourles directeurs de thegravese

bull Calendrier fin 2012

Que trouvera-t-on demaindans thesesfr (1)

bull Toutes les donneacutees du Sudoc relatives aux thegraveses de doctorat franccedilaises soutenues depuis 1985

bull Toutes Non Celles qui passent avec succegraves lrsquoalgorithme de chargement qui a pour but de les laquo FRBriser raquo

bull Regroupement des notices Sudoc en familles composeacutees de ndash la notice megravere (la notice de la thegravese originelle telle que valideacutee par le

jury zone 105$m)

ndash Eacuteventuellement les notices enfants (les notices de reproduction zone 105$bv)

bull Chaque famille aura une page propre wwwthesesfrNNT

bull Conseacutequence pour thesesfr recherche de lrsquoexhaustiviteacute depuis 1985

bull Calendrier fin septembre 2012

Que trouvera-t-on demaindans thesesfr (2)

bull Toutes les donneacutees de TEL et lrsquoindexation du texte inteacutegral sous reacuteserve que le lien agrave la thegravese originelle ait eacuteteacute trouveacute

bull Principe chargement de toutes les donneacutees de TEL dans le Sudoc par moissonnage oai-pmh de TELndash Creacuteation de notices probablement assez pauvres (pas de liens

IdRef) mais avec lrsquoaccegraves au texte inteacutegral

bull Algorithme laquo FRBrisateur raquo de chargement dans thesesfrndash Si la notice megravere est trouveacutee ajout dans thesesfr de lrsquoaccegraves au

texte inteacutegral

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral sur le web

bull Calendrier fin 2012

Que trouvera-t-on demaindans thesesfr (3)

bull Des liens vers le catalogue des laquo thegraveses agrave la carte raquo de lrsquoANRT de Lille

bull Principe envoi reacutegulier (mensuel ) de la liste de NNTdisponibles dans laquo thegraveses agrave la carte raquo

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral avec la possibiliteacute de commander un fac-simileacute de la thegravese

bull Calendrier soumis aux contraintes de lrsquoANRT sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (4)

bull Les donneacutees de Theacutesa pour les thegraveses en preacuteparation au sein drsquoeacutetablissements relevant de la CGE et non utilisateurs de STEP

bull Principe envoi reacutegulier (mensuel ) des donneacutees par lrsquoINIST

bull Conseacutequence pour thesesfr recenser toutes les thegraveses en preacuteparation

bull Calendrier soumis aux contraintes de lrsquoINIST sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (5)

bull Des liens vers les donneacutees non-documentaires issus des partenaires associatifs du projet IntellirsquoAgence-ABG par exemplendash Cvthegraveque

ndash Offres drsquoemploi

ndash hellip

bull Conseacutequence pour thesesfr servir les docteurs et les doctorants au-delagrave de leur travail acadeacutemique

bull Calendrier soumis aux contraintes de lrsquo IntellirsquoAgence-ABG sans doute fin 2012

Journeacutees ABES ndash 20 juin 2012

Page 3: Tutoriel theses.fr : support pour diffusion sur le webQue trouve-t-on aujourd’hui dans theses.fr ? •Toutes les données validées dans STAR –Description de 11 397 thèses soutenues

Que trouve-t-on aujourdrsquohuidans thesesfr

bull Toutes les donneacutees valideacutees dans STARndash Description de 11 397 thegraveses soutenues agrave partir de 2006

ndash Indexation du texte inteacutegral

ndash Accegraves au texte inteacutegral dans 70 des cas (8 019 thegraveses)

bull Toutes les donneacutees de STEP lorsqursquoune certaine finesse de description est atteintendash Description de 64 812 thegraveses en preacuteparation depuis 2002

bull 131 335 personnesndash Une base de donneacutees de personnes qualifieacutees par les thegraveses qui

leur sont lieacutees

ndash Exemple jazz Breacutesil

bull Les pages de thegraveses soutenues

bull Les pages de thegraveses en preacuteparation

bull sous reacuteserve drsquoun lien IdRef-autoriteacutes Sudoc ndash Les pages de personnes

ndash Les pages drsquoorganismes

Les pages laquo finales raquo

bull Les pages de thegraveses soutenues

bull Les pages de thegraveses en preacuteparation

bull sous reacuteserve drsquoun lien IdRef-autoriteacutes Sudoc ndash Les pages de personnes

ndash Les pages drsquoorganismes

Les pages laquo finales raquo

httpwwwthesesfr2011REN20056

bull Les pages de thegraveses soutenues

bull Les pages de thegraveses en preacuteparation

bull sous reacuteserve drsquoun lien IdRef-autoriteacutes Sudoc ndash Les pages de personnes

ndash Les pages drsquoorganismes

Les pages laquo finales raquo

httpwwwthesesfr2011REN20056

httpwwwthesesfrs57810

bull Les pages de thegraveses soutenues

bull Les pages de thegraveses en preacuteparation

bull sous reacuteserve drsquoun lien IdRef-autoriteacutes Sudoc ndash Les pages de personnes

ndash Les pages drsquoorganismes

Les pages laquo finales raquo

httpwwwthesesfr2011REN20056

httpwwwthesesfrs57810

httpwwwthesesfr154887528

httpwwwthesesfr 079486304

Les trois onglets de recherche

bull Toutes les thegraveses

ndash Deux restrictions possibles bull uniquement les thegraveses soutenues

bull uniquement les thegraveses soutenues accessibles en ligne

bull Thegraveses en preacuteparation

ndash Restriction possible uniquement les thegraveses en preacuteparation dont

la soutenance est preacutevue dans les 6 prochains mois

bull Personnes docteurs directeurs de thegravese membres du jury

ndash Restriction possible uniquement les personnes en lien avec une thegravese soutenue ou en preacuteparation depuis moins de 5 ans

Au choix de lrsquoutilisateur

bull Consultation par lrsquoencart de recherche

ndash Requecircte sur les meacutetadonneacutees et le texte inteacutegral

bull Consultation par lrsquoencart de recherche puis raffinement par utilisation des facettes

date de soutenance eacutetablissement

discipline eacutecole doctorale

langue de la thegravese directeur de thegravese

domaine

bull Consultation par navigation pure via les facettes

Page drsquoaccueil wwwthesesfr

Page de reacutesultats obtenue apregraves utilisation de lrsquoencart de recherche

Page de reacutesultats obtenue apregraves raffinement par la facette Etablissement

Page de la thegravese soutenue obtenue en cliquant sur le titre

Page drsquoun organisme obtenue en cliquant sur le nom de lrsquoorganisme

Page de la thegravese en preacuteparation obtenue en cliquant sur le titre

Page drsquoune personne obtenue en cliquant sur le nom de la personne

Les servicesbull Rebonds vers des applications du web 20 via AddThis

bull Recommandations

bull

ndash des flux ATOM par deacutefautbull thegraveses soutenues reacutecemment

bull soutenues reacutecemment accessibles en ligne

bull nouvelles thegraveses en preacuteparation

bull annonces de soutenance

ndash et des flux personnalisables flux de recherche

bullndash Zotero

ndash format txt

ndash format csv

ndash formats laquo machines raquo

Un service particulier

bull Rendre possible un cercle vertueux lrsquoutilisateur entre en contact avec le producteur pour signaler une erreur

16 7 10

9576

4558

6848

37 28

147154

0

20

40

60

80

100

120

140

160

180

200

juil-11 aoucirct-11 sept-11 oct-11 nov-11 deacutec-11 janv-12 feacutevr-12 mars-12 avr-12 mai-12

Assistance de thesesfr

signaler une erreur

ABESstp

bull Depuis avril 2012

bull Mail aucorrespondant STEP ou au correspondant STAR

Les donneacutees brutes

bull Ouvertes reacuteutilisables via une APIndash pour une liste de reacutesultats ajouter ampformat=xml ou

ampformat=json ou ampformat=atom ou ampformat=csv ou ampformat=txt en paramegravetre de lrsquourl de recherche

ndash pour une page finale ajouter xml (ou rdf ) agrave lrsquourl de la page

bull Ce principe permet drsquoajouter autant de formats que neacutecessaire

bull Exemple reacutecupeacuterer la description de la thegravese 2010MON30067

ndash dans lrsquointerfacendash en rdfxml

bull Exemple reacutecupeacuterer la liste de toutes les thegraveses soutenues agrave Toulouse 2 et accessibles en ligne dans lrsquoED Science du langage

ndash dans lrsquointerfacendash en xml (solr)ndash en json

thesesfr et Google

bull Description de toutes les pages de thesesfr dans un fichier sitemap pour faciliter lrsquoindexation des robots

bull 77 du trafic provient des moteurs de recherche

99 674

13 218

10 6710

20 000

40 000

60 000

80 000

100 000

120 000

Source de trafic (nb de visites)

trafic de recherche

sites reacutefeacuterents

acceacutes directs

77

14

9

Source de trafic ( du nb de visites)

juillet 2011-mai 2012

trafic de recherche

sites reacutefeacuterents

acceacutes directs

12 711

11 86815 961

61 815

73 306

66 891

91 055

95 25999 652

93 250

97 161

0

20 000

40 000

60 000

80 000

100 000

120 000

Visiteurs uniques

Quelques chiffres

86 810 75 383116 255

402 331399 129

349 976

427 499440 975

467 914

426 059

427 365

0

50 000

100 000

150 000

200 000

250 000

300 000

350 000

400 000

450 000

500 000

Pages vues

Plus de deacutetails

bull Le cercle vertueux de thesesfr mise en relation de lrsquoutilisateur et du producteur de donneacutees Punktokomo 10 avril 2012

bull thesesfr comment fonctionne lrsquoonglet laquo personnes raquo Punktokomo 19 janvier 2012

bull thesesfr lrsquoAPI XML de recherche Punktokomo 22 juillet 2011

bull thesesfr lrsquoAPI XML des personnes Punktokomo 12 juillet 2011

bull thesesfr lrsquoAPI XML des thegraveses Punktokomo 12 juillet 2011

bull thesesfr les technologies utiliseacutees Punktokomo 12 juillet 2011

UN PROJET DOTEacute DE MOYENS SPEacuteCIFIQUES JUSQUrsquoA FIN 2012

thesesfr les prochains deacuteveloppements

Quelles fonctionnaliteacutes demain dans thesesfr (1)

bull Une interface en trois langues

ndash Franccedilais anglais italien

bull Un module de recherche avanceacutee

ndash exclure la recherche dans le texte inteacutegral

ndash ne pas tenir compte de la pertinence deacutefinie par deacutefaut (pondeacuteration des index)

ndash faciliter la recherche exacte

bull Calendrier fin septembre 2012

Quelles fonctionnaliteacutes demain dans thesesfr (2)

bull Des services accessibles sur authentificationndash paniersndash alerte mailndash hellip

bull Des services speacutecifiques pour les personnes reconnues comme eacutetant lrsquoauteur drsquoune thegravesendash mise en relation ecirctre contacteacute via thesesfrndash accegraves aux statistiques de sa page de thegravesendash hellip

bull Impossibiliteacute drsquooffrir de tels services pourles directeurs de thegravese

bull Calendrier fin 2012

Que trouvera-t-on demaindans thesesfr (1)

bull Toutes les donneacutees du Sudoc relatives aux thegraveses de doctorat franccedilaises soutenues depuis 1985

bull Toutes Non Celles qui passent avec succegraves lrsquoalgorithme de chargement qui a pour but de les laquo FRBriser raquo

bull Regroupement des notices Sudoc en familles composeacutees de ndash la notice megravere (la notice de la thegravese originelle telle que valideacutee par le

jury zone 105$m)

ndash Eacuteventuellement les notices enfants (les notices de reproduction zone 105$bv)

bull Chaque famille aura une page propre wwwthesesfrNNT

bull Conseacutequence pour thesesfr recherche de lrsquoexhaustiviteacute depuis 1985

bull Calendrier fin septembre 2012

Que trouvera-t-on demaindans thesesfr (2)

bull Toutes les donneacutees de TEL et lrsquoindexation du texte inteacutegral sous reacuteserve que le lien agrave la thegravese originelle ait eacuteteacute trouveacute

bull Principe chargement de toutes les donneacutees de TEL dans le Sudoc par moissonnage oai-pmh de TELndash Creacuteation de notices probablement assez pauvres (pas de liens

IdRef) mais avec lrsquoaccegraves au texte inteacutegral

bull Algorithme laquo FRBrisateur raquo de chargement dans thesesfrndash Si la notice megravere est trouveacutee ajout dans thesesfr de lrsquoaccegraves au

texte inteacutegral

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral sur le web

bull Calendrier fin 2012

Que trouvera-t-on demaindans thesesfr (3)

bull Des liens vers le catalogue des laquo thegraveses agrave la carte raquo de lrsquoANRT de Lille

bull Principe envoi reacutegulier (mensuel ) de la liste de NNTdisponibles dans laquo thegraveses agrave la carte raquo

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral avec la possibiliteacute de commander un fac-simileacute de la thegravese

bull Calendrier soumis aux contraintes de lrsquoANRT sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (4)

bull Les donneacutees de Theacutesa pour les thegraveses en preacuteparation au sein drsquoeacutetablissements relevant de la CGE et non utilisateurs de STEP

bull Principe envoi reacutegulier (mensuel ) des donneacutees par lrsquoINIST

bull Conseacutequence pour thesesfr recenser toutes les thegraveses en preacuteparation

bull Calendrier soumis aux contraintes de lrsquoINIST sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (5)

bull Des liens vers les donneacutees non-documentaires issus des partenaires associatifs du projet IntellirsquoAgence-ABG par exemplendash Cvthegraveque

ndash Offres drsquoemploi

ndash hellip

bull Conseacutequence pour thesesfr servir les docteurs et les doctorants au-delagrave de leur travail acadeacutemique

bull Calendrier soumis aux contraintes de lrsquo IntellirsquoAgence-ABG sans doute fin 2012

Journeacutees ABES ndash 20 juin 2012

Page 4: Tutoriel theses.fr : support pour diffusion sur le webQue trouve-t-on aujourd’hui dans theses.fr ? •Toutes les données validées dans STAR –Description de 11 397 thèses soutenues

bull Les pages de thegraveses soutenues

bull Les pages de thegraveses en preacuteparation

bull sous reacuteserve drsquoun lien IdRef-autoriteacutes Sudoc ndash Les pages de personnes

ndash Les pages drsquoorganismes

Les pages laquo finales raquo

bull Les pages de thegraveses soutenues

bull Les pages de thegraveses en preacuteparation

bull sous reacuteserve drsquoun lien IdRef-autoriteacutes Sudoc ndash Les pages de personnes

ndash Les pages drsquoorganismes

Les pages laquo finales raquo

httpwwwthesesfr2011REN20056

bull Les pages de thegraveses soutenues

bull Les pages de thegraveses en preacuteparation

bull sous reacuteserve drsquoun lien IdRef-autoriteacutes Sudoc ndash Les pages de personnes

ndash Les pages drsquoorganismes

Les pages laquo finales raquo

httpwwwthesesfr2011REN20056

httpwwwthesesfrs57810

bull Les pages de thegraveses soutenues

bull Les pages de thegraveses en preacuteparation

bull sous reacuteserve drsquoun lien IdRef-autoriteacutes Sudoc ndash Les pages de personnes

ndash Les pages drsquoorganismes

Les pages laquo finales raquo

httpwwwthesesfr2011REN20056

httpwwwthesesfrs57810

httpwwwthesesfr154887528

httpwwwthesesfr 079486304

Les trois onglets de recherche

bull Toutes les thegraveses

ndash Deux restrictions possibles bull uniquement les thegraveses soutenues

bull uniquement les thegraveses soutenues accessibles en ligne

bull Thegraveses en preacuteparation

ndash Restriction possible uniquement les thegraveses en preacuteparation dont

la soutenance est preacutevue dans les 6 prochains mois

bull Personnes docteurs directeurs de thegravese membres du jury

ndash Restriction possible uniquement les personnes en lien avec une thegravese soutenue ou en preacuteparation depuis moins de 5 ans

Au choix de lrsquoutilisateur

bull Consultation par lrsquoencart de recherche

ndash Requecircte sur les meacutetadonneacutees et le texte inteacutegral

bull Consultation par lrsquoencart de recherche puis raffinement par utilisation des facettes

date de soutenance eacutetablissement

discipline eacutecole doctorale

langue de la thegravese directeur de thegravese

domaine

bull Consultation par navigation pure via les facettes

Page drsquoaccueil wwwthesesfr

Page de reacutesultats obtenue apregraves utilisation de lrsquoencart de recherche

Page de reacutesultats obtenue apregraves raffinement par la facette Etablissement

Page de la thegravese soutenue obtenue en cliquant sur le titre

Page drsquoun organisme obtenue en cliquant sur le nom de lrsquoorganisme

Page de la thegravese en preacuteparation obtenue en cliquant sur le titre

Page drsquoune personne obtenue en cliquant sur le nom de la personne

Les servicesbull Rebonds vers des applications du web 20 via AddThis

bull Recommandations

bull

ndash des flux ATOM par deacutefautbull thegraveses soutenues reacutecemment

bull soutenues reacutecemment accessibles en ligne

bull nouvelles thegraveses en preacuteparation

bull annonces de soutenance

ndash et des flux personnalisables flux de recherche

bullndash Zotero

ndash format txt

ndash format csv

ndash formats laquo machines raquo

Un service particulier

bull Rendre possible un cercle vertueux lrsquoutilisateur entre en contact avec le producteur pour signaler une erreur

16 7 10

9576

4558

6848

37 28

147154

0

20

40

60

80

100

120

140

160

180

200

juil-11 aoucirct-11 sept-11 oct-11 nov-11 deacutec-11 janv-12 feacutevr-12 mars-12 avr-12 mai-12

Assistance de thesesfr

signaler une erreur

ABESstp

bull Depuis avril 2012

bull Mail aucorrespondant STEP ou au correspondant STAR

Les donneacutees brutes

bull Ouvertes reacuteutilisables via une APIndash pour une liste de reacutesultats ajouter ampformat=xml ou

ampformat=json ou ampformat=atom ou ampformat=csv ou ampformat=txt en paramegravetre de lrsquourl de recherche

ndash pour une page finale ajouter xml (ou rdf ) agrave lrsquourl de la page

bull Ce principe permet drsquoajouter autant de formats que neacutecessaire

bull Exemple reacutecupeacuterer la description de la thegravese 2010MON30067

ndash dans lrsquointerfacendash en rdfxml

bull Exemple reacutecupeacuterer la liste de toutes les thegraveses soutenues agrave Toulouse 2 et accessibles en ligne dans lrsquoED Science du langage

ndash dans lrsquointerfacendash en xml (solr)ndash en json

thesesfr et Google

bull Description de toutes les pages de thesesfr dans un fichier sitemap pour faciliter lrsquoindexation des robots

bull 77 du trafic provient des moteurs de recherche

99 674

13 218

10 6710

20 000

40 000

60 000

80 000

100 000

120 000

Source de trafic (nb de visites)

trafic de recherche

sites reacutefeacuterents

acceacutes directs

77

14

9

Source de trafic ( du nb de visites)

juillet 2011-mai 2012

trafic de recherche

sites reacutefeacuterents

acceacutes directs

12 711

11 86815 961

61 815

73 306

66 891

91 055

95 25999 652

93 250

97 161

0

20 000

40 000

60 000

80 000

100 000

120 000

Visiteurs uniques

Quelques chiffres

86 810 75 383116 255

402 331399 129

349 976

427 499440 975

467 914

426 059

427 365

0

50 000

100 000

150 000

200 000

250 000

300 000

350 000

400 000

450 000

500 000

Pages vues

Plus de deacutetails

bull Le cercle vertueux de thesesfr mise en relation de lrsquoutilisateur et du producteur de donneacutees Punktokomo 10 avril 2012

bull thesesfr comment fonctionne lrsquoonglet laquo personnes raquo Punktokomo 19 janvier 2012

bull thesesfr lrsquoAPI XML de recherche Punktokomo 22 juillet 2011

bull thesesfr lrsquoAPI XML des personnes Punktokomo 12 juillet 2011

bull thesesfr lrsquoAPI XML des thegraveses Punktokomo 12 juillet 2011

bull thesesfr les technologies utiliseacutees Punktokomo 12 juillet 2011

UN PROJET DOTEacute DE MOYENS SPEacuteCIFIQUES JUSQUrsquoA FIN 2012

thesesfr les prochains deacuteveloppements

Quelles fonctionnaliteacutes demain dans thesesfr (1)

bull Une interface en trois langues

ndash Franccedilais anglais italien

bull Un module de recherche avanceacutee

ndash exclure la recherche dans le texte inteacutegral

ndash ne pas tenir compte de la pertinence deacutefinie par deacutefaut (pondeacuteration des index)

ndash faciliter la recherche exacte

bull Calendrier fin septembre 2012

Quelles fonctionnaliteacutes demain dans thesesfr (2)

bull Des services accessibles sur authentificationndash paniersndash alerte mailndash hellip

bull Des services speacutecifiques pour les personnes reconnues comme eacutetant lrsquoauteur drsquoune thegravesendash mise en relation ecirctre contacteacute via thesesfrndash accegraves aux statistiques de sa page de thegravesendash hellip

bull Impossibiliteacute drsquooffrir de tels services pourles directeurs de thegravese

bull Calendrier fin 2012

Que trouvera-t-on demaindans thesesfr (1)

bull Toutes les donneacutees du Sudoc relatives aux thegraveses de doctorat franccedilaises soutenues depuis 1985

bull Toutes Non Celles qui passent avec succegraves lrsquoalgorithme de chargement qui a pour but de les laquo FRBriser raquo

bull Regroupement des notices Sudoc en familles composeacutees de ndash la notice megravere (la notice de la thegravese originelle telle que valideacutee par le

jury zone 105$m)

ndash Eacuteventuellement les notices enfants (les notices de reproduction zone 105$bv)

bull Chaque famille aura une page propre wwwthesesfrNNT

bull Conseacutequence pour thesesfr recherche de lrsquoexhaustiviteacute depuis 1985

bull Calendrier fin septembre 2012

Que trouvera-t-on demaindans thesesfr (2)

bull Toutes les donneacutees de TEL et lrsquoindexation du texte inteacutegral sous reacuteserve que le lien agrave la thegravese originelle ait eacuteteacute trouveacute

bull Principe chargement de toutes les donneacutees de TEL dans le Sudoc par moissonnage oai-pmh de TELndash Creacuteation de notices probablement assez pauvres (pas de liens

IdRef) mais avec lrsquoaccegraves au texte inteacutegral

bull Algorithme laquo FRBrisateur raquo de chargement dans thesesfrndash Si la notice megravere est trouveacutee ajout dans thesesfr de lrsquoaccegraves au

texte inteacutegral

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral sur le web

bull Calendrier fin 2012

Que trouvera-t-on demaindans thesesfr (3)

bull Des liens vers le catalogue des laquo thegraveses agrave la carte raquo de lrsquoANRT de Lille

bull Principe envoi reacutegulier (mensuel ) de la liste de NNTdisponibles dans laquo thegraveses agrave la carte raquo

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral avec la possibiliteacute de commander un fac-simileacute de la thegravese

bull Calendrier soumis aux contraintes de lrsquoANRT sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (4)

bull Les donneacutees de Theacutesa pour les thegraveses en preacuteparation au sein drsquoeacutetablissements relevant de la CGE et non utilisateurs de STEP

bull Principe envoi reacutegulier (mensuel ) des donneacutees par lrsquoINIST

bull Conseacutequence pour thesesfr recenser toutes les thegraveses en preacuteparation

bull Calendrier soumis aux contraintes de lrsquoINIST sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (5)

bull Des liens vers les donneacutees non-documentaires issus des partenaires associatifs du projet IntellirsquoAgence-ABG par exemplendash Cvthegraveque

ndash Offres drsquoemploi

ndash hellip

bull Conseacutequence pour thesesfr servir les docteurs et les doctorants au-delagrave de leur travail acadeacutemique

bull Calendrier soumis aux contraintes de lrsquo IntellirsquoAgence-ABG sans doute fin 2012

Journeacutees ABES ndash 20 juin 2012

Page 5: Tutoriel theses.fr : support pour diffusion sur le webQue trouve-t-on aujourd’hui dans theses.fr ? •Toutes les données validées dans STAR –Description de 11 397 thèses soutenues

bull Les pages de thegraveses soutenues

bull Les pages de thegraveses en preacuteparation

bull sous reacuteserve drsquoun lien IdRef-autoriteacutes Sudoc ndash Les pages de personnes

ndash Les pages drsquoorganismes

Les pages laquo finales raquo

httpwwwthesesfr2011REN20056

bull Les pages de thegraveses soutenues

bull Les pages de thegraveses en preacuteparation

bull sous reacuteserve drsquoun lien IdRef-autoriteacutes Sudoc ndash Les pages de personnes

ndash Les pages drsquoorganismes

Les pages laquo finales raquo

httpwwwthesesfr2011REN20056

httpwwwthesesfrs57810

bull Les pages de thegraveses soutenues

bull Les pages de thegraveses en preacuteparation

bull sous reacuteserve drsquoun lien IdRef-autoriteacutes Sudoc ndash Les pages de personnes

ndash Les pages drsquoorganismes

Les pages laquo finales raquo

httpwwwthesesfr2011REN20056

httpwwwthesesfrs57810

httpwwwthesesfr154887528

httpwwwthesesfr 079486304

Les trois onglets de recherche

bull Toutes les thegraveses

ndash Deux restrictions possibles bull uniquement les thegraveses soutenues

bull uniquement les thegraveses soutenues accessibles en ligne

bull Thegraveses en preacuteparation

ndash Restriction possible uniquement les thegraveses en preacuteparation dont

la soutenance est preacutevue dans les 6 prochains mois

bull Personnes docteurs directeurs de thegravese membres du jury

ndash Restriction possible uniquement les personnes en lien avec une thegravese soutenue ou en preacuteparation depuis moins de 5 ans

Au choix de lrsquoutilisateur

bull Consultation par lrsquoencart de recherche

ndash Requecircte sur les meacutetadonneacutees et le texte inteacutegral

bull Consultation par lrsquoencart de recherche puis raffinement par utilisation des facettes

date de soutenance eacutetablissement

discipline eacutecole doctorale

langue de la thegravese directeur de thegravese

domaine

bull Consultation par navigation pure via les facettes

Page drsquoaccueil wwwthesesfr

Page de reacutesultats obtenue apregraves utilisation de lrsquoencart de recherche

Page de reacutesultats obtenue apregraves raffinement par la facette Etablissement

Page de la thegravese soutenue obtenue en cliquant sur le titre

Page drsquoun organisme obtenue en cliquant sur le nom de lrsquoorganisme

Page de la thegravese en preacuteparation obtenue en cliquant sur le titre

Page drsquoune personne obtenue en cliquant sur le nom de la personne

Les servicesbull Rebonds vers des applications du web 20 via AddThis

bull Recommandations

bull

ndash des flux ATOM par deacutefautbull thegraveses soutenues reacutecemment

bull soutenues reacutecemment accessibles en ligne

bull nouvelles thegraveses en preacuteparation

bull annonces de soutenance

ndash et des flux personnalisables flux de recherche

bullndash Zotero

ndash format txt

ndash format csv

ndash formats laquo machines raquo

Un service particulier

bull Rendre possible un cercle vertueux lrsquoutilisateur entre en contact avec le producteur pour signaler une erreur

16 7 10

9576

4558

6848

37 28

147154

0

20

40

60

80

100

120

140

160

180

200

juil-11 aoucirct-11 sept-11 oct-11 nov-11 deacutec-11 janv-12 feacutevr-12 mars-12 avr-12 mai-12

Assistance de thesesfr

signaler une erreur

ABESstp

bull Depuis avril 2012

bull Mail aucorrespondant STEP ou au correspondant STAR

Les donneacutees brutes

bull Ouvertes reacuteutilisables via une APIndash pour une liste de reacutesultats ajouter ampformat=xml ou

ampformat=json ou ampformat=atom ou ampformat=csv ou ampformat=txt en paramegravetre de lrsquourl de recherche

ndash pour une page finale ajouter xml (ou rdf ) agrave lrsquourl de la page

bull Ce principe permet drsquoajouter autant de formats que neacutecessaire

bull Exemple reacutecupeacuterer la description de la thegravese 2010MON30067

ndash dans lrsquointerfacendash en rdfxml

bull Exemple reacutecupeacuterer la liste de toutes les thegraveses soutenues agrave Toulouse 2 et accessibles en ligne dans lrsquoED Science du langage

ndash dans lrsquointerfacendash en xml (solr)ndash en json

thesesfr et Google

bull Description de toutes les pages de thesesfr dans un fichier sitemap pour faciliter lrsquoindexation des robots

bull 77 du trafic provient des moteurs de recherche

99 674

13 218

10 6710

20 000

40 000

60 000

80 000

100 000

120 000

Source de trafic (nb de visites)

trafic de recherche

sites reacutefeacuterents

acceacutes directs

77

14

9

Source de trafic ( du nb de visites)

juillet 2011-mai 2012

trafic de recherche

sites reacutefeacuterents

acceacutes directs

12 711

11 86815 961

61 815

73 306

66 891

91 055

95 25999 652

93 250

97 161

0

20 000

40 000

60 000

80 000

100 000

120 000

Visiteurs uniques

Quelques chiffres

86 810 75 383116 255

402 331399 129

349 976

427 499440 975

467 914

426 059

427 365

0

50 000

100 000

150 000

200 000

250 000

300 000

350 000

400 000

450 000

500 000

Pages vues

Plus de deacutetails

bull Le cercle vertueux de thesesfr mise en relation de lrsquoutilisateur et du producteur de donneacutees Punktokomo 10 avril 2012

bull thesesfr comment fonctionne lrsquoonglet laquo personnes raquo Punktokomo 19 janvier 2012

bull thesesfr lrsquoAPI XML de recherche Punktokomo 22 juillet 2011

bull thesesfr lrsquoAPI XML des personnes Punktokomo 12 juillet 2011

bull thesesfr lrsquoAPI XML des thegraveses Punktokomo 12 juillet 2011

bull thesesfr les technologies utiliseacutees Punktokomo 12 juillet 2011

UN PROJET DOTEacute DE MOYENS SPEacuteCIFIQUES JUSQUrsquoA FIN 2012

thesesfr les prochains deacuteveloppements

Quelles fonctionnaliteacutes demain dans thesesfr (1)

bull Une interface en trois langues

ndash Franccedilais anglais italien

bull Un module de recherche avanceacutee

ndash exclure la recherche dans le texte inteacutegral

ndash ne pas tenir compte de la pertinence deacutefinie par deacutefaut (pondeacuteration des index)

ndash faciliter la recherche exacte

bull Calendrier fin septembre 2012

Quelles fonctionnaliteacutes demain dans thesesfr (2)

bull Des services accessibles sur authentificationndash paniersndash alerte mailndash hellip

bull Des services speacutecifiques pour les personnes reconnues comme eacutetant lrsquoauteur drsquoune thegravesendash mise en relation ecirctre contacteacute via thesesfrndash accegraves aux statistiques de sa page de thegravesendash hellip

bull Impossibiliteacute drsquooffrir de tels services pourles directeurs de thegravese

bull Calendrier fin 2012

Que trouvera-t-on demaindans thesesfr (1)

bull Toutes les donneacutees du Sudoc relatives aux thegraveses de doctorat franccedilaises soutenues depuis 1985

bull Toutes Non Celles qui passent avec succegraves lrsquoalgorithme de chargement qui a pour but de les laquo FRBriser raquo

bull Regroupement des notices Sudoc en familles composeacutees de ndash la notice megravere (la notice de la thegravese originelle telle que valideacutee par le

jury zone 105$m)

ndash Eacuteventuellement les notices enfants (les notices de reproduction zone 105$bv)

bull Chaque famille aura une page propre wwwthesesfrNNT

bull Conseacutequence pour thesesfr recherche de lrsquoexhaustiviteacute depuis 1985

bull Calendrier fin septembre 2012

Que trouvera-t-on demaindans thesesfr (2)

bull Toutes les donneacutees de TEL et lrsquoindexation du texte inteacutegral sous reacuteserve que le lien agrave la thegravese originelle ait eacuteteacute trouveacute

bull Principe chargement de toutes les donneacutees de TEL dans le Sudoc par moissonnage oai-pmh de TELndash Creacuteation de notices probablement assez pauvres (pas de liens

IdRef) mais avec lrsquoaccegraves au texte inteacutegral

bull Algorithme laquo FRBrisateur raquo de chargement dans thesesfrndash Si la notice megravere est trouveacutee ajout dans thesesfr de lrsquoaccegraves au

texte inteacutegral

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral sur le web

bull Calendrier fin 2012

Que trouvera-t-on demaindans thesesfr (3)

bull Des liens vers le catalogue des laquo thegraveses agrave la carte raquo de lrsquoANRT de Lille

bull Principe envoi reacutegulier (mensuel ) de la liste de NNTdisponibles dans laquo thegraveses agrave la carte raquo

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral avec la possibiliteacute de commander un fac-simileacute de la thegravese

bull Calendrier soumis aux contraintes de lrsquoANRT sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (4)

bull Les donneacutees de Theacutesa pour les thegraveses en preacuteparation au sein drsquoeacutetablissements relevant de la CGE et non utilisateurs de STEP

bull Principe envoi reacutegulier (mensuel ) des donneacutees par lrsquoINIST

bull Conseacutequence pour thesesfr recenser toutes les thegraveses en preacuteparation

bull Calendrier soumis aux contraintes de lrsquoINIST sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (5)

bull Des liens vers les donneacutees non-documentaires issus des partenaires associatifs du projet IntellirsquoAgence-ABG par exemplendash Cvthegraveque

ndash Offres drsquoemploi

ndash hellip

bull Conseacutequence pour thesesfr servir les docteurs et les doctorants au-delagrave de leur travail acadeacutemique

bull Calendrier soumis aux contraintes de lrsquo IntellirsquoAgence-ABG sans doute fin 2012

Journeacutees ABES ndash 20 juin 2012

Page 6: Tutoriel theses.fr : support pour diffusion sur le webQue trouve-t-on aujourd’hui dans theses.fr ? •Toutes les données validées dans STAR –Description de 11 397 thèses soutenues

bull Les pages de thegraveses soutenues

bull Les pages de thegraveses en preacuteparation

bull sous reacuteserve drsquoun lien IdRef-autoriteacutes Sudoc ndash Les pages de personnes

ndash Les pages drsquoorganismes

Les pages laquo finales raquo

httpwwwthesesfr2011REN20056

httpwwwthesesfrs57810

bull Les pages de thegraveses soutenues

bull Les pages de thegraveses en preacuteparation

bull sous reacuteserve drsquoun lien IdRef-autoriteacutes Sudoc ndash Les pages de personnes

ndash Les pages drsquoorganismes

Les pages laquo finales raquo

httpwwwthesesfr2011REN20056

httpwwwthesesfrs57810

httpwwwthesesfr154887528

httpwwwthesesfr 079486304

Les trois onglets de recherche

bull Toutes les thegraveses

ndash Deux restrictions possibles bull uniquement les thegraveses soutenues

bull uniquement les thegraveses soutenues accessibles en ligne

bull Thegraveses en preacuteparation

ndash Restriction possible uniquement les thegraveses en preacuteparation dont

la soutenance est preacutevue dans les 6 prochains mois

bull Personnes docteurs directeurs de thegravese membres du jury

ndash Restriction possible uniquement les personnes en lien avec une thegravese soutenue ou en preacuteparation depuis moins de 5 ans

Au choix de lrsquoutilisateur

bull Consultation par lrsquoencart de recherche

ndash Requecircte sur les meacutetadonneacutees et le texte inteacutegral

bull Consultation par lrsquoencart de recherche puis raffinement par utilisation des facettes

date de soutenance eacutetablissement

discipline eacutecole doctorale

langue de la thegravese directeur de thegravese

domaine

bull Consultation par navigation pure via les facettes

Page drsquoaccueil wwwthesesfr

Page de reacutesultats obtenue apregraves utilisation de lrsquoencart de recherche

Page de reacutesultats obtenue apregraves raffinement par la facette Etablissement

Page de la thegravese soutenue obtenue en cliquant sur le titre

Page drsquoun organisme obtenue en cliquant sur le nom de lrsquoorganisme

Page de la thegravese en preacuteparation obtenue en cliquant sur le titre

Page drsquoune personne obtenue en cliquant sur le nom de la personne

Les servicesbull Rebonds vers des applications du web 20 via AddThis

bull Recommandations

bull

ndash des flux ATOM par deacutefautbull thegraveses soutenues reacutecemment

bull soutenues reacutecemment accessibles en ligne

bull nouvelles thegraveses en preacuteparation

bull annonces de soutenance

ndash et des flux personnalisables flux de recherche

bullndash Zotero

ndash format txt

ndash format csv

ndash formats laquo machines raquo

Un service particulier

bull Rendre possible un cercle vertueux lrsquoutilisateur entre en contact avec le producteur pour signaler une erreur

16 7 10

9576

4558

6848

37 28

147154

0

20

40

60

80

100

120

140

160

180

200

juil-11 aoucirct-11 sept-11 oct-11 nov-11 deacutec-11 janv-12 feacutevr-12 mars-12 avr-12 mai-12

Assistance de thesesfr

signaler une erreur

ABESstp

bull Depuis avril 2012

bull Mail aucorrespondant STEP ou au correspondant STAR

Les donneacutees brutes

bull Ouvertes reacuteutilisables via une APIndash pour une liste de reacutesultats ajouter ampformat=xml ou

ampformat=json ou ampformat=atom ou ampformat=csv ou ampformat=txt en paramegravetre de lrsquourl de recherche

ndash pour une page finale ajouter xml (ou rdf ) agrave lrsquourl de la page

bull Ce principe permet drsquoajouter autant de formats que neacutecessaire

bull Exemple reacutecupeacuterer la description de la thegravese 2010MON30067

ndash dans lrsquointerfacendash en rdfxml

bull Exemple reacutecupeacuterer la liste de toutes les thegraveses soutenues agrave Toulouse 2 et accessibles en ligne dans lrsquoED Science du langage

ndash dans lrsquointerfacendash en xml (solr)ndash en json

thesesfr et Google

bull Description de toutes les pages de thesesfr dans un fichier sitemap pour faciliter lrsquoindexation des robots

bull 77 du trafic provient des moteurs de recherche

99 674

13 218

10 6710

20 000

40 000

60 000

80 000

100 000

120 000

Source de trafic (nb de visites)

trafic de recherche

sites reacutefeacuterents

acceacutes directs

77

14

9

Source de trafic ( du nb de visites)

juillet 2011-mai 2012

trafic de recherche

sites reacutefeacuterents

acceacutes directs

12 711

11 86815 961

61 815

73 306

66 891

91 055

95 25999 652

93 250

97 161

0

20 000

40 000

60 000

80 000

100 000

120 000

Visiteurs uniques

Quelques chiffres

86 810 75 383116 255

402 331399 129

349 976

427 499440 975

467 914

426 059

427 365

0

50 000

100 000

150 000

200 000

250 000

300 000

350 000

400 000

450 000

500 000

Pages vues

Plus de deacutetails

bull Le cercle vertueux de thesesfr mise en relation de lrsquoutilisateur et du producteur de donneacutees Punktokomo 10 avril 2012

bull thesesfr comment fonctionne lrsquoonglet laquo personnes raquo Punktokomo 19 janvier 2012

bull thesesfr lrsquoAPI XML de recherche Punktokomo 22 juillet 2011

bull thesesfr lrsquoAPI XML des personnes Punktokomo 12 juillet 2011

bull thesesfr lrsquoAPI XML des thegraveses Punktokomo 12 juillet 2011

bull thesesfr les technologies utiliseacutees Punktokomo 12 juillet 2011

UN PROJET DOTEacute DE MOYENS SPEacuteCIFIQUES JUSQUrsquoA FIN 2012

thesesfr les prochains deacuteveloppements

Quelles fonctionnaliteacutes demain dans thesesfr (1)

bull Une interface en trois langues

ndash Franccedilais anglais italien

bull Un module de recherche avanceacutee

ndash exclure la recherche dans le texte inteacutegral

ndash ne pas tenir compte de la pertinence deacutefinie par deacutefaut (pondeacuteration des index)

ndash faciliter la recherche exacte

bull Calendrier fin septembre 2012

Quelles fonctionnaliteacutes demain dans thesesfr (2)

bull Des services accessibles sur authentificationndash paniersndash alerte mailndash hellip

bull Des services speacutecifiques pour les personnes reconnues comme eacutetant lrsquoauteur drsquoune thegravesendash mise en relation ecirctre contacteacute via thesesfrndash accegraves aux statistiques de sa page de thegravesendash hellip

bull Impossibiliteacute drsquooffrir de tels services pourles directeurs de thegravese

bull Calendrier fin 2012

Que trouvera-t-on demaindans thesesfr (1)

bull Toutes les donneacutees du Sudoc relatives aux thegraveses de doctorat franccedilaises soutenues depuis 1985

bull Toutes Non Celles qui passent avec succegraves lrsquoalgorithme de chargement qui a pour but de les laquo FRBriser raquo

bull Regroupement des notices Sudoc en familles composeacutees de ndash la notice megravere (la notice de la thegravese originelle telle que valideacutee par le

jury zone 105$m)

ndash Eacuteventuellement les notices enfants (les notices de reproduction zone 105$bv)

bull Chaque famille aura une page propre wwwthesesfrNNT

bull Conseacutequence pour thesesfr recherche de lrsquoexhaustiviteacute depuis 1985

bull Calendrier fin septembre 2012

Que trouvera-t-on demaindans thesesfr (2)

bull Toutes les donneacutees de TEL et lrsquoindexation du texte inteacutegral sous reacuteserve que le lien agrave la thegravese originelle ait eacuteteacute trouveacute

bull Principe chargement de toutes les donneacutees de TEL dans le Sudoc par moissonnage oai-pmh de TELndash Creacuteation de notices probablement assez pauvres (pas de liens

IdRef) mais avec lrsquoaccegraves au texte inteacutegral

bull Algorithme laquo FRBrisateur raquo de chargement dans thesesfrndash Si la notice megravere est trouveacutee ajout dans thesesfr de lrsquoaccegraves au

texte inteacutegral

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral sur le web

bull Calendrier fin 2012

Que trouvera-t-on demaindans thesesfr (3)

bull Des liens vers le catalogue des laquo thegraveses agrave la carte raquo de lrsquoANRT de Lille

bull Principe envoi reacutegulier (mensuel ) de la liste de NNTdisponibles dans laquo thegraveses agrave la carte raquo

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral avec la possibiliteacute de commander un fac-simileacute de la thegravese

bull Calendrier soumis aux contraintes de lrsquoANRT sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (4)

bull Les donneacutees de Theacutesa pour les thegraveses en preacuteparation au sein drsquoeacutetablissements relevant de la CGE et non utilisateurs de STEP

bull Principe envoi reacutegulier (mensuel ) des donneacutees par lrsquoINIST

bull Conseacutequence pour thesesfr recenser toutes les thegraveses en preacuteparation

bull Calendrier soumis aux contraintes de lrsquoINIST sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (5)

bull Des liens vers les donneacutees non-documentaires issus des partenaires associatifs du projet IntellirsquoAgence-ABG par exemplendash Cvthegraveque

ndash Offres drsquoemploi

ndash hellip

bull Conseacutequence pour thesesfr servir les docteurs et les doctorants au-delagrave de leur travail acadeacutemique

bull Calendrier soumis aux contraintes de lrsquo IntellirsquoAgence-ABG sans doute fin 2012

Journeacutees ABES ndash 20 juin 2012

Page 7: Tutoriel theses.fr : support pour diffusion sur le webQue trouve-t-on aujourd’hui dans theses.fr ? •Toutes les données validées dans STAR –Description de 11 397 thèses soutenues

bull Les pages de thegraveses soutenues

bull Les pages de thegraveses en preacuteparation

bull sous reacuteserve drsquoun lien IdRef-autoriteacutes Sudoc ndash Les pages de personnes

ndash Les pages drsquoorganismes

Les pages laquo finales raquo

httpwwwthesesfr2011REN20056

httpwwwthesesfrs57810

httpwwwthesesfr154887528

httpwwwthesesfr 079486304

Les trois onglets de recherche

bull Toutes les thegraveses

ndash Deux restrictions possibles bull uniquement les thegraveses soutenues

bull uniquement les thegraveses soutenues accessibles en ligne

bull Thegraveses en preacuteparation

ndash Restriction possible uniquement les thegraveses en preacuteparation dont

la soutenance est preacutevue dans les 6 prochains mois

bull Personnes docteurs directeurs de thegravese membres du jury

ndash Restriction possible uniquement les personnes en lien avec une thegravese soutenue ou en preacuteparation depuis moins de 5 ans

Au choix de lrsquoutilisateur

bull Consultation par lrsquoencart de recherche

ndash Requecircte sur les meacutetadonneacutees et le texte inteacutegral

bull Consultation par lrsquoencart de recherche puis raffinement par utilisation des facettes

date de soutenance eacutetablissement

discipline eacutecole doctorale

langue de la thegravese directeur de thegravese

domaine

bull Consultation par navigation pure via les facettes

Page drsquoaccueil wwwthesesfr

Page de reacutesultats obtenue apregraves utilisation de lrsquoencart de recherche

Page de reacutesultats obtenue apregraves raffinement par la facette Etablissement

Page de la thegravese soutenue obtenue en cliquant sur le titre

Page drsquoun organisme obtenue en cliquant sur le nom de lrsquoorganisme

Page de la thegravese en preacuteparation obtenue en cliquant sur le titre

Page drsquoune personne obtenue en cliquant sur le nom de la personne

Les servicesbull Rebonds vers des applications du web 20 via AddThis

bull Recommandations

bull

ndash des flux ATOM par deacutefautbull thegraveses soutenues reacutecemment

bull soutenues reacutecemment accessibles en ligne

bull nouvelles thegraveses en preacuteparation

bull annonces de soutenance

ndash et des flux personnalisables flux de recherche

bullndash Zotero

ndash format txt

ndash format csv

ndash formats laquo machines raquo

Un service particulier

bull Rendre possible un cercle vertueux lrsquoutilisateur entre en contact avec le producteur pour signaler une erreur

16 7 10

9576

4558

6848

37 28

147154

0

20

40

60

80

100

120

140

160

180

200

juil-11 aoucirct-11 sept-11 oct-11 nov-11 deacutec-11 janv-12 feacutevr-12 mars-12 avr-12 mai-12

Assistance de thesesfr

signaler une erreur

ABESstp

bull Depuis avril 2012

bull Mail aucorrespondant STEP ou au correspondant STAR

Les donneacutees brutes

bull Ouvertes reacuteutilisables via une APIndash pour une liste de reacutesultats ajouter ampformat=xml ou

ampformat=json ou ampformat=atom ou ampformat=csv ou ampformat=txt en paramegravetre de lrsquourl de recherche

ndash pour une page finale ajouter xml (ou rdf ) agrave lrsquourl de la page

bull Ce principe permet drsquoajouter autant de formats que neacutecessaire

bull Exemple reacutecupeacuterer la description de la thegravese 2010MON30067

ndash dans lrsquointerfacendash en rdfxml

bull Exemple reacutecupeacuterer la liste de toutes les thegraveses soutenues agrave Toulouse 2 et accessibles en ligne dans lrsquoED Science du langage

ndash dans lrsquointerfacendash en xml (solr)ndash en json

thesesfr et Google

bull Description de toutes les pages de thesesfr dans un fichier sitemap pour faciliter lrsquoindexation des robots

bull 77 du trafic provient des moteurs de recherche

99 674

13 218

10 6710

20 000

40 000

60 000

80 000

100 000

120 000

Source de trafic (nb de visites)

trafic de recherche

sites reacutefeacuterents

acceacutes directs

77

14

9

Source de trafic ( du nb de visites)

juillet 2011-mai 2012

trafic de recherche

sites reacutefeacuterents

acceacutes directs

12 711

11 86815 961

61 815

73 306

66 891

91 055

95 25999 652

93 250

97 161

0

20 000

40 000

60 000

80 000

100 000

120 000

Visiteurs uniques

Quelques chiffres

86 810 75 383116 255

402 331399 129

349 976

427 499440 975

467 914

426 059

427 365

0

50 000

100 000

150 000

200 000

250 000

300 000

350 000

400 000

450 000

500 000

Pages vues

Plus de deacutetails

bull Le cercle vertueux de thesesfr mise en relation de lrsquoutilisateur et du producteur de donneacutees Punktokomo 10 avril 2012

bull thesesfr comment fonctionne lrsquoonglet laquo personnes raquo Punktokomo 19 janvier 2012

bull thesesfr lrsquoAPI XML de recherche Punktokomo 22 juillet 2011

bull thesesfr lrsquoAPI XML des personnes Punktokomo 12 juillet 2011

bull thesesfr lrsquoAPI XML des thegraveses Punktokomo 12 juillet 2011

bull thesesfr les technologies utiliseacutees Punktokomo 12 juillet 2011

UN PROJET DOTEacute DE MOYENS SPEacuteCIFIQUES JUSQUrsquoA FIN 2012

thesesfr les prochains deacuteveloppements

Quelles fonctionnaliteacutes demain dans thesesfr (1)

bull Une interface en trois langues

ndash Franccedilais anglais italien

bull Un module de recherche avanceacutee

ndash exclure la recherche dans le texte inteacutegral

ndash ne pas tenir compte de la pertinence deacutefinie par deacutefaut (pondeacuteration des index)

ndash faciliter la recherche exacte

bull Calendrier fin septembre 2012

Quelles fonctionnaliteacutes demain dans thesesfr (2)

bull Des services accessibles sur authentificationndash paniersndash alerte mailndash hellip

bull Des services speacutecifiques pour les personnes reconnues comme eacutetant lrsquoauteur drsquoune thegravesendash mise en relation ecirctre contacteacute via thesesfrndash accegraves aux statistiques de sa page de thegravesendash hellip

bull Impossibiliteacute drsquooffrir de tels services pourles directeurs de thegravese

bull Calendrier fin 2012

Que trouvera-t-on demaindans thesesfr (1)

bull Toutes les donneacutees du Sudoc relatives aux thegraveses de doctorat franccedilaises soutenues depuis 1985

bull Toutes Non Celles qui passent avec succegraves lrsquoalgorithme de chargement qui a pour but de les laquo FRBriser raquo

bull Regroupement des notices Sudoc en familles composeacutees de ndash la notice megravere (la notice de la thegravese originelle telle que valideacutee par le

jury zone 105$m)

ndash Eacuteventuellement les notices enfants (les notices de reproduction zone 105$bv)

bull Chaque famille aura une page propre wwwthesesfrNNT

bull Conseacutequence pour thesesfr recherche de lrsquoexhaustiviteacute depuis 1985

bull Calendrier fin septembre 2012

Que trouvera-t-on demaindans thesesfr (2)

bull Toutes les donneacutees de TEL et lrsquoindexation du texte inteacutegral sous reacuteserve que le lien agrave la thegravese originelle ait eacuteteacute trouveacute

bull Principe chargement de toutes les donneacutees de TEL dans le Sudoc par moissonnage oai-pmh de TELndash Creacuteation de notices probablement assez pauvres (pas de liens

IdRef) mais avec lrsquoaccegraves au texte inteacutegral

bull Algorithme laquo FRBrisateur raquo de chargement dans thesesfrndash Si la notice megravere est trouveacutee ajout dans thesesfr de lrsquoaccegraves au

texte inteacutegral

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral sur le web

bull Calendrier fin 2012

Que trouvera-t-on demaindans thesesfr (3)

bull Des liens vers le catalogue des laquo thegraveses agrave la carte raquo de lrsquoANRT de Lille

bull Principe envoi reacutegulier (mensuel ) de la liste de NNTdisponibles dans laquo thegraveses agrave la carte raquo

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral avec la possibiliteacute de commander un fac-simileacute de la thegravese

bull Calendrier soumis aux contraintes de lrsquoANRT sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (4)

bull Les donneacutees de Theacutesa pour les thegraveses en preacuteparation au sein drsquoeacutetablissements relevant de la CGE et non utilisateurs de STEP

bull Principe envoi reacutegulier (mensuel ) des donneacutees par lrsquoINIST

bull Conseacutequence pour thesesfr recenser toutes les thegraveses en preacuteparation

bull Calendrier soumis aux contraintes de lrsquoINIST sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (5)

bull Des liens vers les donneacutees non-documentaires issus des partenaires associatifs du projet IntellirsquoAgence-ABG par exemplendash Cvthegraveque

ndash Offres drsquoemploi

ndash hellip

bull Conseacutequence pour thesesfr servir les docteurs et les doctorants au-delagrave de leur travail acadeacutemique

bull Calendrier soumis aux contraintes de lrsquo IntellirsquoAgence-ABG sans doute fin 2012

Journeacutees ABES ndash 20 juin 2012

Page 8: Tutoriel theses.fr : support pour diffusion sur le webQue trouve-t-on aujourd’hui dans theses.fr ? •Toutes les données validées dans STAR –Description de 11 397 thèses soutenues

httpwwwthesesfr 079486304

Les trois onglets de recherche

bull Toutes les thegraveses

ndash Deux restrictions possibles bull uniquement les thegraveses soutenues

bull uniquement les thegraveses soutenues accessibles en ligne

bull Thegraveses en preacuteparation

ndash Restriction possible uniquement les thegraveses en preacuteparation dont

la soutenance est preacutevue dans les 6 prochains mois

bull Personnes docteurs directeurs de thegravese membres du jury

ndash Restriction possible uniquement les personnes en lien avec une thegravese soutenue ou en preacuteparation depuis moins de 5 ans

Au choix de lrsquoutilisateur

bull Consultation par lrsquoencart de recherche

ndash Requecircte sur les meacutetadonneacutees et le texte inteacutegral

bull Consultation par lrsquoencart de recherche puis raffinement par utilisation des facettes

date de soutenance eacutetablissement

discipline eacutecole doctorale

langue de la thegravese directeur de thegravese

domaine

bull Consultation par navigation pure via les facettes

Page drsquoaccueil wwwthesesfr

Page de reacutesultats obtenue apregraves utilisation de lrsquoencart de recherche

Page de reacutesultats obtenue apregraves raffinement par la facette Etablissement

Page de la thegravese soutenue obtenue en cliquant sur le titre

Page drsquoun organisme obtenue en cliquant sur le nom de lrsquoorganisme

Page de la thegravese en preacuteparation obtenue en cliquant sur le titre

Page drsquoune personne obtenue en cliquant sur le nom de la personne

Les servicesbull Rebonds vers des applications du web 20 via AddThis

bull Recommandations

bull

ndash des flux ATOM par deacutefautbull thegraveses soutenues reacutecemment

bull soutenues reacutecemment accessibles en ligne

bull nouvelles thegraveses en preacuteparation

bull annonces de soutenance

ndash et des flux personnalisables flux de recherche

bullndash Zotero

ndash format txt

ndash format csv

ndash formats laquo machines raquo

Un service particulier

bull Rendre possible un cercle vertueux lrsquoutilisateur entre en contact avec le producteur pour signaler une erreur

16 7 10

9576

4558

6848

37 28

147154

0

20

40

60

80

100

120

140

160

180

200

juil-11 aoucirct-11 sept-11 oct-11 nov-11 deacutec-11 janv-12 feacutevr-12 mars-12 avr-12 mai-12

Assistance de thesesfr

signaler une erreur

ABESstp

bull Depuis avril 2012

bull Mail aucorrespondant STEP ou au correspondant STAR

Les donneacutees brutes

bull Ouvertes reacuteutilisables via une APIndash pour une liste de reacutesultats ajouter ampformat=xml ou

ampformat=json ou ampformat=atom ou ampformat=csv ou ampformat=txt en paramegravetre de lrsquourl de recherche

ndash pour une page finale ajouter xml (ou rdf ) agrave lrsquourl de la page

bull Ce principe permet drsquoajouter autant de formats que neacutecessaire

bull Exemple reacutecupeacuterer la description de la thegravese 2010MON30067

ndash dans lrsquointerfacendash en rdfxml

bull Exemple reacutecupeacuterer la liste de toutes les thegraveses soutenues agrave Toulouse 2 et accessibles en ligne dans lrsquoED Science du langage

ndash dans lrsquointerfacendash en xml (solr)ndash en json

thesesfr et Google

bull Description de toutes les pages de thesesfr dans un fichier sitemap pour faciliter lrsquoindexation des robots

bull 77 du trafic provient des moteurs de recherche

99 674

13 218

10 6710

20 000

40 000

60 000

80 000

100 000

120 000

Source de trafic (nb de visites)

trafic de recherche

sites reacutefeacuterents

acceacutes directs

77

14

9

Source de trafic ( du nb de visites)

juillet 2011-mai 2012

trafic de recherche

sites reacutefeacuterents

acceacutes directs

12 711

11 86815 961

61 815

73 306

66 891

91 055

95 25999 652

93 250

97 161

0

20 000

40 000

60 000

80 000

100 000

120 000

Visiteurs uniques

Quelques chiffres

86 810 75 383116 255

402 331399 129

349 976

427 499440 975

467 914

426 059

427 365

0

50 000

100 000

150 000

200 000

250 000

300 000

350 000

400 000

450 000

500 000

Pages vues

Plus de deacutetails

bull Le cercle vertueux de thesesfr mise en relation de lrsquoutilisateur et du producteur de donneacutees Punktokomo 10 avril 2012

bull thesesfr comment fonctionne lrsquoonglet laquo personnes raquo Punktokomo 19 janvier 2012

bull thesesfr lrsquoAPI XML de recherche Punktokomo 22 juillet 2011

bull thesesfr lrsquoAPI XML des personnes Punktokomo 12 juillet 2011

bull thesesfr lrsquoAPI XML des thegraveses Punktokomo 12 juillet 2011

bull thesesfr les technologies utiliseacutees Punktokomo 12 juillet 2011

UN PROJET DOTEacute DE MOYENS SPEacuteCIFIQUES JUSQUrsquoA FIN 2012

thesesfr les prochains deacuteveloppements

Quelles fonctionnaliteacutes demain dans thesesfr (1)

bull Une interface en trois langues

ndash Franccedilais anglais italien

bull Un module de recherche avanceacutee

ndash exclure la recherche dans le texte inteacutegral

ndash ne pas tenir compte de la pertinence deacutefinie par deacutefaut (pondeacuteration des index)

ndash faciliter la recherche exacte

bull Calendrier fin septembre 2012

Quelles fonctionnaliteacutes demain dans thesesfr (2)

bull Des services accessibles sur authentificationndash paniersndash alerte mailndash hellip

bull Des services speacutecifiques pour les personnes reconnues comme eacutetant lrsquoauteur drsquoune thegravesendash mise en relation ecirctre contacteacute via thesesfrndash accegraves aux statistiques de sa page de thegravesendash hellip

bull Impossibiliteacute drsquooffrir de tels services pourles directeurs de thegravese

bull Calendrier fin 2012

Que trouvera-t-on demaindans thesesfr (1)

bull Toutes les donneacutees du Sudoc relatives aux thegraveses de doctorat franccedilaises soutenues depuis 1985

bull Toutes Non Celles qui passent avec succegraves lrsquoalgorithme de chargement qui a pour but de les laquo FRBriser raquo

bull Regroupement des notices Sudoc en familles composeacutees de ndash la notice megravere (la notice de la thegravese originelle telle que valideacutee par le

jury zone 105$m)

ndash Eacuteventuellement les notices enfants (les notices de reproduction zone 105$bv)

bull Chaque famille aura une page propre wwwthesesfrNNT

bull Conseacutequence pour thesesfr recherche de lrsquoexhaustiviteacute depuis 1985

bull Calendrier fin septembre 2012

Que trouvera-t-on demaindans thesesfr (2)

bull Toutes les donneacutees de TEL et lrsquoindexation du texte inteacutegral sous reacuteserve que le lien agrave la thegravese originelle ait eacuteteacute trouveacute

bull Principe chargement de toutes les donneacutees de TEL dans le Sudoc par moissonnage oai-pmh de TELndash Creacuteation de notices probablement assez pauvres (pas de liens

IdRef) mais avec lrsquoaccegraves au texte inteacutegral

bull Algorithme laquo FRBrisateur raquo de chargement dans thesesfrndash Si la notice megravere est trouveacutee ajout dans thesesfr de lrsquoaccegraves au

texte inteacutegral

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral sur le web

bull Calendrier fin 2012

Que trouvera-t-on demaindans thesesfr (3)

bull Des liens vers le catalogue des laquo thegraveses agrave la carte raquo de lrsquoANRT de Lille

bull Principe envoi reacutegulier (mensuel ) de la liste de NNTdisponibles dans laquo thegraveses agrave la carte raquo

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral avec la possibiliteacute de commander un fac-simileacute de la thegravese

bull Calendrier soumis aux contraintes de lrsquoANRT sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (4)

bull Les donneacutees de Theacutesa pour les thegraveses en preacuteparation au sein drsquoeacutetablissements relevant de la CGE et non utilisateurs de STEP

bull Principe envoi reacutegulier (mensuel ) des donneacutees par lrsquoINIST

bull Conseacutequence pour thesesfr recenser toutes les thegraveses en preacuteparation

bull Calendrier soumis aux contraintes de lrsquoINIST sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (5)

bull Des liens vers les donneacutees non-documentaires issus des partenaires associatifs du projet IntellirsquoAgence-ABG par exemplendash Cvthegraveque

ndash Offres drsquoemploi

ndash hellip

bull Conseacutequence pour thesesfr servir les docteurs et les doctorants au-delagrave de leur travail acadeacutemique

bull Calendrier soumis aux contraintes de lrsquo IntellirsquoAgence-ABG sans doute fin 2012

Journeacutees ABES ndash 20 juin 2012

Page 9: Tutoriel theses.fr : support pour diffusion sur le webQue trouve-t-on aujourd’hui dans theses.fr ? •Toutes les données validées dans STAR –Description de 11 397 thèses soutenues

Les trois onglets de recherche

bull Toutes les thegraveses

ndash Deux restrictions possibles bull uniquement les thegraveses soutenues

bull uniquement les thegraveses soutenues accessibles en ligne

bull Thegraveses en preacuteparation

ndash Restriction possible uniquement les thegraveses en preacuteparation dont

la soutenance est preacutevue dans les 6 prochains mois

bull Personnes docteurs directeurs de thegravese membres du jury

ndash Restriction possible uniquement les personnes en lien avec une thegravese soutenue ou en preacuteparation depuis moins de 5 ans

Au choix de lrsquoutilisateur

bull Consultation par lrsquoencart de recherche

ndash Requecircte sur les meacutetadonneacutees et le texte inteacutegral

bull Consultation par lrsquoencart de recherche puis raffinement par utilisation des facettes

date de soutenance eacutetablissement

discipline eacutecole doctorale

langue de la thegravese directeur de thegravese

domaine

bull Consultation par navigation pure via les facettes

Page drsquoaccueil wwwthesesfr

Page de reacutesultats obtenue apregraves utilisation de lrsquoencart de recherche

Page de reacutesultats obtenue apregraves raffinement par la facette Etablissement

Page de la thegravese soutenue obtenue en cliquant sur le titre

Page drsquoun organisme obtenue en cliquant sur le nom de lrsquoorganisme

Page de la thegravese en preacuteparation obtenue en cliquant sur le titre

Page drsquoune personne obtenue en cliquant sur le nom de la personne

Les servicesbull Rebonds vers des applications du web 20 via AddThis

bull Recommandations

bull

ndash des flux ATOM par deacutefautbull thegraveses soutenues reacutecemment

bull soutenues reacutecemment accessibles en ligne

bull nouvelles thegraveses en preacuteparation

bull annonces de soutenance

ndash et des flux personnalisables flux de recherche

bullndash Zotero

ndash format txt

ndash format csv

ndash formats laquo machines raquo

Un service particulier

bull Rendre possible un cercle vertueux lrsquoutilisateur entre en contact avec le producteur pour signaler une erreur

16 7 10

9576

4558

6848

37 28

147154

0

20

40

60

80

100

120

140

160

180

200

juil-11 aoucirct-11 sept-11 oct-11 nov-11 deacutec-11 janv-12 feacutevr-12 mars-12 avr-12 mai-12

Assistance de thesesfr

signaler une erreur

ABESstp

bull Depuis avril 2012

bull Mail aucorrespondant STEP ou au correspondant STAR

Les donneacutees brutes

bull Ouvertes reacuteutilisables via une APIndash pour une liste de reacutesultats ajouter ampformat=xml ou

ampformat=json ou ampformat=atom ou ampformat=csv ou ampformat=txt en paramegravetre de lrsquourl de recherche

ndash pour une page finale ajouter xml (ou rdf ) agrave lrsquourl de la page

bull Ce principe permet drsquoajouter autant de formats que neacutecessaire

bull Exemple reacutecupeacuterer la description de la thegravese 2010MON30067

ndash dans lrsquointerfacendash en rdfxml

bull Exemple reacutecupeacuterer la liste de toutes les thegraveses soutenues agrave Toulouse 2 et accessibles en ligne dans lrsquoED Science du langage

ndash dans lrsquointerfacendash en xml (solr)ndash en json

thesesfr et Google

bull Description de toutes les pages de thesesfr dans un fichier sitemap pour faciliter lrsquoindexation des robots

bull 77 du trafic provient des moteurs de recherche

99 674

13 218

10 6710

20 000

40 000

60 000

80 000

100 000

120 000

Source de trafic (nb de visites)

trafic de recherche

sites reacutefeacuterents

acceacutes directs

77

14

9

Source de trafic ( du nb de visites)

juillet 2011-mai 2012

trafic de recherche

sites reacutefeacuterents

acceacutes directs

12 711

11 86815 961

61 815

73 306

66 891

91 055

95 25999 652

93 250

97 161

0

20 000

40 000

60 000

80 000

100 000

120 000

Visiteurs uniques

Quelques chiffres

86 810 75 383116 255

402 331399 129

349 976

427 499440 975

467 914

426 059

427 365

0

50 000

100 000

150 000

200 000

250 000

300 000

350 000

400 000

450 000

500 000

Pages vues

Plus de deacutetails

bull Le cercle vertueux de thesesfr mise en relation de lrsquoutilisateur et du producteur de donneacutees Punktokomo 10 avril 2012

bull thesesfr comment fonctionne lrsquoonglet laquo personnes raquo Punktokomo 19 janvier 2012

bull thesesfr lrsquoAPI XML de recherche Punktokomo 22 juillet 2011

bull thesesfr lrsquoAPI XML des personnes Punktokomo 12 juillet 2011

bull thesesfr lrsquoAPI XML des thegraveses Punktokomo 12 juillet 2011

bull thesesfr les technologies utiliseacutees Punktokomo 12 juillet 2011

UN PROJET DOTEacute DE MOYENS SPEacuteCIFIQUES JUSQUrsquoA FIN 2012

thesesfr les prochains deacuteveloppements

Quelles fonctionnaliteacutes demain dans thesesfr (1)

bull Une interface en trois langues

ndash Franccedilais anglais italien

bull Un module de recherche avanceacutee

ndash exclure la recherche dans le texte inteacutegral

ndash ne pas tenir compte de la pertinence deacutefinie par deacutefaut (pondeacuteration des index)

ndash faciliter la recherche exacte

bull Calendrier fin septembre 2012

Quelles fonctionnaliteacutes demain dans thesesfr (2)

bull Des services accessibles sur authentificationndash paniersndash alerte mailndash hellip

bull Des services speacutecifiques pour les personnes reconnues comme eacutetant lrsquoauteur drsquoune thegravesendash mise en relation ecirctre contacteacute via thesesfrndash accegraves aux statistiques de sa page de thegravesendash hellip

bull Impossibiliteacute drsquooffrir de tels services pourles directeurs de thegravese

bull Calendrier fin 2012

Que trouvera-t-on demaindans thesesfr (1)

bull Toutes les donneacutees du Sudoc relatives aux thegraveses de doctorat franccedilaises soutenues depuis 1985

bull Toutes Non Celles qui passent avec succegraves lrsquoalgorithme de chargement qui a pour but de les laquo FRBriser raquo

bull Regroupement des notices Sudoc en familles composeacutees de ndash la notice megravere (la notice de la thegravese originelle telle que valideacutee par le

jury zone 105$m)

ndash Eacuteventuellement les notices enfants (les notices de reproduction zone 105$bv)

bull Chaque famille aura une page propre wwwthesesfrNNT

bull Conseacutequence pour thesesfr recherche de lrsquoexhaustiviteacute depuis 1985

bull Calendrier fin septembre 2012

Que trouvera-t-on demaindans thesesfr (2)

bull Toutes les donneacutees de TEL et lrsquoindexation du texte inteacutegral sous reacuteserve que le lien agrave la thegravese originelle ait eacuteteacute trouveacute

bull Principe chargement de toutes les donneacutees de TEL dans le Sudoc par moissonnage oai-pmh de TELndash Creacuteation de notices probablement assez pauvres (pas de liens

IdRef) mais avec lrsquoaccegraves au texte inteacutegral

bull Algorithme laquo FRBrisateur raquo de chargement dans thesesfrndash Si la notice megravere est trouveacutee ajout dans thesesfr de lrsquoaccegraves au

texte inteacutegral

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral sur le web

bull Calendrier fin 2012

Que trouvera-t-on demaindans thesesfr (3)

bull Des liens vers le catalogue des laquo thegraveses agrave la carte raquo de lrsquoANRT de Lille

bull Principe envoi reacutegulier (mensuel ) de la liste de NNTdisponibles dans laquo thegraveses agrave la carte raquo

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral avec la possibiliteacute de commander un fac-simileacute de la thegravese

bull Calendrier soumis aux contraintes de lrsquoANRT sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (4)

bull Les donneacutees de Theacutesa pour les thegraveses en preacuteparation au sein drsquoeacutetablissements relevant de la CGE et non utilisateurs de STEP

bull Principe envoi reacutegulier (mensuel ) des donneacutees par lrsquoINIST

bull Conseacutequence pour thesesfr recenser toutes les thegraveses en preacuteparation

bull Calendrier soumis aux contraintes de lrsquoINIST sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (5)

bull Des liens vers les donneacutees non-documentaires issus des partenaires associatifs du projet IntellirsquoAgence-ABG par exemplendash Cvthegraveque

ndash Offres drsquoemploi

ndash hellip

bull Conseacutequence pour thesesfr servir les docteurs et les doctorants au-delagrave de leur travail acadeacutemique

bull Calendrier soumis aux contraintes de lrsquo IntellirsquoAgence-ABG sans doute fin 2012

Journeacutees ABES ndash 20 juin 2012

Page 10: Tutoriel theses.fr : support pour diffusion sur le webQue trouve-t-on aujourd’hui dans theses.fr ? •Toutes les données validées dans STAR –Description de 11 397 thèses soutenues

Au choix de lrsquoutilisateur

bull Consultation par lrsquoencart de recherche

ndash Requecircte sur les meacutetadonneacutees et le texte inteacutegral

bull Consultation par lrsquoencart de recherche puis raffinement par utilisation des facettes

date de soutenance eacutetablissement

discipline eacutecole doctorale

langue de la thegravese directeur de thegravese

domaine

bull Consultation par navigation pure via les facettes

Page drsquoaccueil wwwthesesfr

Page de reacutesultats obtenue apregraves utilisation de lrsquoencart de recherche

Page de reacutesultats obtenue apregraves raffinement par la facette Etablissement

Page de la thegravese soutenue obtenue en cliquant sur le titre

Page drsquoun organisme obtenue en cliquant sur le nom de lrsquoorganisme

Page de la thegravese en preacuteparation obtenue en cliquant sur le titre

Page drsquoune personne obtenue en cliquant sur le nom de la personne

Les servicesbull Rebonds vers des applications du web 20 via AddThis

bull Recommandations

bull

ndash des flux ATOM par deacutefautbull thegraveses soutenues reacutecemment

bull soutenues reacutecemment accessibles en ligne

bull nouvelles thegraveses en preacuteparation

bull annonces de soutenance

ndash et des flux personnalisables flux de recherche

bullndash Zotero

ndash format txt

ndash format csv

ndash formats laquo machines raquo

Un service particulier

bull Rendre possible un cercle vertueux lrsquoutilisateur entre en contact avec le producteur pour signaler une erreur

16 7 10

9576

4558

6848

37 28

147154

0

20

40

60

80

100

120

140

160

180

200

juil-11 aoucirct-11 sept-11 oct-11 nov-11 deacutec-11 janv-12 feacutevr-12 mars-12 avr-12 mai-12

Assistance de thesesfr

signaler une erreur

ABESstp

bull Depuis avril 2012

bull Mail aucorrespondant STEP ou au correspondant STAR

Les donneacutees brutes

bull Ouvertes reacuteutilisables via une APIndash pour une liste de reacutesultats ajouter ampformat=xml ou

ampformat=json ou ampformat=atom ou ampformat=csv ou ampformat=txt en paramegravetre de lrsquourl de recherche

ndash pour une page finale ajouter xml (ou rdf ) agrave lrsquourl de la page

bull Ce principe permet drsquoajouter autant de formats que neacutecessaire

bull Exemple reacutecupeacuterer la description de la thegravese 2010MON30067

ndash dans lrsquointerfacendash en rdfxml

bull Exemple reacutecupeacuterer la liste de toutes les thegraveses soutenues agrave Toulouse 2 et accessibles en ligne dans lrsquoED Science du langage

ndash dans lrsquointerfacendash en xml (solr)ndash en json

thesesfr et Google

bull Description de toutes les pages de thesesfr dans un fichier sitemap pour faciliter lrsquoindexation des robots

bull 77 du trafic provient des moteurs de recherche

99 674

13 218

10 6710

20 000

40 000

60 000

80 000

100 000

120 000

Source de trafic (nb de visites)

trafic de recherche

sites reacutefeacuterents

acceacutes directs

77

14

9

Source de trafic ( du nb de visites)

juillet 2011-mai 2012

trafic de recherche

sites reacutefeacuterents

acceacutes directs

12 711

11 86815 961

61 815

73 306

66 891

91 055

95 25999 652

93 250

97 161

0

20 000

40 000

60 000

80 000

100 000

120 000

Visiteurs uniques

Quelques chiffres

86 810 75 383116 255

402 331399 129

349 976

427 499440 975

467 914

426 059

427 365

0

50 000

100 000

150 000

200 000

250 000

300 000

350 000

400 000

450 000

500 000

Pages vues

Plus de deacutetails

bull Le cercle vertueux de thesesfr mise en relation de lrsquoutilisateur et du producteur de donneacutees Punktokomo 10 avril 2012

bull thesesfr comment fonctionne lrsquoonglet laquo personnes raquo Punktokomo 19 janvier 2012

bull thesesfr lrsquoAPI XML de recherche Punktokomo 22 juillet 2011

bull thesesfr lrsquoAPI XML des personnes Punktokomo 12 juillet 2011

bull thesesfr lrsquoAPI XML des thegraveses Punktokomo 12 juillet 2011

bull thesesfr les technologies utiliseacutees Punktokomo 12 juillet 2011

UN PROJET DOTEacute DE MOYENS SPEacuteCIFIQUES JUSQUrsquoA FIN 2012

thesesfr les prochains deacuteveloppements

Quelles fonctionnaliteacutes demain dans thesesfr (1)

bull Une interface en trois langues

ndash Franccedilais anglais italien

bull Un module de recherche avanceacutee

ndash exclure la recherche dans le texte inteacutegral

ndash ne pas tenir compte de la pertinence deacutefinie par deacutefaut (pondeacuteration des index)

ndash faciliter la recherche exacte

bull Calendrier fin septembre 2012

Quelles fonctionnaliteacutes demain dans thesesfr (2)

bull Des services accessibles sur authentificationndash paniersndash alerte mailndash hellip

bull Des services speacutecifiques pour les personnes reconnues comme eacutetant lrsquoauteur drsquoune thegravesendash mise en relation ecirctre contacteacute via thesesfrndash accegraves aux statistiques de sa page de thegravesendash hellip

bull Impossibiliteacute drsquooffrir de tels services pourles directeurs de thegravese

bull Calendrier fin 2012

Que trouvera-t-on demaindans thesesfr (1)

bull Toutes les donneacutees du Sudoc relatives aux thegraveses de doctorat franccedilaises soutenues depuis 1985

bull Toutes Non Celles qui passent avec succegraves lrsquoalgorithme de chargement qui a pour but de les laquo FRBriser raquo

bull Regroupement des notices Sudoc en familles composeacutees de ndash la notice megravere (la notice de la thegravese originelle telle que valideacutee par le

jury zone 105$m)

ndash Eacuteventuellement les notices enfants (les notices de reproduction zone 105$bv)

bull Chaque famille aura une page propre wwwthesesfrNNT

bull Conseacutequence pour thesesfr recherche de lrsquoexhaustiviteacute depuis 1985

bull Calendrier fin septembre 2012

Que trouvera-t-on demaindans thesesfr (2)

bull Toutes les donneacutees de TEL et lrsquoindexation du texte inteacutegral sous reacuteserve que le lien agrave la thegravese originelle ait eacuteteacute trouveacute

bull Principe chargement de toutes les donneacutees de TEL dans le Sudoc par moissonnage oai-pmh de TELndash Creacuteation de notices probablement assez pauvres (pas de liens

IdRef) mais avec lrsquoaccegraves au texte inteacutegral

bull Algorithme laquo FRBrisateur raquo de chargement dans thesesfrndash Si la notice megravere est trouveacutee ajout dans thesesfr de lrsquoaccegraves au

texte inteacutegral

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral sur le web

bull Calendrier fin 2012

Que trouvera-t-on demaindans thesesfr (3)

bull Des liens vers le catalogue des laquo thegraveses agrave la carte raquo de lrsquoANRT de Lille

bull Principe envoi reacutegulier (mensuel ) de la liste de NNTdisponibles dans laquo thegraveses agrave la carte raquo

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral avec la possibiliteacute de commander un fac-simileacute de la thegravese

bull Calendrier soumis aux contraintes de lrsquoANRT sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (4)

bull Les donneacutees de Theacutesa pour les thegraveses en preacuteparation au sein drsquoeacutetablissements relevant de la CGE et non utilisateurs de STEP

bull Principe envoi reacutegulier (mensuel ) des donneacutees par lrsquoINIST

bull Conseacutequence pour thesesfr recenser toutes les thegraveses en preacuteparation

bull Calendrier soumis aux contraintes de lrsquoINIST sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (5)

bull Des liens vers les donneacutees non-documentaires issus des partenaires associatifs du projet IntellirsquoAgence-ABG par exemplendash Cvthegraveque

ndash Offres drsquoemploi

ndash hellip

bull Conseacutequence pour thesesfr servir les docteurs et les doctorants au-delagrave de leur travail acadeacutemique

bull Calendrier soumis aux contraintes de lrsquo IntellirsquoAgence-ABG sans doute fin 2012

Journeacutees ABES ndash 20 juin 2012

Page 11: Tutoriel theses.fr : support pour diffusion sur le webQue trouve-t-on aujourd’hui dans theses.fr ? •Toutes les données validées dans STAR –Description de 11 397 thèses soutenues

Page drsquoaccueil wwwthesesfr

Page de reacutesultats obtenue apregraves utilisation de lrsquoencart de recherche

Page de reacutesultats obtenue apregraves raffinement par la facette Etablissement

Page de la thegravese soutenue obtenue en cliquant sur le titre

Page drsquoun organisme obtenue en cliquant sur le nom de lrsquoorganisme

Page de la thegravese en preacuteparation obtenue en cliquant sur le titre

Page drsquoune personne obtenue en cliquant sur le nom de la personne

Les servicesbull Rebonds vers des applications du web 20 via AddThis

bull Recommandations

bull

ndash des flux ATOM par deacutefautbull thegraveses soutenues reacutecemment

bull soutenues reacutecemment accessibles en ligne

bull nouvelles thegraveses en preacuteparation

bull annonces de soutenance

ndash et des flux personnalisables flux de recherche

bullndash Zotero

ndash format txt

ndash format csv

ndash formats laquo machines raquo

Un service particulier

bull Rendre possible un cercle vertueux lrsquoutilisateur entre en contact avec le producteur pour signaler une erreur

16 7 10

9576

4558

6848

37 28

147154

0

20

40

60

80

100

120

140

160

180

200

juil-11 aoucirct-11 sept-11 oct-11 nov-11 deacutec-11 janv-12 feacutevr-12 mars-12 avr-12 mai-12

Assistance de thesesfr

signaler une erreur

ABESstp

bull Depuis avril 2012

bull Mail aucorrespondant STEP ou au correspondant STAR

Les donneacutees brutes

bull Ouvertes reacuteutilisables via une APIndash pour une liste de reacutesultats ajouter ampformat=xml ou

ampformat=json ou ampformat=atom ou ampformat=csv ou ampformat=txt en paramegravetre de lrsquourl de recherche

ndash pour une page finale ajouter xml (ou rdf ) agrave lrsquourl de la page

bull Ce principe permet drsquoajouter autant de formats que neacutecessaire

bull Exemple reacutecupeacuterer la description de la thegravese 2010MON30067

ndash dans lrsquointerfacendash en rdfxml

bull Exemple reacutecupeacuterer la liste de toutes les thegraveses soutenues agrave Toulouse 2 et accessibles en ligne dans lrsquoED Science du langage

ndash dans lrsquointerfacendash en xml (solr)ndash en json

thesesfr et Google

bull Description de toutes les pages de thesesfr dans un fichier sitemap pour faciliter lrsquoindexation des robots

bull 77 du trafic provient des moteurs de recherche

99 674

13 218

10 6710

20 000

40 000

60 000

80 000

100 000

120 000

Source de trafic (nb de visites)

trafic de recherche

sites reacutefeacuterents

acceacutes directs

77

14

9

Source de trafic ( du nb de visites)

juillet 2011-mai 2012

trafic de recherche

sites reacutefeacuterents

acceacutes directs

12 711

11 86815 961

61 815

73 306

66 891

91 055

95 25999 652

93 250

97 161

0

20 000

40 000

60 000

80 000

100 000

120 000

Visiteurs uniques

Quelques chiffres

86 810 75 383116 255

402 331399 129

349 976

427 499440 975

467 914

426 059

427 365

0

50 000

100 000

150 000

200 000

250 000

300 000

350 000

400 000

450 000

500 000

Pages vues

Plus de deacutetails

bull Le cercle vertueux de thesesfr mise en relation de lrsquoutilisateur et du producteur de donneacutees Punktokomo 10 avril 2012

bull thesesfr comment fonctionne lrsquoonglet laquo personnes raquo Punktokomo 19 janvier 2012

bull thesesfr lrsquoAPI XML de recherche Punktokomo 22 juillet 2011

bull thesesfr lrsquoAPI XML des personnes Punktokomo 12 juillet 2011

bull thesesfr lrsquoAPI XML des thegraveses Punktokomo 12 juillet 2011

bull thesesfr les technologies utiliseacutees Punktokomo 12 juillet 2011

UN PROJET DOTEacute DE MOYENS SPEacuteCIFIQUES JUSQUrsquoA FIN 2012

thesesfr les prochains deacuteveloppements

Quelles fonctionnaliteacutes demain dans thesesfr (1)

bull Une interface en trois langues

ndash Franccedilais anglais italien

bull Un module de recherche avanceacutee

ndash exclure la recherche dans le texte inteacutegral

ndash ne pas tenir compte de la pertinence deacutefinie par deacutefaut (pondeacuteration des index)

ndash faciliter la recherche exacte

bull Calendrier fin septembre 2012

Quelles fonctionnaliteacutes demain dans thesesfr (2)

bull Des services accessibles sur authentificationndash paniersndash alerte mailndash hellip

bull Des services speacutecifiques pour les personnes reconnues comme eacutetant lrsquoauteur drsquoune thegravesendash mise en relation ecirctre contacteacute via thesesfrndash accegraves aux statistiques de sa page de thegravesendash hellip

bull Impossibiliteacute drsquooffrir de tels services pourles directeurs de thegravese

bull Calendrier fin 2012

Que trouvera-t-on demaindans thesesfr (1)

bull Toutes les donneacutees du Sudoc relatives aux thegraveses de doctorat franccedilaises soutenues depuis 1985

bull Toutes Non Celles qui passent avec succegraves lrsquoalgorithme de chargement qui a pour but de les laquo FRBriser raquo

bull Regroupement des notices Sudoc en familles composeacutees de ndash la notice megravere (la notice de la thegravese originelle telle que valideacutee par le

jury zone 105$m)

ndash Eacuteventuellement les notices enfants (les notices de reproduction zone 105$bv)

bull Chaque famille aura une page propre wwwthesesfrNNT

bull Conseacutequence pour thesesfr recherche de lrsquoexhaustiviteacute depuis 1985

bull Calendrier fin septembre 2012

Que trouvera-t-on demaindans thesesfr (2)

bull Toutes les donneacutees de TEL et lrsquoindexation du texte inteacutegral sous reacuteserve que le lien agrave la thegravese originelle ait eacuteteacute trouveacute

bull Principe chargement de toutes les donneacutees de TEL dans le Sudoc par moissonnage oai-pmh de TELndash Creacuteation de notices probablement assez pauvres (pas de liens

IdRef) mais avec lrsquoaccegraves au texte inteacutegral

bull Algorithme laquo FRBrisateur raquo de chargement dans thesesfrndash Si la notice megravere est trouveacutee ajout dans thesesfr de lrsquoaccegraves au

texte inteacutegral

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral sur le web

bull Calendrier fin 2012

Que trouvera-t-on demaindans thesesfr (3)

bull Des liens vers le catalogue des laquo thegraveses agrave la carte raquo de lrsquoANRT de Lille

bull Principe envoi reacutegulier (mensuel ) de la liste de NNTdisponibles dans laquo thegraveses agrave la carte raquo

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral avec la possibiliteacute de commander un fac-simileacute de la thegravese

bull Calendrier soumis aux contraintes de lrsquoANRT sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (4)

bull Les donneacutees de Theacutesa pour les thegraveses en preacuteparation au sein drsquoeacutetablissements relevant de la CGE et non utilisateurs de STEP

bull Principe envoi reacutegulier (mensuel ) des donneacutees par lrsquoINIST

bull Conseacutequence pour thesesfr recenser toutes les thegraveses en preacuteparation

bull Calendrier soumis aux contraintes de lrsquoINIST sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (5)

bull Des liens vers les donneacutees non-documentaires issus des partenaires associatifs du projet IntellirsquoAgence-ABG par exemplendash Cvthegraveque

ndash Offres drsquoemploi

ndash hellip

bull Conseacutequence pour thesesfr servir les docteurs et les doctorants au-delagrave de leur travail acadeacutemique

bull Calendrier soumis aux contraintes de lrsquo IntellirsquoAgence-ABG sans doute fin 2012

Journeacutees ABES ndash 20 juin 2012

Page 12: Tutoriel theses.fr : support pour diffusion sur le webQue trouve-t-on aujourd’hui dans theses.fr ? •Toutes les données validées dans STAR –Description de 11 397 thèses soutenues

Page de reacutesultats obtenue apregraves utilisation de lrsquoencart de recherche

Page de reacutesultats obtenue apregraves raffinement par la facette Etablissement

Page de la thegravese soutenue obtenue en cliquant sur le titre

Page drsquoun organisme obtenue en cliquant sur le nom de lrsquoorganisme

Page de la thegravese en preacuteparation obtenue en cliquant sur le titre

Page drsquoune personne obtenue en cliquant sur le nom de la personne

Les servicesbull Rebonds vers des applications du web 20 via AddThis

bull Recommandations

bull

ndash des flux ATOM par deacutefautbull thegraveses soutenues reacutecemment

bull soutenues reacutecemment accessibles en ligne

bull nouvelles thegraveses en preacuteparation

bull annonces de soutenance

ndash et des flux personnalisables flux de recherche

bullndash Zotero

ndash format txt

ndash format csv

ndash formats laquo machines raquo

Un service particulier

bull Rendre possible un cercle vertueux lrsquoutilisateur entre en contact avec le producteur pour signaler une erreur

16 7 10

9576

4558

6848

37 28

147154

0

20

40

60

80

100

120

140

160

180

200

juil-11 aoucirct-11 sept-11 oct-11 nov-11 deacutec-11 janv-12 feacutevr-12 mars-12 avr-12 mai-12

Assistance de thesesfr

signaler une erreur

ABESstp

bull Depuis avril 2012

bull Mail aucorrespondant STEP ou au correspondant STAR

Les donneacutees brutes

bull Ouvertes reacuteutilisables via une APIndash pour une liste de reacutesultats ajouter ampformat=xml ou

ampformat=json ou ampformat=atom ou ampformat=csv ou ampformat=txt en paramegravetre de lrsquourl de recherche

ndash pour une page finale ajouter xml (ou rdf ) agrave lrsquourl de la page

bull Ce principe permet drsquoajouter autant de formats que neacutecessaire

bull Exemple reacutecupeacuterer la description de la thegravese 2010MON30067

ndash dans lrsquointerfacendash en rdfxml

bull Exemple reacutecupeacuterer la liste de toutes les thegraveses soutenues agrave Toulouse 2 et accessibles en ligne dans lrsquoED Science du langage

ndash dans lrsquointerfacendash en xml (solr)ndash en json

thesesfr et Google

bull Description de toutes les pages de thesesfr dans un fichier sitemap pour faciliter lrsquoindexation des robots

bull 77 du trafic provient des moteurs de recherche

99 674

13 218

10 6710

20 000

40 000

60 000

80 000

100 000

120 000

Source de trafic (nb de visites)

trafic de recherche

sites reacutefeacuterents

acceacutes directs

77

14

9

Source de trafic ( du nb de visites)

juillet 2011-mai 2012

trafic de recherche

sites reacutefeacuterents

acceacutes directs

12 711

11 86815 961

61 815

73 306

66 891

91 055

95 25999 652

93 250

97 161

0

20 000

40 000

60 000

80 000

100 000

120 000

Visiteurs uniques

Quelques chiffres

86 810 75 383116 255

402 331399 129

349 976

427 499440 975

467 914

426 059

427 365

0

50 000

100 000

150 000

200 000

250 000

300 000

350 000

400 000

450 000

500 000

Pages vues

Plus de deacutetails

bull Le cercle vertueux de thesesfr mise en relation de lrsquoutilisateur et du producteur de donneacutees Punktokomo 10 avril 2012

bull thesesfr comment fonctionne lrsquoonglet laquo personnes raquo Punktokomo 19 janvier 2012

bull thesesfr lrsquoAPI XML de recherche Punktokomo 22 juillet 2011

bull thesesfr lrsquoAPI XML des personnes Punktokomo 12 juillet 2011

bull thesesfr lrsquoAPI XML des thegraveses Punktokomo 12 juillet 2011

bull thesesfr les technologies utiliseacutees Punktokomo 12 juillet 2011

UN PROJET DOTEacute DE MOYENS SPEacuteCIFIQUES JUSQUrsquoA FIN 2012

thesesfr les prochains deacuteveloppements

Quelles fonctionnaliteacutes demain dans thesesfr (1)

bull Une interface en trois langues

ndash Franccedilais anglais italien

bull Un module de recherche avanceacutee

ndash exclure la recherche dans le texte inteacutegral

ndash ne pas tenir compte de la pertinence deacutefinie par deacutefaut (pondeacuteration des index)

ndash faciliter la recherche exacte

bull Calendrier fin septembre 2012

Quelles fonctionnaliteacutes demain dans thesesfr (2)

bull Des services accessibles sur authentificationndash paniersndash alerte mailndash hellip

bull Des services speacutecifiques pour les personnes reconnues comme eacutetant lrsquoauteur drsquoune thegravesendash mise en relation ecirctre contacteacute via thesesfrndash accegraves aux statistiques de sa page de thegravesendash hellip

bull Impossibiliteacute drsquooffrir de tels services pourles directeurs de thegravese

bull Calendrier fin 2012

Que trouvera-t-on demaindans thesesfr (1)

bull Toutes les donneacutees du Sudoc relatives aux thegraveses de doctorat franccedilaises soutenues depuis 1985

bull Toutes Non Celles qui passent avec succegraves lrsquoalgorithme de chargement qui a pour but de les laquo FRBriser raquo

bull Regroupement des notices Sudoc en familles composeacutees de ndash la notice megravere (la notice de la thegravese originelle telle que valideacutee par le

jury zone 105$m)

ndash Eacuteventuellement les notices enfants (les notices de reproduction zone 105$bv)

bull Chaque famille aura une page propre wwwthesesfrNNT

bull Conseacutequence pour thesesfr recherche de lrsquoexhaustiviteacute depuis 1985

bull Calendrier fin septembre 2012

Que trouvera-t-on demaindans thesesfr (2)

bull Toutes les donneacutees de TEL et lrsquoindexation du texte inteacutegral sous reacuteserve que le lien agrave la thegravese originelle ait eacuteteacute trouveacute

bull Principe chargement de toutes les donneacutees de TEL dans le Sudoc par moissonnage oai-pmh de TELndash Creacuteation de notices probablement assez pauvres (pas de liens

IdRef) mais avec lrsquoaccegraves au texte inteacutegral

bull Algorithme laquo FRBrisateur raquo de chargement dans thesesfrndash Si la notice megravere est trouveacutee ajout dans thesesfr de lrsquoaccegraves au

texte inteacutegral

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral sur le web

bull Calendrier fin 2012

Que trouvera-t-on demaindans thesesfr (3)

bull Des liens vers le catalogue des laquo thegraveses agrave la carte raquo de lrsquoANRT de Lille

bull Principe envoi reacutegulier (mensuel ) de la liste de NNTdisponibles dans laquo thegraveses agrave la carte raquo

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral avec la possibiliteacute de commander un fac-simileacute de la thegravese

bull Calendrier soumis aux contraintes de lrsquoANRT sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (4)

bull Les donneacutees de Theacutesa pour les thegraveses en preacuteparation au sein drsquoeacutetablissements relevant de la CGE et non utilisateurs de STEP

bull Principe envoi reacutegulier (mensuel ) des donneacutees par lrsquoINIST

bull Conseacutequence pour thesesfr recenser toutes les thegraveses en preacuteparation

bull Calendrier soumis aux contraintes de lrsquoINIST sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (5)

bull Des liens vers les donneacutees non-documentaires issus des partenaires associatifs du projet IntellirsquoAgence-ABG par exemplendash Cvthegraveque

ndash Offres drsquoemploi

ndash hellip

bull Conseacutequence pour thesesfr servir les docteurs et les doctorants au-delagrave de leur travail acadeacutemique

bull Calendrier soumis aux contraintes de lrsquo IntellirsquoAgence-ABG sans doute fin 2012

Journeacutees ABES ndash 20 juin 2012

Page 13: Tutoriel theses.fr : support pour diffusion sur le webQue trouve-t-on aujourd’hui dans theses.fr ? •Toutes les données validées dans STAR –Description de 11 397 thèses soutenues

Page de reacutesultats obtenue apregraves raffinement par la facette Etablissement

Page de la thegravese soutenue obtenue en cliquant sur le titre

Page drsquoun organisme obtenue en cliquant sur le nom de lrsquoorganisme

Page de la thegravese en preacuteparation obtenue en cliquant sur le titre

Page drsquoune personne obtenue en cliquant sur le nom de la personne

Les servicesbull Rebonds vers des applications du web 20 via AddThis

bull Recommandations

bull

ndash des flux ATOM par deacutefautbull thegraveses soutenues reacutecemment

bull soutenues reacutecemment accessibles en ligne

bull nouvelles thegraveses en preacuteparation

bull annonces de soutenance

ndash et des flux personnalisables flux de recherche

bullndash Zotero

ndash format txt

ndash format csv

ndash formats laquo machines raquo

Un service particulier

bull Rendre possible un cercle vertueux lrsquoutilisateur entre en contact avec le producteur pour signaler une erreur

16 7 10

9576

4558

6848

37 28

147154

0

20

40

60

80

100

120

140

160

180

200

juil-11 aoucirct-11 sept-11 oct-11 nov-11 deacutec-11 janv-12 feacutevr-12 mars-12 avr-12 mai-12

Assistance de thesesfr

signaler une erreur

ABESstp

bull Depuis avril 2012

bull Mail aucorrespondant STEP ou au correspondant STAR

Les donneacutees brutes

bull Ouvertes reacuteutilisables via une APIndash pour une liste de reacutesultats ajouter ampformat=xml ou

ampformat=json ou ampformat=atom ou ampformat=csv ou ampformat=txt en paramegravetre de lrsquourl de recherche

ndash pour une page finale ajouter xml (ou rdf ) agrave lrsquourl de la page

bull Ce principe permet drsquoajouter autant de formats que neacutecessaire

bull Exemple reacutecupeacuterer la description de la thegravese 2010MON30067

ndash dans lrsquointerfacendash en rdfxml

bull Exemple reacutecupeacuterer la liste de toutes les thegraveses soutenues agrave Toulouse 2 et accessibles en ligne dans lrsquoED Science du langage

ndash dans lrsquointerfacendash en xml (solr)ndash en json

thesesfr et Google

bull Description de toutes les pages de thesesfr dans un fichier sitemap pour faciliter lrsquoindexation des robots

bull 77 du trafic provient des moteurs de recherche

99 674

13 218

10 6710

20 000

40 000

60 000

80 000

100 000

120 000

Source de trafic (nb de visites)

trafic de recherche

sites reacutefeacuterents

acceacutes directs

77

14

9

Source de trafic ( du nb de visites)

juillet 2011-mai 2012

trafic de recherche

sites reacutefeacuterents

acceacutes directs

12 711

11 86815 961

61 815

73 306

66 891

91 055

95 25999 652

93 250

97 161

0

20 000

40 000

60 000

80 000

100 000

120 000

Visiteurs uniques

Quelques chiffres

86 810 75 383116 255

402 331399 129

349 976

427 499440 975

467 914

426 059

427 365

0

50 000

100 000

150 000

200 000

250 000

300 000

350 000

400 000

450 000

500 000

Pages vues

Plus de deacutetails

bull Le cercle vertueux de thesesfr mise en relation de lrsquoutilisateur et du producteur de donneacutees Punktokomo 10 avril 2012

bull thesesfr comment fonctionne lrsquoonglet laquo personnes raquo Punktokomo 19 janvier 2012

bull thesesfr lrsquoAPI XML de recherche Punktokomo 22 juillet 2011

bull thesesfr lrsquoAPI XML des personnes Punktokomo 12 juillet 2011

bull thesesfr lrsquoAPI XML des thegraveses Punktokomo 12 juillet 2011

bull thesesfr les technologies utiliseacutees Punktokomo 12 juillet 2011

UN PROJET DOTEacute DE MOYENS SPEacuteCIFIQUES JUSQUrsquoA FIN 2012

thesesfr les prochains deacuteveloppements

Quelles fonctionnaliteacutes demain dans thesesfr (1)

bull Une interface en trois langues

ndash Franccedilais anglais italien

bull Un module de recherche avanceacutee

ndash exclure la recherche dans le texte inteacutegral

ndash ne pas tenir compte de la pertinence deacutefinie par deacutefaut (pondeacuteration des index)

ndash faciliter la recherche exacte

bull Calendrier fin septembre 2012

Quelles fonctionnaliteacutes demain dans thesesfr (2)

bull Des services accessibles sur authentificationndash paniersndash alerte mailndash hellip

bull Des services speacutecifiques pour les personnes reconnues comme eacutetant lrsquoauteur drsquoune thegravesendash mise en relation ecirctre contacteacute via thesesfrndash accegraves aux statistiques de sa page de thegravesendash hellip

bull Impossibiliteacute drsquooffrir de tels services pourles directeurs de thegravese

bull Calendrier fin 2012

Que trouvera-t-on demaindans thesesfr (1)

bull Toutes les donneacutees du Sudoc relatives aux thegraveses de doctorat franccedilaises soutenues depuis 1985

bull Toutes Non Celles qui passent avec succegraves lrsquoalgorithme de chargement qui a pour but de les laquo FRBriser raquo

bull Regroupement des notices Sudoc en familles composeacutees de ndash la notice megravere (la notice de la thegravese originelle telle que valideacutee par le

jury zone 105$m)

ndash Eacuteventuellement les notices enfants (les notices de reproduction zone 105$bv)

bull Chaque famille aura une page propre wwwthesesfrNNT

bull Conseacutequence pour thesesfr recherche de lrsquoexhaustiviteacute depuis 1985

bull Calendrier fin septembre 2012

Que trouvera-t-on demaindans thesesfr (2)

bull Toutes les donneacutees de TEL et lrsquoindexation du texte inteacutegral sous reacuteserve que le lien agrave la thegravese originelle ait eacuteteacute trouveacute

bull Principe chargement de toutes les donneacutees de TEL dans le Sudoc par moissonnage oai-pmh de TELndash Creacuteation de notices probablement assez pauvres (pas de liens

IdRef) mais avec lrsquoaccegraves au texte inteacutegral

bull Algorithme laquo FRBrisateur raquo de chargement dans thesesfrndash Si la notice megravere est trouveacutee ajout dans thesesfr de lrsquoaccegraves au

texte inteacutegral

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral sur le web

bull Calendrier fin 2012

Que trouvera-t-on demaindans thesesfr (3)

bull Des liens vers le catalogue des laquo thegraveses agrave la carte raquo de lrsquoANRT de Lille

bull Principe envoi reacutegulier (mensuel ) de la liste de NNTdisponibles dans laquo thegraveses agrave la carte raquo

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral avec la possibiliteacute de commander un fac-simileacute de la thegravese

bull Calendrier soumis aux contraintes de lrsquoANRT sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (4)

bull Les donneacutees de Theacutesa pour les thegraveses en preacuteparation au sein drsquoeacutetablissements relevant de la CGE et non utilisateurs de STEP

bull Principe envoi reacutegulier (mensuel ) des donneacutees par lrsquoINIST

bull Conseacutequence pour thesesfr recenser toutes les thegraveses en preacuteparation

bull Calendrier soumis aux contraintes de lrsquoINIST sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (5)

bull Des liens vers les donneacutees non-documentaires issus des partenaires associatifs du projet IntellirsquoAgence-ABG par exemplendash Cvthegraveque

ndash Offres drsquoemploi

ndash hellip

bull Conseacutequence pour thesesfr servir les docteurs et les doctorants au-delagrave de leur travail acadeacutemique

bull Calendrier soumis aux contraintes de lrsquo IntellirsquoAgence-ABG sans doute fin 2012

Journeacutees ABES ndash 20 juin 2012

Page 14: Tutoriel theses.fr : support pour diffusion sur le webQue trouve-t-on aujourd’hui dans theses.fr ? •Toutes les données validées dans STAR –Description de 11 397 thèses soutenues

Page de la thegravese soutenue obtenue en cliquant sur le titre

Page drsquoun organisme obtenue en cliquant sur le nom de lrsquoorganisme

Page de la thegravese en preacuteparation obtenue en cliquant sur le titre

Page drsquoune personne obtenue en cliquant sur le nom de la personne

Les servicesbull Rebonds vers des applications du web 20 via AddThis

bull Recommandations

bull

ndash des flux ATOM par deacutefautbull thegraveses soutenues reacutecemment

bull soutenues reacutecemment accessibles en ligne

bull nouvelles thegraveses en preacuteparation

bull annonces de soutenance

ndash et des flux personnalisables flux de recherche

bullndash Zotero

ndash format txt

ndash format csv

ndash formats laquo machines raquo

Un service particulier

bull Rendre possible un cercle vertueux lrsquoutilisateur entre en contact avec le producteur pour signaler une erreur

16 7 10

9576

4558

6848

37 28

147154

0

20

40

60

80

100

120

140

160

180

200

juil-11 aoucirct-11 sept-11 oct-11 nov-11 deacutec-11 janv-12 feacutevr-12 mars-12 avr-12 mai-12

Assistance de thesesfr

signaler une erreur

ABESstp

bull Depuis avril 2012

bull Mail aucorrespondant STEP ou au correspondant STAR

Les donneacutees brutes

bull Ouvertes reacuteutilisables via une APIndash pour une liste de reacutesultats ajouter ampformat=xml ou

ampformat=json ou ampformat=atom ou ampformat=csv ou ampformat=txt en paramegravetre de lrsquourl de recherche

ndash pour une page finale ajouter xml (ou rdf ) agrave lrsquourl de la page

bull Ce principe permet drsquoajouter autant de formats que neacutecessaire

bull Exemple reacutecupeacuterer la description de la thegravese 2010MON30067

ndash dans lrsquointerfacendash en rdfxml

bull Exemple reacutecupeacuterer la liste de toutes les thegraveses soutenues agrave Toulouse 2 et accessibles en ligne dans lrsquoED Science du langage

ndash dans lrsquointerfacendash en xml (solr)ndash en json

thesesfr et Google

bull Description de toutes les pages de thesesfr dans un fichier sitemap pour faciliter lrsquoindexation des robots

bull 77 du trafic provient des moteurs de recherche

99 674

13 218

10 6710

20 000

40 000

60 000

80 000

100 000

120 000

Source de trafic (nb de visites)

trafic de recherche

sites reacutefeacuterents

acceacutes directs

77

14

9

Source de trafic ( du nb de visites)

juillet 2011-mai 2012

trafic de recherche

sites reacutefeacuterents

acceacutes directs

12 711

11 86815 961

61 815

73 306

66 891

91 055

95 25999 652

93 250

97 161

0

20 000

40 000

60 000

80 000

100 000

120 000

Visiteurs uniques

Quelques chiffres

86 810 75 383116 255

402 331399 129

349 976

427 499440 975

467 914

426 059

427 365

0

50 000

100 000

150 000

200 000

250 000

300 000

350 000

400 000

450 000

500 000

Pages vues

Plus de deacutetails

bull Le cercle vertueux de thesesfr mise en relation de lrsquoutilisateur et du producteur de donneacutees Punktokomo 10 avril 2012

bull thesesfr comment fonctionne lrsquoonglet laquo personnes raquo Punktokomo 19 janvier 2012

bull thesesfr lrsquoAPI XML de recherche Punktokomo 22 juillet 2011

bull thesesfr lrsquoAPI XML des personnes Punktokomo 12 juillet 2011

bull thesesfr lrsquoAPI XML des thegraveses Punktokomo 12 juillet 2011

bull thesesfr les technologies utiliseacutees Punktokomo 12 juillet 2011

UN PROJET DOTEacute DE MOYENS SPEacuteCIFIQUES JUSQUrsquoA FIN 2012

thesesfr les prochains deacuteveloppements

Quelles fonctionnaliteacutes demain dans thesesfr (1)

bull Une interface en trois langues

ndash Franccedilais anglais italien

bull Un module de recherche avanceacutee

ndash exclure la recherche dans le texte inteacutegral

ndash ne pas tenir compte de la pertinence deacutefinie par deacutefaut (pondeacuteration des index)

ndash faciliter la recherche exacte

bull Calendrier fin septembre 2012

Quelles fonctionnaliteacutes demain dans thesesfr (2)

bull Des services accessibles sur authentificationndash paniersndash alerte mailndash hellip

bull Des services speacutecifiques pour les personnes reconnues comme eacutetant lrsquoauteur drsquoune thegravesendash mise en relation ecirctre contacteacute via thesesfrndash accegraves aux statistiques de sa page de thegravesendash hellip

bull Impossibiliteacute drsquooffrir de tels services pourles directeurs de thegravese

bull Calendrier fin 2012

Que trouvera-t-on demaindans thesesfr (1)

bull Toutes les donneacutees du Sudoc relatives aux thegraveses de doctorat franccedilaises soutenues depuis 1985

bull Toutes Non Celles qui passent avec succegraves lrsquoalgorithme de chargement qui a pour but de les laquo FRBriser raquo

bull Regroupement des notices Sudoc en familles composeacutees de ndash la notice megravere (la notice de la thegravese originelle telle que valideacutee par le

jury zone 105$m)

ndash Eacuteventuellement les notices enfants (les notices de reproduction zone 105$bv)

bull Chaque famille aura une page propre wwwthesesfrNNT

bull Conseacutequence pour thesesfr recherche de lrsquoexhaustiviteacute depuis 1985

bull Calendrier fin septembre 2012

Que trouvera-t-on demaindans thesesfr (2)

bull Toutes les donneacutees de TEL et lrsquoindexation du texte inteacutegral sous reacuteserve que le lien agrave la thegravese originelle ait eacuteteacute trouveacute

bull Principe chargement de toutes les donneacutees de TEL dans le Sudoc par moissonnage oai-pmh de TELndash Creacuteation de notices probablement assez pauvres (pas de liens

IdRef) mais avec lrsquoaccegraves au texte inteacutegral

bull Algorithme laquo FRBrisateur raquo de chargement dans thesesfrndash Si la notice megravere est trouveacutee ajout dans thesesfr de lrsquoaccegraves au

texte inteacutegral

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral sur le web

bull Calendrier fin 2012

Que trouvera-t-on demaindans thesesfr (3)

bull Des liens vers le catalogue des laquo thegraveses agrave la carte raquo de lrsquoANRT de Lille

bull Principe envoi reacutegulier (mensuel ) de la liste de NNTdisponibles dans laquo thegraveses agrave la carte raquo

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral avec la possibiliteacute de commander un fac-simileacute de la thegravese

bull Calendrier soumis aux contraintes de lrsquoANRT sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (4)

bull Les donneacutees de Theacutesa pour les thegraveses en preacuteparation au sein drsquoeacutetablissements relevant de la CGE et non utilisateurs de STEP

bull Principe envoi reacutegulier (mensuel ) des donneacutees par lrsquoINIST

bull Conseacutequence pour thesesfr recenser toutes les thegraveses en preacuteparation

bull Calendrier soumis aux contraintes de lrsquoINIST sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (5)

bull Des liens vers les donneacutees non-documentaires issus des partenaires associatifs du projet IntellirsquoAgence-ABG par exemplendash Cvthegraveque

ndash Offres drsquoemploi

ndash hellip

bull Conseacutequence pour thesesfr servir les docteurs et les doctorants au-delagrave de leur travail acadeacutemique

bull Calendrier soumis aux contraintes de lrsquo IntellirsquoAgence-ABG sans doute fin 2012

Journeacutees ABES ndash 20 juin 2012

Page 15: Tutoriel theses.fr : support pour diffusion sur le webQue trouve-t-on aujourd’hui dans theses.fr ? •Toutes les données validées dans STAR –Description de 11 397 thèses soutenues

Page drsquoun organisme obtenue en cliquant sur le nom de lrsquoorganisme

Page de la thegravese en preacuteparation obtenue en cliquant sur le titre

Page drsquoune personne obtenue en cliquant sur le nom de la personne

Les servicesbull Rebonds vers des applications du web 20 via AddThis

bull Recommandations

bull

ndash des flux ATOM par deacutefautbull thegraveses soutenues reacutecemment

bull soutenues reacutecemment accessibles en ligne

bull nouvelles thegraveses en preacuteparation

bull annonces de soutenance

ndash et des flux personnalisables flux de recherche

bullndash Zotero

ndash format txt

ndash format csv

ndash formats laquo machines raquo

Un service particulier

bull Rendre possible un cercle vertueux lrsquoutilisateur entre en contact avec le producteur pour signaler une erreur

16 7 10

9576

4558

6848

37 28

147154

0

20

40

60

80

100

120

140

160

180

200

juil-11 aoucirct-11 sept-11 oct-11 nov-11 deacutec-11 janv-12 feacutevr-12 mars-12 avr-12 mai-12

Assistance de thesesfr

signaler une erreur

ABESstp

bull Depuis avril 2012

bull Mail aucorrespondant STEP ou au correspondant STAR

Les donneacutees brutes

bull Ouvertes reacuteutilisables via une APIndash pour une liste de reacutesultats ajouter ampformat=xml ou

ampformat=json ou ampformat=atom ou ampformat=csv ou ampformat=txt en paramegravetre de lrsquourl de recherche

ndash pour une page finale ajouter xml (ou rdf ) agrave lrsquourl de la page

bull Ce principe permet drsquoajouter autant de formats que neacutecessaire

bull Exemple reacutecupeacuterer la description de la thegravese 2010MON30067

ndash dans lrsquointerfacendash en rdfxml

bull Exemple reacutecupeacuterer la liste de toutes les thegraveses soutenues agrave Toulouse 2 et accessibles en ligne dans lrsquoED Science du langage

ndash dans lrsquointerfacendash en xml (solr)ndash en json

thesesfr et Google

bull Description de toutes les pages de thesesfr dans un fichier sitemap pour faciliter lrsquoindexation des robots

bull 77 du trafic provient des moteurs de recherche

99 674

13 218

10 6710

20 000

40 000

60 000

80 000

100 000

120 000

Source de trafic (nb de visites)

trafic de recherche

sites reacutefeacuterents

acceacutes directs

77

14

9

Source de trafic ( du nb de visites)

juillet 2011-mai 2012

trafic de recherche

sites reacutefeacuterents

acceacutes directs

12 711

11 86815 961

61 815

73 306

66 891

91 055

95 25999 652

93 250

97 161

0

20 000

40 000

60 000

80 000

100 000

120 000

Visiteurs uniques

Quelques chiffres

86 810 75 383116 255

402 331399 129

349 976

427 499440 975

467 914

426 059

427 365

0

50 000

100 000

150 000

200 000

250 000

300 000

350 000

400 000

450 000

500 000

Pages vues

Plus de deacutetails

bull Le cercle vertueux de thesesfr mise en relation de lrsquoutilisateur et du producteur de donneacutees Punktokomo 10 avril 2012

bull thesesfr comment fonctionne lrsquoonglet laquo personnes raquo Punktokomo 19 janvier 2012

bull thesesfr lrsquoAPI XML de recherche Punktokomo 22 juillet 2011

bull thesesfr lrsquoAPI XML des personnes Punktokomo 12 juillet 2011

bull thesesfr lrsquoAPI XML des thegraveses Punktokomo 12 juillet 2011

bull thesesfr les technologies utiliseacutees Punktokomo 12 juillet 2011

UN PROJET DOTEacute DE MOYENS SPEacuteCIFIQUES JUSQUrsquoA FIN 2012

thesesfr les prochains deacuteveloppements

Quelles fonctionnaliteacutes demain dans thesesfr (1)

bull Une interface en trois langues

ndash Franccedilais anglais italien

bull Un module de recherche avanceacutee

ndash exclure la recherche dans le texte inteacutegral

ndash ne pas tenir compte de la pertinence deacutefinie par deacutefaut (pondeacuteration des index)

ndash faciliter la recherche exacte

bull Calendrier fin septembre 2012

Quelles fonctionnaliteacutes demain dans thesesfr (2)

bull Des services accessibles sur authentificationndash paniersndash alerte mailndash hellip

bull Des services speacutecifiques pour les personnes reconnues comme eacutetant lrsquoauteur drsquoune thegravesendash mise en relation ecirctre contacteacute via thesesfrndash accegraves aux statistiques de sa page de thegravesendash hellip

bull Impossibiliteacute drsquooffrir de tels services pourles directeurs de thegravese

bull Calendrier fin 2012

Que trouvera-t-on demaindans thesesfr (1)

bull Toutes les donneacutees du Sudoc relatives aux thegraveses de doctorat franccedilaises soutenues depuis 1985

bull Toutes Non Celles qui passent avec succegraves lrsquoalgorithme de chargement qui a pour but de les laquo FRBriser raquo

bull Regroupement des notices Sudoc en familles composeacutees de ndash la notice megravere (la notice de la thegravese originelle telle que valideacutee par le

jury zone 105$m)

ndash Eacuteventuellement les notices enfants (les notices de reproduction zone 105$bv)

bull Chaque famille aura une page propre wwwthesesfrNNT

bull Conseacutequence pour thesesfr recherche de lrsquoexhaustiviteacute depuis 1985

bull Calendrier fin septembre 2012

Que trouvera-t-on demaindans thesesfr (2)

bull Toutes les donneacutees de TEL et lrsquoindexation du texte inteacutegral sous reacuteserve que le lien agrave la thegravese originelle ait eacuteteacute trouveacute

bull Principe chargement de toutes les donneacutees de TEL dans le Sudoc par moissonnage oai-pmh de TELndash Creacuteation de notices probablement assez pauvres (pas de liens

IdRef) mais avec lrsquoaccegraves au texte inteacutegral

bull Algorithme laquo FRBrisateur raquo de chargement dans thesesfrndash Si la notice megravere est trouveacutee ajout dans thesesfr de lrsquoaccegraves au

texte inteacutegral

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral sur le web

bull Calendrier fin 2012

Que trouvera-t-on demaindans thesesfr (3)

bull Des liens vers le catalogue des laquo thegraveses agrave la carte raquo de lrsquoANRT de Lille

bull Principe envoi reacutegulier (mensuel ) de la liste de NNTdisponibles dans laquo thegraveses agrave la carte raquo

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral avec la possibiliteacute de commander un fac-simileacute de la thegravese

bull Calendrier soumis aux contraintes de lrsquoANRT sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (4)

bull Les donneacutees de Theacutesa pour les thegraveses en preacuteparation au sein drsquoeacutetablissements relevant de la CGE et non utilisateurs de STEP

bull Principe envoi reacutegulier (mensuel ) des donneacutees par lrsquoINIST

bull Conseacutequence pour thesesfr recenser toutes les thegraveses en preacuteparation

bull Calendrier soumis aux contraintes de lrsquoINIST sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (5)

bull Des liens vers les donneacutees non-documentaires issus des partenaires associatifs du projet IntellirsquoAgence-ABG par exemplendash Cvthegraveque

ndash Offres drsquoemploi

ndash hellip

bull Conseacutequence pour thesesfr servir les docteurs et les doctorants au-delagrave de leur travail acadeacutemique

bull Calendrier soumis aux contraintes de lrsquo IntellirsquoAgence-ABG sans doute fin 2012

Journeacutees ABES ndash 20 juin 2012

Page 16: Tutoriel theses.fr : support pour diffusion sur le webQue trouve-t-on aujourd’hui dans theses.fr ? •Toutes les données validées dans STAR –Description de 11 397 thèses soutenues

Page de la thegravese en preacuteparation obtenue en cliquant sur le titre

Page drsquoune personne obtenue en cliquant sur le nom de la personne

Les servicesbull Rebonds vers des applications du web 20 via AddThis

bull Recommandations

bull

ndash des flux ATOM par deacutefautbull thegraveses soutenues reacutecemment

bull soutenues reacutecemment accessibles en ligne

bull nouvelles thegraveses en preacuteparation

bull annonces de soutenance

ndash et des flux personnalisables flux de recherche

bullndash Zotero

ndash format txt

ndash format csv

ndash formats laquo machines raquo

Un service particulier

bull Rendre possible un cercle vertueux lrsquoutilisateur entre en contact avec le producteur pour signaler une erreur

16 7 10

9576

4558

6848

37 28

147154

0

20

40

60

80

100

120

140

160

180

200

juil-11 aoucirct-11 sept-11 oct-11 nov-11 deacutec-11 janv-12 feacutevr-12 mars-12 avr-12 mai-12

Assistance de thesesfr

signaler une erreur

ABESstp

bull Depuis avril 2012

bull Mail aucorrespondant STEP ou au correspondant STAR

Les donneacutees brutes

bull Ouvertes reacuteutilisables via une APIndash pour une liste de reacutesultats ajouter ampformat=xml ou

ampformat=json ou ampformat=atom ou ampformat=csv ou ampformat=txt en paramegravetre de lrsquourl de recherche

ndash pour une page finale ajouter xml (ou rdf ) agrave lrsquourl de la page

bull Ce principe permet drsquoajouter autant de formats que neacutecessaire

bull Exemple reacutecupeacuterer la description de la thegravese 2010MON30067

ndash dans lrsquointerfacendash en rdfxml

bull Exemple reacutecupeacuterer la liste de toutes les thegraveses soutenues agrave Toulouse 2 et accessibles en ligne dans lrsquoED Science du langage

ndash dans lrsquointerfacendash en xml (solr)ndash en json

thesesfr et Google

bull Description de toutes les pages de thesesfr dans un fichier sitemap pour faciliter lrsquoindexation des robots

bull 77 du trafic provient des moteurs de recherche

99 674

13 218

10 6710

20 000

40 000

60 000

80 000

100 000

120 000

Source de trafic (nb de visites)

trafic de recherche

sites reacutefeacuterents

acceacutes directs

77

14

9

Source de trafic ( du nb de visites)

juillet 2011-mai 2012

trafic de recherche

sites reacutefeacuterents

acceacutes directs

12 711

11 86815 961

61 815

73 306

66 891

91 055

95 25999 652

93 250

97 161

0

20 000

40 000

60 000

80 000

100 000

120 000

Visiteurs uniques

Quelques chiffres

86 810 75 383116 255

402 331399 129

349 976

427 499440 975

467 914

426 059

427 365

0

50 000

100 000

150 000

200 000

250 000

300 000

350 000

400 000

450 000

500 000

Pages vues

Plus de deacutetails

bull Le cercle vertueux de thesesfr mise en relation de lrsquoutilisateur et du producteur de donneacutees Punktokomo 10 avril 2012

bull thesesfr comment fonctionne lrsquoonglet laquo personnes raquo Punktokomo 19 janvier 2012

bull thesesfr lrsquoAPI XML de recherche Punktokomo 22 juillet 2011

bull thesesfr lrsquoAPI XML des personnes Punktokomo 12 juillet 2011

bull thesesfr lrsquoAPI XML des thegraveses Punktokomo 12 juillet 2011

bull thesesfr les technologies utiliseacutees Punktokomo 12 juillet 2011

UN PROJET DOTEacute DE MOYENS SPEacuteCIFIQUES JUSQUrsquoA FIN 2012

thesesfr les prochains deacuteveloppements

Quelles fonctionnaliteacutes demain dans thesesfr (1)

bull Une interface en trois langues

ndash Franccedilais anglais italien

bull Un module de recherche avanceacutee

ndash exclure la recherche dans le texte inteacutegral

ndash ne pas tenir compte de la pertinence deacutefinie par deacutefaut (pondeacuteration des index)

ndash faciliter la recherche exacte

bull Calendrier fin septembre 2012

Quelles fonctionnaliteacutes demain dans thesesfr (2)

bull Des services accessibles sur authentificationndash paniersndash alerte mailndash hellip

bull Des services speacutecifiques pour les personnes reconnues comme eacutetant lrsquoauteur drsquoune thegravesendash mise en relation ecirctre contacteacute via thesesfrndash accegraves aux statistiques de sa page de thegravesendash hellip

bull Impossibiliteacute drsquooffrir de tels services pourles directeurs de thegravese

bull Calendrier fin 2012

Que trouvera-t-on demaindans thesesfr (1)

bull Toutes les donneacutees du Sudoc relatives aux thegraveses de doctorat franccedilaises soutenues depuis 1985

bull Toutes Non Celles qui passent avec succegraves lrsquoalgorithme de chargement qui a pour but de les laquo FRBriser raquo

bull Regroupement des notices Sudoc en familles composeacutees de ndash la notice megravere (la notice de la thegravese originelle telle que valideacutee par le

jury zone 105$m)

ndash Eacuteventuellement les notices enfants (les notices de reproduction zone 105$bv)

bull Chaque famille aura une page propre wwwthesesfrNNT

bull Conseacutequence pour thesesfr recherche de lrsquoexhaustiviteacute depuis 1985

bull Calendrier fin septembre 2012

Que trouvera-t-on demaindans thesesfr (2)

bull Toutes les donneacutees de TEL et lrsquoindexation du texte inteacutegral sous reacuteserve que le lien agrave la thegravese originelle ait eacuteteacute trouveacute

bull Principe chargement de toutes les donneacutees de TEL dans le Sudoc par moissonnage oai-pmh de TELndash Creacuteation de notices probablement assez pauvres (pas de liens

IdRef) mais avec lrsquoaccegraves au texte inteacutegral

bull Algorithme laquo FRBrisateur raquo de chargement dans thesesfrndash Si la notice megravere est trouveacutee ajout dans thesesfr de lrsquoaccegraves au

texte inteacutegral

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral sur le web

bull Calendrier fin 2012

Que trouvera-t-on demaindans thesesfr (3)

bull Des liens vers le catalogue des laquo thegraveses agrave la carte raquo de lrsquoANRT de Lille

bull Principe envoi reacutegulier (mensuel ) de la liste de NNTdisponibles dans laquo thegraveses agrave la carte raquo

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral avec la possibiliteacute de commander un fac-simileacute de la thegravese

bull Calendrier soumis aux contraintes de lrsquoANRT sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (4)

bull Les donneacutees de Theacutesa pour les thegraveses en preacuteparation au sein drsquoeacutetablissements relevant de la CGE et non utilisateurs de STEP

bull Principe envoi reacutegulier (mensuel ) des donneacutees par lrsquoINIST

bull Conseacutequence pour thesesfr recenser toutes les thegraveses en preacuteparation

bull Calendrier soumis aux contraintes de lrsquoINIST sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (5)

bull Des liens vers les donneacutees non-documentaires issus des partenaires associatifs du projet IntellirsquoAgence-ABG par exemplendash Cvthegraveque

ndash Offres drsquoemploi

ndash hellip

bull Conseacutequence pour thesesfr servir les docteurs et les doctorants au-delagrave de leur travail acadeacutemique

bull Calendrier soumis aux contraintes de lrsquo IntellirsquoAgence-ABG sans doute fin 2012

Journeacutees ABES ndash 20 juin 2012

Page 17: Tutoriel theses.fr : support pour diffusion sur le webQue trouve-t-on aujourd’hui dans theses.fr ? •Toutes les données validées dans STAR –Description de 11 397 thèses soutenues

Page drsquoune personne obtenue en cliquant sur le nom de la personne

Les servicesbull Rebonds vers des applications du web 20 via AddThis

bull Recommandations

bull

ndash des flux ATOM par deacutefautbull thegraveses soutenues reacutecemment

bull soutenues reacutecemment accessibles en ligne

bull nouvelles thegraveses en preacuteparation

bull annonces de soutenance

ndash et des flux personnalisables flux de recherche

bullndash Zotero

ndash format txt

ndash format csv

ndash formats laquo machines raquo

Un service particulier

bull Rendre possible un cercle vertueux lrsquoutilisateur entre en contact avec le producteur pour signaler une erreur

16 7 10

9576

4558

6848

37 28

147154

0

20

40

60

80

100

120

140

160

180

200

juil-11 aoucirct-11 sept-11 oct-11 nov-11 deacutec-11 janv-12 feacutevr-12 mars-12 avr-12 mai-12

Assistance de thesesfr

signaler une erreur

ABESstp

bull Depuis avril 2012

bull Mail aucorrespondant STEP ou au correspondant STAR

Les donneacutees brutes

bull Ouvertes reacuteutilisables via une APIndash pour une liste de reacutesultats ajouter ampformat=xml ou

ampformat=json ou ampformat=atom ou ampformat=csv ou ampformat=txt en paramegravetre de lrsquourl de recherche

ndash pour une page finale ajouter xml (ou rdf ) agrave lrsquourl de la page

bull Ce principe permet drsquoajouter autant de formats que neacutecessaire

bull Exemple reacutecupeacuterer la description de la thegravese 2010MON30067

ndash dans lrsquointerfacendash en rdfxml

bull Exemple reacutecupeacuterer la liste de toutes les thegraveses soutenues agrave Toulouse 2 et accessibles en ligne dans lrsquoED Science du langage

ndash dans lrsquointerfacendash en xml (solr)ndash en json

thesesfr et Google

bull Description de toutes les pages de thesesfr dans un fichier sitemap pour faciliter lrsquoindexation des robots

bull 77 du trafic provient des moteurs de recherche

99 674

13 218

10 6710

20 000

40 000

60 000

80 000

100 000

120 000

Source de trafic (nb de visites)

trafic de recherche

sites reacutefeacuterents

acceacutes directs

77

14

9

Source de trafic ( du nb de visites)

juillet 2011-mai 2012

trafic de recherche

sites reacutefeacuterents

acceacutes directs

12 711

11 86815 961

61 815

73 306

66 891

91 055

95 25999 652

93 250

97 161

0

20 000

40 000

60 000

80 000

100 000

120 000

Visiteurs uniques

Quelques chiffres

86 810 75 383116 255

402 331399 129

349 976

427 499440 975

467 914

426 059

427 365

0

50 000

100 000

150 000

200 000

250 000

300 000

350 000

400 000

450 000

500 000

Pages vues

Plus de deacutetails

bull Le cercle vertueux de thesesfr mise en relation de lrsquoutilisateur et du producteur de donneacutees Punktokomo 10 avril 2012

bull thesesfr comment fonctionne lrsquoonglet laquo personnes raquo Punktokomo 19 janvier 2012

bull thesesfr lrsquoAPI XML de recherche Punktokomo 22 juillet 2011

bull thesesfr lrsquoAPI XML des personnes Punktokomo 12 juillet 2011

bull thesesfr lrsquoAPI XML des thegraveses Punktokomo 12 juillet 2011

bull thesesfr les technologies utiliseacutees Punktokomo 12 juillet 2011

UN PROJET DOTEacute DE MOYENS SPEacuteCIFIQUES JUSQUrsquoA FIN 2012

thesesfr les prochains deacuteveloppements

Quelles fonctionnaliteacutes demain dans thesesfr (1)

bull Une interface en trois langues

ndash Franccedilais anglais italien

bull Un module de recherche avanceacutee

ndash exclure la recherche dans le texte inteacutegral

ndash ne pas tenir compte de la pertinence deacutefinie par deacutefaut (pondeacuteration des index)

ndash faciliter la recherche exacte

bull Calendrier fin septembre 2012

Quelles fonctionnaliteacutes demain dans thesesfr (2)

bull Des services accessibles sur authentificationndash paniersndash alerte mailndash hellip

bull Des services speacutecifiques pour les personnes reconnues comme eacutetant lrsquoauteur drsquoune thegravesendash mise en relation ecirctre contacteacute via thesesfrndash accegraves aux statistiques de sa page de thegravesendash hellip

bull Impossibiliteacute drsquooffrir de tels services pourles directeurs de thegravese

bull Calendrier fin 2012

Que trouvera-t-on demaindans thesesfr (1)

bull Toutes les donneacutees du Sudoc relatives aux thegraveses de doctorat franccedilaises soutenues depuis 1985

bull Toutes Non Celles qui passent avec succegraves lrsquoalgorithme de chargement qui a pour but de les laquo FRBriser raquo

bull Regroupement des notices Sudoc en familles composeacutees de ndash la notice megravere (la notice de la thegravese originelle telle que valideacutee par le

jury zone 105$m)

ndash Eacuteventuellement les notices enfants (les notices de reproduction zone 105$bv)

bull Chaque famille aura une page propre wwwthesesfrNNT

bull Conseacutequence pour thesesfr recherche de lrsquoexhaustiviteacute depuis 1985

bull Calendrier fin septembre 2012

Que trouvera-t-on demaindans thesesfr (2)

bull Toutes les donneacutees de TEL et lrsquoindexation du texte inteacutegral sous reacuteserve que le lien agrave la thegravese originelle ait eacuteteacute trouveacute

bull Principe chargement de toutes les donneacutees de TEL dans le Sudoc par moissonnage oai-pmh de TELndash Creacuteation de notices probablement assez pauvres (pas de liens

IdRef) mais avec lrsquoaccegraves au texte inteacutegral

bull Algorithme laquo FRBrisateur raquo de chargement dans thesesfrndash Si la notice megravere est trouveacutee ajout dans thesesfr de lrsquoaccegraves au

texte inteacutegral

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral sur le web

bull Calendrier fin 2012

Que trouvera-t-on demaindans thesesfr (3)

bull Des liens vers le catalogue des laquo thegraveses agrave la carte raquo de lrsquoANRT de Lille

bull Principe envoi reacutegulier (mensuel ) de la liste de NNTdisponibles dans laquo thegraveses agrave la carte raquo

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral avec la possibiliteacute de commander un fac-simileacute de la thegravese

bull Calendrier soumis aux contraintes de lrsquoANRT sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (4)

bull Les donneacutees de Theacutesa pour les thegraveses en preacuteparation au sein drsquoeacutetablissements relevant de la CGE et non utilisateurs de STEP

bull Principe envoi reacutegulier (mensuel ) des donneacutees par lrsquoINIST

bull Conseacutequence pour thesesfr recenser toutes les thegraveses en preacuteparation

bull Calendrier soumis aux contraintes de lrsquoINIST sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (5)

bull Des liens vers les donneacutees non-documentaires issus des partenaires associatifs du projet IntellirsquoAgence-ABG par exemplendash Cvthegraveque

ndash Offres drsquoemploi

ndash hellip

bull Conseacutequence pour thesesfr servir les docteurs et les doctorants au-delagrave de leur travail acadeacutemique

bull Calendrier soumis aux contraintes de lrsquo IntellirsquoAgence-ABG sans doute fin 2012

Journeacutees ABES ndash 20 juin 2012

Page 18: Tutoriel theses.fr : support pour diffusion sur le webQue trouve-t-on aujourd’hui dans theses.fr ? •Toutes les données validées dans STAR –Description de 11 397 thèses soutenues

Les servicesbull Rebonds vers des applications du web 20 via AddThis

bull Recommandations

bull

ndash des flux ATOM par deacutefautbull thegraveses soutenues reacutecemment

bull soutenues reacutecemment accessibles en ligne

bull nouvelles thegraveses en preacuteparation

bull annonces de soutenance

ndash et des flux personnalisables flux de recherche

bullndash Zotero

ndash format txt

ndash format csv

ndash formats laquo machines raquo

Un service particulier

bull Rendre possible un cercle vertueux lrsquoutilisateur entre en contact avec le producteur pour signaler une erreur

16 7 10

9576

4558

6848

37 28

147154

0

20

40

60

80

100

120

140

160

180

200

juil-11 aoucirct-11 sept-11 oct-11 nov-11 deacutec-11 janv-12 feacutevr-12 mars-12 avr-12 mai-12

Assistance de thesesfr

signaler une erreur

ABESstp

bull Depuis avril 2012

bull Mail aucorrespondant STEP ou au correspondant STAR

Les donneacutees brutes

bull Ouvertes reacuteutilisables via une APIndash pour une liste de reacutesultats ajouter ampformat=xml ou

ampformat=json ou ampformat=atom ou ampformat=csv ou ampformat=txt en paramegravetre de lrsquourl de recherche

ndash pour une page finale ajouter xml (ou rdf ) agrave lrsquourl de la page

bull Ce principe permet drsquoajouter autant de formats que neacutecessaire

bull Exemple reacutecupeacuterer la description de la thegravese 2010MON30067

ndash dans lrsquointerfacendash en rdfxml

bull Exemple reacutecupeacuterer la liste de toutes les thegraveses soutenues agrave Toulouse 2 et accessibles en ligne dans lrsquoED Science du langage

ndash dans lrsquointerfacendash en xml (solr)ndash en json

thesesfr et Google

bull Description de toutes les pages de thesesfr dans un fichier sitemap pour faciliter lrsquoindexation des robots

bull 77 du trafic provient des moteurs de recherche

99 674

13 218

10 6710

20 000

40 000

60 000

80 000

100 000

120 000

Source de trafic (nb de visites)

trafic de recherche

sites reacutefeacuterents

acceacutes directs

77

14

9

Source de trafic ( du nb de visites)

juillet 2011-mai 2012

trafic de recherche

sites reacutefeacuterents

acceacutes directs

12 711

11 86815 961

61 815

73 306

66 891

91 055

95 25999 652

93 250

97 161

0

20 000

40 000

60 000

80 000

100 000

120 000

Visiteurs uniques

Quelques chiffres

86 810 75 383116 255

402 331399 129

349 976

427 499440 975

467 914

426 059

427 365

0

50 000

100 000

150 000

200 000

250 000

300 000

350 000

400 000

450 000

500 000

Pages vues

Plus de deacutetails

bull Le cercle vertueux de thesesfr mise en relation de lrsquoutilisateur et du producteur de donneacutees Punktokomo 10 avril 2012

bull thesesfr comment fonctionne lrsquoonglet laquo personnes raquo Punktokomo 19 janvier 2012

bull thesesfr lrsquoAPI XML de recherche Punktokomo 22 juillet 2011

bull thesesfr lrsquoAPI XML des personnes Punktokomo 12 juillet 2011

bull thesesfr lrsquoAPI XML des thegraveses Punktokomo 12 juillet 2011

bull thesesfr les technologies utiliseacutees Punktokomo 12 juillet 2011

UN PROJET DOTEacute DE MOYENS SPEacuteCIFIQUES JUSQUrsquoA FIN 2012

thesesfr les prochains deacuteveloppements

Quelles fonctionnaliteacutes demain dans thesesfr (1)

bull Une interface en trois langues

ndash Franccedilais anglais italien

bull Un module de recherche avanceacutee

ndash exclure la recherche dans le texte inteacutegral

ndash ne pas tenir compte de la pertinence deacutefinie par deacutefaut (pondeacuteration des index)

ndash faciliter la recherche exacte

bull Calendrier fin septembre 2012

Quelles fonctionnaliteacutes demain dans thesesfr (2)

bull Des services accessibles sur authentificationndash paniersndash alerte mailndash hellip

bull Des services speacutecifiques pour les personnes reconnues comme eacutetant lrsquoauteur drsquoune thegravesendash mise en relation ecirctre contacteacute via thesesfrndash accegraves aux statistiques de sa page de thegravesendash hellip

bull Impossibiliteacute drsquooffrir de tels services pourles directeurs de thegravese

bull Calendrier fin 2012

Que trouvera-t-on demaindans thesesfr (1)

bull Toutes les donneacutees du Sudoc relatives aux thegraveses de doctorat franccedilaises soutenues depuis 1985

bull Toutes Non Celles qui passent avec succegraves lrsquoalgorithme de chargement qui a pour but de les laquo FRBriser raquo

bull Regroupement des notices Sudoc en familles composeacutees de ndash la notice megravere (la notice de la thegravese originelle telle que valideacutee par le

jury zone 105$m)

ndash Eacuteventuellement les notices enfants (les notices de reproduction zone 105$bv)

bull Chaque famille aura une page propre wwwthesesfrNNT

bull Conseacutequence pour thesesfr recherche de lrsquoexhaustiviteacute depuis 1985

bull Calendrier fin septembre 2012

Que trouvera-t-on demaindans thesesfr (2)

bull Toutes les donneacutees de TEL et lrsquoindexation du texte inteacutegral sous reacuteserve que le lien agrave la thegravese originelle ait eacuteteacute trouveacute

bull Principe chargement de toutes les donneacutees de TEL dans le Sudoc par moissonnage oai-pmh de TELndash Creacuteation de notices probablement assez pauvres (pas de liens

IdRef) mais avec lrsquoaccegraves au texte inteacutegral

bull Algorithme laquo FRBrisateur raquo de chargement dans thesesfrndash Si la notice megravere est trouveacutee ajout dans thesesfr de lrsquoaccegraves au

texte inteacutegral

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral sur le web

bull Calendrier fin 2012

Que trouvera-t-on demaindans thesesfr (3)

bull Des liens vers le catalogue des laquo thegraveses agrave la carte raquo de lrsquoANRT de Lille

bull Principe envoi reacutegulier (mensuel ) de la liste de NNTdisponibles dans laquo thegraveses agrave la carte raquo

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral avec la possibiliteacute de commander un fac-simileacute de la thegravese

bull Calendrier soumis aux contraintes de lrsquoANRT sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (4)

bull Les donneacutees de Theacutesa pour les thegraveses en preacuteparation au sein drsquoeacutetablissements relevant de la CGE et non utilisateurs de STEP

bull Principe envoi reacutegulier (mensuel ) des donneacutees par lrsquoINIST

bull Conseacutequence pour thesesfr recenser toutes les thegraveses en preacuteparation

bull Calendrier soumis aux contraintes de lrsquoINIST sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (5)

bull Des liens vers les donneacutees non-documentaires issus des partenaires associatifs du projet IntellirsquoAgence-ABG par exemplendash Cvthegraveque

ndash Offres drsquoemploi

ndash hellip

bull Conseacutequence pour thesesfr servir les docteurs et les doctorants au-delagrave de leur travail acadeacutemique

bull Calendrier soumis aux contraintes de lrsquo IntellirsquoAgence-ABG sans doute fin 2012

Journeacutees ABES ndash 20 juin 2012

Page 19: Tutoriel theses.fr : support pour diffusion sur le webQue trouve-t-on aujourd’hui dans theses.fr ? •Toutes les données validées dans STAR –Description de 11 397 thèses soutenues

Un service particulier

bull Rendre possible un cercle vertueux lrsquoutilisateur entre en contact avec le producteur pour signaler une erreur

16 7 10

9576

4558

6848

37 28

147154

0

20

40

60

80

100

120

140

160

180

200

juil-11 aoucirct-11 sept-11 oct-11 nov-11 deacutec-11 janv-12 feacutevr-12 mars-12 avr-12 mai-12

Assistance de thesesfr

signaler une erreur

ABESstp

bull Depuis avril 2012

bull Mail aucorrespondant STEP ou au correspondant STAR

Les donneacutees brutes

bull Ouvertes reacuteutilisables via une APIndash pour une liste de reacutesultats ajouter ampformat=xml ou

ampformat=json ou ampformat=atom ou ampformat=csv ou ampformat=txt en paramegravetre de lrsquourl de recherche

ndash pour une page finale ajouter xml (ou rdf ) agrave lrsquourl de la page

bull Ce principe permet drsquoajouter autant de formats que neacutecessaire

bull Exemple reacutecupeacuterer la description de la thegravese 2010MON30067

ndash dans lrsquointerfacendash en rdfxml

bull Exemple reacutecupeacuterer la liste de toutes les thegraveses soutenues agrave Toulouse 2 et accessibles en ligne dans lrsquoED Science du langage

ndash dans lrsquointerfacendash en xml (solr)ndash en json

thesesfr et Google

bull Description de toutes les pages de thesesfr dans un fichier sitemap pour faciliter lrsquoindexation des robots

bull 77 du trafic provient des moteurs de recherche

99 674

13 218

10 6710

20 000

40 000

60 000

80 000

100 000

120 000

Source de trafic (nb de visites)

trafic de recherche

sites reacutefeacuterents

acceacutes directs

77

14

9

Source de trafic ( du nb de visites)

juillet 2011-mai 2012

trafic de recherche

sites reacutefeacuterents

acceacutes directs

12 711

11 86815 961

61 815

73 306

66 891

91 055

95 25999 652

93 250

97 161

0

20 000

40 000

60 000

80 000

100 000

120 000

Visiteurs uniques

Quelques chiffres

86 810 75 383116 255

402 331399 129

349 976

427 499440 975

467 914

426 059

427 365

0

50 000

100 000

150 000

200 000

250 000

300 000

350 000

400 000

450 000

500 000

Pages vues

Plus de deacutetails

bull Le cercle vertueux de thesesfr mise en relation de lrsquoutilisateur et du producteur de donneacutees Punktokomo 10 avril 2012

bull thesesfr comment fonctionne lrsquoonglet laquo personnes raquo Punktokomo 19 janvier 2012

bull thesesfr lrsquoAPI XML de recherche Punktokomo 22 juillet 2011

bull thesesfr lrsquoAPI XML des personnes Punktokomo 12 juillet 2011

bull thesesfr lrsquoAPI XML des thegraveses Punktokomo 12 juillet 2011

bull thesesfr les technologies utiliseacutees Punktokomo 12 juillet 2011

UN PROJET DOTEacute DE MOYENS SPEacuteCIFIQUES JUSQUrsquoA FIN 2012

thesesfr les prochains deacuteveloppements

Quelles fonctionnaliteacutes demain dans thesesfr (1)

bull Une interface en trois langues

ndash Franccedilais anglais italien

bull Un module de recherche avanceacutee

ndash exclure la recherche dans le texte inteacutegral

ndash ne pas tenir compte de la pertinence deacutefinie par deacutefaut (pondeacuteration des index)

ndash faciliter la recherche exacte

bull Calendrier fin septembre 2012

Quelles fonctionnaliteacutes demain dans thesesfr (2)

bull Des services accessibles sur authentificationndash paniersndash alerte mailndash hellip

bull Des services speacutecifiques pour les personnes reconnues comme eacutetant lrsquoauteur drsquoune thegravesendash mise en relation ecirctre contacteacute via thesesfrndash accegraves aux statistiques de sa page de thegravesendash hellip

bull Impossibiliteacute drsquooffrir de tels services pourles directeurs de thegravese

bull Calendrier fin 2012

Que trouvera-t-on demaindans thesesfr (1)

bull Toutes les donneacutees du Sudoc relatives aux thegraveses de doctorat franccedilaises soutenues depuis 1985

bull Toutes Non Celles qui passent avec succegraves lrsquoalgorithme de chargement qui a pour but de les laquo FRBriser raquo

bull Regroupement des notices Sudoc en familles composeacutees de ndash la notice megravere (la notice de la thegravese originelle telle que valideacutee par le

jury zone 105$m)

ndash Eacuteventuellement les notices enfants (les notices de reproduction zone 105$bv)

bull Chaque famille aura une page propre wwwthesesfrNNT

bull Conseacutequence pour thesesfr recherche de lrsquoexhaustiviteacute depuis 1985

bull Calendrier fin septembre 2012

Que trouvera-t-on demaindans thesesfr (2)

bull Toutes les donneacutees de TEL et lrsquoindexation du texte inteacutegral sous reacuteserve que le lien agrave la thegravese originelle ait eacuteteacute trouveacute

bull Principe chargement de toutes les donneacutees de TEL dans le Sudoc par moissonnage oai-pmh de TELndash Creacuteation de notices probablement assez pauvres (pas de liens

IdRef) mais avec lrsquoaccegraves au texte inteacutegral

bull Algorithme laquo FRBrisateur raquo de chargement dans thesesfrndash Si la notice megravere est trouveacutee ajout dans thesesfr de lrsquoaccegraves au

texte inteacutegral

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral sur le web

bull Calendrier fin 2012

Que trouvera-t-on demaindans thesesfr (3)

bull Des liens vers le catalogue des laquo thegraveses agrave la carte raquo de lrsquoANRT de Lille

bull Principe envoi reacutegulier (mensuel ) de la liste de NNTdisponibles dans laquo thegraveses agrave la carte raquo

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral avec la possibiliteacute de commander un fac-simileacute de la thegravese

bull Calendrier soumis aux contraintes de lrsquoANRT sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (4)

bull Les donneacutees de Theacutesa pour les thegraveses en preacuteparation au sein drsquoeacutetablissements relevant de la CGE et non utilisateurs de STEP

bull Principe envoi reacutegulier (mensuel ) des donneacutees par lrsquoINIST

bull Conseacutequence pour thesesfr recenser toutes les thegraveses en preacuteparation

bull Calendrier soumis aux contraintes de lrsquoINIST sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (5)

bull Des liens vers les donneacutees non-documentaires issus des partenaires associatifs du projet IntellirsquoAgence-ABG par exemplendash Cvthegraveque

ndash Offres drsquoemploi

ndash hellip

bull Conseacutequence pour thesesfr servir les docteurs et les doctorants au-delagrave de leur travail acadeacutemique

bull Calendrier soumis aux contraintes de lrsquo IntellirsquoAgence-ABG sans doute fin 2012

Journeacutees ABES ndash 20 juin 2012

Page 20: Tutoriel theses.fr : support pour diffusion sur le webQue trouve-t-on aujourd’hui dans theses.fr ? •Toutes les données validées dans STAR –Description de 11 397 thèses soutenues

Les donneacutees brutes

bull Ouvertes reacuteutilisables via une APIndash pour une liste de reacutesultats ajouter ampformat=xml ou

ampformat=json ou ampformat=atom ou ampformat=csv ou ampformat=txt en paramegravetre de lrsquourl de recherche

ndash pour une page finale ajouter xml (ou rdf ) agrave lrsquourl de la page

bull Ce principe permet drsquoajouter autant de formats que neacutecessaire

bull Exemple reacutecupeacuterer la description de la thegravese 2010MON30067

ndash dans lrsquointerfacendash en rdfxml

bull Exemple reacutecupeacuterer la liste de toutes les thegraveses soutenues agrave Toulouse 2 et accessibles en ligne dans lrsquoED Science du langage

ndash dans lrsquointerfacendash en xml (solr)ndash en json

thesesfr et Google

bull Description de toutes les pages de thesesfr dans un fichier sitemap pour faciliter lrsquoindexation des robots

bull 77 du trafic provient des moteurs de recherche

99 674

13 218

10 6710

20 000

40 000

60 000

80 000

100 000

120 000

Source de trafic (nb de visites)

trafic de recherche

sites reacutefeacuterents

acceacutes directs

77

14

9

Source de trafic ( du nb de visites)

juillet 2011-mai 2012

trafic de recherche

sites reacutefeacuterents

acceacutes directs

12 711

11 86815 961

61 815

73 306

66 891

91 055

95 25999 652

93 250

97 161

0

20 000

40 000

60 000

80 000

100 000

120 000

Visiteurs uniques

Quelques chiffres

86 810 75 383116 255

402 331399 129

349 976

427 499440 975

467 914

426 059

427 365

0

50 000

100 000

150 000

200 000

250 000

300 000

350 000

400 000

450 000

500 000

Pages vues

Plus de deacutetails

bull Le cercle vertueux de thesesfr mise en relation de lrsquoutilisateur et du producteur de donneacutees Punktokomo 10 avril 2012

bull thesesfr comment fonctionne lrsquoonglet laquo personnes raquo Punktokomo 19 janvier 2012

bull thesesfr lrsquoAPI XML de recherche Punktokomo 22 juillet 2011

bull thesesfr lrsquoAPI XML des personnes Punktokomo 12 juillet 2011

bull thesesfr lrsquoAPI XML des thegraveses Punktokomo 12 juillet 2011

bull thesesfr les technologies utiliseacutees Punktokomo 12 juillet 2011

UN PROJET DOTEacute DE MOYENS SPEacuteCIFIQUES JUSQUrsquoA FIN 2012

thesesfr les prochains deacuteveloppements

Quelles fonctionnaliteacutes demain dans thesesfr (1)

bull Une interface en trois langues

ndash Franccedilais anglais italien

bull Un module de recherche avanceacutee

ndash exclure la recherche dans le texte inteacutegral

ndash ne pas tenir compte de la pertinence deacutefinie par deacutefaut (pondeacuteration des index)

ndash faciliter la recherche exacte

bull Calendrier fin septembre 2012

Quelles fonctionnaliteacutes demain dans thesesfr (2)

bull Des services accessibles sur authentificationndash paniersndash alerte mailndash hellip

bull Des services speacutecifiques pour les personnes reconnues comme eacutetant lrsquoauteur drsquoune thegravesendash mise en relation ecirctre contacteacute via thesesfrndash accegraves aux statistiques de sa page de thegravesendash hellip

bull Impossibiliteacute drsquooffrir de tels services pourles directeurs de thegravese

bull Calendrier fin 2012

Que trouvera-t-on demaindans thesesfr (1)

bull Toutes les donneacutees du Sudoc relatives aux thegraveses de doctorat franccedilaises soutenues depuis 1985

bull Toutes Non Celles qui passent avec succegraves lrsquoalgorithme de chargement qui a pour but de les laquo FRBriser raquo

bull Regroupement des notices Sudoc en familles composeacutees de ndash la notice megravere (la notice de la thegravese originelle telle que valideacutee par le

jury zone 105$m)

ndash Eacuteventuellement les notices enfants (les notices de reproduction zone 105$bv)

bull Chaque famille aura une page propre wwwthesesfrNNT

bull Conseacutequence pour thesesfr recherche de lrsquoexhaustiviteacute depuis 1985

bull Calendrier fin septembre 2012

Que trouvera-t-on demaindans thesesfr (2)

bull Toutes les donneacutees de TEL et lrsquoindexation du texte inteacutegral sous reacuteserve que le lien agrave la thegravese originelle ait eacuteteacute trouveacute

bull Principe chargement de toutes les donneacutees de TEL dans le Sudoc par moissonnage oai-pmh de TELndash Creacuteation de notices probablement assez pauvres (pas de liens

IdRef) mais avec lrsquoaccegraves au texte inteacutegral

bull Algorithme laquo FRBrisateur raquo de chargement dans thesesfrndash Si la notice megravere est trouveacutee ajout dans thesesfr de lrsquoaccegraves au

texte inteacutegral

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral sur le web

bull Calendrier fin 2012

Que trouvera-t-on demaindans thesesfr (3)

bull Des liens vers le catalogue des laquo thegraveses agrave la carte raquo de lrsquoANRT de Lille

bull Principe envoi reacutegulier (mensuel ) de la liste de NNTdisponibles dans laquo thegraveses agrave la carte raquo

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral avec la possibiliteacute de commander un fac-simileacute de la thegravese

bull Calendrier soumis aux contraintes de lrsquoANRT sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (4)

bull Les donneacutees de Theacutesa pour les thegraveses en preacuteparation au sein drsquoeacutetablissements relevant de la CGE et non utilisateurs de STEP

bull Principe envoi reacutegulier (mensuel ) des donneacutees par lrsquoINIST

bull Conseacutequence pour thesesfr recenser toutes les thegraveses en preacuteparation

bull Calendrier soumis aux contraintes de lrsquoINIST sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (5)

bull Des liens vers les donneacutees non-documentaires issus des partenaires associatifs du projet IntellirsquoAgence-ABG par exemplendash Cvthegraveque

ndash Offres drsquoemploi

ndash hellip

bull Conseacutequence pour thesesfr servir les docteurs et les doctorants au-delagrave de leur travail acadeacutemique

bull Calendrier soumis aux contraintes de lrsquo IntellirsquoAgence-ABG sans doute fin 2012

Journeacutees ABES ndash 20 juin 2012

Page 21: Tutoriel theses.fr : support pour diffusion sur le webQue trouve-t-on aujourd’hui dans theses.fr ? •Toutes les données validées dans STAR –Description de 11 397 thèses soutenues

thesesfr et Google

bull Description de toutes les pages de thesesfr dans un fichier sitemap pour faciliter lrsquoindexation des robots

bull 77 du trafic provient des moteurs de recherche

99 674

13 218

10 6710

20 000

40 000

60 000

80 000

100 000

120 000

Source de trafic (nb de visites)

trafic de recherche

sites reacutefeacuterents

acceacutes directs

77

14

9

Source de trafic ( du nb de visites)

juillet 2011-mai 2012

trafic de recherche

sites reacutefeacuterents

acceacutes directs

12 711

11 86815 961

61 815

73 306

66 891

91 055

95 25999 652

93 250

97 161

0

20 000

40 000

60 000

80 000

100 000

120 000

Visiteurs uniques

Quelques chiffres

86 810 75 383116 255

402 331399 129

349 976

427 499440 975

467 914

426 059

427 365

0

50 000

100 000

150 000

200 000

250 000

300 000

350 000

400 000

450 000

500 000

Pages vues

Plus de deacutetails

bull Le cercle vertueux de thesesfr mise en relation de lrsquoutilisateur et du producteur de donneacutees Punktokomo 10 avril 2012

bull thesesfr comment fonctionne lrsquoonglet laquo personnes raquo Punktokomo 19 janvier 2012

bull thesesfr lrsquoAPI XML de recherche Punktokomo 22 juillet 2011

bull thesesfr lrsquoAPI XML des personnes Punktokomo 12 juillet 2011

bull thesesfr lrsquoAPI XML des thegraveses Punktokomo 12 juillet 2011

bull thesesfr les technologies utiliseacutees Punktokomo 12 juillet 2011

UN PROJET DOTEacute DE MOYENS SPEacuteCIFIQUES JUSQUrsquoA FIN 2012

thesesfr les prochains deacuteveloppements

Quelles fonctionnaliteacutes demain dans thesesfr (1)

bull Une interface en trois langues

ndash Franccedilais anglais italien

bull Un module de recherche avanceacutee

ndash exclure la recherche dans le texte inteacutegral

ndash ne pas tenir compte de la pertinence deacutefinie par deacutefaut (pondeacuteration des index)

ndash faciliter la recherche exacte

bull Calendrier fin septembre 2012

Quelles fonctionnaliteacutes demain dans thesesfr (2)

bull Des services accessibles sur authentificationndash paniersndash alerte mailndash hellip

bull Des services speacutecifiques pour les personnes reconnues comme eacutetant lrsquoauteur drsquoune thegravesendash mise en relation ecirctre contacteacute via thesesfrndash accegraves aux statistiques de sa page de thegravesendash hellip

bull Impossibiliteacute drsquooffrir de tels services pourles directeurs de thegravese

bull Calendrier fin 2012

Que trouvera-t-on demaindans thesesfr (1)

bull Toutes les donneacutees du Sudoc relatives aux thegraveses de doctorat franccedilaises soutenues depuis 1985

bull Toutes Non Celles qui passent avec succegraves lrsquoalgorithme de chargement qui a pour but de les laquo FRBriser raquo

bull Regroupement des notices Sudoc en familles composeacutees de ndash la notice megravere (la notice de la thegravese originelle telle que valideacutee par le

jury zone 105$m)

ndash Eacuteventuellement les notices enfants (les notices de reproduction zone 105$bv)

bull Chaque famille aura une page propre wwwthesesfrNNT

bull Conseacutequence pour thesesfr recherche de lrsquoexhaustiviteacute depuis 1985

bull Calendrier fin septembre 2012

Que trouvera-t-on demaindans thesesfr (2)

bull Toutes les donneacutees de TEL et lrsquoindexation du texte inteacutegral sous reacuteserve que le lien agrave la thegravese originelle ait eacuteteacute trouveacute

bull Principe chargement de toutes les donneacutees de TEL dans le Sudoc par moissonnage oai-pmh de TELndash Creacuteation de notices probablement assez pauvres (pas de liens

IdRef) mais avec lrsquoaccegraves au texte inteacutegral

bull Algorithme laquo FRBrisateur raquo de chargement dans thesesfrndash Si la notice megravere est trouveacutee ajout dans thesesfr de lrsquoaccegraves au

texte inteacutegral

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral sur le web

bull Calendrier fin 2012

Que trouvera-t-on demaindans thesesfr (3)

bull Des liens vers le catalogue des laquo thegraveses agrave la carte raquo de lrsquoANRT de Lille

bull Principe envoi reacutegulier (mensuel ) de la liste de NNTdisponibles dans laquo thegraveses agrave la carte raquo

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral avec la possibiliteacute de commander un fac-simileacute de la thegravese

bull Calendrier soumis aux contraintes de lrsquoANRT sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (4)

bull Les donneacutees de Theacutesa pour les thegraveses en preacuteparation au sein drsquoeacutetablissements relevant de la CGE et non utilisateurs de STEP

bull Principe envoi reacutegulier (mensuel ) des donneacutees par lrsquoINIST

bull Conseacutequence pour thesesfr recenser toutes les thegraveses en preacuteparation

bull Calendrier soumis aux contraintes de lrsquoINIST sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (5)

bull Des liens vers les donneacutees non-documentaires issus des partenaires associatifs du projet IntellirsquoAgence-ABG par exemplendash Cvthegraveque

ndash Offres drsquoemploi

ndash hellip

bull Conseacutequence pour thesesfr servir les docteurs et les doctorants au-delagrave de leur travail acadeacutemique

bull Calendrier soumis aux contraintes de lrsquo IntellirsquoAgence-ABG sans doute fin 2012

Journeacutees ABES ndash 20 juin 2012

Page 22: Tutoriel theses.fr : support pour diffusion sur le webQue trouve-t-on aujourd’hui dans theses.fr ? •Toutes les données validées dans STAR –Description de 11 397 thèses soutenues

12 711

11 86815 961

61 815

73 306

66 891

91 055

95 25999 652

93 250

97 161

0

20 000

40 000

60 000

80 000

100 000

120 000

Visiteurs uniques

Quelques chiffres

86 810 75 383116 255

402 331399 129

349 976

427 499440 975

467 914

426 059

427 365

0

50 000

100 000

150 000

200 000

250 000

300 000

350 000

400 000

450 000

500 000

Pages vues

Plus de deacutetails

bull Le cercle vertueux de thesesfr mise en relation de lrsquoutilisateur et du producteur de donneacutees Punktokomo 10 avril 2012

bull thesesfr comment fonctionne lrsquoonglet laquo personnes raquo Punktokomo 19 janvier 2012

bull thesesfr lrsquoAPI XML de recherche Punktokomo 22 juillet 2011

bull thesesfr lrsquoAPI XML des personnes Punktokomo 12 juillet 2011

bull thesesfr lrsquoAPI XML des thegraveses Punktokomo 12 juillet 2011

bull thesesfr les technologies utiliseacutees Punktokomo 12 juillet 2011

UN PROJET DOTEacute DE MOYENS SPEacuteCIFIQUES JUSQUrsquoA FIN 2012

thesesfr les prochains deacuteveloppements

Quelles fonctionnaliteacutes demain dans thesesfr (1)

bull Une interface en trois langues

ndash Franccedilais anglais italien

bull Un module de recherche avanceacutee

ndash exclure la recherche dans le texte inteacutegral

ndash ne pas tenir compte de la pertinence deacutefinie par deacutefaut (pondeacuteration des index)

ndash faciliter la recherche exacte

bull Calendrier fin septembre 2012

Quelles fonctionnaliteacutes demain dans thesesfr (2)

bull Des services accessibles sur authentificationndash paniersndash alerte mailndash hellip

bull Des services speacutecifiques pour les personnes reconnues comme eacutetant lrsquoauteur drsquoune thegravesendash mise en relation ecirctre contacteacute via thesesfrndash accegraves aux statistiques de sa page de thegravesendash hellip

bull Impossibiliteacute drsquooffrir de tels services pourles directeurs de thegravese

bull Calendrier fin 2012

Que trouvera-t-on demaindans thesesfr (1)

bull Toutes les donneacutees du Sudoc relatives aux thegraveses de doctorat franccedilaises soutenues depuis 1985

bull Toutes Non Celles qui passent avec succegraves lrsquoalgorithme de chargement qui a pour but de les laquo FRBriser raquo

bull Regroupement des notices Sudoc en familles composeacutees de ndash la notice megravere (la notice de la thegravese originelle telle que valideacutee par le

jury zone 105$m)

ndash Eacuteventuellement les notices enfants (les notices de reproduction zone 105$bv)

bull Chaque famille aura une page propre wwwthesesfrNNT

bull Conseacutequence pour thesesfr recherche de lrsquoexhaustiviteacute depuis 1985

bull Calendrier fin septembre 2012

Que trouvera-t-on demaindans thesesfr (2)

bull Toutes les donneacutees de TEL et lrsquoindexation du texte inteacutegral sous reacuteserve que le lien agrave la thegravese originelle ait eacuteteacute trouveacute

bull Principe chargement de toutes les donneacutees de TEL dans le Sudoc par moissonnage oai-pmh de TELndash Creacuteation de notices probablement assez pauvres (pas de liens

IdRef) mais avec lrsquoaccegraves au texte inteacutegral

bull Algorithme laquo FRBrisateur raquo de chargement dans thesesfrndash Si la notice megravere est trouveacutee ajout dans thesesfr de lrsquoaccegraves au

texte inteacutegral

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral sur le web

bull Calendrier fin 2012

Que trouvera-t-on demaindans thesesfr (3)

bull Des liens vers le catalogue des laquo thegraveses agrave la carte raquo de lrsquoANRT de Lille

bull Principe envoi reacutegulier (mensuel ) de la liste de NNTdisponibles dans laquo thegraveses agrave la carte raquo

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral avec la possibiliteacute de commander un fac-simileacute de la thegravese

bull Calendrier soumis aux contraintes de lrsquoANRT sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (4)

bull Les donneacutees de Theacutesa pour les thegraveses en preacuteparation au sein drsquoeacutetablissements relevant de la CGE et non utilisateurs de STEP

bull Principe envoi reacutegulier (mensuel ) des donneacutees par lrsquoINIST

bull Conseacutequence pour thesesfr recenser toutes les thegraveses en preacuteparation

bull Calendrier soumis aux contraintes de lrsquoINIST sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (5)

bull Des liens vers les donneacutees non-documentaires issus des partenaires associatifs du projet IntellirsquoAgence-ABG par exemplendash Cvthegraveque

ndash Offres drsquoemploi

ndash hellip

bull Conseacutequence pour thesesfr servir les docteurs et les doctorants au-delagrave de leur travail acadeacutemique

bull Calendrier soumis aux contraintes de lrsquo IntellirsquoAgence-ABG sans doute fin 2012

Journeacutees ABES ndash 20 juin 2012

Page 23: Tutoriel theses.fr : support pour diffusion sur le webQue trouve-t-on aujourd’hui dans theses.fr ? •Toutes les données validées dans STAR –Description de 11 397 thèses soutenues

Plus de deacutetails

bull Le cercle vertueux de thesesfr mise en relation de lrsquoutilisateur et du producteur de donneacutees Punktokomo 10 avril 2012

bull thesesfr comment fonctionne lrsquoonglet laquo personnes raquo Punktokomo 19 janvier 2012

bull thesesfr lrsquoAPI XML de recherche Punktokomo 22 juillet 2011

bull thesesfr lrsquoAPI XML des personnes Punktokomo 12 juillet 2011

bull thesesfr lrsquoAPI XML des thegraveses Punktokomo 12 juillet 2011

bull thesesfr les technologies utiliseacutees Punktokomo 12 juillet 2011

UN PROJET DOTEacute DE MOYENS SPEacuteCIFIQUES JUSQUrsquoA FIN 2012

thesesfr les prochains deacuteveloppements

Quelles fonctionnaliteacutes demain dans thesesfr (1)

bull Une interface en trois langues

ndash Franccedilais anglais italien

bull Un module de recherche avanceacutee

ndash exclure la recherche dans le texte inteacutegral

ndash ne pas tenir compte de la pertinence deacutefinie par deacutefaut (pondeacuteration des index)

ndash faciliter la recherche exacte

bull Calendrier fin septembre 2012

Quelles fonctionnaliteacutes demain dans thesesfr (2)

bull Des services accessibles sur authentificationndash paniersndash alerte mailndash hellip

bull Des services speacutecifiques pour les personnes reconnues comme eacutetant lrsquoauteur drsquoune thegravesendash mise en relation ecirctre contacteacute via thesesfrndash accegraves aux statistiques de sa page de thegravesendash hellip

bull Impossibiliteacute drsquooffrir de tels services pourles directeurs de thegravese

bull Calendrier fin 2012

Que trouvera-t-on demaindans thesesfr (1)

bull Toutes les donneacutees du Sudoc relatives aux thegraveses de doctorat franccedilaises soutenues depuis 1985

bull Toutes Non Celles qui passent avec succegraves lrsquoalgorithme de chargement qui a pour but de les laquo FRBriser raquo

bull Regroupement des notices Sudoc en familles composeacutees de ndash la notice megravere (la notice de la thegravese originelle telle que valideacutee par le

jury zone 105$m)

ndash Eacuteventuellement les notices enfants (les notices de reproduction zone 105$bv)

bull Chaque famille aura une page propre wwwthesesfrNNT

bull Conseacutequence pour thesesfr recherche de lrsquoexhaustiviteacute depuis 1985

bull Calendrier fin septembre 2012

Que trouvera-t-on demaindans thesesfr (2)

bull Toutes les donneacutees de TEL et lrsquoindexation du texte inteacutegral sous reacuteserve que le lien agrave la thegravese originelle ait eacuteteacute trouveacute

bull Principe chargement de toutes les donneacutees de TEL dans le Sudoc par moissonnage oai-pmh de TELndash Creacuteation de notices probablement assez pauvres (pas de liens

IdRef) mais avec lrsquoaccegraves au texte inteacutegral

bull Algorithme laquo FRBrisateur raquo de chargement dans thesesfrndash Si la notice megravere est trouveacutee ajout dans thesesfr de lrsquoaccegraves au

texte inteacutegral

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral sur le web

bull Calendrier fin 2012

Que trouvera-t-on demaindans thesesfr (3)

bull Des liens vers le catalogue des laquo thegraveses agrave la carte raquo de lrsquoANRT de Lille

bull Principe envoi reacutegulier (mensuel ) de la liste de NNTdisponibles dans laquo thegraveses agrave la carte raquo

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral avec la possibiliteacute de commander un fac-simileacute de la thegravese

bull Calendrier soumis aux contraintes de lrsquoANRT sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (4)

bull Les donneacutees de Theacutesa pour les thegraveses en preacuteparation au sein drsquoeacutetablissements relevant de la CGE et non utilisateurs de STEP

bull Principe envoi reacutegulier (mensuel ) des donneacutees par lrsquoINIST

bull Conseacutequence pour thesesfr recenser toutes les thegraveses en preacuteparation

bull Calendrier soumis aux contraintes de lrsquoINIST sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (5)

bull Des liens vers les donneacutees non-documentaires issus des partenaires associatifs du projet IntellirsquoAgence-ABG par exemplendash Cvthegraveque

ndash Offres drsquoemploi

ndash hellip

bull Conseacutequence pour thesesfr servir les docteurs et les doctorants au-delagrave de leur travail acadeacutemique

bull Calendrier soumis aux contraintes de lrsquo IntellirsquoAgence-ABG sans doute fin 2012

Journeacutees ABES ndash 20 juin 2012

Page 24: Tutoriel theses.fr : support pour diffusion sur le webQue trouve-t-on aujourd’hui dans theses.fr ? •Toutes les données validées dans STAR –Description de 11 397 thèses soutenues

UN PROJET DOTEacute DE MOYENS SPEacuteCIFIQUES JUSQUrsquoA FIN 2012

thesesfr les prochains deacuteveloppements

Quelles fonctionnaliteacutes demain dans thesesfr (1)

bull Une interface en trois langues

ndash Franccedilais anglais italien

bull Un module de recherche avanceacutee

ndash exclure la recherche dans le texte inteacutegral

ndash ne pas tenir compte de la pertinence deacutefinie par deacutefaut (pondeacuteration des index)

ndash faciliter la recherche exacte

bull Calendrier fin septembre 2012

Quelles fonctionnaliteacutes demain dans thesesfr (2)

bull Des services accessibles sur authentificationndash paniersndash alerte mailndash hellip

bull Des services speacutecifiques pour les personnes reconnues comme eacutetant lrsquoauteur drsquoune thegravesendash mise en relation ecirctre contacteacute via thesesfrndash accegraves aux statistiques de sa page de thegravesendash hellip

bull Impossibiliteacute drsquooffrir de tels services pourles directeurs de thegravese

bull Calendrier fin 2012

Que trouvera-t-on demaindans thesesfr (1)

bull Toutes les donneacutees du Sudoc relatives aux thegraveses de doctorat franccedilaises soutenues depuis 1985

bull Toutes Non Celles qui passent avec succegraves lrsquoalgorithme de chargement qui a pour but de les laquo FRBriser raquo

bull Regroupement des notices Sudoc en familles composeacutees de ndash la notice megravere (la notice de la thegravese originelle telle que valideacutee par le

jury zone 105$m)

ndash Eacuteventuellement les notices enfants (les notices de reproduction zone 105$bv)

bull Chaque famille aura une page propre wwwthesesfrNNT

bull Conseacutequence pour thesesfr recherche de lrsquoexhaustiviteacute depuis 1985

bull Calendrier fin septembre 2012

Que trouvera-t-on demaindans thesesfr (2)

bull Toutes les donneacutees de TEL et lrsquoindexation du texte inteacutegral sous reacuteserve que le lien agrave la thegravese originelle ait eacuteteacute trouveacute

bull Principe chargement de toutes les donneacutees de TEL dans le Sudoc par moissonnage oai-pmh de TELndash Creacuteation de notices probablement assez pauvres (pas de liens

IdRef) mais avec lrsquoaccegraves au texte inteacutegral

bull Algorithme laquo FRBrisateur raquo de chargement dans thesesfrndash Si la notice megravere est trouveacutee ajout dans thesesfr de lrsquoaccegraves au

texte inteacutegral

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral sur le web

bull Calendrier fin 2012

Que trouvera-t-on demaindans thesesfr (3)

bull Des liens vers le catalogue des laquo thegraveses agrave la carte raquo de lrsquoANRT de Lille

bull Principe envoi reacutegulier (mensuel ) de la liste de NNTdisponibles dans laquo thegraveses agrave la carte raquo

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral avec la possibiliteacute de commander un fac-simileacute de la thegravese

bull Calendrier soumis aux contraintes de lrsquoANRT sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (4)

bull Les donneacutees de Theacutesa pour les thegraveses en preacuteparation au sein drsquoeacutetablissements relevant de la CGE et non utilisateurs de STEP

bull Principe envoi reacutegulier (mensuel ) des donneacutees par lrsquoINIST

bull Conseacutequence pour thesesfr recenser toutes les thegraveses en preacuteparation

bull Calendrier soumis aux contraintes de lrsquoINIST sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (5)

bull Des liens vers les donneacutees non-documentaires issus des partenaires associatifs du projet IntellirsquoAgence-ABG par exemplendash Cvthegraveque

ndash Offres drsquoemploi

ndash hellip

bull Conseacutequence pour thesesfr servir les docteurs et les doctorants au-delagrave de leur travail acadeacutemique

bull Calendrier soumis aux contraintes de lrsquo IntellirsquoAgence-ABG sans doute fin 2012

Journeacutees ABES ndash 20 juin 2012

Page 25: Tutoriel theses.fr : support pour diffusion sur le webQue trouve-t-on aujourd’hui dans theses.fr ? •Toutes les données validées dans STAR –Description de 11 397 thèses soutenues

Quelles fonctionnaliteacutes demain dans thesesfr (1)

bull Une interface en trois langues

ndash Franccedilais anglais italien

bull Un module de recherche avanceacutee

ndash exclure la recherche dans le texte inteacutegral

ndash ne pas tenir compte de la pertinence deacutefinie par deacutefaut (pondeacuteration des index)

ndash faciliter la recherche exacte

bull Calendrier fin septembre 2012

Quelles fonctionnaliteacutes demain dans thesesfr (2)

bull Des services accessibles sur authentificationndash paniersndash alerte mailndash hellip

bull Des services speacutecifiques pour les personnes reconnues comme eacutetant lrsquoauteur drsquoune thegravesendash mise en relation ecirctre contacteacute via thesesfrndash accegraves aux statistiques de sa page de thegravesendash hellip

bull Impossibiliteacute drsquooffrir de tels services pourles directeurs de thegravese

bull Calendrier fin 2012

Que trouvera-t-on demaindans thesesfr (1)

bull Toutes les donneacutees du Sudoc relatives aux thegraveses de doctorat franccedilaises soutenues depuis 1985

bull Toutes Non Celles qui passent avec succegraves lrsquoalgorithme de chargement qui a pour but de les laquo FRBriser raquo

bull Regroupement des notices Sudoc en familles composeacutees de ndash la notice megravere (la notice de la thegravese originelle telle que valideacutee par le

jury zone 105$m)

ndash Eacuteventuellement les notices enfants (les notices de reproduction zone 105$bv)

bull Chaque famille aura une page propre wwwthesesfrNNT

bull Conseacutequence pour thesesfr recherche de lrsquoexhaustiviteacute depuis 1985

bull Calendrier fin septembre 2012

Que trouvera-t-on demaindans thesesfr (2)

bull Toutes les donneacutees de TEL et lrsquoindexation du texte inteacutegral sous reacuteserve que le lien agrave la thegravese originelle ait eacuteteacute trouveacute

bull Principe chargement de toutes les donneacutees de TEL dans le Sudoc par moissonnage oai-pmh de TELndash Creacuteation de notices probablement assez pauvres (pas de liens

IdRef) mais avec lrsquoaccegraves au texte inteacutegral

bull Algorithme laquo FRBrisateur raquo de chargement dans thesesfrndash Si la notice megravere est trouveacutee ajout dans thesesfr de lrsquoaccegraves au

texte inteacutegral

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral sur le web

bull Calendrier fin 2012

Que trouvera-t-on demaindans thesesfr (3)

bull Des liens vers le catalogue des laquo thegraveses agrave la carte raquo de lrsquoANRT de Lille

bull Principe envoi reacutegulier (mensuel ) de la liste de NNTdisponibles dans laquo thegraveses agrave la carte raquo

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral avec la possibiliteacute de commander un fac-simileacute de la thegravese

bull Calendrier soumis aux contraintes de lrsquoANRT sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (4)

bull Les donneacutees de Theacutesa pour les thegraveses en preacuteparation au sein drsquoeacutetablissements relevant de la CGE et non utilisateurs de STEP

bull Principe envoi reacutegulier (mensuel ) des donneacutees par lrsquoINIST

bull Conseacutequence pour thesesfr recenser toutes les thegraveses en preacuteparation

bull Calendrier soumis aux contraintes de lrsquoINIST sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (5)

bull Des liens vers les donneacutees non-documentaires issus des partenaires associatifs du projet IntellirsquoAgence-ABG par exemplendash Cvthegraveque

ndash Offres drsquoemploi

ndash hellip

bull Conseacutequence pour thesesfr servir les docteurs et les doctorants au-delagrave de leur travail acadeacutemique

bull Calendrier soumis aux contraintes de lrsquo IntellirsquoAgence-ABG sans doute fin 2012

Journeacutees ABES ndash 20 juin 2012

Page 26: Tutoriel theses.fr : support pour diffusion sur le webQue trouve-t-on aujourd’hui dans theses.fr ? •Toutes les données validées dans STAR –Description de 11 397 thèses soutenues

Quelles fonctionnaliteacutes demain dans thesesfr (2)

bull Des services accessibles sur authentificationndash paniersndash alerte mailndash hellip

bull Des services speacutecifiques pour les personnes reconnues comme eacutetant lrsquoauteur drsquoune thegravesendash mise en relation ecirctre contacteacute via thesesfrndash accegraves aux statistiques de sa page de thegravesendash hellip

bull Impossibiliteacute drsquooffrir de tels services pourles directeurs de thegravese

bull Calendrier fin 2012

Que trouvera-t-on demaindans thesesfr (1)

bull Toutes les donneacutees du Sudoc relatives aux thegraveses de doctorat franccedilaises soutenues depuis 1985

bull Toutes Non Celles qui passent avec succegraves lrsquoalgorithme de chargement qui a pour but de les laquo FRBriser raquo

bull Regroupement des notices Sudoc en familles composeacutees de ndash la notice megravere (la notice de la thegravese originelle telle que valideacutee par le

jury zone 105$m)

ndash Eacuteventuellement les notices enfants (les notices de reproduction zone 105$bv)

bull Chaque famille aura une page propre wwwthesesfrNNT

bull Conseacutequence pour thesesfr recherche de lrsquoexhaustiviteacute depuis 1985

bull Calendrier fin septembre 2012

Que trouvera-t-on demaindans thesesfr (2)

bull Toutes les donneacutees de TEL et lrsquoindexation du texte inteacutegral sous reacuteserve que le lien agrave la thegravese originelle ait eacuteteacute trouveacute

bull Principe chargement de toutes les donneacutees de TEL dans le Sudoc par moissonnage oai-pmh de TELndash Creacuteation de notices probablement assez pauvres (pas de liens

IdRef) mais avec lrsquoaccegraves au texte inteacutegral

bull Algorithme laquo FRBrisateur raquo de chargement dans thesesfrndash Si la notice megravere est trouveacutee ajout dans thesesfr de lrsquoaccegraves au

texte inteacutegral

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral sur le web

bull Calendrier fin 2012

Que trouvera-t-on demaindans thesesfr (3)

bull Des liens vers le catalogue des laquo thegraveses agrave la carte raquo de lrsquoANRT de Lille

bull Principe envoi reacutegulier (mensuel ) de la liste de NNTdisponibles dans laquo thegraveses agrave la carte raquo

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral avec la possibiliteacute de commander un fac-simileacute de la thegravese

bull Calendrier soumis aux contraintes de lrsquoANRT sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (4)

bull Les donneacutees de Theacutesa pour les thegraveses en preacuteparation au sein drsquoeacutetablissements relevant de la CGE et non utilisateurs de STEP

bull Principe envoi reacutegulier (mensuel ) des donneacutees par lrsquoINIST

bull Conseacutequence pour thesesfr recenser toutes les thegraveses en preacuteparation

bull Calendrier soumis aux contraintes de lrsquoINIST sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (5)

bull Des liens vers les donneacutees non-documentaires issus des partenaires associatifs du projet IntellirsquoAgence-ABG par exemplendash Cvthegraveque

ndash Offres drsquoemploi

ndash hellip

bull Conseacutequence pour thesesfr servir les docteurs et les doctorants au-delagrave de leur travail acadeacutemique

bull Calendrier soumis aux contraintes de lrsquo IntellirsquoAgence-ABG sans doute fin 2012

Journeacutees ABES ndash 20 juin 2012

Page 27: Tutoriel theses.fr : support pour diffusion sur le webQue trouve-t-on aujourd’hui dans theses.fr ? •Toutes les données validées dans STAR –Description de 11 397 thèses soutenues

Que trouvera-t-on demaindans thesesfr (1)

bull Toutes les donneacutees du Sudoc relatives aux thegraveses de doctorat franccedilaises soutenues depuis 1985

bull Toutes Non Celles qui passent avec succegraves lrsquoalgorithme de chargement qui a pour but de les laquo FRBriser raquo

bull Regroupement des notices Sudoc en familles composeacutees de ndash la notice megravere (la notice de la thegravese originelle telle que valideacutee par le

jury zone 105$m)

ndash Eacuteventuellement les notices enfants (les notices de reproduction zone 105$bv)

bull Chaque famille aura une page propre wwwthesesfrNNT

bull Conseacutequence pour thesesfr recherche de lrsquoexhaustiviteacute depuis 1985

bull Calendrier fin septembre 2012

Que trouvera-t-on demaindans thesesfr (2)

bull Toutes les donneacutees de TEL et lrsquoindexation du texte inteacutegral sous reacuteserve que le lien agrave la thegravese originelle ait eacuteteacute trouveacute

bull Principe chargement de toutes les donneacutees de TEL dans le Sudoc par moissonnage oai-pmh de TELndash Creacuteation de notices probablement assez pauvres (pas de liens

IdRef) mais avec lrsquoaccegraves au texte inteacutegral

bull Algorithme laquo FRBrisateur raquo de chargement dans thesesfrndash Si la notice megravere est trouveacutee ajout dans thesesfr de lrsquoaccegraves au

texte inteacutegral

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral sur le web

bull Calendrier fin 2012

Que trouvera-t-on demaindans thesesfr (3)

bull Des liens vers le catalogue des laquo thegraveses agrave la carte raquo de lrsquoANRT de Lille

bull Principe envoi reacutegulier (mensuel ) de la liste de NNTdisponibles dans laquo thegraveses agrave la carte raquo

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral avec la possibiliteacute de commander un fac-simileacute de la thegravese

bull Calendrier soumis aux contraintes de lrsquoANRT sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (4)

bull Les donneacutees de Theacutesa pour les thegraveses en preacuteparation au sein drsquoeacutetablissements relevant de la CGE et non utilisateurs de STEP

bull Principe envoi reacutegulier (mensuel ) des donneacutees par lrsquoINIST

bull Conseacutequence pour thesesfr recenser toutes les thegraveses en preacuteparation

bull Calendrier soumis aux contraintes de lrsquoINIST sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (5)

bull Des liens vers les donneacutees non-documentaires issus des partenaires associatifs du projet IntellirsquoAgence-ABG par exemplendash Cvthegraveque

ndash Offres drsquoemploi

ndash hellip

bull Conseacutequence pour thesesfr servir les docteurs et les doctorants au-delagrave de leur travail acadeacutemique

bull Calendrier soumis aux contraintes de lrsquo IntellirsquoAgence-ABG sans doute fin 2012

Journeacutees ABES ndash 20 juin 2012

Page 28: Tutoriel theses.fr : support pour diffusion sur le webQue trouve-t-on aujourd’hui dans theses.fr ? •Toutes les données validées dans STAR –Description de 11 397 thèses soutenues

Que trouvera-t-on demaindans thesesfr (2)

bull Toutes les donneacutees de TEL et lrsquoindexation du texte inteacutegral sous reacuteserve que le lien agrave la thegravese originelle ait eacuteteacute trouveacute

bull Principe chargement de toutes les donneacutees de TEL dans le Sudoc par moissonnage oai-pmh de TELndash Creacuteation de notices probablement assez pauvres (pas de liens

IdRef) mais avec lrsquoaccegraves au texte inteacutegral

bull Algorithme laquo FRBrisateur raquo de chargement dans thesesfrndash Si la notice megravere est trouveacutee ajout dans thesesfr de lrsquoaccegraves au

texte inteacutegral

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral sur le web

bull Calendrier fin 2012

Que trouvera-t-on demaindans thesesfr (3)

bull Des liens vers le catalogue des laquo thegraveses agrave la carte raquo de lrsquoANRT de Lille

bull Principe envoi reacutegulier (mensuel ) de la liste de NNTdisponibles dans laquo thegraveses agrave la carte raquo

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral avec la possibiliteacute de commander un fac-simileacute de la thegravese

bull Calendrier soumis aux contraintes de lrsquoANRT sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (4)

bull Les donneacutees de Theacutesa pour les thegraveses en preacuteparation au sein drsquoeacutetablissements relevant de la CGE et non utilisateurs de STEP

bull Principe envoi reacutegulier (mensuel ) des donneacutees par lrsquoINIST

bull Conseacutequence pour thesesfr recenser toutes les thegraveses en preacuteparation

bull Calendrier soumis aux contraintes de lrsquoINIST sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (5)

bull Des liens vers les donneacutees non-documentaires issus des partenaires associatifs du projet IntellirsquoAgence-ABG par exemplendash Cvthegraveque

ndash Offres drsquoemploi

ndash hellip

bull Conseacutequence pour thesesfr servir les docteurs et les doctorants au-delagrave de leur travail acadeacutemique

bull Calendrier soumis aux contraintes de lrsquo IntellirsquoAgence-ABG sans doute fin 2012

Journeacutees ABES ndash 20 juin 2012

Page 29: Tutoriel theses.fr : support pour diffusion sur le webQue trouve-t-on aujourd’hui dans theses.fr ? •Toutes les données validées dans STAR –Description de 11 397 thèses soutenues

Que trouvera-t-on demaindans thesesfr (3)

bull Des liens vers le catalogue des laquo thegraveses agrave la carte raquo de lrsquoANRT de Lille

bull Principe envoi reacutegulier (mensuel ) de la liste de NNTdisponibles dans laquo thegraveses agrave la carte raquo

bull Conseacutequence pour thesesfr faciliter lrsquoaccegraves au texte inteacutegral avec la possibiliteacute de commander un fac-simileacute de la thegravese

bull Calendrier soumis aux contraintes de lrsquoANRT sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (4)

bull Les donneacutees de Theacutesa pour les thegraveses en preacuteparation au sein drsquoeacutetablissements relevant de la CGE et non utilisateurs de STEP

bull Principe envoi reacutegulier (mensuel ) des donneacutees par lrsquoINIST

bull Conseacutequence pour thesesfr recenser toutes les thegraveses en preacuteparation

bull Calendrier soumis aux contraintes de lrsquoINIST sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (5)

bull Des liens vers les donneacutees non-documentaires issus des partenaires associatifs du projet IntellirsquoAgence-ABG par exemplendash Cvthegraveque

ndash Offres drsquoemploi

ndash hellip

bull Conseacutequence pour thesesfr servir les docteurs et les doctorants au-delagrave de leur travail acadeacutemique

bull Calendrier soumis aux contraintes de lrsquo IntellirsquoAgence-ABG sans doute fin 2012

Journeacutees ABES ndash 20 juin 2012

Page 30: Tutoriel theses.fr : support pour diffusion sur le webQue trouve-t-on aujourd’hui dans theses.fr ? •Toutes les données validées dans STAR –Description de 11 397 thèses soutenues

Que trouvera-t-on demaindans thesesfr (4)

bull Les donneacutees de Theacutesa pour les thegraveses en preacuteparation au sein drsquoeacutetablissements relevant de la CGE et non utilisateurs de STEP

bull Principe envoi reacutegulier (mensuel ) des donneacutees par lrsquoINIST

bull Conseacutequence pour thesesfr recenser toutes les thegraveses en preacuteparation

bull Calendrier soumis aux contraintes de lrsquoINIST sans doute fin 2012

Que trouvera-t-on demaindans thesesfr (5)

bull Des liens vers les donneacutees non-documentaires issus des partenaires associatifs du projet IntellirsquoAgence-ABG par exemplendash Cvthegraveque

ndash Offres drsquoemploi

ndash hellip

bull Conseacutequence pour thesesfr servir les docteurs et les doctorants au-delagrave de leur travail acadeacutemique

bull Calendrier soumis aux contraintes de lrsquo IntellirsquoAgence-ABG sans doute fin 2012

Journeacutees ABES ndash 20 juin 2012

Page 31: Tutoriel theses.fr : support pour diffusion sur le webQue trouve-t-on aujourd’hui dans theses.fr ? •Toutes les données validées dans STAR –Description de 11 397 thèses soutenues

Que trouvera-t-on demaindans thesesfr (5)

bull Des liens vers les donneacutees non-documentaires issus des partenaires associatifs du projet IntellirsquoAgence-ABG par exemplendash Cvthegraveque

ndash Offres drsquoemploi

ndash hellip

bull Conseacutequence pour thesesfr servir les docteurs et les doctorants au-delagrave de leur travail acadeacutemique

bull Calendrier soumis aux contraintes de lrsquo IntellirsquoAgence-ABG sans doute fin 2012

Journeacutees ABES ndash 20 juin 2012

Page 32: Tutoriel theses.fr : support pour diffusion sur le webQue trouve-t-on aujourd’hui dans theses.fr ? •Toutes les données validées dans STAR –Description de 11 397 thèses soutenues

Journeacutees ABES ndash 20 juin 2012