Web Doc Adbs 6juillet2007

Preview:

DESCRIPTION

Les impacts du Web 2.0 sur les métiers de la documentation

Citation preview

Web 2.0 et documentation

Quand le web 2.0 interroge

les pratiques documentaires

conférence ADBS, le 6 juillet 2007

Hervé Le CrosnierUniversité de Caen

Web 2.0● Un concept marketing● Qui s'appuie sur des

changement réels du web– innovations techniques

– modèle de participation sociale

– changement dans les formes de valorisation économique

● C'est la conjonction de ces trois renouvellements qui fait le Web 2.0

Succès du concept● Le concept a été validé par les acteurs

eux-même, et repris dans la presse magazine grand public

● L'établissement du concept, et l'éclairage qu'il offre, a suscité de nouvelles innovations socio-techniques sur le web

● web science (Tim Berners-Lee)– comme l'ingénierie : proposition d'outils

– comme les sciences humaines : socio-écologie du réseau

Albums photo● Images publiques et

images privées● taggage (sujet)● métadonnées

géographiques (GPS)● mashup et

ré-utilisation● licences d'usage

(Creative commons)

Folksonomie

● partage des signets● indexation par centre

d'intérêt● coopération de veille● geste rendu facile

(bookmarklet)● flux RSS par personne

(ou groupe) ou par tag

Blogosphère

● De la publication à la conversation (Technorati)

● réseau de bloggueurs

● flux RSS

● expression personnelle (adolescents et skyblogs)

● financement micro-publicitaire

● nouvel espace public de débat

Journalisme citoyen

● témoignage et journalisme

● Editorialisation vs enquêtes

● local et global● nécessité de

former à l'écriture publique (exp. de Brest ou Place publique)

Wikipedia

● Ecriture collaborative ouverte

● disparition de la figure de l'auteur

● consensus ou vision du monde (projet des encyclopédistes du 18ème)

● Un succès massif

● auto-correction et crédibilité (comparaison avec Brittanica par Nature)

Réseaux sociaux

● créer des liens entre amis d'un même espace virtuel

● l'étendue de ce réseau permet de mesurer le succès

● vente en ligne● rencontres personnelles

ou professionnelles

Musique

● recherche de notoriété

● remise en cause du modèle de l'industrie musicale

● vente directe en ligne

Vidéo

● constitution d'un stock par les internautes

● réutilisation dans les pages personnelles et les blogs

● problèmes de droit d'auteurs

● vie privée, image publique

Archivage

● Grandes capacités de stockage (TeraOctets)

● échantillonage● sélection par les

usagers (Hanzoweb)

● folksonomie

Du portail à la page d'accueil

● Organisation personnalisée

● Ajax● flux RSS et

Podcasts● Usage privé, base

de données des intentions

Commerce 2.0

● C2C : consumer to Consumer

● Recueillir les critiques et commentaires

● listes et sélections (shoposphere), information entre consommateurs

● échelles de notoriété (des vendeurs, des critiques, des préconisateurs)

● Web services : programmes d'associés

Moteurs !

● Financement publicitaire

● méthodes d'appariement intégrant les usages (page rank)

● création de nouvelles interfaces (SmartSearch, Exalead)

● Recherche documentaire ou nouveau média ?

Techniques

● Le navigateur web comme une plate-forme (eBay et Firefox Companion)

● Applications sur le réseau (Google documents & spreadsheet) pour la collaboration

● Flux RSS, Tag Clouds,

● Importance de Flash (indépendance envers le navigateur ?)

● Ajax et micro-publicité (AdSense)

● Lecture multimodale (navigateur, mobile,...)

● Vidéo et animations (rich media)

Web services

● « Programmer à l'échelle du web » (Jeff Bezos)

● relations serveur à serveur

● Une architecture de partage et de contrats

● Mashups

Pratiques sociales

● Le coeur du web est à sa périphérie, dans les usagers

● un web inscriptible

● Folksonomie, taggage

● Partage des repérages : intelligence collective pour la sélection et la découverte

● frontière floue entre sphère publique et sphère privée

● réseau social

● culture du mixage

● vidéo, partout, toujours (cf. pratiques des adolescents)

Économie

● constitution de grands groupes verticaux● par rachat d'entreprises plutôt que

introduction en bourse● économie de la longue traîne● place de la publicité contextuelle (ou

micro-publicité)● data is power● système en évolution permanente (beta)

Public / Privé

● La frontière entre le privé et le public devient ténue– les albums photo privés sont souvent

accessibles au public (Flickr, Riya)– les goûts que l'on affiche (Myspace)– les pétitions que l'on signe sont publiques

et permanentes– Recherche d'emploi et web

Reconnaissance des visages

● un album photo chez Riya.com

● Habitude grand-public de techniques policières ou militaires

● Et si on croisait des albums, des photos publiques (manifestations,...)

Technologies de l'identité

● Les technologies proches de l'individu (mobile, iPod, wearable computers, blackberry,...)

● aident à la construction de soi dans l'univers numérique

– mise en place de playlists

– autoportrait (usage du mobile photo)● apprentissage de l'individualisation dans une société

massifiée

– le walkman, point tournant

– l'informatique diffuse (pervasive computing : assister implicitement les individus dans leur vie quotidienne)

– dans la ville numérique

Gestion de l'identité

● La tentation médiatique :

– la mise en scène de son existence– surtout chez les adolescents

● On agit sur une sphère publique depuis son lieu intime

● Sans avoir la formation, ni l'entourage des gens des médias

● Il va falloir apprendre à vivre avec cette nouvelle donne

– comme on a appris à vivre en ville

Economie de l'identité

● Connaître l'usager

● par ses traces, ses usages... sur de multiples plate-formes

● lui donner des informations adaptées (géolocalisation, centres d'intérêt, actualité,...)

● et cibler la publicité (adwords de Google ou smartads de Yahoo)

● Industrie de l'influence

Web sémantique

● Rendre l'information disponible sur le web utilisable directement par des machines

● pour améliorer le service de filtrage ou d'extraction de connaissances proposé aux utilisateurs

● Un projet décentralisé, à l'image du web● ... et fédérateur (visant l'ensemble du

savoir)

Quelques caractéristiques● Il s'agit de construire des descriptions sémantiques

utilisables par des communautés à l'intérieur du web

● Le web sémantique s'appuie sur une forte normalisation

– des échanges (SOAP, WSDL, XML)

– des langages de descriptions (RDF, OWL)

– des langages de requêtes et d'inférence (SPARQL)● Il est nécessaire de consacrer une partie de l'énergie de

production de documents à organiser des accès sémantiques (métadonnées, construction de schémas de description et d'ontologies)

● ce qui est une différence avec le Web 2.0 qui cherche à utiliser les usages simples des lecteurs (statistiquesd'usage)

RDF

● RDF : Resource Description Framework

● Un langage de graphe

● Permettant d'associer dans un triplet :

– Un sujet ( "Hernani")

– Un prédicat ( "a pour auteur")

– Un objet ( "Victor Hugo")● Chaque élément du triplet est représenté par un

URI ( Uniform Resource Identifier)

● Y compris la relation (exp : Dublin Core)

● ce qui permet une normalisation et un partage de la sémantique des expressions utilisées

Représentation XML● <?xml version="1.0"?><rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:exterms="http://www.example.org/terms/">

<rdf:Description rdf:about="http://www.example.org/index.html"><exterms:creation-date>August 16, 1999</exterms:creation-date><dc:language>en</dc:language><dc:creator rdf:resource="http://www.example.org/staffid/85740"/>

</rdf:Description></rdf:RDF>

Du document aux relations

● XML : balisage sémantique● RDF : relations sémantiques● Lecture : interprétation par un humain● Extraction : transformer l'information

(GRDDL) en utilisant au mieux le balisage (microformats, RDF-A)

● Requêtes logiques : extraire un « sous-graphe » en tenant compte des définitions des

relations logiques (prédicats) – langage SPARQL

Microformats

● hCard, pour la description des personnes et organisations

● <div class="vcard"> <div class="fn org">Wikimedia Foundation Inc.</div> <div class="adr"> <div class="street-address">200 2nd Ave. South #358</div> <div> <span class="locality">St. Petersburg</span>, <abbr class="region" title="Florida">FL</abbr> <span class="postal-code">33701-4313</span> </div> <div class="country-name">USA</div> </div> <div>Phone: <span class="tel">+1-727-231-0101</span></div> <div>Email: <span class="email">info@wikimedia.org</span></div> <div> <span class="tel"><span class="type">Fax</span>: <span class="value">+1-727-258-0207</span></span> </div></div>

RDF-A

● Intégrer les triplets RDF dans du code HTML

● <p class="contactinfo" about="http://example.org/staff/jo"> My name is <span property="contact:fn">Jo Smith</span>. I'm a <span property="contact:title"> distinguished web engineer </span> at <a rel="contact:org" href="http://example.org"> Example.org </a>. You can contact me <a rel="contact:email" href="mailto:jo@example.org"> via email </a> </p>

Le « cake » du web sémantique

● Un projet fédérateur

● dans lequel les documentalistes doivent trouver une place

– construire les ontologies

– assurer la confiance dans les descriptions

– garantir la ré-utilisabilité

● construire des outils sémantiques coopératifs

sémantique sociale

● Les usagers– expriment des

besoins,

– créent et diffusent des documents

– ajoutent de l'intentionalité (folksonomie) aux documents existants

– et les valident par la critique (notoriété) ou les statistiques d'usage

● Les documentalistes– adaptent les signaux

des usagers pour les rendres utilisables par des moteurs d'inférence logique (web sémantique, indexation, classification)

– créent les outils facilitant l'indexation par les usagers, la sélection et la diffusion.

cyberinfrastructure

● Un buzzword politique

● un ensemble d'outils et de mise en relation

● des sources (documents, données, collections) considérées comme un « bien commun »

Redocumentarisation

● Les documents numériques ont besoin de clés de description complexes (et d'outils d'interprétation de cette complexité)

● le continuum numérique permet d'associer traces et documents aux relations humaines

● organiser la gouvernance de l'univers documentaire numérique (sélection, validation, conservation,...)