Machine tags de Flickr et folksonomies organisées
Patrick Peccattewww.softexperience.com
blog.tuquoque.com
Laboratoire d'histoire visuelle contemporaine (Lhivic)culturevisuelle.org/dejavu/
Dispositifs d'Information et de Communication à l'Ère Numérique (DICEN)
Séminaire Folksonomies et Taggingvendredi 26 mars 2010 - CNAM-Paris
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
Sommaire
Rappels sur Flickr et les tags Fonctions Rechercher et Explorer sur les tags Définition des machine tags et (non)-relation avec RDF Premiers exemples de machine tags Fonctions Rechercher et Explorer sur les machine tags Applications simples Applications "plus évoluées" API de Flickr et machine tags Avantages et inconvénients des machine tags
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
Présentation succincte de Flickr
Flickr est un site web de partage de photos et de vidéos Appartient à Yahoo! Annonce 4,4 milliards de photos
(en fait probablement de l'ordre de 3 milliards) Chaque photo peut être décrite par un titre, une
description, des tags (75 maximum par photo), des commentaires, des notes associées à des zones de la photo
Organisation des photos par albums et classeurs Groupes d'utilisateurs réunis sur des thématiques très
variées
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
Le titulaire d'un compte Flickr a la possibilité de contrôler qui peut ajouter des tags sur ses photos
http://www.flickr.com/account/prefs/photoprivacy/?from=privacy
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
Possibilité de rechercher uniquement sur les tagshttp://www.flickr.com/search/?m=tags
Possibilité d'explorer les tagshttp://www.flickr.com/photos/tags/
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
Possibilité d'explorer les tagshttp://www.flickr.com/photos/tags/tiger/
Possibilité d'explorer les tags - clustershttp://www.flickr.com/photos/tags/tiger/clusters/
Les clusters sont des regroupements automatiques des tagsqui interviennent le plus souvent dans une exploration
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
Tags et machine tags L'usage massif des tags sur Flickr est souvent
reconnu comme "emblématique" des folksonomies du Web 2.0
Ces folksonomies peuvent être organisées grâce aux machine tags
Les machine tags (en français tags de programmation) sont des tags tout à fait standards :
✔ ils peuvent être écrits à la main ou à l'aide de l'API de Flickr
✔ seule différence par rapport aux tags habituels :ils suivent une syntaxe particulière
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
Machine tagsUn machine tag est un triple tag, c'est-à-dire un tag de la forme :
namespace:predicate=valueoù :
✔ namespace est un espace de nom quelconque (grosso modo, un sujet ou une classe)
✔ predicate est un prédicat (ou champ, ou propriété) qui appartient à la classe ou au sujet défini(e) par l'espace de nom
✔ value est une valeur ; comme pour les tags Flickr habituels, les guillemets sont requis si la valeur comporte un espace
(terminologie de Flickr)
Un premier exemple(interfaces en anglais et en français)
Note : si la photo ne comporte pas de tags standards, alors les machine tasg sont affichés comme des tags (sans Show/Hide machine tags)
Machine tags - autres représentationsstatue hauteur 9.50m
statue nature bronze
statue ville Paris
statue localisation Place de la République
statue sculpteur Léopold et Charles Morice
statue sujet allégorie de la République
Tableau
statue hauteur = 9.50mnature = bronzeville = Parislocalisation = Place de la Républiquesculpteur = Léopold et Charles Moricesujet = allégorie de la République
Arbre
Les machine tags permettent de travailler avec une folksonomieorganisée, d'introduire une structuration peu formelle dans une folksonomie
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
Machine tags entre folksonomy et taxonomyprésentation de Flickr
taxonomy
folksonomy
Machine tags (MT) et RDF
Photo(resource) "MTvalue"
MTnamespace:MTpredicate
« Machine tags associated to a photo are much like RDF triples having that photo as its subject. The main difference is that the so-called "namespace" of the machine tag is not necessarily associated to a URI prefix. So there is no guarantee that different people will not use the same prefix with different meaning. But this was already true of plain tags, and is considered as a feature rather than a problem in the land of folksonomies :) »Wiki du W3Chttp://www.w3.org/2008/WebVideo/Annotations/wiki/FlickrMachineTags
La flèche n'est même pas un morphisme (map) au sens de la théorie des catégories : une même flèche MTnamespace:MTpredicate peut pointer sur deux MTvalue distinctes (d'où l'expression folksonomie organisée plutôt que catégorisée !)
triple RDF ??Non, mais presque...
Machine tags et RDF
A Performance and Scalability Metric for Virtual RDF Graphs,by Michael Hausenblas, Wolfgang Slany, Danny Ayers, 2007http://sw-app.org/pub/sfsw07-vrdfgraph.pdf
NQRDF The Poor Man's RDF
= Not Quite RDF
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
"RDFizers"introduire de véritables namespaces
Service pour obtenir une représentation RDF des informations sur une image FlickrFlickr photo info to RDF image descriptionhttp://www.kanzaki.com/works/2005/imgdsc/flickr2rdf
✔ mais date de 2005, donc ne prend pas en compte les machines tags Flickcurl: C library for the Flickr API, by Dave Beckett
http://librdf.org/flickcurl/Comporte un utilitaire flickrdf qui génère des triples RDFà partir d'une photo Flickr :
✔ « Machine tags when they are found are scanned for xmlns:prefix=uri and then all other machine tags with that prefix turn into triples. Several prefixes are also pre-defined by the library to automatically get turned into triples without an xmlns, such as blue:, cell:, filter: and geo:. Non-machine tags are not yet interpreted. »
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
Exemples de machine tagsThe Library Of Congress / The Commons
Le projet The Commons (les Organismes publics en français) a été lancé en janvier 2008 avec la publication sur Flickr de photographies de laLibrary of Congress
Actuellement 34 institutions participent au projet Objectifs :
✔ accroître l'accès aux collections détenues par des institutions du monde entier
✔ fournir au public un moyen lui permettant de contribuer à l'amélioration de la description de ces collections
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
The Library Of Congress / The Commons Machine tags utilisés par la LoC
✔ xmlns:dc=http://purl.org/dc/elements/1.1/✔ dc:identifier=http://hdl.loc.gov/loc.pnp/fsa.8b29516✔ commons:event=commonground2009
xmlns:dc : syntaxe "à la XML" (cependant, xmlns n'est pas standardisé en machine tags) -> l'espace de nom dc est bien le Dublin Core, mais le souci de rigueur ne va pas jusqu'à définir le préfixe commons ...
dc:identifier : la Library of Congress maintient le lien entre les images stockées sur Flickr et son catalogue en ligne (Prints and Photographs Online Catalog)
commons:event : l'image a été choisie en 2009 pour un événement global Common Ground regroupant plusieurs institutions -> sélection d'images par le public et projections sur les bâtiments des institutions
dc:identifier= http://hdl.loc.gov/loc.pnp/fsa.8b29516Identifiant persistant résolu par Handle System en :
http://lcweb2.loc.gov/cgi-bin/query/h?pp/PPALL:@field(NUMBER+@band(fsa+8b29516))
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
Utilisation Les machine tags xmlns:dc et dc:identifier
sont aussi utilisés par quelques institutions du projet The Commons :
✔ Powerhouse Museum Collection✔ New York Public Library✔ Boston Public Library (très partiellement)
Ainsi que par d'autres institutions qui ne font pas partie de The Commons(MIT OpenCourseWare, etc.)
Recherche sur les machine tags
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
Explore avec un joker sur predicate et valuehttp://www.flickr.com/photos/tags/dc:*=*
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
Explore avec un joker sur namespacehttp://www.flickr.com/photos/tags/*:user=
Explore sur un namespace + predicate + valuehttp://www.flickr.com/photos/tags/photo:process=daguerreotype
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
Explore avec un joker sur namespace et valuehttp://www.flickr.com/photos/tags/*:*=losangeles
suppression des espaces
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
Applications simples
"Simple" :machine tags = identifiant unique (id) ou saisie manuelle des informations
Montre la variété de l'utilisation des machine tags
Nécessité de groupes ou associations qui développent un vocabulaire spécifique à leurs besoins
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
Upcoming est un calendrier d'événements et unréseau social. Appartient à Yahoo!
http://www.flickr.com/photos/tags/upcoming:*=*(+373 000 photos)
Upcoming
Credit : Patrick H~ on Flickr, licence Creative Commons
Chaque événement est identifié par un numéro, ce qui permet d'effectuer des recherches précises sur les photos de cet événement
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
Last.fm est une webradio et un site internet proposant un système de collection de statistiques et
de recommandation de musiquehttp://www.flickr.com/photos/tags/lastfm:*=*
(+1457000 photos)
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
Last.fm
Credit : Christoph! on Flickr, licence Creative Commons
Identification des événements similaire à celui de Upcoming :autre namespace et même predicate
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
Rotocasted groupe d'amateurs de jouetshttp://rotocasted.com/
http://www.flickr.com/photos/tags/roto:*=*(+2400 photos)
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
Roto
Credit : blakewest on Flickr, licence Creative Commons
Autres applications simples Utata - collectif de photographes et d'écrivains qui partagent un même intérêt artistique. Groupe
Flickr : plus de 18000 membres et 300000 photos.http://www.flickr.com/photos/tags/utata:*=
Typedia – encyclopédie de dessins de caractèreshttp://www.flickr.com/photos/tags/type:*=
Citizen Weather Observer Program (CWOP) Station Metadata Group vise à constituer une base de photos sur les stations météorologiques du réseau CWOP http://www.flickr.com/photos/tags/wx:*=
Burning Man - « rencontre artistique et bariolée qui se tient chaque année dans le désert du Nevada » (Wikipedia)http://www.flickr.com/photos/tags/burningman:*=
Dopplr - « service gratuit de réseau social, lancé en 2001, qui permet aux utilisateurs de calcu-ler l'empreinte carbone que leurs voyages ont produit » (Wikipedia)http://www.flickr.com/photos/tags/dopplr:*=
Foursquare - outil de réseau social, de jeu et de microblogging qui permet à l’utilisateur d'indi-quer où il se trouve et de rencontrer ses contactshttp://www.flickr.com/photos/tags/foursquare:*=
Open Plaques – plaques bleues commémoratives d'événements ou de personnalités (en Grande-Bretagne)http://www.flickr.com/photos/tags/openplaques:*=
Lego – photos de constructions en Legohttp://www.flickr.com/photos/tags/lego:*=
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
Applications "plus évoluées"
Utilisation d'automatismes ou del'API Flickr
Utilisation de Flickr en relation avec une autre application
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
Taxonomie des plantes et animauxhttp://www.flickr.com/photos/tags/taxonomy:*=*
(+78000 photos)
Taxonomy
Credit : OliBac on Flickr, licence Creative Commons
Générateur de tags pour la taxonomie des oiseaux australiens http://flickr.webboy.net/
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
Générateur de tags pour la taxonomie des oiseaux australiens http://flickr.webboy.net/
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
Astrometry est un groupe Flickr créé en 2007.Un programme automatique scrute le groupe et identifie
les photos astronomiques d'après les positions des étoiles et planètes environnantes sur les clichés
http://www.flickr.com/photos/tags/astrometrydotnet:*=*(+7800 photos)
Credit : jimkster on Flickr, licence Creative Commons
Compte-rendudu robot
Astrometry.net
Machine tagsgénérés par le robot
Astrometry.net
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
Le projet AccessCeramics
accessCeramics est une collection de photos de céramiques contemporaines conçue pour être utilisée par des artistes, des enseignants, des chercheurs et le grand public
Le projet utilise les possibilités de Flickr et des réseaux sociaux tout en proposant également une interface web personnalisée
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
Le projet AccessCeramics
Les initiateurs du projet souhaitaient initialement utiliser Flickr comme un silo unique regroupant images et métadonnées accédées par une interface web utilisant l'API de Flickr
Mais les possibilités de Flickr sont apparues insuffisantes, en ce qui concerne la sécurisation des machine tags et l'impossibilité d'effectuer des recherches avec troncatures
Le projet AccessCeramics Images sur Flickr Métadonnées saisies par l'artiste stockées dans une base de
données MySQL Machine tags générées ensuite par un 'super-utilisateur'
accessCeramics sur Flickr
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
Le projet AccessCeramics
Les métadonnées utilisées sont un mélange de :✔ Dublin Core✔ VRA Core (un standard développé par la Visual
Resource Association) Choix effectué pour simplifier le processus
d'indexation des images La plupart des valeurs de champs proviennent du
Getty Art and Architecture Thesaurus
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
accessCeramics sur Flickrhttp://www.flickr.com/photos/tags/accessceramics:*=*
(+1300 photos)(+3000 photos dans la base)
AccessCeramics – saisie des métadonnées sur l'application MySQL
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
Sur accessCeramics.org (base MySQL)
Sur le groupe Flickr accessCeramicsCredit : accessCeramics guest on Flickrlicence Creative Commons
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
Autres applications "plus évoluées"
Fotopedia encyclopédie de photos en ligne mixant des contenus de Flickr, de Wikipedia et des utilisateurs.http://www.flickr.com/photos/tags/fotonauts:*=
WildlifeNearYou – site pour partager la passion de la vie sauvagehttp://www.flickr.com/photos/tags/wlny:*=*
Open Library – couvertures de livres (très peu développé...)http://www.flickr.com/photos/tags/openlibrary:*=
OpenStreetMap - projet pour créer des cartes libres du monde sous licence CC-BY-SA, en utilisant le système GPS ou d'autres données libreshttp://www.flickr.com/photos/tags/osm:*=
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
API Flickr
Pour exécuter une action à l'aide de l'API Flickr, vous devez sélectionner une convention d'appel, envoyer une requête à son point terminal en spécifiant une méthode et des arguments, puis vous recevez une réponse formatée
Format d'envoi : REST, XML-RPC, SOAP Format de retour : REST, XML-RPC, SOAP, JSON L'API Flickr dispose de 166 méthodes ... ... dont 5 pour travailler avec les machine tags
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
API Flickr flickr.machinetags.getNamespaces
Return a list of unique namespaces, optionally limited by a given predicate, in alphabetical order
flickr.machinetags.getPairsReturn a list of unique namespace and predicate pairs, optionally limited by predicate or namespace, in alphabetical order
flickr.machinetags.getPredicatesReturn a list of unique predicates, optionally limited by a given namespace
flickr.machinetags.getValuesReturn a list of unique values for a namespace and predicate
flickr.machinetags.getRecentValuesFetch recently used (or created) machine tags values
Ces API sont mises en œuvre par exemple avec la fonction Explore en utilisant des jokers * sur les machine tags (voir ci-dessus)
API Flickr – Exemplehttp://www.flickr.com/services/api/explore/?method=flickr.machinetags.getPredicates
<rsp stat="ok"> <predicates namespace="statue" page="1" total="6" perpage="500" pages="1">
<predicate usage="1" namespaces="1">hauteur</predicate> <predicate usage="2" namespaces="1">localisation</predicate> <predicate usage="1" namespaces="1">nature</predicate> <predicate usage="2" namespaces="1">sculpteur</predicate> <predicate usage="3" namespaces="1">sujet</predicate> <predicate usage="1" namespaces="1">ville</predicate>
</predicates> </rsp>
Une application : Flickr machine tag browser de Paul Mison
http://husk.org/code/machine-tag-browser.html
Navigation dans les machine tags selon les trois niveaux namespace, predicate, value
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
Lors du chargement d'une photo comprenant un mot-clé IPTC (ou XMP) observant la syntaxe d'un machine tag, celui-ci est effectivement reconnu comme un machine tag
La création des machine tags est libre et non contrôlée :✔ avantage : souple et facile✔ mais aussi inconvénient : c'est un capharnaüm
API : pas de possibilité de troncatures Problèmes de langue Accents et espaces Problème des machine tags qui demeurent dans l'index
après suppression des photos
Avantages et inconvénients des machine tags
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
Merci pour votre attention