Réseaux sociaux comme support d'outils de recommandation
Analyse de réseaux socio-sémantiquesCécile Bothorel Département LUSSI
Cécile Bothorelpage 2 Département LUSSI
Sommaire
Web, recherche d'information, web social, naviguerrance, filtrage et popularité
Vers un accès synthétique et personnalisé • Analyse de réseaux socio-sémantiques
Du browsing au subscribing, une affaire de filtrage et de popularité
Cécile Bothorelpage 4 Département LUSSI
Types d'accès à l'information = « browsing » et « searching »
Browsing
• Navigation, de page html en page html
• Le fil conducteur, mon propre intérêt Searching
• Requête + navigation
• Matching entre des termes et des contenus
• L'algorithmique du moteur de recherche devient le prescripteur
• Pertinence
Cécile Bothorelpage 5 Département LUSSI
Types d'accès à l'information : « wilfing »
Partage Souscription
• web 2.0 + médias sociaux + RSS
• Navigation sans but, trouvailles surprenantes, sérendipité
• Internautes producteurs• Choix de ses internautes « prescripteurs »
What was I Looking For?
Cécile Bothorelpage 6 Département LUSSI
Accès à l'information
Toujours plus d'infobésité
• De liens hypertextes
• De contenus
• De prescripteurs potentiels
Tout est question de filtrage et de recommandation
… et de popularité
1 trillion de liens internet, 27 milliards de pages web indexées
75 millions de comptes Twitter dont 15 millions actifs
Plus d'1 milliard de vidéos visionnées par jour sur YouTube
4 milliards de photos sur FlickR
15 millions de français sur FaceBook
2 millions de profils consultés sur Viadéo
http://www.slideshare.net/jmlouche/mdias-sociaux-les-chiffres-retenir
Cécile Bothorelpage 7 Département LUSSI
Filtrage et popularité
http://complexnetworks.fr/
• 1998 PageRank de Google : mesure de pertinence dans l’ordonnancement des réponses aux requêtes
Cécile Bothorelpage 8 Département LUSSI
Filtrage et popularité
Cécile Bothorelpage 9 Département LUSSI
Vers un filtrage plus fin
Challenger le principle de pareto : 20% des contenus génèrent 80% des ventes
Analyse de réseaux socio-sémantiques et recommandation
Cécile Bothorelpage 11 Département LUSSI
Analyser un réseau
Cécile Bothorelpage 12 Département LUSSI
Graphes réels
Graphes réels, grands graphes terrain, complex networks
Propriétés structurelles communes
• faible densité en arcs,
• en moyenne des chemins courts (effet petit monde),
• existence de zones denses en arcs,
• incidence des sommets en loi de puissance. Structure de graphe rare d’un point de vue
probabiliste → un domaine de recherche jeune
→puise ses concepts dans l'analyse de réseaux sociaux
Cécile Bothorelpage 13 Département LUSSI
Détection de communautés
La délimitation en groupes n'est pas un a priori • On ne cherche pas qui
appartient à une famille, communauté ethnique ...
• Mettre en évidence une catégorie émergente, basée sur l'analyse de la topologie
Karate Club in an AmericanUniversity [Zachary 1977]
Cécile Bothorelpage 14 Département LUSSI
Détection de communautés
Quatre types d’approches (thèse P. Pons, 2007)• Classiques• Séparatives• Agglomératives• Marches aléatoires
P. Pons, 2007
Trouver la partitionP = {C1, . . . , Ck} qui optimise la
fonction de qualité Q(P)
Cécile Bothorelpage 15 Département LUSSI
Détection de communautés
Quatre types d’approches (thèse P. Pons, 2007)• Classiques
• Séparatives
• Agglomératives
• Marches aléatoires
Calcul de positions clés locales à une communauté
• Centralité, PageRank, Hits
• Elements « frontières »
• Etiquetage des groupes par les thématiques saillantes (textmining, folksonomy mining)P. Pons, 2007
Trouver la partitionP = {C1, . . . , Ck} qui optimise
la fonction de qualité Q(P)
25
31
6
15
horreur DiCaprio
Cécile Bothorelpage 16 Département LUSSI
Réseaux sociaux et similarité
Méthodes locales
• Nombre de voisins communs
• Coefficient de Jaccard
• Adamic/Adar Measure
Méthodes globales
• Longeur des plus courts chemins
• Katz
• Hits, PageRank
• SimRank tagging
co-tagging
Cécile Bothorelpage 17 Département LUSSI
Réseaux sociaux et confiance
Comprendre, modéliser le réseau de confiance/opinions
• TrustRank (lutte anti spam) : mesure gloabale
• TidalTrust : mesure locale
• Propagation de confiance
Networks, Crowds, and Markets: Reasoning About a Highly Connected World By David Easley and Jon Kleinberg, à paraître en 2010
Cécile Bothorelpage 18 Département LUSSI
Modélisation Réseaux et contenus et ...
Cécile Bothorelpage 19 Département LUSSI
Conclusion
Analyse de réseaux
• Détection de communautés, calcul de similarité, propagation de confiance
Modélisation des échanges sur les médias sociaux
• Vers des réseaux socio-sémantiques Compréhension des usages
• Cartographie des échanges
• Visualisation Réseaux égo-centrés
• Prédiction de liens
• Recommendation de contenus, popularité locale
• Visualisation/exploration de un point de vue
Cécile Bothorelpage 20 Département LUSSI
Merci
Recommended