Upload
juan-julian-merelo-guervos
View
2.988
Download
4
Embed Size (px)
DESCRIPTION
Para una lección en los cursos de verano de la Universidad de Extremadura
Citation preview
11
Analizando y creando redes sociales
Juan Julián Merelo GuervósDepto. Arquitectura y Tecnología de Computadores
Universidad de [email protected]
http://atalaya.blogalia.com
22
Introducción
¿Qué son las redes complejas?
El porqué de las redes complejas
Comportamiento a gran escala
Comportamiento de cada nodo
Redes sociales en Internet
33
Notas históricas
44
De qué va esto
Las redes complejas tienen características específicas
Los sistemas complejos pueden ser representados mediante redes
55
Nudos y mallas
Los elementos de una red son nodos y las conexiones entre ellos aristas o arcos.
66 Internet topology
Redes a cascoporro
Las aristas o arcos pueden ser físicos, virtuales o referirse a una relación
77
Tipos de grafos
Dirigidos/adirigidos
Geodésicas
Componentes/cliques
Grado
88
Grafos aleatorios
Se generan aleatoriamente
Tienen pinta de maraña
Pero no son muy realistas
99
Liándose como la zapatilla de un romano
La evolución de una red aleatoria va creando un componente principal y eventualmente un grafo conectado
1010
Una red compleja es como un toro
Una red permite entender, visualizar y cuantificar conjuntos conectados de agentes
1111
Por eso hay redes
Son una metáfora actual e intuitiva para percibir muchos fenómenos
1212
¿Quieres ser un superhéroe?
Alberich, y luego Gleiser, han investigado el Universo Marvel
1313
El culebrón del verano
1414
¿Qué hago ahora?
La visualización es un reto.
Y un problema np-completo.
1515
Vamos con una red
1616
Redes contra redes
1717
¿Para qué queremos esto?
Analizar cuantitativamente fenómenos complejos
Correlacionar medidas con resultado
Predecir los resultados futuros
1818
¿Es este tu amiguito?
Obtener los datos no es trivial.
Mediante encuestas, en entornos físicos.
Más generalmente, usando programas que analicen documentos o páginas web
1919
Procesar los datos
23 -
Reina
Pepe
9 - T
orre
s Fer
nand
o
8 - X
avi H
erná
ndez
22 -
de la
Red
Rub
én
6 - I
niest
a And
rés
15 -
Sergio
Ram
os
10 -
Fàbre
gas
Cesc
7 - V
illa D
avid
20 -
Juan
ito
12 -
Santi C
azor
la
1 - C
asilla
s Ik
er
18 -
Arbelo
a Álva
ro
2 - A
lbiol
Raúl
17 -
Güiz
a Dan
iel
11 -
Capde
vila
Joan
21 -
Silva
David
16 -
Sergio
Gar
cía
14 -
Xabi A
lonso
4 - M
arch
ena
Carlos
19 -
Senna
Mar
cos
3 - F
erna
ndo
Navar
ro
5 - P
uyol
Carles
0
5
10
15
20
25
30
35
40
45
50
23 - Reina Pepe
8 - Xavi Hernández
6 - Iniesta Andrés
10 - Fàbregas Cesc
20 - Juanito
1 - Casillas Iker
2 - Albiol Raúl
11 - Capdevila Joan
16 - Sergio García
4 - Marchena Carlos
3 - Fernando Navarro
Pases totales
Eurocopa 2008
23 - Reina Pepe
9 - Torres Fernando
8 - Xavi Hernández
22 - de la Red Rubén
6 - Iniesta Andrés
15 - Sergio Ramos
10 - Fàbregas Cesc
7 - Villa David
20 - Juanito
12 - Santi Cazorla
1 - Casillas Iker
18 - Arbeloa Álvaro
2 - Albiol Raúl
17 - Güiza Daniel
11 - Capdevila Joan
21 - Silva David
16 - Sergio García
14 - Xabi Alonso
4 - Marchena Carlos
19 - Senna Marcos
3 - Fernando Navarro
5 - Puyol Carles
Jugadores
Jug
ad
ore
s
Pases
2020
Visualizando la red
Uso de programas tales como el Pajek
También Netdraw, Visone....
2121
Primeras impresiones
¿La red está conectada?
¿Cómo están repartidos los enlaces?
¿Cuál es el diámetro?
2222
Segundas impresiones
¿Todos los nodos son alcanzables?
Transitividad Coeficiente de
clústering.
2323
En la red de traspasos
Está conectada 90 nodos Distancia media:
4.297 Coeficiente de
clustering: 0.059 Centralización:
4.12%
2424
Aparecen las leyes de potencia
y=k*x^-b Una representación log-log
muestra una línea recta Y= número de enlaces X= orden, frecuencia,
tamaño... Se reproduce en cantidades
derivadas: visitas, ventas, resultados...
2525
Leyes de potencia en el grado
P(k) ≈ k-
Donde k es el grado del vértice
2626
Lo que lleva a un comportamiento libre de
escala No hay número de
enlaces preferido En redes aleatorias la
distribución es de Poisson Por lo que no hay una
escala preferida Muchos enlaces son
improbables, pero posibles.
2727
¿Por qué aparecen las leyes de potencia?
Enlazado preferencial (Barábasi)
No siempre se cumple Efecto San Mateo
Los mejores consiguen más Otros modelos: log-normal,
exponencial estirada, Weibull.
2828
Se habla de club de ricos cuando los vértices con muchos enlaces solo se enlazan entre si
Estos ricos, como lo viven
2929
También hay redes antisociales
El grado de asortatividad depende de la red.
En el caso de los superhéroes, son disortativos.
3030
¿Y por qué deberían de importarme?
Distribuciones 80/20 (Pareto)
Listas-A Cola larga Condensado de
Bose-Einstein Monopolios
naturales
3131
Qué pequeño es el mundo
Las redes mundo-pañuelo necesitan pocos enlaces para conectarlo todo
Coeficiente alto de clustering Escalado logarítmico de la
longitud de camino con el tamaño.
3232
Empequeñeciendo el mundo
A partir de una red regular, con pocos enlaces.
3333
Redes complejas
Agrupamiento (clustering)
Enlazado preferencial
Leyes de potencias
Mundo pequeño
Componente gigante
Modularidad
3434
¿Y qué pasa con los nodos?
Miden la relevancia de un nodo (o enlace) dentro de la red.
Basadas en geodésicas Cercanía Intermediación (betweenness)
Basadas en el grado (o flujo) Centralidad de flujo Índice de poder de Bonacich Centralidad de eigenvalores
3535
En medio, como el jueves
El grado de intermediación mide la frecuencia con la que un nodo aparece en las geodésicas.
Si es alta controla el flujo de información.
kj jk
jikBETi g
gC
#
#
Número de geodésicas del nodo j al k que pasan por el nodo i.
Número de geodésicas del nodo j al nodo k.
3636
Traspasos de la liga
3737
Nos estamos acercando
La centralidad de cercanía mide cómo de cerca está un nodo del resto.
jij
CLOi dC
1
Longitud de la geodésica del nodo i al nodo k.
3838
Hay que tirar
Los nodos con alta cercanía son los primeros que consiguen nueva información (y los más eficientes para diseminarla).
3939
We got the power
El indice de poder de Bonacich mide la importancia de los vecinos de un nodo
Los que tienen un valor alto, pueden influenciar la red directa o indirectamente.
j
POWjij
POWi CAC
Matriz de adyacencias
Menor que el recíproco del eigenvalor mayor
4040
El poder para el atleti
Atlético
Villarreal
Racing
Mallorca
Espanyol
Recreativo
Málaga
Osasuna
Valladolid
Getafe
Numancia
Barcelona
Athletic
Celta
Poli Ejido
Al
mería
Sevilla
Betis
Valencia
Granada 74
Elche
Eibar
Racing de Ferrol
Real Sociedad
Murcia
Sporting
Borussia
Castilla
Alavés
0
2
4
6
8
10
12
14
Bonacich Power
Traspasos liga
Equipos
Po
we
r
4141
Centros y autoridades
En grafos dirigidos, importa los que reciben enlaces (autoridades) y los que los emiten (hubs)
4242
¿Y Google, qué opina de esto?
Los buenos hubs apuntan a buenas autoridades y viceversa.
El pagerank de Google se basa en el mismo concepto
4343
La autoridad reside en los reyes
AutoridadHub
Autoridad+Hub
Autoridad+Hub
4444
Todos los nodos son iguales
La centralidad de Eigenvector es una suma ponderada de los caminos que se originan en un nodo
Si tienen valor alto, pueden influenciar la red a través de múltiples caminos
j
EIGjij
EIGi CAC Reciprocal of the
largest eigenvalue
4545
Llegando por varios sitios al gol
4646
Fluyendo por el campo
La intermediación de flujo asimila una red a un sistema de tuberías.
Influye la centralidad, pero también la posición en los caminos entre dos vértices
4747
Eurocopa 2004: centralidad de flujo
FBC = 12.17 FBC = 7.39
Rusia 2 : 1 Grecia
Vladislav_RADIMOV
Dmitri_SYCHEV
Andrei_KARIAKA
Igor_SEMSHOV
Rolan_GUSEV
Dmitri_BULYKIN
Viacheslav_MALAFEEV
Roman_SHARONOV
Aleksandr_ANYUKOV
Dmitri_ALENICHEV
Vadim_EVSEEV
Dmitri_SENNIKOV
Dmitri_KIRICHENKO
Aleksei_BUGAYEV
Antonios_NIKOPOLIDIS
Giourkas_SEITARIDIS
Stylianos_VENETIDISTraianos_DELLAS
Angelos_BASINAS
Theodoros_ZAGORAKIS
Angelos_CHARISTEAS
Vassilios_TSIARTAS
Themistoklis_NIKOLAIDIS
Panagiotis_FYSSAS
Zisis_VRYZAS
Mihalis_KAPSIS
Konstantinos_KATSOURANIS
Dimitrios_PAPADOPOULOS
4848
Study 1: Flow Betweenness
(b= 0.10; BETA= 0.33)
4949
Gente a puñaos
Las redes complejas (y las sociales) tienden a formar clusters, grupos, comunidades o módulos.
5050
La red de las redes sociales
5151
La red tiene estructura
Red de colaboración científica en el Santa Fe
Institute
(ejemplo de [Girvan, Newman 2002; cond-mat/0112110])
5252
Experiencias intracorpóreas
Biochemical Journal www.biochemj.org
Biochem. J. (2004) 381, 1-12
Gráfico de sinergia de factores de
transcripción in S. cerevisiae
5353
Red de metaheurísticas
5454
¿Cómo hallamos la estructura de la red?
Problema de particionado de grafos
No se conoce el número de comunidades
Dos formas de atacarlo Aglomerativa Divisiva
5555
Divide y vencerás
(ejemplo de [Newman, Girvan, 2004; cond-mat/0308217])
Los enlaces entre comunidades tienen
alto betweenness
5656
Atacando la red
Cuando se eliminan las aristas con alta intermediación aparece un dendrograma
5757
Network structure
• A modularity measure:
r srs
Cr Csrs
ij A
A
e i j j
iji ea
i
ii iaeQ 2
fraction of edges between communities i and j
fraction of edges connecting to community i
fraction of edges within a community
expected value
5858
Red de coautorías en computación evolutiva
Comunidad de mayor tamaño
5959
¿Y en el fútbol?
6060
Redes sociales en internet
Tratan de usar los mecanismos naturales de las redes como una propuesta de ocio en Internet
Lo más entretenido es añadir “amigos”
6161
La red es una red de por si
Es inevitable crear una red social cuando se está en Internet
El API del grafo social de Google sirve para eso
6262
Los amigos de mis amigos son mis amigos
Microformatos (XFN)
Friend of a Friend – FOAF
Web semántica – RDF.
Mejor que aplicaciones cerradas
6363
Y todo esto, ¿pa qué?
La red social en internet refleja patrones de difusión de información
Y su estudio permite hallar la jerarquía personal
6464
Y, eventualmente, vender la moto
En el márketing viral, la gente se encargar de difundir un mensaje
Permiten una segmentación más fina de la población
6565
El fútbol es así
Las macromedidas de la red permiten compararlas y hacerse una idea general de las mismas.
Los índices de centralidad permiten medir la posible influencia de un nodo en otros.
Las redes pueden usarse en múltiples ámbitos
6666
Eso es todo
¡Muchas gracias!¡Muchas gracias!