68
INTRODUÇÃO À REDES COMPLEXAS E VISUALIZAÇÃO DE DADOS com gephi Newton Calegari, TIDD PUC-SP Maio 2014

Introdução à Redes Complexas e Visualização de Dados com Gephi

Embed Size (px)

DESCRIPTION

Slides da apresentação realizada no MediaLab Week SP, ocorrido na PUC-SP em Julho/2013. Atualização: Slides incrementados para apresentação no TIDD - PUC/SP, 2014.

Citation preview

Page 1: Introdução à Redes Complexas e Visualização de Dados com Gephi

INTRODUÇÃO À REDES COMPLEXAS E

VISUALIZAÇÃO DE DADOS com gephi

Newton Calegari, TIDD PUC-SP Maio 2014

Page 2: Introdução à Redes Complexas e Visualização de Dados com Gephi

REDES COMPLEXAS

2

Page 3: Introdução à Redes Complexas e Visualização de Dados com Gephi

sistemas complexos

3

Interação entre Propriedade emergente

TGS, Redes,

Cibernética...

Auto-organização, Evolução, Adaptação

elementos conectados

diversas relações

podem ser

mapeados

por redes

Page 4: Introdução à Redes Complexas e Visualização de Dados com Gephi

sistema complexo

4

rede

para cada

existe uma

que mostra as relações dos elementos

Page 5: Introdução à Redes Complexas e Visualização de Dados com Gephi

REDES

5

usamos

para estudar o comportamento dos

SISTEMAS COMPLEXOS

Page 6: Introdução à Redes Complexas e Visualização de Dados com Gephi

6

grafos e redes

Page 7: Introdução à Redes Complexas e Visualização de Dados com Gephi

7

Grafos e Redes

Euler, 1735“7 pontes de Königsberg”

VérticeAresta

Page 8: Introdução à Redes Complexas e Visualização de Dados com Gephi

8

Grafos e Redes

rede

Nó (node) Link Rede (network) Refere-se aos sistemas reais (redes sociais, neurônios...)

grafo

Vértice Aresta

Grafo É um modelo, uma

representação matemática

Page 9: Introdução à Redes Complexas e Visualização de Dados com Gephi

9

Grafos e Redes

Grafo

G = (V, E) V: conjunto de vértices E: conjunto de pares de V, arestas !

Arestas não direcionadas Grafo Arestas direcionadas Digrafo (grafo orientado)

[1: https://pt.wikipedia.org/wiki/Ficheiro:6n-graf.svg]

[1]

Page 10: Introdução à Redes Complexas e Visualização de Dados com Gephi

10

Grafos e Redes

conceitos de redes

Node degree número de links conectados ao nóin-degree

out-degreenúmero links de entrada ou saída de um nó em grafos orientados a soma de in e out resulta no grau do nó

Average degree L (links), N (nodes) não-orientado <k> = 2L÷N orientado <k> = L÷N

Page 11: Introdução à Redes Complexas e Visualização de Dados com Gephi

11

Grafos e Redes

conceitos de redes

in-degree 4out-degree 2Node degree 6

Page 12: Introdução à Redes Complexas e Visualização de Dados com Gephi

in-degree 4out-degree 2Node degree 6

in-degree 4out-degree 2Node degree 6

12

Grafos e Redes

conceitos de redes

Average degree 2.2

N: 10 L: 22

Page 13: Introdução à Redes Complexas e Visualização de Dados com Gephi

13

Grafos e Redes

Grafo completo

vértices arestas

Average degree

5 n(n-1)÷2 n-1

Page 14: Introdução à Redes Complexas e Visualização de Dados com Gephi

14

Grafos e Redes

representação

Lista de arestas {(1, 2), (1, 3), (1, 4) (2, 3), (3, 4)}

Lista de adjacências 1: 2, 3, 4 2: 1, 3 3: 1, 2, 4 4: 1, 3

Matriz de adjacências ⎡ 0 1 1 1⎤ | 1 0 1 0| | 1 1 0 1| ⎣ 1 0 1 0⎦

12

43

Page 15: Introdução à Redes Complexas e Visualização de Dados com Gephi

15

Grafos e Redes

grafo e digrafo

⎡ 0 1 1 1⎤ | 1 0 1 0| | 1 1 0 1| ⎣ 1 0 1 0⎦

12

4 3

matriz simétrica

⎡ 0 0 1 1⎤ | 1 0 0 0| | 0 1 0 1| ⎣ 0 0 0 0⎦

1 2

4 3

matriz não simétrica

Page 16: Introdução à Redes Complexas e Visualização de Dados com Gephi

16

Grafos e Redes

grafo e digrafo

⎡ 0 0 2 4⎤ | 3 0 0 0| | 0 2 0 1| ⎣ 0 0 0 0⎦

1 2

4 3

Peso nas arestas

3

2 21

4

Page 17: Introdução à Redes Complexas e Visualização de Dados com Gephi

17

Grafos e Redes

caminhos

A distância entre dois vértices é definida pelo número de arestas do menor caminho que os conecta

AB

D C

E

IF

G

H

Qual a distância entre os vértices A e I?

Page 18: Introdução à Redes Complexas e Visualização de Dados com Gephi

18

Grafos e Redes

caminhos

D

E G

H

AB

C IF

A distância entre dois vértices é definida pelo número de arestas do menor caminho que os conecta

Qual a distância entre os vértices A e I?

A, B, C, F, I 4 arestas

Page 19: Introdução à Redes Complexas e Visualização de Dados com Gephi

19

Grafos e Redes

caminhosA

B

D C

E

IF

G

H

A distância entre dois vértices é definida pelo número de arestas do menor caminho que os conecta

Qual a distância entre os vértices A e I?

A, B, C, F, I 4 arestas A, B, E, G, H, F, I 6 arestas

Page 20: Introdução à Redes Complexas e Visualização de Dados com Gephi

20

Grafos e Redes

caminhosA

B

D C

E

IF

G

H

A distância entre dois vértices é definida pelo número de arestas do menor caminho que os conecta

Qual a distância entre os vértices A e I?

A, B, C, F, I 4 arestas A, B, E, G, H, F, I 6 arestas A, D, C, F, I 4 arestas

Page 21: Introdução à Redes Complexas e Visualização de Dados com Gephi

21

Grafos e Redes

caminhosA

B

D C

E

IF

G

H

A, B, C, F, I 4 arestas A, B, E, G, H, F, I 6 arestas A, D, C, F, I 4 arestas A, C, F, I 3 arestas

A distância entre dois vértices é definida pelo número de arestas do menor caminho que os conecta

Qual a distância entre os vértices A e I?

Page 22: Introdução à Redes Complexas e Visualização de Dados com Gephi

22

Grafos e Redes

caminhos‣ Caminho (path)

‣ Distância (shortest path)

‣ Diâmetro do grafo (maior

distância no grafo)

‣ Distância média (average

path length)

‣ Ciclo (N início = N fim)

‣ Caminho euleriano (cada

aresta uma vez) ‣ Caminho hamiltoniano

(cada vértice uma vez)

Page 23: Introdução à Redes Complexas e Visualização de Dados com Gephi

23

Grafos e Redes

conectividade dos grafos‣ Grafo não orientado ‣ connected dois vértices quaisquer são alcançáveis por um caminho

‣ disconnected formado por dois ou mais componentes não conectados entre si

Page 24: Introdução à Redes Complexas e Visualização de Dados com Gephi

24

Grafos e Redes

conectividade dos grafos‣ Grafo orientado ‣ strongly connected cada vértice qualquer possui um caminho para outro vértice (e vice-versa)Ex, A->B e B->A.

‣ weakly connected é conectado se não considerarmos a direção das arestas

Page 25: Introdução à Redes Complexas e Visualização de Dados com Gephi

25

Grafos e Redes

componentes Conectados‣ strongly connected components

B, C, D, E A F G, H

‣ weakly connected components A B C D E G H F

Page 26: Introdução à Redes Complexas e Visualização de Dados com Gephi

26

Grafos e Redes

componentes Conectados‣ giant component componente que, geralmente, ocupa a maior fração da rede

Page 27: Introdução à Redes Complexas e Visualização de Dados com Gephi

redes

27

Page 28: Introdução à Redes Complexas e Visualização de Dados com Gephi

28

ciência das redes

Erdós e Renyi, 1959Modelo de Redes Randômicas !Adicionando links de maneira aleatória, quase todos os nós terão graus próximos

Page 29: Introdução à Redes Complexas e Visualização de Dados com Gephi

29

ciência das redes

Stanley Milgran, 1967“Six degrees” !Os seis graus de separação

Page 30: Introdução à Redes Complexas e Visualização de Dados com Gephi

30

ciência das redes

Mark Granovetter, 1973Clusters !Pequenos grupos fortemente conectados !Vínculos fortes e vínculos fracos

Page 31: Introdução à Redes Complexas e Visualização de Dados com Gephi

31

ciência das redes

Watts e StrogatzCoeficiente de clusterização !Hubs

Page 32: Introdução à Redes Complexas e Visualização de Dados com Gephi

32

redes randômicas

{ ... }

rede livre sem escala

ciência das redes

Page 33: Introdução à Redes Complexas e Visualização de Dados com Gephi

33

redes randômicas

•Modelo de Erdös-Renyi •Rede democrática

(probabilidade de conexão igual para todos os nós)

•Randômica •Estática

ciência das redes

Page 34: Introdução à Redes Complexas e Visualização de Dados com Gephi

34

rede livre sem escala•Modelo de Barabási •Exponencial •Lei de Pareto (80-20) •Permite crescimento dinâmico •Muitos nós são conectados à rede por

ligações com nós que possuem muitos links, os hubs

ciência das redes

Page 35: Introdução à Redes Complexas e Visualização de Dados com Gephi

35

rede livre sem escala‣A rede se expande com a adição de novos

nós com m links ‣Novos nós adicionados à rede preferem se

conectar com outros nós altamente conectados ‣Hubs se originam do crescimento e da

conexão preferencial

ciência das redes

Page 36: Introdução à Redes Complexas e Visualização de Dados com Gephi

36

modelo de rede randômica

Modelo de Erdös-Renyi

ciência das redes

Page 37: Introdução à Redes Complexas e Visualização de Dados com Gephi

37

modelo de rede randômica

80 nós 162 arestas Grafo não-orientado

ciência das redes

Page 38: Introdução à Redes Complexas e Visualização de Dados com Gephi

38

modelo de rede randômica

ciência das redes

Page 39: Introdução à Redes Complexas e Visualização de Dados com Gephi

39

modelo de rede livre sem escala

Modelo de Barabási

ciência das redes

Page 40: Introdução à Redes Complexas e Visualização de Dados com Gephi

40

modelo de rede livre sem escala

80 nós 79 arestas Grafo não-orientado

ciência das redes

Page 41: Introdução à Redes Complexas e Visualização de Dados com Gephi

41

modelo de rede livre sem escala

ciência das redes

Page 42: Introdução à Redes Complexas e Visualização de Dados com Gephi

42

modelo de rede livre sem escalaHubs

Nós que concentram grande número de conexões

ciência das redes

Page 43: Introdução à Redes Complexas e Visualização de Dados com Gephi

43

aplicações

Identificação de Comunidades

Organizações: encontrar grupos e comunidades

Biologia: locating funciontal modules (Ex: Se na análise de uma rede molecular há determinados hubs, possivelmente esses hubs são módulos que podem até desempenhar papel de maior importância no organismo, requerem maior atenção)

ciência das redes

Page 44: Introdução à Redes Complexas e Visualização de Dados com Gephi

44

aplicações

Localização de Caminho Ótimo

Organizações: networking, logística, encontrando vínculos sociais (redes sociais)

Biologia: diseases pathway

ciência das redes

Page 45: Introdução à Redes Complexas e Visualização de Dados com Gephi

45

aplicações

Viral (Viral Process)

Organizações: marketing viral, buzz

Computação/Epidemiologia: erradicando vírus, identificando como vírus se espalham

ciência das redes

Page 46: Introdução à Redes Complexas e Visualização de Dados com Gephi

visualização de dados

46

Page 47: Introdução à Redes Complexas e Visualização de Dados com Gephi

47

Visualização de dados

Visualização das redes

Page 48: Introdução à Redes Complexas e Visualização de Dados com Gephi

48

Visualização de dados

Visualização das redes

Page 49: Introdução à Redes Complexas e Visualização de Dados com Gephi

49

Visualização de dados

Visualização das redes

Page 50: Introdução à Redes Complexas e Visualização de Dados com Gephi

50

Visualização de dados

Visualização das redes

Page 51: Introdução à Redes Complexas e Visualização de Dados com Gephi

51

gephi

www.gephi.org

Page 52: Introdução à Redes Complexas e Visualização de Dados com Gephi

52

introdução ao gephi

Page 53: Introdução à Redes Complexas e Visualização de Dados com Gephi

53

introdução ao gephi

Page 54: Introdução à Redes Complexas e Visualização de Dados com Gephi

54

introdução ao gephi

Page 55: Introdução à Redes Complexas e Visualização de Dados com Gephi

55

Tamanho do nó

Cor

Centralizar grafo na tela

Mostrar/Esconder texto do nó Mostrar/Esconder

arestas

introdução ao gephi

Page 56: Introdução à Redes Complexas e Visualização de Dados com Gephi

56

introdução ao gephi

Page 57: Introdução à Redes Complexas e Visualização de Dados com Gephi

57

Detectando comunidades na rede

introdução ao gephi

Page 58: Introdução à Redes Complexas e Visualização de Dados com Gephi

58

Pluginsintrodução ao gephi

Page 59: Introdução à Redes Complexas e Visualização de Dados com Gephi

59

Pluginsintrodução ao gephi

[https://marketplace.gephi.org/]

Page 60: Introdução à Redes Complexas e Visualização de Dados com Gephi

60

Layouts

introdução ao gephi

ARF

Page 61: Introdução à Redes Complexas e Visualização de Dados com Gephi

61

Layouts

introdução ao gephi

Circular Layout

Page 62: Introdução à Redes Complexas e Visualização de Dados com Gephi

62

Layouts

introdução ao gephi

Concentric Layout

Page 63: Introdução à Redes Complexas e Visualização de Dados com Gephi

63

Layouts

introdução ao gephi

Dual Circle Layout

Page 64: Introdução à Redes Complexas e Visualização de Dados com Gephi

64

Layouts

introdução ao gephi

Fruchterman-Reingold

Page 65: Introdução à Redes Complexas e Visualização de Dados com Gephi

65

Layouts

introdução ao gephi

Radial Axis Layout

Page 66: Introdução à Redes Complexas e Visualização de Dados com Gephi

66

Principais formatos de arquivos suportados

• GEFX (XML; mais recursos; surgiu em 2007 com o Gephi)

• GraphML (XML; utilizado no NodeXL, Sonivus, NetworkX, Sonivus)

• PajekNET (Arquivo texto; um elemento por linha; reconhecido no Pajek, NodeXL, NetworkX)

• GDF (Parecido com tabela de BD ou arquivo CSV, possui definição de tipo; usado no GUESS)

• GML (Graph Modeling Language; Graphlet, Pajek, yEd, LEDA, NetworkX)

• CSV (Simples, pode ser usado com , ; | “espaço”; Ideal para raw data, dados exportados de BD e Excel)

introdução ao gephi

Page 67: Introdução à Redes Complexas e Visualização de Dados com Gephi

67[https://gephi.org/users/supported-graph-formats/]

introdução ao gephi

Principais formatos de arquivos suportados

Page 68: Introdução à Redes Complexas e Visualização de Dados com Gephi

68

Datasets

✓ Stanford Large Network Dataset Collectionhttp://snap.stanford.edu/data/ !

✓Gephi Wiki - Datasetshttp://wiki.gephi.org/index.php/Datasets

introdução ao gephi