Upload
others
View
2
Download
0
Embed Size (px)
Citation preview
1
Análise de uma Rede Complexa: Um Ensaio
Sobre a Transmissão de Volatilidade
Entre Commodities no Curto Prazo
Marcelo de Oliveira Passos1
Mathiaz Schneid Tessmann2
Regis Augusto Ely3
Lisa Mariane Bueno4
Resumo: Este trabalho desenvolve uma aplicação do algoritmo Force Atlas2: uma
distribuição de layout para grafos e redes complexas. Também é elaborada uma breve
revisão da literatura sobre grafos e redes complexas. Nesse sentido, foram comentadas
as principais medidas estatísticas e propriedades da análise de redes, assim como as
noções fundamentais sobre as distribuições Force Atlas 1 e 2. A Force Atlas 2 foi usada
para gerar a rede de transmissão de volatilidade entre 10 das principais commodities
negociadas na Bolsa de Chicago (Chicago Mercantile Exchange). Os resultados
(distribuição e layout de Force Atlas2 e estatísticas da rede) foram analisados. Os dados
utilizados foram obtidos do artigo de Ely e Tessmann (2018), que calcularam os índices
de spillover desenvolvidos por Diebold e Yilmaz (2012).
Palavras – Chave: redes complexas, análise estatística de dados em rede, sistemas
complexos, abordagem de redes, grafos, commodities, índice de spillover.
Códigos JEL: Q50, K32, C20
Abstract: This work develops an application of the Force Atlas2 algorithm: a layout
distribution for graphs and complex networks. A brief review of the literature on
complex networks and graphs is also presented. In this sense, the main statistical
measures and properties of the network analysis were commented, as well as the
fundamental notions about the Force Atlas 1 and 2 distributions. Force Atlas 2 was
used to generate the volatility transmission network among 10 major traded
commodities on the Chicago Mercantile Exchange. The results (distribution and layout
of Force Atlas2 and network statistics) were analyzed. The data used were obtained
from the article by Ely and Tessmann (2018), who calculated the spillover indices
developed by Diebold and Yilmaz (2012).
Keywords: complex networks, network data statistical analysis, complex systems,
network approach, graphs, commodities, spillovers.
JEL Codes: Q50, K32, C20
.
1 Professor adjunto do Mestrado em Economia Aplicada da Universidade Federal de Pelotas (PPGOM-
UFPel). 2 Mestrando em Economia Aplicada do PPGOM-UFPel. 3 Professor adjunto do Mestrado em Economia Aplicada da Universidade Federal de Pelotas (PPGOM-
UFPel). 4 Economista graduada na Universidade Federal de Pelotas (UFPel).
2
1. Introdução
O principal objetivo deste trabalho é - a partir dos com os dados de transmissão de
volatilidade entre 10 das principais commodities negociadas na Bolsa de Chicago (Chicago
Mercantile Exchange) - gerar uma rede, calcular suas estatísticas e analisar os resultados da
distribuição do algoritmo de Force Atlas 2. Outro objetivo específico é elaborada uma breve
revisão da literatura sobre grafos e redes complexas, além de apresentar os resultados de outras
distribuições de grafos. Esta revisão, que inclui também um breve glossário, tem por finalidade
facilitar a apresentação de dois métodos quantitativos (teoria dos grafos e ciência de redes) que
estão sendo, desde a década passada, cada vez mais amplamente utilizados em revistas acadêmicas
internacionais, embora ainda sejam novidade na pesquisa econômica feita no Brasil.
Na primeira seção são apresentados os aspectos conceituais e históricos da teoria dos grafos
e da descrição de redes complexas.
A segunda seção é composta pela metodologia: as medidas estatísticas para analisar redes,
tanto ao nível do agente quanto ao nível da rede. Nela há uma exposição sobre como analisar
arestas, clusters e as propriedades das redes, além de algumas ferramentas estatísticas para detectar
e analisar clusters e as seis propriedades para investigar redes reais. Por fim, são apresentados os
métodos Force Atlas e Force Atlas 2 para elaborar grafos.
Na terceira e quarta seções, são descritas as fontes dos dados e analisados os resultados.
Na última seção são feitas as considerações finais.
2. Aspectos históricos e conceituais da teoria dos grafos e análise de redes
2.1. Definição de Grafo
Segundo Ruohonen (2013), existem duas formas de se definir o que é um grafo: a conceitual
e a formal.
Conceitualmente, segundo ele, um grafo é composto por vértices e arestas que conectam
estes vértices.
Figura 1 - Grafo formado por um conjunto de vértices e arestas
Fonte: Ruohonen (2013)
Formalmente, um grafo é um par de conjuntos, isto é, G = (V,E), onde V é um conjunto de
elementos chamados vértices e E é um conjunto de pares de vértices não ordenados denominados
linhas ou arestas (o E, vem do inglês edge).
3
2.2. Teoria dos grafos
A Teoria dos Grafos é atualmente uma das áreas mais importantes da matemática discreta.
Tendo as suas raízes em jogos e recreações matemáticas, atribui-se a sua criação a Euler, ao
resolver o problema das pontes de Königsberg em 1736, mas foram os problemas acerca de
formulas de estrutura de compostos químicos, que Arthur Cayley (apud Pegg, Rowland e
Weisstein, 2018) resolveu na segunda metade do século XIX, que a começaram a desenvolver.
Hoje, a Teoria dos Grafos tem sido aplicada a muitas áreas (Informática, Investigação Operacional,
Economia, Sociologia, Genética, etc.), pois um grafo constitui o modelo matemático ideal para o
estudo das relações entre objetos discretos de qualquer tipo.
Conforme Pereira (2013), um grafo G = (V, E) é um sistema formado por um conjunto V de
elementos chamados vértices, pontos, agentes ou nós, e um conjunto E de pares não ordenados de
vértices chamados linhas ou arestas. É usual também escrever apenas V(G) ou E(G) para expressar
que V e E são, respectivamente, os conjuntos de vértices e linhas do grafo G. Um dígrafo ou grafo
dirigido5 D = (V, A) é definido de forma parecida. Ocorre que A é o conjunto de pares ordenados
que se denominam arcos. Agora, V(D) e A(D) são, respectivamente, o conjunto de vértices e de
arcos ou linhas do dígrafo D. Ainda segundo Pereira (2013), há pouco consenso e muita diversidade
entre as nomenclaturas adotadas pelas teorias dos grafos e das redes. Ele utiliza os termos arestas
para as linhas de um grafo e arcos para as linhas de um dígrafo. Mas o próprio autor afirma que há
aqueles que não seguem esta convenção e também coloca que:
“É certo que, em teoria dos grafos, continua a faltar uniformidade de terminologia até
mesmo a respeito dos conceitos mais básicos. J.B. Pacheco de Amorim foi, salvo
involuntária omissão, o primeiro matemático de língua portuguesa a desenvolver
investigação nesta área: em 1953, na sua tese de doutoramento, usou sempre a palavra rede.
É curioso que, especialmente entre engenheiros, esta palavra ainda continua a ser
sistematicamente usada para significar grafo, dirigido ou não. Hoje isto é sintoma de
divórcio entre Ciências Básicas e Ciências Aplicadas ou Tecnológicas porque, atualmente,
entre matemáticos, grafo e digrafo são as palavras mais usadas, ficando rede reservada para
quando as linhas (ou os vértices) do grafo ou digrafo são afetados de valores. É a convenção
que Busacker e Saaty (1965) também seguem.” (Pereira, 2013, p. 1-2 ).
Neste texto, para manter a uniformidade, usaremos, alternadamente, os termos vértices (ou
agentes) e arestas (ou conexões) para designar os elementos das redes6 que serão analisadas,
independente de serem redes ou grafos direcionados ou não.
Grafos podem ser classificados de acordo com a direção das ligações. Grafos não
direcionados ou redes não direcionadas são grafos cujas arestas conectam pares de vértices não
ordenados, ou seja, cada aresta do grafo liga ao mesmo tempo dois vértices. Um exemplo deste tipo
de grafo é o Facebook, já que nesta rede social, o vínculo de amizade estabelecido é mutuo. Grafos
direcionados D = (V, A) ou redes direcionadas são grafos cujas arestas têm uma orientação
atribuída, por isso é possível atribuir um significado à ordem dos vértices. Graficamente, arestas
direcionadas são representadas por setas, que indicam a direção da ligação. O Twitter é um exemplo
de gráfico direcionado, já que o indivíduo pode ser seguido por outros, sem necessariamente segui-
los também.
Uma exposição detalhada dos teoremas da teoria dos grafos não é o objetivo deste trabalho.
Mas é útil conhecer alguns conceitos preliminares. Portanto, elabora-se um glossário resumido no
5 Também chamado de quiver. Digrafo é um termo muito utilizado em textos matemáticos de língua portuguesa e que
deriva do inglês directed graph. 6 A rede aqui analisada é um digrafo com arestas valoradas (também chamadas de ponderadas ou pesadas).
4
anexo 3 deste trabalho, baseado nas descrições de Jackson (2010), Easley e Kleinberg (2010) e
Rabuske (1992).
2.3. As sete pontes de Königsberg
A teoria dos grafos é oriunda da solução de um problema clássico resolvido pelo matemático
Leonhard Euler em 1736. O problema é baseado na cidade de Königsberg (território da Prússia até
1945, atual Kaliningrado). Uma cidade próxima do Mar Báltico e que é cortada pelo Rio Pregel (em
alemão) ou Prególia (em russo). Nela, há duas grandes ilhas que, juntas, formam um complexo que
na época continha sete pontes, conforme mostra a figura 2. Discutia-se nas ruas da cidade a
possibilidade de atravessar todas as pontes uma e só uma vez e, ao final, regressar ao ponto de
partida7. A questão virou uma “lenda urbana” e o povo acreditava ser possível fazer isto. Até que
Euler, em 1736, no trabalho publicado no volume 8 da revista Comentarii Academiae Scientiarum
Imperialis Petropolitanae8, provou que não existia caminho que possibilitasse tais restrições. Euler
transformou os caminhos em linhas e suas intersecções em pontos, criando possivelmente o
primeiro grafo da história (figura 4). Ele notou que só seria possível atravessar o caminho inteiro
passando uma única vez em cada ponte se houvesse exatamente zero (nenhum ponto) ou dois
pontos dos quais saíssem um número ímpar de caminhos. Só que de cada ponto deve haver um
número par de caminhos, pois será preciso um caminho para "entrar" e outro para "sair".
Os dois pontos com caminhos ímpares referem-se ao início e ao final do percurso, pois estes
não precisam de um para entrar e um para sair, respectivamente. Se não houver pontos com número
ímpar de caminhos, deve-se iniciar e terminar o trajeto no mesmo ponto, podendo esse ser qualquer
ponto do grafo. Isso não é possível quando temos dois pontos com números ímpares de caminhos,
sendo obrigatoriamente um o início e outro o fim.
Euler mostrou que não é possível passar pelas pontes uma única vez e conseguir terminar o
percurso das sete pontes, a menos que o número de pontes seja par.
O caso das sete pontes de Euler diferencia as abordagens geométrica e topológica. A
caracterização topológica não incide sobre a forma específica dos objetos ou posição, como a
geométrica, e sim sobre a ligação dos objetos. O problema das sete pontes pode ser observado como
uma rede com quatro nós e sete ligações.
Figura 2 - As sete pontes de Köningsberg
Fonte: MIT OpenCourseWare
7 Conforme Pereira (2013, p. 101): “Hoje representamos pontes, ilhas e margens por um multigrafo e traduzimos a
questão dizendo que se procura uma trilha fechado nesse multigrafo. ” 8 Deste trabalho pioneiro nasceram, além da teoria dos grafos, a Topologia.
5
Figura 3 – Grafo que representa as 7 pontes
Fonte: Marino (2012)
A solução de Euler do problema das "Sete Pontes de Königsberg" é considerada a primeira
prova verdadeira na teoria das redes.
2.4. Stanley Milgram e a Teoria dos Seis Graus
A manifestação mais conhecida da história das redes é a Teoria dos seis graus de separação,
originada através de um experimento do cientista social Stanley Milgram (Watts, D. 1999).
Milgram concluiu que em termos de contato social, os indivíduos norte-americanos estavam
separados em média por 6 pessoas. A experiência consistiu no envio de correspondência de um
grupo de pessoas para um segundo grupo. Desses dois grupos, 196 remetentes estavam no Nebraska
e os 100 destinatários em Boston.
A regra fundamental consistia em que cada remetente enviasse a correspondência para um
conhecido próximo que encaminharia a carta para o destino final, Boston. O resultado da
experiência foi que 29% dos remetentes conseguiram fazer as correspondências chegarem ao
destinatário em Boston, e em média foram necessários 6 intermediários para fazer a
correspondência chegar ao destinatário final.
2.5. Descrevendo redes
A maioria das redes sociais, biológicas e tecnológicas, exibem características topológicas
não triviais substanciais, com padrões de conexão entre seus elementos que não são puramente
regulares nem puramente aleatórios.
Tais características incluem uma cauda pesada na distribuição de grau, um alto coeficiente
de agrupamento, assortatividade ou desastrosidade entre vértices, estrutura da comunidade e
estrutura hierárquica. No caso de redes direcionadas, esses recursos também incluem reciprocidade,
perfil de significância de tríade e outros recursos.
Em contraste, muitos dos modelos matemáticos de redes que foram estudadas no passado,
como redes e gráficos aleatórios, não mostram esses recursos.
As estruturas mais complexas podem ser realizadas por redes com um número médio de
interações e isso corresponde ao fato de que o conteúdo máximo de informação (entropia) é obtido
para probabilidades médias.
Duas classes bem conhecidas e muito estudadas de redes complexas são as redes sem escala
(scale free) e as redes de mundo pequeno (small world), cuja descoberta e definição são estudos de
caso canônicos na área de rede.
No entanto, como o estudo de redes complexas continuou a crescer em importância e
popularidade, muitos outros aspectos da estrutura da rede também atraíram atenção.
6
Recentemente, o estudo de redes complexas foi expandido para redes de redes e, se essas
redes são interdependentes, elas se tornam significativamente mais vulneráveis a falhas aleatórias e
ataques direcionados e exibem falhas em cascata, bem como transições de percolação de primeira
ordem. Além disso, o comportamento coletivo de uma rede na presença de falha e recuperação de
nós foi estudado e descobriu-se que essa rede pode ter falhas espontâneas e recuperações
espontâneas.
O campo continua a desenvolver-se a um ritmo acelerado e reuniu pesquisadores de muitas
áreas, incluindo Matemática, Física, Biologia, Clima, Informática, Sociologia, Epidemiologia e
outros. Ideias de ciência e engenharia de redes foram aplicadas à análise de redes reguladoras
metabólicas e genéticas. A modelagem e o design de redes de comunicação escaláveis, como a
geração e visualização de redes sem fio complexas; o desenvolvimento de estratégias de vacinação
para o controle de doenças; e uma ampla gama de outras questões práticas. As pesquisas em redes
são regularmente publicadas nas revistas científicas mais visíveis e obtêm financiamento vigoroso
em muitos países. A teoria da rede foi encontrada recentemente útil para identificar
estrangulamentos no tráfego da cidade.
No século XX, os matemáticos Paul Erdos e Alfred Rényi, deram estudo aos métodos de
formação de redes aleatórias. Há duas classes de redes, as redes regulares e as redes aleatórias
(Erdos, P. 1959). As redes regulares são formadas por um padrão determinista, onde todos os nós
têm o mesmo grau, ou seja, todos os elementos têm um critério em comum. Já as redes aleatórias
não obedecem a padrões e tiveram um papel fundamental para o desenvolvimento das redes
complexas. As propriedades das redes aleatórias são representadas por distribuições de
probabilidade.
Em outro experimento, observou-se serem necessários apenas seis intermediários para ligar
quaisquer dois atores de cinema, por terem participado do mesmo filme. O ator Kevin Bacon teve
maior conectividade por ter grande participação cinematográfica. Isto gerou um jogo, no qual um
ator determina seu número-de-Kevin-Bacon, que consiste no número de intermediários necessários
para ligar o ator a Kevin Bacon.
Surgiram outros jogos, como o número de Erdos e o número de Einstem. No primeiro os
autores são ligados sempre que forem coautores no mesmo artigo cientifico e no segundo a ligação
pode ser definida por uma coautoria, ou pela relação de orientação de um doutoramento, assim, tem
número de Einsten igual a 1 aqueles que forem seus orientandos. O cálculo do número mínimo de
intermediários necessários para ligar qualquer nó em uma rede é feito através de um coeficiente
topológico.
3. Metodologia: medidas de análise estatística de redes
Para representar redes recorre-se à Matemática, mas especificamente ao ramo da Teoria dos
Grafos. Porém, para analisar estas redes, é fundamental recorrer a outro ramo da Matemática, a
Estatística. Utilizar medidas Estatísticas para analisar redes sociais permite compreender e avaliar a
estrutura da rede sem a necessidade de conhecer a sua representação gráfica. O objetivo dessas
medidas é quantificar a estrutura das redes, para possibilitar ao analista a compreensão do
comportamento dos fenômenos sociais que geraram essas redes.
3.1. Medidas ao nível dos agentes (ou nós)
São elas:
1. Centralidade do grau ou valência;
2. Centralidade de intermediação;
3. Centralidade de proximidade;
4. Centralidade do autovetor; e
7
5. Coeficiente de agrupamento local.
A centralidade do grau (ou valência) é definida pela seguinte expressão:
1
, 0n
i ij i
j
k a k n
(1) e 0v v vk N k n (2)
Onde aij é a entrada da i-ésima linha e j-ésima coluna da matriz de adjacência A.
E Nv é a vizinhança do agente (nó ou vértice) V.
Para redes direcionadas temos:
ik = grau de entrada (número de agentes de entrada, isto é, número das arestas ou relações que
começam no agente v).
ik = grau de saída (número de agentes de saída, isto é, número das arestas ou relações que
terminam no agente v).
1
n
i ij
j
k a
(3) , 1
n
i ij
j
k a
(4)
A medida do grau em redes direcionadas é também conhecida como prestígio. É uma
expressão muito usada em ARS (análise de redes sociais).
Existem dois tipos de prestígio: (i) o de suporte; e (ii) o de influência. O de suporte é o grau
de entrada e o de influência é o grau de saída. Em redes pesadas (ou ponderadas) a força é
equivalente ao grau. Ela é igual à soma dos pesos das arestas adjacentes a um dado agente (ou das
relações vinculadas a este agente). Tal como em (5):
1ij
nw w
i
j
k a
(5)
A intermediação de um nó (vértices) indica em que medida um dado nó se situa entre outros
nós da rede e pode ser calculado usando a fórmula da Equação 6. Os nós que obtêm valores altos de
intermediação tendem a ocupar papéis críticos na estrutura da rede, pois geralmente têm uma
posição de interação entre grupos, sendo elementos vitais na conexão de diferentes regiões da rede.
Esses atores que ocupam papeis críticos são chamados de gate-keepers, uma vez que tendem a
controlar o fluxo de informação que se estabelece entre as comunidades. A centralidade de
intermediação é dada pela seguinte expressão:
, ( )\
( )stv
s t V G v st
vb
(6)
Onde st é o número de caminhos mais curtos entre os agentes s e t (geralmente st =1). E
st (v) indica o número de caminhos mais curtos que passam pelo agente (vértice) v.
A intermediação de arestas, é definida como o número de caminhos mais curtos entre pares
de nós que percorrem uma aresta específica da rede, Equação 7. Essa medida permite identificar
pontes, que são ligações fora do círculo de conhecidos do indivíduo, e pontes locais, que são arestas
que permitem encurtar significativamente a distância entre vários subgrupos na rede, mas que, ao
contrário das pontes, não representam o único caminho possível de ligação entre estes subgrupos. A
intermediação de uma aresta be é dada por:
, ( )
( )uve
u v V G uv
eb
(7)
8
Sendo que be é o número de caminhos mais curtos entre pares de agentes que percorrem uma
aresta específica da rede. uv(e) representa o número de caminhos mais curtos que passam pela
aresta e. O somatório indica que esta fração tem que ser calculada para todos os pares de agentes (v)
na rede
Essa medida ajuda a identificar pontes e pontes locais, que são arestas com alto grau de
intermediação. Essas pontes são conexões fora do círculo mais próximo do agente e possuem
grande interesse para os agentes que buscam ter acesso a novos recursos. As pontes facilitam a
difusão de recursos a várias comunidades na rede (Kossinets e Watts, 2006). Mas essas situações
são geralmente raras no mundo real. E elas geram apenas uma vantagem temporária, pois as pontes
geralmente são instáveis ao longo do tempo. As pontes locais são mais realistas e permitem encurtar
bastante a distância entre vários subgrupos na rede. Mas, ao contrário das pontes, elas não
representam o único caminho possível de conexão entre esses subgrupos.
A expressão (8) resume a centralidade de proximidade:
( )\
1
( , )v
u V G v
nCl
d u v
(8)
Onde d(u,v) representa o comprimento do caminho mais curto entre os agentes u e v. É uma
medida da posição global de aproximação de um dado agente na rede.
A proximidade é uma medida aproximada da posição global de um dado ator na rede,
fornecendo uma ideia de quanto tempo um dado nó inicial demora para alcançar todos os outros nós
da rede, ou seja, é um quantificador da acessibilidade e mensura a rapidez com a qual certo agente
consegue atingir os outros agentes na rede. Muito útil para estimar custos de transporte em
aplicações de análise e elaboração de projetos, economia regional, comércio internacional, logística
etc. É o comprimento médio de todos os caminhos mais curtos entre um agente e todos os outros.
Ela é calculada para os agentes contidos na maior componente conectada da rede (giant
componente).
A equação (9) fornece a centralidade do autovetor:
1
1 n
i ij j
j
x a x
(9)
Onde xi/xj representa a centralidade do agente i/j; aij denota a matriz de adjacência A (aij =
1 se os agentes i e j estão conectados por uma aresta e aij = 0 se não estão) e indica o maior
autovetor da matriz A.
A centralidade do autovetor é uma medida proposta por Bonacich (1987) e fundamenta-se
na noção de que a centralidade de um agente é definida pela centralidade dos agentes com os quais
se relaciona (via trocas, transações etc.). Assim, o poder ou status econômico-financeiro de um
agente é definido pelo poder ou status econômico-financeiro de seus alters. Os alters são os agentes
diretamente relacionados ao agente central (também chamado de ponto focal ou ego). A
centralidade do autovetor é a combinação linear das centralidades dos seus vizinhos de primeira
ordem.
O coeficiente de agrupamento local é obtido a partir de (10):
2
( 1)
jk
i
i i
ec
k k
(10), sendo , ,i jkvj vk N e E (10)
9
Onde Ni é a vizinhança do agente vi; ekj denota a aresta que conecta o agente vj ao agente
vk; ki é o grau do agente vi e |ekj| é a proporção de relações (arestas) estabelecidas entre os agentes
da vizinhança de vi.
Na ARC, o analista pode examinar redes em que exista a propriedade da transitividade. Já
na ARS, as redes são naturalmente transitivas.
Existe uma probabilidade grande de amigos de um determinado amigo na rede serem
também amigos. Em redes econômico-financeiras também pode haver transitividade. Se um agente
fornece bens e serviços para outro, ele também pode ter relações com o concorrente ou com um
aliado deste outro. O coeficiente de agrupamento local ajuda a mensurar a transitividade. Ele pode
ser global (calculado para toda a rede) ou local (calculado para cada agente). A transitividade local,
denotada por ci e proposta por Watts e Strogatz (1998), é calculada para a vizinhança de um agente.
Indica o grau de coesão entre seus respectivos vizinhos.
3.2. Medidas ao nível da rede
3.2.1. Conceitos fundamentais
Três conceitos fundamentais da teoria dos grafos devem ser conhecidos antes da
apresentação das medidas estatísticas ao nível da rede. São eles: (i) o caminho; (ii) a distância
geodésica (caminho mais curto); e (iii) a excentricidade.
Um caminho é uma sequência de agentes (vértices ou nós) nos quais pares consecutivos de
agentes não repetidos estão ligados por uma relação (conexão ou aresta). O primeiro agente de um
caminho é o agente inicial e o último agente é o agente final.
A distância geodésica (ou caminho mais curto) é denotada por d(i,j) e corresponde ao
caminho mínimo entre os agentes i e j.
A excentricidade é a maior distância geodésica entre um agente v e qualquer outro agente no
grafo, conforme a expressão seguinte:
( )\max ( , )v
u V G vd v i
(11)
3.2.2. Estatísticas da ARC ao nível da rede
As mais amplamente difundidas são:
1. Diâmetro/raio;
2. Distância geodésica média;
3. Grau médio;
4. Reciprocidade;
5. Densidade; e
6. Coeficiente de agrupamento global.
O diâmetro (D) é a excentricidade máxima do conjunto de agentes que definem a rede. Já o
raio (R) é a excentricidade mínima deste conjunto de agentes.
As redes esparsas costumam apresentar diâmetro maior do que as redes completas. Isto
ocorre porque as redes esparsas possuem caminhos menores entre pares de agentes.
Para certo tipo de redes reais, o diâmetro efetivo diminui ao longo do tempo (Leskovec et
tal, 2005). Isto contraria a sabedoria convencional de diâmetros progressivamente menores. Esta
medida fornece uma ideia de proximidade de pares de agentes na rede complexa. Ela mede a
distância entre dois agentes no pior dos casos.
D = max {v: v V} (12) R = min{v: v V} (13)
10
A distância geodésica média é denotada por l. É medida para todas as combinações de pares
de agentes numa rede e expressa a noção de quão longe estão dois agentes um do outro, em média.
Ela ajuda a medir a eficiência do fluxo de transações, trocas ou relações econômico-financeiras no
interior da rede. Ela é expressa por (14):
1( , )
11
2i j
l d i j
n n
(14)
Onde d (i, j) representa a distância geodésica, ou comprimento do caminho mais curto, entre
os agentes i e j. E ½ n(n-1) indica o número máximo de relações (ou arestas, ou vínculos) numa
rede composta por n agentes. Esta equação não vale para o caso de uma rede que apresenta mais do
que uma componente conectada. Isto ocorre porque a d (i, j) é infinita quando não há cominho na
rede que conecte dois agentes. Nesses casos, é melhor recorrer à média harmônica da distância
geodésica (equação 15):
1 1 1
1 ( , )1
2i j
ld i j
n n
(15)
A média harmônica da distância geodésica é à medida que possibilita a transformação de
distâncias infinitas em distâncias nulas.
O grau médio, definido por (16), é apenas a média dos graus de todos os agentes da rede.
Conforme Costa et al. (2011), o grau médio é uma medida de conectividade global da rede.
1
1 n
i
i
k kn
(16)
A reciprocidade, r, é um indicador específico para redes direcionadas que mensura a
tendência de pares de agentes criarem conexões entre si. Há várias maneiras de se calcular essa
medida. A mais utilizada e intuitiva é calcular a razão entre o número de conexões mútuas na rede
o número de todas as conexões existentes (equação 17). A medida da reciprocidade denota a
probabilidade de existir simetria nas conexões entre os pares de vértices (aij =1 e aji =1). Nas redes
não direcionadas, conclui-se intuitivamente que a reciprocidade é a máxima possível, dado que
todos os pares de vértices mantêm conexões simétricas entre si.
#,0 1
# #
dmutr r
dmut dasym
(17)
Onde #mut indica o número de díades (pares de agentes) mútuos e #asym denota o número
de díades assimétricas.
De acordo com Wasserman e Faust (1994), uma díade assimétrica é um par de agentes
conectados por uma relação (aresta) cuja direção assume o sentido de um dos agentes, mas não de
ambos. De modo contrário, uma díade mútua é um par de agentes conectados por duas ligações,
cada uma delas indo a uma direção diferente. Por exemplo a b e sendo a e b dois agentes (ou
nós, ou vértices) em uma rede.
A densidade quantifica o grau de conectividade que uma rede possui e é uma medida
relevante ao nível da rede, pois ela expressa a proporção de arestas da rede em comparação com o
número máximo possível de arestas. O valor mínimo da densidade é 0, quando a rede não possui
arestas, e o valor máximo é 1, quando ela possui conectividade absoluta (uma rede completa ou um
11
clique). Portanto, quando a densidade é alta, a rede é densa e, quando ocorre o contrário, a rede é
esparsa.
max
( ) ,0 1m
Gm
(18)
Onde m representa o número de arestas presentes numa rede e mmax indica o número
máximo de arestas nessa rede. No caso de as redes não serem direcionadas, o número máximo de
arestas será dado por:
max
( 1)( )
2
n nm nd
(19)
Onde mmax (nd) simboliza o número máximo de arestas em uma rede não direcionadas e n é
o número de vértices da rede.
Porém, no caso de a rede ser direcionada, o número máximo de arestas é dado por:
max ( ) ( 1)m d n n (20)
Onde max (d) é o número máximo de arestas em uma rede direcionada.
A expressão (21) gera o coeficiente de agrupamento global.
1i
i
c cn
(21)
Onde ci (i = 1, 2, ..., n) é o coeficiente de agrupamento local (equação 9), conforme
definiram Watts e Strogatz (1998). O coeficiente de agrupamento global (c) é a média dos
coeficientes locais (ci’s). Existem outras formas de calcular a versão global do coeficiente de
agrupamento local, mas adotamos a versão de Watts e Strogatz (1998), que criaram a expressão
redes de “small world” para aquelas que emergem de contextos socioeconômicos reais e que são
caracterizadas por altos coeficientes de agrupamento globais. Nessas redes, é comum encontrar a
propriedade de transitividade entre pares de agentes. Isso aumenta a probabilidade de formação de
redes completas (ou cliques).
3.3. Analisando arestas, clusters e propriedades das redes
Em determinados cenários o analista pode estar interessado em descobrir o nó dominante,
com maior influência ou uma lista ordenada de nós com essas características. Para isso foram
desenvolvidos algoritmos de análise de ligações, sendo o PageRank e o HITS os mais populares.
Esses algoritmos exploram a relação existente entre as ligações e o conteúdo das páginas Web, com
o intuito de melhorar a tarefa de recuperação de informações na Web, sendo extremamente
importante no desenho de motores de busca eficientes.
Hub e authority são conceitos elementares. No contexto da Web, um hub pode ser entendido
como uma página Web que aponta para muitas outras páginas Web, ou seja, uma seleção de páginas
Web que abordam um tema especifico. A qualidade de um hub é geralmente determinada pela
qualidade das authorities para as quais aponta. As authorities são páginas Web citadas por vários
hubs diferentes, o que significa que sua importância é medida pelo número de ligações que recebem
de outras páginas. Normalmente boas authorities são fontes confiáveis de informação sobre um
determinado tema.
12
3.4. O PageRank
PageRank é um algoritmo de análise de ligações que se baseia no conceito de centralidade
do vetor próprio, utilizado pelo motor de busca da Google na medição de importância ou relevância
das páginas da internet. A relevância de uma página é medida com base no valor da informação
transmitida por essa página, então as que são consideras mais valiosas tendem a aparecer no topo
dos resultados das pesquisas no Google.
A ideia do algoritmo é que a informação da Web pode ser classificada de acordo com a
popularidade da ligação, quanto maior o número de páginas ligadas a uma dada página Web, maior
a sua popularidade. No entanto, a relevância dessas ligações também é importante. O PageRank
mede a importância relativa de um conjunto de páginas Web, tendo por base não apenas a
quantidade, mas sobretudo a qualidade das respectivas ligações.
Esses algoritmos também são utilizados em outros domínios do conhecimento, como nas
Ciências Sociais, onde as ligações podem ser analisadas através de duas perspectivas diferentes,
mas inter-relacionadas: uma centrada na informação e a outra centrada nos atores. Essas duas
perspectivas ajudam a compreender os fenômenos sociais subjacentes, por meio da identificação
das fontes de informação mais valiosas ou dos atores sociais mais relevantes. No entanto, ainda se
verifica ausência de princípios orientadores sobre como interpretar os resultados da análise de
ligações no contexto das Ciências Sociais.
3.5. Identificando clusters
Uma das características únicas das redes sociais é que possuem estrutura de comunidade.
Normalmente essa propriedade emerge como consequência da heterogeneidade global e local da
distribuição das arestas num grafo, então nesse tipo de rede é possível encontrar concentrações
elevadas de arestas em determinadas regiões, e baixa concentração de arestas entre essas regiões.
Comunidades, ou clusters, são grupos de vértices densamente conectados com ligações
esparsas entre eles. De acordo com Newman e Girvan (2004), existem duas linhas de investigação
principais na descoberta de comunidades de redes. A primeira teve origem no Campo da Ciência de
Computadores e é conhecida como partição de grafos, enquanto a segunda foi essencialmente
desenvolvida por sociólogos, sendo usualmente referida por blockmodeling, agrupamento
hierárquico ou detecção de estrutura de comunidades. O processo básico subjacente aos algoritmos
de detecção de comunidade baseia-se na divisão do grafo original num conjunto de subgrafos
disjuntos, por via da otimização de uma dada função objetivo. O propósito de ambas as abordagens
é descobrir grupos de vértices relacionados e, se possível, definir a respectiva organização
hierárquica, tendo por base informação fornecida pela topologia da rede. Isto é geralmente realizado
removendo iterativamente as arestas pontes que ligam grupos de vértices, conforme sugerido por
Girvan e Newman (2002).
Na vida real é possível encontrar uma variedade de exemplos de grupos coesos, ou
comunidades. A sociedade é um ambiente rico em encontrar comunidades, uma vez que as pessoas
têm uma tendência natural para formar grupos. Esses grupos podem ser famílias, círculos de
amigos, grupos religiosos ou de trabalho, cidades, nações, etc. Se também consideramos grupos
formados por empresas, ou consumidores de um dado produto, é possível identificar comunidades
com relevância para a área da Economia e da Gestão.
A importância de estudar estas comunidades é intuitiva em domínios como a ARS. Para
sublinhar esta importância, Fortunato (2010) afirmou que a análise da suposição estrutural dos nós,
em cada comunidade da rede, pode ajudar a identificar atores centrais, associados a funções de
estabilidade e controle do grupo, bem como atores intermediários, que são aqueles que se localizam
nas fronteiras das comunidades e desempenham um papel fundamental na disseminação e troca de
informações e novas ideias, criando pontes entre comunidades.
13
3.6. Agrupamento hierárquico
O agrupamento hierárquico é uma classe de métodos para detectar clusters, ou grupos.
Algoritmos hierárquicos geram estruturas de grupos inseridos dentro de grupos maiores que, por sua
vez, se encontram inseridos em grupos ainda maiores, que são representados por dendrogramas que
mostram a estrutura multinível da rede. Esses métodos são eficazes na solução de problemas de
análise de grupos e problemas semelhantes, como o particionamento de grafos e a identificação de
comunidades.
O agrupamento hierárquico é bastante intuitivo, sendo baseado na definição de semelhança.
Primeiro é necessário escolher uma medida de semelhança (ou dissemelhança) para avaliar quão
semelhantes são dois nós, de acordo com uma dada propriedade global ou local9. Em seguida, deve-
se calcular a matriz de semelhança entre todos os pares de nós, independente desses nós estarem
conectados entre si. Depois, é preciso selecionar um método para agrupar os nós: os métodos
aglomerativos, que focam nas regiões mais densas da rede ao invés de focar nas ligações das
fronteiras da rede10
, ou os métodos divisivos, que focam na identificação e remoção das ligações que
conectam regiões densamente conectadas a rede, sobretudo as pontes e as pontes locais (Easley e
Kleinberg, 2010)11
. Conforme a escolha, uma medida de distância é selecionada para calcular a
semelhança entre grupos12
. O resultado final desse processo é um dendograma que ilustra a
organização dos nós retornada pelo algoritmo hierárquico. Para selecionar os melhores métodos,
uma estratégia é calcular o valor de modularidade (Newman e Girvan, 2004) para as comunidades e
selecionar o número que maximiza essa função.
Um dos algoritmos mais conhecidos e utilizados na descoberta de comunidade em redes
sociais é o algoritmo de Girvan-Newman, desenvolvido por Girvan e Newman (2002). A ideia
principal deste algoritmo é que as comunidades de uma rede podem ser isoladas através da
identificação e remoção das arestas ponte, que são as arestas em que passam uma grande quantidade
de caminhos mais curtos entre os nós.
O primeiro passo do algoritmo de Girvan-Newman é calcular o valor de intermediação de
todas as arestas da rede. Então remover as arestas que obtenham maior valor de intermediação. E
repetir os passos anteriores até que todas as arestas do grafo tenham sido removidas.
Este algoritmo é baseado no conceito de intermediação, e é apropriado para redes de
tamanho moderado devido ao custo de computação exigido no cálculo da medida de intermediação.
O input (entrada) deste algoritmo é um grafo e o output (saída) é um dendograma.
3.7. Otimização (ou classe) da modularidade
A otimização (classe) de modularidade é outro tipo de método utilizado para detectar
comunidades em redes. A modularidade Q é uma função de qualidade que avalia e mede a
importância de uma dada partição da rede em comunidades. Esta função é utilizada para comparar a
qualidade das partições e também como uma função objetivo em problemas de otimização. Segundo
Newman (2006), a modularidade é representada pela diferença normalizada entre o número de
arestas observadas no interior de cada grupo de nós da rede e o número de arestas que seria
provável observar no interior desse mesmo grupo numa rede equivalente onde as arestas são
geradas aleatoriamente. A modularidade Q é calculada da seguinte forma:
9 Entre os exemplos dessa medida estão a semelhança do cosseno, o índice de Jaccard, a distância Euclidiana, a
distância de Manhattan e a distância de Hamming entre pares de linhas numa matriz de adjacência. 10 O algoritmo Walktrap (elaborado por Pons e Latapy, 2005) é um exemplo deste tipo de método. 11 O conhecido algoritmo de Girvan e Newman (2002), mencionado no texto, é um exemplo bastante citado deste
método. 12 Alguns exemplos dessa medida: o single linkage (ou vizinho mais próximo), o complete linkage (ou vizinho mais
afastado) e o método de Ward.
14
1( , )
2 2
i j
ij i j
ij
k kQ A c c
m m
(22)
Onde m indica o número de arestas;ik e jk representam respectivamente o grau dos vértices
i e j; ijA é a entrada da matriz adjacência que indica que o número de ligações estabelecidas entre
os vértices i e j; 2
i jk k
m representa o número esperado de arestas que deveria existir entre o par de
vértices (i, j); ic e jc denotam os grupos a que os vértices i e j pertencem; e ( , )i jc c representa o
delta de Kronecker.
A modularidade Q pode assumir valores positivos e negativos. Se Q > 0, então existe a
possibilidade de encontrar estrutura de comunidade em rede. Se Q for um número positivo e
elevado, então a respectiva partição tem maior probabilidade de refletir a estrutura de comunidade
verdadeira. De acordo com Clauset et al (2004), uma modularidade que assuma valores superiores
ou iguais a 0,3 é um bom indicador da existência de comunidade com significado na rede.
3.8. Como analisar redes reais? As seis propriedades.
Os problemas do mundo real são uma fonte de inspiração para as teorias de redes. A grande
maioria dos eventos do mundo real e das atividades que desenvolvemos, observamos e estudamos
podem ser facilmente modeladas utilizando grafos e, posteriormente, analisadas a luz da
metodologia das redes sociais.
Dada a enorme diversidade de redes passiveis de encontrar no mundo real, os investigadores
resolveram classifica-las em tipos principais, apesar desta classificação não ser consensual. Uma
classificação possível é a proposta por Newmam (2003).
Apesar dessas redes derivarem de campos de conhecimento distintos e serem originadas de
diferentes problemas do mundo real, elas partilham de um conjunto de propriedades que as tornam
peculiares, opondo-se desta forma, a dois modelos de redes bem conhecidos: as redes aleatórias e as
redes regulares. Por esse motivo, estas redes tendem a denominarem-se redes complexas.
Para modelar redes complexas são necessárias propriedades adicionais (Newman, 2003b).
Redes reais são gafos não-regulares e não-aleatórios com características únicas, onde a “ordem
coexiste com a desordem” (Fortunato, 2010).
Algumas das propriedades das redes complexas são:
1. Small World
2. Lei de potência e distribuição do grau em nós
3. Agrupamento ou transitividade
4. Resiliência
5. Padrões misturados
6. Estrutura de Comunidade
3.8.1. O “small world”
Como vimos, Stanley Milgram (1967), um psicólogo social americano, foi o primeiro a
sugerir a existência de efeitos dos “pequenos mundos” em redes sociais reais, por via de uma série
de experiências famosas conhecidas como Experiência de Milgram. A hipótese principal do estudo
era de que pares de indivíduos aparentemente distantes estão ligados por um caminho curto, isto é,
por um pequeno número de conhecidos, na rede. Neste experimento Milgram pediu a cerca de 300
participantes aleatórios de Omaha, Wichita e Nebraska, para enviar um dossiê a alguém que
conhecessem pessoalmente com o objetivo final de chegar esse dossiê a um determinado individuo-
15
alvo (um corretor de Boston). Com esta experiência foi possível demonstrar que o comprimento
médio dos caminhos que alcançaram o indivíduo-alvo era aproximadamente 6, o que deu origem ao
conceito seis graus de separação.
De fato, o efeito dos pequenos mundos tem sido amplamente observado em redes do mundo
real, observado pela existência de atalhos entre a maioria dos pares de nós numa rede. Isso significa
que duas pessoas separadas uma da outra podem rapidamente entrar em contato através de um
número baixo de conhecidos ou amigos. Em termos matemáticos o efeito dos pequenos mundos
implica que a distância geodésica media, isto é, o caminho mais curto, entre pares de nós cresça
logaritmicamente com a dimensão de uma rede de grau médio fixo (Newman, 2003b).
3.8.2. Segunda: Lei de potência e distribuição do grau em nós
A distribuição do grau P(k) é a distribuição de probabilidade dos graus dos nós numa rede.
Então P(k) representa a probabilidade de um vértice escolhido aleatoriamente e de forma uniforme
possuir grau k, e é definida como a fração de nós na rede que tem grau k.
Grafos aleatórios seguem uma distribuição binomial do grau, uma vez que a presença, ou
ausência, de uma aresta é igual para todos os pares de vértices existentes.
Em redes reais, a distribuição do grau é bastante distinta da distribuição do grau observada
nas redes aleatórias. Barabasi e Albert (1999) descobriram que em redes reais a distribuição dos
graus dos vértices é assimétrica positiva e muito heterogênea, já que a grande maioria dos vértices
assume valores pequenos de grau e a minoria tem valores elevados nesta medida.
Essa descoberta vem reforçar o trabalho de Price (1965) sobre rede de citações de artigos
científicos. A distribuição de grau em redes reais, tais como redes de citações, segue uma lei de
potência e as redes são chamadas de redes livres de escala (Barabasi e Bonabeau, 2003).
Distribuições que seguem uma lei de potência surgem quando a quantidade que um indivíduo obtém
de alguma coisa depende da quantidade que esse indivíduo já possui dessa mesma coisa. Uma
analogia comum é a de que dinheiro faz dinheiro ou os ricos ficam mais ricos.
3.8.3. Terceira: Agrupamento ou transitividade
De acordo com Wasserman e Faust (1994), a transitividade é uma propriedade que mede a
densidade de triângulos, isto é, três nós interligados por três arestas na rede, o que significa que
cada nó está totalmente conectado aos restantes dos nós na rede. Na linguagem de redes sócias, isto
significa que a probabilidade de um amigo do meu amigo também ser meu amigo é elevada.
3.8.4. Quarta: resiliência
A resiliência mede o impacto na conectividade da rede quando um, ou mais, vértices são
removidos, sendo um bom indicador de coesão da rede.
Quando vértices que definem uma aresta ponte são removidos, verificam-se fortes mudanças
na rede no que diz respeito à capacidade de comunicação entre pares de vértices, dado que alguns
pares ficam desconectados. Porem em cenários reais, a remoção de um único nó não é geralmente
motivo para alarme, uma vez que as redes reais são compostas por milhões ou bilhões de nós. Nesse
caso é mais apropriado testar a coesão da rede tendo por base a remoção de uma dada porcentagem
de nós.
3.8.5. Quinta: padrões misturados
Algumas redes são compostas por diferentes tipos de vértices. Nesses tipos de rede, a ligação
entre vértices ou a probabilidade de ligação entre pares de vértices tende a ser seletiva e bastante
dependente do tipo de vértice, por exemplo, nas redes alimentares os vértices podem representar
plantas, animais herbívoros ou animais carnívoros.
16
Em redes sociais essa propriedade também é evidente, uma vez que os indivíduos tendem a
interagir com indivíduos semelhantes. Essa ligação seletiva é usualmente denominada de
assortatividade ou homofilia, sendo as afinidades culturais, étnicas ou políticas os exemplos
clássicos.
3.8.6. Sexta: estrutura de comunidade
A grande maioria das redes sociais apresentam estrutura de comunidade, o que significa que
é possível encontrar grupos de vértices densamente conectados que estão esparsamente conectados
a outros grupos de vértices na rede.
3.9. Distribuições Force Atlas 1 e 2 para análise de redes
Os métodos Force Atlas e Force Atlas 2 são métodos de elaboração de gráficos direcionados
pela força. São desenhados baseados nas semelhanças e/ou diferenças nos dados. Os padrões podem
ser ajustados para colocar mais ênfase na independência entre um e outro dos agentes (vértices)
individuais. Ou então levando em conta a proximidade entre eles.
O algoritmo do Force Atlas possui opções para força de repulsão e também para força de
atração.
O Force Atlas 2 foi criado por Mathieu Jacomy no Sciences Po Médialab (Paris). Jacomy foi
membro fundador do Gephi Consortium13
. No blog do próprio criador deste algoritmo14
ele o
descreve como sendo
“Is a continuous algorithm, that allows you to manipulate the graph while it is rendering (a
classic force-vector, like Fruchterman Rheingold, and unlike OpenOrd). Has a linear-linear
model (attraction and repulsion proportional to distance between nodes). The shape of the
graph is between Früchterman & Rheingold’s layout and Noack’s LinLog. Features a
unique adaptive convergence speed that allows most graphs to converge more efficiently.
Proposes summarized settings, focused on what impact the shape of the graph (scaling,
gravity…). Default speed should be the good one. Now features a Barnes Hut optimization
(performance drops less with big graphs)” (Jacomy, 2011).
O Force Atlas 2 usa um conjunto diferente de opções em relação ao Force Atlas comum.
Tais opções fornecem maior controle sobre o resultado, razão pela qual o escolhemos para
descrever os vários índices de spillover de prazos distintos. Ele também permite definir parâmetros
para hubs (pontos focais centrais), gravidade e para a repulsão. Tais recursos nos permitiram
direcionar os vértices (que são os ativos de commodities) próximos do centro do grafo. Como o
Force 2 acrescenta a gravidade ao conjunto de opções do Force Atlas comum, optamos por dispor
os vértices mais ao centro, enquanto o hub empurrou os nós para as bordas do gráfico.
Ambas as distribuições são úteis para posicionar e analisar clusters. Sobretudo quando se
deseja que os vértices sejam distribuídos em grupos baseados na semelhança ou diferença existente
entre eles e outros vértices.
Normalmente, os resultados das duas distribuições e dos respectivos layouts são diferentes
apenas nos aspectos relativos à gravidade. A posição e a orientação podem variar um pouco, mas a
configuração dos clusters, hubs e dos outros vértices e arestas permanecem. A posição do eixo não
afeta a configuração destes dois métodos, a não ser em grafos com uma estrutura de X-Y (o que não
é o caso desta aplicação). O que importa é a posição relativa entre os vértices/ativos e a valoração
(ou ponderação) de cada aresta.
13 O Gephi é um dos softwares livres mais usados em análise de redes. Ver https://gephi.org/ 14 https://gephi.wordpress.com/2011/06/06/forceatlas2-the-new-version-of-our-home-brew-layout/
17
4. Fontes dos dados
Os dados dos índices de spillovers das commodities foram obtidos do artigo de Ely e
Tessmann (2018). Os autores calcularam a transmissão de volatilidade de dez commodities (entre
elas mesmas, delas para o mercado e do mercado para elas). Utilizaram dados da Chicago
Mercantile Exchange.
5. Resultados
5.1. Índices de spillover de Diebold e Yilmaz (2012)
Com base nos preços de fechamento diário dos ativos no período, subtraindo o preço final
do dia pelo preço do dia anterior obtiveram-se os retornos diários dos ativos. Estimando o VAR dos
retornos de cada ativo utilizando o critério de Akaike para seleção de defasagens, e subtraindo o
retorno estimado do ativo pelo retorno real, foi encontrada a variância dos resíduos que identifica a
volatilidade dos choques. Com esses resíduos é montada a matriz de variância-covariância
necessária para formular os índices de spillover de Diebold e Yilmaz (2012), calculados por Ely e
Tessmann (2018), conforme o quadro 1.
O índice de spillover varia de 0 a 100 e verificou-se, nesse mercado, uma conectividade total
de 25.25. O “To” denota o quanto um ativo transborda para o mercado ou para outro ativo, por
exemplo, a volatilidade do petróleo transfere em 1.77 para os demais ativos do mercado. Enquanto
o “From” indica o quanto a volatilidade de um determinado ativo é influenciada pela volatilidade
total dos demais componentes do mercado ou de outro ativo, nesse caso, a volatilidade dos demais
ativos do mercado transborda volatilidade para o petróleo em 1.96.
Quadro 1 – Índices de spillover e conectividade das commodities
Nat. Gas Oil Cotton Coffee Sugar Soybeans Wheat Oats Corn Rice From
Nat. Gas 92.10 4,93 0.06 0.18 0.13 0.85 0.43 0.36 0.81 0.10 0.79
Oil 4.18 80.42 1.94 1.25 1.42 3.70 2.57 1.09 3.07 0.36 1.96
Cotton 0.04 2.04 85.62 1.24 0.88 3.03 2.65 1.03 2.75 0.72 1.44
Coffee 0.13 1.34 1.28 86.90 3.17 1.50 2.07 1.51 1.71 0.39 1.31
Sugar 0.14 1.52 0.92 3.27 87.24 2.07 1.84 0.60 1.90 0.49 1.28
Soy 0.53 2.74 2.12 0.94 1.33 58.31 8.40 6.35 16.56 2.72 4.17
Wheat 0.28 1.86 1.77 1.27 1.17 7.98 55.56 7.09 20.82 2.19 4.44
Oats 0.27 0.93 0.79 1.22 0.47 7.20 8.43 66.85 11.93 1.92 3.31
Corn 0.45 1.93 1.62 0.92 1.02 14.20 18.78 8.90 50.10 2.08 4.99
Rice 0.08 0.40 0.78 0.47 0.63 4.01 3.29 2.43 3.51 84.40 1.56
To 0.61 1.77 1.13 1.08 1.02 4.45 4.85 2.94 6.31 1.10 25.25
Fonte: Ely e Tessmann (2018).
18
O gráfico abaixo ilustra a conectividade total das commodities em questão no período
avaliado:
Figura 4 – Conectividade total das commodities (cotações diárias de fechamento em
2000-2018)
Fonte: Ely e Tessmann (2018).
Os gráficos a seguir ilustram o quanto cada commodity transmite em volatilidade para as
demais no período analisado:
19
Figura 5 – Transmissão dos spillovers das commodities (cotações diárias de fechamento
em 2000-2018)
Fonte: Ely e Tessmann (2018).
Da mesma forma, os gráficos seguintes ilustram quanto de volatilidade cada commodity
recebeu das demais no período considerado:
20
Figura 6 – Volatilidade recebida das commodities (cotações diárias de fechamento em 2000-
2018)
Fonte: Ely e Tessmann (2018).
21
5.2. Análise das estatísticas da rede
A tabela 1 apresenta as medidas estatísticas da rede elaborada com os dados do quadro 1 e
dispostos graficamente pelo algoritmo de Force Atlas2:
Tabela 1 – Medidas estatísticas da rede de transmissão de volatilidade
Legenda Grau
Grau de
entrada
ponderado
Grau de
saída
ponderado
Grau ponderado
Classe de modularidade
PageRanks
Gas 18 6.1 7.85 13.95 0 0.035366102387969015
Oil 18 17.69 19.58 37.27 0 0.07648911166094712
Cotton 18 11.28 14.38 25.66 0 0.05280025220370181
Coffee 18 10.76 13.1 23.86 0 0.050373687082745214
Sugar 18 10.22 12.75 22.97 0 0.04888794238697127
Soybean 18 44.54 41.69 86.23 1 0.16565316880421418
Wheat 18 48.46 44.43 92.89 1 0.1800419335664106
Oats 18 29.36 33.16 62.52 1 0.11649019240715708
Corn 18 63.06 49.9 112.96 1 0.22187681383714988
Rice 18 10.97 15.6 26.57 1 0.052020810563894765
Fonte: Elaboração dos autores
Inicialmente, cabe mencionar que a rede elaborada é um dígrafo n-partido completo15
. Os
graus dos vértices são idênticos e iguais a 18, isto é, cada um dos 10 vértices recebe 9 arestas
direcionadas e envia outras 9 para os demais 9 vértices. Os graus de entrada e de saída ponderados,
que expressam o “peso” das arestas recebidas e enviadas por cada vértice, são somados e geram a
medida de grau ponderado. Em ordem decrescente, os mais representativos são: o milho, o trigo, a
soja, a aveia e, um tanto mais distante, o petróleo e o arroz. Os outros ativos possuem graus
ponderados em torno de 22 a 26, aproximadamente.
Em relação à modularidade Q (classe de modularidade), os ativos assinalados com o valor 1
fazem parte de um agrupamento (cluster ou comunidade). Nota-se que são praticamente os mesmos
ativos com maiores graus ponderados, com a exceção somente do arroz. Chamaremos este cluster
de agrupamento principal da rede. E analisaremos os fatores pelos quais eles são próximos na
subseção seguinte. Os outros ativos, numerados com o valor zero, não constituem agrupamento(s)
secundário(s), ainda que, como veremos na descrição da rede, na próxima subseção, existam ainda
dois ciclos que merecem análise (café-açúcar e petróleo-gás).
Finalmente, os algoritmos de PageRank confirmam os valores altos deste agrupamento
principal, mantendo a mesma ordem decrescente dos graus ponderados que mencionamos.
5.3. Análise da distribuição-layout Force Atlas2
Os dados do quadro 1, com as estimativas de Ely e Tessmann (2018), geraram a rede da
figura 3. Pelo fato de que as transmissões de volatilidade ocorrem de cada ativo para todos demais,
as são direcionadas. Elas foram “pesadas” (ou ponderadas) com os dados dos índices de spillovers.
Utilizou-se uma distribuição de Force Atlas 2, a qual consideramos a mais adequada para descrever
graficamente a distribuição espacial dos spillovers das commodities16
.
15 Este parágrafo é melhor compreendido com o auxílio do glossário do anexo 2. Também pode ser útil uma consulta ao
livro clássico de Flament (1963 ). 16 Elaboramos redes utilizando outras distribuições. Elas estão no anexo 3 deste trabalho.
22
Pode-se observar que os resultados estão concentrados em um agrupamento principal
(cluster ou comunidade) e em dois ciclos cuja transmissão mútua da volatilidade merece atenção.
No agrupamento mais denso e com arestas mais “pesadas” estão presentes as transmissões mais
significativas entre os ativos de milho, trigo, soja, aveia e arroz.
Nos outros dois ciclos, que possuem arestas mais tênues que as do agrupamento principal,
há os ativos de gás-petróleo e café-açúcar.
O outro ativo que sobra é o algodão. Ele não chega a ser um outlier, uma vez que também
transmite e recebe volatilidade considerável do referido agrupamento (sobretudo do arroz, cujas
arestas se mostram um pouco mais grossas).
Percebe-se que os ativos que possuem arestas mais valoradas (as de maior peso) são
justamente os do agrupamento principal e os dos dois ciclos. Isso ocorre, em parte, por causa de: (i)
vínculos existentes na cadeia produtiva deles; (ii) questões relativas às elasticidades cruzadas da
demanda (bens complementares, bens substitutos etc.); (iii) ao preço dos bens subst itutos e
complementares na produção; (iv) as características intrínsecas do cultivo de cada ativo; (v) ao fato
de eles serem bens importantes e substitutos no mercado de insumos para várias outras cadeias
produtivas; (v) terem sido alvo de especulação no período pós Grande Recessão e de aumento
vertiginoso da demanda decorrente do forte crescimento econômico chinês e indiano, além de
outros fatores que serão mencionados na próxima subseção.
Primeiramente, em relação aos vínculos, o ciclo de petróleo-gás refere-se a duas cadeias
produtivas similares, interdependentes e muitas vezes com produções verticalizadas (como no caso
da Petrobras, da russa Gazprom, da Petróleos Mexicanos – Pemex etc.). No caso do ciclo de café-
açúcar, ambos são bens complementares.
No tocante às elasticidades cruzadas, os ativos do agrupamento principal apresentam
características já descritas em alguns estudos, como o de Wright (2012), que aponta o milho e a soja
como bens substitutos na produção; Lessley, Johnson e Hanson (1991), que chegam à mesma
conclusão para o milho e a aveia e Bekkerman (2014), que afirma o mesmo para o trigo e a aveia.
Quanto aos bens substitutos e complementares na produção, os ativos do agrupamento
principal são complementares como insumos na elaboração de vários tipos de rações animais (à
base de farelos de soja, trigo, aveia e milho). Estas rações são utilizadas em várias cadeias
produtivas agropecuárias, tais como: suinocultura, bovinocultura, cinofilia, equinocultura,
avicultura, ovinocultura, caprinocultura, pecuária leiteira etc. O arroz e o algodão também fornecem
farelos para rações, mas não fazem parte deste agrupamento principal porque não são substitutos na
produção em relação aos grãos que os compõem. Ainda em relação ao agrupamento principal, além
de serem substitutas, pode existir complementaridade entre algumas das commodities17
. No Brasil,
o caso do milho e da soja foi estudado por Caldarelli e Bacchi, que mostraram uma forte interação
entre os mercados de milho e de soja, evidenciando uma relação de complementaridade na oferta e
de serem substitutos na demanda. Estes autores afirmaram:
“No que diz respeito às relações entre os mercados de soja e milho (complementaridade ou
substitutibilidade), os resultados das funções de respostas a impulso demonstram que elas
dependem do nível de mercado considerado. No caso de um choque no consumo aparente de
milho ou no preço desse grão no segmento atacadista, prevalecem os efeitos de
complementaridade. Assim, um aumento no consumo aparente de milho leva a um
acréscimo no preço do milho e da soja e um aumento do preço do milho no atacado reduz o
consumo do cereal, diminuindo também o consumo e o preço da soja. De outro lado,
choques em variáveis relacionadas ao segmento produtor – preço de milho ou preço de soja
– indicam substitutibilidade entre a leguminosa e o cereal. Por exemplo: um aumento do
17 A análise desta relação em mercados internacionais de commodities fica para pesquisas futuras.
23
preço do milho leva a um aumento da oferta desse grão, reduzindo a oferta de soja e
elevando o preço desta leguminosa.” (Caldarelli e Bacchi, 2012).
Figura 7 – Distribuição de Force Atlas 2 para a transmissão de volatilidade
Fonte: Elaboração dos autores.
No que tange às características intrínsecas do cultivo de cada ativo, os ativos do
agrupamento principal requerem condições climáticas que apresentam mais semelhanças do que
diferenças (quadro 2)18
.
18 O quadro é indicativo das espécies mais utilizadas de cada ativo. É uma síntese geral, que ignora as particularidades
do cultivo de cada produto e das espécies de cada um deles.
24
Quadro 2 – Fatores que influem no cultivo das commodities analisadas
Commodities
Radiação solar Geada ou neve Chuvas e
irrigação
Temperaturas
médias
Umidade do
solo
Trigo
Evitar excesso de
sol no início do
plantio
Geadas só no início
do plantio
40 a 140 mm
por ano, a
depender da
fase de
produção
Menor do que
27°
Menor do
que 75%
Milho
Essencial, pois o milho precisa de
luminosidade para
maturar o grão.
Sensível às baixas temperaturas e
geadas.
250 mm até 5.000 mm por
ano.
12,8°C à noite e acima de
19,5°C
durante o dia.
Média. Não podem ser
solos muito
úmidos ou
encharcados.
Soja
A soja necessita
de radiação solar
para o ciclo de
maturação e para
a colheita.
No início do cultivo
ou na maturação, as
geadas leves podem
não prejudicar e até
ajudar no controle de
fungos. Mas geadas
fortes podem ser
prejudiciais
De 700 mm a
1.200 mm por
ano (bem
distribuídos).
Entre 25°C e
35°C.
Média. Não
pode
ultrapassar
30%.
Aveia É uma planta de dias longos.
Precisa de sol,
mas não tolera
temperaturas
acima de 32°C.
Alguns tipos resistem à geada.
Mas outros não são
resistentes.
Precisa de muita umidade e
chuvas.
Requer baixas temperaturas.
Entre 13°C e
23°C.
Não tolera solos muito
úmidos.
Prefere solos
bem
drenados.
Arroz
Sim. O plantio
carece de luz
solar.
Prejudicam no
emborrachamento e
floração
Muito
desejáveis.
Entre 25°C e
32°C.
Planta
hidrófila.
Necessita de
solos muito
úmidos ou
encharcados.
Algodão
Mais de 200 dias
de sol por ano
Precisa de 180 a 200
dias seguidos sem geadas ou neve
Precisa de
irrigação e chuvas
regulares.
Acima de
20°C.
Não suporta
solos muito úmidos.
Fontes: Elaboração dos autores a partir do conteúdo do sítio da Embrapa
Alguns dos ativos mencionados foram alvos de muita especulação no período pós Grande
Recessão. Os retornos de ativos de renda fixa e variável caíram muito e muitos recursos transferidos
destes ativos para os derivativos de commodities (contratos de opções e futuros, principalmente). O
modelo simples de Knittel e Pyndick (2016) ajuda a explicar esse fenômeno para o mercado de
petróleo. Cabe transcrever a visão de Czech (2012), que estudou o papel dos especuladores para
explicar os movimentos dos preços de commodities agrícolas, que atingiram picos em 2007-2008 e
2010-2011:
“A maior parte da literatura acadêmica não apoia a ideia de que os especuladores dirigem os
preços das commodities para além dos níveis dos seus fundamentos. Há, no entanto, alguns
pesquisadores que acham evidências empíricas que sustentam a ideia de que a atividade dos
especuladores afeta os preços das commodities. Este artigo conclui que a atividade dos
especuladores podem temporariamente sobrevalorizar ou depreciar os valores das
25
commodities. Assume-se, no entanto, que os fundamentos e os fatores financeiros
influenciam os preços das commodities. No entanto, é difícil indicar em que medida cada
fator afeta separadamente os preços.” (Czech, 2012).
Como sugere Czech em relação aos fundamentos, os preços dos ativos também tiveram forte
alta após o aumento significativo da demanda, como reflexo do forte crescimento econômico da
China e da Índia. Estes países são muito populosos e parcelas expressivas de seus povos passaram a
ter acesso maior ao consumo de proteínas, açúcar e cereais.
Finalmente, o estudo da FGV Projetos19
também corrobora estes pontos de vista e toca em
outro ponto importante que é a complementaridade na produção de biocombustíveis (no caso do
milho e da soja), do etanol (cana-de-açúcar), e da biomassa (casca e palha de arroz)20
. Para a FGV,
a referida alta das commodities decorreu dos seguintes fatos:
i. Crescimento da demanda por alimentos e mudança da sua estrutura de consumo - mais
proteína e menos carboidratos –, graças ao crescimento da renda da população e à
urbanização dos países menos desenvolvidos;
ii. Utilização de cereais e outros produtos agrícolas na fabricação de combustíveis;
iii. Operações nos mercados financeiros;
iv. Quebras de safra provocadas pelo clima;
v. Baixo nível de estoques de cereais, resultado de mudanças de políticas públicas ou de
quebras de safra;
vi. Custos crescentes de combustíveis e fertilizantes;
vii. Desvalorização do dólar a partir de 2022; e
viii. Medidas protecionistas adotadas por diversos governos após o início da alta dos preços.
Entre elas, a proibição de exportação de alimentos e a desvalorização cambial em relação ao
dólar, moeda em que são comercializadas as commodities. Ao reduzirem as exportações, as
medidas teriam contribuído para a elevação dos preços dos alimentos nos mercados de
outros países.
6. Conclusões
O cálculo das estatísticas do algoritmo de grafos Force Atlas2 foi realizado com base nas
estimativas dos índices de spillover feitas por Ely e Tessmann (2018). A rede gerada classifica-se
como um dígrafo n-partido completo. Trata-se de um dígrafo (grafo direcionado) porque as
transmissões de volatilidade ocorrem de cada ativo para todos demais, de forma direcionada e com
“pesos” nas arestas (arestas ponderadas ou valoradas). Esses pesos correspondem aos índices de
spillover. A distribuição de Force Atlas 2 foi considerada como a mais adequada para descrever
graficamente a distribuição espacial dos spillovers das commodities. As outras distribuições de
layout estimadas estão no anexo 1 deste trabalho e podem ser úteis para confirmar, sob diferentes
perspectivas visuais, as conclusões do artigo.
A primeira conclusão, extraída da análise das estatísticas da rede (ao nível dos vértices e da
rede, em sentido amplo) e também da observação dos layouts de Force Atlas 2 e dos outros que
constam no anexo 1 é: uma concentração em um agrupamento principal e a existência de dois
ciclos. O agrupamento principal é mais denso e possui arestas mais grossas ou pesadas, refletindo
as transmissões mais relevantes de volatilidade entre o milho, o trigo, a soja, a aveia e o arroz. Nos
dois ciclos, com arestas mais finas do que as do agrupamento principal, estão os binômios de gás-
petróleo e café-açúcar. O algodão é o único ativo que não pertence a ambos os ciclos e ao
19 http://bibliotecadigital.fgv.br/dspace/bitstream/handle/10438/6947/326.pdf?sequence=1 20 Ver Cortez, Lora e Gomez (2008). https://www.nipe.unicamp.br/docs/publicacoes/inte-biomassa-energia070814.pdf
26
agrupamento principal. Mas, ainda assim, as estatísticas mostram que ele transmite e recebe
volatilidade do referido agrupamento (sobretudo do arroz, cujas arestas se mostram um pouco mais
grossas).
Cabe analisar o porquê de os ativos (ou vértices) que possuem arestas de maior peso serem
os do agrupamento principal e os dos dois ciclos.
A explicação recai em várias hipóteses, cuja análise detalhada foge do escopo deste
trabalho. Porém, tais hipóteses podem servir para pesquisas futuras. Essas hipóteses, levantadas a
partir de pesquisa da literatura sobre commodities são: (i) vínculos existentes na cadeia produtiva de
algumas das commodities; (ii) questões relativas às suas elasticidades cruzadas da demanda (bens
complementares, bens substitutos etc.); (iii) preço das commodities que são bens substitutos e
complementares na produção; (iv) características intrínsecas do cultivo de cada commoditie
agrícola (excluem-se aqui o gás e o petróleo, obviamente; (v) o fato de algumas commodities
agropecuárias serem bens importantes e substitutos no mercado de insumos para várias outras
cadeias produtivas; (v) as commodities foram objeto de especulação no período pós Grande
Recessão e de aumento vertiginoso da demanda decorrente do forte crescimento econômico chinês
e indiano.
Referências
AMORIM, J. B. P. O problema das quatro cores. Tese de doutoramento. Coimbra: Universidade de
Coimbra, 1953.
ANDERSON, J.R. Comment on "Bubble Troubles? Rational Storage, Mean Reversion, and Runs in
Commodity Prices". In: CHAVAS, J. P., HUMMELS, D. e WRIGHT, B. D. (editors). The
Economics of Food Price Volatility. Chicago: University of Chicago Press, 2014.
http://papers.nber.org/books/chav12-1
BARABASI, A. L. e ALBERT, R. Emergence of scaling in random networks. Science, 286(5439):
509-512, 1999. https://arxiv.org/pdf/0906.0612.pdf
BEKKERMAN, A., SCHWEIZER, H. e SMITH, V. H. The impacts of the canadian wheat board
ruling on the north american malt barley markets. Canadian Journal of Agricultural
Economics/Revue Canadienne D'agroeconomie, 62: 619–645, 2014. doi:10.1111/cjag.12044.
BARABASI, A. L. e BONABEAU, E. Emergence of scaling in random networks. Scientific
American, 288: 60-69, 2003.
BONACICH, P. Power and centrality: a family of measures. The American Journal of Sociology.
92 (5): 1170-1182, 1987.
BUSACKER, R. G. e SAATY, T. L. Finite graphs and networks: an introduction with
applications. New York: McGraw-Hill,1965.
CALDARELLI, C. E. e BACCHI, M. R. P. Fatores de influência no preço do milho no Brasil. Nova
Economia, v. 22, n. 1 Belo Horizonte Jan./Apr. 2012
CLAUSET, A., NEWMAN, M. E. J. e MOORE, C. Finding community structure in very large
networks. Physical Review E, 70(6): 066111, 2004.
https://arxiv.org/pdf/cond-mat/0408187.pdf
CZECH, K. Speculation in the agricultural commodity market. Varsóvia, Polônia: Departament of
Agricultural Economics and International Economic Relations of Warsaw University of Life
Sciences, 2012.
http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.921.6672&rep=rep1&type=pdf
27
COHEN, R. e HAVLIN, S. Complex Networks: Structure, Robustness and Function. Cambridge,
Massachussets: Cambridge University Press, 2010.
CORTEZ, L. A. B.; LARA, E. E. S. e GÓMEZ, E. O. (orgs). Biomassa para energia. Campinas,
SP: Editora da Unicamp, 2008.
https://www.nipe.unicamp.br/docs/publicacoes/inte-biomassa-energia070814.pdf
DIEBOLD, F. X. e YILMAZ, K. Better to Give than to Receive: Forecast-Based Measurement of
Volatility Spillovers. International Journal of Forecasting, 28(1), 57-66, 2012.
http://financialconnectedness.org/research.html
EASLEY, D. e KLEINBERG, J. Networks, crowds and markets: reasoning about a highly
connected world. Cambridge, Massachussets: Cambridge University Press, 2010.
ELY, R. A. e TESSMANN, M. Transmissão de volatilidade entre commodities no curto, médio e
longo prazos. Pelotas: Universidade Federal de Pelotas, 2018.
ERDŐS, P. e RÉNYI, A. On the evolution of random graphs. Publications of the Mathematical
Institute of the Hungarian Academy of Sciences, 1960
ERDŐS, P. e RÉNYI, A. On Random Graphs. Publicationes Mathematicae. 6: 290–297, 1959.
FGV PROJETOS. Fatores determinantes dos preços dos alimentos: o impacto dos biocombustíveis.
Rio de Janeiro: Editora da Fundação Getúlio Vargas, Nov. 2008.
http://bibliotecadigital.fgv.br/dspace/bitstream/handle/10438/6947/326.pdf?sequence=1
FLAMENT, C. Applications of graph theory to group structure. New Jersey: Prentice-Hall, 1963.
FORTUNATO, S. Community detection in graphs. Physics Report, 486(3-5): 75-174, 2010.
https://arxiv.org/pdf/0906.0612.pdf
FRUCHTERMAN, T. M. J. e REINGOLD, E. M. Graph Drawing by Force-Directed Placement.
Software: Practice and Experience, 21(11), 1991.
GAMA, J., CARVALHO, A P. L., FACELLI, K. et al. Extração de conhecimento de dados – data
mining. 2ª ed. Lisboa: Sílabo, 2015.
GIRVAN, M. e NEWMAN, M. E. J. Community structure in social and biological networks.
Proceedings of NSF Workshop on Next Generation Data Mining, p. 99-108, 2002.
HU, YIFAN. Efficient, high-quality force-directed graph drawing. The Mathematica Journal, 10, v.
1, 2006.
http://www.mathematica-journal.com/issue/v10i1/contents/graph_draw/graph_draw.pdf
KOSSINETS, G. e WATTS, D. J. Neural network ensembles, cross validation and active learning.
In: Advances in Neural Information Processing Systems, v. 7, p. 231-238, 1995.
JACOMY, M., VENTURINI, T. , HEYMANN, , S. e BASTIAN, M. Force Atlas2, a continuous
graph layout algorithm for handy network visualization designed for the Gephi software. PLoS
ONE, 9(6): e98679, 2014. https://doi.org/10.1371/journal.pone.0098679.
KNITTEL, C. R. e PYNDICK, R. S. The simple economics of commodity prices speculation.
American Economic Journal: Macroeconomics, 8(2), p. 85–110, 2016.
http://dx.doi.org/10.1257/mac.20140033
LESKOVEC, J., KLEINBERG, J. e FALOUTSOS, C. Graphs over time: densification laws,
shrinking diameters and possible explanations. In: Proceedings of the 11th ACM SIGKDD
International Conference on Knowledge Discovery in Data Mining, p. 177-187, New York, NY,
USA. ACM, 2005.
28
LESSLEY, B. V., JOHNSON, D. M. e HANSON, J. C. Using the Partial Budget to Analyze Farm
Change: 1990-1991. Maryland: University of Maryland System, pp. 7, 1991.
https://www.arec.umd.edu/sites/arec.umd.edu/files/_docs/Using%20the%20Partial%20Budget_0.pd
f
MARINO, R. As pontes de Konigsberg. In: Todas as configurações possíveis. Blog.
http://www.todasasconfiguracoes.com/2012/06/15/as-pontes-de-konigsberg/
NEWMAN, M. E. J. Mixing patterns in networks. Physical Review E, 67(2): 026126, 2003a.
NEWMAN, M. E. J. The structure and function of complex networks. SIAM Review, 45(23): 167-
228, 2003b.
NEWMAN, M. E. J. Modularity and community structure in networks. Proceedings of the National
Academy of Sciences of the United States of America, 103(23): 8577-8528, 2006.
NEWMAN, M. E. J. e GIRVAN, M. Finding and evaluating community structure in networks.
Physical Review E, 69(2): 026113, 2004.
PEREIRA, J. M. S. Grafos e redes: teoria e algoritmos básicos. Rio de Janeiro: Interciência, 2013.
PONS, P. e LATAPY, M. Computing commuties in large networks using random networks.
Journal of Graph Algorithms and Applications, v. 10, n.2, p. 191-2018, 2006.
PRICE, D. D. S. Networks of scientific papers. Science, 149(3683): 510-515, 1965.
http://garfield.library.upenn.edu/papers/pricenetworks1965.pdf
RABUSKE, M. A. Introdução à teoria dos grafos. Florianópolis: Editora da UFSC, 1992.
RUOHONEN, K. Graph Theory. Tampere, Finlândia: Tampere University of Technology, 2013.
http://math.tut.fi/~ruohonen/GT_English.pdf
WASSERMAN, S. e FAUST, K. Social network analysis: methods and applications. Cambridge,
Massachussets: Cambridge University Press, 1994.
WATTS, D. J. Networks, dynamics and the small-world phenomenon. American Journal of
Sociology, v. 105, Issue 2, 493-527, Sep. 1999.
WATTS, D. J. e STROGATZ, S. H. Collective dynamics of small-world networks. Nature,
193(6684): 440-442, 1998.
WRIGHT, B. International grain reserves and other instruments to address volatility in ,grain
markets. The World Bank Research Observer, v. 27, n. 2, August 2012.
https://openknowledge.worldbank.org/bitstream/handle/10986/17115/wbro_27_2_222.pdf?sequenc
e=1&isAllowed=y
29
Anexo 1 – Outras distribuições de layout de grafos 21
Figura 8 - Distribuição de Fruchterman-Reingold: é um algoritmo de layout dirigido pela
força. Ele considera a força existente entre dois vértices, que são representados, para usar uma
analogia, por “anéis de aço” (sendo as arestas as “molas” que os seguram). A força de atração é a
própria força da mola e a força de repulsão, seria como uma força elétrica. Nesta distribuição a
soma dos vetores de força determina qual direção um vértice deve se mover.
Fonte: Cálculos dos autores.
21 Os comentários deste anexo baseiam-se nos conteúdos do sítio do Gephi (https://gephi.org/ ) e nos artigos dos
próprios autores que desenvolveram os algoritmos de layout mostrados (citados nas referências).
30
Figura 9 - Distribuição Noverlap: ela primeiramente separa o grafo em uma grade de
quadrados. Em seguida, localiza os vértices nos quadrados (um vértice pode estar em vários
quadrados, se for grande). Depois, faz uma lista de relações de proximidade, isto é, dois vértices
ficarão mais próximos se estiverem na mesma área (ou em um quadrado comum). Finalmente, a
distribuição testa cada uma dessas relações, elimina os vértices que não se sobrepõem e aplica uma
força repulsiva naqueles vértices que se sobrepõem.
Fonte: Cálculos dos autores.
31
Figura 10 - Distribuição de Yifan Hu: nas palavras do próprio Yifan Hu (2006): “Nós
propomos um algoritmo de desenho de grafos que seja eficiente e de alta qualidade. Este algoritmo
combina uma abordagem multinível, que efetivamente supera os mínimos locais, com a técnica de
árvore óctupla de Barne e Hut, que aproxima de forma eficiente as forças de curto e de longo
alcance. Nossos resultados numéricos mostram que o algoritmo é comparável em velocidade ao
algoritmo de desenho de grafo multinível altamente eficiente de Walshaw e ainda gera melhores
resultados para alguns dos problemas difíceis. Além disso, um esquema de amenização adaptativa
para os algoritmos dirigidos pela força e um modelo de força repulsivo geral são propostos.” (Yifan
Hu, 2006).
Fonte: Cálculos dos autores.
32
Figura 11 - Distribuição de Yifan Hu Proporcional: O algoritmo de Yifan Hu Proporcional é
similar ao algoritmo Yifan Hu. A diferença é que o primeiro estabelece um deslocamento
proporcional para distribuir os vértices na área do grafo. Em termos de velocidade de cálculo e
precisão, não há muita diferença entre os dois.
Fonte: Cálculos dos autores.
33
Anexo 2– Glossário resumido com os principais termos referentes à teoria dos grafos.
Uma das dificuldades de quem inicia o estudo da teoria dos grafos e a ciência de redes é
dominar o seu vocabulário específico. Portanto, elabora-se este glossário para facilitar a leitura das
análises do texto.
Aresta – linha que liga dois vértices em um grafo
Arestas paralelas – representam conexões diferentes entre vértices idênticos.
Árvore – um grafo conexo que não possui ciclos. Dada uma árvore T, existe apenas um caminho
simples entre dois vértices de T, caso contrário, os dois caminhos formariam um ciclo.
Árvore geradora - Um subgrafo T de um grafo conexo G é denominado árvore geradora de G se T
for uma árvore e se ela incluir todos os vértices pertencentes a G. Seja G um grafo conexo
ponderado. Nesse caso, qualquer árvore geradora T de G estará associada a um peso total obtido
pela soma dos pesos das arestas em T.
Árvore geradora mínima - é uma árvore geradora cujo o peso total é o menor possível.
Caminho em um multigrafo G – é uma sequência conexa de vértices e arestas tal que:
V0, e1, V1, e2, ..., en, Vn
No qual cada aresta ei contém os vértices Vi-1 e Vi. O comprimento do caminho é definido pelo
número n de arestas e, sempre que não existir uma situação ambígua, é possível descrever um
caminho por meio de sua sequência de vértices. Intuitivamente, um caminho é considerado fechado
se V0 = Vn.
Caminho fechado – um caminho com o primeiro e o último vértices idênticos.
Caminho gerador – caminho que engloba todos os vértices de um grafo G.
Caminho orientado - Seja G um grafo orientado. Os conceitos de caminho, caminho simples, trilha
e ciclo são os mesmos dos grafos não orientados, exceto pelo fato de que a direção da aresta deve
coincidir com a direção do caminho. Um caminho (orientado) P em G é uma sequência alternada de
vértices a arestas orientadas, por exemplo, P = { V0, e1, V1, e2, ..., en, Vn}, tal que cada aresta ei
começa em Vi-1 e termina em Vi . Quando não existir ambiguidades, denotamos P, por sua
sequência de vértices ou de arestas.
Caminho simples – aquele no qual todos os vértices são distintos. Um vértice V será alcançável a
partir de um vértice U quando existir um caminho de U para V. Se V for alcançável a partir de U,
então há um caminho simples de U para V.
Ciclo ou circuito – é um caminho fechado que, com a exceção do seu primeiro e último vértices,
possui todos os outros distintos entre si. Um caminho que começa e acaba no mesmo vértice. Um
ciclo num dígrafo é qualquer passeio (v0, v1,…, vk−1, vk) que satisfaça as seguintes restrições: k ≥
1, vk = v0 e os vértices v0, v1,…, vk−1 são distintos dois a dois. As arestas do ciclo apontam
todos na mesma direção. Para enfatizar esse fato, usam-se ocasionalmente as expressões ciclo
orientado e ciclo dirigido no lugar de ciclo. Ciclos podem se parecer com caminhos, pois se
tivermos (v0, v1,…, vk−1, vk) como um ciclo, então teremos que, sem o vértice inicial, (v1,…,
vk−1, vk) será um caminho.
Ciclo de Euler – ciclo em que se percorre uma e somente uma vez cada aresta de um grafo.
Comprimento de um caminho – é igual a n, o número de arestas do caminho em questão.
34
Comprimento do caminho mínimo - considere um grafo conexo G, a distância entre os vértices U
e V em G, denotada por d(U, V) é o comprimento do caminho mínimo entre U e V.
Dendograma - um tipo de representação gráfica na forma de uma árvore (do grego”dendron” ou
“árvore”). O dendograma dispõe os dados em subcategorias que são divididas em outras até atingir
o nível de detalhe desejado (de modo semelhante aos ramos arbóreos). Ele permite observar as
relações de agrupamento entre os dados e também entre os grupos deles. Mas não pode ser utilizado
para deduzir algo sobre as relações de semelhança ou proximidade entre categorias. Quando se
verificam as sucessões de subcategorias, é possível perceber os critérios de agrupamento
(clustering) e a distância entre os dados conforme as relações estabelecidas. O dendrograma
também é útil para ilustrar os agrupamentos que surgem após a aplicação de um algoritmo de
agrupamento hierárquico.
Diâmetro de um grafo conexo – é a distância máxima entre qualquer par de seus vértices.
Grafo - Uma estrutura matemática em que pontos (vértices ou nós) são usados para representar
coisas com interesse e no qual as linhas (arestas) são usadas para ligar os vértices estabelecendo que
entre os vértices ligados há alguma relação.
Grafo acíclico – como o próprio nome diz: um grafo sem ciclos.
Grafo completo (ou cheio) - Um grafo completo com v vértices, que se denota por Kv, é um grafo
simples no qual todo par de vértices é conectado por uma aresta. Isso significa que um grafo
completo pode ser definido como sendo um grafo simples que contém o número máximo de arestas.
O número de arestas em um grafo completo é dado por n(n-1)/2.
Grafo conexo – aquele no qual é possível alcançar, por meio das arestas, qualquer vértice partindo
de outro vértice qualquer. Em um grafo conexo sempre há um caminho entre um qualquer par de
seus vértices.
Grafos isomorfos - Sejam dois grafos G e H não direcionados, não-rotulados e não ponderados
Haverá um isomorfismo dos grafos G e H se houver uma bijeção entre os conjuntos de vértices de
G e H.
f: V(G) G(H)
Assim, dois vértices quaisquer u e v pertencentes a G são adjacentes em G se e somente se ƒ(u) e
ƒ(v) forem adjacentes em H. Portanto, existirá a chamada "bijeção com preservação de arestas",
com a bijeção preservando a estrutura dos grafos. A concepção de isomorfismo de grafos pode ser
aplicada aos outros tipos de grafos, desde que adicionemos os requisitos necessários no sentido de
preservar os elementos adicionais que estão relacionados à estrutura, tais como os pesos e as
direções das arestas que os compõem. Todavia, vale mencionar o caso em que dois grafos rotulados
são ditos isomórficos: eles só o serão se os grafos subjacentes correspondentes não rotulados forem
também isomórficos.
Grafo n-partido - Um grafo G será considerado um grafo n-partido quando ele possuir n conjuntos
independentes. Portanto, um grafo G bipartido é um grafo com 2 conjuntos independentes (sendo 2-
partido). Um grafo G = (V, A) é chamado n-partido se os seguintes critérios forem obedecidos: (i)
for possível particionar o conjunto de vértices em n conjuntos não vazios V1, V2, ...Vk, de forma
que eles possam ser disjuntos dois a dois e que a união dos elementos destes conjuntos iguale o
conjunto original de vértice; (ii) cada aresta a ∈ A, tenha extremidades em conjuntos distintos; (iii)
n deve ser o menor inteiro capaz de assegurar os critérios anteriores. Do contrário, qualquer grafo
com n vértices seria um grafo n partido.
35
Grafo orientado – grafo no qual as arestas são direcionadas. Um grafo orientado G, ou um dígrafo
consiste em: i) um conjunto V = V(G) onde os elementos que o compõem são os vértices ou nós;
ii) um segundo conjunto E de pares ordenados (U, V), denominados arcos ou arestas orientadas.
Grafo partido - Um grafo G é n-partido se ele possuir k conjuntos independentes. Logo, um grafo
G bipartido é um grafo com 2 conjuntos independentes, portanto, ele é 2-partido.
Grafo ponderado (ou valorado) – grafo no qual suas arestas estão associadas a um número não
negativo chamado de peso. O comprimento de um caminho num grafo ponderado é definido como
a soma dos pesos das arestas deste caminho.
Grafo reflexivo – um pseudografo no qual todos os vértices possuem um laço associado a eles.
Grafo rotulado – grafo no qual dados estão associados às suas arestas e/ou vértices.
Grafo simples – Grafo que não contém laços ou arestas paralelas.
Grafo trivial – grafo com somente um vértice.
Grafo vazio – grafo que possui somente vértices (sem arestas).
Grau – também chamado de valência de um vértice. Consiste no número de arestas que incidem no
vértice em questão.
Graus de entrada e de saída - Suponha que G seja um grafo orientado. O grau de saída de um
vértice V é o número de arestas começando em V. Já o grau de entrada é o número de arestas que
terminam o em V. A soma dos graus de saída dos vértices de um grafo orientado G é igual a soma
dos graus de entrada dos vértices, que é igual ao número de arestas em G.
Hub – Um vértice em uma rede com uma série de conexões (ou arestas) cujo número ou o peso é
muito acima da média dos outros vértices da rede. A emergência de hubs decorre de uma
propriedade de redes livres de escala (free scale). Ainda que os hubs não possam ser vistos em redes
aleatórias, eles devem emergir de redes livres de escala. Tal emergência é fruto da distribuição de
leis de potência. Eles possuem um impacto significativo na topologia da rede e são encontrados em
redes reais como a internet, redes biológicas e as redes de neurônios.
Laço (ou loop) – uma aresta que liga um vértice a si mesmo.
Matriz de adjacências – Seja G um grafo simples de n vértices V1, V2... Vn. A matriz de
adjacência é uma matriz n x n, onde o valor de cada elemento ejk da matriz é determinado da
seguinte maneira: ejk = 1, se os vértices Vj e Vk são ligados por uma aresta; ejk = 0, em caso
contrário. Exemplo: considere a seguinte matriz de adjacência para um grafo direcionado.
V1 V2 V3 V4 V5 V6
V1 0 1 0 0 1 0
V2 1 0 1 1 1 0
V3 0 1 0 0 0 1
V4 0 1 0 0 1 1
V5 1 1 0 1 0 0
V6 0 0 1 0 0 0
36
Insere-se no software Wolfram Mathematica 10.0 a referida matriz com o auxílio do
comando “AdjacencyGraph”, tal como segue:
In[1]: AdjacencyGraph[{{0,1,0,0,1,0},{1,0,1,1,1,0},{0,1,0,0,0,0},{0,1,0,0,0,1},
{1,1,0,1,0,0},{0,0,1,0,0,0}}]
Obtém-se, finalmente, a figura 8, que mostra o resultado (output) do Wolfram Mathematica
com o grafo descrito pela matriz de adjacência:
Figura 12 - Exemplo de um grafo
Fonte: Cálculos dos autores.
As propriedades da matriz de adjacência são as seguintes:
Na diagonal principal da matriz, todos os valores são iguais a 0.
A quantidade de algarismos “1” presentes na linha ou coluna correspondente a um vértice é
igual ao grau deste vértice.
As permutações de colunas e das suas linhas correspondentes geram uma representação de
um grafo isomorfo.
Seja um hipotético grafo G desconexo que possui dois componentes g1 e g2. A matriz de
adjacência X(G) pode ser expressa como uma função das duas matrizes de X(g1) e X(g2):
X(g1) 0
0 X(g2)
37
Multigrafo – grafo não orientado que possui, no mínimo, duas arestas paralelas.
Multigrafo atravessável – aquele no qual há um caminho que inclua todos os vértices e que utilize
cada aresta somente uma vez. Isto é, ele pode ser desenhado sem quebra nas curvas e sem repetição
nas arestas. Esse caminho deve necessariamente ser uma trilha, uma vez que nenhuma aresta é
utilizada por duas vezes. Esta trilha é denominada trilha atravessável.
Pseudografo – grafo que apresenta, no mínimo, um laço.
Semicaminho – essencialmente, é o mesmo que um caminho. A diferença é que a aresta ei pode
iniciar em Vi-1 ou Vi e terminar no outro vértice. De modo similar são conceituadas as semitrilhas e
os caminhos semi-simples.
Rede de pequeno mundo (small world) – um tipo de grafo em que a maior parte dos vértices não
são vizinhos uns dos outros. Contudo, os vizinhos de qualquer vértice têm alta probabilidade de
serem vizinhos uns dos outros, podendo a maior parte dos vértices ser alcançada a partir de outro
por uma trajetória que percorre poucos pontos ou vértices. Nas redes de pequeno mundo, a distância
típica L entre dois vértices escolhidos aleatoriamente (isto é, o número de vértices a serem
percorridos) cresce de forma proporcional ao logaritmo do número de nós na rede. Portanto:
L log N
Note-se que o coeficiente de agrupamento não é pequeno. Assim, tomando como exemplo uma rede
social, existem estranhos que se conectam por intermédio de um grupo pequeno de conhecidos.
Rede livre de escala (free scale) - redes complexas cujo grau de distribuição segue uma lei de
potência. Neste tipo de rede, a maior parte dos vértices, em que a maioria dos nodos (vértices) tem
poucas ligações, contrastando com a existência de alguns vértices que apresentam um alto número
de conexões. Isto é, um vértice com grau elevado tende a conectar-se com outro vértice de grau
elevado. Assim, pode-se afirmar que a probabilidade de um vértice conectar-se com outro é
diretamente proporcional ao seu grau. Portanto, as redes livres de escala são dominadas em geral
por um pequeno número de vértices que se denominam hubs e geralmente resistem melhor a falhas
eventuais, porém apresentam vulnerabilidade à choques ou ataques coordenados. Nas redes sem
escala a probabilidade de um vértice apresentar k conexões decai quando k aumenta, de acordo com
a lei de potência.
P(k) k-
Onde k > 0 e > 0, com denotando o expoente de livre escala, que condiciona a probabilidade
P(k) de existência na rede de vértices com grau k.
Trilha – caminho no qual todas as arestas são distintas.
Vértice ou nó - é o ponto de um grafo que representa a extremidade de uma ou mais arestas.