Análise de uma Rede Complexa: Um Ensaio Sobre a ......1 Análise de uma Rede Complexa: Um Ensaio Sobre a Transmissão de Volatilidade Entre Commodities no Curto Prazo Marcelo de Oliveira

1

Análise de uma Rede Complexa: Um Ensaio

Sobre a Transmissão de Volatilidade

Entre Commodities no Curto Prazo

Marcelo de Oliveira Passos1

Mathiaz Schneid Tessmann2

Regis Augusto Ely3

Lisa Mariane Bueno4

Resumo: Este trabalho desenvolve uma aplicação do algoritmo Force Atlas2: uma

distribuição de layout para grafos e redes complexas. Também é elaborada uma breve

revisão da literatura sobre grafos e redes complexas. Nesse sentido, foram comentadas

as principais medidas estatísticas e propriedades da análise de redes, assim como as

noções fundamentais sobre as distribuições Force Atlas 1 e 2. A Force Atlas 2 foi usada

para gerar a rede de transmissão de volatilidade entre 10 das principais commodities

negociadas na Bolsa de Chicago (Chicago Mercantile Exchange). Os resultados

(distribuição e layout de Force Atlas2 e estatísticas da rede) foram analisados. Os dados

utilizados foram obtidos do artigo de Ely e Tessmann (2018), que calcularam os índices

de spillover desenvolvidos por Diebold e Yilmaz (2012).

Palavras – Chave: redes complexas, análise estatística de dados em rede, sistemas

complexos, abordagem de redes, grafos, commodities, índice de spillover.

Códigos JEL: Q50, K32, C20

Abstract: This work develops an application of the Force Atlas2 algorithm: a layout

distribution for graphs and complex networks. A brief review of the literature on

complex networks and graphs is also presented. In this sense, the main statistical

measures and properties of the network analysis were commented, as well as the

fundamental notions about the Force Atlas 1 and 2 distributions. Force Atlas 2 was

used to generate the volatility transmission network among 10 major traded

commodities on the Chicago Mercantile Exchange. The results (distribution and layout

of Force Atlas2 and network statistics) were analyzed. The data used were obtained

from the article by Ely and Tessmann (2018), who calculated the spillover indices

developed by Diebold and Yilmaz (2012).

Keywords: complex networks, network data statistical analysis, complex systems,

network approach, graphs, commodities, spillovers.

JEL Codes: Q50, K32, C20

.

1 Professor adjunto do Mestrado em Economia Aplicada da Universidade Federal de Pelotas (PPGOM-

UFPel). 2 Mestrando em Economia Aplicada do PPGOM-UFPel. 3 Professor adjunto do Mestrado em Economia Aplicada da Universidade Federal de Pelotas (PPGOM-

UFPel). 4 Economista graduada na Universidade Federal de Pelotas (UFPel).

2

1. Introdução

O principal objetivo deste trabalho é - a partir dos com os dados de transmissão de

volatilidade entre 10 das principais commodities negociadas na Bolsa de Chicago (Chicago

Mercantile Exchange) - gerar uma rede, calcular suas estatísticas e analisar os resultados da

distribuição do algoritmo de Force Atlas 2. Outro objetivo específico é elaborada uma breve

revisão da literatura sobre grafos e redes complexas, além de apresentar os resultados de outras

distribuições de grafos. Esta revisão, que inclui também um breve glossário, tem por finalidade

facilitar a apresentação de dois métodos quantitativos (teoria dos grafos e ciência de redes) que

estão sendo, desde a década passada, cada vez mais amplamente utilizados em revistas acadêmicas

internacionais, embora ainda sejam novidade na pesquisa econômica feita no Brasil.

Na primeira seção são apresentados os aspectos conceituais e históricos da teoria dos grafos

e da descrição de redes complexas.

A segunda seção é composta pela metodologia: as medidas estatísticas para analisar redes,

tanto ao nível do agente quanto ao nível da rede. Nela há uma exposição sobre como analisar

arestas, clusters e as propriedades das redes, além de algumas ferramentas estatísticas para detectar

e analisar clusters e as seis propriedades para investigar redes reais. Por fim, são apresentados os

métodos Force Atlas e Force Atlas 2 para elaborar grafos.

Na terceira e quarta seções, são descritas as fontes dos dados e analisados os resultados.

Na última seção são feitas as considerações finais.

2. Aspectos históricos e conceituais da teoria dos grafos e análise de redes

2.1. Definição de Grafo

Segundo Ruohonen (2013), existem duas formas de se definir o que é um grafo: a conceitual

e a formal.

Conceitualmente, segundo ele, um grafo é composto por vértices e arestas que conectam

estes vértices.

Figura 1 - Grafo formado por um conjunto de vértices e arestas

Fonte: Ruohonen (2013)

Formalmente, um grafo é um par de conjuntos, isto é, G = (V,E), onde V é um conjunto de

elementos chamados vértices e E é um conjunto de pares de vértices não ordenados denominados

linhas ou arestas (o E, vem do inglês edge).

3

2.2. Teoria dos grafos

A Teoria dos Grafos é atualmente uma das áreas mais importantes da matemática discreta.

Tendo as suas raízes em jogos e recreações matemáticas, atribui-se a sua criação a Euler, ao

resolver o problema das pontes de Königsberg em 1736, mas foram os problemas acerca de

formulas de estrutura de compostos químicos, que Arthur Cayley (apud Pegg, Rowland e

Weisstein, 2018) resolveu na segunda metade do século XIX, que a começaram a desenvolver.

Hoje, a Teoria dos Grafos tem sido aplicada a muitas áreas (Informática, Investigação Operacional,

Economia, Sociologia, Genética, etc.), pois um grafo constitui o modelo matemático ideal para o

estudo das relações entre objetos discretos de qualquer tipo.

Conforme Pereira (2013), um grafo G = (V, E) é um sistema formado por um conjunto V de

elementos chamados vértices, pontos, agentes ou nós, e um conjunto E de pares não ordenados de

vértices chamados linhas ou arestas. É usual também escrever apenas V(G) ou E(G) para expressar

que V e E são, respectivamente, os conjuntos de vértices e linhas do grafo G. Um dígrafo ou grafo

dirigido5 D = (V, A) é definido de forma parecida. Ocorre que A é o conjunto de pares ordenados

que se denominam arcos. Agora, V(D) e A(D) são, respectivamente, o conjunto de vértices e de

arcos ou linhas do dígrafo D. Ainda segundo Pereira (2013), há pouco consenso e muita diversidade

entre as nomenclaturas adotadas pelas teorias dos grafos e das redes. Ele utiliza os termos arestas

para as linhas de um grafo e arcos para as linhas de um dígrafo. Mas o próprio autor afirma que há

aqueles que não seguem esta convenção e também coloca que:

“É certo que, em teoria dos grafos, continua a faltar uniformidade de terminologia até

mesmo a respeito dos conceitos mais básicos. J.B. Pacheco de Amorim foi, salvo

involuntária omissão, o primeiro matemático de língua portuguesa a desenvolver

investigação nesta área: em 1953, na sua tese de doutoramento, usou sempre a palavra rede.

É curioso que, especialmente entre engenheiros, esta palavra ainda continua a ser

sistematicamente usada para significar grafo, dirigido ou não. Hoje isto é sintoma de

divórcio entre Ciências Básicas e Ciências Aplicadas ou Tecnológicas porque, atualmente,

entre matemáticos, grafo e digrafo são as palavras mais usadas, ficando rede reservada para

quando as linhas (ou os vértices) do grafo ou digrafo são afetados de valores. É a convenção

que Busacker e Saaty (1965) também seguem.” (Pereira, 2013, p. 1-2 ).

Neste texto, para manter a uniformidade, usaremos, alternadamente, os termos vértices (ou

agentes) e arestas (ou conexões) para designar os elementos das redes6 que serão analisadas,

independente de serem redes ou grafos direcionados ou não.

Grafos podem ser classificados de acordo com a direção das ligações. Grafos não

direcionados ou redes não direcionadas são grafos cujas arestas conectam pares de vértices não

ordenados, ou seja, cada aresta do grafo liga ao mesmo tempo dois vértices. Um exemplo deste tipo

de grafo é o Facebook, já que nesta rede social, o vínculo de amizade estabelecido é mutuo. Grafos

direcionados D = (V, A) ou redes direcionadas são grafos cujas arestas têm uma orientação

atribuída, por isso é possível atribuir um significado à ordem dos vértices. Graficamente, arestas

direcionadas são representadas por setas, que indicam a direção da ligação. O Twitter é um exemplo

de gráfico direcionado, já que o indivíduo pode ser seguido por outros, sem necessariamente segui-

los também.

Uma exposição detalhada dos teoremas da teoria dos grafos não é o objetivo deste trabalho.

Mas é útil conhecer alguns conceitos preliminares. Portanto, elabora-se um glossário resumido no

5 Também chamado de quiver. Digrafo é um termo muito utilizado em textos matemáticos de língua portuguesa e que

deriva do inglês directed graph. 6 A rede aqui analisada é um digrafo com arestas valoradas (também chamadas de ponderadas ou pesadas).

4

anexo 3 deste trabalho, baseado nas descrições de Jackson (2010), Easley e Kleinberg (2010) e

Rabuske (1992).

2.3. As sete pontes de Königsberg

A teoria dos grafos é oriunda da solução de um problema clássico resolvido pelo matemático

Leonhard Euler em 1736. O problema é baseado na cidade de Königsberg (território da Prússia até

1945, atual Kaliningrado). Uma cidade próxima do Mar Báltico e que é cortada pelo Rio Pregel (em

alemão) ou Prególia (em russo). Nela, há duas grandes ilhas que, juntas, formam um complexo que

na época continha sete pontes, conforme mostra a figura 2. Discutia-se nas ruas da cidade a

possibilidade de atravessar todas as pontes uma e só uma vez e, ao final, regressar ao ponto de

partida7. A questão virou uma “lenda urbana” e o povo acreditava ser possível fazer isto. Até que

Euler, em 1736, no trabalho publicado no volume 8 da revista Comentarii Academiae Scientiarum

Imperialis Petropolitanae8, provou que não existia caminho que possibilitasse tais restrições. Euler

transformou os caminhos em linhas e suas intersecções em pontos, criando possivelmente o

primeiro grafo da história (figura 4). Ele notou que só seria possível atravessar o caminho inteiro

passando uma única vez em cada ponte se houvesse exatamente zero (nenhum ponto) ou dois

pontos dos quais saíssem um número ímpar de caminhos. Só que de cada ponto deve haver um

número par de caminhos, pois será preciso um caminho para "entrar" e outro para "sair".

Os dois pontos com caminhos ímpares referem-se ao início e ao final do percurso, pois estes

não precisam de um para entrar e um para sair, respectivamente. Se não houver pontos com número

ímpar de caminhos, deve-se iniciar e terminar o trajeto no mesmo ponto, podendo esse ser qualquer

ponto do grafo. Isso não é possível quando temos dois pontos com números ímpares de caminhos,

sendo obrigatoriamente um o início e outro o fim.

Euler mostrou que não é possível passar pelas pontes uma única vez e conseguir terminar o

percurso das sete pontes, a menos que o número de pontes seja par.

O caso das sete pontes de Euler diferencia as abordagens geométrica e topológica. A

caracterização topológica não incide sobre a forma específica dos objetos ou posição, como a

geométrica, e sim sobre a ligação dos objetos. O problema das sete pontes pode ser observado como

uma rede com quatro nós e sete ligações.

Figura 2 - As sete pontes de Köningsberg

Fonte: MIT OpenCourseWare

7 Conforme Pereira (2013, p. 101): “Hoje representamos pontes, ilhas e margens por um multigrafo e traduzimos a

questão dizendo que se procura uma trilha fechado nesse multigrafo. ” 8 Deste trabalho pioneiro nasceram, além da teoria dos grafos, a Topologia.

5

Figura 3 – Grafo que representa as 7 pontes

Fonte: Marino (2012)

A solução de Euler do problema das "Sete Pontes de Königsberg" é considerada a primeira

prova verdadeira na teoria das redes.

2.4. Stanley Milgram e a Teoria dos Seis Graus

A manifestação mais conhecida da história das redes é a Teoria dos seis graus de separação,

originada através de um experimento do cientista social Stanley Milgram (Watts, D. 1999).

Milgram concluiu que em termos de contato social, os indivíduos norte-americanos estavam

separados em média por 6 pessoas. A experiência consistiu no envio de correspondência de um

grupo de pessoas para um segundo grupo. Desses dois grupos, 196 remetentes estavam no Nebraska

e os 100 destinatários em Boston.

A regra fundamental consistia em que cada remetente enviasse a correspondência para um

conhecido próximo que encaminharia a carta para o destino final, Boston. O resultado da

experiência foi que 29% dos remetentes conseguiram fazer as correspondências chegarem ao

destinatário em Boston, e em média foram necessários 6 intermediários para fazer a

correspondência chegar ao destinatário final.

2.5. Descrevendo redes

A maioria das redes sociais, biológicas e tecnológicas, exibem características topológicas

não triviais substanciais, com padrões de conexão entre seus elementos que não são puramente

regulares nem puramente aleatórios.

Tais características incluem uma cauda pesada na distribuição de grau, um alto coeficiente

de agrupamento, assortatividade ou desastrosidade entre vértices, estrutura da comunidade e

estrutura hierárquica. No caso de redes direcionadas, esses recursos também incluem reciprocidade,

perfil de significância de tríade e outros recursos.

Em contraste, muitos dos modelos matemáticos de redes que foram estudadas no passado,

como redes e gráficos aleatórios, não mostram esses recursos.

As estruturas mais complexas podem ser realizadas por redes com um número médio de

interações e isso corresponde ao fato de que o conteúdo máximo de informação (entropia) é obtido

para probabilidades médias.

Duas classes bem conhecidas e muito estudadas de redes complexas são as redes sem escala

(scale free) e as redes de mundo pequeno (small world), cuja descoberta e definição são estudos de

caso canônicos na área de rede.

No entanto, como o estudo de redes complexas continuou a crescer em importância e

popularidade, muitos outros aspectos da estrutura da rede também atraíram atenção.

6

Recentemente, o estudo de redes complexas foi expandido para redes de redes e, se essas

redes são interdependentes, elas se tornam significativamente mais vulneráveis a falhas aleatórias e

ataques direcionados e exibem falhas em cascata, bem como transições de percolação de primeira

ordem. Além disso, o comportamento coletivo de uma rede na presença de falha e recuperação de

nós foi estudado e descobriu-se que essa rede pode ter falhas espontâneas e recuperações

espontâneas.

O campo continua a desenvolver-se a um ritmo acelerado e reuniu pesquisadores de muitas

áreas, incluindo Matemática, Física, Biologia, Clima, Informática, Sociologia, Epidemiologia e

outros. Ideias de ciência e engenharia de redes foram aplicadas à análise de redes reguladoras

metabólicas e genéticas. A modelagem e o design de redes de comunicação escaláveis, como a

geração e visualização de redes sem fio complexas; o desenvolvimento de estratégias de vacinação

para o controle de doenças; e uma ampla gama de outras questões práticas. As pesquisas em redes

são regularmente publicadas nas revistas científicas mais visíveis e obtêm financiamento vigoroso

em muitos países. A teoria da rede foi encontrada recentemente útil para identificar

estrangulamentos no tráfego da cidade.

No século XX, os matemáticos Paul Erdos e Alfred Rényi, deram estudo aos métodos de

formação de redes aleatórias. Há duas classes de redes, as redes regulares e as redes aleatórias

(Erdos, P. 1959). As redes regulares são formadas por um padrão determinista, onde todos os nós

têm o mesmo grau, ou seja, todos os elementos têm um critério em comum. Já as redes aleatórias

não obedecem a padrões e tiveram um papel fundamental para o desenvolvimento das redes

complexas. As propriedades das redes aleatórias são representadas por distribuições de

probabilidade.

Em outro experimento, observou-se serem necessários apenas seis intermediários para ligar

quaisquer dois atores de cinema, por terem participado do mesmo filme. O ator Kevin Bacon teve

maior conectividade por ter grande participação cinematográfica. Isto gerou um jogo, no qual um

ator determina seu número-de-Kevin-Bacon, que consiste no número de intermediários necessários

para ligar o ator a Kevin Bacon.

Surgiram outros jogos, como o número de Erdos e o número de Einstem. No primeiro os

autores são ligados sempre que forem coautores no mesmo artigo cientifico e no segundo a ligação

pode ser definida por uma coautoria, ou pela relação de orientação de um doutoramento, assim, tem

número de Einsten igual a 1 aqueles que forem seus orientandos. O cálculo do número mínimo de

intermediários necessários para ligar qualquer nó em uma rede é feito através de um coeficiente

topológico.

3. Metodologia: medidas de análise estatística de redes

Para representar redes recorre-se à Matemática, mas especificamente ao ramo da Teoria dos

Grafos. Porém, para analisar estas redes, é fundamental recorrer a outro ramo da Matemática, a

Estatística. Utilizar medidas Estatísticas para analisar redes sociais permite compreender e avaliar a

estrutura da rede sem a necessidade de conhecer a sua representação gráfica. O objetivo dessas

medidas é quantificar a estrutura das redes, para possibilitar ao analista a compreensão do

comportamento dos fenômenos sociais que geraram essas redes.

3.1. Medidas ao nível dos agentes (ou nós)

São elas:

1. Centralidade do grau ou valência;

2. Centralidade de intermediação;

3. Centralidade de proximidade;

4. Centralidade do autovetor; e

7

5. Coeficiente de agrupamento local.

A centralidade do grau (ou valência) é definida pela seguinte expressão:

1

, 0n

i ij i

j

k a k n

(1) e 0v v vk N k n (2)

Onde aij é a entrada da i-ésima linha e j-ésima coluna da matriz de adjacência A.

E Nv é a vizinhança do agente (nó ou vértice) V.

Para redes direcionadas temos:

ik = grau de entrada (número de agentes de entrada, isto é, número das arestas ou relações que

começam no agente v).

ik = grau de saída (número de agentes de saída, isto é, número das arestas ou relações que

terminam no agente v).

1

n

i ij

j

k a

(3) , 1

n

i ij

j

k a

(4)

A medida do grau em redes direcionadas é também conhecida como prestígio. É uma

expressão muito usada em ARS (análise de redes sociais).

Existem dois tipos de prestígio: (i) o de suporte; e (ii) o de influência. O de suporte é o grau

de entrada e o de influência é o grau de saída. Em redes pesadas (ou ponderadas) a força é

equivalente ao grau. Ela é igual à soma dos pesos das arestas adjacentes a um dado agente (ou das

relações vinculadas a este agente). Tal como em (5):

1ij

nw w

i

j

k a

(5)

A intermediação de um nó (vértices) indica em que medida um dado nó se situa entre outros

nós da rede e pode ser calculado usando a fórmula da Equação 6. Os nós que obtêm valores altos de

intermediação tendem a ocupar papéis críticos na estrutura da rede, pois geralmente têm uma

posição de interação entre grupos, sendo elementos vitais na conexão de diferentes regiões da rede.

Esses atores que ocupam papeis críticos são chamados de gate-keepers, uma vez que tendem a

controlar o fluxo de informação que se estabelece entre as comunidades. A centralidade de

intermediação é dada pela seguinte expressão:

, ( )\

( )stv

s t V G v st

vb

(6)

Onde st é o número de caminhos mais curtos entre os agentes s e t (geralmente st =1). E

st (v) indica o número de caminhos mais curtos que passam pelo agente (vértice) v.

A intermediação de arestas, é definida como o número de caminhos mais curtos entre pares

de nós que percorrem uma aresta específica da rede, Equação 7. Essa medida permite identificar

pontes, que são ligações fora do círculo de conhecidos do indivíduo, e pontes locais, que são arestas

que permitem encurtar significativamente a distância entre vários subgrupos na rede, mas que, ao

contrário das pontes, não representam o único caminho possível de ligação entre estes subgrupos. A

intermediação de uma aresta be é dada por:

, ( )

( )uve

u v V G uv

eb

(7)

8

Sendo que be é o número de caminhos mais curtos entre pares de agentes que percorrem uma

aresta específica da rede. uv(e) representa o número de caminhos mais curtos que passam pela

aresta e. O somatório indica que esta fração tem que ser calculada para todos os pares de agentes (v)

na rede

Essa medida ajuda a identificar pontes e pontes locais, que são arestas com alto grau de

intermediação. Essas pontes são conexões fora do círculo mais próximo do agente e possuem

grande interesse para os agentes que buscam ter acesso a novos recursos. As pontes facilitam a

difusão de recursos a várias comunidades na rede (Kossinets e Watts, 2006). Mas essas situações

são geralmente raras no mundo real. E elas geram apenas uma vantagem temporária, pois as pontes

geralmente são instáveis ao longo do tempo. As pontes locais são mais realistas e permitem encurtar

bastante a distância entre vários subgrupos na rede. Mas, ao contrário das pontes, elas não

representam o único caminho possível de conexão entre esses subgrupos.

A expressão (8) resume a centralidade de proximidade:

( )\

1

( , )v

u V G v

nCl

d u v

(8)

Onde d(u,v) representa o comprimento do caminho mais curto entre os agentes u e v. É uma

medida da posição global de aproximação de um dado agente na rede.

A proximidade é uma medida aproximada da posição global de um dado ator na rede,

fornecendo uma ideia de quanto tempo um dado nó inicial demora para alcançar todos os outros nós

da rede, ou seja, é um quantificador da acessibilidade e mensura a rapidez com a qual certo agente

consegue atingir os outros agentes na rede. Muito útil para estimar custos de transporte em

aplicações de análise e elaboração de projetos, economia regional, comércio internacional, logística

etc. É o comprimento médio de todos os caminhos mais curtos entre um agente e todos os outros.

Ela é calculada para os agentes contidos na maior componente conectada da rede (giant

componente).

A equação (9) fornece a centralidade do autovetor:

1

1 n

i ij j

j

x a x

(9)

Onde xi/xj representa a centralidade do agente i/j; aij denota a matriz de adjacência A (aij =

1 se os agentes i e j estão conectados por uma aresta e aij = 0 se não estão) e indica o maior

autovetor da matriz A.

A centralidade do autovetor é uma medida proposta por Bonacich (1987) e fundamenta-se

na noção de que a centralidade de um agente é definida pela centralidade dos agentes com os quais

se relaciona (via trocas, transações etc.). Assim, o poder ou status econômico-financeiro de um

agente é definido pelo poder ou status econômico-financeiro de seus alters. Os alters são os agentes

diretamente relacionados ao agente central (também chamado de ponto focal ou ego). A

centralidade do autovetor é a combinação linear das centralidades dos seus vizinhos de primeira

ordem.

O coeficiente de agrupamento local é obtido a partir de (10):

2

( 1)

jk

i

i i

ec

k k

(10), sendo , ,i jkvj vk N e E (10)

9

Onde Ni é a vizinhança do agente vi; ekj denota a aresta que conecta o agente vj ao agente

vk; ki é o grau do agente vi e |ekj| é a proporção de relações (arestas) estabelecidas entre os agentes

da vizinhança de vi.

Na ARC, o analista pode examinar redes em que exista a propriedade da transitividade. Já

na ARS, as redes são naturalmente transitivas.

Existe uma probabilidade grande de amigos de um determinado amigo na rede serem

também amigos. Em redes econômico-financeiras também pode haver transitividade. Se um agente

fornece bens e serviços para outro, ele também pode ter relações com o concorrente ou com um

aliado deste outro. O coeficiente de agrupamento local ajuda a mensurar a transitividade. Ele pode

ser global (calculado para toda a rede) ou local (calculado para cada agente). A transitividade local,

denotada por ci e proposta por Watts e Strogatz (1998), é calculada para a vizinhança de um agente.

Indica o grau de coesão entre seus respectivos vizinhos.

3.2. Medidas ao nível da rede

3.2.1. Conceitos fundamentais

Três conceitos fundamentais da teoria dos grafos devem ser conhecidos antes da

apresentação das medidas estatísticas ao nível da rede. São eles: (i) o caminho; (ii) a distância

geodésica (caminho mais curto); e (iii) a excentricidade.

Um caminho é uma sequência de agentes (vértices ou nós) nos quais pares consecutivos de

agentes não repetidos estão ligados por uma relação (conexão ou aresta). O primeiro agente de um

caminho é o agente inicial e o último agente é o agente final.

A distância geodésica (ou caminho mais curto) é denotada por d(i,j) e corresponde ao

caminho mínimo entre os agentes i e j.

A excentricidade é a maior distância geodésica entre um agente v e qualquer outro agente no

grafo, conforme a expressão seguinte:

( )\max ( , )v

u V G vd v i

(11)

3.2.2. Estatísticas da ARC ao nível da rede

As mais amplamente difundidas são:

1. Diâmetro/raio;

2. Distância geodésica média;

3. Grau médio;

4. Reciprocidade;

5. Densidade; e

6. Coeficiente de agrupamento global.

O diâmetro (D) é a excentricidade máxima do conjunto de agentes que definem a rede. Já o

raio (R) é a excentricidade mínima deste conjunto de agentes.

As redes esparsas costumam apresentar diâmetro maior do que as redes completas. Isto

ocorre porque as redes esparsas possuem caminhos menores entre pares de agentes.

Para certo tipo de redes reais, o diâmetro efetivo diminui ao longo do tempo (Leskovec et

tal, 2005). Isto contraria a sabedoria convencional de diâmetros progressivamente menores. Esta

medida fornece uma ideia de proximidade de pares de agentes na rede complexa. Ela mede a

distância entre dois agentes no pior dos casos.

D = max {v: v V} (12) R = min{v: v V} (13)

10

A distância geodésica média é denotada por l. É medida para todas as combinações de pares

de agentes numa rede e expressa a noção de quão longe estão dois agentes um do outro, em média.

Ela ajuda a medir a eficiência do fluxo de transações, trocas ou relações econômico-financeiras no

interior da rede. Ela é expressa por (14):

1( , )

11

2i j

l d i j

n n

(14)

Onde d (i, j) representa a distância geodésica, ou comprimento do caminho mais curto, entre

os agentes i e j. E ½ n(n-1) indica o número máximo de relações (ou arestas, ou vínculos) numa

rede composta por n agentes. Esta equação não vale para o caso de uma rede que apresenta mais do

que uma componente conectada. Isto ocorre porque a d (i, j) é infinita quando não há cominho na

rede que conecte dois agentes. Nesses casos, é melhor recorrer à média harmônica da distância

geodésica (equação 15):

1 1 1

1 ( , )1

2i j

ld i j

n n

(15)

A média harmônica da distância geodésica é à medida que possibilita a transformação de

distâncias infinitas em distâncias nulas.

O grau médio, definido por (16), é apenas a média dos graus de todos os agentes da rede.

Conforme Costa et al. (2011), o grau médio é uma medida de conectividade global da rede.

1

1 n

i

i

k kn

(16)

A reciprocidade, r, é um indicador específico para redes direcionadas que mensura a

tendência de pares de agentes criarem conexões entre si. Há várias maneiras de se calcular essa

medida. A mais utilizada e intuitiva é calcular a razão entre o número de conexões mútuas na rede

o número de todas as conexões existentes (equação 17). A medida da reciprocidade denota a

probabilidade de existir simetria nas conexões entre os pares de vértices (aij =1 e aji =1). Nas redes

não direcionadas, conclui-se intuitivamente que a reciprocidade é a máxima possível, dado que

todos os pares de vértices mantêm conexões simétricas entre si.

#,0 1

# #

dmutr r

dmut dasym

(17)

Onde #mut indica o número de díades (pares de agentes) mútuos e #asym denota o número

de díades assimétricas.

De acordo com Wasserman e Faust (1994), uma díade assimétrica é um par de agentes

conectados por uma relação (aresta) cuja direção assume o sentido de um dos agentes, mas não de

ambos. De modo contrário, uma díade mútua é um par de agentes conectados por duas ligações,

cada uma delas indo a uma direção diferente. Por exemplo a b e sendo a e b dois agentes (ou

nós, ou vértices) em uma rede.

A densidade quantifica o grau de conectividade que uma rede possui e é uma medida

relevante ao nível da rede, pois ela expressa a proporção de arestas da rede em comparação com o

número máximo possível de arestas. O valor mínimo da densidade é 0, quando a rede não possui

arestas, e o valor máximo é 1, quando ela possui conectividade absoluta (uma rede completa ou um

11

clique). Portanto, quando a densidade é alta, a rede é densa e, quando ocorre o contrário, a rede é

esparsa.

max

( ) ,0 1m

Gm

(18)

Onde m representa o número de arestas presentes numa rede e mmax indica o número

máximo de arestas nessa rede. No caso de as redes não serem direcionadas, o número máximo de

arestas será dado por:

max

( 1)( )

2

n nm nd

(19)

Onde mmax (nd) simboliza o número máximo de arestas em uma rede não direcionadas e n é

o número de vértices da rede.

Porém, no caso de a rede ser direcionada, o número máximo de arestas é dado por:

max ( ) ( 1)m d n n (20)

Onde max (d) é o número máximo de arestas em uma rede direcionada.

A expressão (21) gera o coeficiente de agrupamento global.

1i

i

c cn

(21)

Onde ci (i = 1, 2, ..., n) é o coeficiente de agrupamento local (equação 9), conforme

definiram Watts e Strogatz (1998). O coeficiente de agrupamento global (c) é a média dos

coeficientes locais (ci’s). Existem outras formas de calcular a versão global do coeficiente de

agrupamento local, mas adotamos a versão de Watts e Strogatz (1998), que criaram a expressão

redes de “small world” para aquelas que emergem de contextos socioeconômicos reais e que são

caracterizadas por altos coeficientes de agrupamento globais. Nessas redes, é comum encontrar a

propriedade de transitividade entre pares de agentes. Isso aumenta a probabilidade de formação de

redes completas (ou cliques).

3.3. Analisando arestas, clusters e propriedades das redes

Em determinados cenários o analista pode estar interessado em descobrir o nó dominante,

com maior influência ou uma lista ordenada de nós com essas características. Para isso foram

desenvolvidos algoritmos de análise de ligações, sendo o PageRank e o HITS os mais populares.

Esses algoritmos exploram a relação existente entre as ligações e o conteúdo das páginas Web, com

o intuito de melhorar a tarefa de recuperação de informações na Web, sendo extremamente

importante no desenho de motores de busca eficientes.

Hub e authority são conceitos elementares. No contexto da Web, um hub pode ser entendido

como uma página Web que aponta para muitas outras páginas Web, ou seja, uma seleção de páginas

Web que abordam um tema especifico. A qualidade de um hub é geralmente determinada pela

qualidade das authorities para as quais aponta. As authorities são páginas Web citadas por vários

hubs diferentes, o que significa que sua importância é medida pelo número de ligações que recebem

de outras páginas. Normalmente boas authorities são fontes confiáveis de informação sobre um

determinado tema.

12

3.4. O PageRank

PageRank é um algoritmo de análise de ligações que se baseia no conceito de centralidade

do vetor próprio, utilizado pelo motor de busca da Google na medição de importância ou relevância

das páginas da internet. A relevância de uma página é medida com base no valor da informação

transmitida por essa página, então as que são consideras mais valiosas tendem a aparecer no topo

dos resultados das pesquisas no Google.

A ideia do algoritmo é que a informação da Web pode ser classificada de acordo com a

popularidade da ligação, quanto maior o número de páginas ligadas a uma dada página Web, maior

a sua popularidade. No entanto, a relevância dessas ligações também é importante. O PageRank

mede a importância relativa de um conjunto de páginas Web, tendo por base não apenas a

quantidade, mas sobretudo a qualidade das respectivas ligações.

Esses algoritmos também são utilizados em outros domínios do conhecimento, como nas

Ciências Sociais, onde as ligações podem ser analisadas através de duas perspectivas diferentes,

mas inter-relacionadas: uma centrada na informação e a outra centrada nos atores. Essas duas

perspectivas ajudam a compreender os fenômenos sociais subjacentes, por meio da identificação

das fontes de informação mais valiosas ou dos atores sociais mais relevantes. No entanto, ainda se

verifica ausência de princípios orientadores sobre como interpretar os resultados da análise de

ligações no contexto das Ciências Sociais.

3.5. Identificando clusters

Uma das características únicas das redes sociais é que possuem estrutura de comunidade.

Normalmente essa propriedade emerge como consequência da heterogeneidade global e local da

distribuição das arestas num grafo, então nesse tipo de rede é possível encontrar concentrações

elevadas de arestas em determinadas regiões, e baixa concentração de arestas entre essas regiões.

Comunidades, ou clusters, são grupos de vértices densamente conectados com ligações

esparsas entre eles. De acordo com Newman e Girvan (2004), existem duas linhas de investigação

principais na descoberta de comunidades de redes. A primeira teve origem no Campo da Ciência de

Computadores e é conhecida como partição de grafos, enquanto a segunda foi essencialmente

desenvolvida por sociólogos, sendo usualmente referida por blockmodeling, agrupamento

hierárquico ou detecção de estrutura de comunidades. O processo básico subjacente aos algoritmos

de detecção de comunidade baseia-se na divisão do grafo original num conjunto de subgrafos

disjuntos, por via da otimização de uma dada função objetivo. O propósito de ambas as abordagens

é descobrir grupos de vértices relacionados e, se possível, definir a respectiva organização

hierárquica, tendo por base informação fornecida pela topologia da rede. Isto é geralmente realizado

removendo iterativamente as arestas pontes que ligam grupos de vértices, conforme sugerido por

Girvan e Newman (2002).

Na vida real é possível encontrar uma variedade de exemplos de grupos coesos, ou

comunidades. A sociedade é um ambiente rico em encontrar comunidades, uma vez que as pessoas

têm uma tendência natural para formar grupos. Esses grupos podem ser famílias, círculos de

amigos, grupos religiosos ou de trabalho, cidades, nações, etc. Se também consideramos grupos

formados por empresas, ou consumidores de um dado produto, é possível identificar comunidades

com relevância para a área da Economia e da Gestão.

A importância de estudar estas comunidades é intuitiva em domínios como a ARS. Para

sublinhar esta importância, Fortunato (2010) afirmou que a análise da suposição estrutural dos nós,

em cada comunidade da rede, pode ajudar a identificar atores centrais, associados a funções de

estabilidade e controle do grupo, bem como atores intermediários, que são aqueles que se localizam

nas fronteiras das comunidades e desempenham um papel fundamental na disseminação e troca de

informações e novas ideias, criando pontes entre comunidades.

13

3.6. Agrupamento hierárquico

O agrupamento hierárquico é uma classe de métodos para detectar clusters, ou grupos.

Algoritmos hierárquicos geram estruturas de grupos inseridos dentro de grupos maiores que, por sua

vez, se encontram inseridos em grupos ainda maiores, que são representados por dendrogramas que

mostram a estrutura multinível da rede. Esses métodos são eficazes na solução de problemas de

análise de grupos e problemas semelhantes, como o particionamento de grafos e a identificação de

comunidades.

O agrupamento hierárquico é bastante intuitivo, sendo baseado na definição de semelhança.

Primeiro é necessário escolher uma medida de semelhança (ou dissemelhança) para avaliar quão

semelhantes são dois nós, de acordo com uma dada propriedade global ou local9. Em seguida, deve-

se calcular a matriz de semelhança entre todos os pares de nós, independente desses nós estarem

conectados entre si. Depois, é preciso selecionar um método para agrupar os nós: os métodos

aglomerativos, que focam nas regiões mais densas da rede ao invés de focar nas ligações das

fronteiras da rede10

, ou os métodos divisivos, que focam na identificação e remoção das ligações que

conectam regiões densamente conectadas a rede, sobretudo as pontes e as pontes locais (Easley e

Kleinberg, 2010)11

. Conforme a escolha, uma medida de distância é selecionada para calcular a

semelhança entre grupos12

. O resultado final desse processo é um dendograma que ilustra a

organização dos nós retornada pelo algoritmo hierárquico. Para selecionar os melhores métodos,

uma estratégia é calcular o valor de modularidade (Newman e Girvan, 2004) para as comunidades e

selecionar o número que maximiza essa função.

Um dos algoritmos mais conhecidos e utilizados na descoberta de comunidade em redes

sociais é o algoritmo de Girvan-Newman, desenvolvido por Girvan e Newman (2002). A ideia

principal deste algoritmo é que as comunidades de uma rede podem ser isoladas através da

identificação e remoção das arestas ponte, que são as arestas em que passam uma grande quantidade

de caminhos mais curtos entre os nós.

O primeiro passo do algoritmo de Girvan-Newman é calcular o valor de intermediação de

todas as arestas da rede. Então remover as arestas que obtenham maior valor de intermediação. E

repetir os passos anteriores até que todas as arestas do grafo tenham sido removidas.

Este algoritmo é baseado no conceito de intermediação, e é apropriado para redes de

tamanho moderado devido ao custo de computação exigido no cálculo da medida de intermediação.

O input (entrada) deste algoritmo é um grafo e o output (saída) é um dendograma.

3.7. Otimização (ou classe) da modularidade

A otimização (classe) de modularidade é outro tipo de método utilizado para detectar

comunidades em redes. A modularidade Q é uma função de qualidade que avalia e mede a

importância de uma dada partição da rede em comunidades. Esta função é utilizada para comparar a

qualidade das partições e também como uma função objetivo em problemas de otimização. Segundo

Newman (2006), a modularidade é representada pela diferença normalizada entre o número de

arestas observadas no interior de cada grupo de nós da rede e o número de arestas que seria

provável observar no interior desse mesmo grupo numa rede equivalente onde as arestas são

geradas aleatoriamente. A modularidade Q é calculada da seguinte forma:

9 Entre os exemplos dessa medida estão a semelhança do cosseno, o índice de Jaccard, a distância Euclidiana, a

distância de Manhattan e a distância de Hamming entre pares de linhas numa matriz de adjacência. 10 O algoritmo Walktrap (elaborado por Pons e Latapy, 2005) é um exemplo deste tipo de método. 11 O conhecido algoritmo de Girvan e Newman (2002), mencionado no texto, é um exemplo bastante citado deste

método. 12 Alguns exemplos dessa medida: o single linkage (ou vizinho mais próximo), o complete linkage (ou vizinho mais

afastado) e o método de Ward.

14

1( , )

2 2

i j

ij i j

ij

k kQ A c c

m m

(22)

Onde m indica o número de arestas;ik e jk representam respectivamente o grau dos vértices

i e j; ijA é a entrada da matriz adjacência que indica que o número de ligações estabelecidas entre

os vértices i e j; 2

i jk k

m representa o número esperado de arestas que deveria existir entre o par de

vértices (i, j); ic e jc denotam os grupos a que os vértices i e j pertencem; e ( , )i jc c representa o

delta de Kronecker.

A modularidade Q pode assumir valores positivos e negativos. Se Q > 0, então existe a

possibilidade de encontrar estrutura de comunidade em rede. Se Q for um número positivo e

elevado, então a respectiva partição tem maior probabilidade de refletir a estrutura de comunidade

verdadeira. De acordo com Clauset et al (2004), uma modularidade que assuma valores superiores

ou iguais a 0,3 é um bom indicador da existência de comunidade com significado na rede.

3.8. Como analisar redes reais? As seis propriedades.

Os problemas do mundo real são uma fonte de inspiração para as teorias de redes. A grande

maioria dos eventos do mundo real e das atividades que desenvolvemos, observamos e estudamos

podem ser facilmente modeladas utilizando grafos e, posteriormente, analisadas a luz da

metodologia das redes sociais.

Dada a enorme diversidade de redes passiveis de encontrar no mundo real, os investigadores

resolveram classifica-las em tipos principais, apesar desta classificação não ser consensual. Uma

classificação possível é a proposta por Newmam (2003).

Apesar dessas redes derivarem de campos de conhecimento distintos e serem originadas de

diferentes problemas do mundo real, elas partilham de um conjunto de propriedades que as tornam

peculiares, opondo-se desta forma, a dois modelos de redes bem conhecidos: as redes aleatórias e as

redes regulares. Por esse motivo, estas redes tendem a denominarem-se redes complexas.

Para modelar redes complexas são necessárias propriedades adicionais (Newman, 2003b).

Redes reais são gafos não-regulares e não-aleatórios com características únicas, onde a “ordem

coexiste com a desordem” (Fortunato, 2010).

Algumas das propriedades das redes complexas são:

1. Small World

2. Lei de potência e distribuição do grau em nós

3. Agrupamento ou transitividade

4. Resiliência

5. Padrões misturados

6. Estrutura de Comunidade

3.8.1. O “small world”

Como vimos, Stanley Milgram (1967), um psicólogo social americano, foi o primeiro a

sugerir a existência de efeitos dos “pequenos mundos” em redes sociais reais, por via de uma série

de experiências famosas conhecidas como Experiência de Milgram. A hipótese principal do estudo

era de que pares de indivíduos aparentemente distantes estão ligados por um caminho curto, isto é,

por um pequeno número de conhecidos, na rede. Neste experimento Milgram pediu a cerca de 300

participantes aleatórios de Omaha, Wichita e Nebraska, para enviar um dossiê a alguém que

conhecessem pessoalmente com o objetivo final de chegar esse dossiê a um determinado individuo-

15

alvo (um corretor de Boston). Com esta experiência foi possível demonstrar que o comprimento

médio dos caminhos que alcançaram o indivíduo-alvo era aproximadamente 6, o que deu origem ao

conceito seis graus de separação.

De fato, o efeito dos pequenos mundos tem sido amplamente observado em redes do mundo

real, observado pela existência de atalhos entre a maioria dos pares de nós numa rede. Isso significa

que duas pessoas separadas uma da outra podem rapidamente entrar em contato através de um

número baixo de conhecidos ou amigos. Em termos matemáticos o efeito dos pequenos mundos

implica que a distância geodésica media, isto é, o caminho mais curto, entre pares de nós cresça

logaritmicamente com a dimensão de uma rede de grau médio fixo (Newman, 2003b).

3.8.2. Segunda: Lei de potência e distribuição do grau em nós

A distribuição do grau P(k) é a distribuição de probabilidade dos graus dos nós numa rede.

Então P(k) representa a probabilidade de um vértice escolhido aleatoriamente e de forma uniforme

possuir grau k, e é definida como a fração de nós na rede que tem grau k.

Grafos aleatórios seguem uma distribuição binomial do grau, uma vez que a presença, ou

ausência, de uma aresta é igual para todos os pares de vértices existentes.

Em redes reais, a distribuição do grau é bastante distinta da distribuição do grau observada

nas redes aleatórias. Barabasi e Albert (1999) descobriram que em redes reais a distribuição dos

graus dos vértices é assimétrica positiva e muito heterogênea, já que a grande maioria dos vértices

assume valores pequenos de grau e a minoria tem valores elevados nesta medida.

Essa descoberta vem reforçar o trabalho de Price (1965) sobre rede de citações de artigos

científicos. A distribuição de grau em redes reais, tais como redes de citações, segue uma lei de

potência e as redes são chamadas de redes livres de escala (Barabasi e Bonabeau, 2003).

Distribuições que seguem uma lei de potência surgem quando a quantidade que um indivíduo obtém

de alguma coisa depende da quantidade que esse indivíduo já possui dessa mesma coisa. Uma

analogia comum é a de que dinheiro faz dinheiro ou os ricos ficam mais ricos.

3.8.3. Terceira: Agrupamento ou transitividade

De acordo com Wasserman e Faust (1994), a transitividade é uma propriedade que mede a

densidade de triângulos, isto é, três nós interligados por três arestas na rede, o que significa que

cada nó está totalmente conectado aos restantes dos nós na rede. Na linguagem de redes sócias, isto

significa que a probabilidade de um amigo do meu amigo também ser meu amigo é elevada.

3.8.4. Quarta: resiliência

A resiliência mede o impacto na conectividade da rede quando um, ou mais, vértices são

removidos, sendo um bom indicador de coesão da rede.

Quando vértices que definem uma aresta ponte são removidos, verificam-se fortes mudanças

na rede no que diz respeito à capacidade de comunicação entre pares de vértices, dado que alguns

pares ficam desconectados. Porem em cenários reais, a remoção de um único nó não é geralmente

motivo para alarme, uma vez que as redes reais são compostas por milhões ou bilhões de nós. Nesse

caso é mais apropriado testar a coesão da rede tendo por base a remoção de uma dada porcentagem

de nós.

3.8.5. Quinta: padrões misturados

Algumas redes são compostas por diferentes tipos de vértices. Nesses tipos de rede, a ligação

entre vértices ou a probabilidade de ligação entre pares de vértices tende a ser seletiva e bastante

dependente do tipo de vértice, por exemplo, nas redes alimentares os vértices podem representar

plantas, animais herbívoros ou animais carnívoros.

16

Em redes sociais essa propriedade também é evidente, uma vez que os indivíduos tendem a

interagir com indivíduos semelhantes. Essa ligação seletiva é usualmente denominada de

assortatividade ou homofilia, sendo as afinidades culturais, étnicas ou políticas os exemplos

clássicos.

3.8.6. Sexta: estrutura de comunidade

A grande maioria das redes sociais apresentam estrutura de comunidade, o que significa que

é possível encontrar grupos de vértices densamente conectados que estão esparsamente conectados

a outros grupos de vértices na rede.

3.9. Distribuições Force Atlas 1 e 2 para análise de redes

Os métodos Force Atlas e Force Atlas 2 são métodos de elaboração de gráficos direcionados

pela força. São desenhados baseados nas semelhanças e/ou diferenças nos dados. Os padrões podem

ser ajustados para colocar mais ênfase na independência entre um e outro dos agentes (vértices)

individuais. Ou então levando em conta a proximidade entre eles.

O algoritmo do Force Atlas possui opções para força de repulsão e também para força de

atração.

O Force Atlas 2 foi criado por Mathieu Jacomy no Sciences Po Médialab (Paris). Jacomy foi

membro fundador do Gephi Consortium13

. No blog do próprio criador deste algoritmo14

ele o

descreve como sendo

“Is a continuous algorithm, that allows you to manipulate the graph while it is rendering (a

classic force-vector, like Fruchterman Rheingold, and unlike OpenOrd). Has a linear-linear

model (attraction and repulsion proportional to distance between nodes). The shape of the

graph is between Früchterman & Rheingold’s layout and Noack’s LinLog. Features a

unique adaptive convergence speed that allows most graphs to converge more efficiently.

Proposes summarized settings, focused on what impact the shape of the graph (scaling,

gravity…). Default speed should be the good one. Now features a Barnes Hut optimization

(performance drops less with big graphs)” (Jacomy, 2011).

O Force Atlas 2 usa um conjunto diferente de opções em relação ao Force Atlas comum.

Tais opções fornecem maior controle sobre o resultado, razão pela qual o escolhemos para

descrever os vários índices de spillover de prazos distintos. Ele também permite definir parâmetros

para hubs (pontos focais centrais), gravidade e para a repulsão. Tais recursos nos permitiram

direcionar os vértices (que são os ativos de commodities) próximos do centro do grafo. Como o

Force 2 acrescenta a gravidade ao conjunto de opções do Force Atlas comum, optamos por dispor

os vértices mais ao centro, enquanto o hub empurrou os nós para as bordas do gráfico.

Ambas as distribuições são úteis para posicionar e analisar clusters. Sobretudo quando se

deseja que os vértices sejam distribuídos em grupos baseados na semelhança ou diferença existente

entre eles e outros vértices.

Normalmente, os resultados das duas distribuições e dos respectivos layouts são diferentes

apenas nos aspectos relativos à gravidade. A posição e a orientação podem variar um pouco, mas a

configuração dos clusters, hubs e dos outros vértices e arestas permanecem. A posição do eixo não

afeta a configuração destes dois métodos, a não ser em grafos com uma estrutura de X-Y (o que não

é o caso desta aplicação). O que importa é a posição relativa entre os vértices/ativos e a valoração

(ou ponderação) de cada aresta.

13 O Gephi é um dos softwares livres mais usados em análise de redes. Ver https://gephi.org/ 14 https://gephi.wordpress.com/2011/06/06/forceatlas2-the-new-version-of-our-home-brew-layout/

https://gephi.org/

https://gephi.wordpress.com/2011/06/06/forceatlas2-the-new-version-of-our-home-brew-layout/

17

4. Fontes dos dados

Os dados dos índices de spillovers das commodities foram obtidos do artigo de Ely e

Tessmann (2018). Os autores calcularam a transmissão de volatilidade de dez commodities (entre

elas mesmas, delas para o mercado e do mercado para elas). Utilizaram dados da Chicago

Mercantile Exchange.

5. Resultados

5.1. Índices de spillover de Diebold e Yilmaz (2012)

Com base nos preços de fechamento diário dos ativos no período, subtraindo o preço final

do dia pelo preço do dia anterior obtiveram-se os retornos diários dos ativos. Estimando o VAR dos

retornos de cada ativo utilizando o critério de Akaike para seleção de defasagens, e subtraindo o

retorno estimado do ativo pelo retorno real, foi encontrada a variância dos resíduos que identifica a

volatilidade dos choques. Com esses resíduos é montada a matriz de variância-covariância

necessária para formular os índices de spillover de Diebold e Yilmaz (2012), calculados por Ely e

Tessmann (2018), conforme o quadro 1.

O índice de spillover varia de 0 a 100 e verificou-se, nesse mercado, uma conectividade total

de 25.25. O “To” denota o quanto um ativo transborda para o mercado ou para outro ativo, por

exemplo, a volatilidade do petróleo transfere em 1.77 para os demais ativos do mercado. Enquanto

o “From” indica o quanto a volatilidade de um determinado ativo é influenciada pela volatilidade

total dos demais componentes do mercado ou de outro ativo, nesse caso, a volatilidade dos demais

ativos do mercado transborda volatilidade para o petróleo em 1.96.

Quadro 1 – Índices de spillover e conectividade das commodities

Nat. Gas Oil Cotton Coffee Sugar Soybeans Wheat Oats Corn Rice From

Nat. Gas 92.10 4,93 0.06 0.18 0.13 0.85 0.43 0.36 0.81 0.10 0.79

Oil 4.18 80.42 1.94 1.25 1.42 3.70 2.57 1.09 3.07 0.36 1.96

Cotton 0.04 2.04 85.62 1.24 0.88 3.03 2.65 1.03 2.75 0.72 1.44

Coffee 0.13 1.34 1.28 86.90 3.17 1.50 2.07 1.51 1.71 0.39 1.31

Sugar 0.14 1.52 0.92 3.27 87.24 2.07 1.84 0.60 1.90 0.49 1.28

Soy 0.53 2.74 2.12 0.94 1.33 58.31 8.40 6.35 16.56 2.72 4.17

Wheat 0.28 1.86 1.77 1.27 1.17 7.98 55.56 7.09 20.82 2.19 4.44

Oats 0.27 0.93 0.79 1.22 0.47 7.20 8.43 66.85 11.93 1.92 3.31

Corn 0.45 1.93 1.62 0.92 1.02 14.20 18.78 8.90 50.10 2.08 4.99

Rice 0.08 0.40 0.78 0.47 0.63 4.01 3.29 2.43 3.51 84.40 1.56

To 0.61 1.77 1.13 1.08 1.02 4.45 4.85 2.94 6.31 1.10 25.25

Fonte: Ely e Tessmann (2018).

18

O gráfico abaixo ilustra a conectividade total das commodities em questão no período

avaliado:

Figura 4 – Conectividade total das commodities (cotações diárias de fechamento em

2000-2018)


Os gráficos a seguir ilustram o quanto cada commodity transmite em volatilidade para as

demais no período analisado:

19

Figura 5 – Transmissão dos spillovers das commodities (cotações diárias de fechamento

em 2000-2018)


Da mesma forma, os gráficos seguintes ilustram quanto de volatilidade cada commodity

recebeu das demais no período considerado:

20

Figura 6 – Volatilidade recebida das commodities (cotações diárias de fechamento em 2000-

2018)


21

5.2. Análise das estatísticas da rede

A tabela 1 apresenta as medidas estatísticas da rede elaborada com os dados do quadro 1 e

dispostos graficamente pelo algoritmo de Force Atlas2:

Tabela 1 – Medidas estatísticas da rede de transmissão de volatilidade

Legenda Grau

Grau de

entrada

ponderado

Grau de

saída

ponderado

Grau ponderado

Classe de modularidade

PageRanks

Gas 18 6.1 7.85 13.95 0 0.035366102387969015

Oil 18 17.69 19.58 37.27 0 0.07648911166094712

Cotton 18 11.28 14.38 25.66 0 0.05280025220370181

Coffee 18 10.76 13.1 23.86 0 0.050373687082745214

Sugar 18 10.22 12.75 22.97 0 0.04888794238697127

Soybean 18 44.54 41.69 86.23 1 0.16565316880421418

Wheat 18 48.46 44.43 92.89 1 0.1800419335664106

Oats 18 29.36 33.16 62.52 1 0.11649019240715708

Corn 18 63.06 49.9 112.96 1 0.22187681383714988

Rice 18 10.97 15.6 26.57 1 0.052020810563894765

Fonte: Elaboração dos autores

Inicialmente, cabe mencionar que a rede elaborada é um dígrafo n-partido completo15

. Os

graus dos vértices são idênticos e iguais a 18, isto é, cada um dos 10 vértices recebe 9 arestas

direcionadas e envia outras 9 para os demais 9 vértices. Os graus de entrada e de saída ponderados,

que expressam o “peso” das arestas recebidas e enviadas por cada vértice, são somados e geram a

medida de grau ponderado. Em ordem decrescente, os mais representativos são: o milho, o trigo, a

soja, a aveia e, um tanto mais distante, o petróleo e o arroz. Os outros ativos possuem graus

ponderados em torno de 22 a 26, aproximadamente.

Em relação à modularidade Q (classe de modularidade), os ativos assinalados com o valor 1

fazem parte de um agrupamento (cluster ou comunidade). Nota-se que são praticamente os mesmos

ativos com maiores graus ponderados, com a exceção somente do arroz. Chamaremos este cluster

de agrupamento principal da rede. E analisaremos os fatores pelos quais eles são próximos na

subseção seguinte. Os outros ativos, numerados com o valor zero, não constituem agrupamento(s)

secundário(s), ainda que, como veremos na descrição da rede, na próxima subseção, existam ainda

dois ciclos que merecem análise (café-açúcar e petróleo-gás).

Finalmente, os algoritmos de PageRank confirmam os valores altos deste agrupamento

principal, mantendo a mesma ordem decrescente dos graus ponderados que mencionamos.

5.3. Análise da distribuição-layout Force Atlas2

Os dados do quadro 1, com as estimativas de Ely e Tessmann (2018), geraram a rede da

figura 3. Pelo fato de que as transmissões de volatilidade ocorrem de cada ativo para todos demais,

as são direcionadas. Elas foram “pesadas” (ou ponderadas) com os dados dos índices de spillovers.

Utilizou-se uma distribuição de Force Atlas 2, a qual consideramos a mais adequada para descrever

graficamente a distribuição espacial dos spillovers das commodities16

.

15 Este parágrafo é melhor compreendido com o auxílio do glossário do anexo 2. Também pode ser útil uma consulta ao

livro clássico de Flament (1963 ). 16 Elaboramos redes utilizando outras distribuições. Elas estão no anexo 3 deste trabalho.

22

Pode-se observar que os resultados estão concentrados em um agrupamento principal

(cluster ou comunidade) e em dois ciclos cuja transmissão mútua da volatilidade merece atenção.

No agrupamento mais denso e com arestas mais “pesadas” estão presentes as transmissões mais

significativas entre os ativos de milho, trigo, soja, aveia e arroz.

Nos outros dois ciclos, que possuem arestas mais tênues que as do agrupamento principal,

há os ativos de gás-petróleo e café-açúcar.

O outro ativo que sobra é o algodão. Ele não chega a ser um outlier, uma vez que também

transmite e recebe volatilidade considerável do referido agrupamento (sobretudo do arroz, cujas

arestas se mostram um pouco mais grossas).

Percebe-se que os ativos que possuem arestas mais valoradas (as de maior peso) são

justamente os do agrupamento principal e os dos dois ciclos. Isso ocorre, em parte, por causa de: (i)

vínculos existentes na cadeia produtiva deles; (ii) questões relativas às elasticidades cruzadas da

demanda (bens complementares, bens substitutos etc.); (iii) ao preço dos bens subst itutos e

complementares na produção; (iv) as características intrínsecas do cultivo de cada ativo; (v) ao fato

de eles serem bens importantes e substitutos no mercado de insumos para várias outras cadeias

produtivas; (v) terem sido alvo de especulação no período pós Grande Recessão e de aumento

vertiginoso da demanda decorrente do forte crescimento econômico chinês e indiano, além de

outros fatores que serão mencionados na próxima subseção.

Primeiramente, em relação aos vínculos, o ciclo de petróleo-gás refere-se a duas cadeias

produtivas similares, interdependentes e muitas vezes com produções verticalizadas (como no caso

da Petrobras, da russa Gazprom, da Petróleos Mexicanos – Pemex etc.). No caso do ciclo de café-

açúcar, ambos são bens complementares.

No tocante às elasticidades cruzadas, os ativos do agrupamento principal apresentam

características já descritas em alguns estudos, como o de Wright (2012), que aponta o milho e a soja

como bens substitutos na produção; Lessley, Johnson e Hanson (1991), que chegam à mesma

conclusão para o milho e a aveia e Bekkerman (2014), que afirma o mesmo para o trigo e a aveia.

Quanto aos bens substitutos e complementares na produção, os ativos do agrupamento

principal são complementares como insumos na elaboração de vários tipos de rações animais (à

base de farelos de soja, trigo, aveia e milho). Estas rações são utilizadas em várias cadeias

produtivas agropecuárias, tais como: suinocultura, bovinocultura, cinofilia, equinocultura,

avicultura, ovinocultura, caprinocultura, pecuária leiteira etc. O arroz e o algodão também fornecem

farelos para rações, mas não fazem parte deste agrupamento principal porque não são substitutos na

produção em relação aos grãos que os compõem. Ainda em relação ao agrupamento principal, além

de serem substitutas, pode existir complementaridade entre algumas das commodities17

. No Brasil,

o caso do milho e da soja foi estudado por Caldarelli e Bacchi, que mostraram uma forte interação

entre os mercados de milho e de soja, evidenciando uma relação de complementaridade na oferta e

de serem substitutos na demanda. Estes autores afirmaram:

“No que diz respeito às relações entre os mercados de soja e milho (complementaridade ou

substitutibilidade), os resultados das funções de respostas a impulso demonstram que elas

dependem do nível de mercado considerado. No caso de um choque no consumo aparente de

milho ou no preço desse grão no segmento atacadista, prevalecem os efeitos de

complementaridade. Assim, um aumento no consumo aparente de milho leva a um

acréscimo no preço do milho e da soja e um aumento do preço do milho no atacado reduz o

consumo do cereal, diminuindo também o consumo e o preço da soja. De outro lado,

choques em variáveis relacionadas ao segmento produtor – preço de milho ou preço de soja

– indicam substitutibilidade entre a leguminosa e o cereal. Por exemplo: um aumento do

17 A análise desta relação em mercados internacionais de commodities fica para pesquisas futuras.

23

preço do milho leva a um aumento da oferta desse grão, reduzindo a oferta de soja e

elevando o preço desta leguminosa.” (Caldarelli e Bacchi, 2012).

Figura 7 – Distribuição de Force Atlas 2 para a transmissão de volatilidade

Fonte: Elaboração dos autores.

No que tange às características intrínsecas do cultivo de cada ativo, os ativos do

agrupamento principal requerem condições climáticas que apresentam mais semelhanças do que

diferenças (quadro 2)18

.

18 O quadro é indicativo das espécies mais utilizadas de cada ativo. É uma síntese geral, que ignora as particularidades

do cultivo de cada produto e das espécies de cada um deles.

24

Quadro 2 – Fatores que influem no cultivo das commodities analisadas

Commodities

Radiação solar Geada ou neve Chuvas e

irrigação

Temperaturas

médias

Umidade do

solo

Trigo

Evitar excesso de

sol no início do

plantio

Geadas só no início

do plantio

40 a 140 mm

por ano, a

depender da

fase de

produção

Menor do que

27°

Menor do

que 75%

Milho

Essencial, pois o milho precisa de

luminosidade para

maturar o grão.

Sensível às baixas temperaturas e

geadas.

250 mm até 5.000 mm por

ano.

12,8°C à noite e acima de

19,5°C

durante o dia.

Média. Não podem ser

solos muito

úmidos ou

encharcados.

Soja

A soja necessita

de radiação solar

para o ciclo de

maturação e para

a colheita.

No início do cultivo

ou na maturação, as

geadas leves podem

não prejudicar e até

ajudar no controle de

fungos. Mas geadas

fortes podem ser

prejudiciais

De 700 mm a

1.200 mm por

ano (bem

distribuídos).

Entre 25°C e

35°C.

Média. Não

pode

ultrapassar

30%.

Aveia É uma planta de dias longos.

Precisa de sol,

mas não tolera

temperaturas

acima de 32°C.

Alguns tipos resistem à geada.

Mas outros não são

resistentes.

Precisa de muita umidade e

chuvas.

Requer baixas temperaturas.

Entre 13°C e

23°C.

Não tolera solos muito

úmidos.

Prefere solos

bem

drenados.

Arroz

Sim. O plantio

carece de luz

solar.

Prejudicam no

emborrachamento e

floração

Muito

desejáveis.

Entre 25°C e

32°C.

Planta

hidrófila.

Necessita de

solos muito

úmidos ou

encharcados.

Algodão

Mais de 200 dias

de sol por ano

Precisa de 180 a 200

dias seguidos sem geadas ou neve

Precisa de

irrigação e chuvas

regulares.

Acima de

20°C.

Não suporta

solos muito úmidos.

Fontes: Elaboração dos autores a partir do conteúdo do sítio da Embrapa

Alguns dos ativos mencionados foram alvos de muita especulação no período pós Grande

Recessão. Os retornos de ativos de renda fixa e variável caíram muito e muitos recursos transferidos

destes ativos para os derivativos de commodities (contratos de opções e futuros, principalmente). O

modelo simples de Knittel e Pyndick (2016) ajuda a explicar esse fenômeno para o mercado de

petróleo. Cabe transcrever a visão de Czech (2012), que estudou o papel dos especuladores para

explicar os movimentos dos preços de commodities agrícolas, que atingiram picos em 2007-2008 e

2010-2011:

“A maior parte da literatura acadêmica não apoia a ideia de que os especuladores dirigem os

preços das commodities para além dos níveis dos seus fundamentos. Há, no entanto, alguns

pesquisadores que acham evidências empíricas que sustentam a ideia de que a atividade dos

especuladores afeta os preços das commodities. Este artigo conclui que a atividade dos

especuladores podem temporariamente sobrevalorizar ou depreciar os valores das

25

commodities. Assume-se, no entanto, que os fundamentos e os fatores financeiros

influenciam os preços das commodities. No entanto, é difícil indicar em que medida cada

fator afeta separadamente os preços.” (Czech, 2012).

Como sugere Czech em relação aos fundamentos, os preços dos ativos também tiveram forte

alta após o aumento significativo da demanda, como reflexo do forte crescimento econômico da

China e da Índia. Estes países são muito populosos e parcelas expressivas de seus povos passaram a

ter acesso maior ao consumo de proteínas, açúcar e cereais.

Finalmente, o estudo da FGV Projetos19

também corrobora estes pontos de vista e toca em

outro ponto importante que é a complementaridade na produção de biocombustíveis (no caso do

milho e da soja), do etanol (cana-de-açúcar), e da biomassa (casca e palha de arroz)20

. Para a FGV,

a referida alta das commodities decorreu dos seguintes fatos:

i. Crescimento da demanda por alimentos e mudança da sua estrutura de consumo - mais

proteína e menos carboidratos –, graças ao crescimento da renda da população e à

urbanização dos países menos desenvolvidos;

ii. Utilização de cereais e outros produtos agrícolas na fabricação de combustíveis;

iii. Operações nos mercados financeiros;

iv. Quebras de safra provocadas pelo clima;

v. Baixo nível de estoques de cereais, resultado de mudanças de políticas públicas ou de

quebras de safra;

vi. Custos crescentes de combustíveis e fertilizantes;

vii. Desvalorização do dólar a partir de 2022; e

viii. Medidas protecionistas adotadas por diversos governos após o início da alta dos preços.

Entre elas, a proibição de exportação de alimentos e a desvalorização cambial em relação ao

dólar, moeda em que são comercializadas as commodities. Ao reduzirem as exportações, as

medidas teriam contribuído para a elevação dos preços dos alimentos nos mercados de

outros países.

6. Conclusões

O cálculo das estatísticas do algoritmo de grafos Force Atlas2 foi realizado com base nas

estimativas dos índices de spillover feitas por Ely e Tessmann (2018). A rede gerada classifica-se

como um dígrafo n-partido completo. Trata-se de um dígrafo (grafo direcionado) porque as

transmissões de volatilidade ocorrem de cada ativo para todos demais, de forma direcionada e com

“pesos” nas arestas (arestas ponderadas ou valoradas). Esses pesos correspondem aos índices de

spillover. A distribuição de Force Atlas 2 foi considerada como a mais adequada para descrever

graficamente a distribuição espacial dos spillovers das commodities. As outras distribuições de

layout estimadas estão no anexo 1 deste trabalho e podem ser úteis para confirmar, sob diferentes

perspectivas visuais, as conclusões do artigo.

A primeira conclusão, extraída da análise das estatísticas da rede (ao nível dos vértices e da

rede, em sentido amplo) e também da observação dos layouts de Force Atlas 2 e dos outros que

constam no anexo 1 é: uma concentração em um agrupamento principal e a existência de dois

ciclos. O agrupamento principal é mais denso e possui arestas mais grossas ou pesadas, refletindo

as transmissões mais relevantes de volatilidade entre o milho, o trigo, a soja, a aveia e o arroz. Nos

dois ciclos, com arestas mais finas do que as do agrupamento principal, estão os binômios de gás-

petróleo e café-açúcar. O algodão é o único ativo que não pertence a ambos os ciclos e ao

19 http://bibliotecadigital.fgv.br/dspace/bitstream/handle/10438/6947/326.pdf?sequence=1 20 Ver Cortez, Lora e Gomez (2008). https://www.nipe.unicamp.br/docs/publicacoes/inte-biomassa-energia070814.pdf

http://bibliotecadigital.fgv.br/dspace/bitstream/handle/10438/6947/326.pdf?sequence=1

https://www.nipe.unicamp.br/docs/publicacoes/inte-biomassa-energia070814.pdf

26

agrupamento principal. Mas, ainda assim, as estatísticas mostram que ele transmite e recebe

volatilidade do referido agrupamento (sobretudo do arroz, cujas arestas se mostram um pouco mais

grossas).

Cabe analisar o porquê de os ativos (ou vértices) que possuem arestas de maior peso serem

os do agrupamento principal e os dos dois ciclos.

A explicação recai em várias hipóteses, cuja análise detalhada foge do escopo deste

trabalho. Porém, tais hipóteses podem servir para pesquisas futuras. Essas hipóteses, levantadas a

partir de pesquisa da literatura sobre commodities são: (i) vínculos existentes na cadeia produtiva de

algumas das commodities; (ii) questões relativas às suas elasticidades cruzadas da demanda (bens

complementares, bens substitutos etc.); (iii) preço das commodities que são bens substitutos e

complementares na produção; (iv) características intrínsecas do cultivo de cada commoditie

agrícola (excluem-se aqui o gás e o petróleo, obviamente; (v) o fato de algumas commodities

agropecuárias serem bens importantes e substitutos no mercado de insumos para várias outras

cadeias produtivas; (v) as commodities foram objeto de especulação no período pós Grande

Recessão e de aumento vertiginoso da demanda decorrente do forte crescimento econômico chinês

e indiano.

Referências

AMORIM, J. B. P. O problema das quatro cores. Tese de doutoramento. Coimbra: Universidade de

Coimbra, 1953.

ANDERSON, J.R. Comment on "Bubble Troubles? Rational Storage, Mean Reversion, and Runs in

Commodity Prices". In: CHAVAS, J. P., HUMMELS, D. e WRIGHT, B. D. (editors). The

Economics of Food Price Volatility. Chicago: University of Chicago Press, 2014.

http://papers.nber.org/books/chav12-1

BARABASI, A. L. e ALBERT, R. Emergence of scaling in random networks. Science, 286(5439):

509-512, 1999. https://arxiv.org/pdf/0906.0612.pdf

BEKKERMAN, A., SCHWEIZER, H. e SMITH, V. H. The impacts of the canadian wheat board

ruling on the north american malt barley markets. Canadian Journal of Agricultural

Economics/Revue Canadienne D'agroeconomie, 62: 619–645, 2014. doi:10.1111/cjag.12044.

BARABASI, A. L. e BONABEAU, E. Emergence of scaling in random networks. Scientific

American, 288: 60-69, 2003.

BONACICH, P. Power and centrality: a family of measures. The American Journal of Sociology.

92 (5): 1170-1182, 1987.

BUSACKER, R. G. e SAATY, T. L. Finite graphs and networks: an introduction with

applications. New York: McGraw-Hill,1965.

CALDARELLI, C. E. e BACCHI, M. R. P. Fatores de influência no preço do milho no Brasil. Nova

Economia, v. 22, n. 1 Belo Horizonte Jan./Apr. 2012

CLAUSET, A., NEWMAN, M. E. J. e MOORE, C. Finding community structure in very large

networks. Physical Review E, 70(6): 066111, 2004.

https://arxiv.org/pdf/cond-mat/0408187.pdf

CZECH, K. Speculation in the agricultural commodity market. Varsóvia, Polônia: Departament of

Agricultural Economics and International Economic Relations of Warsaw University of Life

Sciences, 2012.

http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.921.6672&rep=rep1&type=pdf

http://papers.nber.org/books/chav12-1

https://arxiv.org/pdf/0906.0612.pdf

https://arxiv.org/pdf/cond-mat/0408187.pdf

http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.921.6672&rep=rep1&type=pdf

27

COHEN, R. e HAVLIN, S. Complex Networks: Structure, Robustness and Function. Cambridge,

Massachussets: Cambridge University Press, 2010.

CORTEZ, L. A. B.; LARA, E. E. S. e GÓMEZ, E. O. (orgs). Biomassa para energia. Campinas,

SP: Editora da Unicamp, 2008.


DIEBOLD, F. X. e YILMAZ, K. Better to Give than to Receive: Forecast-Based Measurement of

Volatility Spillovers. International Journal of Forecasting, 28(1), 57-66, 2012.

http://financialconnectedness.org/research.html

EASLEY, D. e KLEINBERG, J. Networks, crowds and markets: reasoning about a highly

connected world. Cambridge, Massachussets: Cambridge University Press, 2010.

ELY, R. A. e TESSMANN, M. Transmissão de volatilidade entre commodities no curto, médio e

longo prazos. Pelotas: Universidade Federal de Pelotas, 2018.

ERDŐS, P. e RÉNYI, A. On the evolution of random graphs. Publications of the Mathematical

Institute of the Hungarian Academy of Sciences, 1960

ERDŐS, P. e RÉNYI, A. On Random Graphs. Publicationes Mathematicae. 6: 290–297, 1959.

FGV PROJETOS. Fatores determinantes dos preços dos alimentos: o impacto dos biocombustíveis.

Rio de Janeiro: Editora da Fundação Getúlio Vargas, Nov. 2008.


FLAMENT, C. Applications of graph theory to group structure. New Jersey: Prentice-Hall, 1963.

FORTUNATO, S. Community detection in graphs. Physics Report, 486(3-5): 75-174, 2010.


FRUCHTERMAN, T. M. J. e REINGOLD, E. M. Graph Drawing by Force-Directed Placement.

Software: Practice and Experience, 21(11), 1991.

GAMA, J., CARVALHO, A P. L., FACELLI, K. et al. Extração de conhecimento de dados – data

mining. 2ª ed. Lisboa: Sílabo, 2015.

GIRVAN, M. e NEWMAN, M. E. J. Community structure in social and biological networks.

Proceedings of NSF Workshop on Next Generation Data Mining, p. 99-108, 2002.

HU, YIFAN. Efficient, high-quality force-directed graph drawing. The Mathematica Journal, 10, v.

1, 2006.

http://www.mathematica-journal.com/issue/v10i1/contents/graph_draw/graph_draw.pdf

KOSSINETS, G. e WATTS, D. J. Neural network ensembles, cross validation and active learning.

In: Advances in Neural Information Processing Systems, v. 7, p. 231-238, 1995.

JACOMY, M., VENTURINI, T. , HEYMANN, , S. e BASTIAN, M. Force Atlas2, a continuous

graph layout algorithm for handy network visualization designed for the Gephi software. PLoS

ONE, 9(6): e98679, 2014. https://doi.org/10.1371/journal.pone.0098679.

KNITTEL, C. R. e PYNDICK, R. S. The simple economics of commodity prices speculation.

American Economic Journal: Macroeconomics, 8(2), p. 85–110, 2016.

http://dx.doi.org/10.1257/mac.20140033

LESKOVEC, J., KLEINBERG, J. e FALOUTSOS, C. Graphs over time: densification laws,

shrinking diameters and possible explanations. In: Proceedings of the 11th ACM SIGKDD

International Conference on Knowledge Discovery in Data Mining, p. 177-187, New York, NY,

USA. ACM, 2005.


http://financialconnectedness.org/research.html



http://www.mathematica-journal.com/issue/v10i1/contents/graph_draw/graph_draw.pdf

https://doi.org/10.1371/journal.pone.0098679

http://dx.doi.org/10.1257/mac.20140033

28

LESSLEY, B. V., JOHNSON, D. M. e HANSON, J. C. Using the Partial Budget to Analyze Farm

Change: 1990-1991. Maryland: University of Maryland System, pp. 7, 1991.

https://www.arec.umd.edu/sites/arec.umd.edu/files/_docs/Using%20the%20Partial%20Budget_0.pd

f

MARINO, R. As pontes de Konigsberg. In: Todas as configurações possíveis. Blog.

http://www.todasasconfiguracoes.com/2012/06/15/as-pontes-de-konigsberg/

NEWMAN, M. E. J. Mixing patterns in networks. Physical Review E, 67(2): 026126, 2003a.

NEWMAN, M. E. J. The structure and function of complex networks. SIAM Review, 45(23): 167-

228, 2003b.

NEWMAN, M. E. J. Modularity and community structure in networks. Proceedings of the National

Academy of Sciences of the United States of America, 103(23): 8577-8528, 2006.

NEWMAN, M. E. J. e GIRVAN, M. Finding and evaluating community structure in networks.

Physical Review E, 69(2): 026113, 2004.

PEREIRA, J. M. S. Grafos e redes: teoria e algoritmos básicos. Rio de Janeiro: Interciência, 2013.

PONS, P. e LATAPY, M. Computing commuties in large networks using random networks.

Journal of Graph Algorithms and Applications, v. 10, n.2, p. 191-2018, 2006.

PRICE, D. D. S. Networks of scientific papers. Science, 149(3683): 510-515, 1965.

http://garfield.library.upenn.edu/papers/pricenetworks1965.pdf

RABUSKE, M. A. Introdução à teoria dos grafos. Florianópolis: Editora da UFSC, 1992.

RUOHONEN, K. Graph Theory. Tampere, Finlândia: Tampere University of Technology, 2013.

http://math.tut.fi/~ruohonen/GT_English.pdf

WASSERMAN, S. e FAUST, K. Social network analysis: methods and applications. Cambridge,

Massachussets: Cambridge University Press, 1994.

WATTS, D. J. Networks, dynamics and the small-world phenomenon. American Journal of

Sociology, v. 105, Issue 2, 493-527, Sep. 1999.

WATTS, D. J. e STROGATZ, S. H. Collective dynamics of small-world networks. Nature,

193(6684): 440-442, 1998.

WRIGHT, B. International grain reserves and other instruments to address volatility in ,grain

markets. The World Bank Research Observer, v. 27, n. 2, August 2012.

https://openknowledge.worldbank.org/bitstream/handle/10986/17115/wbro_27_2_222.pdf?sequenc

e=1&isAllowed=y

https://www.arec.umd.edu/sites/arec.umd.edu/files/_docs/Using%20the%20Partial%20Budget_0.pdf

https://www.arec.umd.edu/sites/arec.umd.edu/files/_docs/Using%20the%20Partial%20Budget_0.pdf

http://www.todasasconfiguracoes.com/2012/06/15/as-pontes-de-konigsberg/

http://garfield.library.upenn.edu/papers/pricenetworks1965.pdf

http://math.tut.fi/~ruohonen/GT_English.pdf

https://openknowledge.worldbank.org/bitstream/handle/10986/17115/wbro_27_2_222.pdf?sequence=1&isAllowed=y

https://openknowledge.worldbank.org/bitstream/handle/10986/17115/wbro_27_2_222.pdf?sequence=1&isAllowed=y

29

Anexo 1 – Outras distribuições de layout de grafos 21

Figura 8 - Distribuição de Fruchterman-Reingold: é um algoritmo de layout dirigido pela

força. Ele considera a força existente entre dois vértices, que são representados, para usar uma

analogia, por “anéis de aço” (sendo as arestas as “molas” que os seguram). A força de atração é a

própria força da mola e a força de repulsão, seria como uma força elétrica. Nesta distribuição a

soma dos vetores de força determina qual direção um vértice deve se mover.

Fonte: Cálculos dos autores.

21 Os comentários deste anexo baseiam-se nos conteúdos do sítio do Gephi (https://gephi.org/ ) e nos artigos dos

próprios autores que desenvolveram os algoritmos de layout mostrados (citados nas referências).

https://gephi.org/

30

Figura 9 - Distribuição Noverlap: ela primeiramente separa o grafo em uma grade de

quadrados. Em seguida, localiza os vértices nos quadrados (um vértice pode estar em vários

quadrados, se for grande). Depois, faz uma lista de relações de proximidade, isto é, dois vértices

ficarão mais próximos se estiverem na mesma área (ou em um quadrado comum). Finalmente, a

distribuição testa cada uma dessas relações, elimina os vértices que não se sobrepõem e aplica uma

força repulsiva naqueles vértices que se sobrepõem.


31

Figura 10 - Distribuição de Yifan Hu: nas palavras do próprio Yifan Hu (2006): “Nós

propomos um algoritmo de desenho de grafos que seja eficiente e de alta qualidade. Este algoritmo

combina uma abordagem multinível, que efetivamente supera os mínimos locais, com a técnica de

árvore óctupla de Barne e Hut, que aproxima de forma eficiente as forças de curto e de longo

alcance. Nossos resultados numéricos mostram que o algoritmo é comparável em velocidade ao

algoritmo de desenho de grafo multinível altamente eficiente de Walshaw e ainda gera melhores

resultados para alguns dos problemas difíceis. Além disso, um esquema de amenização adaptativa

para os algoritmos dirigidos pela força e um modelo de força repulsivo geral são propostos.” (Yifan

Hu, 2006).


32

Figura 11 - Distribuição de Yifan Hu Proporcional: O algoritmo de Yifan Hu Proporcional é

similar ao algoritmo Yifan Hu. A diferença é que o primeiro estabelece um deslocamento

proporcional para distribuir os vértices na área do grafo. Em termos de velocidade de cálculo e

precisão, não há muita diferença entre os dois.


33

Anexo 2– Glossário resumido com os principais termos referentes à teoria dos grafos.

Uma das dificuldades de quem inicia o estudo da teoria dos grafos e a ciência de redes é

dominar o seu vocabulário específico. Portanto, elabora-se este glossário para facilitar a leitura das

análises do texto.

Aresta – linha que liga dois vértices em um grafo

Arestas paralelas – representam conexões diferentes entre vértices idênticos.

Árvore – um grafo conexo que não possui ciclos. Dada uma árvore T, existe apenas um caminho

simples entre dois vértices de T, caso contrário, os dois caminhos formariam um ciclo.

Árvore geradora - Um subgrafo T de um grafo conexo G é denominado árvore geradora de G se T

for uma árvore e se ela incluir todos os vértices pertencentes a G. Seja G um grafo conexo

ponderado. Nesse caso, qualquer árvore geradora T de G estará associada a um peso total obtido

pela soma dos pesos das arestas em T.

Árvore geradora mínima - é uma árvore geradora cujo o peso total é o menor possível.

Caminho em um multigrafo G – é uma sequência conexa de vértices e arestas tal que:

V0, e1, V1, e2, ..., en, Vn

No qual cada aresta ei contém os vértices Vi-1 e Vi. O comprimento do caminho é definido pelo

número n de arestas e, sempre que não existir uma situação ambígua, é possível descrever um

caminho por meio de sua sequência de vértices. Intuitivamente, um caminho é considerado fechado

se V0 = Vn.

Caminho fechado – um caminho com o primeiro e o último vértices idênticos.

Caminho gerador – caminho que engloba todos os vértices de um grafo G.

Caminho orientado - Seja G um grafo orientado. Os conceitos de caminho, caminho simples, trilha

e ciclo são os mesmos dos grafos não orientados, exceto pelo fato de que a direção da aresta deve

coincidir com a direção do caminho. Um caminho (orientado) P em G é uma sequência alternada de

vértices a arestas orientadas, por exemplo, P = { V0, e1, V1, e2, ..., en, Vn}, tal que cada aresta ei

começa em Vi-1 e termina em Vi . Quando não existir ambiguidades, denotamos P, por sua

sequência de vértices ou de arestas.

Caminho simples – aquele no qual todos os vértices são distintos. Um vértice V será alcançável a

partir de um vértice U quando existir um caminho de U para V. Se V for alcançável a partir de U,

então há um caminho simples de U para V.

Ciclo ou circuito – é um caminho fechado que, com a exceção do seu primeiro e último vértices,

possui todos os outros distintos entre si. Um caminho que começa e acaba no mesmo vértice. Um

ciclo num dígrafo é qualquer passeio (v0, v1,…, vk−1, vk) que satisfaça as seguintes restrições: k ≥

1, vk = v0 e os vértices v0, v1,…, vk−1 são distintos dois a dois. As arestas do ciclo apontam

todos na mesma direção. Para enfatizar esse fato, usam-se ocasionalmente as expressões ciclo

orientado e ciclo dirigido no lugar de ciclo. Ciclos podem se parecer com caminhos, pois se

tivermos (v0, v1,…, vk−1, vk) como um ciclo, então teremos que, sem o vértice inicial, (v1,…,

vk−1, vk) será um caminho.

Ciclo de Euler – ciclo em que se percorre uma e somente uma vez cada aresta de um grafo.

Comprimento de um caminho – é igual a n, o número de arestas do caminho em questão.

34

Comprimento do caminho mínimo - considere um grafo conexo G, a distância entre os vértices U

e V em G, denotada por d(U, V) é o comprimento do caminho mínimo entre U e V.

Dendograma - um tipo de representação gráfica na forma de uma árvore (do grego”dendron” ou

“árvore”). O dendograma dispõe os dados em subcategorias que são divididas em outras até atingir

o nível de detalhe desejado (de modo semelhante aos ramos arbóreos). Ele permite observar as

relações de agrupamento entre os dados e também entre os grupos deles. Mas não pode ser utilizado

para deduzir algo sobre as relações de semelhança ou proximidade entre categorias. Quando se

verificam as sucessões de subcategorias, é possível perceber os critérios de agrupamento

(clustering) e a distância entre os dados conforme as relações estabelecidas. O dendrograma

também é útil para ilustrar os agrupamentos que surgem após a aplicação de um algoritmo de

agrupamento hierárquico.

Diâmetro de um grafo conexo – é a distância máxima entre qualquer par de seus vértices.

Grafo - Uma estrutura matemática em que pontos (vértices ou nós) são usados para representar

coisas com interesse e no qual as linhas (arestas) são usadas para ligar os vértices estabelecendo que

entre os vértices ligados há alguma relação.

Grafo acíclico – como o próprio nome diz: um grafo sem ciclos.

Grafo completo (ou cheio) - Um grafo completo com v vértices, que se denota por Kv, é um grafo

simples no qual todo par de vértices é conectado por uma aresta. Isso significa que um grafo

completo pode ser definido como sendo um grafo simples que contém o número máximo de arestas.

O número de arestas em um grafo completo é dado por n(n-1)/2.

Grafo conexo – aquele no qual é possível alcançar, por meio das arestas, qualquer vértice partindo

de outro vértice qualquer. Em um grafo conexo sempre há um caminho entre um qualquer par de

seus vértices.

Grafos isomorfos - Sejam dois grafos G e H não direcionados, não-rotulados e não ponderados

Haverá um isomorfismo dos grafos G e H se houver uma bijeção entre os conjuntos de vértices de

G e H.

f: V(G) G(H)

Assim, dois vértices quaisquer u e v pertencentes a G são adjacentes em G se e somente se ƒ(u) e

ƒ(v) forem adjacentes em H. Portanto, existirá a chamada "bijeção com preservação de arestas",

com a bijeção preservando a estrutura dos grafos. A concepção de isomorfismo de grafos pode ser

aplicada aos outros tipos de grafos, desde que adicionemos os requisitos necessários no sentido de

preservar os elementos adicionais que estão relacionados à estrutura, tais como os pesos e as

direções das arestas que os compõem. Todavia, vale mencionar o caso em que dois grafos rotulados

são ditos isomórficos: eles só o serão se os grafos subjacentes correspondentes não rotulados forem

também isomórficos.

Grafo n-partido - Um grafo G será considerado um grafo n-partido quando ele possuir n conjuntos

independentes. Portanto, um grafo G bipartido é um grafo com 2 conjuntos independentes (sendo 2-

partido). Um grafo G = (V, A) é chamado n-partido se os seguintes critérios forem obedecidos: (i)

for possível particionar o conjunto de vértices em n conjuntos não vazios V1, V2, ...Vk, de forma

que eles possam ser disjuntos dois a dois e que a união dos elementos destes conjuntos iguale o

conjunto original de vértice; (ii) cada aresta a ∈ A, tenha extremidades em conjuntos distintos; (iii)

n deve ser o menor inteiro capaz de assegurar os critérios anteriores. Do contrário, qualquer grafo

com n vértices seria um grafo n partido.

35

Grafo orientado – grafo no qual as arestas são direcionadas. Um grafo orientado G, ou um dígrafo

consiste em: i) um conjunto V = V(G) onde os elementos que o compõem são os vértices ou nós;

ii) um segundo conjunto E de pares ordenados (U, V), denominados arcos ou arestas orientadas.

Grafo partido - Um grafo G é n-partido se ele possuir k conjuntos independentes. Logo, um grafo

G bipartido é um grafo com 2 conjuntos independentes, portanto, ele é 2-partido.

Grafo ponderado (ou valorado) – grafo no qual suas arestas estão associadas a um número não

negativo chamado de peso. O comprimento de um caminho num grafo ponderado é definido como

a soma dos pesos das arestas deste caminho.

Grafo reflexivo – um pseudografo no qual todos os vértices possuem um laço associado a eles.

Grafo rotulado – grafo no qual dados estão associados às suas arestas e/ou vértices.

Grafo simples – Grafo que não contém laços ou arestas paralelas.

Grafo trivial – grafo com somente um vértice.

Grafo vazio – grafo que possui somente vértices (sem arestas).

Grau – também chamado de valência de um vértice. Consiste no número de arestas que incidem no

vértice em questão.

Graus de entrada e de saída - Suponha que G seja um grafo orientado. O grau de saída de um

vértice V é o número de arestas começando em V. Já o grau de entrada é o número de arestas que

terminam o em V. A soma dos graus de saída dos vértices de um grafo orientado G é igual a soma

dos graus de entrada dos vértices, que é igual ao número de arestas em G.

Hub – Um vértice em uma rede com uma série de conexões (ou arestas) cujo número ou o peso é

muito acima da média dos outros vértices da rede. A emergência de hubs decorre de uma

propriedade de redes livres de escala (free scale). Ainda que os hubs não possam ser vistos em redes

aleatórias, eles devem emergir de redes livres de escala. Tal emergência é fruto da distribuição de

leis de potência. Eles possuem um impacto significativo na topologia da rede e são encontrados em

redes reais como a internet, redes biológicas e as redes de neurônios.

Laço (ou loop) – uma aresta que liga um vértice a si mesmo.

Matriz de adjacências – Seja G um grafo simples de n vértices V1, V2... Vn. A matriz de

adjacência é uma matriz n x n, onde o valor de cada elemento ejk da matriz é determinado da

seguinte maneira: ejk = 1, se os vértices Vj e Vk são ligados por uma aresta; ejk = 0, em caso

contrário. Exemplo: considere a seguinte matriz de adjacência para um grafo direcionado.

V1 V2 V3 V4 V5 V6

V1 0 1 0 0 1 0

V2 1 0 1 1 1 0

V3 0 1 0 0 0 1

V4 0 1 0 0 1 1

V5 1 1 0 1 0 0

V6 0 0 1 0 0 0

36

Insere-se no software Wolfram Mathematica 10.0 a referida matriz com o auxílio do

comando “AdjacencyGraph”, tal como segue:

In[1]: AdjacencyGraph[{{0,1,0,0,1,0},{1,0,1,1,1,0},{0,1,0,0,0,0},{0,1,0,0,0,1},

{1,1,0,1,0,0},{0,0,1,0,0,0}}]

Obtém-se, finalmente, a figura 8, que mostra o resultado (output) do Wolfram Mathematica

com o grafo descrito pela matriz de adjacência:

Figura 12 - Exemplo de um grafo


As propriedades da matriz de adjacência são as seguintes:

Na diagonal principal da matriz, todos os valores são iguais a 0.

A quantidade de algarismos “1” presentes na linha ou coluna correspondente a um vértice é

igual ao grau deste vértice.

As permutações de colunas e das suas linhas correspondentes geram uma representação de

um grafo isomorfo.

Seja um hipotético grafo G desconexo que possui dois componentes g1 e g2. A matriz de

adjacência X(G) pode ser expressa como uma função das duas matrizes de X(g1) e X(g2):

X(g1) 0

0 X(g2)

37

Multigrafo – grafo não orientado que possui, no mínimo, duas arestas paralelas.

Multigrafo atravessável – aquele no qual há um caminho que inclua todos os vértices e que utilize

cada aresta somente uma vez. Isto é, ele pode ser desenhado sem quebra nas curvas e sem repetição

nas arestas. Esse caminho deve necessariamente ser uma trilha, uma vez que nenhuma aresta é

utilizada por duas vezes. Esta trilha é denominada trilha atravessável.

Pseudografo – grafo que apresenta, no mínimo, um laço.

Semicaminho – essencialmente, é o mesmo que um caminho. A diferença é que a aresta ei pode

iniciar em Vi-1 ou Vi e terminar no outro vértice. De modo similar são conceituadas as semitrilhas e

os caminhos semi-simples.

Rede de pequeno mundo (small world) – um tipo de grafo em que a maior parte dos vértices não

são vizinhos uns dos outros. Contudo, os vizinhos de qualquer vértice têm alta probabilidade de

serem vizinhos uns dos outros, podendo a maior parte dos vértices ser alcançada a partir de outro

por uma trajetória que percorre poucos pontos ou vértices. Nas redes de pequeno mundo, a distância

típica L entre dois vértices escolhidos aleatoriamente (isto é, o número de vértices a serem

percorridos) cresce de forma proporcional ao logaritmo do número de nós na rede. Portanto:

L log N

Note-se que o coeficiente de agrupamento não é pequeno. Assim, tomando como exemplo uma rede

social, existem estranhos que se conectam por intermédio de um grupo pequeno de conhecidos.

Rede livre de escala (free scale) - redes complexas cujo grau de distribuição segue uma lei de

potência. Neste tipo de rede, a maior parte dos vértices, em que a maioria dos nodos (vértices) tem

poucas ligações, contrastando com a existência de alguns vértices que apresentam um alto número

de conexões. Isto é, um vértice com grau elevado tende a conectar-se com outro vértice de grau

elevado. Assim, pode-se afirmar que a probabilidade de um vértice conectar-se com outro é

diretamente proporcional ao seu grau. Portanto, as redes livres de escala são dominadas em geral

por um pequeno número de vértices que se denominam hubs e geralmente resistem melhor a falhas

eventuais, porém apresentam vulnerabilidade à choques ou ataques coordenados. Nas redes sem

escala a probabilidade de um vértice apresentar k conexões decai quando k aumenta, de acordo com

a lei de potência.

P(k) k-

Onde k > 0 e > 0, com denotando o expoente de livre escala, que condiciona a probabilidade

P(k) de existência na rede de vértices com grau k.

Trilha – caminho no qual todas as arestas são distintas.

Vértice ou nó - é o ponto de um grafo que representa a extremidade de uma ou mais arestas.

Documents

Análise de uma Rede Complexa: Um Ensaio Sobre a ......1 Análise de uma Rede Complexa: Um Ensaio Sobre a Transmissão de Volatilidade Entre Commodities no Curto Prazo Marcelo de Oliveira