3
Coeficiente de Correlação Ró de Spearman ρ O coeficiente ρ de Spearman mede a intensidade da relação entre variáveis ordinais. Usa, em vez do valor observado, apenas a ordem das observações. Deste modo, este coeficiente não é sensível a assimetrias na distribuição, nem à presença de outliers, não exigindo portanto que os dados provenham de duas populações normais. Aplica-se igualmente em variáveis intervalares/rácio como alternativa ao R de Pearson, quando neste último se viola a normalidade. Nos caso em que os dados não formam uma nuvem “bem comportada”, com alguns pontos muito afastados dos restantes, ou em que parece existir uma relação crescente ou decrescente em formato de curva, o coeficiente ρ de Spearman é mais apropriado. Uma fórmula fácil para calcular o coeficiente ρ de Spearman é dada por: , 6 1 3 1 2 n n d n i i = = ρ em que n é o número de pares (x i , y i ) e d i =(postos de x i dentre os valores de x)- (postos de y i dentre os valores de y). Se os postos de x são exactamente iguais aos pontos de y, então todos os d i serão zero e ρ será 1. O coeficiente ρ de Spearman varia entre -1 e 1. Quanto mais próximo estiver destes extremos, maior será a associação entre as variáveis. O sinal negativo da correlação significa que as variáveis variam em sentido contrário, isto é, as categorias mais elevadas de uma variável estão associadas a categorias mais baixas da outra variável. Exemplo: Os dados abaixo foram recolhidos em 13 nascentes de rios e em cada nascente foi contado o número de juvenis de uma certa espécie de mosquito e medida a dureza da água do rio.

Coeficiente%20de%20 correla%c3%a7%c3%a3o%20r%c3%b3%20de%20spearman

Embed Size (px)

Citation preview

Page 1: Coeficiente%20de%20 correla%c3%a7%c3%a3o%20r%c3%b3%20de%20spearman

Coeficiente de Correlação Ró de Spearman ― ρ

O coeficiente ρ de Spearman mede a intensidade da relação entre variáveis ordinais. Usa,

em vez do valor observado, apenas a ordem das observações.

Deste modo, este coeficiente não é sensível a assimetrias na distribuição, nem à presença de

outliers, não exigindo portanto que os dados provenham de duas populações normais.

Aplica-se igualmente em variáveis intervalares/rácio como alternativa ao R de Pearson,

quando neste último se viola a normalidade. Nos caso em que os dados não formam uma

nuvem “bem comportada”, com alguns pontos muito afastados dos restantes, ou em que

parece existir uma relação crescente ou decrescente em formato de curva, o coeficiente ρ de

Spearman é mais apropriado.

Uma fórmula fácil para calcular o coeficiente ρ de Spearman é dada por:

,6

1 31

2

nn

dn

ii

−−=∑=ρ

em que n é o número de pares (xi, yi) e

di=(postos de xi dentre os valores de x)- (postos de yi dentre os valores de y).

Se os postos de x são exactamente iguais aos pontos de y, então todos os di serão zero e ρ

será 1.

O coeficiente ρ de Spearman varia entre -1 e 1. Quanto mais próximo estiver destes

extremos, maior será a associação entre as variáveis. O sinal negativo da correlação significa

que as variáveis variam em sentido contrário, isto é, as categorias mais elevadas de uma

variável estão associadas a categorias mais baixas da outra variável.

Exemplo:

Os dados abaixo foram recolhidos em 13 nascentes de rios e em cada nascente foi contado

o número de juvenis de uma certa espécie de mosquito e medida a dureza da água do rio.

Page 2: Coeficiente%20de%20 correla%c3%a7%c3%a3o%20r%c3%b3%20de%20spearman

Dureza da água 17 20 22 28 42 55 75 80 90 145 145 170

Nº de juvenis 42 40 30 7 12 10 7 3 7 5 2 4

Será que as variáveis estão correlacionadas?

Diagrama de dispersão

Diagrama de Dispersão

0

10

20

30

40

50

0 50 100 150 200

Dureza da água

Nº d

e ju

veni

s

O gráfico indica uma relação negativa, mas uma linha curva descreveria melhor a relação

do que uma linha recta. O coeficiente ρ de Spearman é mais apropriado para medir a

intensidade da associação entre as variáveis.

Cálculo do coeficiente ρ de Spearman

Dureza da água Posto Nº de juvenis Posto di2

17 1 2 1 (1-13)2=144 20 2 3 2 (2-12)2=100 22 3 4 3 (3-11)2=64 28 4 5 4 (4-5)2=1 42 5 7 5 (5-9)2=16 55 6 7 6 (6-10)2=16 55 7 7 7 (7-8)2=1 75 8 8 8 (8-6)2=1 80 9 12 9 (9-2)2=49 90 10 10 10 (10-7)2=9 145 11 30 11 (11-4)2=49 145 12 40 12 (12-1)2=121 170 13 42 13 (13-3)2=100

Total 671

Page 3: Coeficiente%20de%20 correla%c3%a7%c3%a3o%20r%c3%b3%20de%20spearman

Tem-se que

,84.084.111313

67116

1 331

2

−=−=−

−=−

−=∑=

nn

dn

ii

ρ

ou seja, existe uma associação forte e negativa entre as variáveis.

Alguns exercícios

1. As notas obtidas por 10 estudantes a Análise Matemática e o seu QI (quociente de

inteligência) são apresentadas no quadro seguinte.

Notas 8 14 18 10 6,5 9 14 5,2 10 13

QI 70 190 304 100 42 80 169 27 105 159

Utilize o coeficiente ρ de Spearman para verificar se as variáveis estão associadas e qual o seu

grau de associação.

2. Registaram-se os valores de duas variáveis x e y. Os valores encontram-se registados na

tabela abaixo.

x 32 40 33 24 39 32 37 32 33 27 26 29 y 939 1505 1009 516 1426 939 1279 944 1004 659 611 766

Utilize o coeficiente ρ de Spearman para verificar se as variáveis estão associadas e qual o seu

grau de associação.