34
ANÁLISE DESCRITIVA FORMATAÇÃO & DESIGN Cléber da Costa Figueiredo [email protected] Thiago Rodrigo Alves Carneiro [email protected] Texto da aula Profª Carmen Diva Saldiva de André Prof. Gilberto Alvarenga Paula

Aula - Estatística Descritiva

  • Upload
    jpmcf

  • View
    27

  • Download
    1

Embed Size (px)

DESCRIPTION

Slides de aula sobre Estatística Descritiva

Citation preview

Page 1: Aula - Estatística Descritiva

ANÁLISE DESCRITIVA

FORMATAÇÃO & DESIGN

Cléber da Costa Figueiredo

[email protected]

Thiago Rodrigo Alves Carneiro

[email protected]

Texto da aula

Profª Carmen Diva Saldiva de André

Prof. Gilberto Alvarenga Paula

Page 2: Aula - Estatística Descritiva

Classificação das variáveis

Variável Qualquer característica associada a uma população

Classificação Classificação

Qualitativa QuantitativaQualitativa Quantitativa

nominal contínua nominal contínua

ordinal discreta ordinal discreta

Page 3: Aula - Estatística Descritiva

Exemplo

Arquivo Pulse do Minitab

Refere-se a um experimento feito por alunos.

Cada aluno registrou sua altura, peso, sexo,

hábito de fumar, nível de atividade física

usual e pulsação em repouso.

Então todos eles jogaram moedas e aqueles

que tiraram cara fizeram corrida estacionária

por um minuto.

Depois disso todos os alunos mediram

novamente sua pulsação.

Page 4: Aula - Estatística Descritiva

Informações do arquivo Pulse

Information of the worksheet Column Count Name

C1 92 Pulse1

C2 92 Pulse2

C3 92 Ran (1:correu, 2:não correu)

C4 92 Smokes (1:fumante, 2:não fumante)

C5 92 Sex (1:masculino, 2:feminino)

C6 92 Height

C7 92 Weight

C8 92 Activity (1:leve, 2:moderada, 3:forte)

(Pulsação antes de correr)

(Pulsação depois de correr)

MTB > INFO

Page 5: Aula - Estatística Descritiva

Pulse1 Pulse2 Ran Smokes Sex Height Weight Activity

64 88 1 2 1 66.00 140 2

58 70 1 2 1 72.00 145 2

62 76 1 1 1 73.50 160 3

66 78 1 1 1 73.00 190 1

64 80 1 2 1 69.00 155 2

74 84 1 2 1 73.00 165 1

84 84 1 2 1 72.00 150 3

68 72 1 2 1 74.00 190 2

62 75 1 2 1 72.00 195 2

......

Informações do arquivo Pulse

Page 6: Aula - Estatística Descritiva

Média

Mediana

Moda

Quartis

Máximo

Mínimo

Variáveis Quantitativas

Medidas de posição

Page 7: Aula - Estatística Descritiva

Amplitude

Variância

Desvio padrão

Intervalo interquartil

Coeficiente de Variação

Variáveis Quantitativas

Medidas de dispersão

Page 8: Aula - Estatística Descritiva

MTB > DESCRIBE C1 C2 C6 C7

Descriptive Statistics Variable N Mean Median Tr Mean StDev SEMean

Pulse1 92 72.87 71.00 72.61 11.01 1.15

Pulse2 92 80.00 76.00 78.85 17.09 1.78

Height 92 68.72 69.00 68.78 3.66 0.38

Weight 92 145.15 145.00 144.52 23.74 2.48

Variáveis quantitativas no arquivo

Pulse

Page 9: Aula - Estatística Descritiva

MTB > DESCRIBE C1 C2 C6 C7

Descriptive Statistics Variable Min Max Q1 Q3

Pulse1 48.00 100.00 64.00 80.00

Pulse2 50.00 140.00 68.00 87.00

Height 61.00 75.00 66.00 72.00

Weight 95.00 215.00 125.00 156.50

Variáveis quantitativas no arquivo

Pulse

Page 10: Aula - Estatística Descritiva

MTB > DESCRIBE C1;

SUBC > BY C5.

Descriptive Statistics Variable Sex N Mean Median Tr Mean StDev SEMean

Pulse1 1 57 70.42 70.00 70.27 9.95 1.32

2 35 76.86 78.00 76.65 11.62 1.96

Descrever a pulsação em repouso

segundo o sexo

Page 11: Aula - Estatística Descritiva

MTB > DESCRIBE C1;

SUBC > BY C5.

Descriptive Statistics Variable Sex Min Max Q1 Q3

Pulse1 1 48.00 92.00 63.00 75.00 2 58.00 100.00 66.00 86.00

Calcular o intervalo-interquartil para cada sexo

Descrever a pulsação em repouso

segundo o sexo

Page 12: Aula - Estatística Descritiva

Variáveis Qualitativas

Para dados qualitativos podemos

construir tabelas que os quantificam

por categoria de classificação

Page 13: Aula - Estatística Descritiva

Variáveis qualitativas no arquivo Pulse

Ran

Smokes

Sex

Activity

Page 14: Aula - Estatística Descritiva

MTB > TALLY C3 C4 C5 C8

Summary Statistics for Discrete Variables Ran Count Smokes Count Sex Count Activity Count

1 35 1 28 1 57 0 1

2 57 2 64 2 35 1 9

N= 92 N= 92 N= 92 2 61

3 21

N= 92

Variáveis qualitativas no arquivo Pulse

Page 15: Aula - Estatística Descritiva

Rows: Sex Columns: Smokes

1 2 All

1 20 37 57

35.09 64.91 100.00

2 8 27 35

22.86 77.14 100.00

All 28 64 92 30.43 69.57 100.00

MTB > Table 'Sex' 'Smokes';

SUBC > Counts;

SUBC > RowPercents.

Há indícios de associação entre sexo e

hábito de fumar?

Page 16: Aula - Estatística Descritiva

Dentre as mulheres, qual a

porcentagem das que correram?

Rows: Ran Columns: Sex

1 2 All

1 24 11 35

42.10 31.43 38.04

2 33 24 57

57.90 68.57 61.96

All 57 35 92

100.00 100.00 100.00

MTB > Table 'Ran' 'Sex';

SUBC> Counts;

SUBC> ColPercents.

Page 17: Aula - Estatística Descritiva

Gráficos para variáveis quantitativas

Page 18: Aula - Estatística Descritiva

Histograma

O histograma para uma variável

contínua é obtido agrupando-se os

valores dessa variável em classes.

Page 19: Aula - Estatística Descritiva

Características do Histograma

- Bases iguais

Construir um retângulo para cada classe,

com base igual ao tamanho da classe e

altura proporcional à frequência da classe.

Exemplo 1

Faixa Etária Frequência Proporção

20 30 10 0,2530 40 20 0,5040 50 10 0,25

40

Page 20: Aula - Estatística Descritiva

Histograma de frequência (proporção)

f

0,6 -

0,5 -

0,4 -

0,3 -

0,2 -

0,1 -

0,0 -

20 30 40 50 idade

Page 21: Aula - Estatística Descritiva

Histograma de densidade

h

0,06 -

0,05 -

0,04 -

0,03 -

0,02 -

0,01 -

0,00 - 20 30 40 50 idade

Área (frequência) = base x altura (densidade)

f = 10 x h

h = (f / 10)

Page 22: Aula - Estatística Descritiva

Bases diferentes

Exemplo 1 modificado

Construir um retângulo para cada classe,

com base igual ao tamanho da classe e

área do retângulo igual à frequência da

classe. A altura será dada por:

h = f/base f: frequência relativa

Faixa Etária Frequência Proporção

20 30 10 0,25030 35 15 0,37535 50 15 0,375

h

0,025 0,075 0,025

Page 23: Aula - Estatística Descritiva

Histograma de frequência

f

0,6 -

0,5 -

0,4 -

0,3 -

0,2 -

0,1 -

0,0 - 20 30 35 50 idade

Faz sentido?

Page 24: Aula - Estatística Descritiva

Histograma de densidade

h

0,07 -

0,06 -

0,05 -

0,04 -

0,03 -

0,02 -

0,01 -

0,00 - 20 30 35 50 idade

Page 25: Aula - Estatística Descritiva

74,573,071,570,068,567,065,564,062,561,0

20

10

0

Height

Fre

qu

en

cy

Distribuição de frequência

para altura (arquivo PULSE)

Classe de altura f fr

60,25-61,75

61,75-63,25

63,25-64,75

64,75-66,25

66,25-67,75

67,75-69,25

69,25-70,75

70,75-72,25

72,25-73,75

73,75-75,25

Total

1

10

2

13

7

20

7

15

9

8

92

0,011

0,109

0,022

0,141

0,076

0,217

0,076

0,163

0,098

0,087

1

MTB > HIST C6

Arquivo PULSE – Histograma da altura

(Height)

Page 26: Aula - Estatística Descritiva

Arquivo Pulse – Diagrama de pontos

(Dotplot) da pulsação em repouso

MTB > DOTPLOT C1

. .

. : . :

: : : :

: . : : : . . . : . : : : . . .

. : : : : : : : : : : . . : . : . : : : : : : : : : : . . : . :

. : : :.: : : : : : : : : : : : .. : : : . : . . : : :.: : : : : : : : : : : : .. : : : . : .

---+---------+---------+---------+---------+---------+- ---+---------+---------+---------+---------+---------+-

50 60 50 60 70 80 90 100 70 80 90 100

Pulse1 Pulse1

Page 27: Aula - Estatística Descritiva

Arquivo Pulse – Dotplot da pulsação

em repouso segundo Sexo

MTB > DotPlot 'Pulse1';

SUBC> Same; SUBC> By 'Sex'.

::

SexSex 1 : 1 : : : . : : .

. : . : . . . : : : :. : : : : . . . .

. : : : : : : : : : : : . . . : . : : . : : : : : : : : : : : . . . : . : :

--+---------+---------+---------+---------+---------+- --+---------+---------+---------+---------+---------+-

SexSex 2 . . 2 . . ::

. . . . : . : : : : : : : : ..: . . : . . : . : : : : : : : : ..: . . : . .

--+---------+---------+---------+---------+---------+- --+---------+---------+---------+---------+---------+-

50 60 70 80 90 100 50 60 70 80 90 100

Pulse1 Pulse1

Page 28: Aula - Estatística Descritiva

Diagrama de caixa (Boxplot)

Representa os dados através de um

retângulo construído com os quartis e

fornece informações sobre valores

extremos

Page 29: Aula - Estatística Descritiva

_Q3

_Q1

_md

linha

auxiliar

_Q3

_Q1

_md

_Q1-1,5d

_Q3+1,5d

* *

*

* *

*

_Q3

_Q1

_md

_Q1-1,5d

_Q3+1,5d

altura _Q3

_Q1

d

Q1 = 1º quartil md = mediana Q3 = 3º quartil d = diferença interquartil

Construção do Boxplot

Page 30: Aula - Estatística Descritiva

Arquivo Pulse – Boxplot da pulsação

em repouso

MTB > BOXPLOT C1

Page 31: Aula - Estatística Descritiva

Arquivo Pulse – Boxplot da pulsação

em repouso

MTB > BOXPLOT C1*C5

Page 32: Aula - Estatística Descritiva

Arquivo Cholest – Boxplot do nível de

colesterol segundo o número de dias

após o enfarto

Page 33: Aula - Estatística Descritiva

Diagrama de dispersão

Avalia o comportamento conjunto de

duas variáveis quantitativas

Page 34: Aula - Estatística Descritiva

MTB > PLOT C6*C7

Arquivo Pulse – Relação entre o peso

a altura dos alunos