18
Estatística e Probabilidade Estatística e Probabilidade Medidas de tendência central e medidas de dispersão. Média, mediana e moda. Propriedades da curva normal Exercícios.

Estatística e Probabilidade

Embed Size (px)

DESCRIPTION

Estatística e Probabilidade. Medidas de tendência central e medidas de dispersão. Média, mediana e moda. Propriedades da curva normal Exercícios. 1. MEDIDAS ESTATÍSTICAS Amostras com variáveis quantitativas devem ser estudadas de acordo com os seus descritores e distribuição. - PowerPoint PPT Presentation

Citation preview

Page 1: Estatística e Probabilidade

Estatística e ProbabilidadeEstatística e Probabilidade

Medidas de tendência central e medidas de dispersão.

Média, mediana e moda. Propriedades da curva normal Exercícios.

Page 2: Estatística e Probabilidade

•1. MEDIDAS ESTATÍSTICAS• • Amostras com variáveis quantitativas devem ser estudadas de acordo com os seus descritores e distribuição.

• Os descritores ou medidas são basicamente: • -Medidas de tendência central e medidas de dispersão.

• 1.1 Medidas de tendência central ou de posição.

• As medidas de tendência central mostram um valor ou dado em torno do qual os dados da amostra agrupam-se:

• São a média, a mediana e a moda.

Page 3: Estatística e Probabilidade

• 2. MEDIDAS DE TENDÊNCIA CENTRAL• Média aritmética simples ou simplesmente média• • A média aritmética simples de um conjunto de valores é o valor obtido somando-se todos eles e dividindo-se o total pelo número de valores. É denotada (leia-se “x barra”)

• Observar que com dados agrupados deve-se usar a multiplicação dos valores pela frequência ou seja: fx sobre o somatório das frequências.

• • E nos dados agrupados por intervalos de classe, xi e fi são os valores do ponto médio e da freqüência absoluta da classe i-ésima respectivamente.

Page 4: Estatística e Probabilidade

• Média aritmética simples ou simplesmente média• •Popriedade dos desvios:• A soma dos desvios de cada valor com relação à média = zero.• Para dados agrupados em frequências simples:•∑fd = ∑f (x- ) = 0•

Page 5: Estatística e Probabilidade

• Mediana•

• A mediana é um valor central da série, divide a mesma em dois subconjuntos iguais.

• Deve-se ordenar a série em valores crescentes ou decrescentes.

• Para séries curtas, o que deve ser observado é a mediana como média dos valores centrais se o n for par.

• O cálculo para séries longas é:• mediana = (n+1) / 2

• Com dados grupados, a mediana corresponde à Fr = 0,5.•

Page 6: Estatística e Probabilidade

• Moda

• Moda ou moda de X, Mo, é o elemento mais freqüente no conjunto.• • A moda é facilmente indicada na coluna de frequências simples.

• Para dados em intervalos de classe, há um intervalo modal, e a moda é o ponto médio deste intervalo.

• No histograma, a moda são os picos da distribuição.• Distribuições bimodais ou polimodais (vários picos) indicam forte assimetria, afastamento da normalidade ou mistura de amostras.

• Calcular a média, mediana e indicar a moda dos dados referentes às medidas das conchas, escolhendo uma das variáveis, CAC, LAC ou PC.

Page 7: Estatística e Probabilidade

•3. MEDIDAS de dispersão.

• As medidas de dispersão revelam a variabilidade dos dados.

• Exceto a amplitude, mostram o grau de afastamento dos valores observados em relação aos valores representativos centrais.

• - Amplitude total: diferença entre os valores extremos da série.

• Variância e desvio padrão:

• Variância é a quantidade de desvios de cada valor em relação à média. Tem os símbolos δ2 para dados populacionais ou s2 para dados amostrais.

• O desvio padrão, δ ou s, é a raiz quadrada da variância. É uma medida de dispersão apresentada na mesma unidade de mensuração de x, lembrando que na variância os valores são considerados como o seu quadrado.

Page 8: Estatística e Probabilidade

• Fórmulas para a variância e desvio padrão:•δ2 = ∑ (x-µ) 2

• n

• µ = média da população.

• Ver fórmulas alternativas para amostras no livro, como:• s2 = ∑ (x- ) 2

• n-1•

• O desvio padrão, δ ou s, é a raiz quadrada da variância:

n-1

-1

Page 9: Estatística e Probabilidade

• Coeficiente de variação:• Trata-se de uma medida de dispersão, útil para a comparação da variabilidade em séries diferentes, que apresentam variáveis distintas. É dado por Cv ou pelo Cv%

• • Idealmente uma amostra deve ter uma Cv baixo, refletindo pouca variação dos dados com relação à média. Utiliza-se uma aproximação do Cv a 20% ou menos da média para observar-se esta característica. Em amostragens aleatórias esta relação pode ser usada para uma aproximação do tamanho da amostra, desde que esta tenha distribuição normal.

• Calcular a variância, desvio padrão e coeficiente de variação referentes às medidas das conchas, escolhendo uma das variáveis, CAC, LAC ou PC.

s

Page 10: Estatística e Probabilidade

•4. AS DISTRIBUIÇÕES NORMAIS, A CURVA NORMAL OU CURVA DE GAUSS.• • As populações descritas com variáveis quantitativas tem uma tendência à distribuição normal, o que significa que os seus histogramas apresentarão um desenho em forma de sino. Os valores extremos coincidem com as abas do sino. Estes diagramas em forma de sino foram descobertos e estudados por Gauss, daí o termo curva de Gauss (matemático alemão 1977-1855).

• As amostras destas populações terão também distribuição normal.

Page 11: Estatística e Probabilidade

•4.1 PROPRIEDADES DA CURVA NORMAL. •

• A curva é simétrica.

• A média coincide com a ordenada máxima; a média coincide com a mediana e moda (simetria); Curvas assimétricas ou achatadas não mantém as mesmas derivações da normal.

• Tem dois pontos de inflexão que correspondem a 1 desvio padrão (δ) acima e abaixo da média. Este limite corresponde a 68% dos valores de x, ou da população em estudo.

2,5%

Page 12: Estatística e Probabilidade

•4.1 PROPRIEDADES DA CURVA NORMAL. •

• Aproximadamente 95% da população situa-se entre µ-2 δ e µ+2 δ; Cerca de 99,7% dos valores se forem 3δ.

2,5%

Page 13: Estatística e Probabilidade

•4.2 A CURVA NORMAL REDUZIDA•

• A curva normal reduzida é uma distribuição teórica de valores de X padronizados.

• A abcissa é chamada de linha ζ ou Z. Os valores são então de uma variável hipotética chamada z.

• Nesta distribuição µ = 0 e δ = 1.

• A área entre z = -1 e z = +1 é 0,6826. As áreas entre µ e qualquer valor de z são informadas em tabelas como a A1.

Page 14: Estatística e Probabilidade

•4.2 A CURVA NORMAL REDUZIDA•

• • A área que corresponde a valores de z entre -1,96 e + 1,96, é de 0,4750 + 0,4750 = 0,95.

• Entre -2.58 e +2.58 é = 0,9902

• Realizar os exercícios referentes aos exemplos do livro 1, 2, 3.

Page 15: Estatística e Probabilidade

•4.3 Procedimentos transformadores para distribuições sem normalidade, assimétricas ou achatadas.

• As transformações mais usadas são para assimetrias à direita;

• x´ = log x• x´ = √x• x´ = 1/x• • Para assimetrias à esquerda:

• x´ = x2

Page 16: Estatística e Probabilidade

•4.3 Procedimentos transformadores para distribuições sem normalidade, assimétricas ou achatadas.

• O programa Biostat fornece testes de normalidade com base nos parâmetros de simetria e curtose.

• Distribuições simétricas têm g1 próximo de 0, sendo menor do que 0 inclinada para esquerda e maior do que 0 inclinada para a direita.

• A curva normal é mesocúrtica, com um g2 próximo de 3. Um g2 maior do que 3, indica um excesso de observações nas imediações da média e caudas, nas curvas assimétricas leptocúrticas (skewed); um g2 menor do que 3 indica um excesso de observações no ombros da curva, dita platicúrtica.

• Observar alguns exemplos.

Page 17: Estatística e Probabilidade

•5. Aplicações da curva normal: áreas e proporções da curva. • • Transforma-se x em z da seguinte forma:

• z = x-µ• δ

• Exemplo 4.

• Na parte de exercícios, preparar:

• Exercícios 8, 9, 10, 11.

Page 18: Estatística e Probabilidade

•5. Aplicações da curva normal: áreas e proporções da curva. • • As regiões de não significância dos valores com relação à média, correspondem geralmente a valores de S 0-1,96 Z nos dois lados da curva. Valores superiores a 1,96 correspondem a 2,5% de cada lado e compõe as áreas de significância das diferenças, ou chamada área α (alfa). Utiliza-se geralmente dois níveis de alfa: 0,05 (5%) - significante - e mais raramente 0,01 (1%) – muito significante.

2,5