Upload
lucian-burnett
View
32
Download
2
Embed Size (px)
DESCRIPTION
Estatística e Probabilidade. Medidas de tendência central e medidas de dispersão. Média, mediana e moda. Propriedades da curva normal Exercícios. 1. MEDIDAS ESTATÍSTICAS Amostras com variáveis quantitativas devem ser estudadas de acordo com os seus descritores e distribuição. - PowerPoint PPT Presentation
Citation preview
Estatística e ProbabilidadeEstatística e Probabilidade
Medidas de tendência central e medidas de dispersão.
Média, mediana e moda. Propriedades da curva normal Exercícios.
•1. MEDIDAS ESTATÍSTICAS• • Amostras com variáveis quantitativas devem ser estudadas de acordo com os seus descritores e distribuição.
• Os descritores ou medidas são basicamente: • -Medidas de tendência central e medidas de dispersão.
• 1.1 Medidas de tendência central ou de posição.
• As medidas de tendência central mostram um valor ou dado em torno do qual os dados da amostra agrupam-se:
• São a média, a mediana e a moda.
•
•
• 2. MEDIDAS DE TENDÊNCIA CENTRAL• Média aritmética simples ou simplesmente média• • A média aritmética simples de um conjunto de valores é o valor obtido somando-se todos eles e dividindo-se o total pelo número de valores. É denotada (leia-se “x barra”)
•
• Observar que com dados agrupados deve-se usar a multiplicação dos valores pela frequência ou seja: fx sobre o somatório das frequências.
• • E nos dados agrupados por intervalos de classe, xi e fi são os valores do ponto médio e da freqüência absoluta da classe i-ésima respectivamente.
• Média aritmética simples ou simplesmente média• •Popriedade dos desvios:• A soma dos desvios de cada valor com relação à média = zero.• Para dados agrupados em frequências simples:•∑fd = ∑f (x- ) = 0•
• Mediana•
• A mediana é um valor central da série, divide a mesma em dois subconjuntos iguais.
• Deve-se ordenar a série em valores crescentes ou decrescentes.
• Para séries curtas, o que deve ser observado é a mediana como média dos valores centrais se o n for par.
• O cálculo para séries longas é:• mediana = (n+1) / 2
• Com dados grupados, a mediana corresponde à Fr = 0,5.•
• Moda
• Moda ou moda de X, Mo, é o elemento mais freqüente no conjunto.• • A moda é facilmente indicada na coluna de frequências simples.
• Para dados em intervalos de classe, há um intervalo modal, e a moda é o ponto médio deste intervalo.
• No histograma, a moda são os picos da distribuição.• Distribuições bimodais ou polimodais (vários picos) indicam forte assimetria, afastamento da normalidade ou mistura de amostras.
• Calcular a média, mediana e indicar a moda dos dados referentes às medidas das conchas, escolhendo uma das variáveis, CAC, LAC ou PC.
•3. MEDIDAS de dispersão.
• As medidas de dispersão revelam a variabilidade dos dados.
• Exceto a amplitude, mostram o grau de afastamento dos valores observados em relação aos valores representativos centrais.
• - Amplitude total: diferença entre os valores extremos da série.
• Variância e desvio padrão:
• Variância é a quantidade de desvios de cada valor em relação à média. Tem os símbolos δ2 para dados populacionais ou s2 para dados amostrais.
• O desvio padrão, δ ou s, é a raiz quadrada da variância. É uma medida de dispersão apresentada na mesma unidade de mensuração de x, lembrando que na variância os valores são considerados como o seu quadrado.
• Fórmulas para a variância e desvio padrão:•δ2 = ∑ (x-µ) 2
• n
• µ = média da população.
• Ver fórmulas alternativas para amostras no livro, como:• s2 = ∑ (x- ) 2
• n-1•
• O desvio padrão, δ ou s, é a raiz quadrada da variância:
n-1
-1
• Coeficiente de variação:• Trata-se de uma medida de dispersão, útil para a comparação da variabilidade em séries diferentes, que apresentam variáveis distintas. É dado por Cv ou pelo Cv%
• • Idealmente uma amostra deve ter uma Cv baixo, refletindo pouca variação dos dados com relação à média. Utiliza-se uma aproximação do Cv a 20% ou menos da média para observar-se esta característica. Em amostragens aleatórias esta relação pode ser usada para uma aproximação do tamanho da amostra, desde que esta tenha distribuição normal.
• Calcular a variância, desvio padrão e coeficiente de variação referentes às medidas das conchas, escolhendo uma das variáveis, CAC, LAC ou PC.
s
•4. AS DISTRIBUIÇÕES NORMAIS, A CURVA NORMAL OU CURVA DE GAUSS.• • As populações descritas com variáveis quantitativas tem uma tendência à distribuição normal, o que significa que os seus histogramas apresentarão um desenho em forma de sino. Os valores extremos coincidem com as abas do sino. Estes diagramas em forma de sino foram descobertos e estudados por Gauss, daí o termo curva de Gauss (matemático alemão 1977-1855).
• As amostras destas populações terão também distribuição normal.
•
•4.1 PROPRIEDADES DA CURVA NORMAL. •
•
• A curva é simétrica.
• A média coincide com a ordenada máxima; a média coincide com a mediana e moda (simetria); Curvas assimétricas ou achatadas não mantém as mesmas derivações da normal.
• Tem dois pontos de inflexão que correspondem a 1 desvio padrão (δ) acima e abaixo da média. Este limite corresponde a 68% dos valores de x, ou da população em estudo.
2,5%
•4.1 PROPRIEDADES DA CURVA NORMAL. •
•
•
• Aproximadamente 95% da população situa-se entre µ-2 δ e µ+2 δ; Cerca de 99,7% dos valores se forem 3δ.
2,5%
•4.2 A CURVA NORMAL REDUZIDA•
• A curva normal reduzida é uma distribuição teórica de valores de X padronizados.
• A abcissa é chamada de linha ζ ou Z. Os valores são então de uma variável hipotética chamada z.
• Nesta distribuição µ = 0 e δ = 1.
• A área entre z = -1 e z = +1 é 0,6826. As áreas entre µ e qualquer valor de z são informadas em tabelas como a A1.
•4.2 A CURVA NORMAL REDUZIDA•
• • A área que corresponde a valores de z entre -1,96 e + 1,96, é de 0,4750 + 0,4750 = 0,95.
• Entre -2.58 e +2.58 é = 0,9902
• Realizar os exercícios referentes aos exemplos do livro 1, 2, 3.
•
•4.3 Procedimentos transformadores para distribuições sem normalidade, assimétricas ou achatadas.
• As transformações mais usadas são para assimetrias à direita;
• x´ = log x• x´ = √x• x´ = 1/x• • Para assimetrias à esquerda:
• x´ = x2
•
•4.3 Procedimentos transformadores para distribuições sem normalidade, assimétricas ou achatadas.
• O programa Biostat fornece testes de normalidade com base nos parâmetros de simetria e curtose.
• Distribuições simétricas têm g1 próximo de 0, sendo menor do que 0 inclinada para esquerda e maior do que 0 inclinada para a direita.
• A curva normal é mesocúrtica, com um g2 próximo de 3. Um g2 maior do que 3, indica um excesso de observações nas imediações da média e caudas, nas curvas assimétricas leptocúrticas (skewed); um g2 menor do que 3 indica um excesso de observações no ombros da curva, dita platicúrtica.
• Observar alguns exemplos.
•
•5. Aplicações da curva normal: áreas e proporções da curva. • • Transforma-se x em z da seguinte forma:
• z = x-µ• δ
• Exemplo 4.
• Na parte de exercícios, preparar:
• Exercícios 8, 9, 10, 11.
•
•5. Aplicações da curva normal: áreas e proporções da curva. • • As regiões de não significância dos valores com relação à média, correspondem geralmente a valores de S 0-1,96 Z nos dois lados da curva. Valores superiores a 1,96 correspondem a 2,5% de cada lado e compõe as áreas de significância das diferenças, ou chamada área α (alfa). Utiliza-se geralmente dois níveis de alfa: 0,05 (5%) - significante - e mais raramente 0,01 (1%) – muito significante.
2,5