17
UNIVERSIDADE FEDERAL DA PARAÍBA Departamento de Estatística Departamento de Estatística Tarciana Tarciana Liberal Liberal

Departamento de Estatística …tarciana/CPEI/Aula3.pdfa) Construa a tabela de distribuição de freqüência (aproxime para o inteiro mais próximo). b) Qual o percentual de dias

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

UNIVERSIDADE FEDERAL DA PARAÍBA

Departamento de EstatísticaDepartamento de Estatística

TarcianaTarciana LiberalLiberal

� Quando se estuda uma massa de dados é de freqüenteinteresse resumir as informações de variáveis.

� Costuma-se, freqüentemente, para uma melhorcompreensão dos mesmos, distribuí-los em classes ouintervalos determinando-se o número de indivíduosintervalos determinando-se o número de indivíduospertencentes a cada um dos intervalos.

� Desta forma, um arranjo tabular dos dados,juntamente com as freqüências correspondentes aosmesmos é denominado distribuição de freqüência outabela de freqüência.

1) Dados Brutos: Conjunto de dados que ainda não foramnumericamente organizados, obtidos após a crítica dosvalores.

2) Rol: É um arranjo dos dados brutos em ordem crescente.

3) Amplitude Total (AT): É a diferença entre o maior e omenor valor observado.menor valor observado.

4) Freqüência absoluta ou simples (fi): É o número deobservações que se encontra presente em uma classe ouintervalo especifico.

AT = XMÁX - XMÍN

Σ fi=n

5) Freqüência percentual (fi%): Representa o percentualde um certo valor na amostra.

6) Freqüência simples acumulada (Fi): É a soma dasfreqüências simples das classes ou dos valoresanteriores.

fi%=(fi /n)x100 Σ fi%=100

anteriores.

7) Freqüência percentual acumulada (Fi%): É a soma dasfreqüências relativas percentual das classes ou dosvalores anteriores.

Fi = f1 + f2 + ... + fi

Fi %= f1% + f2% + ... + fi%

� Utilizada em geral para dados de uma variávelqualitativa ou discreta.

� Considera-se os diferentes valores das� Considera-se os diferentes valores dasobservações ou categorias e o número de vezes(freqüência) que cada valor aparece nos dados.

Ex: Considere a idade dos alunos do 3º período do curso deEngenharia civil da UFPB.

Dados Brutos: 20 – 18 – 19 – 22 – 20 – 22 – 23 – 21 – 21 – 21 Rol: 18 – 19 – 20 – 20 – 21 – 21 – 21 – 22 – 22 – 23

IdadeIdade ff ff FF FFIdadeIdade ffii ffii%% FFii FFii%%

1818 11 1010 11 1010

1919 11 1010 22 2020

2020 22 2020 44 4040

2121 33 3030 77 7070

2222 22 2020 99 9090

2323 11 1010 1010 100100

TotalTotal 1010 100100

� De acordo com a Secretária de Turismo da Paraíba,os quatro estados com maior participação no númerode turistas que desembarcaram no aeroporto de JoãoPessoa em 2009 foram: São Paulo (SP), Rio de Janeiro(RJ), Bahia (BA) e Paraná (PR). Os dados de umaamostra de 30 turistas abordados no aeroporto sãoapresentados a seguir:apresentados a seguir:

Qual a classificação dessa variável? Organize os dados em uma tabela com fi, fi%.

SP BA BA SP RJ BA SP SP PR PR

RJ SP SP RJ PR RJ SP RJ SP BA

SP RJ PR SP BA SP PR BA SP SP

� Complete os dados que faltam na distribuição:

Xi ffii ffii%% FFii FFii%%

1111 4444

2222 8888

3333 303030303333 30303030

4444 27272727

5555 15151515 72727272

6666 83838383

7777 10101010 93939393

8888TOTAL 100100100100

� Determinou-se durante 30 dias os erros cometidos por um estagiário na digitação de documentos.

2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 4 4 4 4 4 5 5 5 6 6 7 7

a) Em quantos dias ele cometeu menos de 4 erros?b) Qual o percentual de dias com mais de 3 erros.c) O chefe decidiu manter o funcionário se ele

cometer mais de 3 erros em no máximo 30% dos dias. O funcionário será demitido?

� Os dados são agrupados em classes

� Considera-se a freqüência em cada classe (nºde observações pertencentes)

� São mais comuns tabelas com intervalos iguais

Para a construção de uma distribuição de freqüênciapor intervalo é necessário algumas definiçõesadicionais.

8) Número de classes (k): Representa o total de classes da variável.

9) Amplitude das classes (h): É a divisão entre a amplitude total e onúmero de classes. O valor só poderá ser arredondado paramais.

h=AT / k

10) Limites das Classes: São os números extremos das classes.Utilizaremos a seguinte representação:

Li |— Ls ( Compreende todos os valores de Li a Ls, excluindo Ls )

11) Ponto Médio (PM): É a média aritmética entre o limite superior,denotado por Ls, e o limite inferior, denotado por Li. O pontomédio será denotado por PM, onde PM = (Li+Ls)/2

h=AT / k

� Não existe uma fórmula exata para o cálculo donúmero de classes. Seja n o tamanho da amostra,temos duas alternativas

1- Para n ≤ 25, K=5 e para n > 25, temos que K ≈ raiz(n)

2- Fórmula de Sturges:

k = 1 + 3,3 × log10(n)

Dados Brutos: 20,5 Dados Brutos: 20,5 Dados Brutos: 20,5 Dados Brutos: 20,5 ---- 19,5 19,5 19,5 19,5 ---- 15,6 15,6 15,6 15,6 ---- 24,1 24,1 24,1 24,1 ---- 9,9 9,9 9,9 9,9 ---- 15,4 15,4 15,4 15,4 ---- 12,7 12,7 12,7 12,7 ---- 5,4 5,4 5,4 5,4 ---- 17,0 17,0 17,0 17,0 ---- 28,6 28,6 28,6 28,6 ---- 16,9 16,9 16,9 16,9 ---- 7,8 7,8 7,8 7,8 ----23,3 23,3 23,3 23,3 ---- 11,8 11,8 11,8 11,8 ---- 18,4 18,4 18,4 18,4 ---- 13,4 13,4 13,4 13,4 ---- 14,3 14,3 14,3 14,3 ---- 19,2 19,2 19,2 19,2 ---- 9,2 9,2 9,2 9,2 ---- 16,8 16,8 16,8 16,8 ---- 8,8 8,8 8,8 8,8 ----22,1 22,1 22,1 22,1 ---- 20,8 20,8 20,8 20,8 ---- 12,6 12,6 12,6 12,6 ---- 15,915,915,915,9

Rol: Rol: Rol: Rol: 5,4 5,4 5,4 5,4 ---- 7,8 7,8 7,8 7,8 –––– 8,8 8,8 8,8 8,8 –––– 9,2 9,2 9,2 9,2 ---- 9,4 9,4 9,4 9,4 –––– 9,9 9,9 9,9 9,9 –––– 11,8 11,8 11,8 11,8 –––– 12,6 12,6 12,6 12,6 –––– 12,7 12,7 12,7 12,7 –––– 13,4 13,4 13,4 13,4 –––– 14,3 14,3 14,3 14,3 –––– 15,415,415,415,4

15,6 15,6 15,6 15,6 –––– 15,9 15,9 15,9 15,9 –––– 16,8 16,8 16,8 16,8 –––– 16,9 16,9 16,9 16,9 –––– 17,0 17,0 17,0 17,0 –––– 18,4 18,4 18,4 18,4 –––– 19,2 19,2 19,2 19,2 –––– 19,5 19,5 19,5 19,5 –––– 20,5 20,5 20,5 20,5 –––– 20,8 20,8 20,8 20,8 –––– 22,1 22,1 22,1 22,1 ––––24,1 24,1 24,1 24,1 –––– 28,6 28,6 28,6 28,6

Passos:Passos:1. Ordenar as informações2. Variável aleatória Preço é de natureza contínua implicando numa

distribuição intervalar (Por classe).3. Calcular a amplitude total: AT = 28,6 – 5,4 = 23,2.4. Calcular o número de intervalos: k = raiz(25) = 5 .5. Calcular a amplitude do intervalo: h =AT/k = 23,2/5 = 4,64.

Tabela : Distribuição de Freqüência dos Preços do Produto ATabela : Distribuição de Freqüência dos Preços do Produto A

Preço (R$)Preço (R$) ffii ffii%% FFii FFii%%

||––

||––

||––||––

||––

||––

TotalTotal 2525 100100 -- --

� Os dados abaixo representam o valor da hora de trabalhode 25 profissionais de Engenharia de produção na cidadede João Pessoa.

20,5 9,5 15,3 24,1 19,9

15,4 12,7 7,4 15,3 26,2

14,9 7,8 23,3 11,8 18,4

Qual a classificação dessa variável? Organize os dados em uma tabela apropriada.

14,9 7,8 23,3 11,8 18,4

13,4 14,3 16,2 9,2 16,8

9,8 20,1 17,8 12,6 15,9

� Os dados abaixo referem-se aos gastos diários comreparos em máquinas na produção de uma indústria.

� 33,35,35,39,41,41,42,45,47,48,50,52,53,54,55,55,57,59,60,60,61,64,65,65,65,66,66,66,67,68,69,71,73,73,74,74,76,77,77,78,80,81,84,85,85,88,89,91,94,100

� a) Construa a tabela de distribuição de freqüência � a) Construa a tabela de distribuição de freqüência (aproxime para o inteiro mais próximo).

� b) Qual o percentual de dias que obtiveram gastos maiores ou iguais a 73 e inferiores a 93?

� c) O chefe do setor considera o processo satisfatório se o gasto diário não ultrapassou R$ 73,00 em mais de 40% dos dias. O que você pode concluir?

� d) Qual o ponto médio da primeira classe?

� A tabela de frequências abaixo refere-se às notas daturma 03 de Cálculo das probabilidades e estatística I.

NOTASNOTASNOTASNOTAS fifififi

0|---- 2 4

2|---- 4 8

4|---- 6 12

6|---- 8 8

8|---- 10 4

TOTAL 36

� Considerando nota mínima para aprovação igual a 6. Qual foi o percentual de aprovados?

� A professora considera o desempenho de uma turma satisfatório se pelo menos 60% das notas estiverem distribuídas entre 4 (incluso) e 8 (excluso). A turma teve um desempenho satisfatório? Justifique sua resposta.

TOTAL 36