Upload
lucas-antonio-risso
View
22
Download
3
Embed Size (px)
Citation preview
Distribuio de Freqncia
Representao do conjunto de dados
Distribuies de freqncia
Freqncia relativaFreqncia acumulada
Representao Grfica
Histogramas
Organizao dos dados
Os mtodos utilizados para organizar dados compreendem o arranjo desses dados em subconjuntos que apresentem caractersticas similares.
mesma idade (ou faixa etria), mesma finalidade, mesma escola, mesmo bairro, etc
Os dados agrupados podem ser resumidos em tabelas ou grficos e, a partir desses, podemos obter as estatsticas descritivas j definidas: mdia, mediana, desvio, etc.
Dados organizados em grupos ou categorias/classes so usualmente designados distribuio de freqncia.
Distribuio de frequncia
Uma distribuio de freqncia um mtodo de se agrupar dados em classes de modo a fornecer a quantidade (e/ou a percentagem) de dados em cada classe
Com isso, podemos resumir e visualizar um conjunto de dados sem precisar levar em conta os valores individuais.
Uma distribuio de freqncia (absoluta ou relativa) pode ser apresentada em tabelas ou grficos
Distribuio de frequncia
Uma distribuio de freqncia agrupa os
dados por classes de ocorrncia, resumindo
a anlise de conjunto de dados grandes.
Adotemos o conjunto de dados que represente a populaoOrdene em ordem crescente ou decrescente
Eventos AlturaAluno 1 1,60Aluno 2 1,69Aluno 3 1,72Aluno 4 1,73Aluno 5 1,73Aluno 6 1,74Aluno 7 1,75Aluno 8 1,75Aluno 9 1,75Aluno 10 1,75Aluno 11 1,75Aluno 12 1,76Aluno 13 1,78Aluno 14 1,80Aluno 15 1,82Aluno 16 1,82Aluno 17 1,84Aluno 18 1,88
Construindo uma distribuio de freqncia
Construindo uma distribuio de freqncia
Determine a Quantidade de classes (k)Regra de Sturges (Regra do Logaritmo)
k = 1 + 3,3log(n)
Regra da Potncia de 2 k = menor valor interiro tal que 2k
n
Regra da Raiz Quadrada
Bom senso !!! Decida a quantidade de classes que GARANTA observar
como os valores se distribuem.
nk =
Quantidade de dados (n)
Quantidade de Classes (k)
Quantidade de dados (n)
Quantidade de Classes (k)
Quantidade de dados (n)
Quantidade M N IM A de C lasses (k)
Quantidade M XIM A de C lasses (k)
1 1 1 e 2 1 at 50 5 102 2 3 e 4 2 51 a 100 8 16
3 a 5 3 5 a 8 3 101 a 200 10 20 6 a 11 4 9 a 16 4 201 a 300 12 2412 a 23 5 17 a 32 5 301 a 500 15 3024 a 46 6 33 a 64 6 mais de 500 20 4047 a 93 7 65 a 128 7
94 a 187 8 129 a 256 8188 a 376 9 257 a 512 9377 a 756 10 513 a 1024 10
Regra de Sturges (Logaritmo) Regra da Potncia de 2 Bom Senso
Construindo uma distribuio de freqncia
Construindo uma distribuio de freqncia
Calcule a amplitude das classes (h)Calcule a amplitude do conjunto de dados
L = xmx xmnCalcule a amplitude (largura) da classe
h = L / k Arredonde convenientemente
Calcule os Limites das Classes1a classe: xmn at xmn + h2a classe: xmn + h at xmn + 2 . h........................ka classe: xmn + (k-1) . h at xmn + k . h
Limite das classesUtilize a notao:
[x,y) intervalo de entre x (fechado) at y (aberto)Freqentemente temos que arredondar a amplitude das classes e, conseqentemente, arredondar tambm os limites das classes.Como sugesto, podemos tentar, se possvel, um ajuste simtrico nos limites das classes das pontas (i.e., primeira e ltima) nas quais, usualmente, a quantidade de dados menor.
Ponto mdio das classesxk = Linferior + ( Lsuperior Linferior ) / 2
Construindo uma distribuio de freqncia
Determinao da freqncia das classes
Consiste em agrupar os dados em cada classe e contar os totais
Traar o grfico
Dividir o eixo horizontal em tantas partes quanto for o nmero de classes. Sugesto: deixe espao entre o eixo vertical e a primeira classe.
Identifique a maior freqncia da classe na tabela e marque esse nmero (ou outro um pouco maior) na extremidade do eixo vertical; divida esse eixo em algumas partes e marque os valores correspondentes
Desenhe um retngulo, para cada classe, com largura igual largura da classe e com altura igual freqncia da classe
Construindo uma distribuio de freqncia
Do nosso exemplo:Ordenamos os dadosPor Sturges, temos:
n=18 ; k=5 (nmero de classes)
Amplitude de classes Amplitude do conjunto
de dados: 1,88- 1,60=0,28m
Amplitude de classes: 0,28/5=0,056
Arredondado h = 0,06m
Altura1,601,691,721,731,731,741,751,751,751,751,751,761,781,801,821,821,841,88
Exemplo
Construindo uma tabela de freqncia
Calcule os Limites de ClasseArredonde os Limites de Classe nos extremos
1,9-1,88=0,02Distribua o excesso:
1,60-0,01; 1,88+0,01Ajuste todas as classes
Altura1,601,691,721,731,731,741,751,751,751,751,751,761,781,801,821,821,841,88
Amplitude 0,06Limites
inferioresLimite
superior1,60 1,661,66 1,721,72 1,781,78 1,841,84 1,90
Aqui sobra 0,02m!
Freqncias absolutasDistribua os eventos ou ocorrncia por suas respectivas classes
Freqncias acumuladasSome as ocorrncias de dados cumulativamente s classes
Observao importante: muito til representar as frequncias em termos percentuais ao total de amostras
0,06
Dados Classe FrequnciaFrequncia Acumulada
1,60 1,59-1,65 1 11,69 1,65-1,71 1 21,72 1,71-1,77 10 121,73 1,77-1,83 4 161,73 1,83-1,89 2 181,74 Total 181,751,751,751,751,751,761,781,801,821,821,841,88
Amplitude
Construindo uma tabela de freqncia
Representao Grfica
HistogramaNa abscissas, distribua as classesNa ordenada da esquerda, as freqncias absolutasConstrua um grfico de barras para as freqnciasConstrua um grfico de linha para a freqncia acumulada (utilize a escala da direita)
0,06
Classe Frequncia Frequncia Acumulada1,59-1,65 1 11,65-1,71 1 21,71-1,77 10 121,77-1,83 4 161,83-1,89 2 18
Total 18
Amplitude
02468
1012
1,59-1,65
1,65-1,71
1,71-1,77
1,77-1,83
1,83-1,89
0
5
10
15
20
Distribuio de Freqncia: Histogramas e Polgonos de
FreqnciaUma distribuio de freqncia representada por um grfico de barras denominada histograma
Outro grfico de interesse o chamado polgono de freqncia
O polgono de freqncia obtido unindo-se os pontos mdios da parte superior de cada retngulo do histograma com segmentos de reta
importante notar que tanto o histograma quanto o polgono de freqncia indicam a freqncia absoluta de cada classe
Distribuio de Freqncia: Histogramas e Polgonos de
FreqnciaDigamos que temos histogramas para as alturas dos estudantes de duas turmas diferentes, traados de acordo com as regras descritas at agora
Poderamos sobrepor os desenhos para fazer uma anlise comparativa das turmas?
Que cuidados devemos tomar?
O problema com esta regra de construo que o histograma construdo especfico para o conjunto em anlise
Para fazermos anlises comparativas de conjuntos de dados diferentes, as classes devem ser as mesmas!
Devemos, ento, utilizar algum conhecimento prvio da rea em estudo para definir o intervalo aceitvel de variao dos dados e, a partir da, definir as classes
Essas classes genricas serviro para o estudo de quaisquer conjunto de dados e permitiro anlises comparativas
Distribuio de Freqncia: Histogramas e Polgonos de
Freqncia
Distribuio de Freqncia: Histogramas e Polgonos de
FreqnciaEm um histograma, as classes devem SEMPRE ter a mesma largura?
No necessariamente!
Existem casos em que mais adequado agrupar os dados em classes com larguras desiguais.
O exemplo tpico a classificao de pessoas por faixas etrias (infantil, juvenil, adulto, snior, etc). Essas faixas no tm a mesma largura.
Distribuio de Freqncia: Histogramas com Classes de Larguras
DesiguaisA representao grfica dos dados em um histograma com classes de larguras desiguais requer a transformao dos valores de freqncia absoluta em densidade de freqncia.
Isso fundamental pois devemos manter a rea dos retngulos proporcionais freqncia da classe
A densidade de freqncia dada por:
classedalarguraclassedafreqnciafreqnciadedensidade =
Distribuio de Freqncia: Histogramas com Classes de Larguras
Desiguais
Isso significa que a altura das barras (i.e., os valores na escala do eixo vertical) NO representam a freqncia da classe, mas sim a densidade de freqncia.
Para calcularmos a freqncia da classe devemos multiplicar a densidade (indicada no eixo vertical) pela largura respectiva
Outros Grficos0,05
Classe Frequncia Frequncia Relativa (%)
1,59-1,65 1 6%1,65-1,71 1 6%1,71-1,77 10 56%1,77-1,83 4 22%1,83-1,89 2 11%
Total 18
Amplitude
Frequncia Relativa (%)
22%
11% 6% 6%
55%
1,59-1,651,65-1,711,71-1,771,77-1,831,83-1,89
Grfico de Pizza
Grfico de Pareto
Outros GrficosClasse Frequncia
Frequncia Relativa(%)
Frequncia Acumulada
Frequncia Acumulada(%)
1,71-1,77 10 56% 10 56%1,77-1,83 4 22% 14 78%1,83-1,89 2 11% 16 89%1,65-1,71 1 6% 17 94%1,59-1,65 1 6% 18 100%
Total 18
100%94%89%
56% 78%
0%20%40%60%80%
100%120%
1,71-1,77 1,77-1,83 1,83-1,89 1,65-1,71
Classe de Altura (m) Freqncia Freq. Acumulada
1.55 [--- 1.63 2 21.63 [--- 1.71 12 141.71 [--- 1.79 22 361.79 [--- 1.87 13 491.87 [--- 1.96 2 51
Distribuio Acumulada
0102030405060
1.55 [---1.63
1.63 [---1.71
1.71 [---1.79
1.79 [---1.87
1.87 [---1.96
Classes de alturas (m)
F
r
e
q
n
c
i
a
Seqncia1Seqncia2Seqncia3Seqncia4
OGIVA DE GALTON
0
10
20
30
40
50
60
1.55 [---1.63
1.63 [---1.71
1.71 [---1.79
1.79 [---1.87
1.87 [---1.96
Classes de alturas (m)
F
r
e
q
:
u
n
c
i
a
a
c
u
m
u
l
a
d
a
Series2Series1Series3
Outros Grficos
Quando os dados esto resumidos em uma tabela de freqncias, podemos calcular aproximadamente a mdia aritmtica ponderando sobre:
Pontos mdios de cada intervalo supe-se que todos os elementos das classes ocorrem no ponto mdio das respectivas classes;Exemplo: temos 7 ocorrncias na faixa entre 1,75 e 1,79. Consideramos que as sete ocorrncias equivalem a (1,79+1,75)/2=1,77 ponto mdio da classe.
Mdia Ponderada: Mdia de uma tabela de freqncia
Mdia Ponderada: Mdia de uma tabela de freqncia
=
fxf
x).(
x = ponto mdio da classef = freqnciaf = n
Erros por pginas
No de paginas
0 251 20
2 33 14 1
nfx
ffx
x == ..
66,05033
)1132025()14()13()32()201()250( ==++++
++++=x
Mdia PonderadaA mdia ponderada considerada ponderada quando os valores dos conjuntos tiverem pesos / freqncias diferentesNuma distribuio utilizando os valores discretos, calcula-se:
Mdia PonderadaQuando tivermos uma distribuio com dados agrupados por classes de valores, calculamos considerando o valor de cada classe como o ponto mdio respectivo da classe.
Alturas de Pessoas
Ponto Mdio (Xi)
Frequncia (fi) xi.fi
1,59-1,65 1,62 1 1,621,65-1,71 1,68 1 1,681,71-1,77 1,74 10 17,41,77-1,83 1,80 4 7,21,83-1,89 1,86 2 3,72
Total 18 31,62
nfx
ffx
x == ..
1,761862,31 ==x
Clculo da Moda para dados Agrupados
Caso 1: dados agrupados por valores discretos moda o valor com maior freqncia.Caso 2: dados agrupados por classes
Moda BrutaMtodo de KingMtodo de CzuberMtodo de Pearson
Clculo da Moda para dados Agrupados: Moda Bruta
Moda BrutaTome a classe que apresenta a maior freqncia classe modalA moda ser o ponto mdio da classe modal: (liminf + limsup )/2
Clculo da Moda para dados Agrupados: King
Mtodo de King:
OndeLiminf : limite inferior da classe modalfant : freqncia da classe anterior modalfpost : freqncia da classe posterior modalh: amplitude da classe modal
hff
fM
postant
posto ++= inflim
Clculo da Moda para dados Agrupados: Czuber
Mtodo de Czuber (mais preciso):
OndeLiminf : limite inferior da classe modalfMo : freqncia da classe modalfant : freqncia da classe anterior modalfpost : freqncia da classe posterior modalh: amplitude da classe modal
( )hfff ffM postantMo antMoo ++= inflim
Clculo da Moda para dados Agrupados: Pearson
Mtodo de Pearson:
OndeMd : Mediana
: Mdia
XMM do 23 =
X
Clculo da Mediana para dados Agrupados
Dados agrupados por classesMediana o valor localizado a Lx =n/2Aps clculo de Lx , determina-se o valor da mediana por:
Onde: Lx Localizao (posio) da Mediana Fant freqncia acumulada at a classe anterior classe
da mediana fi freqncia absoluta da classe da mediana h amplitude de classe Liminf Limite inferior da classe da mediana
i
ant
fFhLimX )L.( xinf
~ +=
Clculo dos Percentis para dados Agrupados por Classes
O percentil o valor localizado a LPx =(K/100)*n Onde K o percentil desejado (ex.: P45 K=45)
Aps clculo de LPx , determina-se o valor do percentil por:
Onde: LPx Localizao (posio) do Percentil Fant freqncia acumulada at a classe anterior classe
do percentil fi freqncia absoluta da classe do percentil h amplitude de classe Liminf Limite inferior da classe do percentil
i
antx f
FhLimP
)L.( xPinf
+=
Medidas de Posio Dados Agrupados: Mediana / Separatrizes (alternativo)
Para definirmos um procedimento alternativo de clculo da mediana e quaisquer outras separatrizes, utilizaremos o exemplo abaixo:
Encontra-se a classe onde est a mediana. Faz-se, ento, a proporcionalidade entre a rea e a base do retngulo hachurado e o que define a classe onde est a mediana
Md = 10,67
%2200,8
%3300,800,12 = dM
Medidas de Posio Dados Agrupados: Mediana / Separatrizes (alternativo)
16,00
Encontra-se a classe onde est Q3. Faz-se, ento, a proporcionalidade entre a rea e a base do retngulo hachurado e o que define a classe de Q3
Q3 = 15,82
3 12,0016,00 12,0022% 14%
Q =
Medidas de Posio Dados Agrupados: Mediana / Separatrizes (alternativo)
16,00
Mtodo AlternativoA regra de trs gera precisamente o mesmo resultado na aplicao da equao para clculo dos percentis para dados agrupados. Seno vejamos:
( )
( )( ) ( )
sup inf sup infinf inf
sup inf inf
inf sup inf inf
x x
ii px acm px acm
x
i px acm
px acm px acmx
i i
L L L LP L P Lfp p p f fn n
L L P Lf f f
L L L f f L h f fP
f f
= =
= + + = =
Mtodo AlternativoOnde:
Lsup = limite superior classe do percentilLinf = limite inferior classe do percentilPx = valor do percentil procuradopi = percentual representativo da classe do percentilppx = percentil procuradopacm = percentual acumulado at a classe anterior classe do percentilfi = frequncia da classe do percentiln = tamanho da amostrafpx = posio do percentil procuradofacm = frequncia acumulada at a classe anterior classe do percentil
Medidas de Disperso (Dados Agrupados)
O desvio-padro, nesse caso, faz uma ponderao da distncia dos pontos mdios de cada classe para a mdia, e a respectiva freqncia de valores:
( ) ( ))(populao(amostra)
N
xf
n
xxfs
k
jjj
k
jjj
==
=
= 12
1
2 ~
1
~
Desvio padro de dados agrupados
)1()].([)].([ 22
=
nnxfxfn
s
Desvio padro para uma tabela de freqnciasx = ponto mdio da classef = frequncia da classen = tamanho da amostra (ou f = soma das frequncias)
AssimetriaComparando a mdia, a moda e a mediana, podemos concluir pela assimetria da distribuio:
Assimetria: no simetria distribuio tende mais para um ladoDados negativamente assimtricos (assimetria para a esquerda)
Mdia e mediana esquerda da modaEm geral, mdia esquerda da mediana
Dados positivamente assimtricos (assimetria para a direita)
Mdia e mediana direita da modaEm geral, mdia direita da mediana
Assimetria
mdiamediana
modaMdia = moda = mediana
mdiamoda
mediana
Assimtrica direita
Assimtrica esquerda Simtrica
Moxx >> ~Moxx
Interpretando Histogramas
Histograma uma ferramenta estatstica que permite resumir informaes de um conjunto de dados, visualizando a forma da distribuio desses dados, a localizao do valor central e a disperso dos dados em torno do valor central
Ou seja, em anlises de processos produtivos, freqentemente obtemos informaes teis sobre a populao/amostra de dados coletados pela anlise da forma do histograma
O valor mdio est localizado no centro do histogramaA freqncia mais alta no meio e diminui gradualmente na direo dos extremos
Ocorre quando no existem restries aos valores que a varivel de controle pode assumir
Processo geralmente sob controle, somente causas comuns esto presentesProcesso usualmente est estvel
Simtrico ou em Forma de Sino
O valor mdio est localizado fora do centro do histogramaA freqncia diminui gradativamente em um dos lados e de modo um tanto abrupto do outro lado
Ocorre quando no possvel que a varivel de controle assuma valores mais altos (ou mais baixos)
Processo em que o limite inferior (superior) controlado (apenas um limite de especificao)
Por exemplo, teoricamente impossvel valores inferiores 0% para a varivel impureza
Assimtrico
O valor mdio est localizado fora do centro do histograma
A freqncia diminui abruptamente de um dos lados e suavemente em direo ao outro
Processo no atende s especificaes e uma inspeo 100% realizada para eliminar produtos defeituosos
Despinhadeiro
Parte do grfico relativamente simtrica com o acrscimo de algumas classes mais afastadas de menores freqncias
Ocorre quando dados de outra distribuio, diferente da distribuio da maior parte das medidas, so includos
Processo com anormalidades, ou erro de medio e/ou registro de dados, ou incluso de dados de um processo diferente
Ilhas Isoladas ou Pico Isolado
A freqncia mais baixa no centro do histograma e existe um pico em cada lado
Ocorre quando dados de duas distribuies, com mdias muito diferentes, so misturados
Os valores da varivel de controle devem estar associados a duas mquinas ou dois turnos distintos, por exemplo
Bimodal ou com Dois Picos
Todas as classes possuem mais ou menos a mesma freqncia, exceto aquelas das extremidades
Ocorre quando dados de duas distribuies, com mdias no muito diferentes, so misturados
Os valores da varivel de controle devem estar associados a nveis distintos de algum (ou alguns) dos fatores que constituem o processo em anlise
Achatado ou Plat
Atende, com folga, os limites de especificaoMdia no centro da faixa de especificaoVariabilidade aceitvelManter a situao atual
Especificao atendida sem nenhuma margem extraMdia no centro da faixa de especificaoVariabilidade um pouco elevadaAdotar medidas para reduzir um pouco a variabilidade
Histogramas e Limites de Especificao de Processos
No atende os limites de especificaoMdia deslocada para a esquerdaVariabilidade aceitvelAdotar medidas para deslocar a mdia para o centro (valor nominal)
No atende os limites de especificaoMdia no centro da faixa de especificaoVariabilidade elevadaAdotar medidas para reduzir a variabilidade
No atende os limites de especificaoMdia deslocada para a esquerdaVariabilidade elevadaAdotar medidas para deslocar a mdia para o centro e reduzir a variabilidade
Histogramas e Limites de Especificao de Processos
Coeficiente de Assimetria
Coeficiente de Assimetria de Pearson (As)
sxxAs )~.(3 =
Permite comparar duas ou mais distribuies diferentes e avaliar qual mais assimtrica.
Quanto maior o Coeficiente de Assimetria de Pearson, mais assimtrica curva.
Assimtrica moderada: 0,15
Curtose
Grau de achatamento (ou afilamento) de uma distribuio em relao com a distribuio normal.
Distribuio Normal
Mesocrtica
C=0,263
Leptocrtica
C0,263
).(2)(
1090
13
PPQQC
=
Distribuio de FreqnciaRepresentao do conjunto de dadosOrganizao dos dadosDistribuio de frequnciaDistribuio de frequnciaConstruindo uma distribuio de freqnciaConstruindo uma distribuio de freqnciaConstruindo uma distribuio de freqnciaConstruindo uma distribuio de freqnciaConstruindo uma distribuio de freqnciaConstruindo uma distribuio de freqnciaExemploConstruindo uma tabela de freqnciaConstruindo uma tabela de freqnciaRepresentao GrficaDistribuio de Freqncia:Histogramas e Polgonos de FreqnciaDistribuio de Freqncia:Histogramas e Polgonos de FreqnciaDistribuio de Freqncia:Histogramas e Polgonos de FreqnciaDistribuio de Freqncia:Histogramas e Polgonos de FreqnciaDistribuio de Freqncia:Histogramas com Classes de Larguras DesiguaisDistribuio de Freqncia:Histogramas com Classes de Larguras DesiguaisOutros GrficosOutros GrficosOutros GrficosMdia Ponderada: Mdia de uma tabela de freqnciaMdia Ponderada: Mdia de uma tabela de freqnciaMdia PonderadaMdia PonderadaClculo da Moda para dados AgrupadosClculo da Moda para dados Agrupados: Moda BrutaClculo da Moda para dados Agrupados: KingClculo da Moda para dados Agrupados: CzuberClculo da Moda para dados Agrupados: PearsonClculo da Mediana para dados AgrupadosClculo dos Percentis para dados Agrupados por ClassesMedidas de Posio Dados Agrupados: Mediana / Separatrizes (alternativo)Medidas de Posio Dados Agrupados: Mediana / Separatrizes (alternativo)Medidas de Posio Dados Agrupados: Mediana / Separatrizes (alternativo)Mtodo AlternativoMtodo AlternativoMedidas de Disperso(Dados Agrupados)Desvio padro de dados agrupadosAssimetriaAssimetriaInterpretando HistogramasSimtrico ou em Forma de SinoAssimtricoDespinhadeiroIlhas Isoladas ou Pico IsoladoBimodal ou com Dois PicosAchatado ou PlatHistogramas e Limites de Especificao de ProcessosHistogramas e Limites de Especificao de ProcessosCoeficiente de AssimetriaCurtose