Teoria Elementar da Amostragem.docx

Embed Size (px)

Citation preview

ndiceIntroduo31.Teoria Elementar da Amostragem41.2.Plano de amostragem51.3.Amostragem Aleatria Simples com reposio61.4.Amostragem sem reposio71.5.Amostragem Sistemtica91.6.Inacessibilidade a toda populao101.7.Amostragem a esmo101.8.Amostragens intencionais101.9.Amostragem por voluntrios112.Distribuies Amostrais112.1.Estimao112.2.Intervalo de confiana para a mdia de uma populao112.3.Intervalo de confiana para a proporo de uma populao13Concluso14Bibliografia15

5

Introduo O objectivo da teoria de amostragem o de seleccionar uma parte amostra de uma coleco de elementos Populao e com base na informao recolhida dessa amostra, inferir sobre determinada caracterstica de interesse da Populao. So apresentados alguns conceitos utilizados na teoria da amostragem (Populao, unidade, amostra, dimenso, caracterstica, varivel, estimador, Estimativa, amostragem, amostra enviesada, processo de amostragem enviesado e Dados) e as fases de um processo de amostragem. Tambm so analisados diferentes sistemas de amostragem (aleatria e no aleatria) e apresentados exemplos de cada um dos mtodos mencionados.

1.Teoria Elementar da AmostragemA teoria elementar da amostragem um estudo das relaes existentes entre uma populao e as amostras dela extradas.Em geral, um estudo de inferncia feito a respeito de uma populao mediante a utilizao de amostras dela extradas, juntamente com as indicaes da preciso.

Amostragem todo o processo de recolha de uma parte, geralmente pequena, dos elementos que constituem um dado conjunto. Da anlise dessa parte pretende obter-se informaes para todo o conjunto.

Algumas noes bsicas da teoria da amostragem:Populao -- a coleco de todos os elementos com uma dada caracterstica comum.Num processo de amostragem importante distinguir entre populao objectivo -- a totalidade dos elementos em estudo e relativamente aos quais se pretende obter certo tipo de informao e populao inquirida -- aquela sobre a qual efectivamente feita a amostragem.

Caracterstica ou atributo da populao -- a informao relativa populao que se pretende estudar.As caractersticas podem ser de natureza quantitativa e neste caso consideram-se escalas numricas nas quais as variveis se podem classificar em:Contnuas (referem-se a medies, pesagens);Discretas (referem-se a contagens),

As de natureza qualitativa e neste caso classificam-se em:Nominais (ex: sexo, espcie de uma dada planta ou animal);Ordinais (ex: itens de valores de uma dada classificao).Populao de amostras o conjunto de todas as amostras possveis.Unidade de amostragem ou unidade estatstica -- o elemento da populao considerada e sobre o qual vai ser estudada a caracterstica de interesse -exemplos: um animal, uma planta, um objecto, uma famlia, uma explorao agrcola, um bairro.O objectivo principal da teoria da amostragem obter uma amostra que seja uma representao honesta da populao e que conduza estimao das caractersticas da populao com grande preciso.

Algumas das vantagens que podemos desde j apontar ao usarmos um processo de amostragem no estudo de um dado problema so:a) Reduo dos custos e maior rapidez no apuramento dos resultados;b) Maior profundidade na recolha de elementos;c) Resolve o problema de estudar caractersticas que so destrutivas;d) Minimiza os erros associados recolha de informao (na recolha, registo e tratamento de informao h sempre erros associados. A recolha de um nmero menor de elementos faz, obviamente, diminuir as possibilidades deste tipo de erro).

1.2.Plano de amostragemAs fases principais de um plano de amostragem adequado:Definio dos objectivos do estudo;Escolha dos dados teis a recolher, o que significa:Definio da unidade de amostragem;Definio da escala de valores para a caracterstica em estudo;Definio da populao ou universo;Escolha do mtodo de amostragem;Definio do nvel de preciso ou erro de amostragem admitido.

Definida a populao h que decidir sobre o processo a adoptar na recolha dos elementos a incluir na amostra, isto , o mtodo de amostragem. Tais processos podem ser globalmente classificados em:1--mtodos no aleatrios ou dirigidos - nestes mtodos a construo da amostra feita a partir de informao a priori sobre a populao estudada, tentando que a amostra seja um espelho fiel dessa populao. Por assentarem em bases empricas, tais mtodos no permitem calcular a preciso das estimativas obtidas a partir da amostra.Os mtodos no aleatrios mais conhecidos so a amostragem orientada, a amostragem por convenincia e a amostragem por quotas.2 --mtodos aleatrios ou probabilsticos quando cada elemento da populao tem uma probabilidade conhecida de fazer parte da amostra. Estes mtodos possibilitam a determinao da distribuio de probabilidade, pelo menos assintoticamente, do estimador de interesse, consequentemente a determinao da sua varincia e permitem por isso quantificar o erro de amostragem decorrente da utilizao de apenas uma parte da populao.Destes mtodos iremos estudar a amostragem aleatria simples, a amostragem estratificada, a amostragem por conglomerados e a amostragem multietpica.

1.3.Amostragem Aleatria Simples com reposioFaz-se uma lista da populao e sorteiam-se os elementos que faro parte da amostra.Pode-se utilizar uma tabela de nmeros aleatrios.Cada subconjunto da populao com o mesmo n de elementos tem a mesma chance de ser includo na amostra. p = n / NSe considerarmos uma populao com N elementos, num processo de amostragem com reposio, cada elemento tem a mesma probabilidade 1/N de ser seleccionado. Sendo assim, qualquer amostra de dimenso n tem probabilidade 1/ Nn de ser seleccionada.Seja ento X1 , X2 ,..., Xn uma amostra aleatria retirada com reposio de uma populao com N elementos com valores Ai ( i=1,...N, ) e x1 , x2 ,..., xn a correspondente amostra observada.Cada elemento da amostra Xi pode tomar qualquer valor Ai com probabilidade 1/N.Um estimador centrado para m , como, Tem-se ainda . A chama-se erro padro da mdia.Como regra geral no se conhece no possvel saber o valor do erro padro.H ento que determinar um estimado de . Vamos relembrar que um estimador centrado de . Efectivamente . Relembrando que tem-se Num processo de amostragem, necessrio calcular a dimenso da amostra a recolher, de modo a obter a estimativa de interesse, com um erro inferior a , fixado um nvel de confiana.Quando a dimenso da amostra aumenta, aumenta a preciso do estimador, mas tambm os custos de amostragem.Idealmente deve estabelecer-se a preciso desejada e ento escolher a dimenso da amostra.Como um intervalo de confiana para a (1-)100% de confiana, no caso de uma amostra aleatria obtida com reposio determinado com base numa amostra de dimenso n.Sendo assim, fixado o nvel de preciso ou erro de amostragem () e o nvel de confiana (1-) ou o risco () podemos determinar a dimenso da amostra a recolher de forma a ter um erro inferior a . Para isso basta ento exigir que . Porm, para calcular o valor t/2 necessrio saber o nmero de graus de liberdade (n-1), e consequentemente a dimenso da amostra, que afinal aquilo que pretendemos calcular. Por isso na prtica costuma usar-se t/2=2 para um nvel de significncia de 5%. No que se refere ao valor s', o desvio padro da amostra, necessita de ser conhecido para se ter a dimenso da amostra.O que se dever fazer?Considerar uma amostragem de uma populao semelhante e usar os valores de interesse desse estudo.Fazer um estudo piloto para, a partir dele obter estimativas dos parmetros desconhecidos para podermos usar a frmula acima.Considerar uma amostragem bi-etpica, isto , obter uma primeira amostra de dimenso n1 e com desvio padro s1. Para uma preciso , a amostra final dever ter um nmero de elementos n, dado por .Se o valor resultante para n tal que aprecivel (>5% ou >10%), deve considerar-se como dimenso de amostra a recolher o valor dado por .

1.4.Amostragem sem reposioNeste caso a situao diferente da anterior, porque os elementos vo ser includos na amostra sem reposio o que torna as variveis aleatrias correspondentes aos valores da caracterstica em estudo no independentes umas das outras. No entanto, no caso da populao ser grande relativamente dimenso da amostra extrada, pode considerar-se um esquema de amostragem em que aquelas variveis so praticamente independentes.Caso do estudo das propriedades dos estimadores da mdia e da varincia da populao.Para facilitar consideremos as seguintes variveis indicatrizes:

Seja novamente ( X1 , X2 , .. ., Xn ) a amostra retirada desta vez sem reposio ento (Note-se que se Aj est na amostra Aj Ij =Xj )Vamos ento calcular o valor mdio e a varincia de .

Portanto estimador centrado de .Calculemos agora a varincia de

Ora atendendo a que os Ij no so independentes tem- se ora

o que, aps pequenos clculos d Por curiosidade vejamos que a correlao assim dada. Observe-se que a covarincia tende para zero quando N , o que explica a quase independncia para populaes grandes.O sinal negativo no coeficiente de correlao tambm se interpreta com facilidade, bastando pensar que o facto de na amostra se observar um elemento com a caracterstica A. diminui a probabilidade de se observar outro com essa mesma caracterstica.Calculemos ento: Atendendo a que se pode escrever como com vem , aps o que, considerando a substituio, se tem .Observe-se que < isto < Sendo assim, quer dizer que a amostragem sem reposio mais eficiente do que a amostragem com reposio para estimar o valor mdio.Se N grande comparativamente a n, a fraco no difere muito de 1 e a diferena na eficincia torna-se desprezvel.Ao factor chama-se correco de populao finita e a chama-se fraco de amostragem.A expresso da varincia acima deduzida pode ser apresentada usando a varincia corrigida , isto , .

Vimos que no caso da amostragem com reposio, era um estimador centrado de , veremos agora que no caso da amostragem sem reposio estimador centrado de .Ora logo estimador centrado de na amostragem sem reposio.Neste caso uma estimativa do erro padro : .

1.5.Amostragem SistemticaQuando os elementos da populao se apresentam ordenados e a retirada dos elementos da amostra feita periodicamente, temos uma amostragem sistemtica. Assim, por exemplo, em uma linha de produo, podemos, a cada dez itens produzidos, retirar um para pertencer a uma amostra da produo diria.Amostras no-probabilsticas so tambm, muitas vezes, empregados em trabalhos estatsticos, por simplicidade ou por impossibilidade de se obterem amostras probabilsticas, como seria desejvel. No entanto processos no-probabilsticos de amostragem tm tambm sua importncia. Sua utilizao, entretanto, deve ser feita com cuidado. Apresentamos a seguir algumas tcnicas de amostragem no-probabilstica.

1.6.Inacessibilidade a toda populaoEsta situao ocorre com muita freqncia na prtica. Por exemplo, seja a populao que nos interessa constituda de todas as peas produzidas por certa mquina. Ora, mesmo estando a mquina em funcionamento normal, existe uma parte da populao que formada pelas peas que ainda vo ser produzidas. Ou ento se nos interessar a populao de todos os portadores de febre tifide, estaremos diante de um caso semelhante. Deve-se notar que, em geral, estudos realizados com base nos elementos da populao amostrada tero, na verdade, seu interesse de aplicao voltado para os elementos restantes da populao. Este caso de amostragem no-probabilstica pode ocorrer tambm quando, embora se tenha a possibilidade de atingir toda a populao, retiramos a amostra de uma parte que seja prontamente acessvel. Assim, se fssemos recolher uma amostra de um monte de minrio, poderamos por simplificao retirar a amostra de uma camada prxima da superfcie do monte, pois o acesso as pores interiores seria problemtico.

1.7.Amostragem a esmo a amostragem em que o amostrador, para simplificar o processo, procura ser aleatrio sem, no entanto, realizar propriamente o sorteio usando algum dispositivo aleatrio confivel. Por exemplo, se desejarmos retirar uma amostra de 100 parafusos de uma caixa contendo 10.000, evidentemente no faremos uma AAS, pois seria muito trabalhosa, mas retiramos simplesmente a esmo.Os resultados da amostragem a esmo so, em geral, equivalentes aos da amostragem probabilstica se a populao homognea e se no existe a possibilidade de o amostrador ser inconscientemente influenciado por alguma caracterstica dos elementos da populao. 1.8.Amostragens intencionais Enquadram-se aqui os diversos casos em que o amostrador deliberadamente escolhe certos elementos para pertencer amostra, por julgar tais elementos bem representativos. O perigo desse tipo de amostragem grande, pois o amostrador pode facilmente se enganar em seu pr-julgamento.

1.9.Amostragem por voluntriosOcorre, por exemplo, no caso da aplicao experimental de uma nova droga em pacientes, quando a tica obriga que haja concordncia dos escolhidos.

2.Distribuies AmostraisO conceito de distribuio de probabilidade de uma varivel aleatria ser agora utilizado para caracterizar a distribuio dos diversos valores de uma varivel em uma populao.Ao retirar uma amostra aleatria de uma populao estaremos considerando cada valor da amostra como um valor de uma varivel aleatria cuja distribuio de probabilidade a mesma da populao no instante da retirada desse elemento para a amostra. Em conseqncia do fato de os valores da amostra serem aleatrios, decorre que qualquer quantidade calculada em funo dos elementos da amostra tambm ser uma varivel aleatria.Parmetros so valores tericos correspondentes a populao. Estatsticas so funes dos valores amostrais. As estatsticas, sendo variveis aleatrias, tero alguma distribuio de probabilidade, com uma mdia, varincia, etc. A distribuio de probabilidade de uma estatstica chama-se comumente distribuio amostral ou distribuio por amostragem.

2.1.EstimaoA inferncia estatstica tem por objetivo fazer generalizaes sobre uma populao, com base nos dados de amostra. Um dos itens bsicos nesse processo a estimao de parmetros. A estimao pode ser por ponto ou por intervalo.

Estimativa por Ponto: a estimativa de um parmetro populacional por um nico valor. Estimativa por Intervalo: consiste em um intervalo em torno da estimativa por ponto de tal forma que ele possua probabilidade conhecida (nvel de confiana (1-)) de conter o verdadeiro valor do parmetro. Este intervalo conhecido por intervalo de confiana (IC).

2.2.Intervalo de confiana para a mdia de uma populao

Os intervalos de confiana para a mdia so tipicamente construdos com o estimador no centro do intervalo.1- Quando conhecido:Quando o uso da distribuio normal est garantido, o intervalo de confiana para a mdia determinado por:

IC = ( - z ; + z ) ou

IC = ( - z ; + z )

no caso de populao finita de tamanho N e amostragem sem reposio.

Os intervalos de confiana mais freqentemente utilizados so os de 90%, 95% e 99%.Z(1-)

1,650,90

1,960,95

2,580,99

2- Quando desconhecido Quando o desvio padro da populao no conhecido, usa-se o desvio padro da amostra como estimativa, substituindo-se por s nas equaes para intervalo de confiana. (Distribuio da populao normal) A disbruio t de Student utilizada quando o desvio padro da populao desconhecido. A forma da distribuio t muito semelhante com a normal, sendo a principal diferena entre as duas distribuies que a distribuio t apresenta maior rea nas caudas. Para calcularmos t, necessitamos conhecer o nvel de confiana desejado e o nmero de graus de liberdade (gl=n-1). O intervalo de confiana para a mdia determinado por:

IC = ( - t ; + t ) ou

IC = ( - t ; + t )

no caso de populao finita de tamanho N e amostragem sem reposio.

2.3.Intervalo de confiana para a proporo de uma populao

A distribuio amostral da proporo aproximadamente normal para n > 30, pode-se ento usar a distribuio normal para estabelecer o intervalo de confiana:

IC=( p - z ; p + z) ou

IC=( p - z ; p + z)

no caso de populao finita de tamanho N e amostragem sem reposio.

ConclusoA amostragem e os processos de amostragem aplicam-se em variadssimas reas do conhecimento e, muitas vezes, so a nica forma de obter informaes sobre uma determinada realidade a conhecer. A amostragem tambm o processo de determinao de uma parte da Populao a ser pesquisada. Enquanto que a tcnica da amostragem selecciona parte de uma Populao e observa-a, com vista a estimar uma ou mais caractersticas para a totalidade dessa mesma Populao, um censo envolve um exame a todos os elementos da Populao.

Bibliografia Montenegro, Eduardo J. S -. Estatstica programada passo a passo. Vol. III e Vol. V Nazareth, Helenalda Curso Bsico de Estatstica Editora tica