13
TEORIA DE LA ESTIMACION En inferencia estadística se llama estimación al conjunto de permiten dar un valor aproximado de un parámetro de una poblaci de los datos proporcionados por una muestra. Por ejemplo, una e de la media de una determinada característica de una población N podría ser la media de esa misma característica para una mues tamaño n. a estimación se divide en tres !randes bloques, cada uno de tiene distintos métodos que se usan en función de las caracterí propósitos del estudio# $. Estimación puntual# %étodo de los momentos& %étodo de la máxima verosimilitud& %étodo de los mínimos cuadrados& '. Estimación por intervalos. (. Estimación ba"esiana. Estimador )n estimador es una re!la que establece cómo calcular una estim basada en las mediciones contenidas en una muestra estadística.

Teoria de La Estimacion

Embed Size (px)

DESCRIPTION

TRABAJO SOBRE LA ESTIMACION

Citation preview

TEORIA DE LA ESTIMACION

En inferencia estadstica se llama estimacin al conjunto de tcnicas que permiten dar un valor aproximado de un parmetro de una poblacin a partir de los datos proporcionados por una muestra. Por ejemplo, una estimacin de la media de una determinada caracterstica de una poblacin de tamao N podra ser la media de esa misma caracterstica para una muestra de tamao n.

La estimacin se divide en tres grandes bloques, cada uno de los cuales tiene distintos mtodos que se usan en funcin de las caractersticas y propsitos del estudio:

1. Estimacin puntual: Mtodo de los momentos;

Mtodo de la mxima verosimilitud;

Mtodo de los mnimos cuadrados;

2. Estimacin por intervalos.

3. Estimacin bayesiana.

EstimadorUn estimador es una regla que establece cmo calcular una estimacin basada en las mediciones contenidas en una muestra estadstica.

Estimacin puntual Consiste en la estimacin del valor del parmetro mediante un slo valor, obtenido de una frmula determinada. Por ejemplo, si se pretende estimar la talla media de un determinado grupo de individuos, puede extraerse una muestra y ofrecer como estimacin puntual la talla media de los individuos. Lo ms importante de un estimador, es que sea un estimador eficiente. Es decir, que sea insesgado (ausencia de sesgos) y estable en el muestreo o eficiente (varianza mnima) Estimacin puntual. Sea X una variable poblacional con distribucin F , siendo desconocido. El problema de estimacin puntual consiste en, seleccionada una muestra X1, ..., Xn, encontrar el estadstico T(X1, ..., Xn) que mejor estime el parmetro . Una vez observada o realizada la muestra, con valores x1, ..., xn, se obtiene la estimacin puntual de , T(x1, ..., xn) = .

Vemos a continuacin dos mtodos para obtener la estimacin puntual de un parmetro: mtodo de los momentos y mtodo de mxima verosimilitud. Mtodo de los momentos: consiste en igualar momentos poblacionales a momentos muestrales. Deberemos tener tantas igualdades como parmetros a estimar. Momento poblacional de orden r r = E(Xr) Momento muestral de orden r ar = Xn i=1 Xr i n

Mtodo de mxima verosimilitud: consiste en tomar como valor del parmetro aquel que maximice la probabilidad de que ocurra la muestra observada. Si X1, ..., Xn es una muestra seleccionada de una poblacin con distribucin F o densidad f(x), la probabilidad de que ocurra una realizacin x1, ..., xn viene dada por: L(x1, ..., xn) = Yn i=1 f(xi)

A L(x1, ..., xn) se le llama funcin de verosimilitud.(credibilidad de la muestra observada). Buscamos entonces el valor de que maximice la funcin de verosimilud, y al valor obtenido se le llama estimacin por mxima verosimilitud de . Nota: si la variable X es discreta, en lugar de f(xi ) consideramos la funcin masa de probabilidad p(xi).

Ejemplo 7.1: Sea X N(, ), con desconocido. Seleccionada una m.a.s. X1, ..., Xn, con realizacin x1, ..., xn, estimamos el parmetro por ambos mtodos. Segn el mtodo de los momentos: E(X) = Xn i=1 Xi n = X, y al ser = E(X) se obtiene que = x. Por el mtodo de mxima verosimilitud: L(x1, ..., xn) = Yn i=1 f(xi ) = = Yn i=1 1 2 e (xi) 2 2

Estimacin por Intervalos de conanza 109 y maximizamos en tal funcin; en este caso resulta ms fcil maximizar su logaritmo: lnL(x1, ..., xn) = 1 2 2 Xn i=1 (xi ) 2 n ln( 2) lnL(x1, ..., xn) = 1 2 Xn i=1 (xi ) = n x n 2 = 0 =

Estimacin por intervalosConsiste en la obtencin de un intervalo dentro del cual estar el valor del parmetro estimado con una cierta probabilidad. En la estimacin por intervalos se usan los siguientes conceptos:

Intervalo de confianzaEl intervalo de confianza es una expresin del tipo [1, 2] 1 2, donde es el parmetro a estimar. Este intervalo contiene al parmetro estimado con un determinado nivel de confianza. Pero a veces puede cambiar este intervalo cuando la muestra no garantiza un axioma o un equivalente circunstancial.

Variabilidad del ParmetroSi no se conoce, puede obtenerse una aproximacin en los datos aportados por la literatura cientfica o en un estudio piloto. Tambin hay mtodos para calcular el tamao de la muestra que prescinde de este aspecto. Habitualmente se usa como medida de esta variabilidad la desviacin tpica poblacional y se denota .

Error de la estimacinEs una medida de su precisin que se corresponde con la amplitud del intervalo de confianza. Cuanta ms precisin se desee en la estimacin de un parmetro, ms estrecho deber ser el intervalo de confianza y, si se quiere mantener o disminuir el error, ms ocurrencias debern incluirse en la muestra estudiada. En caso de no incluir nuevas observaciones para la muestra, ms error se comete al aumentar la precisin. Se suele llamar E, segn la frmula E = (2 - 1)/2.

Lmite de ConfianzaEs la probabilidad de que el verdadero valor del parmetro estimado en la poblacin se site en el intervalo de confianza obtenido. El nivel de confianza se denota por (1-), aunque habitualmente suele expresarse con un porcentaje ((1-)100%). Es habitual tomar como nivel de confianza un 95% o un 99%, que se corresponden con valores de 0,05 y 0,01 respectivamente.

PRUEBA DE HIPOTESIS

CONCEPTO

Afirmacin acerca de los parmetros de la poblacin.

Hiptesis Estadstica:

Al intentar alcanzar una decisin, es til hacer hiptesis (o conjeturas) sobre la poblacin aplicada.

Tales hiptesis, que pueden ser o no ciertas, se llaman hiptesis estadsticas.

Son, en general, enunciados acerca de las distribuciones de probabilidad de las poblaciones.

Hiptesis Nula.

En muchos casos formulamos una hiptesis estadstica con el nico propsito de rechazarla o invalidarla. As, si queremos decidir si una moneda est trucada, formulamos la hiptesis de que la moneda es buena (o sea p = 0,5, donde p es la probabilidad de cara).

Analgicamente, si deseamos decidir si un procedimiento es mejor que otro, formulamos la hiptesis de que no hay diferencia entre ellos (o sea. Que cualquier diferencia observada se debe simplemente a fluctuaciones en el muestreo de la misma poblacin). Tales hiptesis se suelen llamar hiptesis nula y se denotan por Ho.

Para todo tipo de investigacin en la que tenemos dos o ms grupos, se establecer una hiptesis nula.

La hiptesis nula es aquella que nos dice que no existen diferencias significativas entre los grupos.

Por ejemplo, supongamos que un investigador cree que si un grupo de jvenes se somete a un entrenamiento intensivo de natacin, stos sern mejores nadadores que aquellos que no recibieron entrenamiento. Para demostrar su hiptesis toma al azar una muestra de jvenes, y tambin al azar los distribuye en dos grupos: uno que llamaremos experimental, el cual recibir entrenamiento, y otro que no recibir entrenamiento alguno, al que llamaremos control. La hiptesis nula sealar que no hay diferencia en el desempeo de la natacin entre el grupo de jvenes que recibi el entrenamiento y el que no lo recibi.

Una hiptesis nula es importante por varias razones:

Es una hiptesis que se acepta o se rechaza segn el resultado de la investigacin.

El hecho de contar con una hiptesis nula ayuda a determinar si existe una diferencia entre los grupos, si esta diferencia es significativa, y si no se debi al azar.

No toda investigacin precisa de formular hiptesis nula. Recordemos que la hiptesis nula es aquella por la cual indicamos que la informacin a obtener es contraria a la hiptesis de trabajo.

Al formular esta hiptesis, se pretende negar la variable independiente. Es decir, se enuncia que la causa determinada como origen del problema flucta, por tanto, debe rechazarse como tal.

Otro ejemplo:

Hiptesis: el aprendizaje de los nios se relaciona directamente con su edad.

Errores tipo I Y II Al tomar la decisin de rechazar o no las hiptesis podemos equivocarnos en nuestra decisin, podemos cometer un error. La decisin siempre se toma en funcin de la hiptesis nula, sobre esta hiptesis y se pueden cometer dos tipos de errores:

1er Error. Error de tipo I o

Rechazar la hiptesis nula, siendo cierta

2do Error. Error de tipo II o

Aceptar la hiptesis nula, cuando esta es falsa

Lo anterior se resume en la siguiente tabla:

Condicin de la hiptesis nula

Accin posible

No rechazar H0

Rechazar H0

Verdadera

Correcto

Probabilidad 1 - a

Error tipo I

Probabilidad a

Falsa

Error tipo II

Probabilidad b

Correcto

Probabilidad 1 b

Nivel de significacin

Siempre al tomar una decisin estoy expuesto a cometer un error, por eso es muy beneficioso tener una cuantificacin de cun buena o no ha sido mi decisin, medir en trminos de probabilidades si mi decisin ha sido o no acertada y tener alguna medida de la confianza de mis decisiones.

El error que se mide con ms frecuencia es el de tipo I o , donde se fija una probabilidad pequea, como es lgico, de cometer este tipo de error, de equivocarme en mi decisin. Por convencin se fija una probabilidad de 0.05 o un 5%, o de 0.01 o un 1% yb se acostumbra a denotar esta probabilidad por , as tendramos = 0.05 ,o, = 0.01

La especificidad de una probabilidad pequea designada por de cometer el error de tipo I, es lo que se conoce como nivel de significacin de la prueba.

Ahora resulta fcil entender porque la hiptesis nula se expresa en trminos de lo que ``esperamos rechazar, lo contrario a lo esperado por el investigador, pues el error que fijamos con una probabilidad pequea de equivocarnos es el de rechazarla siendo cierta, y desde el momento mismo en que la formulamos se hace en funcin de lo que no se espera que ocurra.

En el ejemplo de la intervencin para reducir la prevalencia del habito de fumar, la hiptesis nula se formul en trminos de igualdad en los proporciones de fumadores, cuando lo que el investigador espera es que sea menor la prevalencia de los que fuman despus de la intervencin.Ilustracin de las zonas de rechazo de una hiptesis nula

El rechazo de la Hiptesis Nula equivale a la aceptacin de la Hiptesis Alternativa, si en el ejemplo que nos ocupa rechazamos la igualdad de prevalencia de fumadores, aceptamos la alternativa de que la prevalencia disminuy despus de aplicado el plan de intervencin.

El error de tipo II o tambin puede ser `` medido, pero en la prctica su uso se limita a casos muy especiales. Es por eso que al no tener en valor de probabilidad fijado de cometer este tipo de error- aceptar la hiptesis nula cuando es falsa- trato de no cometer este error al realizar la prueba y por eso al no poder rechazar la hiptesis nula nunca digo que la acepto, si no que no puedo rechazarla. Esta forma de expresar el no rechazo de H es denominada por algunos autores como reservar el juicio y simplemente lo que se trata es de no cometer el error de tipo II al utilizar la palabra acepto.

-Estadgrafo o estadstico de prueba.

Para realizar una prueba de hiptesis hay que tener en cuenta algunos aspectos de diseo de la investigacin como es la naturaleza de las variables, en que escala estn medidas, las caractersticas de la muestra, y el cumplimiento de algunos supuestos pre establecidos para decidir que tipo de prueba se va a utilizar.

Siempre existe para cualquier tipo de prueba un estadstico o estadgrafo ( expresin o formula matemtica) que se calcula con los datos de la muestra. Este estadgrafa bajo el supuesto de que H sea cierta sigue una determinada distribucin terica de frecuencia, distribucin que puede variar segn el tipo de prueba, y que en ocasiones le da el nombre a la prueba estadstica.

-Regla de decisin.

La distribucin terica de frecuencia o de probabilidad que caracteriza a cada estadgrafo y el nivel de significacin que se fije para realizar la prueba, son los elementos esenciales que van a influir en la decisin que se tome en cuento al rechazo o no de la hiptesis nula.

Generalmente cuando se produce el rechazo de H y por ende la aceptacin de la alternativa se dice que la prueba fue significativa a un 5% o un 1 % en dependencia del nivel de significacin con que se halla trabajado la prueba. Este aspecto se explicar con mas detalle, en aras de facilitar su comprensin, cuando desarrollemos algunas pruebas de hiptesis especificas.

Antes creemos pertinente realizar algunas observaciones sobre el termino estadsticamente significativo, que con frecuencia se confunde con el significado corriente de la palabra significativo, y se hace sinnimo el resultado de una prueba, al de relevante, importante desde el punto de vista del marco terico de la ciencia en la cual se est investigando. Por tanto se recomienda usar en la literatura cientfica la palabra significativo solo en caso de referirse al resultado de una prueba estadstica y no al discurso en general.

Otro aspecto que vale la pena aclarar es que el resultado de una prueba de hiptesis no puede analizarse al margen del marco terico de la ciencia particular en que esta ha sido usada. El resultado de la prueba estadstica slo es una parte de la evidencia que influye en la decisin del investigador. La decisin estadstica no debe considerarse como definitiva, si no que es un elemento mas a considerar junto con el anlisis de toda la informacin cientfica que existe sobre el problema que se investiga.

1 Pruebas de hiptesis a partir de medias.

Existen dos condiciones bsicas en que realizamos PH a partir de medias: para una sola poblacin y para dos poblaciones. Veremos cada caso por separado, a la vez que nos detendremos en las particularidades de cada una. Pero antes, debes conocer que las pruebas de hiptesis se pueden realizar de forma unilateral y bilateral, en dependencia de la forma en que son enunciadas las hiptesis nula y alternativa. As, una PH bilateral es aquella en que slo interesa conocer la existencia de diferencias, sin definir el sentido de stas, como ocurre en el caso unilateral.

La media de una sola poblacin.

Esta situacin surge cuando al investigador le interesa probar que la media m de una determinada variable en una poblacin es igual o diferente a un valor determinado m0. Estas pruebas pueden realizarse en tres condiciones diferentes que veremos a continuacin:

La poblacin se distribuye normal con varianza conocida.

La poblacin se distribuye normal con varianza desconocida.

La poblacin no se distribuye normal.

Aunque la teora para las condiciones 1 y 2 se basa en que la poblacin sigue una distribucin normal, en la prctica es comn aplicar este proceder an cuando la poblacin slo est distribuida aproximadamente normal. Esto es satisfactorio siempre que la desviacin de la normalidad sea moderada.

1- Poblacin normal con varianza conocida.

Suponemos que X~N (m, s2) donde s2 es conocida y queremos contrastar si es posible que m (desconocida) sea en realidad cierto valor m0 fijado. Esto es un supuesto terico que nunca se dar en la realidad pero servir para introducir la teora sobre contrastes.

Test de dos colas con varianza conocida :

El test se escribe entonces como:

Ho: m = m0

H1: m m0

Estadgrafo de prueba: