35
INFERENCIA ESTADÍSTICA

SUMA DE VARIABLES ALEATORIAS - fi.mdp.edu. · PDF fileDistribución de la media muestral y características numéricas Al ser la media muestral una suma de variables aleatorias x i

Embed Size (px)

Citation preview

Page 1: SUMA DE VARIABLES ALEATORIAS - fi.mdp.edu. · PDF fileDistribución de la media muestral y características numéricas Al ser la media muestral una suma de variables aleatorias x i

INFERENCIA

ESTADÍSTICA

Page 2: SUMA DE VARIABLES ALEATORIAS - fi.mdp.edu. · PDF fileDistribución de la media muestral y características numéricas Al ser la media muestral una suma de variables aleatorias x i

Población y Muestra Una variable aleatoria puede pensarse como cualquier

característica medible de los individuos de una población. El conjunto de todas las mediciones de dicha

variable es la Población o Universo.

1 2 3, , ,..... nX X X X

Estas variables forman una muestra aleatoria de tamaño n si:

•Las Xi son variables aleatorias independientes.

•Cada variable Xi tiene la misma distribución de probabilidad que la

distribución de la población con su misma esperanza µ y varianza σ2

1 2 3, , ,..... Nx x x x

Muestra es un subconjunto de la población

al que tenemos acceso y sobre el que

realmente hacemos las mediciones 1 2 3, , ,..... nx x x x

Cada una de estas mediciones son valores que toman las

variables aleatorias

Page 3: SUMA DE VARIABLES ALEATORIAS - fi.mdp.edu. · PDF fileDistribución de la media muestral y características numéricas Al ser la media muestral una suma de variables aleatorias x i

Ejemplo de una población

Page 4: SUMA DE VARIABLES ALEATORIAS - fi.mdp.edu. · PDF fileDistribución de la media muestral y características numéricas Al ser la media muestral una suma de variables aleatorias x i

Seleccionamos una muestra

Page 5: SUMA DE VARIABLES ALEATORIAS - fi.mdp.edu. · PDF fileDistribución de la media muestral y características numéricas Al ser la media muestral una suma de variables aleatorias x i

Seleccionamos otras

muestras

Page 6: SUMA DE VARIABLES ALEATORIAS - fi.mdp.edu. · PDF fileDistribución de la media muestral y características numéricas Al ser la media muestral una suma de variables aleatorias x i

La inferencia

estadística

generaliza

conclusiones

extraídas de

una muestra

sobre la

población

El objetivo de tomar una muestra es obtener

información sobre los parámetros no conocidos de

la población

Parámetro

Es una

cantidad

numérica

calculada

sobre la

población.

Estadístico muestral o Estimador

Es cualquier operación que se hace con la muestra. Ej:

media muestral, proporción muestral, varianza muestral

Los estimadores son variables aleatorias, su

distribución de probabilidades se llaman

distribuciones de muestreo.

Page 7: SUMA DE VARIABLES ALEATORIAS - fi.mdp.edu. · PDF fileDistribución de la media muestral y características numéricas Al ser la media muestral una suma de variables aleatorias x i

Distribución de la media muestral

Page 8: SUMA DE VARIABLES ALEATORIAS - fi.mdp.edu. · PDF fileDistribución de la media muestral y características numéricas Al ser la media muestral una suma de variables aleatorias x i

Si los datos originales no se

distribuyen normalmente

Page 9: SUMA DE VARIABLES ALEATORIAS - fi.mdp.edu. · PDF fileDistribución de la media muestral y características numéricas Al ser la media muestral una suma de variables aleatorias x i

Distribución de la media muestral

y características numéricas

Al ser la media muestral una suma de variables aleatorias xi con igual distribución, por el teorema central del límite, la media muestral tiene una distribución normal. Y por el teorema de Bernoulli generalizado,

1 1

( )( )

n ni i i

i i

x x E xE x E E n

n n n

iE x 2

iV x

2 2

21 1

( ) .n n

i i

i i

x xV x V V n

n n n n

Page 10: SUMA DE VARIABLES ALEATORIAS - fi.mdp.edu. · PDF fileDistribución de la media muestral y características numéricas Al ser la media muestral una suma de variables aleatorias x i

Estimación puntual de

parámetros

Es el valor numérico que toma un estimador.

Se calcula con los datos de la muestra, del cual se espera que estime un parámetro poblacional.

Si X es una variable aleatoria con distribución de

probabilidades f(x), caracterizada por el parámetro

desconocido y si es una muestra

aleatoria de tamaño n, entonces

1 2, ,....., nx x x

1 2ˆ ( , ,..... )nh x x x Es un estimador puntual de

La media muestral es un estimador puntual de 2 2esun estimadorpuntualdeS

Page 11: SUMA DE VARIABLES ALEATORIAS - fi.mdp.edu. · PDF fileDistribución de la media muestral y características numéricas Al ser la media muestral una suma de variables aleatorias x i

Propiedades de los

estimadores • Propiedad de insesgadura:

Un estimador es un estimador insesgado del parámetro

si E( )=

Es decir, la esperanza del estimador muestral es el

parámetro poblacional.

Ejemplos: la media y la varianza muestrales son

estimadores insesgados de y 2Respectivamente. Demostrarlo

•Propiedad de eficiencia:

Un estimador insesgado es más eficiente que otro

Si son insesgados de y la varianza de es menor que

la varianza de

1 2

12

Page 12: SUMA DE VARIABLES ALEATORIAS - fi.mdp.edu. · PDF fileDistribución de la media muestral y características numéricas Al ser la media muestral una suma de variables aleatorias x i

Propiedades de los estimadores

• Propiedad de suficiencia:

Un estimador es suficiente si utiliza toda la

información de la muestra.

La media muestral es un estimador

suficiente de

El modo no es un estimador suficiente de

Page 13: SUMA DE VARIABLES ALEATORIAS - fi.mdp.edu. · PDF fileDistribución de la media muestral y características numéricas Al ser la media muestral una suma de variables aleatorias x i

Estimación por intervalos

Intervalo de confianza para la media poblacional

conociendo

Coeficiente de confianza

2

/2 /2( ) 1P z Z z

22~ , ~ ,X N X N

n

~ 0,1

xz N

n

Partimos de una población X, la distribución muestral de la media y su

estandarización.

Al hacer inferencia, existe el riesgo de equivocarnos.

Page 14: SUMA DE VARIABLES ALEATORIAS - fi.mdp.edu. · PDF fileDistribución de la media muestral y características numéricas Al ser la media muestral una suma de variables aleatorias x i

Intervalo de confianza para la media

poblacional con varianza conocida

/2 /2( ) 1x

P z z

n

/2 /2( ) 1P z x zn n

/2 /2

/2 /2

( ) 1

( ) 1

P z x z xn n

P z x z xn n

/2 /2( ) 1P x z x zn n

Page 15: SUMA DE VARIABLES ALEATORIAS - fi.mdp.edu. · PDF fileDistribución de la media muestral y características numéricas Al ser la media muestral una suma de variables aleatorias x i

Ejemplo

Se sabe que la vida media en hs de una

lámpara de 75 watts es

aproximadamente normal, con

dispersión de 25 hs. Una muestra

aleatoria de 20 lámparas tiene una vida

media de 1014 hs. Construir un

intervalo de confianza del 95%

respecto de la vida media de las

lámparas.

Page 16: SUMA DE VARIABLES ALEATORIAS - fi.mdp.edu. · PDF fileDistribución de la media muestral y características numéricas Al ser la media muestral una suma de variables aleatorias x i

Observaciones

• Sería erróneo escribir 1003,043 1024,95 0,95P

¿Por qué?

•Esto significa que no hay que vincular 1 con el parámetro que se estima, ya que está

ligada solamente con los límites del intervalo que

varían de una muestra a otra.

Interpretación: aunque nunca sabremos si la media

poblacional se encuentra en el intervalo hallado, tendremos

la seguridad de que el método utilizado para la obtención de

dicho intervalo es confiable el 95 %, es decir, se puede

esperar que contenga a dicho parámetro en el 95 % de las

veces.

Page 17: SUMA DE VARIABLES ALEATORIAS - fi.mdp.edu. · PDF fileDistribución de la media muestral y características numéricas Al ser la media muestral una suma de variables aleatorias x i

Nivel de confianza y

precisión de la estimación

Cuanto más alto es el nivel de confianza, más largo es el intervalo y menor es la precisión de la estimación.

Elección del tamaño de la muestra

La precisión del intervalo de confianza es el radio del

intervalo

2

.zn

Esto significa que al usar la media muestral para estimar la

media poblacional , el error de muestreo es

2

.x znEjercicio: despejar n

Page 18: SUMA DE VARIABLES ALEATORIAS - fi.mdp.edu. · PDF fileDistribución de la media muestral y características numéricas Al ser la media muestral una suma de variables aleatorias x i

Estimación por intervalos para

la media poblacional

2

/2 /2( ) 1P x z x zn n

con varianza poblacional conocida

con varianza poblacional desconocida

Si n 30 se reemplaza por S y usamos el

intervalo anterior, para muestras grandes

/2 /2( ) 1S S

P x Z x zn n

Page 19: SUMA DE VARIABLES ALEATORIAS - fi.mdp.edu. · PDF fileDistribución de la media muestral y características numéricas Al ser la media muestral una suma de variables aleatorias x i

Intervalo para la media poblacional si no

se conoce la dispersión poblacional σ

En la práctica es habitual que todos los parámetros sean desconocidos

Cuando se desconoce σ, se observa el tamaño de la muestra n

En este caso, S no es una buena estimación de σ. Si

además la muestra proviene de una población normal, la media muestral

se ajusta a una distribución t.

Si n <30 Si n ≥30

En este caso la media muestral se distribuye normalmente, porque S es

una mejor estimación de σ

1~

/n

xT t

S n

xz

S

n

Page 20: SUMA DE VARIABLES ALEATORIAS - fi.mdp.edu. · PDF fileDistribución de la media muestral y características numéricas Al ser la media muestral una suma de variables aleatorias x i

Distribución T (de Student)

Page 21: SUMA DE VARIABLES ALEATORIAS - fi.mdp.edu. · PDF fileDistribución de la media muestral y características numéricas Al ser la media muestral una suma de variables aleatorias x i

Tabla T

Page 22: SUMA DE VARIABLES ALEATORIAS - fi.mdp.edu. · PDF fileDistribución de la media muestral y características numéricas Al ser la media muestral una suma de variables aleatorias x i

Intervalo de confianza para la media con

varianza poblacional desconocida y

n<30

Si la población base es normal, la varianza es

desconocida y el tamaño de la muestra menor que 30,

la media muestral tiene distribución T con n-1 grados de

libertad

/2, 1 /2, 1( ) 1

n nP t T t

/2, 1 /2, 1( ) 1

n n

xP t t

S

n

/2, 1 /2, 1( ) 1

n n

S SP x t x t

n n

Page 23: SUMA DE VARIABLES ALEATORIAS - fi.mdp.edu. · PDF fileDistribución de la media muestral y características numéricas Al ser la media muestral una suma de variables aleatorias x i

Ejemplo :

Dispersión poblacional desconocida y

tamaño de la muestra menor que 30

Se toma una muestra piloto, se calcula S y se la utiliza como

estimación de Ejemplo: En un estudio hecho para determinar el tiempo

medio necesario para el montaje de cierta pieza de una

máquina, 25 trabajadores hicieron un promedio de 42,5

minutos y una varianza de 4,1 minutos. Si los tiempos de los

trabajadores se distribuyen normalmente, estimar el tiempo

promedio necesario para el montaje de la máquina al nivel

del 99%

41,367 43,63 0,005;24

2,797t

Page 24: SUMA DE VARIABLES ALEATORIAS - fi.mdp.edu. · PDF fileDistribución de la media muestral y características numéricas Al ser la media muestral una suma de variables aleatorias x i

Distribución Ji-Cuadrado

1 2, ,...., nx x xSean Variables aleatorias

independientes y distribuidas

en forma normal estandarizada

Entonces la variable aleatoria 2 2 2 2 2

1 2 3 ..... nx x x x

Tiene distribución Ji-Cuadrado con n grados de libertad.

La media y la varianza de la distribución ji-cuadrado es

2 2n n

Es no negativa y asimétrica hacia la derecha. Si n aumenta,

se aproxima a la normal

Page 25: SUMA DE VARIABLES ALEATORIAS - fi.mdp.edu. · PDF fileDistribución de la media muestral y características numéricas Al ser la media muestral una suma de variables aleatorias x i

Distribución muestral de la

variable

2

2

2

1n S

Si

es la varianza de una muestra

aleatoria de tamaño n tomada de

una población normal que tiene una

varianza 2

Entonces la variable aleatoria muestral

Se distribuye como

2

1n

gl=2

gl=3

gl=4gl=5

0 2 Chi2 6 8

(Ji- cuadrado con n-1 gl)

2

2 1

1

n

i

i

x x

Sn

2

1n

Page 26: SUMA DE VARIABLES ALEATORIAS - fi.mdp.edu. · PDF fileDistribución de la media muestral y características numéricas Al ser la media muestral una suma de variables aleatorias x i

Tabla de Ji-Cuadrado

Page 27: SUMA DE VARIABLES ALEATORIAS - fi.mdp.edu. · PDF fileDistribución de la media muestral y características numéricas Al ser la media muestral una suma de variables aleatorias x i

Intervalo de confianza para la

varianza poblacional

Una estimación de la varianza poblacional, es la varianza

muestral

2

2 1

1

n

i

i

x x

Sn

Si bien comprobamos que es un estimador insesgado de

S NO ES un estimador insesgado de la dispersión

poblacional

Para muestras grandes, el sesgo es pequeño y es muy

común hacer esa estimación.

2

Usaremos la variable aleatoria con

distribución Ji- cuadrado y n-1 grados

de libertad:

2

2

2

1n S

Page 28: SUMA DE VARIABLES ALEATORIAS - fi.mdp.edu. · PDF fileDistribución de la media muestral y características numéricas Al ser la media muestral una suma de variables aleatorias x i

Extremos del intervalo para la

varianza poblacional

2 2 2

1 /2; 1 /2; 1n nP

2

2 2

1 /2; 1 /2; 12

1n n

n SP

2

2

1 /2; 1 2

1n

n S

2

2

/2; 12

1n

n S

2

2

2

1 /2; 1

1

n

n S

2

2

2

/2; 1

1

n

n S

2 2

2

2 2

/2; 1 1 /2; 1

1 11

n n

n S n SP

Page 29: SUMA DE VARIABLES ALEATORIAS - fi.mdp.edu. · PDF fileDistribución de la media muestral y características numéricas Al ser la media muestral una suma de variables aleatorias x i

Suponiendo una confiabilidad del 90%

para n = 7 , se ubican los valores de la

tabla en la gráfica

Page 30: SUMA DE VARIABLES ALEATORIAS - fi.mdp.edu. · PDF fileDistribución de la media muestral y características numéricas Al ser la media muestral una suma de variables aleatorias x i

Tabla de Ji-Cuadrado

Page 31: SUMA DE VARIABLES ALEATORIAS - fi.mdp.edu. · PDF fileDistribución de la media muestral y características numéricas Al ser la media muestral una suma de variables aleatorias x i

Construir el intervalo de confianza

con esos datos, si la varianza

muestral es de 4,1

21,952 15

2 2

2

2 2

/2; 1 1 /2; 1

1 11

n n

n S n SP

2

2

/2; 1

1 6.4,11,952

12,6n

n S

2

2

1 /2; 1

1 6.4,115

1,64n

n S

Page 32: SUMA DE VARIABLES ALEATORIAS - fi.mdp.edu. · PDF fileDistribución de la media muestral y características numéricas Al ser la media muestral una suma de variables aleatorias x i

Ejemplo

De 70 cables producidos por una compañía se

obtuvo una resistencia media a la tracción de

1,5 toneladas con una dispersión de 45 kg.

Estimar la dispersión de todos los cables

producidos por la compañía utilizando un

nivel de confianza de 0,95.

38,34 53,53

Page 33: SUMA DE VARIABLES ALEATORIAS - fi.mdp.edu. · PDF fileDistribución de la media muestral y características numéricas Al ser la media muestral una suma de variables aleatorias x i

Intervalo de confianza sobre una

proporción

Si se ha tomado una muestra aleatoria de tamaño n de una gran población (posiblemente infinita),

donde X observaciones en esta muestra pertenecen a la clase de interés.

ˆX

pn

Es el estimador puntual de la proporción

poblacional.

Es binomial, de parámetros n y p

La distribución de muestreo de es

aproximadamente normal con esperanza p y

varianza con p no cerca de 0 y 1.

Demostrarlo.

p

1p p

n

Page 34: SUMA DE VARIABLES ALEATORIAS - fi.mdp.edu. · PDF fileDistribución de la media muestral y características numéricas Al ser la media muestral una suma de variables aleatorias x i

Para n tendiendo a infinito,

intervalo de confianza para p

La distribución de es aproximadamente normal estándar.

ˆ

ˆ ˆ1

p pz

p p

n

/2 /2 1P z Z z

/2 /2

ˆ1

ˆ ˆ1

p pP z z

p p

n

/2 /2

ˆ ˆ ˆ ˆ1 1ˆ ˆ 1

p p p pP p z p p z

n n

Page 35: SUMA DE VARIABLES ALEATORIAS - fi.mdp.edu. · PDF fileDistribución de la media muestral y características numéricas Al ser la media muestral una suma de variables aleatorias x i

Ejemplo

En una muestra aleatoria de 75 ejes de árbol, 12 tienen un acabado superficial que es más rugoso

que lo permitido por las especificaciones. Una estimación puntual de la proporción de los ejes en la población que excede las especificaciones de

rugosidad es

12ˆ 0,16

75

Xp

n

Construir un intervalo de confianza para p utilizando

una confiabilidad del 95%

0,077 0,243p