84
Introducción a inferencia básica Métodos de Análisis Aplicados a los Mercados de Suelo en América Latina Daniel A. Rodríguez, Ph.D. University of North Carolina, Chapel Hill [email protected] www.planning.unc.edu/rodriguez

Introducción a inferencia básica

Embed Size (px)

DESCRIPTION

Métodos de Análisis Aplicados a los Mercados de Suelo en América Latina

Citation preview

Page 1: Introducción a inferencia básica

Introducción a inferencia básica

Métodos de Análisis Aplicados a los Mercados de Suelo en América Latina

Daniel A. Rodríguez, Ph.D.University of North Carolina, Chapel Hill

[email protected] www.planning.unc.edu/rodriguez

Page 2: Introducción a inferencia básica

Objetivos de aprendizaje

• Aplicar estadística descriptiva a muestras

• Entender el teorema del limite central y su importancia para describir poblaciones a partir de muestras

• Calcular normal estándar, área bajo curva normal e intervalos de confianza

Page 3: Introducción a inferencia básica

Resumen de temas

• Estadística descriptiva– Medidas de tendencia central– Medidas de dispersión

• Estadística inferencial

Page 4: Introducción a inferencia básica

Presentación• Medidas de tendencia central• Medidas de dispersión• Distribuciones muestrales• Teorema del Limite Central• Normal estándar• Formulación de hipótesis• Intervalos de confianza• T-de estudiante• Pruebas de hipótesis

Page 5: Introducción a inferencia básica

Medidas de tendencia central

• Son indicadores que describen la situación de tendencia o hacia la que tienden a aglomerarse las observaciones de una variable aleatoria– Media– Mediana

Page 6: Introducción a inferencia básica

Medidas de tendencia central: la media

• Ejemplo numérico: tenemos los siguientes precios del suelo (por m2) para una ciudad por barrios

• La media es el promedio aritmético = la suma de todas las observaciones, dividida por el número de observaciones

Barrio A B C D E FPrecios 6 13 5 15 3 2

3,76

23155136

Page 7: Introducción a inferencia básica

Medidas de tendencia central: la media

• En términos matemáticos, la media aritmética es:

n

Xn

i i 1

n

XXXX n ...321

Page 8: Introducción a inferencia básica

Medidas de tendencia central: la media

• Atributo interesante de la media– La suma de la diferencia entre cada

observación y la media es 0

0)(...)()()( 321 xXxXxXxX n

0)(1

xXn

ii

Page 9: Introducción a inferencia básica

Medidas de tendencia central: la mediana

• Es el valor medio de un arreglo ordenado de datos– Ordenar los datos (ascendente o

descendente)– Encontrar el dato justo en medio de los

demás datos

Esta definición aplica para un número par o impar de observacionesmedianaladeposición

n

2

1

Page 10: Introducción a inferencia básica

Medidas de tendencia central: la mediana

• Ejemplo numérico: tenemos los siguientes precios del suelo para una ciudad por barrios Barrio F E C A B DPrecios 2 3 5 6 13 15

Hay 6 observaciones. Luego la posición de la mediana es n+1 / 2 = 3.5. Quiere decir que la mediana esta entre el valor del dato en la posición 3 y el valor del dato en la posición 4.

Posición 3: barrio C Posición 4: barrio A Mediana, entre 5 y 6. Es decir: 5.5

Page 11: Introducción a inferencia básica

Sesgo debido a observaciones extremas

• La mediana no es sensible a observaciones extremas– Es un indicador que no es sesgado por los

extremos por lo que se recomienda cuando las variables aleatorias tienen distribuciones amplias

• La media es sensible a observaciones extremas

Esta definición aplica para un número par o impar de observaciones

Page 12: Introducción a inferencia básica

Distribución normal

115

=10

Page 13: Introducción a inferencia básica

Distribución asimétrica

Page 14: Introducción a inferencia básica

Presentación• Medidas de tendencia central• Medidas de dispersión• Distribuciones muestrales• Teorema del Limite Central• Normal estándar• Formulación de hipótesis• Intervalos de confianza• T-de estudiante• Pruebas de hipótesis

Page 15: Introducción a inferencia básica

Medidas de dispersión

• Indican el grado de “separación” entre los datos numéricos de una variable aleatoria.– Rango– Varianza

Page 16: Introducción a inferencia básica

Medidas de dispersión

• El rango describe los valores extremos entre los cuales se encuentra distribuida una variable– Se calcula restando el valor menor del valor

mayor; para el ejemplo del barrio 1, el rango es 8-6 = 2 Barrio 1 (n=9)

Page 17: Introducción a inferencia básica

Medidas de dispersión

• La varianza

• Evalúa en qué medida las observaciones fluctúan con respecto a la media

1

1

2

n

XXn

i i

Page 18: Introducción a inferencia básica

• La desviación estándar – Extrae la raíz cuadrada de la varianza para

de esta manera compensar la elevada al cuadrado

Medidas de dispersión

1

1

2

n

XXn

i i

Page 19: Introducción a inferencia básica

Medidas de dispersión• La varianza y desviación estándar;

ejemplo numérico: tenemos los siguientes precios del suelo para una ciudad por barriosBarrio F E C A B DPrecios 2 3 5 6 13 15

EstándarDesviación 4,507,29

07.29

16

33.715.....33.7333.72 222

Page 20: Introducción a inferencia básica

Presentación• Medidas de tendencia central• Medidas de dispersión• Distribuciones muestrales• Teorema del Limite Central• Normal estándar• Formulación de hipótesis• Intervalos de confianza• T-de estudiante• Pruebas de hipótesis

Page 21: Introducción a inferencia básica

Introducción a la estadística inferencial

• La información muestral de tendencia central y dispersión permite hacer estimativos de dichos indicadores para la población– Incluso permite determinar el tamaño de

muestras óptimo para alcanzar buenas predicciones poblacionales

Page 22: Introducción a inferencia básica

Estadística inferencial --conceptos básicos

• Población o marco muestral: grupo sobre el cual se quieren hacer generalizaciones

• Muestra: grupo menor al de la población que fue seleccionado para ser estudiado

• Diseño de muestra: Criterio que se utilizo para seleccionar las observaciones de la muestra

Page 23: Introducción a inferencia básica

Distribución muestral de medias de muestras

Populacao; x =5 5 5 5 5 54 4 4 4 4 4 43 3 3 3 3 32 2 2 2 2 2 21 1 1 1 1 1

Poblacion

Muestras (c/u de tamaño igual a 3)

Page 24: Introducción a inferencia básica

Medias muestralesx = x = x = x = x = x = x = x = x =

5 5 5 5 5 4 4 4 34 4 4 3 2 3 3 2 23 2 1 2 1 2 1 1 1

Media 4.0 3.7 3.3 3.3 2.7 3.0 2.7 2.3 2.0

0

0.5

1

1.5

2

2.5

0.0 1.0 2.0 3.0 4.0 5.0

Média

Fre

qu

ênci

a

Média: Frequência:4.0 1.03.7 1.03.3 2.03.0 2.02.7 2.02.3 1.02.0 1.0

Media Frecuencia

Page 25: Introducción a inferencia básica

Ejemplo de distribución de medias de muestras

• Valor por m2 de locales comerciales en cierta zona a ser estimado por un grupo de estudiantes

• Cada estudiante tomará una muestra aleatoria de locales

Page 26: Introducción a inferencia básica

ResultadosResultados

• Persona 1: P1, P2….Pn P1 media1, s1

• Persona 2: P1, P2….Pn P2 media2, s2

– Media Pi de cada estudiante es parte de la distribución muestral de la media

– Distribución de medias es normal

– Con menor dispersión que si

• La dispersión de la media de medias es menor que la dispersión de las variables crudas

• Cuánto menor? Raiz cuadrada de n (n= número de estudiantes)

Page 27: Introducción a inferencia básica

ResultadosResultados

• Lo anterior es cierto SIN importar distribución del precio/m2 de todos los locales comerciales

Precio/m2

# de locales

Precio/m2

# de locales

Page 28: Introducción a inferencia básica

Presentación• Medidas de tendencia central• Medidas de dispersión• Distribuciones muestrales• Teorema del Limite Central• Normal estándar• Formulación de hipótesis• Intervalos de confianza• T-de estudiante• Pruebas de hipótesis

Page 29: Introducción a inferencia básica

Teorema del Límite Central

• Distribución de suma (o media) de variables aleatorias con varianza finita ~ Normal o Gaussiana, cuando n>30– Aleatoria– Distribución normal

Page 30: Introducción a inferencia básica

Teorema del Límite Central

• Si tomamos muestras repetidas de un tamaño predefinido de una población – Distribución de medias será normal– Media de distribución muestral del promedio

promedio de población• Xbarra = μ

– Error estándar = desviación estándar/ √n• Si n es grande, error disminuye

Page 31: Introducción a inferencia básica

Ejemplo Ejemplo

• Utilizar el programa climit para explorar las implicaciones del teorema central del limite– Hacer doble click en el ícono en esta lámina

(no contiene virus!)

Cenlimit.exe

Page 32: Introducción a inferencia básica

Notación

• Muestra– (xbarra) es la media – s es la desviación estándar de la muestra– n es el tamaño de la muestra

• Población– es la media de la población– es la desviación estándar de la población– N es el tamaño de la población

x

Page 33: Introducción a inferencia básica

Distribución muestral del promedio

• Variable cuantitativa– Xbarra = μ (promedio de población)– Error = σ/√n

• Variable proporcional– p= π (promedio de proporción de población)– Error = √ (p(1-p)/n)

Page 34: Introducción a inferencia básica

Distribución normal

• Hay infinitas distribuciones normales (depende de la media, y la dispersión)– Dos ejemplos

Page 35: Introducción a inferencia básica

Continuando con el teorema del límite central

• No solo la media de medias se aproxima a la media de la población– Sino que sabemos que 68.27% de las

muestras están entre y ; y 95.45% de las muestras están entre

y

x x

x 2x 2

Page 36: Introducción a inferencia básica

Dicho de otro modo:34.134% de observaciones están entre la media y +1 desviación estándar47.725% de observaciones están entre la media y +2 desviaciones estándar

Continuando con el teorema del límite central

Page 37: Introducción a inferencia básica

Área bajo la distribución normal

Xbarra

2-2 -

50%

50%

50%-34.13%

=15.87%

Page 38: Introducción a inferencia básica

Área bajo la distribución normal

Xbarra Xbarra

2-2 - 2-2 -

50%

50%

15.87%

15.87% x 2 = 31.74%

50%-47.725%

=2.275%

=2.275% x 2

=4.55

Page 39: Introducción a inferencia básica

Área bajo la distribución normal

Xbarra

El área rayada muestra los casos en que la muestra tuvo una media mayor a 115

115

SXbarra =10

Page 40: Introducción a inferencia básica

Presentación• Medidas de tendencia central• Medidas de dispersión• Distribuciones muestrales• Teorema del Limite Central• Normal estándar• Formulación de hipótesis• Intervalos de confianza• T-de estudiante• Pruebas de hipótesis

Page 41: Introducción a inferencia básica

Normal estándar

• La letra “z” se designa al valor de cada observación en términos de la desviaciones estándar de la muestra– Transformación:

– Nuevos valores tienen promedio 0, y desviación estándar 1 muy útil

ux

Page 42: Introducción a inferencia básica

Normal estándar

• En el caso anterior del valor 115, su normal estándar sería 1.5, porque está a 1.5 desviaciones estándares de la media

Page 43: Introducción a inferencia básica

Ejemplo de normal estándar

pop_acre std hu_acre std 1 10.02 0.63 8.38 2.21 2 42.39 5.72 20.62 6.84 3 18.46 1.96 9.48 2.63 4 14.48 1.33 9.95 2.81 5 23.53 2.76 12.30 3.70

Variable Obs Mean Std. Dev.

Min Max Mean Std. Dev.

Min Max

pop_acre 318 6.01 6.36 0 42.39 -1.23E-09 1 -0.95 5.72 hu_acre 318 2.51 2.65 0.02 20.62 -2.20E-10 1 -0.94 6.84 parkacre 318 0.00 0.01 0 0.04 -2.84E-09 1 -0.73 6.30 roadacre 318 0.02 0.01 0.00 0.07 3.21E-09 1 -1.67 3.89

Page 44: Introducción a inferencia básica

Área bajo la distribución normal

Xbarra 115

SXbarra =10

• La pregunta original sobre el área a la derecha de 115– El valor normal estándar

de 115 es 1.5– Cuál es el área a la

derecha de 1.5?– Utilizar una tabla Z

Page 45: Introducción a inferencia básica

Tabla Z

z 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09

0 0 0.004 0.008 0.012 0.016 0.0199 0.0239 0.0279 0.0319 0.0359

0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753

0.2 0.0793 0.0832 0.0871 0.091 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141

0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.148 0.1517

0.4 0.1554 0.1591 0.1628 0.1664 0.17 0.1736 0.1772 0.1808 0.1844 0.1879

0.5 0.1915 0.195 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.219 0.2224

0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549

0.7 0.258 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852

0.8 0.2881 0.291 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133

0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3304 0.3365 0.3389

1 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621

1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.377 0.379 0.381 0.383

1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.398 0.3997 0.4015

1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177

1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319

1.5 0.4332 0.4345 0.4357 0.437 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441

1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545

1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633

1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706

1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.475 0.4756 0.4761 0.4767

2 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817

2.1 0.4821 0.4826 0.483 0.4834 0.4838 0.4842 0.4846 0.485 0.4854 0.4857

2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.489

2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916

2.4 0.4918 0.492 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936

2.5 0.4938 0.494 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952

2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.496 0.4961 0.4962 0.4963 0.4964

2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.497 0.4971 0.4972 0.4973 0.4974

2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.498 0.4981

2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986

3 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.499 0.499

3.1 0.499 0.4991 0.4991 0.4991 0.4992 0.4992 0.4992 0.4992 0.4993 0.4993

3.2 0.4993 0.4993 0.4994 0.4994 0.4994 0.4994 0.4994 0.4995 0.4995 0.4995

3.3 0.4995 0.4995 0.4995 0.4996 0.4996 0.4996 0.4996 0.4996 0.4996 0.4997

3.4 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4998

3.5 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998

3.6 0.4998 0.4998 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999

3.7 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999

3.8 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.499

La tabla es en Excel. Para acceder a los datos, hacer doble click en la tabla.

Muestra area entre 0 y la normal estandar

Page 46: Introducción a inferencia básica

Ejemplo normal estándar

• Una muestra tiene un valor de 80– Cual es su valor normal estándar?

• (80-100)/10 = - 2.0

– Que % de las muestras son mayores que 80?• Utilizando -2.0, ir a la a tabla. Utilizar 2, ya que la

curva es simétrica. El valor es 0.4772. Es decir, que 0.5 + 0.477 = 97.7% de las muestras serían mayores que 80, y sólo

2.3% serian menores.

Page 47: Introducción a inferencia básica

Presentación• Medidas de tendencia central• Medidas de dispersión• Distribuciones muestrales• Teorema del Limite Central• Normal estándar• Formulación de hipótesis• Intervalos de confianza• T-de estudiante• Pruebas de hipótesis

Page 48: Introducción a inferencia básica

Hipótesis

• Bisagra ente problema y estudio empírico

• Fundamentada por teoría y praxis

• Ajustes y mejoras de acuerdo a evidencia

Page 49: Introducción a inferencia básica

Ejemplos de Hipótesis

• Existe una relación entre regulación de usos de suelo y precios, tal que las ciudades mas reguladas presentan mayores precios de tierra

• Existe una relación entre la localización y el precio de la tierra, tal que los inmuebles mas próximos a centros de actividad y negocios tienen precios mas elevados que inmuebles mas distantes

• Existe una relación entre la informalidad y la pobreza, tal que las ciudades con mayores índices de pobreza presentan mayores domicilios informales que ciudades con menor índices de pobreza en su población

Page 50: Introducción a inferencia básica

Prueba de hipótesis

• Recolectar información para determinar si la hipótesis es cierta o no– En muchos casos, no estaremos 100% seguros de

que la hipótesis sea cierta (o no), pero tendremos alta confiabilidad de que lo sea

Page 51: Introducción a inferencia básica

Formulación de hipótesis para inferencia estadística

• Hipótesis nula (H0)

– Afirmación que indica que para la población, dos variables son iguales

• Hipótesis alternativa (H1)

– Afirmación que indica que para la población, dos variables difieren (>, <, < o >)

– Hipótesis de la investigación

Page 52: Introducción a inferencia básica

• Queremos saber si alcaldes con tintes de izquierda adquieren tierra para proyectos de vivienda con métodos que están por fuera del mercado de tierra, en comparación a alcaldes con tintes de derecha

• Sabemos cantidad de tierra adquirida por via administrativa (expropiada) para todas las ciudades de Colombia

• Formulamos el test de hipótesis:– H0: izquierda = derecha

– H1: izquierda ≠ derecha

Ejemplo: adquisición de la tierra e ideología política

Page 53: Introducción a inferencia básica

• Digamos que izquierda = 83.18%

derecha = 22.25%

• Como estas medidas son para la población de ciudades, no hay necesidad de hacer pruebas de significancia– izquierda > derecha , luego H0 es rechazada

Ejemplo: adquisición de la tierra e ideología política

Page 54: Introducción a inferencia básica

• Caso más usual: dos muestras aleatorias• izquierda = ??• derecha = ?•

izquierda = 23.33%• derecha = 83.18%

x

Ejemplo: adquisición de la tierra e ideología política

x

Page 55: Introducción a inferencia básica

• En el ejemplo anterior– Si no sabemos media en la población, tenemos error

de muestra, y el hecho que las muestras tienen medias distintas podría ser una coincidencia

– La hipótesis es la misma, queremos saber si la media en las dos poblaciones son diferentes

– Hay que incluir información no solo sobre la media, sino sobre la dispersión que existe en la media muestral –porque nos ayuda a saber que tan diferentes las medias son en realidad

Ejemplo: adquisición de la tierra e ideología política

Page 56: Introducción a inferencia básica

Presentación• Medidas de tendencia central• Medidas de dispersión• Distribuciones muestrales• Teorema del Limite Central• Normal estándar• Formulación de hipótesis• Intervalos de confianza• T-de estudiante• Pruebas de hipótesis

Page 57: Introducción a inferencia básica

Estimación de intervalos de confianza

• Un rango o intervalo de valores entre los cuales podemos afirmar que está la media poblacional

• Por ejemplo, si sabemos la media muestral, podemos decir con 95% de certeza que la media de la población esta entre el rango de y=

xx 96.1 xx 96.1

xx 96.1

Page 58: Introducción a inferencia básica

Intervalos de confianza

• Retomando el ejemplo del precio/m2 de locales comerciales– Xbarra de precios= promedio de promedios– Error estándar = s/√n

• Puedo adivinar promedio, usando Xbarra

• No contiene información sobre el error

Page 59: Introducción a inferencia básica

Intervalos de confianza

• Presentar la inferencia como intervalo– Contiene rango en el que el valor del parámetro

(la media) se encuentra– Probabilidad de que esté en ese intervalo a

cierto “nivel de confianza” • 95% nivel de confianza estándar en ciencias sociales

• Normalidad del TCL nos ayuda a construir intervalos a deseados niveles de confianza

Page 60: Introducción a inferencia básica

Intervalos de confianza

• Valores críticos para población

• Declarar hechos– Tenemos 95% de confianza que promedio esta

dentro rango dado– 5% de los casos, media de la población esta por

fuera del intervalo de confianza del promedio

58.2,96.1

58.2,96.1

xx

ErrorEstxErrorEstx

Page 61: Introducción a inferencia básica

Intervalos de confianza en MUESTRAS

n

sZx

ErrorEstZx

.

n

ppZp

ErrorEstZp

)1(

.

Page 62: Introducción a inferencia básica

Ejemplo

• Considere una distribucion asimetrica, tirada hacia la derecha (right skewed)

– La media muestral es 14.46, n=40, y la desviacion estandar 1.34. Estimar un intervalo de confianza del 95%

Page 63: Introducción a inferencia básica

Ejemplo

Page 64: Introducción a inferencia básica

Presentación

• Repaso teorema del limite central

• Normal estándar

• Formulación de hipótesis

• Intervalos de confianza

• T-de estudiante

• Pruebas de hipótesis

Page 65: Introducción a inferencia básica

T de estudiante

• William Gosset se dio cuenta que la distribución normal no describe muestras pequeñas– Más probable que valores lejos del promedio

ocurran– Hay que ajustar la distribución por el tamaño

de la muestra– No pudo usar su nombre “estudiante”

Page 66: Introducción a inferencia básica

T de estudiante

• Como distribución normal pero con colas mas gruesas (probables)

• Si n ∞, t normal

• Ajuste al tamaño de la muestra se llama “grados de libertad”

Page 67: Introducción a inferencia básica

T de estudiante

• Como distribución normal pero con colas mas gruesas (probables)

• Si n ∞, t normal

• Ajuste al tamaño de la muestra se llama “grados de libertad”– Mucho grados = bueno; pocos no tan bueno

• 1 grado de libertad, hay que irse 12 veces la desviación estándar para tener 95% de observaciones

• df=5, t.05=2.58; df=10, t.05=2.23; df=50, t.05=2.01

Page 68: Introducción a inferencia básica

Pruebas de hipótesis

• Comparar valor por m2 de locales comerciales en zona con otro valor– Antes construimos intervalo de confianza

para promedio muestral (269k,291k)– Qué tan factible es que el promedio

verdadero en la población de locales sea 255k?

– No muy probable…

T1

Page 69: Introducción a inferencia básica

Presentación• Medidas de tendencia central• Medidas de dispersión• Distribuciones muestrales• Teorema del Limite Central• Normal estándar• Formulación de hipótesis• Intervalos de confianza• T-de estudiante• Pruebas de hipótesis

Page 70: Introducción a inferencia básica

Pruebas de hipótesis

• Usemos números!– 255,000 esta a 5.9 desviaciones del

promedio– Cual es la probablidad de que esto ocurra?

• Mirar curva de distribución normal (Tabla Z)– Casi 0

Page 71: Introducción a inferencia básica

Pasos para examinar una hipótesis

1. Formular hipótesis nula (Ho) e hipótesis alternativa (Ha)

2. Identificar estadística a comparar

3. Probabilidad de observar promedio de muestra si Ho es verdad

4. Concluir

Page 72: Introducción a inferencia básica

1. Formular hipótesis

• Nula – nada ocurre (en términos de parámetros poblacionales)– Π = valor– µ = valor– µ1- µ2 = valor

• Alternativa –lo que nos interesa!– Π > valor –una cola– µ ≠ valor –dos colas– µ1- µ2 < valor –una cola

Page 73: Introducción a inferencia básica

2. Identificar estadística a comparar

• La estadística a comparar: qué tan lejos está el valor de la muestra del de la población –azar o no?– Prueba de una muestra o de dos?

Empecemos con una:

n

sx

ErrorEst

xZ

.

npp

pErrorEst

p

)1(

.

Page 74: Introducción a inferencia básica

3. Valor p

• Probabilidad de que la estadística (t o Z) sea resultado de azar o no, si la hipótesis nula es verdad– Una probabilidad bien baja sugiere baja

posibilidad de azar– Usando distribución (t o Z) con valores

críticos (y para T, dependiendo de grados de libertad)

Page 75: Introducción a inferencia básica

4. Conclusión

• Si p es cerca a 0, probabilidad de que sea resultado de azar es baja – rechazar Ho

• Si p es cerca a 1, probabilidad que sea resultado de azar es alta – no rechazar Ho

• Sugiero p<0.05

Page 76: Introducción a inferencia básica

Ejemplo• Valor/m2 locales comerciales en cierta zona

– 280k, s=85000, n = 400– Un censo mostró que el valor de predios comerciales

es de 268k/m2. Es la diferencia significativa?– Ho: Xbarra estudio = µ censo– T= (280k-268k)/(85k/ √(400) = 2.82; df=?– http://www.socr.ucla.edu/Applets.dir/T-table.html– P~ 0– Rechazar Ho, que son iguales

Page 77: Introducción a inferencia básica

Comparar dos muestras

• Frecuente en investigación – evaluar intervenciones– Aumento de precios– Ingresos – Tiempos de viaje– Calidad del aire

• Todo permanece igual en prueba de hipótesis, menos estadística a comparar

T2

Page 78: Introducción a inferencia básica

Ejemplo

• Comparación de precios de predios residenciales, antes y después, TransMilenio

Page 79: Introducción a inferencia básica

Estrategia de análisis

• Si no hay diferencia entre dos grupos (antes y después) en población (Ho) qué tan probable es que yo encuentre diferencia en mis (dos) muestras?– Estadística del test

• t= (diferencia en muestra – diferencia en población)/ se (diferencia en muestra)

Page 80: Introducción a inferencia básica

Estrategia de análisis• Var(X1+X2)=Var(X1)+Var(X2)+2Cov(X1,X

2)

• Si X1, X2 son independientes, Cov = 0

BA xx

BABA

es

xxt

)(

B

x

A

xxxxx n

s

n

seseses BA

BABA

2222

Page 81: Introducción a inferencia básica

Ejemplo

• = 7.32/2.31 = 3.05

• Si no hay diferencia, probabilidad de que encontremos una de 3.05 por azar es < 0.01

• Rechazar hipótesis nula

Antes (n=1055) Despues (n=874) Promedio Std. Dev. Promedio Std. Dev.

Precio 73.93 44.47 80.99 55.11

Page 82: Introducción a inferencia básica

Objetivos de aprendizaje –el principio pero al final• Aplicar estadística descriptiva a

muestras• Entender el teorema del limite central

y su importancia para describir poblaciones a partir de muestras

• Calcular normal estándar, área bajo curva normal e intervalos de confianza

Page 83: Introducción a inferencia básica

Ejercicio

• Consideren los datos de propiedades cercanas TransMilenio, recogidos entre el 2001 y el 2006.– Examinar los precios del suelo (price_000)

de propiedades ofrecidas en el 2002 y en el 2006 en la zona de intervencion

• Zona_int=1 &• Yr_2002 o yr_2006

Page 84: Introducción a inferencia básica

Ejercicio

• Para cada agno– Media– Mediana– Desv Estandar – Intervalo de confianza de 95% para la media

poblacional– Prueba de hipotesis de que los precios son

diferentes para los dos agnos