45
RESUMEN DE ALGUNOS CONCEPTOS ESTADÍSTICOS ELEMENTALES Y NOTACIÓN EMPLEADA EN EL CURSO 1 rojo 1 2 3 4 5 6 Supongamos que tenemos dos dados, uno rojo y otro verde, cada uno de los cuales toma valores entre 1 y 6 con igual probabilidad. Definiremos la variable aleatoria x como la suma de los valores que toman los dos dados. 2

Conceptos y notaciónpintos-clapes.webs.uvigo.es/docencia/Estadística y notación.pdf · densidad de probabilidad 55 60 65 70 75 Variables aleatorias continuas 56 x 0.05 0.05 Por

  • Upload
    others

  • View
    17

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Conceptos y notaciónpintos-clapes.webs.uvigo.es/docencia/Estadística y notación.pdf · densidad de probabilidad 55 60 65 70 75 Variables aleatorias continuas 56 x 0.05 0.05 Por

RESUMEN DE ALGUNOS CONCEPTOS ESTADÍSTICOS ELEMENTALES Y NOTACIÓN EMPLEADA EN EL CURSO

1

rojo 1 2 3 4 5 6

Supongamos que tenemos dos dados, uno rojo y otro verde, cada uno de los cuales toma valores entre 1 y 6 con igual probabilidad. Definiremos la variable aleatoria x como la suma de los valores que toman los dos dados.

2

Page 2: Conceptos y notaciónpintos-clapes.webs.uvigo.es/docencia/Estadística y notación.pdf · densidad de probabilidad 55 60 65 70 75 Variables aleatorias continuas 56 x 0.05 0.05 Por

Ejemplo de distribución de probabilidades: x es la suma de dos dados

Por ejemplo, en el dado rojo puede aparecer 4 y en el verde un 6

r 1 2 3 4 5 6 v

1

2

3

4

5

6 10

3

r 1 2 3 4 5 6 v

1

2

3

4

5 7

6

Ejemplo de distribución de probabilidades: x es la suma de dos dados

Igualmente, si el dado rojo es 2 y el verde 5, la suma es 7

4

Page 3: Conceptos y notaciónpintos-clapes.webs.uvigo.es/docencia/Estadística y notación.pdf · densidad de probabilidad 55 60 65 70 75 Variables aleatorias continuas 56 x 0.05 0.05 Por

r 1 2 3 4 5 6 v

1 2 3 4 5 6 7

2 3 4 5 6 7 8

3 4 5 6 7 8 9

4 5 6 7 8 9 10

5 6 7 8 9 10 11

6 7 8 9 10 11 12

Ejemplo de distribución de probabilidades: x es la suma de dos dados

Esta tabla muestra todos los posibles resultados, que van de 2 a 12.

5

r 1 2 3 4 5 6 v

1 2 3 4 5 6 7

2 3 4 5 6 7 8

3 4 5 6 7 8 9

4 5 6 7 8 9 10

5 6 7 8 9 10 11

6 7 8 9 10 11 12

x f 2 3 4 5 4 6 7 8 9

10 11 12

Ejemplo de distribución de probabilidades: x es la suma de dos dados

La frecuencia f es el número de veces que se repite un resultado

Por ejemplo, hay cuatro resultados que hacen x igual a 5 6

Page 4: Conceptos y notaciónpintos-clapes.webs.uvigo.es/docencia/Estadística y notación.pdf · densidad de probabilidad 55 60 65 70 75 Variables aleatorias continuas 56 x 0.05 0.05 Por

r 1 2 3 4 5 6 v

1 2 3 4 5 6 7

2 3 4 5 6 7 8

3 4 5 6 7 8 9

4 5 6 7 8 9 10

5 6 7 8 9 10 11

6 7 8 9 10 11 12

x f p 2 1 3 2 4 3 5 4 6 5 7 6 8 5 9 4

10 3 11 2 12 1

Ejemplo de distribución de probabilidades: x es la suma de dos dados

Finalmente, derivamos la probabilidad de obtener cada valor de x.

7

r 1 2 3 4 5 6 v

1 2 3 4 5 6 7

2 3 4 5 6 7 8

3 4 5 6 7 8 9

4 5 6 7 8 9 10

5 6 7 8 9 10 11

6 7 8 9 10 11 12

x f p 2 1 3 2 4 3 5 4 6 5 7 6 8 5 9 4

10 3 11 2 12 1

Ejemplo de distribución de probabilidades: x es la suma de dos dados

Hay 1/6 de probabilidad de obtener cada número del dado rojo y lo mismo para el dado verde. Por lo tanto, cada valor en la tabla ocurre con probabilidad 1/36.

8

Page 5: Conceptos y notaciónpintos-clapes.webs.uvigo.es/docencia/Estadística y notación.pdf · densidad de probabilidad 55 60 65 70 75 Variables aleatorias continuas 56 x 0.05 0.05 Por

r 1 2 3 4 5 6 v

1 2 3 4 5 6 7

2 3 4 5 6 7 8

3 4 5 6 7 8 9

4 5 6 7 8 9 10

5 6 7 8 9 10 11

6 7 8 9 10 11 12

x f p 2 1 1/36 3 2 2/36 4 3 3/36 5 4 4/36 6 5 5/36 7 6 6/36 8 5 5/36 9 4 4/36

10 3 3/36 11 2 2/36 12 1 1/36

Por lo tanto, para obtener las probabilidades asociadas a cada valor de x, se dividen las frecuencias por 36.

Ejemplo de distribución de probabilidades: x es la suma de dos dados

9

Ejemplo de distribución de probabilidades: x es la suma de dos dados

La distribución se muestra gráficamente.

6 __ 36

5 __ 36

4 __ 36

3 __ 36

2 __ 36

1 / 36

2 __ 36

3 __ 36

5 __ 36

4 __ 36

probabilidad

2 3 4 5 6 7 8 9 10 11 12 x

1 / 36

10

Page 6: Conceptos y notaciónpintos-clapes.webs.uvigo.es/docencia/Estadística y notación.pdf · densidad de probabilidad 55 60 65 70 75 Variables aleatorias continuas 56 x 0.05 0.05 Por

La definición de E(x), el valor esperado de x:

VALOR ESPERADO DE UNA VARIABLE ALEATORIA DISCRETA

El valor esperado de una variable aleatoria, conocido también como la media poblacional, es la suma ponderada de los valores que toma la variable aleatoria, donde los pesos son las probabilidades ligadas a esos valores.

Notación alternativa para E(x):

E(x) = µx

11

xi pi xi pi xi pi x1 p1 x1 p1 2 1/36 x2 p2 x2 p2 3 2/36 x3 p3 x3 p3 4 3/36 x4 p4 x4 p4 5 4/36 x5 p5 x5 p5 6 5/36 x6 p6 x6 p6 7 6/36 x7 p7 x7 p7 8 5/36 x8 p8 x8 p8 9 4/36 x9 p9 x9 p9 10 3/36 x10 p10 x10 p10 11 2/36 x11 p11 x11 p11 12 1/36

! xi pi = E(x)

Valor esperado de una variable aleatoria

En el caso de la variable x, definida como la suma de los dados verde y rojo, se adjunta a cada posible valor su probabilidad.

12

Page 7: Conceptos y notaciónpintos-clapes.webs.uvigo.es/docencia/Estadística y notación.pdf · densidad de probabilidad 55 60 65 70 75 Variables aleatorias continuas 56 x 0.05 0.05 Por

xi pi xi pi xi pi xi pi

x1 p1 x1 p1 2 1/36 2/36 x2 p2 x2 p2 3 2/36 6/36 x3 p3 x3 p3 4 3/36 12/36 x4 p4 x4 p4 5 4/36 20/36 x5 p5 x5 p5 6 5/36 30/36 x6 p6 x6 p6 7 6/36 42/36 x7 p7 x7 p7 8 5/36 40/36 x8 p8 x8 p8 9 4/36 36/36 x9 p9 x9 p9 10 3/36 30/36 x10 p10 x10 p10 11 2/36 22/36 x11 p11 x11 p11 12 1/36 12/36

! xi pi = E(x) 252/36 = 7

Por lo tanto, el valor esperado es 7. Este resultado era esperable si tenemos en cuenta que la distribución es simétrica en 7, como se vio en la transparencia del histograma

Valor esperado de una variable aleatoria

13

La definición de E[g(x)], no es más que :

Ejemplo:

Valor esperado de una función de una variable aleatoria

14

Page 8: Conceptos y notaciónpintos-clapes.webs.uvigo.es/docencia/Estadística y notación.pdf · densidad de probabilidad 55 60 65 70 75 Variables aleatorias continuas 56 x 0.05 0.05 Por

xi pi g(xi) g(xi ) pi xi pi xi2 xi

2 pi

x1 p1 g(x1) g(x1) p1 2 1/36 4 0.11 x2 p2 g(x2) g(x2) p2 3 2/36 9 0.50 x3 p3 g(x3) g(x3) p3 4 3/36 16 1.33 … … …... ……... 5 4/36 25 2.78 … … …... ……... 6 5/36 36 5.00 … … …... ……... 7 6/36 49 8.17 … … …... ……... 8 5/36 64 8.89 … … …... ……... 9 4/36 81 9.00 … … …... ……... 10 3/36 100 8.83 … … …... ……... 11 2/36 121 6.72 xn pn g(xn) g(xn) pn 12 1/36 144 4.00 " " " ! g(xi) pi 54.83

En nuestro ejemplo valor esperado de x2 es 54.83. Observar que no es igual a 7 elevado al cuadrado.

Es decir, E(x2) no es lo mismo que E(x) elevado al cuadrado

Valor esperado de una función de una variable aleatoria

15

1. E(x+y) = E(x) + E(y)

2. E(ax) = aE(x)

3. E(a) = a

Donde, x e y son variables aleatorias y a es una constante.

Las reglas del valor esperado

16

Page 9: Conceptos y notaciónpintos-clapes.webs.uvigo.es/docencia/Estadística y notación.pdf · densidad de probabilidad 55 60 65 70 75 Variables aleatorias continuas 56 x 0.05 0.05 Por

Dos variables aleatorias x e y se dicen independientes si

E[f(x)g(y)] = E[f(x)] E[g(y)]

para cualquier f(x) , g(y)

Caso particular: si x e y son independientes,

E(xy) = E(x) E(y)

Independencia de dos variables aleatorias

.

17

La varianza poblacional de x :

La varianza mide la dispersión de la distribución con respecto a la media de la población.

LA VARIANZA POBLACIONAL DE UNA VARIABLE ALEATORIA DISCRETA

18

Page 10: Conceptos y notaciónpintos-clapes.webs.uvigo.es/docencia/Estadística y notación.pdf · densidad de probabilidad 55 60 65 70 75 Variables aleatorias continuas 56 x 0.05 0.05 Por

xi pi xi-µ (xi-µ)2 (xi-µ)2 pi

2 1/36 -5 25 0.69 3 2/36 -4 16 0.89 4 3/36 -3 9 0.75 5 4/36 -2 4 0.44 6 5/36 -1 1 0.14 7 6/36 0 0 0.00 8 5/36 1 1 0.14 9 4/36 2 4 0.44

10 3/36 3 9 0.75 11 2/36 4 16 0.89 12 1/36 5 25 0.69

5.83

En nuestro ejemplo de los dados.

La varianza poblacional de una variable aleatoria discreta

19

Varianza poblacional de x : notación

pop.var(x)

La varianza poblacional de una variable aleatoria discreta

20

Page 11: Conceptos y notaciónpintos-clapes.webs.uvigo.es/docencia/Estadística y notación.pdf · densidad de probabilidad 55 60 65 70 75 Variables aleatorias continuas 56 x 0.05 0.05 Por

Desviación típica de x"

La varianza poblacional de una variable aleatoria discreta

21

2. VARIABLES ALEATORIAS CONTINUAS

Una variable aleatoria discreta sólo toma un conjunto finito de valores, con probabilidad positiva, como la suma del valor de dos dados.

6 __ 36

5 __ 36

4 __ 36

3 __ 36

2 __ 36

1 / 36

2 __ 36

3 __ 36

5 __ 36

4 __ 36

probabilidad

2 3 4 5 6 7 8 9 10 11 12 x

1 / 36

22

Page 12: Conceptos y notaciónpintos-clapes.webs.uvigo.es/docencia/Estadística y notación.pdf · densidad de probabilidad 55 60 65 70 75 Variables aleatorias continuas 56 x 0.05 0.05 Por

densidad de probabilidad

55 60 70 75 65

Variables aleatorias continuas

Sin embargo, la mayoría de las variables aleatorias en econometría son contInuas, como puede ser, por ejemplo, la temperatura en un cuarto, que puede tomar valores entre 55 y 75 grados Farenheit.

x

0.05

23

densidad de probabilidad

55 60 70 75 65

Variables aleatorias continuas

Observar que la probabilidad de que una variable continua tome un valor determinado es infinitamente pequeña (cero, en realidad). Por este motivo, la probabilidad de variables continuas se calcula para intervalos de valores de x. El área que corresponde a ese intervalo es la probabilidad del mismo.

x

0.05

24

Page 13: Conceptos y notaciónpintos-clapes.webs.uvigo.es/docencia/Estadística y notación.pdf · densidad de probabilidad 55 60 65 70 75 Variables aleatorias continuas 56 x 0.05 0.05 Por

densidad de probabilidad

55 60 70 75 65

Variables aleatorias continuas

56 x

0.05

0.05

Por ejemplo, la probabilidad de que la temperatura este entre 55 y 56 F es 0.05. Estamos considerando que todas las temperaturas son igual de probables, por lo que el área de todo el rectángulo es 1. Es decir, como la base es de 20 grados, la probabilidad de cada grado es 0.05 (0.05*20=1) 25

densidad de probabilidad

55 60 70 75 65

0.05

58 57

Variables aleatorias continuas

La probabilidad por unidad es el área del rectángulo definida por dicha unidad, es decir 0.05.

x

26

Page 14: Conceptos y notaciónpintos-clapes.webs.uvigo.es/docencia/Estadística y notación.pdf · densidad de probabilidad 55 60 65 70 75 Variables aleatorias continuas 56 x 0.05 0.05 Por

densidad de probabilidad

55 60 70 75 65

0.05

58 57

Variables aleatorias continuas

La probabilidad por intervalo unitario se llama densidad y es igual a la altura del intervalo unidad (dado que el área es base por altura)

Matemáticamente, la densidad se escribe como una función de la variable f(x).

f(x) = 0.05 para 55 x 75 f(x) = 0 para x < 55 o x > 75

x

27

55 60 70 75 x 65

0.05

58 57

Variables aleatorias continuas

El eje vertical se conoce como la densidad de probabilidad y la función de densidad, f(x), es la línea gruesa negra.

f(x)

f(x) = 0.05 si 55 x 75 f(x) = 0 si x < 55 y x > 75

28

Page 15: Conceptos y notaciónpintos-clapes.webs.uvigo.es/docencia/Estadística y notación.pdf · densidad de probabilidad 55 60 65 70 75 Variables aleatorias continuas 56 x 0.05 0.05 Por

55 60 70 75 x 65

0.05

Variables aleatorias continuas

densidad

f(x)

0.05

5

0.25

f(x) = 0.05 para 55 < x < 75 f(x) = 0 para x < 55 o x > 75

Supongamos que queremos calcular la probabilidad en el intervalo 65 y 70. Debemos calcular el área debajo de la densidad entre 65 y 70. 29

¿Cuál es la expresión de la esperanza y la varianza de una variable continua?

Investígalo.

30

Page 16: Conceptos y notaciónpintos-clapes.webs.uvigo.es/docencia/Estadística y notación.pdf · densidad de probabilidad 55 60 65 70 75 Variables aleatorias continuas 56 x 0.05 0.05 Por

Media poblacional de x: E(x) =µx

Lo que nos interesa ver aquí es cómo podemos escribir una variable aleatoria formada por dos componentes: una parte, la media, que sería el componente “fijo” y otra parte, que es lo que puede llamarse perturbación, que es el componente aleatorio puro.

LOS COMPONENTES FIJOS Y ALEATORIOS DE UNA VARIABLE ALEATORIA

31

Media poblacional de x: E(x) =µx

Para la observación i, el componente aleatorio está dado por ui = xi - µx

El valor observado de la variable x para el individuo i, por ejemplo, su salario, será en general distinto al valor medio µx. La diferencia no es la misma para todos los individuos, es decir, será aleatoria ui = xi - µx.

Los componentes fijos y aleatorios de una variable aleatoria

32

Page 17: Conceptos y notaciónpintos-clapes.webs.uvigo.es/docencia/Estadística y notación.pdf · densidad de probabilidad 55 60 65 70 75 Variables aleatorias continuas 56 x 0.05 0.05 Por

Media poblacional de x: E(x) =µx

Para la observación i, el componente aleatorio está dado por ui = xi - µx

Por tanto x podemos escribirla como la suma de dos componentes: xi = µx + ui

Los componentes fijos y aleatorios de una variable aleatoria

33

Media poblacional de x: E(x) =µx

Para la observación i, el componente aleatorio está dado por ui = xi - µx

Por tanto x, la podemos escribir como la suma de dos componentes : xi = µx + ui

Observar que el valor esperado de ui es cero:

E(ui) = E(xi - µx) = E(xi) + E(-µx) =µx - µx = 0

Los componentes fijos y aleatorios de una variable aleatoria

34

Page 18: Conceptos y notaciónpintos-clapes.webs.uvigo.es/docencia/Estadística y notación.pdf · densidad de probabilidad 55 60 65 70 75 Variables aleatorias continuas 56 x 0.05 0.05 Por

Estimadores y estimaciones:

•  Un estimador es una fórmula matemática.

•  Una estimación es un número que se obtiene de aplicar el estimador a los datos de una muestra concreta.

3. ESTIMADORES

Salvo en casos artificialmente simples, como el de los dados, no conoceremos la distribución de probabilidad o la función de densidad de la variable objeto de estudio. En consecuencia, tampoco conoceremos la media o la varianza poblacionales. Se trata, entonces, de obtener estimaciones a partir de una muestra de n observaciones. 35

Característica Poblacional Estimador

Media: µx

Varianza :

Estimadores

36

Page 19: Conceptos y notaciónpintos-clapes.webs.uvigo.es/docencia/Estadística y notación.pdf · densidad de probabilidad 55 60 65 70 75 Variables aleatorias continuas 56 x 0.05 0.05 Por

Los estimadores son variables aleatorias: veamos la media muestral como ejemplo:

Estimadores

37

La media muestral puede descomponerse en una parte fija y otra estocástica

Estimadores

38

Page 20: Conceptos y notaciónpintos-clapes.webs.uvigo.es/docencia/Estadística y notación.pdf · densidad de probabilidad 55 60 65 70 75 Variables aleatorias continuas 56 x 0.05 0.05 Por

Estimadores

De forma que no es más que la media de n valores fijos y n valores aleatorios.

39

Estimadores

Donde ! es la media de los términos aleatorios de la muestra.

40

Page 21: Conceptos y notaciónpintos-clapes.webs.uvigo.es/docencia/Estadística y notación.pdf · densidad de probabilidad 55 60 65 70 75 Variables aleatorias continuas 56 x 0.05 0.05 Por

Estimadores

Estos gráficos describen la densidad de x y x. Como se observó, ambos tienen el mismo componente fijo, pero la distribución de la media muestral está más concentrada.

Densidad de x

µx x µx x

Densidad de x

41

Estimadores

La diferencia está en el componente aleatorio de ambas variables. El componente aleatorio de la media muestral es menor que el de la variable original dado que es la media de los componentes aleatorios de todas las variables, y estos tienden a cancelarse.

Densidad de x

µx x µx x

Densidad de x

42

Page 22: Conceptos y notaciónpintos-clapes.webs.uvigo.es/docencia/Estadística y notación.pdf · densidad de probabilidad 55 60 65 70 75 Variables aleatorias continuas 56 x 0.05 0.05 Por

Insesgadez de x:

INSESGADEZ Y EFICIENCIA

Supongamos que queremos estimar la media poblacional µx de una variable aleatoria x dado un conjunto de n observaciones. Un estimador a utilizar es la media muestral. Demostraremos que es insesgado. 43

Insesgadez de x:

Insesgadez y Eficiencia

Es decir, el valor esperado de la media muestral es igual al parámetro poblacional que estamos buscando µx

44

Page 23: Conceptos y notaciónpintos-clapes.webs.uvigo.es/docencia/Estadística y notación.pdf · densidad de probabilidad 55 60 65 70 75 Variables aleatorias continuas 56 x 0.05 0.05 Por

Insesgadez de x :

Estimador General Z = !1x1 + !2x2

Insesgadez y Eficiencia

Sin embargo, la media muestral no es el único estimador insesgado de la media poblacional. Supongamos que tenemos únicamente dos observaciones y nos construimos un estimador general, Z 45

Insesgadez de x:

Estimador General Z = !1x1 + !2x2

Insesgadez y Eficiencia

El estimador general Z lo definimos como la suma ponderada de las dos observaciones que tenemos, donde los pesos son!1 y !2. Por ejemplo, en el caso de la media muestral los dos pesos son iguales a 1/n = 1/2 porque sólo tenemos dos observaciones. 46

Page 24: Conceptos y notaciónpintos-clapes.webs.uvigo.es/docencia/Estadística y notación.pdf · densidad de probabilidad 55 60 65 70 75 Variables aleatorias continuas 56 x 0.05 0.05 Por

Insesgadez de x:

Estimador General Z = !1x1 + !2x2

Insesgadez y Eficiencia

¿Cómo deben ser esos ponderadores para que el valor esperado del estimador sea igual a la media poblacional?

47

Insesgadez de x:

Estimador General Z = !1x1 + !2x2

Insesgadez y Eficiencia

48

Page 25: Conceptos y notaciónpintos-clapes.webs.uvigo.es/docencia/Estadística y notación.pdf · densidad de probabilidad 55 60 65 70 75 Variables aleatorias continuas 56 x 0.05 0.05 Por

Insesgadez de x:

Estimador General Z = !1x1 + !2x2

Insesgadez y Eficiencia

49

Insesgadez de x:

Estimador General Z = !1x1 + !2x2

Insesgadez y Eficiencia

Dado que las variables aleatorias son iid., su valor esperado es µx.

50

Page 26: Conceptos y notaciónpintos-clapes.webs.uvigo.es/docencia/Estadística y notación.pdf · densidad de probabilidad 55 60 65 70 75 Variables aleatorias continuas 56 x 0.05 0.05 Por

Insesgadez de x:

Estimador General Z = !1x1 + !2x2

Insesgadez y Eficiencia

Por lo tanto, cualquier estimador Z será un estimador insesgado de µ si la suma de los pesos de las observaciones es 1. Observar que existen infinitas combinaciones de los ponderadores que hacen que su suma sea igual a 1. 51

densidad

µx

estimator B

¿Cómo elegimos entre estimadores? Cuanto más preciso sea un estimador, es decir, cuanto menos incertidumbre nos transmita sobre el valor del parámetro, mejor será. La propiedad de eficiencia se refiere justamente a la precisión.

Insesgadez y Eficiencia

estimador A

52

Page 27: Conceptos y notaciónpintos-clapes.webs.uvigo.es/docencia/Estadística y notación.pdf · densidad de probabilidad 55 60 65 70 75 Variables aleatorias continuas 56 x 0.05 0.05 Por

densidad

µx

estimator B

De la densidad se observa que si bien los dos estimadores A y B son insesgados, el estimador B es más preciso, tiene menor varianza.

Insesgadez y Eficiencia

estimador A

53

Estimador General Z = !1x1 + !2x2

Insesgadez y Eficiencia

Analicemos la varianza poblacional del estimador general buscando definir los pesos que minimicen dicha varianza

54

Page 28: Conceptos y notaciónpintos-clapes.webs.uvigo.es/docencia/Estadística y notación.pdf · densidad de probabilidad 55 60 65 70 75 Variables aleatorias continuas 56 x 0.05 0.05 Por

Estimador General Z = !1x1 + !2x2

Insesgadez y Eficiencia

Es decir, si tenemos dos observaciones, cada observación la debemos ponderar por un medio para obtener el estimador insesgado de menor varianza. Pero ponderar por un medio es justamente definir el estimador Z como la media muestral. 55

CONFLICTO ENTRE VARIANZA MÍNIMA E INSESGADEZ

Supongamos que tenemos dos estimadores alternativos para estimar ", uno que es insesgado y el otro que es sesgado pero con varianza menor que el primero: ¿cuál de los dos elegimos?

densidad

"

estimador B

estimador A

56

Page 29: Conceptos y notaciónpintos-clapes.webs.uvigo.es/docencia/Estadística y notación.pdf · densidad de probabilidad 55 60 65 70 75 Variables aleatorias continuas 56 x 0.05 0.05 Por

Conflicto entre varianza mínima e insesgadez

Una forma para decidir entre uno y otro es definirse una función de pérdida y decidir en función de la pérdida mayor o menor: es decir, nos quedaremos con aquél que tenga menor pérdida.

error (positiva) error (negativa)

pérdida

57

Conflicto entre varianza mínima e insesgadez

Una función muy utilizada es la que se conoce como el “error cuadrático medio” (mean squared error MSE), que se define como el valor esperado del cuadrado de las desviaciones del estimador y el parámetro poblacional.

densidad

"

58

Page 30: Conceptos y notaciónpintos-clapes.webs.uvigo.es/docencia/Estadística y notación.pdf · densidad de probabilidad 55 60 65 70 75 Variables aleatorias continuas 56 x 0.05 0.05 Por

Conflicto entre varianza mínima e insesgadez

El error cuadrático medio puede escribirse como la suma del sesgo al cuadrado más la varianza: es decir, combina el conflicto entre varianza y sesgo en un solo indicador. Supongamos que el sesgo del estimador Bcon respecto a µZ es el que aparece en el gráfico.

" µZ

sesgo

densidad

59

Conflicto entre varianza mínima e insesgadez

" µZ

sesgo

Se puede demostrar que el MSE es igual a la suma de la varianza poblacional más el sesgo al cuadrado.

densidad

60

Page 31: Conceptos y notaciónpintos-clapes.webs.uvigo.es/docencia/Estadística y notación.pdf · densidad de probabilidad 55 60 65 70 75 Variables aleatorias continuas 56 x 0.05 0.05 Por

Conflicto entre varianza mínima e insesgadez

¿Cómo elegiremos entre ambos estimadores? Buscando aquel que tenga menor MSE.

densidad

"

estimador B

estimador A

61

n #x 1 50

La media muestral es un estimador de la media poblacional ¿qué pasa cuando la muestra crece?

densidad de x

50 100 150 200

n = 1

EFECTO DE UN AUMENTO DEL TAMAÑO MUESTRAL

0.08

0.04

0.02

0.06

62

Page 32: Conceptos y notaciónpintos-clapes.webs.uvigo.es/docencia/Estadística y notación.pdf · densidad de probabilidad 55 60 65 70 75 Variables aleatorias continuas 56 x 0.05 0.05 Por

n #x 1 50

Supongamos que x tiene media poblacional 100 y desviación típica 50. Supongamos, además, que no conocemos esta media y que queremos estimarla

densidad de x

50 100 150 200

n = 1

Efecto de un aumento del tamaño muestral

0.08

0.04

0.02

0.06

63

n #x 1 50

De las propiedades de la media muestral, sabemos que su media coincide con la media poblacional, que es insesgada y que su desviación típica será igual a la desviación típica poblacional dividida por la raíz cuadrada del número de observaciones

densidad de x

50 100 150 200

n = 1

Efecto de un aumento del tamaño muestral

0.08

0.04

0.02

0.06

Page 33: Conceptos y notaciónpintos-clapes.webs.uvigo.es/docencia/Estadística y notación.pdf · densidad de probabilidad 55 60 65 70 75 Variables aleatorias continuas 56 x 0.05 0.05 Por

n #x 1 50

Por tanto, cuanto mayor sea n, menor será la varianza de la media muestral.

densidad de x

50 100 150 200

n = 1

Efecto de un aumento del tamaño muestral

0.08

0.04

0.02

0.06

65

n #x 1 50 4 25

25 10 100 5

densidad de x

50 100 150 200

0.08

0.04

n = 100

Efecto de un aumento del tamaño muestral

0.02

0.06

66

Page 34: Conceptos y notaciónpintos-clapes.webs.uvigo.es/docencia/Estadística y notación.pdf · densidad de probabilidad 55 60 65 70 75 Variables aleatorias continuas 56 x 0.05 0.05 Por

n #x 1 50 4 25

25 10 100 5

1000 1.6 5000 0.7

En el límite, la desviación típica de la media muestral tiende a cero, por lo que la media muestral tenderá, en el límite, a la media poblacional: consistencia.

densidad de x

50 100 150 200

n = 5000

Efecto de un aumento del tamaño muestral

0.8

0.4

0.2

0.6

67

Muestra Finita: x es un estimador insesgado de µ

Efecto de un aumento del tamaño muestral

La insesgadez es un concepto de muestras finitas. El valor esperado de la media muestral es igual a su valor poblacional. Pero ¡ojo! el valor real que toma la media muestral puede no coindicir con la media poblacional. 68

Page 35: Conceptos y notaciónpintos-clapes.webs.uvigo.es/docencia/Estadística y notación.pdf · densidad de probabilidad 55 60 65 70 75 Variables aleatorias continuas 56 x 0.05 0.05 Por

Muestra Finita: x es un estimador insesgado de µ

Muestra grande: la distribución de x colapsa en µ

plim x = µ

Efecto de un aumento del tamaño muestral

La consistencia es un concepto de muestras grandes. Un estimador consistente es más preciso a medida que el tamaño de la muestra aumenta.

69

7

EJEMPLO DE UN ESTIMADOR SESGADO PERO CONSISTENTE

Es posible que un estimador sea sesgado en muestras pequeñas pero consistente.

n = 20

Z "$

densidad de Z

70

Page 36: Conceptos y notaciónpintos-clapes.webs.uvigo.es/docencia/Estadística y notación.pdf · densidad de probabilidad 55 60 65 70 75 Variables aleatorias continuas 56 x 0.05 0.05 Por

7

Ejemplo de un estimador sesgado pero consistente

Sea Z un estimador de la característica poblacional ". Mirando a la densidad de Z, se observa que sobreestima el valor del parámetro, es decir, tiene un sesgo positivo

n = 20

"$

densidad de Z

Z

71

7

n = 100

Para que el estimador sea consistente, deben pasar dos cosas cuando la muestra aumenta. El sesgo debe disminuir.

n = 20

Ejemplo de un estimador sesgado pero consistente

"$ Z

72

Page 37: Conceptos y notaciónpintos-clapes.webs.uvigo.es/docencia/Estadística y notación.pdf · densidad de probabilidad 55 60 65 70 75 Variables aleatorias continuas 56 x 0.05 0.05 Por

7

n = 100

y la densidad debe colapsar en el parámetro.

n = 1000

n = 20

Ejemplo de un estimador sesgado pero consistente

"$ Z

73

7

n = 1000

n = 100000

n = 100

Ejemplo de un estimador sesgado pero consistente

"$ Z

74

Page 38: Conceptos y notaciónpintos-clapes.webs.uvigo.es/docencia/Estadística y notación.pdf · densidad de probabilidad 55 60 65 70 75 Variables aleatorias continuas 56 x 0.05 0.05 Por

RELACIONES ENTRE VARIABLES

¿Cómo podemos inferir si existe una relación entre dos variables económicas a partir de los estadísticos covarianza y correlación?

75

COVARIANZA POBLACIONAL

La covarianza poblacional de dos variables aleatorias es el valor esperado del producto de sus desviaciones con respecto a la media

La covarianza poblacional: #XY =E((X-µX) (Y-µY))

76

Page 39: Conceptos y notaciónpintos-clapes.webs.uvigo.es/docencia/Estadística y notación.pdf · densidad de probabilidad 55 60 65 70 75 Variables aleatorias continuas 56 x 0.05 0.05 Por

Covarianza Poblacional

Si X sonY indeptes, #XY = 0

77

COVARIANZA MUESTRAL

Dada una muestra de n observaciones de dos variables, X, Y, la covarianza muestral no es más que la media del producto de sus desviaciones con respecto a la media muestral.

78

Page 40: Conceptos y notaciónpintos-clapes.webs.uvigo.es/docencia/Estadística y notación.pdf · densidad de probabilidad 55 60 65 70 75 Variables aleatorias continuas 56 x 0.05 0.05 Por

La covarianza muestral es un estimador sesgado de la covarianza poblacional

79

1. Si Y = V + W,

Cov(X, Y) = Cov(X, V) + Cov(X, W)

2. Si Y = aZ, donde a es constante,

Cov(X, Y) = Cov(X, aZ) = aCov(X, Z)

Ejemplo: Cov(X, 3Z) = 3Cov(X, Z)

3. Si Y = a, donde a es constante,

Cov(X, Y) = Cov(X, a) = 0

Ejemplo: Cov(X, 10) = 0

Reglas de la covarianza

80

Page 41: Conceptos y notaciónpintos-clapes.webs.uvigo.es/docencia/Estadística y notación.pdf · densidad de probabilidad 55 60 65 70 75 Variables aleatorias continuas 56 x 0.05 0.05 Por

D

EXPRESIONES ALTERNATIVAS DE LA COVARIANZA

#XY =E((X-µX) (Y-µY))=E(XY)- µX µY

POBLACIONAL

MUESTRAL

81

RELACIÓN ENTRE LA VARIANZA Y LA COVARIANZA

La varianza de una variable aleatoria no es más que la covarianza de dicha variable respecto a sí misma

82

Page 42: Conceptos y notaciónpintos-clapes.webs.uvigo.es/docencia/Estadística y notación.pdf · densidad de probabilidad 55 60 65 70 75 Variables aleatorias continuas 56 x 0.05 0.05 Por

Por tanto, las reglas de la varianza se pueden deducir a partir

de las reglas de la covarianza

83

Regla 1: Si Y = V + W, Var(Y) = Var(V) + Var(W) + 2Cov(V, W)

Prueba:

Var(Y) = Cov(Y, Y) = Cov(Y, [V + W]) = Cov(Y, V) + Cov(Y, W) = Cov([V + W], V) + Cov([V + W], W) = Cov(V, V) + Cov(W, V) + Cov(V, W) + Cov(W, W) = Var(V) + Var(W) + 2Cov(V, W)

84

Page 43: Conceptos y notaciónpintos-clapes.webs.uvigo.es/docencia/Estadística y notación.pdf · densidad de probabilidad 55 60 65 70 75 Variables aleatorias continuas 56 x 0.05 0.05 Por

Regla 2: Si Y = bZ, donde b es constante, Var(Y) = b2Var(Z)

Prueba:

Var(Y) = Cov(Y, Y) = Cov(Y, bZ) = bCov(Y, Z) = bCov(bZ, Z) = b2Cov(Z, Z) = b2Var(Z)

85

Regla 3: Si Y = b, donde b es constante, Var(Y) = 0

Prueba:

Var(Y) = Cov(Y, Y) = Cov(b, b) = 0

86

Page 44: Conceptos y notaciónpintos-clapes.webs.uvigo.es/docencia/Estadística y notación.pdf · densidad de probabilidad 55 60 65 70 75 Variables aleatorias continuas 56 x 0.05 0.05 Por

Regla 4: Si Y = V + b, donde b es constante, Var(Y) = Var(V)

Prueba:

Var(Y) = Var(V + b) = Var(V) + Var(b) + 2Cov(V, b) = Var(V)

0

0 V + b

V

Sumar una constante sólo tiene un efecto de traslación: la varianza no cambiará y la media se verá desplazada por la constante de la traslación.

87

COEFICIENTE DE CORRELACIÓN

Coef. Correlación Poblacional

Coef. Correlación Muestral

88

Page 45: Conceptos y notaciónpintos-clapes.webs.uvigo.es/docencia/Estadística y notación.pdf · densidad de probabilidad 55 60 65 70 75 Variables aleatorias continuas 56 x 0.05 0.05 Por

Coeficiente de Correlación

¿Por qué el coeficiente de correlación es mucho mejor que la covarianza como mediada de la asociación entre dos variables? Por que la covarianza depende de las unidades en las que las variables están medidas, mientras que el coeficiente de correlación no.

89