25
1 Vectores Aleatorios Ejemplo Al terminar la secundaria se toman dos pruebas a todos los alumnos. Sean X = nota obtenida por un alumno en la prueba de matem´ atica Y = nota obtenida por un alumno en la prueba de lengua Ambas variables se miden en el mismo alumno En general, Definicion A1 Diremos que (X , Y ) es un vector aleatorio si es una funci´ on del espacio muestral asociado a un experimento Ω en R 2 . ¿C´ omo podemos exhibir la informaci´ on simult´ anea de ambas variables? Estad´ ıstica (Q), FCEN (M. E. Szretter) September 5, 2019 1 / 25

Vectores Aleatorioscms.dm.uba.ar/.../estadisticaQ/vectoresycovarianza.pdf · 2019-09-05 · 3 Vectores Aleatorios: a partir de la conjunta Observemos que la funci on de frecuencia

  • Upload
    others

  • View
    6

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Vectores Aleatorioscms.dm.uba.ar/.../estadisticaQ/vectoresycovarianza.pdf · 2019-09-05 · 3 Vectores Aleatorios: a partir de la conjunta Observemos que la funci on de frecuencia

1

Vectores Aleatorios

Ejemplo

Al terminar la secundaria se toman dos pruebas a todos los alumnos. Sean

X = nota obtenida por un alumno en la prueba de matematica

Y = nota obtenida por un alumno en la prueba de lengua

Ambas variables se miden en el mismo alumno

En general,

Definicion A1

Diremos que (X ,Y ) es un vector aleatorio si es una funcion del espaciomuestral asociado a un experimento Ω en R2.

¿Como podemos exhibir la informacion simultanea de ambas variables?

Estadıstica (Q), FCEN (M. E. Szretter) September 5, 2019 1 / 25

Page 2: Vectores Aleatorioscms.dm.uba.ar/.../estadisticaQ/vectoresycovarianza.pdf · 2019-09-05 · 3 Vectores Aleatorios: a partir de la conjunta Observemos que la funci on de frecuencia

2

Vectores Aleatorios: funcion de probabilidad conjunta

Por simplicidad, supongamos que hay 3 posibles notas de matematica(0,5,10) y cuatro notas de lengua (0,4,7,10)

X = nota matem

0 5 10

0 0.12 0.05 0.03Y = nota 4 0.10 0.15 0.05

lengua 7 0.05 0.25 0.1010 0.03 0.05 0.02

Esta tabla que se conoce como la funcion de probabilidad conjunta deX e Y se lee del siguiente modo:

pXY (5, 7) = 0.25

En general tendremos definida pXY (j , k) para todo j ∈ Rg(X ), k ∈ Rg(Y ).

Estadıstica (Q), FCEN (M. E. Szretter) September 5, 2019 2 / 25

Page 3: Vectores Aleatorioscms.dm.uba.ar/.../estadisticaQ/vectoresycovarianza.pdf · 2019-09-05 · 3 Vectores Aleatorios: a partir de la conjunta Observemos que la funci on de frecuencia

3

Vectores Aleatorios: a partir de la conjunta

Observemos que la funcion de frecuencia de cada una de las variablespuede obtenerse a partir de la funcion de probabilidad conjunta. En elejemplo:

X = nota matem

0 5 10

0 0.12 0.05 0.03Y = nota 4 0.10 0.15 0.05

lengua 7 0.05 0.25 0.1010 0.03 0.05 0.02

pY (7) = P(Y = 7)

pY (7) = P (X = 0 ∩ Y = 7) + P (X = 5 ∩ Y = 7)+ P (X = 10 ∩ Y = 7)= 0.05 + 0.25 + 0.10 = 0.40

Estadıstica (Q), FCEN (M. E. Szretter) September 5, 2019 3 / 25

Page 4: Vectores Aleatorioscms.dm.uba.ar/.../estadisticaQ/vectoresycovarianza.pdf · 2019-09-05 · 3 Vectores Aleatorios: a partir de la conjunta Observemos que la funci on de frecuencia

4

Vectores Aleatorios: a partir de la conjunta

En general, dejamos k fijo y sumamos en j para obtener

pY (k) =∑

j∈Rg(X )

pXY (j , k), para todo k ∈ Rg(Y ).

Luegok X = nota matem pY (k)

0 5 10

0 0.12 0.05 0.03 0.20Y = nota 4 0.10 0.15 0.05 0.30

lengua 7 0.05 0.25 0.10 0.4010 0.03 0.05 0.02 0.10

Estadıstica (Q), FCEN (M. E. Szretter) September 5, 2019 4 / 25

Page 5: Vectores Aleatorioscms.dm.uba.ar/.../estadisticaQ/vectoresycovarianza.pdf · 2019-09-05 · 3 Vectores Aleatorios: a partir de la conjunta Observemos que la funci on de frecuencia

5

Vectores Aleatorios: a partir de la conjunta

Analogamente se obtiene la pX ,

pX (j) =∑

k∈Rg(Y )

pXY (j , k), para j ∈ Rg(X )

k X = nota matem pY (k)

0 5 10

0 0.12 0.05 0.03 0.20Y = nota 4 0.10 0.15 0.05 0.30

lengua 7 0.05 0.25 0.10 0.4010 0.03 0.05 0.02 0.10

pX (j) 0.30 0.50 0.20 1

Se las suele llamar “frecuencias marginales”porque se las puede escribir aambos margenes de la tabla de densidad conjunta.

Estadıstica (Q), FCEN (M. E. Szretter) September 5, 2019 5 / 25

Page 6: Vectores Aleatorioscms.dm.uba.ar/.../estadisticaQ/vectoresycovarianza.pdf · 2019-09-05 · 3 Vectores Aleatorios: a partir de la conjunta Observemos que la funci on de frecuencia

6

Vectores Aleatorios: a partir de la conjunta

A partir de estas funciones de frecuencia se pueden calcular los valoresesperados y las varianzas de ambas variables.

X = nota matem

j 0 5 10

pX (j) 0.30 0.50 0.20

E (X ) = 0 · 0.30 + 5 · 0.50 + 10 · 0.20 = 4.5

E (X 2) = 02 · 0.30 + 52 · 0.50 + 102 · 0.20 = 32.5

Var(X ) = E (X 2)− E (X )2 = 32.5− 20.25 = 12.25

E (Y ) = 0 · 0.20 + 4 · 0.30 + 7 · 0.40 + 10 · 0.10 = 5

E (Y 2) = 02 · 0.20 + 42 · 0.30 + 72 · 0.40 + 102 · 0.10 = 34.4

Var(Y ) = E (Y 2)− E (Y )2 = 34.4− 25 = 9.4

Estadıstica (Q), FCEN (M. E. Szretter) September 5, 2019 6 / 25

Page 7: Vectores Aleatorioscms.dm.uba.ar/.../estadisticaQ/vectoresycovarianza.pdf · 2019-09-05 · 3 Vectores Aleatorios: a partir de la conjunta Observemos que la funci on de frecuencia

7

Vectores Aleatorios: resumamos asociacion

¿Como resumimos la asociacion entre dos variables aleatorias X e Y ?

La primera posibilidad es generalizar la nocion de independencia deeventos.

Definicion A2

Decimos que las variables aleatorias X e Y son independientes si

P(X ∈ A ∩ Y ∈ B) = P(X ∈ A) · P(Y ∈ B)

para todo A y B.

Estadıstica (Q), FCEN (M. E. Szretter) September 5, 2019 7 / 25

Page 8: Vectores Aleatorioscms.dm.uba.ar/.../estadisticaQ/vectoresycovarianza.pdf · 2019-09-05 · 3 Vectores Aleatorios: a partir de la conjunta Observemos que la funci on de frecuencia

8

Vectores Aleatorios Discretos: independencia

En el caso de que ambas variables aleatorias sean discretas, basta verificarmenos.

Teorema A3

Decimos que las variables aleatorias discretas X e Y son independientes si

P(X = j ∩ Y = k) = P(X = j) · P(Y = k)

para todo j ∈ Rg(X ) y k ∈ Rg(Y ). O sea, si

pXY (j , k) = pX (j) · pY (k), para todo j ∈ Rg(X ) y k ∈ Rg(Y )

Estadıstica (Q), FCEN (M. E. Szretter) September 5, 2019 8 / 25

Page 9: Vectores Aleatorioscms.dm.uba.ar/.../estadisticaQ/vectoresycovarianza.pdf · 2019-09-05 · 3 Vectores Aleatorios: a partir de la conjunta Observemos que la funci on de frecuencia

9

Vectores Aleatorios Discretos: independencia

Pero a veces no tenemos tanta suerte con las variables aleatorias. En elcaso de las pruebas, por ejemplo, tenemos:

pXY (5, 4) = 0.15

pX (5) · pY (4) = 0.50 · 0.30 = 0.15

k X = nota matem pY (k)

0 5 10

0 0.12 0.05 0.03 0.20Y = nota 4 0.10 0.15 0.05 0.30

lengua 7 0.05 0.25 0.10 0.4010 0.03 0.05 0.02 0.10

pX (j) 0.30 0.50 0.20 1

Esto no prueba la independencia entre las variables. Para probarla,deberıamos verificar la igualdad para todo casillero de la tabla, porejemplo, tenemos pXY (5, 7) = 0.25

Estadıstica (Q), FCEN (M. E. Szretter) September 5, 2019 9 / 25

Page 10: Vectores Aleatorioscms.dm.uba.ar/.../estadisticaQ/vectoresycovarianza.pdf · 2019-09-05 · 3 Vectores Aleatorios: a partir de la conjunta Observemos que la funci on de frecuencia

10

Vectores Aleatorios Discretos: independencia

¿Son X e Y independientes?

pXY (5, 7) = 0.25

pX (5) · pY (7) = 0.50 · 0.40 = 0.20

Como son diferentes, resulta que las notas de matematica y lengua no sonvariables aleatorias independientes.

Cabe la pregunta inversa. A partir de pX y de pY , ¿puede reconstruirse lafuncion de probabilidad conjunta pXY ?

Respuesta: Solo en el caso en el que las variables X e Y seanindependientes.

Estadıstica (Q), FCEN (M. E. Szretter) September 5, 2019 10 / 25

Page 11: Vectores Aleatorioscms.dm.uba.ar/.../estadisticaQ/vectoresycovarianza.pdf · 2019-09-05 · 3 Vectores Aleatorios: a partir de la conjunta Observemos que la funci on de frecuencia

11

Vectores Aleatorios: resumimos asociacion

¿Que otra relacion entre las variables X e Y podrıamos tratar dedescribir/resumir? Primero, vamos a proponer herramientas parecidas a lasque vimos para una sola variable.

Definimos la esperanza de una funcion g(X ,Y ) del siguiente modo:

E [g(X ,Y )] =∑

j :j∈Rg(X )

∑k:k∈Rg(Y )

g(j , k) pXY (j , k) ,

para toda g : R2 → R.

Si el vector tuviera ambas variables continuas, definirıamos una funcion dedensidad conjunta y las esperanzas de funciones del vector aleatoriocontinuo se obtendrıan integrando la densidad conjunta, no sumando.

Estadıstica (Q), FCEN (M. E. Szretter) September 5, 2019 11 / 25

Page 12: Vectores Aleatorioscms.dm.uba.ar/.../estadisticaQ/vectoresycovarianza.pdf · 2019-09-05 · 3 Vectores Aleatorios: a partir de la conjunta Observemos que la funci on de frecuencia

12

Esperanza de una funcion g

E [g(X ,Y )] =∑

j :j∈Rg(X )

∑k:k∈Rg(Y )

g(j , k) pXY (j , k) ,

En particular

E [XY ] =∑

j :j∈Rg(X )

∑k:k∈Rg(Y )

jk pXY (j , k) , (1)

Estadıstica (Q), FCEN (M. E. Szretter) September 5, 2019 12 / 25

Page 13: Vectores Aleatorioscms.dm.uba.ar/.../estadisticaQ/vectoresycovarianza.pdf · 2019-09-05 · 3 Vectores Aleatorios: a partir de la conjunta Observemos que la funci on de frecuencia

13

Esperanza de una suma de variables aleatorias

E [g(X ,Y )] =∑

j :j∈Rg(X )

∑k:k∈Rg(Y )

g(j , k) pXY (j , k) ,

E [X + Y ] =∑

j :j∈Rg(X )

∑k:k∈Rg(Y )

(j + k) pXY (j , k)

=∑

j∈Rg(X )

∑k∈Rg(Y )

j pXY (j , k) +∑

j∈Rg(X )

∑k∈Rg(Y )

k pXY (j , k)

=∑

j∈Rg(X )

j∑

k∈Rg(Y )

pXY (j , k)

︸ ︷︷ ︸pX (j)

+∑

k∈Rg(Y )

k∑

j∈Rg(X )

pXY (j , k)

︸ ︷︷ ︸pY (k)

=∑

j∈Rg(X )

jpX (j) +∑

k∈Rg(Y )

kpY (k)

= E [X ] + E [Y ]

Estadıstica (Q), FCEN (M. E. Szretter) September 5, 2019 13 / 25

Page 14: Vectores Aleatorioscms.dm.uba.ar/.../estadisticaQ/vectoresycovarianza.pdf · 2019-09-05 · 3 Vectores Aleatorios: a partir de la conjunta Observemos que la funci on de frecuencia

14

Esperanza de una suma de variables aleatorias

E [X + Y ] = E [X ] + E [Y ] (2)

Mas aun,

E [a · X + b · Y + c] = a · E [X ] + b · E [Y ] + c (3)

Lo que se conoce como linealidad de la esperanza. Observemos que esdistinto de lo que tenıamos antes, pues en este caso estan involucradas dosvariables aleatorias.

Estadıstica (Q), FCEN (M. E. Szretter) September 5, 2019 14 / 25

Page 15: Vectores Aleatorioscms.dm.uba.ar/.../estadisticaQ/vectoresycovarianza.pdf · 2019-09-05 · 3 Vectores Aleatorios: a partir de la conjunta Observemos que la funci on de frecuencia

15

Varianza de una suma de variables aleatorias

Si llamamos µX = E (X ) y µY = E (Y ), resulta

Var(X + Y ) = Var(X ) + Var(Y ) + 2 [E (XY )− µX · µY ]

A este tercer sumando (exceptuando el factor 2) se lo llama la covarianzaentre X e Y . Observemos que la covarianza es de la forma E (g(X ,Y )) .

Definicion A4

Sea (X ,Y ) un vector aleatorio, y llamemos µX = E (X ) y µY = E (Y ).Definimos la covarianza entre X e Y al numero

cov(X ,Y ) = E ([X − µX ] · [Y − µY ]).

La formula reducida es

cov(X ,Y ) = E (XY )− E (X ) · E (Y ).

Tarea: probarloEstadıstica (Q), FCEN (M. E. Szretter) September 5, 2019 15 / 25

Page 16: Vectores Aleatorioscms.dm.uba.ar/.../estadisticaQ/vectoresycovarianza.pdf · 2019-09-05 · 3 Vectores Aleatorios: a partir de la conjunta Observemos que la funci on de frecuencia

16

Calculamos la covarianza en el ejemplo

X = nota matem

0 5 10

0 0.12 0.05 0.03Y = nota 4 0.10 0.15 0.05

lengua 7 0.05 0.25 0.1010 0.03 0.05 0.02

E [XY ] =∑

j :j∈Rg(X )

∑k:k∈Rg(Y )

jk pXY (j , k)

= 0 · (0.12 + 0.05 + 0.03 + 0.10) + 5 · 4 · 0.15 + · · ·= 25.25

cov(X ,Y ) = E (XY )− E (X ) · E (Y ) = 25.25− 5 · 4.5 = 2.75

Estadıstica (Q), FCEN (M. E. Szretter) September 5, 2019 16 / 25

Page 17: Vectores Aleatorioscms.dm.uba.ar/.../estadisticaQ/vectoresycovarianza.pdf · 2019-09-05 · 3 Vectores Aleatorios: a partir de la conjunta Observemos que la funci on de frecuencia

17

¿Que significa? Podemos interpretar el signo

Aunque hay estudiantes a los que les va mucho mejor en una prueba queen otra, podrıa ser razonable esperar que a un estudiante que le va muybien en una prueba le ira en la otra al menos un poco mejor que alpromedio. Nos gustarıa encontrar un resumen numerico (una cuenta) de ladistribucion conjunta de X e Y que refleje el grado de asociacion que tieneuna variable con la otra. Queremos que dicho numero sea positivo sipensamos que cuando el valor de X en un individuo supera al promedio delas X , entonces es mas probable que el valor de Y en ese individuotambien supere al valor promedio de Y . En tal caso diremos que X e Yestan positivamente asociadas (pensar en cantidad de calorıasconsumidas diariamente y peso de una persona elegida al azar, o cantidadde horas dedicadas al estudio y nota en el examen), si pasa lo contrario(pensar horas de ejercicio realizado en una semana y peso de una persona,o bien horas dedicadas a jugar a la play y nota en el examen) diremos queestan negativamente asociadas.

Estadıstica (Q), FCEN (M. E. Szretter) September 5, 2019 17 / 25

Page 18: Vectores Aleatorioscms.dm.uba.ar/.../estadisticaQ/vectoresycovarianza.pdf · 2019-09-05 · 3 Vectores Aleatorios: a partir de la conjunta Observemos que la funci on de frecuencia

18

Ejemplo: Funcion de probabilidad conjunta

Mate

02

4

6

8

10

Lengua

02

4

6

8

10

Prob conjunta

0.00

0.05

0.10

0.15

0.20

0.25

0.05

0.10

0.15

0.20

0.25

Estadıstica (Q), FCEN (M. E. Szretter) September 5, 2019 18 / 25

Page 19: Vectores Aleatorioscms.dm.uba.ar/.../estadisticaQ/vectoresycovarianza.pdf · 2019-09-05 · 3 Vectores Aleatorios: a partir de la conjunta Observemos que la funci on de frecuencia

19

Ejemplo: Funcion de probabilidad conjuntaCon las rectas x = µX e y = µY en rojo

Mate

02

4

6

8

10

Lengua

02

4

6

8

10

Prob conjunta

0.00

0.05

0.10

0.15

0.20

0.25

0.05

0.10

0.15

0.20

0.25

0.05

0.10

0.15

0.20

0.25

0.05

0.10

0.15

0.20

0.25

0.05

0.10

0.15

0.20

0.25

0.05

0.10

0.15

0.20

0.25

Estadıstica (Q), FCEN (M. E. Szretter) September 5, 2019 19 / 25

Page 20: Vectores Aleatorioscms.dm.uba.ar/.../estadisticaQ/vectoresycovarianza.pdf · 2019-09-05 · 3 Vectores Aleatorios: a partir de la conjunta Observemos que la funci on de frecuencia

20

Codigo en R para los graficos

require(plot3D)

conj<-c(12,5,3,10,15,5,5,25,10,3,5,2)/100

matem<-rep(c(0,5,10),4)

lengua<-c(rep(0,3),rep(4,3),rep(7,3),rep(10,3))

scatter3D(matem, lengua,conj,type="h",lwd=4,xlab="Mate",

ylab = "Lengua", zlab ="Prob conjunta",ticktype = "detailed" ,bty = "g",

cex.lab= 1,theta = 140, phi = 10,zlim=c(0,0.25))

scatter3D(4.5,5,0,type="h",lwd=6,col="darkred",add=T)

scatter3D(c(4.5,4.5),c(-0.5,10),c(0,0),type="l",lwd=6,col="red",add=T)

scatter3D(c(0,10),c(5,5),c(0,0),type="l",lwd=6,col="red",add=T)

scatter3D(4.5,5,0,type="h",lwd=6,col="darkred",add=T,pch=10)

Estadıstica (Q), FCEN (M. E. Szretter) September 5, 2019 20 / 25

Page 21: Vectores Aleatorioscms.dm.uba.ar/.../estadisticaQ/vectoresycovarianza.pdf · 2019-09-05 · 3 Vectores Aleatorios: a partir de la conjunta Observemos que la funci on de frecuencia

21

Propiedades de la varianza y covarianza

Teorema A5

Si X e Y son independientes, entonces

E [XY ] = E [X ] · E [Y ]

y por lo tanto,Cov(X ,Y ) = 0.

En tal caso,

1 Var(X − Y ) = Var(X ) + Var(Y )

2 Var(X + Y ) = Var(X ) + Var(Y )

Estadıstica (Q), FCEN (M. E. Szretter) September 5, 2019 21 / 25

Page 22: Vectores Aleatorioscms.dm.uba.ar/.../estadisticaQ/vectoresycovarianza.pdf · 2019-09-05 · 3 Vectores Aleatorios: a partir de la conjunta Observemos que la funci on de frecuencia

22

Propiedades de la varianza y covarianza

Demostracion:

E [XY ] =∑

j :j∈Rg(X )

∑k:k∈Rg(Y )

jk pXY (j , k)

=︸︷︷︸por indep

∑j∈Rg(X )

∑k∈Rg(Y )

jk pX (j) · pY (k)

=∑

j∈Rg(X )

j pX (j)

︸ ︷︷ ︸E(X )

∑k∈Rg(Y )

kpY (k)

︸ ︷︷ ︸E(Y )

= E (X ) · E (Y ) .

Estadıstica (Q), FCEN (M. E. Szretter) September 5, 2019 22 / 25

Page 23: Vectores Aleatorioscms.dm.uba.ar/.../estadisticaQ/vectoresycovarianza.pdf · 2019-09-05 · 3 Vectores Aleatorios: a partir de la conjunta Observemos que la funci on de frecuencia

23

Propiedades de la varianza y covarianza

¡Cuidado! covarianza cero NO garantiza independencia. Entonces

1 Cov(X ,Y ) > 0 indica asociacion lineal positiva entre X e Y , i.e.cuando una crece la otra crece tambien, en promedio.

2 Cov(X ,Y ) < 0 indica asociacion lineal negativa entre X e Y , i.e.cuando una crece la otra decrece tambien, en promedio.

Estadıstica (Q), FCEN (M. E. Szretter) September 5, 2019 23 / 25

Page 24: Vectores Aleatorioscms.dm.uba.ar/.../estadisticaQ/vectoresycovarianza.pdf · 2019-09-05 · 3 Vectores Aleatorios: a partir de la conjunta Observemos que la funci on de frecuencia

24

Interpretacion

Supongamos que X e Y tienen una fuerte relacion (o asociacion) entre sı,es decir, que los grandes valores de X tienden a ocurrir conjuntamente (enel mismo individuo) con valores grandes de Y y valores pequenos de X convalores pequenos de Y . Entonces la mayorıa de la masa o densidad deprobabilidad se asociara con las situaciones en las que [X − µX ] y[Y − µY ] sean ambos positivos (tanto X como Y por encima de susrespectivos medias) o ambos son negativos, por lo tanto la esperanza delproducto [X − µX ] · [Y − µY ] sera positiva. Luego, para una relacionpositiva fuerte la relacion, Cov(X ,Y ) deberıa ser positiva. Para unarelacion negativa fuerte, los signos de [X − µX ] y [Y − µY ] tenderan a seropuestos, produciendo un producto negativo. Por lo tanto, cuando hay unarelacion lineal negativa fuerte, Cov(X ,Y ) deberıa ser negativo. Si X e Yno estuvieran linealmente relacionadas, los productos positivos y negativostenderan a cancelarse entre sı, produciendo una covarianza cercana a 0.

Estadıstica (Q), FCEN (M. E. Szretter) September 5, 2019 24 / 25

Page 25: Vectores Aleatorioscms.dm.uba.ar/.../estadisticaQ/vectoresycovarianza.pdf · 2019-09-05 · 3 Vectores Aleatorios: a partir de la conjunta Observemos que la funci on de frecuencia

25

Propiedades

Lema A6

La covarianza verifica las siguientes propiedades:

Cov(X ,Y ) = Cov(Y ,X )

Cov(X ,X ) = Var(X )

Cov(X + Y ,Z ) = Cov(X ,Z ) + Cov(Y ,Z )

Cov(aX ,Y ) = a Cov(X ,Y ), Cov(aX , bY ) = ab Cov(X ,Y )

Var(aX ) = Cov(aX , aX ) = aCov(X , aX ) = a2 · Cov(X ,X ) =a2 · Var(X )

Var(X − Y ) = Var(X ) + Var(Y )− 2Cov(X ,Y ).

Estadıstica (Q), FCEN (M. E. Szretter) September 5, 2019 25 / 25