2 Semana Analisis Multivariante Parte I

Preview:

Citation preview

UNIVERSIDAD NACIONAL UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOSMAYOR DE SAN MARCOS

Universidad del Perú, DECANA DE AMERICAUniversidad del Perú, DECANA DE AMERICA

FACULTAD DE CIENCIAS MATEMÁTICASFACULTAD DE CIENCIAS MATEMÁTICAS

Mg. María Estela Ponce AruneriMg. María Estela Ponce Aruneri

ESCUELA ACADÉMICO PROFESIONAL DE ESTADÍSTICA ACADÉMICO PROFESIONAL DE ESTADÍSTICA

DEPARTAMENTO ACADÉMICO DE ESTADÍSTICADEPARTAMENTO ACADÉMICO DE ESTADÍSTICA

SEMESTRE 2009-II

¿Cuál es la distribución de probabilidad conjunta de un vector que sigue una distribución normal p-dimensional?

1º Para el caso univariado se tiene que :2

1

21( )

x

f x e

2

1

2( ) kx

f x e

2º Sea

2( )2

2

1( )

x bb y f x ke

3º Sea el vector aleatorio:

1

2

.

p

x

xx

x

1

2

.

p

βY el vector de constantes:

4º Reemplazando 3º en 2º se tiene: 1

2( ) kf e

'

x-β A x-βx

1

21 2 ................ 1pdx dx dxke

'

x-β A x-β

El exponente es una forma cuadrática o distancia estadística.

5º ¿A qué es igual k?

* 1Sea k

k

Utilizaremos el siguiente corolario: Sí A es simétrica y definida positiva entonces existe una matriz C no singular tal que: C’AC =I

Si hacemos:

1

2

.:

.

p

y

y

donde

y

(x - β) = Cy

y

' ' ' '(x - β) A(x - β) = y C ACy y y

Necesitamos calcular el jacobiano de la transformación , el que es igual al valor del determinante de la matriz C.

Luego:

2

2

1 2

1 2

1* 2 .......

1* 2 .......

1

1* 2

1

1..........

..........i

i

p

p

i

p y

i

p y

i

y y y

y y y

y

d d d

d d d

d

k Mod ek

k Mod e

k Mod e

y'yC

C

C

1/ 2

1pero Mod C

A

2

2

1* 2

1

1/ 2 / 2* 2

1

1

2

1

2

2

2 2 (*)

i

i

i

i

p y

i

p yp p

i

y

y

d

d

k Mod e

k Mod e Mod

C

C C

1/ 2

/ 22( ) p

k

A

Reemplazando en (*) se tiene:

1/ 2 1

2/ 2

2( )

( ) pf e

'x-β A x-βA

x

Reemplazando el valor de k en 4º se tiene:

Es la función de densidad de una distribución normal p-variante.¿Quién es ?

Sea el vector aleatorio: '1 2 .............. px x xX

( ) ( )

( ) ?

E E

E

(x - β) = Cy x Cy β

x C y β

y

1 2

1 1

2 2 ...../ 2 / 2

1 1

2 2( ) ( ) .........

( ) ( ) pi ip pdy dy dyyf e E y e

' 'y y y y

y

2

2 2

1 2

1

2 .....1/ 2

1

1 1

2 21/ 2 1/ 2

1

1

2

1 1

2 2

( ) .........( )

( )( ) ( )

( ) 0

i

i i

p

i j

p y

i ii

py y

i ijj i

i

dy dy dy

dy dy

y

y

E y e

E y e e

E y

1

.( )

.

p

E

x μ

( )

( ) ( )

E

E E

y 0

x C y β μ

¿A qué es igual A?

( )

( )como

V E

V E E

'x x - μ x - μ

x Cyy'C' C yy' C'

2 2 2

1 2

1

2 ...../ 2

1 1 1

2 2 21/ 2 1/ 2 1/ 2

1

1

2

1 1 1

2 2 2

( ) .........( )

( ) 0( ) ( ) ( )

( ) 0

i j h

p

i j h

i j i j p

py y y

i j i jhh i j

i j

dy dy dy

dy dy dy

y y

y y

E y y e

E y y e e e

E y y

y'y

Sí i j

Sí i = j

2 2

1 2

12 2 .....

/ 2

1 12 2 2

1/ 2 1/ 21

2

2

2

1

2

1 1

2 2

( ) .........( )

( ) 1( ) ( )

( ) 0 ( )

i j

p

i j

i p

py y

iji j

i

i

i

dy dy dy

dy dy

y

y

E y e

E y e e

E y E

y'y

yy' I

1

:

( )

ademas

V E

x C yy' C' CIC' CC'

C'AC = I A CC'

1( ) ( ) 'V V E x A Σ x x - μ x - μ Σ

Teorema: Si la función de densidad de un vector aleatorio x p-dimensional está dada por:

1/ 2 1

2/ 2

2( )

( ) pf e

'x-β A x-βA

x

Donde:

1

( )

( ) ( )

E

V Cov

x β

x x A

Recíprocamente para un vector µ y una matriz simétrica

definida positiva , existe una f.d.p., dada por:

1

21/ 2/ 2

1

2( )

( ) pf e

' -1x-μ Σ x-μx

ΣTal que:

21 1 12 1

22 21 2 2

21 2

)

. .

. .

.( ) ( . . . . .

. . . . . .

. .

p

p

p p p p

yE Cov

x x Σμ

Propiedades de la distribución normal p-variante

Teorema Nº 1

Si X Np(µ,) y y = AX+c donde Akxp y c k y Nk(?, ?) .

Prueba 1

21/ 2/ 2

1

2( )

( ) pf e

' -1x-μ Σ x-μx

Σ

( ) ?f

-1y = Ax + c x = A (y - c)

y

El jacobiano de la transformación es:

1

2

1/ 21

1/ 2

1/ 21

1/ 2

1 1 1

' ( ' )

'

ModMod

Mod

Mod

AA A AA

Σ Σ ΣA

A Σ A A Σ A A Σ A

ΣA

AΣA

1/ 2 1

21/ 2 1/ 2/ 2

1

2( )

( ) 'pf e

'-1 -1 -1A (y-c)-μ Σ A (y-c)-μx

Σ

Σ AΣA

Resolviendo la forma cuadrática se tiene:

1( ) ' ( )

' '-1-1 -1A (y-c)-μ Σ A (y-c)-μ y- Aμ c AΣA y- Aμ c

11( ) ' ( )

21/ 2/ 2

1

2( )

( ) '

, '

p

k

f e

N

'y- Aμ c AΣA y- Aμ c

xAΣA

y Aμ c AΣA

Teorema Nº 2

Si X Np(µ,) y y = -1/ 2(X- µ) es una transformación de X con -1/ 2 simétrica y definida positiva y1, y2, ……….., yp son v.a.i. N(0,1) .

Prueba

Usando las propiedades de transformaciones de vectores aleatorios, así como de esperanza y varianza de una vector aleatorio, se puede probar este teorema.

Interpretación geométrica de c2

La distribución normal p-variada tiene densidad constante sobre elipses o elipsoides de la forma:

2c -1x - μ 'Σ x - μ

A estos elipsoides se denominan contornos de la distribución o elipsoides de igual concentración.

Estos elipsoides están centrados en µ y la longitud media del i-ésimo eje en dirección i es igual a c i

1/2

Ejemplo

Graficar el elipsoide de igual concentración para la distribución normal bivariada con c=2 y:

1 1 0

1 0 2

μ Σ

Distribuciones Marginales

Si

1 11 12

2 21 22

μ Σ Σμ = Σ =

μ Σ Σ

Es particionada en “q” y “p-q” componentes, con

2

1),(x

xxΣμ~x pN

),(~),,(~ 22221111 ΣμxΣμx qpq NN

Prueba:

1

1

1

( )

( )

E

Cov Cov Cov

1q

2

1q 1

2

1q 1 11

2

xx I 0

x

μx I 0 μ

μ

xx I 0 x Σ

x

De forma similar se puede probar para la otra partición de X2.

),(~ 1111 Σμx qN

Ejemplo:

1 2

31 2 4

65

,

x x

x x

xx

x x

Encuentre las distribuciones marginales de los vectores.

16

2

( , )N

xx ~ μ Σ x

x

Distribuciones Condicionales

Si

1 11 12

2 21 22

μ Σ Σμ = Σ =

μ Σ Σ

Es particionada en “q” y “p-q” componentes, con

2

1),(x

xxΣμ~x pN

12

11121221.22

111

112121.2

1.221.21.2 ),(

ΣΣΣΣΣ

μxΣΣμμ

Σμ~x

qpN

Prueba:

12

22

( )

( )

E

Cov

q1 1 1-1-1

21 11 p-q2 2 21 11 1 2

q 1 1-1 -1

21 11 p-q 2 2 21 11 1

q q11 11-1 -1

21 11 p-q 21 11 p-q21

I 0y x xy =

Σ Σ Iy x - Σ Σ x x

I 0 μ μy

Σ Σ I μ μ Σ Σ μ

I 0 I 0Σ Σ Σ 0y

Σ Σ I Σ Σ IΣ Σ 22 12

12.1 2 21 11 1 1( )

-121 110 Σ Σ Σ Σ

μ μ Σ Σ x μ

11 2 2

3

,x

xx

x x

Ejemplo:

Hallar la distribución condicional de la segunda participación conociendo la primera.

321

221

111

3

2

1

),(3 ΣμΣμ~x N

CORRELACIÓN MÚLTIPLE

La máxima correlación entre xi y la combinación lineal x2, es:

20 1

i

R R

-1

i2 22 2iΣ Σ Σ

11 1 12 22

'1 1

( / )

( / )

E x

E x

2 2 2

2 2 2

x x μ

x x μSe tiene que

21 1

2 2 2 11 1 2 2

1 1

1 1

( / )

( / )( / )

Var x

Var xVar x R R

-12 12 22 21

-12 12 22 21

2

x Σ Σ Σ

x Σ Σ Σx

11 2 2

3

,x

xx

x x

Ejemplo:

Hallar la correlación entre la segunda y primera partición

321

221

111

3

2

1

),(3 ΣμΣμ~x N

CORRELACIÓN PARCIAL

1.2 ,R diag -1/2 -1/21.2 11.2 1.2 1.2 11.2D Σ D D Σ

Es la matriz de correlaciones parciales.

Ejemplo: calcular e interpretar las correlaciones parciales para los datos del ejercicio anterior,( de X2 eliminado el efecto de X1)

OBSERVACIONES

1°Las curvas de equidensidad de una distribución normal multivariante son elipsoides (es decir, transformaciones lineales de hiperesferas) centrados en la media. Las direcciones de los ejes principales de los elipsoides vienen dados por los autovectores de la matriz de covarianza Σ. Las longitudes relativas de los cuadrados de los ejes principales vienen dados por los correspondientes autovalores.

2° Sí un vector aleatorio tiene una distribución normal multivariante, cada uno de los componentes del vector aleatorio tiene distribución normal.

3° Sí un vector aleatorio tiene una distribución normal multivariante, entonces cualesquiera dos o más de sus componentes que sean incorrelacionadas, son independientes.