41
ESTADÍSTICA I Tablas de Distribución de Frecuencias Bivariadas. Distribución de Frecuencias marginales y Condicionales. Media Aritmética Marginal. Covarianza Ms. Ylder Helí Vargas Alva

Tablas de distribución de frecuencias bivariadas. distribución de frecuencias marginales y condicionales. media aritmética marginal. covarianza

Embed Size (px)

Citation preview

Page 1: Tablas de distribución de frecuencias bivariadas. distribución de frecuencias marginales y condicionales. media aritmética marginal. covarianza

ESTADÍSTICA I

Tablas de Distribución de Frecuencias Bivariadas. Distribución

de Frecuencias marginales y Condicionales. Media Aritmética

Marginal. Covarianza

Ms. Ylder Helí Vargas Alva

Page 2: Tablas de distribución de frecuencias bivariadas. distribución de frecuencias marginales y condicionales. media aritmética marginal. covarianza

CUADRO N° 01

NUMERO DE ESTUDIANTES SEGUN ESTADO ACTIVIDAD

CUADRO N° 02

NUMERO DE ESTUDIANTES SEGUN ESTADO ACTIVIDAD Y TURNO QUE ASISTEN

Page 3: Tablas de distribución de frecuencias bivariadas. distribución de frecuencias marginales y condicionales. media aritmética marginal. covarianza
Page 4: Tablas de distribución de frecuencias bivariadas. distribución de frecuencias marginales y condicionales. media aritmética marginal. covarianza
Page 5: Tablas de distribución de frecuencias bivariadas. distribución de frecuencias marginales y condicionales. media aritmética marginal. covarianza
Page 6: Tablas de distribución de frecuencias bivariadas. distribución de frecuencias marginales y condicionales. media aritmética marginal. covarianza
Page 7: Tablas de distribución de frecuencias bivariadas. distribución de frecuencias marginales y condicionales. media aritmética marginal. covarianza

Supongamos que se toma una muestra de tamaño

n de una población y que se está investigando, o

se desea estudiar, dos características de la misma.

Sean estas características X e Y. Siguiendo los

procedimientos habituales, la Muestra se divide en

• r clases Ai para la variable X

• s clases Bj para la variables Y

Existirán elementos que pertenecerán simultánea-

mente a AiBj. Los datos los podemos ordenar en

una tabla o matriz llamada Tabla de Contingencia

Estadística Bivariada

Page 8: Tablas de distribución de frecuencias bivariadas. distribución de frecuencias marginales y condicionales. media aritmética marginal. covarianza

Y B1 B2 ..... Bj ..... Bs Total

A1 n11 n12 ..... n1j ..... n1s n1

A2 n21 n22 ..... n2j ..... n2s n2

Ai ni1 ni2 ..... nij ..... nis ni

Ar nr1 nr2 ..... nrj ..... nrs nr

Total n1 n

2 ..... nj ..... n

s n

X

n

= n_

Tabla de Contingencia

Page 9: Tablas de distribución de frecuencias bivariadas. distribución de frecuencias marginales y condicionales. media aritmética marginal. covarianza

Y B1 B2 ..... Bj ..... Bs Total

A1 f11 f12 ..... f1j ..... f1s f1

A2 f21 f22 ..... f2j ..... f2s f2

Ai fi1 fi2 ..... fij ..... fis fi

Ar fr1 fr2 ..... frj ..... frs fr

Total f1 f

2 ..... fj ..... f

s f

X

f

= 1_

Tabla de Contingencia

Page 10: Tablas de distribución de frecuencias bivariadas. distribución de frecuencias marginales y condicionales. media aritmética marginal. covarianza

Notación:

fij := frecuencia conjunta = fr(xi,yj)

fi = = frecuencia marginal =

f j = = frecuencia marginal =

fi/j = = frecuencia condicional =

j

ijf j

iji xyx )(),( rr ff

i

ijf i

jji yyx )(),( rr ff

j

ij

f

f

)(

),()/(

j

ji

jiy

yxyx

r

r

rf

ff

Estadística Bivariada

Page 11: Tablas de distribución de frecuencias bivariadas. distribución de frecuencias marginales y condicionales. media aritmética marginal. covarianza

s

j

iji nn1

Frecuencia Absoluta de la clase Ai; para i= 1, ,2, ... ,r(Independiente de la clases Bj a la que estén asociadas

Suma de los valores de la fila i-ésima )

r

i

ijj nn1

Frecuencia Absoluta de la clase Bj; para j= 1, ,2, ... ,s(Independiente de las clases Ai a la que estén asociadas.

Suma de los valores de la columna j-ésima)

nij Frecuencia Absoluta de la clase conjunta AiBj.(Valor observado en la celda (i,j) de la Tabla de Contingencia)

fij nij

nFrecuencia Relativa

“conjunta” de la clase

conjunta correspondiente a

la intersección de Ai y Bj.

s

j

ijf1

r

i 1

1

Tabla de Contingencia

Page 12: Tablas de distribución de frecuencias bivariadas. distribución de frecuencias marginales y condicionales. media aritmética marginal. covarianza

Para frecuencias relativas , i = 1,....,r se tiene:

Además se verifica que:

s

j

iji ff1

(Suma de los valores de la fila i-ésima

de la tabla de contingencia de frecuencias)

r

i

ijj ff1

n

niif

n

n j

jfj

ij

n

n

j

ij

i/jf

ff

Tabla de Contingencia

Page 13: Tablas de distribución de frecuencias bivariadas. distribución de frecuencias marginales y condicionales. media aritmética marginal. covarianza

niif

nn j

jf

Frecuencia (relativa) “marginal” de la variable X, Conjunto de valores pertenecientes a las clases Ai,

considerandolas independientemente de las calses Bj

Frecuencia (relativa) “marginal” de la variable Y, Conjunto de valores pertenecientes a las clases Bj,

considerandolas independientemente de las calses Ai

Dado el experimento anterior, cuando sólo interesa conocer la

frecuencia de ocurrencia de cada una de las variables por separado

se habla de Frecuencia Marginal de la variable

n

Frecuencia Marginal

Page 14: Tablas de distribución de frecuencias bivariadas. distribución de frecuencias marginales y condicionales. media aritmética marginal. covarianza

Una tela se clasifica en tres categorías A, B y C según cantidad y

severidad de pequeñas imperfecciones. La empresa tiene 5

telares, en un mes dado de producción se registraron los

siguientes datos.

# piezas de tela en la clasificación

Telar A B C Marginal

1 185 16 12 213

2 190 24 21 235

3 170 35 16 221

4 158 22 7 187

5 185 22 15 222

Marginal 888 119 71 1078

Ejemplo

Tabla de Contingencia

Page 15: Tablas de distribución de frecuencias bivariadas. distribución de frecuencias marginales y condicionales. media aritmética marginal. covarianza

Se dice que X es independiente de Y si las frecuencias

condicionales de X/Y son todas iguales; es decir, no

dependen de la clase condicionante, esto es

fi/1 = fi/2 = fi/3 = = fi/s = fi

A

i = 1, 2, 3, ... , r

i1n

1n

i2n

2n

i3n

3n

isn

Sn

i1n

1n

i2n

i3n

isn

2n 3n sn

+ +

+ +

+ +....

+ +....i

n

n

....

....

fi

ii/j ff j ffj/i

ji/jij fff ij if jff

Luego similarmente

j

i/j fijf

fComo

Independencia Estadística

Page 16: Tablas de distribución de frecuencias bivariadas. distribución de frecuencias marginales y condicionales. media aritmética marginal. covarianza

ijn

jn

j

i/jf

ijff

• Cuando se “pregunta” por la frecuencia relativa de una de las varia-

bles, digamos X, restrigida a los elementos observados de una clase

dada de la otra; esto es, estudiar el comportamiento de una variable

dado un valor fijo de la otra.

Frecuencia (relativa) de la variable X en la

clase conjunta AiBj, “dado” que sólo nos

interesa respecto a lo observado en la clase Bj

de la variable Y; para i = 1, 2, .., r

f1/j, f2/j, f3/j, ... , fr/j

Constituye la distribución de frecuencia relativa

condicional de la variable X dada la clase Bj de

la variable Y.

Nótese que se trabaja “condicionado” sobre un

tamaño de muestra “reducido” al número de

observaciones de la clase Bj dada

Frecuencia Condicional

Page 17: Tablas de distribución de frecuencias bivariadas. distribución de frecuencias marginales y condicionales. media aritmética marginal. covarianza

Notación:

Análogamente, se tiene:

fj/i = = frecuencia condicional =

i

ij

f

f

)(

),()/(

i

ji

ijx

yxxy

r

r

rf

ff

Independencia Estadística

X e Y son variables estadísticamente independientes ssi:

ó

ó

)()/( jij yxy rr ff )()/( iyi xyx rr ff

ii/j ff j ffj/i

Estadística Bivariada

Page 18: Tablas de distribución de frecuencias bivariadas. distribución de frecuencias marginales y condicionales. media aritmética marginal. covarianza

Independencia Estadística

como ij/iij fff ijij fff

Asociación de Variables

Datos no agrupados Cov(x,y) =

Datos agrupados : Cov(x,y) =

Coeficiente de Correlación = r =

))((1

yyxxn

ii

))(( yyxx ii if

Cov (x,y)

Sx Sy

Estadística Bivariada

Page 19: Tablas de distribución de frecuencias bivariadas. distribución de frecuencias marginales y condicionales. media aritmética marginal. covarianza

Fallas Anuales

Temperatura 120 140 160 MarginalAverías

2 20 15 10 45

3 12 7 5 24

4 4 10 2 16

5 - 5 10 15

Marginal 36 37 27 100

Obtener :Distribuciones marginales

Distribuciones condicionales (4 averías), Media

y Varianza condicional

Ejercicio

Page 20: Tablas de distribución de frecuencias bivariadas. distribución de frecuencias marginales y condicionales. media aritmética marginal. covarianza

Fallas Anuales

Temperatura 120 140 160 MarginalAverías

2 0,20 0,15 0,10 0,45

3 0,12 0,07 0,05 0,24

4 0,04 0,10 0,02 0,16

5 0 0,05 0,10 0,15

Marginal 0,36 0,37 0,27 1,00

fj/4 ={ 2/8; 5/8; 1/8} Xj/4 =137,5

Vj/4= 2/8(120-137,5)2 +5/8(140-137,5)2

+1//8(160-137,5)2 =

Ejercicio

Page 21: Tablas de distribución de frecuencias bivariadas. distribución de frecuencias marginales y condicionales. media aritmética marginal. covarianza

Curvas de Regresión

X

Y

Page 22: Tablas de distribución de frecuencias bivariadas. distribución de frecuencias marginales y condicionales. media aritmética marginal. covarianza

x , y son variables independiente y dependiente

respectivamente. Además una variable estadística que

representa el error.

Los parámetros 0 y 1 pueden ser estimados a partir de

los datos {(xi , yi)}i=1,...,n mediante método de mínimos

cuadrados.

Entonces

xy 10

iiiii xyyye 10 ˆˆˆ Sea ;

Curvas de regresión (Lineal)

Page 23: Tablas de distribución de frecuencias bivariadas. distribución de frecuencias marginales y condicionales. media aritmética marginal. covarianza

x

y

x: variable independiente y

y : variable dependiente

: una variable estadística que representa el error.

xmx 10

xy 10

Modelo Estadístico (Lineal)

Page 24: Tablas de distribución de frecuencias bivariadas. distribución de frecuencias marginales y condicionales. media aritmética marginal. covarianza

x

y

xy 10

1

0

Modelo Estadístico (Lineal)

Page 25: Tablas de distribución de frecuencias bivariadas. distribución de frecuencias marginales y condicionales. media aritmética marginal. covarianza

x

y xy 10

Los parámetros 0 y 1 pueden ser estimados a partir de los datos

{(xi , yi)}i=1,...,n mediante método de mínimos cuadrados.

Esto es, minimizar el error cuadrático medio min S ei2

xmx 10ii

ei

x

xyi 10

y

Modelo Estadístico (Lineal)

Page 26: Tablas de distribución de frecuencias bivariadas. distribución de frecuencias marginales y condicionales. media aritmética marginal. covarianza

n

i

n

i

iii xy1 1

2

10

2)(minmin

1010

n

i

iE eSC1

2

x

xy

SC

SC1̂ xy 10 ˆˆ

n

i

ix xxSC1

2)(

))(( yyxxSC i

n

i

ixy 1

n

i

ieVNE1

2

Page 27: Tablas de distribución de frecuencias bivariadas. distribución de frecuencias marginales y condicionales. media aritmética marginal. covarianza

Límites de Clase

Ingreso Estandarizado

de una Población

Marca de

Clase

105

Consumo

Promedio

de Leche

Semanal

N° de

Personas

Encuestadas

0 - 100000 0,5 2,13 532

100001 - 200000 1,5 2,82 647

200001 - 300000 2,5 3,70 692

300001 - 400000 3,5 4,25 867

400001 - 500000 4,5 4,86 865

500001 - 600000 5,5 5,16 513

600001 - 800000 7,0 5,23 530

800001 - 1000000 9,0 5,57 181

x

Ejemplo: Curvas de Regresión

Page 28: Tablas de distribución de frecuencias bivariadas. distribución de frecuencias marginales y condicionales. media aritmética marginal. covarianza

x y SCx SCy SCxy SCE

0,5 2,13 14,06 4,35 7,82 2,70 0,32

1,5 2,82 7,56 1,95 3,84 3,10 0,08

2,5 3,70 3,06 0,27 0,90 3,51 0,04

3,5 4,25 0,56 0,00 -0,03 3,91 0,11

4,5 4,86 0,06 0,42 0,16 4,32 0,30

5,5 5,16 1,56 0,89 1,18 4,72 0,19

7,0 5,23 7,56 1,03 2,79 5,33 0,01

9,0 5,57 22,56 1,84 6,44 6,14 0,32

34,0 33,72 57,00 10,74 23,10 33,72 1,374,25 4,215 4,215

1 0.4135965

0 2.4697149

y

x = y =S

Modelo Estadístico: Ejemplo

Page 29: Tablas de distribución de frecuencias bivariadas. distribución de frecuencias marginales y condicionales. media aritmética marginal. covarianza

0.4135965=

SCx

1ˆSCxy

=

ˆˆ 2.4697149 x1y0 = =

SCxy= 23,10

SCx = 57,00

y

x

= 4,215

= 4,25

10,74

% de Ajuste del Modelo =

1 =1,37

= 0,872 87,2%SCE

SCy

Ejemplo

Page 30: Tablas de distribución de frecuencias bivariadas. distribución de frecuencias marginales y condicionales. media aritmética marginal. covarianza

Ejemplo: Curvas de Regresión

t 0 1 2 3 4 5 6

V(t) 30 60 46 32 10 4 17

20 40 26 14 8

20 12

V(t) 25 40 46 29 12 6 17

Sea xt = sen t yt = V(t)

Luego y(t) = 0 + 1 xt + t

t

tt xyQ 2

10,

10,

)(min),(min1010

Page 31: Tablas de distribución de frecuencias bivariadas. distribución de frecuencias marginales y condicionales. media aritmética marginal. covarianza

3,25ˆˆ10 xy 20

),cov(ˆ21

xS

yx

12762yS 45222

,)ˆ( tt yy

% de Ajuste del Modelo =

%%,ˆ

9810098012

2

y

t

S

e

Page 32: Tablas de distribución de frecuencias bivariadas. distribución de frecuencias marginales y condicionales. media aritmética marginal. covarianza

Ingreso

Co

ns

um

o

0.1 1.7 3.3 4.9 6.6 8.2 9.8

6.02

5.32

4.61

3.90

3.19

2.48

1.78

a = 2.4697149

b = 0.4135965

Linear Fit:

Y = a + bx

Ajuste Lineal

Page 33: Tablas de distribución de frecuencias bivariadas. distribución de frecuencias marginales y condicionales. media aritmética marginal. covarianza

Ajuste Logarítmico

Ingreso

Co

ns

um

o

0.1 1.7 3.3 4.9 6.6 8.2 9.8

6.02

5.32

4.61

3.90

3.19

2.48

1.78

Logarithm Fit:

Y = a + b*ln(x)

Page 34: Tablas de distribución de frecuencias bivariadas. distribución de frecuencias marginales y condicionales. media aritmética marginal. covarianza

Ajuste Polinomial

Ingreso

Co

ns

um

o

0.1 1.7 3.3 4.9 6.6 8.2 9.8

6.02

5.32

4.61

3.90

3.19

2.48

1.78

Power Fit:

Y = a xb

a = 2.6890974

b = 0.3543629

Page 35: Tablas de distribución de frecuencias bivariadas. distribución de frecuencias marginales y condicionales. media aritmética marginal. covarianza

Modelo Logístico

Ingreso

Co

ns

um

o

0.1 1.7 3.3 4.9 6.6 8.2 9.8

6.02

5.32

4.61

3.90

3.19

2.48

1.78

Logistic Model:

Y =a

1+b*e-cx

a = 5.6469463

b = 2.2230602

c = 0.55970905

Page 36: Tablas de distribución de frecuencias bivariadas. distribución de frecuencias marginales y condicionales. media aritmética marginal. covarianza

Ingreso

Co

ns

um

o

0.1 1.7 3.3 4.9 6.6 8.2 9.8

6.02

5.32

4.61

3.90

3.19

2.48

1.78

Richard’s Model:

Y =a

1+b*e(b-cx)(1/d)

a = 5.6606384

b = 0.5984401

c = 0.5415778

d = 0.8782331

Modelo de Richard

Page 37: Tablas de distribución de frecuencias bivariadas. distribución de frecuencias marginales y condicionales. media aritmética marginal. covarianza

Asociación Exponencial

Ingreso

Co

ns

um

o

0.1 1.7 3.3 4.9 6.6 8.2 9.8

6.02

5.32

4.61

3.90

3.19

2.48

1.78

Exponential Association (3):

Y = a (b - e-cx)

a = 4.6333776

b = 1.3115177

c = 0.2709334

Page 38: Tablas de distribución de frecuencias bivariadas. distribución de frecuencias marginales y condicionales. media aritmética marginal. covarianza

Sea yi = h ( xi ) con i = 1,...,n

1. Lineales yi = axi + b

y = ax + b

Sy = a Sx

2. No lineales yi = h( xi )

y = h(x) + h”(x) SX2

Sy2 Sx

2 h’ (x)2

En particular

h(x) = ln x y = ln x - ( Sx2 / x2 )

Sy2 ( Sx

2 / x2 ) = CV 2

2

1

2

1

Transformaciones

Page 39: Tablas de distribución de frecuencias bivariadas. distribución de frecuencias marginales y condicionales. media aritmética marginal. covarianza

Relaciones Linealizables

1. y = K x ln y = a0 + a1 ln x

2. y = K ( / x ) y = a0 a1 x-1

3. y = K ex ln y = a0 + a1 x

4. y = K e-/x ln y = a0 + a1 x-1

5. yt = K + cos t y = a0 + a1 xt

siendo xt = cos t

6. y() = y - 1 = a0 + a1 x

y-1 dy = a1 w = dy

dx dx

ln w = ln a1 + ( 1 - ) ln y

Page 40: Tablas de distribución de frecuencias bivariadas. distribución de frecuencias marginales y condicionales. media aritmética marginal. covarianza

3. Box-Cox Transformaciones (1964)

h (x) = X() =

( x + m ) - 1 0 x > -m

ln ( x + m ) = 0 m > 0

Transformaciones

Page 41: Tablas de distribución de frecuencias bivariadas. distribución de frecuencias marginales y condicionales. media aritmética marginal. covarianza

Sea yi = h ( xi ) con i = 1,...,n

1. Lineales 2. No lineales

• yi = a + bxi • y = a + b ln x

• y = a + bx • y = a e bx

• sy = b sx

3. Linealizables

• y = a x b ln y = ln a + b ln x

• y = a ( b / x ) y = a b x-1

• y = a e bx ln y = ln a + b x

• y = a e-b/x ln y = ln a - b x-1

• yt = a + b cos t y = a + b xt siendo xt = cos t

Transformaciones