32
DISTRIBUCIONES BIDIMENSIONALES Aquí interesa el estudio estadístico descriptivo de dos características de interés medidas a individuos que pertenezcan a una población o muestra bajo estudio. Los datos se recolectan de la forma (X,Y) donde X es una característica de interés con n modalidades, es decir, X 1 , X 2 , X 3 ,X 4 ,......X n y la variable y (o característica y) con una modalidad de m categorías, es decir: Y 1 , Y 2 , Y 3 ,Y 4 ,......Y m Así por ejemplo: Sea X : peso Sea Y : estatura Para un grupo de 20 personas X : peso Y : estatura X 1 Y 1 X 2 Y 2 X 3 Y 3 X n Y m Estos datos parece razonable resumirlos en una tabla de doble entrada . Debido a que dos variables son continuas, se debe determinar los intervalos o clases para cada variable (como se hacia en el caso unidimensional). LOS TIPOS DE DATOS QUE SE PUEDEN ANALIZAR SON: TIPO VARIABLES (x , y) EJEMPLOS Cualitativa / cualitativa Categórica / categórica Color cabello / sexo Cuantitativa / cualitativa Continua / categórica Peso / color de ojos Cuantitativa / cualitativa Discreta /categórica Pulsación por minuto / estado civil

DISTRIB.BIDIM.REGRESION Y PROBABILIDADES.doc

Embed Size (px)

Citation preview

Page 1: DISTRIB.BIDIM.REGRESION Y PROBABILIDADES.doc

DISTRIBUCIONES BIDIMENSIONALES

Aquí interesa el estudio estadístico descriptivo de dos características de interés medidas a individuos que pertenezcan a una población o muestra bajo estudio.Los datos se recolectan de la forma (X,Y) donde X es una característica de interés con n modalidades, es decir, X1, X2, X3,X4,......Xn y la variable y (o característica y) con una modalidad de m categorías, es decir: Y1, Y2, Y3,Y4,......Ym

Así por ejemplo:

Sea X : pesoSea Y : estaturaPara un grupo de 20 personas

X : peso Y : estaturaX1 Y1

X2 Y2

X3 Y3

Xn Ym

Estos datos parece razonable resumirlos en una tabla de doble entrada . Debido a que dos variables son continuas, se debe determinar los intervalos o clases para cada variable (como se hacia en el caso unidimensional).

LOS TIPOS DE DATOS QUE SE PUEDEN ANALIZAR SON:

TIPO VARIABLES (x , y) EJEMPLOSCualitativa / cualitativa Categórica / categórica Color cabello / sexoCuantitativa / cualitativa Continua / categórica Peso / color de ojos

Cuantitativa / cualitativa Discreta /categóricaPulsación por minuto /

estado civil

Page 2: DISTRIB.BIDIM.REGRESION Y PROBABILIDADES.doc

DISTRIBUCIONES BIDIMENSIONALES

Estos datos se pueden mostrar en una tabla de frecuencias de doble entrada.

Y

XY1 Y2 Y3 ............... Ym

Total marginal

de XX1 ...............

X2 ...............

X3 ..................

..................

Xn ...............Total

marginal de Y

...............

X 0 0 0 0 0 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 4 4 4 4 4Y 0 1 2 3 4 0 1 2 3 4 0 1 2 3 4 0 1 2 3 4 0 1 2 3 4f 8 19 35 16 3 23 37 22 6 1 35 20 16 2 1 17 4 1 0 0 2 1 1 0 0

Y X 0 1 2 3 4

Total marginal

X

0 88 0,029 0,029

1927 0,070 0,099

3562 0,129 0,228

1678 0,059 0,287

381 0,011 0,298

1 2331 0,085 0,114

3787 0,137 0,322

22144 0,081 0,533

6166 0,022 0,614

1170 0,003 0,629

2 3566 0,129 0,243

20142 0,074 0,525

16215 0,059 0,796

2239 0,007 0,885

1244 0,003 0,903

3 1783 0,062 0,305

4163 0,014 0,603

1237 0,003 0,877

0261 0 0,966

0266 0 0,985

4 285 0,007 0,312

1166 0,003 0,614

1241 0,003 0,892

0265 0 0,981

0270 0 1

Total marginal

Y

Explicación

INTERPRETACIÓN DE UNA CELDA

11

11 8+19+35+16+3=81

Page 3: DISTRIB.BIDIM.REGRESION Y PROBABILIDADES.doc

a) Considerando el total de hijos (hombres y mujeres) que tiene cada familia ¿cuál es el promedio de estos en las 270 familias? R.- 2,4 hijos.

b) Obtener las distribuciones marginales para cada variable.

c) En esta muestra de familias ¿Cuántos hijos hombres hay?, ¿hay más hijos hombres o más hijas mujeres? R.- H = 323 M = 319

d) ¿Cuál es el promedio de hijos varones por familia? R.- 1,2.

e) ¿Cuál es el promedio de hijas por familia? R.- 1,2.

f) Calcule la moda para cada distribución marginal. ¿Qué significa este valor? R.- moda hijos: 0 moda hijas: 1

g) Calcule la varianza y desviación típica para cada distribución marginal. ¿En cuál de las variables (X o Y) los datos están más dispersos? R.- 0,9797 y 1,0351.

h) ¿Cuántas familias tienen sólo un hijo hombre, sin importar si tienen o no hijas mujeres?. R.- 81

i) Obtener la distribución condicional para el número de hijas en las familias que tienen 2 hijos hombres.

j) ¿Cuál es la distribución de los hijos hombres en las familias con una hija mujer?

k) ¿Cuál es el promedio de hijos hombres para las familias que tienen una hija mujer? R.- 1,16.

l) ¿Cuál es el promedio de hijas en las familias que tienen 2 hijos hombres? R.- 0,81.

m) ¿Cuál es el promedio de hijos hombres en las familias que no tienen hijas? R.- 1,84.

DISTRIBUCIONES CONDICIONALES, MEDIAS Y VARIANZAS CONDICIONALES.

Existen 16 familias con 2 hijos hombres y 2 hijas mujeres, que representan el 5,9% del total (270), 215 familias que tienen desde 0 hijos hasta 2 y desde 0 hasta 2 hijas y representan el 79,6% del total de la población.

Page 4: DISTRIB.BIDIM.REGRESION Y PROBABILIDADES.doc

DISTRIBUCIONES CONDICIONALES: Consiste en conocer la distribución de una variable, condicionando a la otra algún valor especifico que ésta toma.

Es decir, la distribución condicional de X dado que Y = yj

Ejemplo:

Obtenga la distribución condicional de x dado que y = 3 en el ejemplo de las 270 familias.

X H(x/y =3)

X1 0 16

X2 1 6

X3 2 2

X4 3 0

X5 4 0

Total 24

MEDIA CONDICIONAL :

M(x/y = yj) =

X

X1

X2

X3

.

.

.

.

.

.Total n.j

Distribución condicional (H)

Distribución condicional (H)

Existen 24 familias con 3 hijos

Existen 24 familias con 3 hijos

Hay 16 familias con 3 hijos y 0 hijas

Hay 16 familias con 3 hijos y 0 hijas

Page 5: DISTRIB.BIDIM.REGRESION Y PROBABILIDADES.doc

M(x/y = 3) =

VARIANZA CONDICIONAL:

COEFICIENTE DE VARIACIÓN:

ANÁLISIS DE REGRESIÓN LINEAL SIMPLE

Es un método estadístico que permite evaluar la relación que existe entre dos variables, una llamada variable independiente X y la otra llamada variable dependiente Y.

La variable dependiente es una función lineal y es una variable aleatoria , mientras que la variable independiente toma valores específicos . A la variable dependiente “Y” se le llama VARIABLE RESPUESTA y a la variable “X” se le llama VARIABLE PREDICTORA.

El modelo de regresión lineal simple se caracteriza por tener solamente una variable independiente.

Pero :

5

141 1 14 2 24 3 34 4 44 5 54

** * * * *

.4 24

aa a a a ai

i

X fx f x f x f x f x f

n

0*16 1*6 2*2 3*0 4*0 100,42

24 24hijas

0 1 iy b b X Donde:

Indica el tipo de relación entre las variables, es decir, si el valor de la relación es positiva es directamente proporcional.

Indica el tipo de relación entre las variables, es decir, si el valor de la relación es positiva es directamente proporcional.

CovarianzaCovarianza

Pendiente Pendiente

Page 6: DISTRIB.BIDIM.REGRESION Y PROBABILIDADES.doc

Sean los siguiente datos:

3 6 9 36 18 4,614 7 16 49 28 8,346 15 36 225 90 15,808 24 64 576 192 23,2621 52 125 886 328

Es directamente proporcional por

ser positiva

Es directamente proporcional por

ser positiva

Page 7: DISTRIB.BIDIM.REGRESION Y PROBABILIDADES.doc

1

1

0

cov 0

r

b

1

1

0

cov 0

r

b

1 0

1

cov 0

b

r

1

1

0

cov 0

r

b

1ˆ 0

cov 0

0

b

r

No hay ninguna relación entre las

variables

No hay ninguna relación entre las

variables

Page 8: DISTRIB.BIDIM.REGRESION Y PROBABILIDADES.doc

Fórmula del coeficiente de Correlación Fórmula del coeficiente de Correlación

Coeficiente de correlación Coeficiente de correlación Es el grado que existe entre la relación de las variables.

Coeficiente de determinación Coeficiente de determinación Indica en que porcentaje (%) la variable independiente explica a la variable dependiente.

PRUEBA DE HIPOTESIS PARA LA PENDIENTE POBLACIONAL

1.- Determinar las hipótesis.

v/s

2.- Prueba de hipótesis o estadista.

*

scxyr

scx scy

1 ˆi ie y y

Error de

estimación Error de

estimación

OJO,Esto estaba en pizarra.

OJO,Esto estaba en pizarra.

Hipótesis nulaHipótesis nula Hipótesis

alternativa

Hipótesis alternativa

Pendiente de la población

Pendiente de la población

1 1ˆ

i

cb

bt

S

T calculadoT calculado

1

2

2b

scxyscy

scxnS

scx

Page 9: DISTRIB.BIDIM.REGRESION Y PROBABILIDADES.doc

3.- determinar el nivel de significación

4.- Regla de decisión : rechazar si y solo si ó

Desarrollo

1.- ó

2.-

Intervalo de confianza

Intervalo de confianza

Page 10: DISTRIB.BIDIM.REGRESION Y PROBABILIDADES.doc

3.-

4.- Regla de decisión.

Intervalo de Confianza para

Se dice que se Se dice que se trabaja con un 95% trabaja con un 95%

de confianza.de confianza.

Se dice que se Se dice que se trabaja con un 95% trabaja con un 95%

de confianza.de confianza.

0,25 0,25

95%

4,303tt 4,303tt

=

1 11 1 1ˆ ˆ* *t b t bb t S b t S

1 1 1 11 1 1 1 1ˆ ˆ ˆ ˆ* , * / * *t b t b t b t bb t S b t S b t S b t S

Page 11: DISTRIB.BIDIM.REGRESION Y PROBABILIDADES.doc

EXPERIMENTO

Es cualquier proceso planeado que da lugar a observaciones o a recolección de datos.

EXPERIMENTO ALEATORIO

Es aquel cuyos resultados no pueden predecirse antes de su realización y por lo tanto, están sujetos al azar.

Ejemplo: Lanzamiento de moneda, lanzamiento de un dado.

ESPACIO MUESTRAL

Es el conjunto integrado por todos los resultados posibles de un experimento.

EVENTOS O SUCESOS

Corresponde a una sub-colección o subconjunto del

EVENTO COMPLEMENTARIO

Si es un evento contenido en un espacio muestral , entonces el evento

complementario denotado por (E complemento) es el que contiene todos los

elementos que están en pero no en .

Suponga que es un evento de algún experimento como un evento , ocurre o no

ocurre, entonces el estará compuesto por los eventos de y

S

Diagrama de Venn, el cual muestra un espacio muestral y tres eventos.

Page 12: DISTRIB.BIDIM.REGRESION Y PROBABILIDADES.doc

EVENTOS COMPUESTOS

Si E y F (como eventos), son eventos entonces la ocurrencia de E ó F se denota por ó que ambos ocurran

EVENTOS MUTUAMENTE EXCLUYENTES.

Dos eventos son mutuamente excluyentes cuando no tienen resultados en común (elementos), es decir,

Ejemplo: suponga que un experimento consiste en examinar 3 fusibles, cada fusible puede ser defectuoso (D) o no defectuoso (B).

a) Determine la cardinalidad del espacio muestral.(cuantos elementos tiene el espacio muestral)

b) Determine el espacio muestral.

BB

DB

BD

D

DD

BD

DB

E

c) Obtenga los siguientes eventos:

que el primer fusible sea defectuoso{DBD-DDD-DDB-DBB}

que a lo mas un fusible sea defectuoso (máximo uno){BBD-BDB-BBB-DBB}

Sale bueno o Sale bueno o malomalo

Sale bueno o Sale bueno o malomalo

Cantidad de Cantidad de fusiblesfusibles

Cantidad de Cantidad de fusiblesfusibles

Page 13: DISTRIB.BIDIM.REGRESION Y PROBABILIDADES.doc

que a lo menos un fusible sea defectuoso

que a lo sumo dos fusibles sean defectuosos (máximo)

que ningún fusible sea defectuoso.

Use el diagrama de Venn para ilustrar la siguiente información, sea el espacio muestral 1,2,3,4,5,6,7,8

El evento

CONCEPTO DE PROBABILIDAD

Si un experimento tiene un espacio muestral y un evento está definido en ,

entonces la probabilidad de es un número real al que se le denomina la

probabilidad de un evento o simplemente la probabilidad de .

La probabilidad satisface las siguientes propiedades.:

1) (para todo evento que pertenece al espacio muestral)

2)

3) Para cualquier número finito k de eventos mutuamente excluyentes definidos en S

S

8

5

7

2

3 4

61

P EOcurre o no

ocurreOcurre

0 0,5 1

Page 14: DISTRIB.BIDIM.REGRESION Y PROBABILIDADES.doc

TEOREMAS DE PROBABILIDAD BÁSICA

TEOREMA 1TEOREMA 1

Si (fi) es un conjunto vacío entonces la probabilidad de es 0.

TEOREMA 2TEOREMA 2

Si A y B se definen en y si entonces A y B se dice que son mutuamente

excluyentes y la probabilidad de que ocurra A o B es:

TEOREMA 3TEOREMA 3

Si A y B se definen en y si distinto de cero

TEOREMA 4TEOREMA 4

Sea el complemento de en , entonces la

PROBABILIDAD CONJUNTA, MARGINAL Y CONDICIONAL

SEXO

HABITO hombres mujeresTotal

fumar

no fumar

Total

Fórmula general

1,2,3,4,5,6

1,3,5

1,6

A

B

P A B P A P B P A B

1,3,5,6

4

6

A B

P A B

3

62

6 1

6

46

46

Page 15: DISTRIB.BIDIM.REGRESION Y PROBABILIDADES.doc

Suponga que se elige una persona y se quiere saber si ésta fuma y sea hombre.

Si fuma y sea mujer

Que no fume y sea hombre

Que no fume y sea mujer

Suponga que se desea conocer la probabilidad de algún sin importar si es

hombre o mujer sin importar los .

Ejemplo :

Suponga que ahora que se elige aleatoriamente una persona y es mujer, cual es la probabilidad de que no fume.

A esto se le llama PROBABILIDAD PROBABILIDAD

CONJUNTACONJUNTA

A esto se le llama PROBABILIDAD PROBABILIDAD

CONJUNTACONJUNTA

2

1

2

1

ijj

i

iji

j

n

P An

nP B

n

Probabilidad

que sea hombre

Probabilidad que sea hombre

Probabilidad que sea mujer

Probabilidad que sea mujer

A esto se le llama PROBABILIDAD PROBABILIDAD

MARGINALMARGINAL

A esto se le llama PROBABILIDAD PROBABILIDAD

MARGINALMARGINAL

2

1

/ iji j

ijj

nP A A

n

A esto se le llama PROBABILIDAD PROBABILIDAD CONDICIONALCONDICIONAL

A esto se le llama PROBABILIDAD PROBABILIDAD CONDICIONALCONDICIONAL

Page 16: DISTRIB.BIDIM.REGRESION Y PROBABILIDADES.doc

Regla de la multiplicaciónRegla de la multiplicación

TEOREMA DE BAYES

El Teorema de Bayes nos permite calcular la probabilidad de un evento que no se conoce a partir de eventos anteriores, para entender este teorema consideremos que un articulo es manufacturado a través de dos máquinas.

Se sabe que la Maq A produce el 40% de la producción total y la Maq B el 60%, se sabe también que la taza de efecto de la Maq A es de un 2% y la Maq B un 4%.

Obtenga la probabilidad de que el articulo sea defectuoso y venga de la Maq A. La probabilidad de que venga de la Maq B sabiendo que es NO defectuoso.

ARTICULO

MÁQUINA MÁQUINA A B

* /P A P D A P D A

0,4*0,020,08

8%

0,4*0,980,39239,2%

* /c cP A P D A P A D

* /P B P D B P B D 0,6 * 0,04

0,024

24%

2* /CP B P D B P B D 0,6 * 0,96

0,57

57%

/

C

C

C

P B DP B D

P D

/C

C

C C

P B DP B D

P A D P B D

TEOREMA DE TEOREMA DE BAYESBAYES

TEOREMA DE TEOREMA DE BAYESBAYES

Page 17: DISTRIB.BIDIM.REGRESION Y PROBABILIDADES.doc

= 0,592

= 59,2%

Distribución de probabilidades: existen discretas y continuas, las discretas se encuentran la Bernoulli, Poison, hipergeométrica, multinomial y la geométrica entre otras.

Entre las distribuciones continuas las más importantes son La Normal, Uniforme, Exponencial, entre otras.

DISTRIBUCIÓN BINOMIAL

En estadística la Distribución Binomial es una distribución de probabilidad discreta del número de éxitos en una secuencia de “n” experimentos independientes, cada uno de los cuales tiene probabilidad “p” de ocurrir. La distribución Bernoulli es una distribución binomial con (el número de ensayos es igual a 1). Su distribución de probabilidad está dada por la siguiente función matemática.

donde

Responde a combinatoria

Responde a combinatoria

A B C D

2

4!4 6

2!2!C

2! 3*46

2! 2

p = probabilidad que ocurra (éxito)q = probabilidad que no ocurra

siempre que

Page 18: DISTRIB.BIDIM.REGRESION Y PROBABILIDADES.doc

Por ejemplo:La distribución binomial se usa para encontrar la probabilidad de sacar 5 caras y 7 sellos en 12 lanzamientos.

Sea x la variable aleatoria salga sello

Probabilidad de que a lo más salgan dos sellos.

Probabilidad de que por lo menos salga un sello.

= 12*0,5 = 6

= 12*0,5*0,5 = 3

n = 12x = 7b = (12, 0.5, 0.5, x = 7) = = 0,1933

= 19,33 %

= 0,00024 + 0,0029 + 0,016= 0,0193

1 1 1P x P x 1 0P x

1 0,00024 0,9997699,98%

La

Page 19: DISTRIB.BIDIM.REGRESION Y PROBABILIDADES.doc

Se tiene la siguiente información :

Calcular:

a)

b) La probabilidad de que a lo más salga un sello.

c) La probabilidad de que a lo menos salga un sello.

SOLUCIÓN:

Sabemos que

,

2 * *VAR x x n p q

* *n p q 1,732

22 2 3 2 * *n p q

3 * *n p q3 *0,5*0,5n

2

3

0,5n

12n

a)

=

=

1 shi nCr 1*0, ^ 1

shift EN

Dos veces

Page 20: DISTRIB.BIDIM.REGRESION Y PROBABILIDADES.doc

Ejercicio :

b)

0 1 2 3 4 5 6 7 8 9 10 12

0,0049

1

c)

c)

1

1

P x P x

P x P x

Page 21: DISTRIB.BIDIM.REGRESION Y PROBABILIDADES.doc

Un fabricante de marcos para ventana sabe por experiencia que un 5% de la producción tendrá algún tipo de defecto menor que requerirá un ligero ajuste. Cual es la probabilidad de que una muestra de 10 marcos para ventana ...

a) ninguno necesite arreglo 0b) por lo menos uno requerirá ajustes de 1 a 10c) mas de dos necesitarán arreglos de 3 a 10

DISTRIBUCION DE PROBABILIDADES PARA UNA VARIABLE ALEATORIADISTRIBUCION DE PROBABILIDADES PARA UNA VARIABLE ALEATORIA DISCRETA POISSONDISCRETA POISSON

a)

=

= 0,598

= 59,8%

a)

=

= 0,598

= 59,8%

b)

= 0,315

= 31,5%

b)

= 0,315

= 31,5%

c)

= 0,0746

= 7,46%

c)

= 0,0746

= 7,46%

Page 22: DISTRIB.BIDIM.REGRESION Y PROBABILIDADES.doc

Ejemplo:

a) Si el 2% de los libros encuadernados en cierto taller tienen encuadernación defectuosa, obtener la probabilidad de que 5 de 400 libros encuadernados en este taller tengan encuadernación defectuosa.

b) probabilidad de que a lo más dos (2) sean defectuosas.

c) la probabilidad de que a lo menos 2 sean defectuosos.

Ejercicio :Suponga que estamos investigando la seguridad de un cruce peligroso, los archivos de la policía indican una media de 5 accidentes por mes.

Page 23: DISTRIB.BIDIM.REGRESION Y PROBABILIDADES.doc

El número de accidentes está distribuido conforme a una distribución de Poisson, se pide calcular:

a)

0 0,0067 0,00671 0,0337 0,04042 0,0846 0,12443 0,140 0,26444 0,1754 0,4394

DISTRIBUCIÓN DE PROBABILIDADES PARA UNA VARIABLE ALEATORIADISTRIBUCIÓN DE PROBABILIDADES PARA UNA VARIABLE ALEATORIA CONDICIONAL DE XCONDICIONAL DE X

Page 24: DISTRIB.BIDIM.REGRESION Y PROBABILIDADES.doc

DISTRUBUCIÓN NORMALDISTRUBUCIÓN NORMAL

Mide la desviación de los datos respecto a la media.

2

1 2 21

, , *2

ix

f x e

2,x N

0,1Z N

Page 25: DISTRIB.BIDIM.REGRESION Y PROBABILIDADES.doc
Page 26: DISTRIB.BIDIM.REGRESION Y PROBABILIDADES.doc
Page 27: DISTRIB.BIDIM.REGRESION Y PROBABILIDADES.doc