View
221
Download
4
Embed Size (px)
Citation preview
DISTRIBUCIONES BIDIMENSIONALES
Aquí interesa el estudio estadístico descriptivo de dos características de interés medidas a individuos que pertenezcan a una población o muestra bajo estudio.Los datos se recolectan de la forma (X,Y) donde X es una característica de interés con n modalidades, es decir, X1, X2, X3,X4,......Xn y la variable y (o característica y) con una modalidad de m categorías, es decir: Y1, Y2, Y3,Y4,......Ym
Así por ejemplo:
Sea X : pesoSea Y : estaturaPara un grupo de 20 personas
X : peso Y : estaturaX1 Y1
X2 Y2
X3 Y3
Xn Ym
Estos datos parece razonable resumirlos en una tabla de doble entrada . Debido a que dos variables son continuas, se debe determinar los intervalos o clases para cada variable (como se hacia en el caso unidimensional).
LOS TIPOS DE DATOS QUE SE PUEDEN ANALIZAR SON:
TIPO VARIABLES (x , y) EJEMPLOSCualitativa / cualitativa Categórica / categórica Color cabello / sexoCuantitativa / cualitativa Continua / categórica Peso / color de ojos
Cuantitativa / cualitativa Discreta /categóricaPulsación por minuto /
estado civil
DISTRIBUCIONES BIDIMENSIONALES
Estos datos se pueden mostrar en una tabla de frecuencias de doble entrada.
Y
XY1 Y2 Y3 ............... Ym
Total marginal
de XX1 ...............
X2 ...............
X3 ..................
..................
Xn ...............Total
marginal de Y
...............
X 0 0 0 0 0 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 4 4 4 4 4Y 0 1 2 3 4 0 1 2 3 4 0 1 2 3 4 0 1 2 3 4 0 1 2 3 4f 8 19 35 16 3 23 37 22 6 1 35 20 16 2 1 17 4 1 0 0 2 1 1 0 0
Y X 0 1 2 3 4
Total marginal
X
0 88 0,029 0,029
1927 0,070 0,099
3562 0,129 0,228
1678 0,059 0,287
381 0,011 0,298
1 2331 0,085 0,114
3787 0,137 0,322
22144 0,081 0,533
6166 0,022 0,614
1170 0,003 0,629
2 3566 0,129 0,243
20142 0,074 0,525
16215 0,059 0,796
2239 0,007 0,885
1244 0,003 0,903
3 1783 0,062 0,305
4163 0,014 0,603
1237 0,003 0,877
0261 0 0,966
0266 0 0,985
4 285 0,007 0,312
1166 0,003 0,614
1241 0,003 0,892
0265 0 0,981
0270 0 1
Total marginal
Y
Explicación
INTERPRETACIÓN DE UNA CELDA
11
11 8+19+35+16+3=81
a) Considerando el total de hijos (hombres y mujeres) que tiene cada familia ¿cuál es el promedio de estos en las 270 familias? R.- 2,4 hijos.
b) Obtener las distribuciones marginales para cada variable.
c) En esta muestra de familias ¿Cuántos hijos hombres hay?, ¿hay más hijos hombres o más hijas mujeres? R.- H = 323 M = 319
d) ¿Cuál es el promedio de hijos varones por familia? R.- 1,2.
e) ¿Cuál es el promedio de hijas por familia? R.- 1,2.
f) Calcule la moda para cada distribución marginal. ¿Qué significa este valor? R.- moda hijos: 0 moda hijas: 1
g) Calcule la varianza y desviación típica para cada distribución marginal. ¿En cuál de las variables (X o Y) los datos están más dispersos? R.- 0,9797 y 1,0351.
h) ¿Cuántas familias tienen sólo un hijo hombre, sin importar si tienen o no hijas mujeres?. R.- 81
i) Obtener la distribución condicional para el número de hijas en las familias que tienen 2 hijos hombres.
j) ¿Cuál es la distribución de los hijos hombres en las familias con una hija mujer?
k) ¿Cuál es el promedio de hijos hombres para las familias que tienen una hija mujer? R.- 1,16.
l) ¿Cuál es el promedio de hijas en las familias que tienen 2 hijos hombres? R.- 0,81.
m) ¿Cuál es el promedio de hijos hombres en las familias que no tienen hijas? R.- 1,84.
DISTRIBUCIONES CONDICIONALES, MEDIAS Y VARIANZAS CONDICIONALES.
Existen 16 familias con 2 hijos hombres y 2 hijas mujeres, que representan el 5,9% del total (270), 215 familias que tienen desde 0 hijos hasta 2 y desde 0 hasta 2 hijas y representan el 79,6% del total de la población.
DISTRIBUCIONES CONDICIONALES: Consiste en conocer la distribución de una variable, condicionando a la otra algún valor especifico que ésta toma.
Es decir, la distribución condicional de X dado que Y = yj
Ejemplo:
Obtenga la distribución condicional de x dado que y = 3 en el ejemplo de las 270 familias.
X H(x/y =3)
X1 0 16
X2 1 6
X3 2 2
X4 3 0
X5 4 0
Total 24
MEDIA CONDICIONAL :
M(x/y = yj) =
X
X1
X2
X3
.
.
.
.
.
.Total n.j
Distribución condicional (H)
Distribución condicional (H)
Existen 24 familias con 3 hijos
Existen 24 familias con 3 hijos
Hay 16 familias con 3 hijos y 0 hijas
Hay 16 familias con 3 hijos y 0 hijas
M(x/y = 3) =
VARIANZA CONDICIONAL:
COEFICIENTE DE VARIACIÓN:
ANÁLISIS DE REGRESIÓN LINEAL SIMPLE
Es un método estadístico que permite evaluar la relación que existe entre dos variables, una llamada variable independiente X y la otra llamada variable dependiente Y.
La variable dependiente es una función lineal y es una variable aleatoria , mientras que la variable independiente toma valores específicos . A la variable dependiente “Y” se le llama VARIABLE RESPUESTA y a la variable “X” se le llama VARIABLE PREDICTORA.
El modelo de regresión lineal simple se caracteriza por tener solamente una variable independiente.
Pero :
5
141 1 14 2 24 3 34 4 44 5 54
** * * * *
.4 24
aa a a a ai
i
X fx f x f x f x f x f
n
0*16 1*6 2*2 3*0 4*0 100,42
24 24hijas
0 1 iy b b X Donde:
Indica el tipo de relación entre las variables, es decir, si el valor de la relación es positiva es directamente proporcional.
Indica el tipo de relación entre las variables, es decir, si el valor de la relación es positiva es directamente proporcional.
CovarianzaCovarianza
Pendiente Pendiente
Sean los siguiente datos:
3 6 9 36 18 4,614 7 16 49 28 8,346 15 36 225 90 15,808 24 64 576 192 23,2621 52 125 886 328
Es directamente proporcional por
ser positiva
Es directamente proporcional por
ser positiva
1
1
0
cov 0
r
b
1
1
0
cov 0
r
b
1 0
1
cov 0
b
r
1
1
0
cov 0
r
b
1ˆ 0
cov 0
0
b
r
No hay ninguna relación entre las
variables
No hay ninguna relación entre las
variables
Fórmula del coeficiente de Correlación Fórmula del coeficiente de Correlación
Coeficiente de correlación Coeficiente de correlación Es el grado que existe entre la relación de las variables.
Coeficiente de determinación Coeficiente de determinación Indica en que porcentaje (%) la variable independiente explica a la variable dependiente.
PRUEBA DE HIPOTESIS PARA LA PENDIENTE POBLACIONAL
1.- Determinar las hipótesis.
v/s
2.- Prueba de hipótesis o estadista.
*
scxyr
scx scy
1 ˆi ie y y
Error de
estimación Error de
estimación
OJO,Esto estaba en pizarra.
OJO,Esto estaba en pizarra.
Hipótesis nulaHipótesis nula Hipótesis
alternativa
Hipótesis alternativa
Pendiente de la población
Pendiente de la población
1 1ˆ
i
cb
bt
S
T calculadoT calculado
1
2
2b
scxyscy
scxnS
scx
3.- determinar el nivel de significación
4.- Regla de decisión : rechazar si y solo si ó
Desarrollo
1.- ó
2.-
Intervalo de confianza
Intervalo de confianza
3.-
4.- Regla de decisión.
Intervalo de Confianza para
Se dice que se Se dice que se trabaja con un 95% trabaja con un 95%
de confianza.de confianza.
Se dice que se Se dice que se trabaja con un 95% trabaja con un 95%
de confianza.de confianza.
0,25 0,25
95%
4,303tt 4,303tt
=
1 11 1 1ˆ ˆ* *t b t bb t S b t S
1 1 1 11 1 1 1 1ˆ ˆ ˆ ˆ* , * / * *t b t b t b t bb t S b t S b t S b t S
EXPERIMENTO
Es cualquier proceso planeado que da lugar a observaciones o a recolección de datos.
EXPERIMENTO ALEATORIO
Es aquel cuyos resultados no pueden predecirse antes de su realización y por lo tanto, están sujetos al azar.
Ejemplo: Lanzamiento de moneda, lanzamiento de un dado.
ESPACIO MUESTRAL
Es el conjunto integrado por todos los resultados posibles de un experimento.
EVENTOS O SUCESOS
Corresponde a una sub-colección o subconjunto del
EVENTO COMPLEMENTARIO
Si es un evento contenido en un espacio muestral , entonces el evento
complementario denotado por (E complemento) es el que contiene todos los
elementos que están en pero no en .
Suponga que es un evento de algún experimento como un evento , ocurre o no
ocurre, entonces el estará compuesto por los eventos de y
S
Diagrama de Venn, el cual muestra un espacio muestral y tres eventos.
EVENTOS COMPUESTOS
Si E y F (como eventos), son eventos entonces la ocurrencia de E ó F se denota por ó que ambos ocurran
EVENTOS MUTUAMENTE EXCLUYENTES.
Dos eventos son mutuamente excluyentes cuando no tienen resultados en común (elementos), es decir,
Ejemplo: suponga que un experimento consiste en examinar 3 fusibles, cada fusible puede ser defectuoso (D) o no defectuoso (B).
a) Determine la cardinalidad del espacio muestral.(cuantos elementos tiene el espacio muestral)
b) Determine el espacio muestral.
BB
DB
BD
D
DD
BD
DB
E
c) Obtenga los siguientes eventos:
que el primer fusible sea defectuoso{DBD-DDD-DDB-DBB}
que a lo mas un fusible sea defectuoso (máximo uno){BBD-BDB-BBB-DBB}
Sale bueno o Sale bueno o malomalo
Sale bueno o Sale bueno o malomalo
Cantidad de Cantidad de fusiblesfusibles
Cantidad de Cantidad de fusiblesfusibles
que a lo menos un fusible sea defectuoso
que a lo sumo dos fusibles sean defectuosos (máximo)
que ningún fusible sea defectuoso.
Use el diagrama de Venn para ilustrar la siguiente información, sea el espacio muestral 1,2,3,4,5,6,7,8
El evento
CONCEPTO DE PROBABILIDAD
Si un experimento tiene un espacio muestral y un evento está definido en ,
entonces la probabilidad de es un número real al que se le denomina la
probabilidad de un evento o simplemente la probabilidad de .
La probabilidad satisface las siguientes propiedades.:
1) (para todo evento que pertenece al espacio muestral)
2)
3) Para cualquier número finito k de eventos mutuamente excluyentes definidos en S
S
8
5
7
2
3 4
61
P EOcurre o no
ocurreOcurre
0 0,5 1
TEOREMAS DE PROBABILIDAD BÁSICA
TEOREMA 1TEOREMA 1
Si (fi) es un conjunto vacío entonces la probabilidad de es 0.
TEOREMA 2TEOREMA 2
Si A y B se definen en y si entonces A y B se dice que son mutuamente
excluyentes y la probabilidad de que ocurra A o B es:
TEOREMA 3TEOREMA 3
Si A y B se definen en y si distinto de cero
TEOREMA 4TEOREMA 4
Sea el complemento de en , entonces la
PROBABILIDAD CONJUNTA, MARGINAL Y CONDICIONAL
SEXO
HABITO hombres mujeresTotal
fumar
no fumar
Total
Fórmula general
1,2,3,4,5,6
1,3,5
1,6
A
B
P A B P A P B P A B
1,3,5,6
4
6
A B
P A B
3
62
6 1
6
46
46
Suponga que se elige una persona y se quiere saber si ésta fuma y sea hombre.
Si fuma y sea mujer
Que no fume y sea hombre
Que no fume y sea mujer
Suponga que se desea conocer la probabilidad de algún sin importar si es
hombre o mujer sin importar los .
Ejemplo :
Suponga que ahora que se elige aleatoriamente una persona y es mujer, cual es la probabilidad de que no fume.
A esto se le llama PROBABILIDAD PROBABILIDAD
CONJUNTACONJUNTA
A esto se le llama PROBABILIDAD PROBABILIDAD
CONJUNTACONJUNTA
2
1
2
1
ijj
i
iji
j
n
P An
nP B
n
Probabilidad
que sea hombre
Probabilidad que sea hombre
Probabilidad que sea mujer
Probabilidad que sea mujer
A esto se le llama PROBABILIDAD PROBABILIDAD
MARGINALMARGINAL
A esto se le llama PROBABILIDAD PROBABILIDAD
MARGINALMARGINAL
2
1
/ iji j
ijj
nP A A
n
A esto se le llama PROBABILIDAD PROBABILIDAD CONDICIONALCONDICIONAL
A esto se le llama PROBABILIDAD PROBABILIDAD CONDICIONALCONDICIONAL
Regla de la multiplicaciónRegla de la multiplicación
TEOREMA DE BAYES
El Teorema de Bayes nos permite calcular la probabilidad de un evento que no se conoce a partir de eventos anteriores, para entender este teorema consideremos que un articulo es manufacturado a través de dos máquinas.
Se sabe que la Maq A produce el 40% de la producción total y la Maq B el 60%, se sabe también que la taza de efecto de la Maq A es de un 2% y la Maq B un 4%.
Obtenga la probabilidad de que el articulo sea defectuoso y venga de la Maq A. La probabilidad de que venga de la Maq B sabiendo que es NO defectuoso.
ARTICULO
MÁQUINA MÁQUINA A B
* /P A P D A P D A
0,4*0,020,08
8%
0,4*0,980,39239,2%
* /c cP A P D A P A D
* /P B P D B P B D 0,6 * 0,04
0,024
24%
2* /CP B P D B P B D 0,6 * 0,96
0,57
57%
/
C
C
C
P B DP B D
P D
/C
C
C C
P B DP B D
P A D P B D
TEOREMA DE TEOREMA DE BAYESBAYES
TEOREMA DE TEOREMA DE BAYESBAYES
= 0,592
= 59,2%
Distribución de probabilidades: existen discretas y continuas, las discretas se encuentran la Bernoulli, Poison, hipergeométrica, multinomial y la geométrica entre otras.
Entre las distribuciones continuas las más importantes son La Normal, Uniforme, Exponencial, entre otras.
DISTRIBUCIÓN BINOMIAL
En estadística la Distribución Binomial es una distribución de probabilidad discreta del número de éxitos en una secuencia de “n” experimentos independientes, cada uno de los cuales tiene probabilidad “p” de ocurrir. La distribución Bernoulli es una distribución binomial con (el número de ensayos es igual a 1). Su distribución de probabilidad está dada por la siguiente función matemática.
donde
Responde a combinatoria
Responde a combinatoria
A B C D
2
4!4 6
2!2!C
2! 3*46
2! 2
p = probabilidad que ocurra (éxito)q = probabilidad que no ocurra
siempre que
Por ejemplo:La distribución binomial se usa para encontrar la probabilidad de sacar 5 caras y 7 sellos en 12 lanzamientos.
Sea x la variable aleatoria salga sello
Probabilidad de que a lo más salgan dos sellos.
Probabilidad de que por lo menos salga un sello.
= 12*0,5 = 6
= 12*0,5*0,5 = 3
n = 12x = 7b = (12, 0.5, 0.5, x = 7) = = 0,1933
= 19,33 %
= 0,00024 + 0,0029 + 0,016= 0,0193
1 1 1P x P x 1 0P x
1 0,00024 0,9997699,98%
La
Se tiene la siguiente información :
Calcular:
a)
b) La probabilidad de que a lo más salga un sello.
c) La probabilidad de que a lo menos salga un sello.
SOLUCIÓN:
Sabemos que
,
2 * *VAR x x n p q
* *n p q 1,732
22 2 3 2 * *n p q
3 * *n p q3 *0,5*0,5n
2
3
0,5n
12n
a)
=
=
1 shi nCr 1*0, ^ 1
shift EN
Dos veces
Ejercicio :
b)
0 1 2 3 4 5 6 7 8 9 10 12
0,0049
1
c)
c)
1
1
P x P x
P x P x
Un fabricante de marcos para ventana sabe por experiencia que un 5% de la producción tendrá algún tipo de defecto menor que requerirá un ligero ajuste. Cual es la probabilidad de que una muestra de 10 marcos para ventana ...
a) ninguno necesite arreglo 0b) por lo menos uno requerirá ajustes de 1 a 10c) mas de dos necesitarán arreglos de 3 a 10
DISTRIBUCION DE PROBABILIDADES PARA UNA VARIABLE ALEATORIADISTRIBUCION DE PROBABILIDADES PARA UNA VARIABLE ALEATORIA DISCRETA POISSONDISCRETA POISSON
a)
=
= 0,598
= 59,8%
a)
=
= 0,598
= 59,8%
b)
= 0,315
= 31,5%
b)
= 0,315
= 31,5%
c)
= 0,0746
= 7,46%
c)
= 0,0746
= 7,46%
Ejemplo:
a) Si el 2% de los libros encuadernados en cierto taller tienen encuadernación defectuosa, obtener la probabilidad de que 5 de 400 libros encuadernados en este taller tengan encuadernación defectuosa.
b) probabilidad de que a lo más dos (2) sean defectuosas.
c) la probabilidad de que a lo menos 2 sean defectuosos.
Ejercicio :Suponga que estamos investigando la seguridad de un cruce peligroso, los archivos de la policía indican una media de 5 accidentes por mes.
El número de accidentes está distribuido conforme a una distribución de Poisson, se pide calcular:
a)
0 0,0067 0,00671 0,0337 0,04042 0,0846 0,12443 0,140 0,26444 0,1754 0,4394
DISTRIBUCIÓN DE PROBABILIDADES PARA UNA VARIABLE ALEATORIADISTRIBUCIÓN DE PROBABILIDADES PARA UNA VARIABLE ALEATORIA CONDICIONAL DE XCONDICIONAL DE X
DISTRUBUCIÓN NORMALDISTRUBUCIÓN NORMAL
Mide la desviación de los datos respecto a la media.
2
1 2 21
, , *2
ix
f x e
2,x N
0,1Z N