of 28 /28
TECNOLOGICO DE ESTUDIOS SUPERIORES DEL ORIENTE DEL ESTADO DE MEXICO LOS REYES, LA PAZ jueves 26 de mayo DEL 2011 CANO RAMOS JOSÉ LUIS FERNÁNDEZ TRUJILLO BRENDA IVONNE SILVA ESCOBAR EDUARDO SOTO MORALES CEFERINO CARLOS GUTIERREZ REYNAGA LICENCIATURA EN CONTADURIA ESTADÍSTICAS ADMINISTRATIVAS UNIDAD III TIPOS DE DISTRIBUCIONES VARIABLES DISCRETAS Y CONTINUAS UNIDAD IV

Unidad III Y Unidad IV

Embed Size (px)

Text of Unidad III Y Unidad IV

TECNOLOGICO DE ESTUDIOS SUPERIORES DEL ORIENTE DEL ESTADO DE MEXICOLOS REYES, LA PAZ jueves 26 de mayo DEL 2011

CANO RAMOS JOS LUIS FERNNDEZ TRUJILLO BRENDA IVONNE SILVA ESCOBAR EDUARDO SOTO MORALES CEFERINO

CARLOS GUTIERREZ REYNAGA

LICENCIATURA EN CONTADURIA

ESTADSTICAS ADMINISTRATIVAS UNIDAD III TIPOS DE DISTRIBUCIONES VARIABLES DISCRETAS Y CONTINUAS UNIDAD IV MUESTREO Y ESTIMACIONES

DISTRIBUCIN BINOMIALEn estadstica, la distribucin binomial es una distribucin de probabilidad discreta que mide el nmero de xitos en una secuencia de n ensayos independientes de bernoulli con una probabilidad fija p de ocurrencia del xito entre los ensayos. es una de las distribuciones de probabilidad ms tiles ( control de calidad, produccin, investigacin). tiene que ver con el experimento aleatorio que produce en cada ensayo o prueba uno de dos resultados posibles mutuamente excluyentes: ocurrencia de un criterio o caracterstica especfico (llamado xito) y no ocurrencia de ste (llamado fracaso). los trminos o calificativos de "xito y fracaso" son solo etiquetas y su interpretacin puede no corresponder con el resultado positivo o negativo de un experimento en la realidad.

EJEMPLO DE LA DISTRIBUCIN DE LA PROBABILIDAD BINOMIAL1._ Una fbrica de medicamentos realiza pruebas clnicas con 100 nuevos frmacos potenciales. Cerca del 20% de las sustancias que alcanzan esta etapa reciben finalmente la aprobacin para su venta Cul es la probabilidad de que se aprueben al menos 15 de los 100 medicamentos? suponga que se satisfacen las hiptesis de la distribucin binomial, y utilice una aproximacin normal con correccin por continuidad. Solucin formula

La media (valor esperado) de y es la desviacin estndar es la probabilidad buscada es 15 o mas medicamentos se

aprueben. Como y= est incluido, la correccin por continuidad consiste en tomar el evento como 2._

Un examen consta de 10 preguntas al as que hay que contestar si o no suponiendo que a las personas que se le aplica no saben contestar a ninguna de las preguntas y,en consecuencia, contestan al azar, hallar :

a) probabilidad de obtener 5 aciertos b) probabilidad de obtener algn acierto c) probabilidad de obtener al menos 5 aciertos Es una distribucin binomial, la persona solo puede acertar o fallar la pregunta Suceso A= (xito)=acertar la pregunta Suceso Distribucin binomial de parmetrosA) Probabilidad de obtener 5 aciertos Obtener exactamente 5 aciertos k=5, aplicamos la formula:

P(x=5)=

b) Probabilidad de obtener algn acierto

El suceso obtener algn acierto es el suceso contrario a no obtener ningn acierto

c) probabilidad de obtener al menos 5 aciertos acertar 5 o mas

3._ la probabilidad de que un estudiante obtenga el ttulo de licenciado en farmacia es 0.3 Hallar la probabilidad de que un grupo de siete estudiantes matriculados en primer curso finalice la carreraa) b) c) d) ninguno de los siete finalice la carrera b)finalicen todos al menos dos acaben la carrera hallar la media y la desviacin tpica del nmero de alumnos que acabaran la carrera

A= obtener el tiulo A= no obtener el tiulo

A) ninguno de los siete finalice la carrera x=0

b) finalicen todos x=7 p(x=k)=

c) al menos dos terminan la carrera calculamos la probabilidad del suceso contrario , probabilidad que no termine ninguno mas la probabilidad de que termine uno

La probabilidad de que termine ninguno:

D) Media y desviacin tpica Media Desviacin tpica

DISTRIBUCIN DE PROBABILIDADES HIPERGEOMETRICAEn la distribucin Hipergeomtrica X=cantidad de resultados xitos en una muestra aleatoria (sin reposicin) de tamao n, tomada de una poblacin de tamao N y de la cual N1 satisface una caracterstica propiedad (xito) antes del muestreo y N2 no la satisface (fracaso). 1._ Consideramos tomar una muestra de 10 de las 87 cuentas de una compaa de las 87, 13 tenan errores. Encuentre p(2 cuentas incorrectas en la muestra. Solucin Tenemos

2._ Cul es la probabilidad de que todas sean del proveedor local? Sea X igual al nmero de piezas de la muestra del proveedor local. Entonces, x tiene una Distribucin hipergeomtrica y la probabilidad pedida es P(x=4). Por consiguiente, P(x=4)=

Cul es la probabilidad de que dos o ms piezas de la muestra sean del proveedor local?

Cul es la probabilidad de que al menos una pieza de la muestra sea del proveedor local?

DISTRIBUCIN DE PROBABILIDAD DE POISSONDescribe la cantidad de veces que ocurre un evento en un intervalo determinado (tiempo, volumen, temperatura, etc...).La distribucin se basa en dos supuestos: 1) La probabilidad es proporcional a la extensin del intervalo. 2) Los intervalos son independientes.

Esta distribucin es una forma lmite de la distribucin binomial, cuando la probabilidad de xito es bien pequea y n es grande ,a esta distribucin se llama "Ley de eventos improbables", lo cual significa que la probabilidad de p es bien pequea .La probabilidad de Poisson es una probabilidad discreta; puesto que se forma por conteo

En teora de probabilidad y estadstica, la distribucin de Poisson es una distribucin de probabilidad discreta que expresa, a partir de una frecuencia de ocurrencia media, la probabilidad que ocurra un determinado nmero de eventos durante cierto periodo de tiempo.

EJEMPLOS DE LA DISTRIBUCIN DE POISSON Suponga que y el nmero de trabajos que llegan a un centro de clculo en un lapso de media hora, tiene una distribucin de poisson con una media de 0.2 por minuto. Utilice una aproximacin normal para encontrar P (Y 10). SOLUCIN =( 0.2/minuto ) = 6 de la tabla 3 del apndice tenemos queP ( Y 10 ) = P

= P ( Z 1.63 ) = .9484

1._ Si en una empresa se presentan para cubrir dos vacantes 13 aspirantes de los cuales 5 son hombres y 8 son mujeres, calcular " El nmero de hombres contratados." N = {13 aspirantes para cubrir 2 vacantes} A = {Nmero de hombres contratados} E0 = Se contratan x0 = 0 hombres, equivale a contratar (n - x0) = 2 mujeres. E1 = Se contratan x1 = 1 hombres, equivale a contratar (n - x1) = 1 mujeres. E2 = Se contratan x2 = 2 hombres, equivale a contratar (n - x2) = 0 mujeres. E M=5 X=0 E N-M =8 n-x = 2 N =13 n =2

Desarrollando N = 13 total de aspirantes M = 5 aspirantes hombres N-M = 8 aspirantes mujer n = 2 vacantes totales x = 0,1,2 hombres posibles a contratar n-x = 2,1,0 mujeres posibles a contratar 5 8 0 2 P (E ) = P (0,13,5,2) = 13 2 = 28 = 0.3588 = 35.88 % 78

5 8 1 1 P(E1) = P (1,13,5,2) = 13 2 = 40 = 0.5128 = 51.28 % 78

5 8 2 0 P (E2) = P (2,13,5,2) = 13 2 MEDIDAS DE TENDENCIA CENTRAL Y D DISPESIN=n M N

= 10 = 0.1282 = 12.82 % 78

DISTRIBUCIN NORMALse llama distribucin normal, distribucin de Gauss o distribucin gaussiana, a una de las distribuciones de probabilidad de variable continua que con ms frecuencia aparece en fenmenos reales

Ejercicio de distribucin normal 1._La media y los que de los pesos de 500 estudiantes de un colegio es 70 kg y la desviacin tpica 3 kg. Suponiendo que los pesos se distribuyen normalmente, hallar cuntos estudiantes pesan: Entre 60 kg y 75 kg. = 0.95252. Ms de 90 kg.

3. Menos de 64 kg.

4.64 kg. p 5.64 kg o menos.

Ejercicio 1. DE LA DISTRIBUCION NORMAL COMO UNA APROXIMACION DE LA DISTRIBUCION BINOMIAL. El director del programa de entrenamiento desea saber la probabilidad de que un participante escogido al azar requiera entre 550 y 650 horas para completar el trabajo requerido: Formula es la probabilidad aleatoria este entre la media y 650 horas. Calculo de valor de z para el punto correspondiente a 550 horas. desviacin estndar. Ejercicio 2. Cul es la probabilidad de que un candidato escogido al azar se tome entre 420 y 570 horas para completar el programa?

Formula:

Valor de z para 420 0.2580 probabilidad de que la variable aleatoria se encuentre entre la media y 570 horas probabilidad de que la variable aleatoria se encuentre entre la media y 420 horas 0.5461 probabilidad de que la variable aleatoria se encuentre entre 420 y 570

MUESTREO Y ESTIMACIONES.4.1 DEFINICIN DE MUESTREO. Definicin. Un muestreo es la seleccin de una muestra a partir de una poblacin, entendida como muestra un subconjunto, elegido de un conjunto mayor usualmente de manera aleatoria, para realizar un estudio estadstico. Al elegir una muestra, se espera que los datos estadsticos sean proporcionales a la poblacin, y por lo tanto, que las propiedades sean extrapolables a la poblacin. Este proceso permite ahorrar recursos, obteniendo resultados parecidos si se realizasen a toda la poblacin. Muestreo y estimaciones. 4.6 Intervalos de confianza para la media, con el uso de la distribucin Normal y t student.

Intervalos de Confianza para la Media con varianza conocida y con Varianza desconocida Estimacin de la media con conocida.

Es conocido de nosotros durante este curso, que en base a la distribucin maestral de medias que se gener en el tema anterior, la frmula para el calculo

TEOREMA DEL LMITE CENTRALEjemplos: 1.La renta media de los habitantes de un pas se distribuye uniformemente entre 4,0 millones ptas. y 10,0 millones ptas. Calcular la probabilidad de que al seleccionar al azar a 100 personas la suma de sus rentas supere los 725 millones ptas. Cada renta personal es una variable independiente que se distribuye segn una funcin uniforme. Por ello, a la suma de las rentas de 100 personas se le puede aplicar el Teorema Central del Lmite. La media y varianza de cada variable individual es: m = (4 + 10 ) / 2 = 7 s 2 = (10 - 4)^2 / 12 = 3 Por tanto, la suma de las 100 variables se distribuye segn una normal cuya media y varianza son: Media: n * m = 100 * 7 = 700 Varianza: n * s2 = 100 * 3 = 300 Para calcular la probabilidad de que la suma de las rentas sea superior a 725 millones, comenzamos por calcular el valor equivalente de la variable normal tipificada:

Luego: P (X > 725) = P (Y > 1,44) = 1 - P (Y < 1,44) = 1 - 0,9251 = 0,0749 Es decir, la probabilidad de que la suma de las rentas de 100 personas seleccionadas al azar supere los 725 millones de pesetas es tan slo del 7,49% Ejemplo: 2.En una asignatura del colegio la probabilidad de que te saquen a la pizarra en cada clase es del 10%. A lo largo del ao tienes 100 clases de esa asignatura. Cul es la probabilidad de tener que salir a la pizarra ms de 15 veces?

Se vuelve a aplicar el Teorema Central del Lmite. Salir a la pizarra es una variable independiente que sigue el modelo de distribucin de Bernouilli: "Salir a la pizarra", le damos el valor 1 y tiene una probabilidad del 0,10 "No salir a la pizarra", le damos el valor 0 y tiene una probabilidad del 0,9 La media y la varianza de cada variable independiente es: m = 0,10 s 2 = 0,10 * 0,90 = 0,09 Por tanto, la suma de las 100 variables se distribuye segn una normal cuya media y varianza son: Media: n * m = 100 * 0,10 = 10 Varianza: n * s2 = 100 * 0,09 = 9 Para calcular la probabilidad de salir a la pizarra ms de 15 veces, calculamos el valor equivalente de la variable normal tipificada: Luego: P (X > 15) = P (Y > 1,67) = 1 - P (Y < 1,67) = 1 - 0,9525 = 0,0475 Es decir, la probabilidad de tener que salir ms de 15 veces a la pizarra a lo largo del curso es tan slo del 4,75%

4.4 DETERMINACION DEL TAMAO DE LA UETRA DE UNA POBLACION

FORMULA:

Donde: n= Tamao de la muestra,

z= 1.96 para el 95% de confianza, 2.56 para el 99% p= Frecuencia esperada del factor a estudiar q= 1- p B= Precisin o error admitido El valor de n obtenido por esta frmula indica el tamao de la muestra para una poblacin infinita, a efectos prcticos se considera poblacin infinita cuando la muestra supone menos del 5% de la poblacin total. EJEMPLOS: 1. Supongamos que se desea realizar una encuesta sobre la brucelosis ovina. Se estima una prevalencia del 15% y se requiere un 5% de precisin sobre una poblacin de 2.000.000 de cabezas. El nivel de confianza se fija en el 95%. Formula:

Z= 1.96, p=0.15, q=0.85, B=0.05

2. En un proyecto realizado en una determinada comunidad se ha calculado que cerca del 30% (0,3) de los nios de la zona del proyecto padecen de malnutricin crnica. Este dato se basa en estadsticas nacionales sobre malnutricin en las zonas rurales. Si el nivel de confianza se fija en el 95%. Z= 1.96, p=0.30, q=0.70, B=0.05 FORMULA

4.5 INTERVALOS DE CONFIANZA PARA LA MEDIDA, CON EL USO DE LA DISTRIBUCIN NORMAL Y t STUDENT Ejemplo: El valor t con = 14 grados de libertad que deja un rea de 0.025 a la izquierda, y por tanto un rea de 0.975 a la derecha, es

Si se observa la tabla, el rea sombreada de la curva es de la cola derecha, es por esto que se tiene que hacer la resta de . La manera de encontrar el valor de t es buscar el valor de en el primer rengln de la tabla y luego buscar los grados de libertad en la primer columna y donde se intercepten y se obtendr el valor de t.

Ejemplo: Encuentre la probabilidad de t0.025 < t < t0.05. Solucin 0.025 0.05

Como t0.05 deja un rea de 0.05 a la derecha, y t0.025 deja un rea de 0.025 a la izquierda, encontramos un rea total de 1-0.05-0.025 = 0.925.

Ejemplo: Encuentre k tal que P(k < t < -1.761) = 0.045, para una muestra aleatoria de tamao 15 que se selecciona de una distribucin normal. Solucin: 0.045

K

t=1.761

Si se busca en la tabla el valor de t =1.761 con 14 grados de libertad nos damos cuenta que a este valor le corresponde un rea de 0.05 a la izquierda, por ser negativo el valor. Entonces si se resta 0.05 y 0.045 se tiene un valor de 0.005, que equivale a . Luego se busca el valor de 0.005 en el primer rengln con 14 grados de libertad y se obtiene un valor de t = 2.977, pero como el valor de est en el extremo izquierdo de la curva entonces la respuesta es t = -2.977 por lo tanto:

Ejemplo: Un ingeniero qumico afirma que el rendimiento medio de la poblacin de cierto proceso en lotes es 500 gramos por milmetro de materia prima. Para verificar esta afirmacin toma una muestra de 25 lotes cada mes. Si el valor de t calculado cae entre t0.05 y t0.05, queda satisfecho con su afirmacin. Qu conclusin extraera de una muestra que tiene una media de 518 gramos por milmetro y una desviacin estndar de 40 gramos? Suponga que la distribucin de rendimientos es aproximadamente normal. Solucin: De la tabla encontramos que t0.05 para 24 grados de libertad es de 1.711. Por tanto, el fabricante queda satisfecho con esta afirmacin si una muestra de 25 lotes rinde un valor t entre 1.711 y 1.711. Se procede a calcular el valor de t:

4.5 Determinacin del tamao de la muestra de una poblacin.Determinacin del tamao de una muestra para medias, y Proporciones

TAMAO DE LA MUESTRA

A la hora de determinar el tamao que debe alcanzar una muestra hay que tomar en cuenta varios factores: el tipo de muestreo, el parmetro a estimar, el error muestral admisible, la varianza poblacional y el nivel de confianza. Por ello antes de presentar algunos casos sencillos de clculo del tamao muestral delimitemos estos factores.

Para calcular el tamao de una muestra hay que tomar en cuenta tres factores:1. El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la poblacin total. 2. El porcentaje de error que se pretende aceptar al momento de hacer la generalizacin. 3. El nivel de variabilidad que se calcula para comprobar la hiptesis. La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para generalizar los resultados obtenidos. Esto quiere decir que un porcentaje del 100% equivale a decir que no existe ninguna duda para generalizar tales resultados, pero tambin implica estudiar a la totalidad de los casos de la poblacin. Para evitar un costo muy alto para el estudio o debido a que en ocasiones llega a ser prcticamente imposible el estudio de todos los casos, entonces se busca un porcentaje de confianza menor. Comnmente en las investigaciones sociales se busca un 95%.

El tamao de la muestra: Al realizar un muestreo probabilstica nos debemos preguntar Cul es el nmero mnimo de unidades de anlisis ( personas, organizaciones, capitulo de telenovelas, etc), que se necesitan para conformar una

muestra ( n) que me asegure un error estndar menor que 0.01 ( fijado por el muestrista o investigador), dado que la poblacin

N es aproximadamente de tantos elementos.

En el tamao de una muestra de una poblacin tenemos que tener presente adems si es conocida o no la varianza poblacional. Para determinar el tamao de muestra necesario para estimar prefijado y conocida la varianza poblacional ( W (1) Ejercicio 1._ Se desea estimar el peso promedio de los sacos que son llenados por un nuevo instrumento en una industria. Se conoce que el peso de un saco que se llena con este instrumento es una variable aleatoria con distribucin normal. Si se supone que la desviacin tpica del peso es de 0,5 kg. Determine el tamao de muestra aleatoria necesaria para determinar una probabilidad igual a 0,95 de que el estimado y el parmetro se diferencien modularmente en menos de 0,1 kg. Solucin:

Q

con un error mximo permisible d

2

) podemos utilizar la formula:

Ejercicio2._ De una poblacin de 1 176 adolescentes de una ciudad X se desea conocer la aceptacin por los programas humorsticos televisivos y para ello se desea tomar una muestra por lo que se necesita saber la cantidad de adolescentes que deben entrevistar para tener una informacin adecuada con error estandar menor de 0.015 al 90 % de confiabilidad. Solucin: N = 1 176 se = 0,015

W 2 ! ( se) 2 ! (0,015) 2 ! 0.000225 s 2 ! p (1 p ) ! 0,9(1 0,9) ! 0,09

por lo que

0,09 ! 400 2 0,000225 W 400 n' ! ! 298 n! 1 n' N 1 400 1176 n' ! !Es decir para realizar la investigacin se necesita una muestra de al menos 298 adolescentes.

s2

1.- Obtener el tamao muestral imaginando que N"E

Donde: : z correspondiente al nivel de confianza elegido : varianza poblacional e: error mximo 2.- Comprobar si se cumple

Si esta condicin se cumple el proceso termina aqu, y ese es el tamao adecuado que debemos muestrear. Si no se cumple, pasamos a una tercera fase: 3.- Obtener el tamao de la muestra segn la siguiente frmula:

Veamos un ejemplo: La Consejera de Trabajo planea un estudio con el inters de conocer el promedio de horas semanales trabajadas por las mujeres del servicio domstico. La muestra ser extrada de una poblacin de 10000 mujeres que figuran en los registros de la Seguridad Social y de las cuales se conoce a travs de un estudio piloto que su varianza es de 9.648. Trabajando con un nivel de confianza de 0.95 y estando dispuestos a admitir un error mximo de 0,1, cul debe ser el tamao muestral que Empleemos?. Buscamos en las tablas de la curva normal el valor de de confianza elegido: = 1. que corresponde con el nivel

1.96 y seguimos los pasos propuestos arriba.

2.- Comprobamos que no se cumple, pues en este caso 10000 < 3706 (3706 - 1); 10000 < 13730730 3.-

Tamao de muestra para estimar la proporcin de la poblacin

Para calcular el tamao de muestra para la estimacin de proporciones poblaciones hemos de tener en cuenta los mismos factores que en el caso de la media. La frmula que nos permitir determinar el tamao muestral es la siguiente:

donde : z correspondiente al nivel de confianza elegido P: proporcin de una categora de la variable e: error mximo N: tamao de la poblacin Siguiendo con el estudio planteado en el punto anterior, supongamos que tratamos de estimar la proporcin de mujeres que trabajan diariamente 10 horas o ms. De un estudio piloto se dedujo que P=0.30, fijamos el nivel de confianza en 0.95 y el error mximo 0.02.

Este es un valor muy por arriba de 1.711. Si se desea obtener la probabilidad de obtener un valor de t con 24 grados de libertad igual o mayor a 2.25 se busca en la tabla y es aproximadamente de 0.02. De aqu que es probable que el fabricante concluya que el proceso produce un mejor producto del que piensa.

4.5.1 DETERMINACION DEL TAMAO DE LA MUESTRA CON GRADO DE CONFIANZA Y ESTIMACIN DE .Ejemplo: En un lote de frascos para medicina, con una poblacin de 8000 unidades, se desea estimar la media de la capacidad en centmetros cbicos de los mismos. A travs de un premuestreo de tamao 35 se ha estimado que la desviacin estndar es de 2 centmetros cbicos. Si queremos tener una precisin 0.25 cms3, y un nivel de significancia del 5%. De que tamao debe de ser la muestra? DATOS: S = 2 cms3; N = 8000; d = 0.25 cms3; E = 0.05 (5%) Z E 2 = 1.96

Ejemplo: En una investigacin, se desea determinar en que proporcin los nios de una regin toman leche en el desayuno. Si se sabe que existen 1.500 nios y deseamos tener una precisin del 10 %, con un nivel de significancia del 5 % . De que tamao debe de ser la muestra? DATOS: N = 1500; d = 10 % = 0.1; = 5 % p = 0.5 y q = 0.5 (asumiendo varianza mxima). Z /2 = 1.96

Se deben de muestrear 90 nios.

4.6 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS 12.Ejercicio Se comparan dos tipos de rosca de tornillo para ver su resistencia ala tensin. Se prueban 50 piezas de cada tipo de cuerda bajo condiciones similares, la marca A tuvo una resistencia promedio a la tensin de 78.3 Kg, mientras que la marca B tuvo una resistencia promedio de 87.2 Kg. Se sabe de antemano que las desviaciones poblacionales son de 6.5 Kg para la marca A y 6.3 Kg para la B.

Determine el intervalo de confianza del 95% para la diferencia de las dos medias poblacionales. SOLUCIN

_1 = 5.6 Kg _2 = 6.3 Kg n1 = n2 = 50g 1- 2= -6.56 -11.24 La resistencia a la tensin de tornillos de la marca B es superior a la marca A. 4.7 UNA SOLA MUESTRA: ESTIMACIN DE LA PROPORCIN Ejemplos: 1. Un fabricante de reproductores de discos compactos utiliza un conjunto de pruebas amplias para evaluar la funcin elctrica de su producto. Todos los reproductores de discos compactos deben pasar todas las pruebas antes de venderse. Una muestra aleatoria de 500 reproductores tiene como resultado 15 que fallan en una o ms pruebas. Encuentre un intervalo de confianza de 90% para la proporcin de los reproductores de discos compactos de la poblacin que no pasan todas las pruebas. Solucin: n=500 p = 15/500 = 0.03 z(0.90) = 1.645

0.0237