28
TECNOLOGICO DE ESTUDIOS SUPERIORES DEL ORIENTE DEL ESTADO DE MEXICO LOS REYES, LA PAZ jueves 26 de mayo DEL 2011 CANO RAMOS JOSÉ LUIS FERNÁNDEZ TRUJILLO BRENDA IVONNE SILVA ESCOBAR EDUARDO SOTO MORALES CEFERINO CARLOS GUTIERREZ REYNAGA LICENCIATURA EN CONTADURIA ESTADÍSTICAS ADMINISTRATIVAS UNIDAD III TIPOS DE DISTRIBUCIONES VARIABLES DISCRETAS Y CONTINUAS UNIDAD IV

Unidad III Y Unidad IV

Embed Size (px)

Citation preview

Page 1: Unidad III Y Unidad IV

TECNOLOGICO DE ESTUDIOS SUPERIORES DEL ORIENTE DEL ESTADO

DE MEXICO

LOS REYES, LA PAZ jueves 26 de mayo DEL 2011

CANO RAMOS JOSÉ LUISFERNÁNDEZ TRUJILLO BRENDA IVONNE

SILVA ESCOBAR EDUARDOSOTO MORALES CEFERINO

CARLOS GUTIERREZ REYNAGA

LICENCIATURA EN CONTADURIA

ESTADÍSTICAS ADMINISTRATIVASUNIDAD III

TIPOS DE DISTRIBUCIONES VARIABLES DISCRETAS Y CONTINUAS

UNIDAD IV

MUESTREO Y ESTIMACIONES

Page 2: Unidad III Y Unidad IV

DISTRIBUCIÓN BINOMIAL

En estadística, la distribución binomial es una distribución de probabilidad discreta que mide el número de éxitos en una secuencia de n ensayos independientes de bernoulli con una probabilidad fija p de ocurrencia del éxito entre los ensayos.

es una de las distribuciones de probabilidad más útiles ( control de calidad, producción, investigación). tiene que ver con el experimento aleatorio que produce en cada ensayo o prueba uno de dos resultados posibles mutuamente excluyentes: ocurrencia de un criterio o característica específico (llamado éxito) y no ocurrencia de éste (llamado fracaso). los términos o calificativos de "éxito y fracaso" son solo etiquetas y su interpretación puede no corresponder con el resultado positivo o negativo de un experimento en la realidad.

EJEMPLO DE LA DISTRIBUCIÓN DE LA PROBABILIDAD BINOMIAL1._

Una fábrica de medicamentos realiza pruebas clínicas con 100 nuevos fármacos potenciales. Cerca del 20% de las sustancias que alcanzan esta etapa reciben finalmente la aprobación para su venta ¿Cuál es la probabilidad de que se aprueben al menos 15 de los 100 medicamentos? suponga que se satisfacen las hipótesis de la distribución binomial, y utilice una aproximación normal con corrección por continuidad.Solución formula

p ( x=k ) [ nk ] pk .qn−k

La media (valor esperado) de y es μ=100 (0.2 )=20 ; la desviación estándar es

σ √100 (0.2 ) (0.8 )=4.0¿

¿la probabilidad buscada es 15 o mas medicamentos se aprueben.

Como y= está incluido, la corrección por continuidad consiste en tomar el evento como y ≥14.5

p¿

2._

Un examen consta de 10 preguntas al as que hay que contestar si o no suponiendo que a las personas que se le aplica no saben contestar a ninguna de las preguntas y,en consecuencia, contestan al azar, hallar :a) probabilidad de obtener 5 aciertos

Page 3: Unidad III Y Unidad IV

b) probabilidad de obtener algún aciertoc) probabilidad de obtener al menos 5 aciertos Es una distribución binomial, la persona solo puede acertar o fallar la preguntaSuceso A= (éxito)=acertar la pregunta→ p=p ( A )0.5SucesoA=noacertar la pregunta→q=p ( A )=0.5Distribución binomial de parámetros n=10 , p=0.5→B (10 ;0.5 )

A) Probabilidad de obtener 5 aciertosObtener exactamente 5 aciertos k=5, aplicamos la formula:

P ( X=K )=[ nk ]Pk .qnk →k=5n=10 p=0.5q=0.5→P ( x=5 )=[ 105 ] . (0.5 )5 . (0.5 )10−5

[ nk ]= n

k ! (n−k )!numeros combinatorios→ [ 105 ]=¿

P(x=5)=¿b) Probabilidad de obtener algún aciertop ( x≥1 )=p ( x=1 )+ p ( x=2 )+ p ( x=3 )+ p ( x=4 )+p (x=5 )+p (x=6 )+ p ( x=7 )+ p ( x=8 )+ p ( x=9 )+ p (x=10)El suceso “obtener algún acierto “es el suceso contrario a “no obtener ningún acierto “

P ( X=0 )=[ 100 ] . (0.5 ) . (0.5 )10=0.00100

px (≥1 )=1−p ( x=0 )→ p ( x≥1 )=−0.00100=0.999c) probabilidad de obtener al menos 5 aciertos acertar 5 o masp ( x≥5 )=p ( x=5 )+ p ( x=6 )+ p ( x=7 )+ p ( X=8 )+ p ( x=9 )+ p (x=10 )p ( x≥5 )=0.2461+0.2051+0.1172+0.0439+0.0098+0.0010=06231

3._

la probabilidad de que un estudiante obtenga el título de licenciado en farmacia es 0.3Hallar la probabilidad de que un grupo de siete estudiantes matriculados en primer curso finalice la carrera

a) ninguno de los siete finalice la carrerab) b)finalicen todosc) al menos dos acaben la carrera d) hallar la media y la desviación típica del número de alumnos que acabaran la carrera

A=” obtener el tiulo”→ p=p ( A )=0.3A= “ no obtener el tiulo “→q=P ( A )=1−0.3=0.7→B=7 ;0.3

A) ninguno de los siete finalice la carrera x=0

P ( x=k )=[ nk ] pk .qn−k →k=0n=7 p=0.3q=0.7→ p ( x=0 )=[ 70 ] . (0.3 ) . (0.7 )7−0=0.0824

b) finalicen todos x=7

Page 4: Unidad III Y Unidad IV

p(x=k)=[ nk ] pk .qn−k →k=7n=3 p=0.3q=0.7→ p=( x=7 )=[ 77 ] . (0.3 )7. (0.7 )0=0.0002

c) al menos dos terminan la carrerax≥2calculamos la probabilidad del suceso contrario , probabilidad que no termine ninguno mas la probabilidad de que termine uno P ( x≥2 )=1−¿

La probabilidad de que termine ninguno:P ( X=1 )=[ 71 ] . (0.3 )1. (0.7 )6=0.2471

P ( X ≥2 )=1−[ P ( X=0 )+P ( X=1 )→P ( X ≥2 )=1−[0.0824+0.2471 ] ]=06705D) Media y desviación típicaMedia μ=n . p=7.0,3=2.1Desviación típica σ √n . p .q √7.0,3 .0,7=1.2124

DISTRIBUCIÓN DE PROBABILIDADES HIPERGEOMETRICA

En la distribución Hipergeométrica X=cantidad de resultados éxitos en una muestra aleatoria (sin reposición) de tamaño n, tomada de una población de tamaño N y de la cual N1 satisface una característica ó propiedad (éxito) antes del muestreo y N2 no la satisface (fracaso).

1._Consideramos tomar una muestra de 10 de las 87 cuentas de una compañía de las 87, 13 tenían errores. Encuentre p(2 cuentas incorrectas en la muestra. SoluciónTenemos N=87 , n=10 , Nϵ=13 y , por lo tanto ,Nf =74 ;queremos p ( y=2 ) .

pγ (2 )(132 )

7410

−2

❑❑ ( 8710 )

=1,175,600,000,0004000,800,000,000

=.294

2._¿Cuál es la probabilidad de que todas sean del proveedor local?Sea X igual al número de piezas de la muestra del proveedor local. Entonces, x tiene unaDistribución hipergeométrica y la probabilidad pedida es P(x=4). Por consiguiente,

Page 5: Unidad III Y Unidad IV

P(x=4)=

P ( x=4 )¿(1004 )(2000 )

(3004 )=0.0119

¿Cuál es la probabilidad de que dos o más piezas de la muestra sean del proveedor local?

P ( x≥2 )

n=¿(1002 )(2002 )

(3004 )+(1003 )(2001 )

(3004 )+(1004 )(2000 )

(3004 )=0.298+0.098+.0119=0.408¿

¿Cuál es la probabilidad de que al menos una pieza de la muestra sea del proveedor local?

P ( X ≥ )=1−P ( X=0 )=1−(1000 )(2004 )

(3004 )+0.196

DISTRIBUCIÓN DE PROBABILIDAD DE POISSONDescribe la cantidad de veces que ocurre un evento en un intervalo determinado (tiempo, volumen, temperatura, etc...).La distribución se basa en dos supuestos:

1°) La probabilidad es proporcional a la extensión del intervalo.

2°) Los intervalos son independientes.

Esta distribución es una forma límite de la distribución binomial, cuando la probabilidad de éxito es bien pequeña y n es grande ,a esta distribución se llama "Ley de eventos improbables", lo cual significa que la probabilidad de p es bien pequeña .La probabilidad de Poisson es una probabilidad discreta; puesto que se forma por conteo

En teoría de probabilidad y estadística, la distribución de Poisson es una distribución de probabilidad discreta que expresa, a partir de una frecuencia de ocurrencia media, la

Page 6: Unidad III Y Unidad IV

probabilidad que ocurra un determinado número de eventos durante cierto periodo de tiempo.

EJEMPLOS DE LA DISTRIBUCIÓN DE POISSON

Suponga que “y” el número de trabajos que llegan a un centro de cálculo en un lapso de media hora, tiene una distribución de poisson con una media de 0.2 por minuto. Utilice una aproximación normal para encontrar P (Y≤10).SOLUCIÓN µ =( 0.2/minuto ) = 6 de la tabla 3 del apéndice tenemos queP ( Y ≤ 10 ) = P ( Z≤10−6 ) = P ( Z ≤ 1.63 ) = .9484 √6

1._Si en una empresa se presentan para cubrir dos vacantes 13 aspirantes de los cuales 5 son hombres y 8 son mujeres, calcular " El número de hombres contratados."

N = {13 aspirantes para cubrir 2 vacantes}A = {Número de hombres contratados}E0 = Se contratan x0 = 0 hombres, equivale a contratar (n - x0) = 2 mujeres.E1 = Se contratan x1 = 1 hombres, equivale a contratar (n - x1) = 1 mujeres.E2 = Se contratan x2 = 2 hombres, equivale a contratar (n - x2) = 0 mujeres.

E E

M = 5 N-M =8 N =13

X = 0 n-x = 2 n =2

DesarrollandoN = 13 total de aspirantesM = 5 aspirantes hombresN-M = 8 aspirantes mujer n = 2 vacantes totalesx = 0,1,2 hombres posibles a contratarn-x = 2,1,0 mujeres posibles a contratar

Page 7: Unidad III Y Unidad IV

5 8 0 2 P (Eо) = P (0,13,5,2) = = 28 = 0.3588 = 35.88 % 13 78 2

5 8 1 1P(E1) = P (1,13,5,2) = = 40 = 0.5128 = 51.28 % 13 78 2

5 8 2 0 P (E2) = P (2,13,5,2) = = 10 = 0.1282 = 12.82 % 13 78 2MEDIDAS DE TENDENCIA CENTRAL Y D DISPESIÓN µ = n M N

DISTRIBUCIÓN NORMAL

se llama distribución normal, distribución de Gauss o distribución gaussiana, a una de las distribuciones de probabilidad de variable continua que con más frecuencia aparece en fenómenos reales

Ejercicio de distribución normal1._La media y los que de los pesos de 500 estudiantes de un colegio es 70 kg y la desviación típica 3 kg. Suponiendo que los pesos se distribuyen normalmente, hallar cuántos estudiantes pesan:Entre 60 kg y 75 kg.

P ¿= 0.9525-0.952 (1−0.9996 )=09521.500=476

Page 8: Unidad III Y Unidad IV

2. Más de 90 kg.

p ( x>90 )=p( z> 90−703 )=p (z>6.67 )=1−p ( Z<6.67 )=1−1=0.500=0

3. Menos de 64 kg.

p ( x<64 )=p (Z< 64−703 )=p (Z<−2 )=1−p (Z ≤2 )=1−07772=0.02128 .500=11

4.64 kg.

pp ( x=64 )=p(z=64−703 )=p (z=−2 )=0.500=0

5.64 kg o menos.p ( x≤64 )=p (x<64 )=11

Ejercicio 1.DE LA DISTRIBUCION NORMAL COMO UNA APROXIMACION DE LA DISTRIBUCION BINOMIAL.El director del programa de entrenamiento desea saber la probabilidad de que un participante escogido al azar requiera entre 550 y 650 horas para completar el trabajo requerido:

Formula Z= x−μσ

Z=650−500100

=150100

=1.5=¿ es la probabilidad aleatoria este entre la media y 650 horas.

Calculo de valor de z para el punto correspondiente a 550 horas.

Zx−μ

σ=580−500

100= 50100

=0.5=.1915desviación estándar.

Ejercicio 2.¿Cuál es la probabilidad de que un candidato escogido al azar se tome entre 420 y 570 horas para completar el programa?

Formula: Z= x−μσ

Z570−500100

= 70100

=0.7=.2580

Valor de z para 420 420−500100

=−80100

=−0.8=0.2881

0.2580 probabilidad de que la variable aleatoria se encuentre entre la media y 570 horas+0.2881 probabilidad de que la variable aleatoria se encuentre entre la media y 420 horas 0.5461 probabilidad de que la variable aleatoria se encuentre entre 420 y 570

Page 9: Unidad III Y Unidad IV

MUESTREO Y ESTIMACIONES.

4.1 DEFINICIÓN DE MUESTREO.

Definición.

Un muestreo es la selección de una muestra a partir de una población, entendida como muestra un subconjunto, elegido de un conjunto mayor usualmente de manera aleatoria, para realizar un estudio estadístico.

Al elegir una muestra, se espera que los datos estadísticos sean proporcionales a la población, y por lo tanto, que las propiedades sean extrapolables a la población. Este proceso permite ahorrar recursos, obteniendo resultados parecidos si se realizasen a toda la población.

Muestreo y estimaciones.

4.6 Intervalos de confianza para la media, con el uso de la distribución Normal y “t” student.

Intervalos de Confianza para la Media con varianza conocida y con Varianza desconocida

Estimación de la media con conocida.

Es conocido de nosotros durante este curso, que en base a la distribución maestral de medias que se generó en el tema anterior, la fórmula para el calculo

TEOREMA DEL LÍMITE CENTRAL

Ejemplos: 1.-

La renta media de los habitantes de un país se distribuye uniformemente entre 4,0 millones ptas. y 10,0 millones ptas. Calcular la probabilidad de que al seleccionar al azar a 100 personas la suma de sus rentas supere los 725 millones ptas.

Page 10: Unidad III Y Unidad IV

Cada renta personal es una variable independiente que se distribuye según una función uniforme. Por ello, a la suma de las rentas de 100 personas se le puede aplicar el Teorema Central del Límite.

La media y varianza de cada variable individual es:

m = (4 + 10 ) / 2 = 7

s 2 = (10 - 4)^2 / 12 = 3

Por tanto, la suma de las 100 variables se distribuye según una normal cuya media y varianza son:

Media: n * m = 100 * 7 = 700

Varianza: n * s2 = 100 * 3 = 300

Para calcular la probabilidad de que la suma de las rentas sea superior a 725 millones, comenzamos por calcular el valor equivalente de la variable normal tipificada:

y=725−70017.3

=1.44

Luego:

P (X > 725) = P (Y > 1,44) = 1 - P (Y < 1,44) = 1 - 0,9251 = 0,0749

Es decir, la probabilidad de que la suma de las rentas de 100 personas seleccionadas al azar supere los 725 millones de pesetas es tan sólo del 7,49%

Ejemplo: 2.-

En una asignatura del colegio la probabilidad de que te saquen a la pizarra en cada clase es del 10%. A lo largo del año tienes 100 clases de esa asignatura. ¿Cuál es la probabilidad de tener que salir a la pizarra más de 15 veces?

Se vuelve a aplicar el Teorema Central del Límite.

Salir a la pizarra es una variable independiente que sigue el modelo de distribución de Bernouilli:

"Salir a la pizarra", le damos el valor 1 y tiene una probabilidad del 0,10

Page 11: Unidad III Y Unidad IV

"No salir a la pizarra", le damos el valor 0 y tiene una probabilidad del 0,9

La media y la varianza de cada variable independiente es:

m = 0,10

s 2 = 0,10 * 0,90 = 0,09

Por tanto, la suma de las 100 variables se distribuye según una normal cuya media y varianza son:

Media: n * m = 100 * 0,10 = 10

Varianza: n * s2 = 100 * 0,09 = 9

Para calcular la probabilidad de salir a la pizarra más de 15 veces, calculamos el valor equivalente de la variable normal tipificada:

Y=15−103.0

=1.67

Luego:

P (X > 15) = P (Y > 1,67) = 1 - P (Y < 1,67) = 1 - 0,9525 = 0,0475

Es decir, la probabilidad de tener que salir más de 15 veces a la pizarra a lo largo del curso es tan sólo del 4,75%

4.4 DETERMINACION DEL TAMAÑO DE LA UETRA DE UNA POBLACION

FORMULA:

n= z2 pqB2

Donde: n= Tamaño de la muestra,z= 1.96 para el 95% de confianza, 2.56 para el 99%p= Frecuencia esperada del factor a estudiarq= 1- pB= Precisión o error admitidoEl valor de n obtenido por esta fórmula indica el tamaño de la muestra para una población infinita, a efectos prácticos se considera población infinita cuando la muestra supone menos del 5% de la población total.

Page 12: Unidad III Y Unidad IV

EJEMPLOS:1. Supongamos que se desea realizar una encuesta sobre la brucelosis ovina. Se

estima una prevalencia del 15% y se requiere un 5% de precisión sobre una población de 2.000.000 de cabezas. El nivel de confianza se fija en el 95%.

Formula: n= z2 pqB2

Z= 1.96, p=0.15, q=0.85, B=0.05

n=1.962 ∙0.15 ∙0.850.052

n= .489804.0025

=196

n=196animales seleccionados

2. En un proyecto realizado en una determinada comunidad se ha calculado que cerca del 30% (0,3) de los niños de la zona del proyecto padecen de malnutrición crónica. Este dato se basa en estadísticas nacionales sobre malnutrición en las zonas rurales. Si el nivel de confianza se fija en el 95%.

FORMULA n= z2 pqB2

Z= 1.96, p=0.30, q=0.70, B=0.05

n=1.962 ∙0.30 ∙0.700.052

n= .806736.0025

=323

n=323∋ños seleccionados

4.5 INTERVALOS DE CONFIANZA PARA LA MEDIDA, CON EL USO DE LA DISTRIBUCIÓN NORMAL Y “t” STUDENT

Ejemplo:

El valor t con = 14 grados de libertad que deja un área de 0.025 a la izquierda, y por tanto un área de 0.975 a la derecha, es

t .975=t.025=¿2.145¿

Page 13: Unidad III Y Unidad IV

Si se observa la tabla, el área sombreada de la curva es de la cola derecha, es por esto que se tiene que hacer la resta de . La manera de encontrar el valor de t es buscar el valor de en el primer renglón de la tabla y luego buscar los grados de libertad en la

primer columna y donde se intercepten y se obtendrá el valor de t.

Ejemplo:

Encuentre la probabilidad de –t0.025 < t < t0.05.

Solución

0.025 0.05

Como t0.05 deja un área de 0.05 a la derecha, y –t0.025 deja un área de 0.025 a la izquierda, encontramos un área total de 1-0.05-0.025 = 0.925.

P (−t .025<t <t .05 )=.925

Ejemplo:

Encuentre k tal que P(k < t < -1.761) = 0.045, para una muestra aleatoria de tamaño 15 que se selecciona de una distribución normal.

Solución:

0.045

K t=1.761

Page 14: Unidad III Y Unidad IV

Si se busca en la tabla el valor de t =1.761 con 14 grados de libertad nos damos cuenta que a este valor le corresponde un área de 0.05 a la izquierda, por ser negativo el valor. Entonces si se resta 0.05 y 0.045 se tiene un valor de 0.005, que equivale a . Luego se busca el valor de 0.005 en el primer renglón con 14 grados de libertad y se obtiene un valor de t = 2.977, pero como el valor de está en el extremo izquierdo de la curva entonces la respuesta es t = -2.977 por lo tanto:

P (−2.977<t<−1.761 )=.045

Ejemplo:

Un ingeniero químico afirma que el rendimiento medio de la población de cierto proceso en lotes es 500 gramos por milímetro de materia prima. Para verificar esta afirmación toma una muestra de 25 lotes cada mes. Si el valor de t calculado cae entre –t0.05 y t0.05, queda satisfecho con su afirmación. ¿Qué conclusión extraería de una muestra que tiene una media de 518 gramos por milímetro y una desviación estándar de 40 gramos? Suponga que la distribución de rendimientos es aproximadamente normal.

Solución:

De la tabla encontramos que t0.05 para 24 grados de libertad es de 1.711. Por tanto, el fabricante queda satisfecho con esta afirmación si una muestra de 25 lotes rinde un valor t entre –1.711 y 1.711.

Se procede a calcular el valor de t:

t= x−μs

√n

=518−50040

√25

=2.25

4.5 Determinación del tamaño de la muestra de una población.

Page 15: Unidad III Y Unidad IV

Determinación del tamaño de una muestra para medias, y Proporciones

TAMAÑO DE LA MUESTRA

A la hora de determinar el tamaño que debe alcanzar una muestra hay que tomar en cuenta varios factores: el tipo de muestreo, el parámetro a estimar, el error muestral admisible, la varianza poblacional y el nivel de confianza. Por ello antes de presentar algunos casos sencillos de cálculo del tamaño muestral delimitemos estos factores.

Para calcular el tamaño de una muestra hay que tomar en cuenta tres factores:

1. El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la población total.

2. El porcentaje de error que se pretende aceptar al momento de hacer la generalización.

3. El nivel de variabilidad que se calcula para comprobar la hipótesis.

La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para generalizar los resultados obtenidos. Esto quiere decir que un porcentaje del 100% equivale a decir que no existe ninguna duda para generalizar tales resultados, pero también implica estudiar a la totalidad de los casos de la población. Para evitar un costo muy alto para el estudio o debido a que en ocasiones llega a ser prácticamente imposible el estudio de todos los casos, entonces se busca un porcentaje de confianza menor. Comúnmente en las investigaciones sociales se busca un 95%.

El tamaño de la muestra:

Al realizar un muestreo probabilística nos debemos preguntar ¿Cuál es el número mínimo de unidades de análisis ( personas, organizaciones, capitulo de telenovelas, etc), que se necesitan para conformar una

muestra (n )que me asegure un error estándar menor que 0.01 ( fijado por el muestrista o investigador),

dado que la población N es aproximadamente de tantos elementos.

Page 16: Unidad III Y Unidad IV

En el tamaño de una muestra de una población tenemos que tener presente además si es conocida o no la varianza poblacional.

Para determinar el tamaño de muestra necesario para estimar μ con un error máximo permisibled

prefijado y conocida la varianza poblacional (σ2

) podemos utilizar la formula:

n=(σ z 1−∝∝2

d )(1)

Ejercicio 1._

Se desea estimar el peso promedio de los sacos que son llenados por un nuevo instrumento en una industria. Se conoce que el peso de un saco que se llena con este instrumento es una variable aleatoria con distribución normal. Si se supone que la desviación típica del peso es de 0,5 kg. Determine el tamaño de muestra aleatoria necesaria para determinar una probabilidad igual a 0,95 de que el estimado y el parámetro se diferencien modularmente en menos de 0,1 kg.

Solución: d=0,1σ=0,1

d=0,5

1−¿ σ=0,95

1−σ2=0,975

Z1=σ20,96

n=¿

Ejercicio2._

De una población de 1 176 adolescentes de una ciudad X se desea conocer la aceptación por los programas humorísticos televisivos y para ello se desea tomar una muestra por lo que se necesita saber la cantidad de adolescentes que deben entrevistar para tener una información adecuada con error estandar menor de 0.015 al 90 % de confiabilidad.Solución:

N = 1 176 se = 0,015

σ 2=(se )2=(0 ,015)2=0 .000225s2=p(1−p )=0,9 (1−0,9 )=0 ,09

Page 17: Unidad III Y Unidad IV

por lo que

n '= s2

σ2= 0 ,090 ,000225

=400

n= n '

1+n 'N

=4001+400

1176

=298

Es decir para realizar la investigación se necesita una muestra de al menos 298 adolescentes.1.- Obtener el tamaño muestral imaginando que N

Donde:

: z correspondiente al nivel de confianza elegido

: varianza poblacional e: error máximo

2.- Comprobar si se cumple

Si esta condición se cumple el proceso termina aquí, y ese es el tamaño adecuado que debemos muestrear. Si no se cumple, pasamos a una tercera fase: 3.- Obtener el tamaño de la muestra según la siguiente fórmula:

Veamos un ejemplo: La Consejería de Trabajo planea un estudio con el interés de conocer el promedio de horas semanales trabajadas por las mujeres del servicio doméstico. La muestra será extraída de una población de 10000 mujeres que figuran en los registros de la Seguridad Social y de las cuales se conoce a través de un estudio piloto que su varianza es de 9.648. Trabajando con un nivel de confianza de 0.95 y estando dispuestos a admitir un error máximo de 0,1, ¿cuál debe ser el tamaño muestral que Empleemos?.

Buscamos en las tablas de la curva normal el valor de que corresponde con el nivel

de confianza elegido: = ±1.96 y seguimos los pasos propuestos arriba. 1.

Page 18: Unidad III Y Unidad IV

2.- Comprobamos que no se cumple, pues en este caso 10000 < 3706 (3706 - 1); 10000 < 137307303.-

Tamaño de muestra para estimar la proporción de la población

Para calcular el tamaño de muestra para la estimación de proporciones poblaciones hemos de tener en cuenta los mismos factores que en el caso de la media. La fórmula que nos permitirá determinar el tamaño muestral es la siguiente:

donde

: z correspondiente al nivel de confianza elegido P: proporción de una categoría de la variable e: error máximo N: tamaño de la población

Siguiendo con el estudio planteado en el punto anterior, supongamos que tratamos de estimar la proporción de mujeres que trabajan diariamente 10 horas o más. De un estudio piloto se dedujo que P=0.30, fijamos el nivel de confianza en 0.95 y el error máximo 0.02.

Page 19: Unidad III Y Unidad IV

Este es un valor muy por arriba de 1.711. Si se desea obtener la probabilidad de obtener un valor de t con 24 grados de libertad igual o mayor a 2.25 se busca en la tabla y es aproximadamente de 0.02. De aquí que es probable que el fabricante concluya que el proceso produce un mejor producto del que piensa.

4.5.1 DETERMINACION DEL TAMAÑO DE LA MUESTRA CON GRADO DE CONFIANZA Y ESTIMACIÓN DE µ.

Ejemplo: En un lote de frascos para medicina, con una población de 8000 unidades, se desea estimar la media de la capacidad en centímetros cúbicos de los mismos.A través de un premuestreo de tamaño 35 se ha estimado que la desviación estándar es de 2 centímetros cúbicos. Si queremos tener una precisión 0.25 cms3, y un nivel de significancia del 5%. ¿De que tamaño debe de ser la muestra?DATOS:S = 2 cms3; N = 8000; d = 0.25 cms3; α = 0.05 (5%)

Zα /2= 1.96

n= N S2Z2

Nd+S2Z2=8000 (2 )2 (1.96 )2

8000 ( .25 )2+(2 )2=122931.2515.37

=239FRASCOS

Ejemplo: En una investigación, se desea determinar en que proporción los niños de una región toman leche en el desayuno. Si se sabe que existen 1.500 niños y deseamos tener una precisión del 10 %, con un nivel de significancia del 5 % . ¿De que tamaño debe de ser la muestra?DATOS:N = 1500; d = 10 % = 0.1; α = 5 % p = 0.5 y q = 0.5 (asumiendo varianza máxima). Zα/2 = 1.96

n= N pq Z2

N d2+ pq Z2=1500 ( .5 ) (.5 )(1.96)2

1500 (.1)2+( .5 ) ¿¿Se deben de muestrear 90 niños.

4.6 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS µ1-µ2.

Ejercicio Se comparan dos tipos de rosca de tornillo para ver su resistencia ala tensión. Se prueban 50 piezas de cada tipo de cuerda bajo condiciones similares, la marca A tuvo una resistencia promedio a la tensión de 78.3 Kg, mientras que la marca B tuvo una resistencia promedio de 87.2 Kg. Se sabe de antemano que las desviaciones poblacionales son de 6.5 Kg para la marca A y 6.3 Kg para la B.

Page 20: Unidad III Y Unidad IV

Determine el intervalo de confianza del 95% para la diferencia de las dos medias poblacionales.SOLUCIÓN

μ−μ2=( X−X 2 )± Zα2 √ σ 2+σ22

nn_1 = 5.6 Kg_2 = 6.3 Kgn1 = n2 = 50gμ1-μ2= -6.56 -11.24La resistencia a la tensión de tornillos de la marca B es superior a la marca A.4.7 UNA SOLA MUESTRA: ESTIMACIÓN DE LA PROPORCIÓN

Ejemplos:

1. Un fabricante de reproductores de discos compactos utiliza un conjunto de pruebas amplias para evaluar la función eléctrica de su producto. Todos los reproductores de discos compactos deben pasar todas las pruebas antes de venderse. Una muestra aleatoria de 500 reproductores tiene como resultado 15 que fallan en una o más pruebas. Encuentre un intervalo de confianza de 90% para la proporción de los reproductores de discos compactos de la población que no pasan todas las pruebas.

Solución:

n=500

p = 15/500 = 0.03

z(0.90) = 1.645

P=p± z√ pqn

=.03±(1.645)√ (.03 )(.97)500

0.0237<P<0.0376

Se sabe con un nivel de confianza del 90% que la proporción de discos defectuosos que no pasan la prueba en esa población esta entre 0.0237 y 0.0376.

2. En un estudio de 300 accidentes de automóvil en una ciudad específica, 60 tuvieron consecuencias fatales. Con base en esta muestra, construya un intervalo

Page 21: Unidad III Y Unidad IV

del 90% de confianza para aproximar la proporción de todos los accidentes automovilísticos que en esa ciudad tienen consecuencias fatales.

Solución:

P= 60/300 = 0.20

Z(0.90) = 1.645

P=p± z√ pqn

=.20± (1.645 )√ ( ,20 ) ( .80 )300

=.20± .038

0.162<P<0.238

Se sabe con un nivel de confianza del 90% que la proporción de accidentes automovilísticos que no pasan la prueba en esa población esta entre 0.162 y 0.238.

Page 22: Unidad III Y Unidad IV