Upload
fernando-lopez-campos
View
43
Download
5
Embed Size (px)
DESCRIPTION
Guia de Estadística Aplicada a La Investigación de Mercados
Citation preview
Guía de estadística aplicada a la investigación
de mercados
Unidades temáticas
• l.- Fundamentos de Probabilidad
• ll.- Introducción a la Estadística
• lll.- Bases para la Investigación
de Mercados
TEMA 1 Ordenamiento o arreglo de datos
•Los datos no procesados, son grandes cantidades de números y tienden a confundir en lugar
de aclarar
•El procesamiento de datos disminuye la cantidad de
detalles pero facilita la tarea de establecer relaciones
Tipos de datos
cuantitativos
cualitativos
Continuos: Puede tomar cualquier valor.
Discretos: Enteros
nominales: Definen categorías
jerarquizados:Denotan orden.
Ejemplos
continuos Discretos Nominales Jerarquizados
Carne kg cajas Res puerco pollo
Buena superior excelente
Auto Kph kpl
# defectos
colores Más sucio
Distribución de frecuencia
Es un agrupamiento de datos en clases, que muestra el número o
porcentaje de observaciones de cada
una de ellas
Elaboración de una distribución de
frecuencia
Decidir el número de intervalos de clase que se vayan a usar
•Utilizar entre 5 y 15Calcular la raíz cuadrada de n y ajustarla a los límites de 5 a 15
Ejemplospara 400 = 20 se ajusta a 15
para 40 = 6.32 se ajusta a 6 o 7
Amplitud de Intervalos de clase
Valor entro mayor - valor menor
# de intervalos que se desee
Distribución de frecuencias para datos
continuos
11.1 12.5 32.4 7.8 21.0 15.4 11.2 22.3
4.4 6.1 27.5 32.8 18.5 16.4 15.1 6.0
10.7 15.8 25.0 18.2 12.2 12.6 4.7 23.5
14.8 22.6 16.0 19.1 7.4 9.2 0.0 26.2
3.5 16.2 14.5 3.2 8.1 12.9 19.1 13.7
Ejemplo:
kg. De duraznos vendidos/día
0 < 5.55.5 < 1111 < 16.516.5 < 2222 < 27.527.5 < 33
5715553
Intervalos de clase kg
Frecuenciani
Como son 40 datosV 40 = 6.32 utilizamos 6 intervalosde clase, y aplicado la fórmula de amplitud del intervalo tenemos:
(33 - 0) / 6 = 5.5
xi = (lim inf + lim sup)/2 Marca de
clasexi
2.758.2513.7519.2524.7530.25
Medidas de tendencia central
Medidas que se ubican en el centro de la muestra o población.•Moda = mayor frecuencia
•Media = µ = Σ((xi)(ni))/N
•Mediana = M = L+C(j/fm)
L=Limite inferior de la clase donde se encuentra n/2 sumando frecuencias.
C=Longitud de la clase.
j=Complemento de la suma de las frecuencias anteriores para completar n/2.
fm=Frecuencia de la clase.
Aplicación de la media al problema anteriorIntervalo
de clase
Frecuencia
ni Marca de
clase xi (xi)(ni)
0<5.5 5 2.75 13.75
5.5<11 7 8.25 57.75
11<16.5 15 13.75 206.25
16.5<22 5 19.25 96.25
22<27.5 5 24.75 123.75
27.5<33 3 30.25 90.75
Σ = 588.5 Σ = 40
µ = 588.5/40
µ = 14.7125 Kg
Aplicación de la mediana y moda
Intervalo
de clase
Frecuencia
ni Marca de
clase xi (xi)(ni)
0<5.5 5 2.75 13.75
5.5<11 7 8.25 57.75
11<16.5 15 13.75 206.25
16.5<22 5 19.25 96.25
22<27.5 5 24.75 123.75
27.5<33 3 30.25 90.75
M = L+C(j/fm)M = 11 + 5.5(8/15)M =13.93 Kg
Mediana =13.93
Medidas de dispersión
Medidas que indican que tan dispersos o alejados de la media están los datos de la muestra o población.
•Varianza = σ2 = Σ (xi - µ )2 ni/N
•Desviación estándar o típica = σ
σ = V Σ (xi - µ )2 ni/N
•Rango = Lim sup - Lim infde los intervalos de clase
Aplicación de varianza del problema en
cuestiónIntervalo de clase
Frecuencia
ni Marca de clase xi
(xi-µ) 2ni
0<5.5 5 2.75 715.2
5.5<11 7 8.25 292.12
11<16.5 15 13.75 13.82
16.5<22 5 19.25 103.06
22<27.5 5 24.75 504
27.5<33 3 30.25 724.47
Σ = 2352.67
σ2 = 2352.67/40
σ2 = 58.81
Aplicación de desviación estándar y
rango
σ = V 58.81
σ = 7.67 Kg
Rango = 33 - 0
Rango = 33 Kg
Técnicas de muestreo
Inferencia estadística:Establecer juicios de una población, después de examinar una muestra
Censo:Examen de toda la población
Muestreo:Examen de una pequeña parte
de la población.
Muestra aleatoria simple
Para poblaciones discretas es aquella en que todos los
elementos de la población tienen la misma oportunidad de
ser incluidos en la muestra.
Para continuas es aquella en que la probabilidad de incluir cualquier intervalo de valores
en la muestra, es igual al porcentaje de la población que
está comprendida en dicho intervalo.
Tablas de números aleatorios
Pasos para utilizar las tablas de números aleatorios
1- Hacer una lista de elementos2- Numere la lista
3- Tome los números de una tabla de números aleatorios
4- omita los que no correspondan5- Estos números se habrán de
incluir en la muestra.
Muestreo de juicio
Para muestras muy pequeñas
Ejemplo:En una cadena de restaurantes se desea introducir una nueva técnica
de servicio, y por costos solo se implementará en 2 restaurantes en
este caso en lugar de hacer pruebas resulta más prudente
basarse en el conocimiento de sus administradores,
Muestreos probabilisticosMuestreo sistemático
Si los elementos de la lista no están en orden se puede muestrear cada
Kesimo elemento.K = N/n
n= Tamaño de la muestraN= Tamaño de la población
Muestreo estratificadoDividir la población en subgrupos de
elementos semejantes.
Muestreo de acumulación o conglomerados.
Ordenar en subgrupos heterogéneos que sean representativos de la
población como una mini población.
Distribuciones de probabilidad
Distribución de Poisson
P(x) = (e-λ t (λ t ) x) / x!
X = número de ocurrenciase = base de logaritmos naturalest = número de unidades (tiempo, distancia etc.)λ t = cantidad media de ocurrencias respecto a t, de esta manera µ = λ t
P(x) = (e-µ (µ ) x) / x!
EjemploSuponga que los clientes llegan a un negocio a razón de 2 por minuto y que esta proporción está bien aproximada mediante el proceso de Poisson, si se observa este proceso durente 30 segundos encuentre la probabilidad de que:a) no llegue nadieb) lleguen 3c) al menos lleguen 2
a) µ = λ t = 2(.5) = 1P(x=0)= (e-1 (1 )0 ) / 0! = .3678
b) P(x=3)= (e-1 (1 )3 ) / 3! = .061
c) P(x=0)= (e-1 (1 )0 ) / 0! = .3678P(x=1)= (e-1 (1 )1 ) / 1! = .3678
1 - (P(x=0)+ P(x=1)) = .2664
Distribución exponencial
Para tiempo y distancia
P(T >t) = e-λ t
P(T <t) = 1- e-λ t
El tiempo que tardan en recibir una orden después de hacerla en un restaurante promedia 10 min.
a) Probabilidad de que espere más de 10 minutos?
λ = 1/10 = 0.1 por minuto
P(T >10) = e-0.1 (10) = e-1 = 0.368
b) De que su tiempo de espera sea de 3 minutos o menos?
P(T <3) = 1- e-0.1(3) = 1- 0.741 = .259
TEMA II Introducción a la estadística
TÉCNICAS DE CONTEO T I
• Probabilidad = Resultados deseados / Resultados posibles
• Las técnicas de conteo son fórmulas matemáticas para obtener los resultados posibles.
Principio de multiplicación
V
V
V
V
V
V
V
F
FF
F
F
F
• De haber n decisiones secuenciales, cada una con m opciones el número total de resultados posibles es mn
F
Pregunta
No. 1 No. 2 No.3
EJEMPLO
Si las placas se identifican por tres
letras y tres números, ¿cual es el
número total de placas que se
pueden obtener?
• (26)(26)(26)(10)(10)(10)
• =17576000
C O A H U I L A
E W M 3 5 9
EjemploCuantas opciones tiene
un cliente al comprar un auto si:
• 6 colores distintos
• 2 transmisiones
automática y standard.
• 2 y 4 puertas
• Austero, con clima y
calefacción y solo con
calefacción.
6 x 2 x 2 x 3 = 72 opciones para escoger su auto
Ejemplo
• Una empresa capacita a cinco
equipos de promoción de ventas
sobre una técnica distinta de
promoción a cada equipo, A, B,C, D
y E. Diga cuantas opciones posibles
hay para completar la promoción en
tres zonas de la ciudad.
5 x 5 x 5 = 125 opciones
PERMUTACIONES
• Es un arreglo en un orden particular de los objetos que forman un conjunto
• P(n,r) = n!/(n- r)!• P(N,R) = permutaciones de n objetos si
se toman r a la vez
• n = número de objetos
• r = objetos a la vez
FACTORIAL
• El producto de un entero positivo por todos los que le preceden se denota como n! Y se lee n factorial
• n(n-1)! = n!• despejando• (n-1)!= n!/n• De esta manera
cuando n=1, se define 0!=1
EJEMPLO
Si ninguna letra se puede repetir
• P(n,r) = n!/(n- r)!• P(26,3)=26!/23!• =15600X1000• =15 600 000
C O A H U I L A
E W M 3 5 9
Ejemplo
• Una empresa capacita a cinco
equipos de promoción de ventas
sobre una técnica distinta de
promoción a cada equipo, A, B,C, D
y E. Diga cuantas formas distintas
puede iniciar la capacitación en tres
zonas distintas de la ciudad.
P(n,r) = n!/(n- r)!
P(5, 3) = 5!/ (5 - 3)! = 60 permutaciones
COMBINACIÓN
• Es una selección de objetos sin importar el orden.
• (n/r)=n!/(n-r)! r!• (n/r)=combinació
n de r objetos tomados de un conjunto n de estos.
• n= número de objetos
• r= objetos a la vez
EJEMPLO
• Una empresa capacita a cinco equipos
de promoción de ventas sobre una
técnica distinta de promoción a cada
equipo, A, B,C, D y E. Diga en
cuantas combinaciones distintas
puede iniciar la capacitación en tres
zonas de la ciudad.
(n/r)=n!/(n-r)! r!
(5/3) = 5! /(5 - 3)! 3! = 10 combinaciones
Teorías de probabilidades
P = Resultados deseados / Resultados posibles
Muestreo con reemplazo
Al obtener muestras aleatorias de un espacio muestral, y al reemplazar dichas muestras antes de las siguiente muestra, se llama muestreo con reemplazo, y en cada muestreo la probabilidad será la misma.
P ( ) = 4/7
Ejemplo
• Una concesionaria tiene
a la venta por sorteo el
siguiente lote de autos,
reemplazando siempre
el auto que sea sorteado
por otro del mismo
color.
• Cual es la probabilidad
que en el segundo sorteo
salga un auto
• Cual es la probabilidad
que en el 5o sorteo salga
un auto
R = 1/4 y 1/6
Teorías de probabilidades T II
P = Resultados deseados / Resultados posibles
Muestreo sin reemplazo
Al obtener muestras aleatorias de un espacio muestral, y al no reemplazar dichas muestras antes de la siguiente muestra, se llama muestreo sin reemplazo, y en cada muestreo la probabilidad será en aumento.
P2 ( ) =3/7 x 4/6 = 6/21
P1 ( ) = 4/7
P3 ( ) = 3/7 x 2/6 x 4/5 = 24/210
Ejemplo
• Una concesionaria tiene
a la venta por sorteo el
siguiente lote de autos, y
si no son reemplazados
• Cual es la probabilidad
que en el segundo sorteo
salga un auto
• Cual es la probabilidad
que en el 3er sorteo salga
un auto
R = 9/12 x 3/11 = 27/132
R = 10/12 X 9/11 X 2/10 = 180/1320
Probabilidad compuesta
En una ciudad se editan dos periódicos A y B. El periódico A lo leen 40 de 100 personas, mientras que el B lo leen 25 de cada 100. Los lectores de ambos periódicos son 15 de cada 100. ¿Que probabilidad hay de que una persona en esta ciudad lea alguno de estos dos periódicos?
A B
1525 10
P = (A U B ) = 25 + 15 + 10 = 50 %
P = (A U B ) = 40 + 25 - 15 = 50 %
Ejemplo
Del ejemplo anterior encuentre la probabilidad de que al elegir una persona de esta ciudad solo lea el periódico B
R = 10%
Probabilidad condicional
La distribución de 125 autos de una empresa
según su modelo y su motor es la siguiente:
AUTOS Austero Clásico Lujo SUMA
6 Cilindros 40 15 10 65
8 Cilindros 30 25 5 60
SUMA 70 40 15 125
0.56
0.42857143
Probabilidad de seleccionar un austero =
Probabilidad de seleccionar un 8 cil.
Que sea austero =
Probabilidad de 8 cil. Condicionada a austero
DISTRIBU
CION
ES
DE PR
OBABILIDAD
T III
Distribución Binomial
P(x) = (n/x) P (éxito)x p (Fracaso) n-x
(n/x) = combinación
n = número de ensayos
x = número de éxitos
P = probabilidad
EjemploUn vendedor de autos nuevos observa que el 80% de los autos vendidos son regresados al departamento de servicios para corregir diversos defectos de fabricación en los primeros 25 días después de su compra. De los 11 autos que se vendieron en un período de 5 días cual es la probabilidad de que:
a) Todos regresen en el lapso de 25 días para recibir servicio.
b) Solo uno no regrese.
P(X) = (11/11) (0.8)11 (0.2)0 = 0.0858
P(X) = (11/10) (0.8)10 (0.2)1 = 0.23
(11/11) = 1
Combinaciones
(11/10) = 11
Uso de la computadora (Excel)
En Excel entramos a fx y en la siguiente ventana seleccionamos Estadísticas en el lado izquierdo y buscamos Distribución binomial en el derecho.
Aparece una ventana que nos pide los siguientes datos:
• Número de éxitos
• Ensayos
• Probabilidad de éxito
• Acumulado escribir la palabra Falso para obtener la función de probabilidad bruta.
Ejemplo
El 8% de los emparedados se piden sin mayonesa, si 7 personas piden emparedados encuentre la probabilidad que:
a) Todos lo quieran con mayonesa
b) Solo uno lo quiera con mayonesa
P(X) = (7/7) (0.92)7 (0.08)0 = 0.5578
P(X) = (7/1) (0.92)1 (0.08)6 = 0.00000168
Distribución Normal
f(X) = e-(1/2) ((x-µx) / σx)2 / V 2π σ x
e = Constante matemática 2.71828
π = Constante matemática 3.1416
µx = Media de la población
σ x =Desviación estándar de la población
X = Es cualquier variable aleatoria continua donde
-x < X < +x
Distribución normal
Resulta demasiado tedioso calcular la función por medio de la fórmula anterior, porque la media y la desviación estándar pueden variar y tener un número infinito de combinaciones.
Fórmula de Transformación
Para evitar estos cálculos debemos estandarizar la información para analizar una tabla.
z = X - µ / σ
z = Variable normal estándar
µ = media
σ = desviación estándar
EjemploPizza Rápida tiene registrados los tiempos de entrega a clientes en la siguiente tabla, y piensa regalar la pizza que sea entregada después de los primeros 30 min. de que fue cocinada, encuentre la probabilidad de que una pizza sea regalada a un cliente.
10 15 25 20 30
10 5 10 25 35
15 20 30 15 10
10 20 15 20 5
15 25 10 15 10
µ = media
µ = promedio
µ =420/25
µ =16.8
Desviación estándar
σ = desviación estándar o típica
σ = V ٤ (xi - µ )2 / N
(10 - 16.8)2 = 46.24
(15 - 16.8)2 = 3.24
(25 - 16.8)2 = 67.24
•
•
•
Σ = 1544
σ = V1544/25 = 7.85
CON DATOS AGRUPADOS
Para el problema anterior
Intervalos Marcas de clase xi
Frecuencias ni
(xi)(ni) (x-µ) 2ni
5 < 15 10 9 90 761.76
15 < 25 20 10 200 6.4 25 < 35 30 5 150 583.2
35 < 45 40 1 40 432.64
Σ = 480
µ = 480 / 25 = 19.2
Σ = 1784
σ = V1784 / 25 = 8.44748
σ = desviación estándar o típica
σ = V ٤ (xi - µ )2 ni/ N
µ = Σ(xi ni) / N
Diferencia
•Existe una diferencia entre los métodos anteriores utilizados para encontrar la media y la desviación estándar, aunque el primero es más exacto el segundo es el más utilizado porque simplifica los cálculos, por lo que debemos practicar el trabajar con datos agrupados.
•Una vez calculados la media y la desviación estándar podremos calcular cualquier probabilidad utilizando la tabla de la distribución normal.
•Siempre recuerda que la probabilidad encontrada en la tabla es la probabilidad de la media al valor estandarizado, es el área bajo la curva entre estos dos puntos.
Uso de la tabla
Como nos preguntan la probabilidad de que se regale la pizza, entonces tendremos que estandarizar el 30 porque debemos encontrar la probabilidad de que sean entregadas en un tiempo mayor de los 30 minutos
z = (X - µ) / σz = (30 - 19.2 / 8.44) = 1.278
buscamos este valor en la tabla de la normal y encontramos una probabilidad de 0.3996, esa es la probabilidad de la media al 30, por lo que la probabilidad mayor de 30 será 0.5 - .3996 = 0.1004 = 10%
3019.2
Uso de la computadora (Excel)
En Excel entramos a fx y en la siguiente ventana seleccionamos Estadísticas y buscamos Distribución normal.
Aparece una ventana que nos pide los siguientes datos• X valor cuya distribución se desea obtener• Media• Desviación estándar• Acumulado escribir la palabra verdadero para obtener la función de probabilidad acumulativa, por lo que la probabilidad encontrada será la acumulada desde el extremo izquierdo hasta el valor cuya distribución se desea obtener, con los datos en cuestión nos dará 0.89966068 pero como nos interesa la probabilidad mayor de 30 entonces será 1- 0.8899 = 0.1004 = 10%
TEMA III Bases para la
investigación de
mercadosESTIAMCIÓN:
Es el proceso de utilizar los datos muestrales para estimar los valores de
parámetros desconocidos de una población.
ESTIMACIÓN DE PUNTO:
Estimación de un punto único de un parámetro de la población.
ESTIMACIÓN DE INTERVALO:
Estimación que incluye un intervalo de valores posibles en el que se considera que está comprendido un parámetro de
la población.
Criterios para seleccionar un buen
estimadorIMPARCIALIDAD:
La media de la distribución de muestreo de las
medias de muestras tomadas de una misma
población es igual a la media de la población
EFICIENCIA:
De dos estadísticas de muestras del mismo
tamaño de una misma población, será más
eficiente la que tenga menor error estándar o
menor desviación estándar.
COHERENCIA:
El tamaño de la muestra debe ser el adecuado
para que la estadística sea un estimador
coherente.
SUFICIENCIA:
Cantidad suficiente de información en la
muestra sobre el parámetro de la población
Si la media y la mediana coinciden, la
media de la muestra sería buen estimador
de la mediana de la población, mejor
estimador que la propia mediana de la
muestra ya que ésta en muestras grandes
tiene desviación estándar mayor que la
media.
La mediana de la muestra sería un
estimador para la media de la población,
pero no es el más eficiente porque en
muestras grandes tiene mayor error
estándar que el de la media de la muestra.
EJEMPLO: Estimación puntual
Una compañía produce jeringas hipodérmicas desechables, cada jeringa viene en envoltura estéril y que a su vez
es empacada en grandes cajas, estas cajas contienen diferentes cantidades de
jeringas. Debido a que las jeringas se venden por piezas la compañía necesita
una estimación del número de piezas que hay por caja, y para propósito de
investigación, se ha tomado una muestra aleatoria de 35 cajas y contado el número
de jeringas por caja. 101 103 112 102 98 97 93
105 100 97 107 93 94 97
97 100 110 106 110 103 99
93 98 106 100 112 105 100
114 97 110 102 98 112 99
Uso de la media de la muestra para estimar la media de la población.
µ = 3570/35 = 102 jeringas
Tanto el comprador como el vendedor estarán de acuerdo con esta estimación
puntual como 102 jeringas para la población, y el fabricante puede
ahorrarse el gasto y el tiempo para contar cada una de las jeringas
contenidas en las cajas.
Varianza de la muestra, como varianza de la población.
σ2 = Σ (x - µ)2 /n-1=1228/34 = 36.12
Desviación estándar de la muestra como estimador de la desviación estándar de
la población.
σ = V Σ (x - µ)2 /n-1
σ = V 36.12 = 6.01 jeringas
Uso de la porción de la muestra para estimar la porción de la población.
La empresa desea estimar el número de cajas que lleguen dañadas debido a un
mal manejo en el traslado; de una muestra de 50 cajas desde el punto de embarque hasta su arribo al punto de destino se encontró que la porción de cajas dañadas es de .08 diríamos que esa misma porción se estima para la
población.
Estimación de intervalo
El director de investigaciones de mercado de una fábrica necesita hacer una estimación de la vida promedio de baterías, se registra el nombre y el
teléfono del propietario.
Se encuentra la media para una estimación puntual, si es de 36 meses
podríamos estimar la duración media de la población de 36 meses, pero el director pide que se de una afirmación acerca del intervalo dentro del cual es probable que esté la media de la población, y para esto debemos encontrar el error estándar de la
media
σ µ= σ/ Vn
para población infinita
De las 200 baterías la que duró más fueron 75 meses y la que menos duró fue
de 15 meses, una manera burda de obtener la desviación estándar de la
muestra para estimar la de la población sería.
6 σ = 75 - 15
σ = 10
pero sería preferible encontrarla por la fórmula ya conocida
σ = V Σ (x - µ)2 /n-1
entonces el error estándar sería
σ µ= 10 / V 200 = 0.707 meses
con 2 errores estándar en la curva de la normal = 0.955 con lo que3 podemos
decir que tenemos el 95.5% de confianza que la vida útil de la batería está dentro
del intervalo 34.58 a 37.41 meses.
Estimación de intervalo de la media a
partir de muestras grandes.
Un gran distribuidor de refacciones automotrices necesita una estimación de
la vida media que cabe esperar de los limpiabrisas en condiciones normales de manejo. La gerencia ya ha determinado
que la desviación estándar de la población es de 6 meses, cuando
seleccionamos una muestra aleatoria simple de 100 limpiabrisas y reunimos los
datos referentes a su vida útil, y obtenemos estos resultados.
N = 100 tamaño de la muestra
µ = 21 meses media muestral
σ = 6 meses desv estándar
Como el vendedor utiliza 10 000 de tales limpiadores al año, nos pide que
encontremos una estimación de intervalo con un nivel de confianza de 95% (como la muestra es mayor de 30 se utiliza
la distribución normal)
σ µ= σ/ Vn = 6/ V100
σ µ = 0.6 meses de error para población infinita
Cálculo de los límites de confianza 95%
= 95%
47.5 en la tabla = 1.96 = z
µ + 1.96 σ µ =límite de confianza sup.
µ - 1.96 σ µ =límite de confianza inf.
21
47.547.5
21 + (1.96 x 0.6) = 22.18 meses
21 - (1.96 x 0.6) = 19.82 meses
Conclusión
podemos informar que la estimación de la vida media de la población de limpiadores
de parabrisas está entre 19.82 y 22.18 meses con el 95 % de confianza.
Será finito cuando la muestra sea más del 5% de la población
σ µ= (σ/ V n )x (V N-n/ N-1)
Estimación de intervalo de la porción a partir de muestras
grandesp = porción de éxitos en una muestra
µp = media de la porción de éxitos
µp = P
P = probabilidad de obtener un éxito
Error estándar de la porción
σ p = V p q / n
q = porción de no éxito
Ejemplo
En una muestra de 75 personas el 40% toman cocacola y el director de
investigaciones de mercados necesita un 99% de confianza para encontrar un
intervalo de la verdadera porción de la población.
n = 75 tamaño de la muestra
p = 0.4 éxitos
q = 0.6 no éxitos
σ p = V P q / n = V (0.4)(0.6)/75
σ p = 0.057 error estándar de la porción.
Para un nivel de confianza de 99% se tiene que:
En la tabla a 49.5 le corresponden 2.58 errores estándar que son los necesarios para el 99% de confianza.
Límite superior de confianza:
p +z cantidad de errores est. x error est.
0.4 + (2.58 x 0.057) = 0.547
Límite inferior de confianza:
p - z cantidad de errores est. X error est.
0.4 - (2.58 x 0.057) = 0.253
45.9 45.9
Por lo que podemos concluir que la verdadera porción de la población está
entre 0.253 y 0.547
Entre 25.3% y 54.7% de la población consumen cocacola, lo que podemos afirmar con un 99% de confianza.
Tamaño de la muestra para estimar una
mediaUna tienda está interesada en obtener
una estimación de intervalo para el número medio de clientes que entran a la tienda diariamente, los dueños saben que existe una diferencia de 90 clientes entre
el índice más bajo y el más alto.
Determine el tamaño de la muestra que se deberá utilizar con el fin de desarrollar un intervalo de confianza de 96% para el
número medio real de clientes con un ancho de solamente +8 personas.
Una estimación burda de la desviación estándar sería
6 σ = 90 clientes (3 a la izq. Y 3 a la der)
σ = 90 / 60 = 15 clientes
Z σ µ = 8
para encontrar z debemos utilizar el nivel de confianza en la tabla
96%
0.48 en la tabla de la curva normal
z = 2.05
por lo tanto
2.05 σ µ = 8
σ µ = 8 / 2.05
σ µ = 3.9 tenemos que σ µ= σ/ V n
3.9 = 15 / V n
n = 14.79 = 15
48 48
Tamaño de la muestra para estimar una
porciónTenemos indicios que el 60 % de la población (>100 000) consumen un producto. Encuentre el tamaño adecuado de la muestra para estimar un intervalo de ancho + 5%para encontrar la verdadera porción con un 90 % de confianza.
σ p = V P q / n
Despejando
n = p q / (σ p )2
sabemos que 90% en tabla z = 1.65p = 0.6 q = 0.4
Y como z σ p =.05
σ p= 0.05/1.65 = 0.03
σ p= 0.03
sustituimos en la fórmula
n = (0.6)(0.4)/(0.03)2 = 266.66 =267
NOTA:Para poblaciones infinitas > 100 000podemos considerar el error E entre 0.02 y 0.06 y utilizamos las sigfórmulas:E = σ p
n = pxq/E2 para 90% de confianza
n = 3.84pxq/E2 95% de confianza
n = 7.52 pxq/E2 99% de confianza
el factor 3.84 se obtiene encontrando z de la tabla de acuerdo al nivel de confianza y elevando al cuadrado.Y si no conocemos la p q se les da el valor de 0.5
PARA POBLACIONES FINITAS < 100 000
n = 3.84 N p x qE2(N - 1) + 3.84 p x q
para un 95 % de confianza
Prueba de hipótesis de la media
En una muestra de 100 ejes traseros de camión que deben soportar 80 000 libras por pulgada cuadrada se encontraron los siguientes resultados, después de someterlos a pruebas de esfuerzos.µ = 79,600σ = 4,000n = 100µ HO = 80 000Si el fabricante usa un nivel de significancia de 0.05 en las pruebas ¿Cumplirán los ejes con el requisito?
σ µ= σ/ Vn = 4000/ V 100 = 400
como el nivel de significancia es de 0.05 se divide entre 2, porque la resistencia de los ejes no puede ser muy baja pero tampoco muy alta por los costos
.475 .475
Z = 1.96
Para 0.5 nivel des significancia
0.025 0.025b
Límite superior 80 000 + 1.96 (400) = 80 784 Lb/pulg2
Límite inferior 80 000 - 1.96 (400)= 79 216 Lb/pulg2
Y como la media está entre los límites se acepta la hipótesis nula. S i cumplirán los requisitos dichos ejes.
Correlación y regresión
OBSERVACIÓN DE VARIABLES RELACIONADAS
La correlación mide la fuerza de una relación entre dos variables; y la regresión da lugar a una ecuación y = a + bx
EJEMPLOS
Un T S U en comer puede explicar los cambios de la demanda de un producto, en términos del nivel de empleo, el precio de un producto usado en términos del tiempo del uso etc.
EJEMPLO
Se indaga si el precio de un auto usado depende del kilometraje
y es la variable dependiente (precio)x es la variable independiente (km)n es número de observacionesAl parecer los autos muestran una relación lineal en el kilometraje y el precio.
Método de mínimos cuadrados
b = n ( Σ x y ) - ( Σ x ) (Σ y )n ( Σ x2 ) - ( Σ x )2
a = Σ y - b Σ x n
y sustituimos en y = a + bx para encontrar los costos
BIBLIOGRAFÍA• Etadística Aplicada a la Mercadotecnia.
• Roaño Humberto
• Editorial Diana
• Estadística Paso a Paso
• Howard B. Christensen
• Editorial Trillas
• Matemáticas Aplicadas para la Edministración y la Economía y Ciencias Sociales
• Frank S. Budnick
• Editorial Mc Graw Hill
• Matemáticas Aplicadas a la Administración y Economía
• Jasdish C. Ayra/Robin W. Landner
• Editorial Pretince Hall
• Estadística
• Murray R. Spiegel
• Editorial Mc Graw Hill
• Probabilidad y Estadística
• Murray R. Spiegel
• Editorial Mc Graw Hill