Guia de Estadística Aplicada a La Investigación de Mercados

Guía de estadística aplicada a la investigación

de mercados

Unidades temáticas

• l.- Fundamentos de Probabilidad

• ll.- Introducción a la Estadística

• lll.- Bases para la Investigación

de Mercados

TEMA 1 Ordenamiento o arreglo de datos

•Los datos no procesados, son grandes cantidades de números y tienden a confundir en lugar

de aclarar

•El procesamiento de datos disminuye la cantidad de

detalles pero facilita la tarea de establecer relaciones

Tipos de datos

cuantitativos

cualitativos

Continuos: Puede tomar cualquier valor.

Discretos: Enteros

nominales: Definen categorías

jerarquizados:Denotan orden.

Ejemplos

continuos Discretos Nominales Jerarquizados

Carne kg cajas Res puerco pollo

Buena superior excelente

Auto Kph kpl

# defectos

colores Más sucio

Distribución de frecuencia

Es un agrupamiento de datos en clases, que muestra el número o

porcentaje de observaciones de cada

una de ellas

Elaboración de una distribución de

frecuencia

Decidir el número de intervalos de clase que se vayan a usar

•Utilizar entre 5 y 15Calcular la raíz cuadrada de n y ajustarla a los límites de 5 a 15

Ejemplospara 400 = 20 se ajusta a 15

para 40 = 6.32 se ajusta a 6 o 7

Amplitud de Intervalos de clase

Valor entro mayor - valor menor

# de intervalos que se desee

Distribución de frecuencias para datos

continuos

11.1 12.5 32.4 7.8 21.0 15.4 11.2 22.3

4.4 6.1 27.5 32.8 18.5 16.4 15.1 6.0

10.7 15.8 25.0 18.2 12.2 12.6 4.7 23.5

14.8 22.6 16.0 19.1 7.4 9.2 0.0 26.2

3.5 16.2 14.5 3.2 8.1 12.9 19.1 13.7

Ejemplo:

kg. De duraznos vendidos/día

0 < 5.55.5 < 1111 < 16.516.5 < 2222 < 27.527.5 < 33

5715553

Intervalos de clase kg

Frecuenciani

Como son 40 datosV 40 = 6.32 utilizamos 6 intervalosde clase, y aplicado la fórmula de amplitud del intervalo tenemos:

(33 - 0) / 6 = 5.5

xi = (lim inf + lim sup)/2 Marca de

clasexi

2.758.2513.7519.2524.7530.25

Medidas de tendencia central

Medidas que se ubican en el centro de la muestra o población.•Moda = mayor frecuencia

•Media = µ = Σ((xi)(ni))/N

•Mediana = M = L+C(j/fm)

L=Limite inferior de la clase donde se encuentra n/2 sumando frecuencias.

C=Longitud de la clase.

j=Complemento de la suma de las frecuencias anteriores para completar n/2.

fm=Frecuencia de la clase.

Aplicación de la media al problema anteriorIntervalo

de clase

Frecuencia

ni Marca de

clase xi (xi)(ni)

0<5.5 5 2.75 13.75

5.5<11 7 8.25 57.75

11<16.5 15 13.75 206.25

16.5<22 5 19.25 96.25

22<27.5 5 24.75 123.75

27.5<33 3 30.25 90.75

Σ = 588.5 Σ = 40

µ = 588.5/40

µ = 14.7125 Kg

Aplicación de la mediana y moda

Intervalo

de clase

Frecuencia

ni Marca de

clase xi (xi)(ni)

0<5.5 5 2.75 13.75

5.5<11 7 8.25 57.75

11<16.5 15 13.75 206.25

16.5<22 5 19.25 96.25

22<27.5 5 24.75 123.75

27.5<33 3 30.25 90.75

M = L+C(j/fm)M = 11 + 5.5(8/15)M =13.93 Kg

Mediana =13.93

Medidas de dispersión

Medidas que indican que tan dispersos o alejados de la media están los datos de la muestra o población.

•Varianza = σ2 = Σ (xi - µ )2 ni/N

•Desviación estándar o típica = σ

σ = V Σ (xi - µ )2 ni/N

•Rango = Lim sup - Lim infde los intervalos de clase

Aplicación de varianza del problema en

cuestiónIntervalo de clase

Frecuencia

ni Marca de clase xi

(xi-µ) 2ni

0<5.5 5 2.75 715.2

5.5<11 7 8.25 292.12

11<16.5 15 13.75 13.82

16.5<22 5 19.25 103.06

22<27.5 5 24.75 504

27.5<33 3 30.25 724.47

Σ = 2352.67

σ2 = 2352.67/40

σ2 = 58.81

Aplicación de desviación estándar y

rango

σ = V 58.81

σ = 7.67 Kg

Rango = 33 - 0

Rango = 33 Kg

Técnicas de muestreo

Inferencia estadística:Establecer juicios de una población, después de examinar una muestra

Censo:Examen de toda la población

Muestreo:Examen de una pequeña parte

de la población.

Muestra aleatoria simple

Para poblaciones discretas es aquella en que todos los

elementos de la población tienen la misma oportunidad de

ser incluidos en la muestra.

Para continuas es aquella en que la probabilidad de incluir cualquier intervalo de valores

en la muestra, es igual al porcentaje de la población que

está comprendida en dicho intervalo.

Tablas de números aleatorios

Pasos para utilizar las tablas de números aleatorios

1- Hacer una lista de elementos2- Numere la lista

3- Tome los números de una tabla de números aleatorios

4- omita los que no correspondan5- Estos números se habrán de

incluir en la muestra.

Muestreo de juicio

Para muestras muy pequeñas

Ejemplo:En una cadena de restaurantes se desea introducir una nueva técnica

de servicio, y por costos solo se implementará en 2 restaurantes en

este caso en lugar de hacer pruebas resulta más prudente

basarse en el conocimiento de sus administradores,

Muestreos probabilisticosMuestreo sistemático

Si los elementos de la lista no están en orden se puede muestrear cada

Kesimo elemento.K = N/n

n= Tamaño de la muestraN= Tamaño de la población

Muestreo estratificadoDividir la población en subgrupos de

elementos semejantes.

Muestreo de acumulación o conglomerados.

Ordenar en subgrupos heterogéneos que sean representativos de la

población como una mini población.

Distribuciones de probabilidad

Distribución de Poisson

P(x) = (e-λ t (λ t ) x) / x!

X = número de ocurrenciase = base de logaritmos naturalest = número de unidades (tiempo, distancia etc.)λ t = cantidad media de ocurrencias respecto a t, de esta manera µ = λ t

P(x) = (e-µ (µ ) x) / x!

EjemploSuponga que los clientes llegan a un negocio a razón de 2 por minuto y que esta proporción está bien aproximada mediante el proceso de Poisson, si se observa este proceso durente 30 segundos encuentre la probabilidad de que:a) no llegue nadieb) lleguen 3c) al menos lleguen 2

a) µ = λ t = 2(.5) = 1P(x=0)= (e-1 (1 )0 ) / 0! = .3678

b) P(x=3)= (e-1 (1 )3 ) / 3! = .061

c) P(x=0)= (e-1 (1 )0 ) / 0! = .3678P(x=1)= (e-1 (1 )1 ) / 1! = .3678

1 - (P(x=0)+ P(x=1)) = .2664

Distribución exponencial

Para tiempo y distancia

P(T >t) = e-λ t

P(T <t) = 1- e-λ t

El tiempo que tardan en recibir una orden después de hacerla en un restaurante promedia 10 min.

a) Probabilidad de que espere más de 10 minutos?

λ = 1/10 = 0.1 por minuto

P(T >10) = e-0.1 (10) = e-1 = 0.368

b) De que su tiempo de espera sea de 3 minutos o menos?

P(T <3) = 1- e-0.1(3) = 1- 0.741 = .259

TEMA II Introducción a la estadística

TÉCNICAS DE CONTEO T I

• Probabilidad = Resultados deseados / Resultados posibles

• Las técnicas de conteo son fórmulas matemáticas para obtener los resultados posibles.

Principio de multiplicación

V

V

V

V

V

V

V

F

FF

F

F

F

• De haber n decisiones secuenciales, cada una con m opciones el número total de resultados posibles es mn

F

Pregunta

No. 1 No. 2 No.3

EJEMPLO

Si las placas se identifican por tres

letras y tres números, ¿cual es el

número total de placas que se

pueden obtener?

• (26)(26)(26)(10)(10)(10)

• =17576000

C O A H U I L A

E W M 3 5 9

EjemploCuantas opciones tiene

un cliente al comprar un auto si:

• 6 colores distintos

• 2 transmisiones

automática y standard.

• 2 y 4 puertas

• Austero, con clima y

calefacción y solo con

calefacción.

6 x 2 x 2 x 3 = 72 opciones para escoger su auto

Ejemplo

• Una empresa capacita a cinco

equipos de promoción de ventas

sobre una técnica distinta de

promoción a cada equipo, A, B,C, D

y E. Diga cuantas opciones posibles

hay para completar la promoción en

tres zonas de la ciudad.

5 x 5 x 5 = 125 opciones

PERMUTACIONES

• Es un arreglo en un orden particular de los objetos que forman un conjunto

• P(n,r) = n!/(n- r)!• P(N,R) = permutaciones de n objetos si

se toman r a la vez

• n = número de objetos

• r = objetos a la vez

FACTORIAL

• El producto de un entero positivo por todos los que le preceden se denota como n! Y se lee n factorial

• n(n-1)! = n!• despejando• (n-1)!= n!/n• De esta manera

cuando n=1, se define 0!=1

EJEMPLO

Si ninguna letra se puede repetir

• P(n,r) = n!/(n- r)!• P(26,3)=26!/23!• =15600X1000• =15 600 000

C O A H U I L A

E W M 3 5 9

Ejemplo

• Una empresa capacita a cinco

equipos de promoción de ventas

sobre una técnica distinta de

promoción a cada equipo, A, B,C, D

y E. Diga cuantas formas distintas

puede iniciar la capacitación en tres

zonas distintas de la ciudad.

P(n,r) = n!/(n- r)!

P(5, 3) = 5!/ (5 - 3)! = 60 permutaciones

COMBINACIÓN

• Es una selección de objetos sin importar el orden.

• (n/r)=n!/(n-r)! r!• (n/r)=combinació

n de r objetos tomados de un conjunto n de estos.

• n= número de objetos

• r= objetos a la vez

EJEMPLO

• Una empresa capacita a cinco equipos

de promoción de ventas sobre una

técnica distinta de promoción a cada

equipo, A, B,C, D y E. Diga en

cuantas combinaciones distintas

puede iniciar la capacitación en tres

zonas de la ciudad.

(n/r)=n!/(n-r)! r!

(5/3) = 5! /(5 - 3)! 3! = 10 combinaciones

Teorías de probabilidades

P = Resultados deseados / Resultados posibles

Muestreo con reemplazo

Al obtener muestras aleatorias de un espacio muestral, y al reemplazar dichas muestras antes de las siguiente muestra, se llama muestreo con reemplazo, y en cada muestreo la probabilidad será la misma.

P ( ) = 4/7

Ejemplo

• Una concesionaria tiene

a la venta por sorteo el

siguiente lote de autos,

reemplazando siempre

el auto que sea sorteado

por otro del mismo

color.

• Cual es la probabilidad

que en el segundo sorteo

salga un auto


que en el 5o sorteo salga

un auto

R = 1/4 y 1/6

Teorías de probabilidades T II

P = Resultados deseados / Resultados posibles

Muestreo sin reemplazo

Al obtener muestras aleatorias de un espacio muestral, y al no reemplazar dichas muestras antes de la siguiente muestra, se llama muestreo sin reemplazo, y en cada muestreo la probabilidad será en aumento.

P2 ( ) =3/7 x 4/6 = 6/21

P1 ( ) = 4/7

P3 ( ) = 3/7 x 2/6 x 4/5 = 24/210

Ejemplo

• Una concesionaria tiene

a la venta por sorteo el

siguiente lote de autos, y

si no son reemplazados


que en el segundo sorteo

salga un auto


que en el 3er sorteo salga

un auto

R = 9/12 x 3/11 = 27/132

R = 10/12 X 9/11 X 2/10 = 180/1320

Probabilidad compuesta

En una ciudad se editan dos periódicos A y B. El periódico A lo leen 40 de 100 personas, mientras que el B lo leen 25 de cada 100. Los lectores de ambos periódicos son 15 de cada 100. ¿Que probabilidad hay de que una persona en esta ciudad lea alguno de estos dos periódicos?

A B

1525 10

P = (A U B ) = 25 + 15 + 10 = 50 %

P = (A U B ) = 40 + 25 - 15 = 50 %

Ejemplo

Del ejemplo anterior encuentre la probabilidad de que al elegir una persona de esta ciudad solo lea el periódico B

R = 10%

Probabilidad condicional

La distribución de 125 autos de una empresa

según su modelo y su motor es la siguiente:

AUTOS Austero Clásico Lujo SUMA

6 Cilindros 40 15 10 65

8 Cilindros 30 25 5 60

SUMA 70 40 15 125

0.56

0.42857143

Probabilidad de seleccionar un austero =

Probabilidad de seleccionar un 8 cil.

Que sea austero =

Probabilidad de 8 cil. Condicionada a austero

DISTRIBU

CION

ES

DE PR

OBABILIDAD

T III

Distribución Binomial

P(x) = (n/x) P (éxito)x p (Fracaso) n-x

(n/x) = combinación

n = número de ensayos

x = número de éxitos

P = probabilidad

EjemploUn vendedor de autos nuevos observa que el 80% de los autos vendidos son regresados al departamento de servicios para corregir diversos defectos de fabricación en los primeros 25 días después de su compra. De los 11 autos que se vendieron en un período de 5 días cual es la probabilidad de que:

a) Todos regresen en el lapso de 25 días para recibir servicio.

b) Solo uno no regrese.

P(X) = (11/11) (0.8)11 (0.2)0 = 0.0858

P(X) = (11/10) (0.8)10 (0.2)1 = 0.23

(11/11) = 1

Combinaciones

(11/10) = 11

Uso de la computadora (Excel)

En Excel entramos a fx y en la siguiente ventana seleccionamos Estadísticas en el lado izquierdo y buscamos Distribución binomial en el derecho.

Aparece una ventana que nos pide los siguientes datos:

• Número de éxitos

• Ensayos

• Probabilidad de éxito

• Acumulado escribir la palabra Falso para obtener la función de probabilidad bruta.

Ejemplo

El 8% de los emparedados se piden sin mayonesa, si 7 personas piden emparedados encuentre la probabilidad que:

a) Todos lo quieran con mayonesa

b) Solo uno lo quiera con mayonesa

P(X) = (7/7) (0.92)7 (0.08)0 = 0.5578

P(X) = (7/1) (0.92)1 (0.08)6 = 0.00000168

Distribución Normal

f(X) = e-(1/2) ((x-µx) / σx)2 / V 2π σ x

e = Constante matemática 2.71828

π = Constante matemática 3.1416

µx = Media de la población

σ x =Desviación estándar de la población

X = Es cualquier variable aleatoria continua donde

-x < X < +x

Distribución normal

Resulta demasiado tedioso calcular la función por medio de la fórmula anterior, porque la media y la desviación estándar pueden variar y tener un número infinito de combinaciones.

Fórmula de Transformación

Para evitar estos cálculos debemos estandarizar la información para analizar una tabla.

z = X - µ / σ

z = Variable normal estándar

µ = media

σ = desviación estándar

EjemploPizza Rápida tiene registrados los tiempos de entrega a clientes en la siguiente tabla, y piensa regalar la pizza que sea entregada después de los primeros 30 min. de que fue cocinada, encuentre la probabilidad de que una pizza sea regalada a un cliente.

10 15 25 20 30

10 5 10 25 35

15 20 30 15 10

10 20 15 20 5

15 25 10 15 10

µ = media

µ = promedio

µ =420/25

µ =16.8

Desviación estándar

σ = desviación estándar o típica

σ = V ٤ (xi - µ )2 / N

(10 - 16.8)2 = 46.24

(15 - 16.8)2 = 3.24

(25 - 16.8)2 = 67.24

•

•

•

Σ = 1544

σ = V1544/25 = 7.85

CON DATOS AGRUPADOS

Para el problema anterior

Intervalos Marcas de clase xi

Frecuencias ni

(xi)(ni) (x-µ) 2ni

5 < 15 10 9 90 761.76

15 < 25 20 10 200 6.4 25 < 35 30 5 150 583.2

35 < 45 40 1 40 432.64

Σ = 480

µ = 480 / 25 = 19.2

Σ = 1784

σ = V1784 / 25 = 8.44748

σ = desviación estándar o típica

σ = V ٤ (xi - µ )2 ni/ N

µ = Σ(xi ni) / N

Diferencia

•Existe una diferencia entre los métodos anteriores utilizados para encontrar la media y la desviación estándar, aunque el primero es más exacto el segundo es el más utilizado porque simplifica los cálculos, por lo que debemos practicar el trabajar con datos agrupados.

•Una vez calculados la media y la desviación estándar podremos calcular cualquier probabilidad utilizando la tabla de la distribución normal.

•Siempre recuerda que la probabilidad encontrada en la tabla es la probabilidad de la media al valor estandarizado, es el área bajo la curva entre estos dos puntos.

Uso de la tabla

Como nos preguntan la probabilidad de que se regale la pizza, entonces tendremos que estandarizar el 30 porque debemos encontrar la probabilidad de que sean entregadas en un tiempo mayor de los 30 minutos

z = (X - µ) / σz = (30 - 19.2 / 8.44) = 1.278

buscamos este valor en la tabla de la normal y encontramos una probabilidad de 0.3996, esa es la probabilidad de la media al 30, por lo que la probabilidad mayor de 30 será 0.5 - .3996 = 0.1004 = 10%

3019.2

Uso de la computadora (Excel)

En Excel entramos a fx y en la siguiente ventana seleccionamos Estadísticas y buscamos Distribución normal.

Aparece una ventana que nos pide los siguientes datos• X valor cuya distribución se desea obtener• Media• Desviación estándar• Acumulado escribir la palabra verdadero para obtener la función de probabilidad acumulativa, por lo que la probabilidad encontrada será la acumulada desde el extremo izquierdo hasta el valor cuya distribución se desea obtener, con los datos en cuestión nos dará 0.89966068 pero como nos interesa la probabilidad mayor de 30 entonces será 1- 0.8899 = 0.1004 = 10%

TEMA III Bases para la

investigación de

mercadosESTIAMCIÓN:

Es el proceso de utilizar los datos muestrales para estimar los valores de

parámetros desconocidos de una población.

ESTIMACIÓN DE PUNTO:

Estimación de un punto único de un parámetro de la población.

ESTIMACIÓN DE INTERVALO:

Estimación que incluye un intervalo de valores posibles en el que se considera que está comprendido un parámetro de

la población.

Criterios para seleccionar un buen

estimadorIMPARCIALIDAD:

La media de la distribución de muestreo de las

medias de muestras tomadas de una misma

población es igual a la media de la población

EFICIENCIA:

De dos estadísticas de muestras del mismo

tamaño de una misma población, será más

eficiente la que tenga menor error estándar o

menor desviación estándar.

COHERENCIA:

El tamaño de la muestra debe ser el adecuado

para que la estadística sea un estimador

coherente.

SUFICIENCIA:

Cantidad suficiente de información en la

muestra sobre el parámetro de la población

Si la media y la mediana coinciden, la

media de la muestra sería buen estimador

de la mediana de la población, mejor

estimador que la propia mediana de la

muestra ya que ésta en muestras grandes

tiene desviación estándar mayor que la

media.

La mediana de la muestra sería un

estimador para la media de la población,

pero no es el más eficiente porque en

muestras grandes tiene mayor error

estándar que el de la media de la muestra.

EJEMPLO: Estimación puntual

Una compañía produce jeringas hipodérmicas desechables, cada jeringa viene en envoltura estéril y que a su vez

es empacada en grandes cajas, estas cajas contienen diferentes cantidades de

jeringas. Debido a que las jeringas se venden por piezas la compañía necesita

una estimación del número de piezas que hay por caja, y para propósito de

investigación, se ha tomado una muestra aleatoria de 35 cajas y contado el número

de jeringas por caja. 101 103 112 102 98 97 93

105 100 97 107 93 94 97

97 100 110 106 110 103 99

93 98 106 100 112 105 100

114 97 110 102 98 112 99

Uso de la media de la muestra para estimar la media de la población.

µ = 3570/35 = 102 jeringas

Tanto el comprador como el vendedor estarán de acuerdo con esta estimación

puntual como 102 jeringas para la población, y el fabricante puede

ahorrarse el gasto y el tiempo para contar cada una de las jeringas

contenidas en las cajas.

Varianza de la muestra, como varianza de la población.

σ2 = Σ (x - µ)2 /n-1=1228/34 = 36.12

Desviación estándar de la muestra como estimador de la desviación estándar de

la población.

σ = V Σ (x - µ)2 /n-1

σ = V 36.12 = 6.01 jeringas

Uso de la porción de la muestra para estimar la porción de la población.

La empresa desea estimar el número de cajas que lleguen dañadas debido a un

mal manejo en el traslado; de una muestra de 50 cajas desde el punto de embarque hasta su arribo al punto de destino se encontró que la porción de cajas dañadas es de .08 diríamos que esa misma porción se estima para la

población.

Estimación de intervalo

El director de investigaciones de mercado de una fábrica necesita hacer una estimación de la vida promedio de baterías, se registra el nombre y el

teléfono del propietario.

Se encuentra la media para una estimación puntual, si es de 36 meses

podríamos estimar la duración media de la población de 36 meses, pero el director pide que se de una afirmación acerca del intervalo dentro del cual es probable que esté la media de la población, y para esto debemos encontrar el error estándar de la

media

σ µ= σ/ Vn

para población infinita

De las 200 baterías la que duró más fueron 75 meses y la que menos duró fue

de 15 meses, una manera burda de obtener la desviación estándar de la

muestra para estimar la de la población sería.

6 σ = 75 - 15

σ = 10

pero sería preferible encontrarla por la fórmula ya conocida

σ = V Σ (x - µ)2 /n-1

entonces el error estándar sería

σ µ= 10 / V 200 = 0.707 meses

con 2 errores estándar en la curva de la normal = 0.955 con lo que3 podemos

decir que tenemos el 95.5% de confianza que la vida útil de la batería está dentro

del intervalo 34.58 a 37.41 meses.

Estimación de intervalo de la media a

partir de muestras grandes.

Un gran distribuidor de refacciones automotrices necesita una estimación de

la vida media que cabe esperar de los limpiabrisas en condiciones normales de manejo. La gerencia ya ha determinado

que la desviación estándar de la población es de 6 meses, cuando

seleccionamos una muestra aleatoria simple de 100 limpiabrisas y reunimos los

datos referentes a su vida útil, y obtenemos estos resultados.

N = 100 tamaño de la muestra

µ = 21 meses media muestral

σ = 6 meses desv estándar

Como el vendedor utiliza 10 000 de tales limpiadores al año, nos pide que

encontremos una estimación de intervalo con un nivel de confianza de 95% (como la muestra es mayor de 30 se utiliza

la distribución normal)

σ µ= σ/ Vn = 6/ V100

σ µ = 0.6 meses de error para población infinita

Cálculo de los límites de confianza 95%

= 95%

47.5 en la tabla = 1.96 = z

µ + 1.96 σ µ =límite de confianza sup.

µ - 1.96 σ µ =límite de confianza inf.

21

47.547.5

21 + (1.96 x 0.6) = 22.18 meses

21 - (1.96 x 0.6) = 19.82 meses

Conclusión

podemos informar que la estimación de la vida media de la población de limpiadores

de parabrisas está entre 19.82 y 22.18 meses con el 95 % de confianza.

Será finito cuando la muestra sea más del 5% de la población

σ µ= (σ/ V n )x (V N-n/ N-1)

Estimación de intervalo de la porción a partir de muestras

grandesp = porción de éxitos en una muestra

µp = media de la porción de éxitos

µp = P

P = probabilidad de obtener un éxito

Error estándar de la porción

σ p = V p q / n

q = porción de no éxito

Ejemplo

En una muestra de 75 personas el 40% toman cocacola y el director de

investigaciones de mercados necesita un 99% de confianza para encontrar un

intervalo de la verdadera porción de la población.

n = 75 tamaño de la muestra

p = 0.4 éxitos

q = 0.6 no éxitos

σ p = V P q / n = V (0.4)(0.6)/75

σ p = 0.057 error estándar de la porción.

Para un nivel de confianza de 99% se tiene que:

En la tabla a 49.5 le corresponden 2.58 errores estándar que son los necesarios para el 99% de confianza.

Límite superior de confianza:

p +z cantidad de errores est. x error est.

0.4 + (2.58 x 0.057) = 0.547

Límite inferior de confianza:

p - z cantidad de errores est. X error est.

0.4 - (2.58 x 0.057) = 0.253

45.9 45.9

Por lo que podemos concluir que la verdadera porción de la población está

entre 0.253 y 0.547

Entre 25.3% y 54.7% de la población consumen cocacola, lo que podemos afirmar con un 99% de confianza.

Tamaño de la muestra para estimar una

mediaUna tienda está interesada en obtener

una estimación de intervalo para el número medio de clientes que entran a la tienda diariamente, los dueños saben que existe una diferencia de 90 clientes entre

el índice más bajo y el más alto.

Determine el tamaño de la muestra que se deberá utilizar con el fin de desarrollar un intervalo de confianza de 96% para el

número medio real de clientes con un ancho de solamente +8 personas.

Una estimación burda de la desviación estándar sería

6 σ = 90 clientes (3 a la izq. Y 3 a la der)

σ = 90 / 60 = 15 clientes

Z σ µ = 8

para encontrar z debemos utilizar el nivel de confianza en la tabla

96%

0.48 en la tabla de la curva normal

z = 2.05

por lo tanto

2.05 σ µ = 8

σ µ = 8 / 2.05

σ µ = 3.9 tenemos que σ µ= σ/ V n

3.9 = 15 / V n

n = 14.79 = 15

48 48

Tamaño de la muestra para estimar una

porciónTenemos indicios que el 60 % de la población (>100 000) consumen un producto. Encuentre el tamaño adecuado de la muestra para estimar un intervalo de ancho + 5%para encontrar la verdadera porción con un 90 % de confianza.

σ p = V P q / n

Despejando

n = p q / (σ p )2

sabemos que 90% en tabla z = 1.65p = 0.6 q = 0.4

Y como z σ p =.05

σ p= 0.05/1.65 = 0.03

σ p= 0.03

sustituimos en la fórmula

n = (0.6)(0.4)/(0.03)2 = 266.66 =267

NOTA:Para poblaciones infinitas > 100 000podemos considerar el error E entre 0.02 y 0.06 y utilizamos las sigfórmulas:E = σ p

n = pxq/E2 para 90% de confianza

n = 3.84pxq/E2 95% de confianza

n = 7.52 pxq/E2 99% de confianza

el factor 3.84 se obtiene encontrando z de la tabla de acuerdo al nivel de confianza y elevando al cuadrado.Y si no conocemos la p q se les da el valor de 0.5

PARA POBLACIONES FINITAS < 100 000

n = 3.84 N p x qE2(N - 1) + 3.84 p x q

para un 95 % de confianza

Prueba de hipótesis de la media

En una muestra de 100 ejes traseros de camión que deben soportar 80 000 libras por pulgada cuadrada se encontraron los siguientes resultados, después de someterlos a pruebas de esfuerzos.µ = 79,600σ = 4,000n = 100µ HO = 80 000Si el fabricante usa un nivel de significancia de 0.05 en las pruebas ¿Cumplirán los ejes con el requisito?

σ µ= σ/ Vn = 4000/ V 100 = 400

como el nivel de significancia es de 0.05 se divide entre 2, porque la resistencia de los ejes no puede ser muy baja pero tampoco muy alta por los costos

.475 .475

Z = 1.96

Para 0.5 nivel des significancia

0.025 0.025b

Límite superior 80 000 + 1.96 (400) = 80 784 Lb/pulg2

Límite inferior 80 000 - 1.96 (400)= 79 216 Lb/pulg2

Y como la media está entre los límites se acepta la hipótesis nula. S i cumplirán los requisitos dichos ejes.

Correlación y regresión

OBSERVACIÓN DE VARIABLES RELACIONADAS

La correlación mide la fuerza de una relación entre dos variables; y la regresión da lugar a una ecuación y = a + bx

EJEMPLOS

Un T S U en comer puede explicar los cambios de la demanda de un producto, en términos del nivel de empleo, el precio de un producto usado en términos del tiempo del uso etc.

EJEMPLO

Se indaga si el precio de un auto usado depende del kilometraje

y es la variable dependiente (precio)x es la variable independiente (km)n es número de observacionesAl parecer los autos muestran una relación lineal en el kilometraje y el precio.

Método de mínimos cuadrados

b = n ( Σ x y ) - ( Σ x ) (Σ y )n ( Σ x2 ) - ( Σ x )2

a = Σ y - b Σ x n

y sustituimos en y = a + bx para encontrar los costos

BIBLIOGRAFÍA• Etadística Aplicada a la Mercadotecnia.

• Roaño Humberto

• Editorial Diana

• Estadística Paso a Paso

• Howard B. Christensen

• Editorial Trillas

• Matemáticas Aplicadas para la Edministración y la Economía y Ciencias Sociales

• Frank S. Budnick

• Editorial Mc Graw Hill

• Matemáticas Aplicadas a la Administración y Economía

• Jasdish C. Ayra/Robin W. Landner

• Editorial Pretince Hall

• Estadística

• Murray R. Spiegel


• Probabilidad y Estadística

• Murray R. Spiegel


Documents

Guia de Estadística Aplicada a La Investigación de Mercados