Upload
anthonyjoel
View
159
Download
0
Embed Size (px)
DESCRIPTION
Separata de practica de Matlab, en la cual se puede encontrar ejercicios y teoría acerca de este pograma
Citation preview
EPE
AUTORES : Silvia Gutiérrez Flores Walter Luna Flores
TÍTULO : Cuaderno de trabajo
FECHA : Enero 2015 CURSO : Estadística Descriptiva CODIGO : MA147 y CE19 ÁREA : Ciencias CICLO : 2015-0
Contenido
EPE 2 Capítulo 1. Organización de datos 5
Subdivisión de la Estadística 5
Definiciones básicas 6
Métodos de recolección de datos 9
Variable 12
Escalas de medición 15
Organización y presentación de datos 25
Tabla de frecuencias para variables cualitativas 28
Representación gráfica de variables cualitativas 31
Representación gráfica de variables discretas 60
Representación gráfica de variables cuantitativas continuas 69
Capítulo 2. Resúmenes de datos 87
Medidas de tendencia central 87
El ingreso promedio mensual en Lima aumentó un 3,9% 87
Medidas de dispersión 111
Medidas de asimetría 120
Capítulo 3. Probabilidades 127
Definiciones básicas de probabilidad 127
Probabilidad condicional 137
Eventos independientes 141
Teorema de la probabilidad total 144
Teorema de Bayes 145
Capítulo 4. Variable aleatoria y distribución de probabilidad 151
Variable aleatoria 151
Variable aleatoria discreta 152
Variable aleatoria continua 161
Distribuciones discretas especiales 162
Distribuciones continuas especiales 174
Capítulo 5 Muestreo 183
Muestreo probabilístico 185
Capítulo 1. Organización de datos 5
Capítulo 1. Organización de datos
Subdivisión de la Estadística
Estadística
Es una ciencia que proporciona un conjunto de métodos,
técnicas y procedimientos para recopilar, organizar, presentar y
analizar datos.
La finalidad y utilidad es describir, numérica o gráficamente al conjunto de datos, así como
también realizar inferencias, entendidas como generalizaciones de lo observado, de manera que
se puedan obtener conclusiones adecuadas.
Estadística Descriptiva
Son métodos y técnicas de recolección,
caracterización, resumen y
presentación que permite describir apropiadamente las características de un conjunto de
datos.
Comprende el uso de gráficos, tablas,
diagramas y criterios para el análisis. Existen
diversos tipos de gráficos
adecuados a los distintos datos que se desean representar.
Estadística Inferencial
Son métodos y técnicas que hacen
posible estimar una o más
características de una población o
tomar decisiones referentes a la
población basados en el resultado de muestras elegidas adecuadamente.
Estas conclusiones no tienen que ser
totalmente válidas, pueden
tener cierto margen de error,
por eso se dan con una medida de confiabilidad o probabilidad.
6 Estadística Básica con Aplicaciones en Excel 2010
Definiciones básicas
Población
•Es el conjunto de todas las unidades elementales de interés en un determinado estudio.
•Pueden ser personas, animales, objetos, conceptos, etc. de los cuales sacamos conclusiones a partir de una o más características observables de naturaleza cualitativa o cuantitativa.
Muestra
•Es una parte o un subconjunto de la población que se selecciona adecuadamente para obtener información acerca de la población de la cual proviene.
•Una muestra será representativa si es elegida de forma aleatoria.
Unidad elemental
•Es el objeto sobre el cual se hace la medición.
•También se le denomina unidad de análisis, unidad estadística o elemento.
•Por ejemplo, en estudios de poblaciones humanas, con frecuencia ocurre que la unidad elemental es cada individuo.
Dato
•Es el resultado de medir una característica de una unidad elemental.
•Los datos pueden ser cualitativos o cuantitativos ya que dependerán del tipo de variable.
Observación
•Es el conjunto de datos de una unidad elemental.
•La observación se tiene para cada unidad elemental.
Capítulo 1. Organización de datos 7
Ejemplo 1 El hotel La Posada es relativamente nuevo en el mercado hotelero de Puno. La gerencia general desea invertir en publicidad para incrementar la cantidad de huéspedes extranjeros en el hotel. Para conocer qué características del hotel es conveniente resaltar en la publicidad, se aplicó una encuesta a una muestra aleatoria de 56 mujeres y 59 hombres extranjeros que se hospedaron en-tre enero y mayo del presente año. A continuación, se presenta parte de la base de datos:
N° Edad Género País de proce-
dencia
Precio dispuesto a pagar por
habitación en dólares
Número de acompañantes
por viaje Criterio de selección del hotel
1 25 Masculino Inglaterra 80 0 Limpieza del dormitorio
2 35 Femenino Argentina 60 2 Precio
3 45 Masculino Francia 115 3 Buena calidad de las toallas y sábanas
4 65 Masculino Francia 45 0 Precio
5 72 Femenino Francia 55 1 Amigable y cordial staff de empleados
6 28 Masculino Estados Unidos 65 2 Precio
7 45 Femenino Estados Unidos 60 1 Precio
8 85 Masculino China 70 2 Precio
9 25 Masculino Inglaterra 65 3 Limpieza del dormitorio
10 35 Femenino Francia 45 1 Precio
11 20 Masculino Estados Unidos 55 2 Amigable y cordial staff de empleados
a. Determine la población, la muestra y la unidad elemental. b. De la base de datos, proporcione un ejemplo de dato y uno de observación.
Solución
Población Todos los huéspedes extranjeros que se hospedaron en el hotel La Posada entre enero y mayo del presente año.
Muestra 115 huéspedes extranjeros que se hospedaron en el hotel La Posada entre enero y mayo del presente año.
Unidad elemental Un huésped extranjero que se hospedó en el hotel La Posada entre enero y mayo del presente año.
Dato X4 = 65 años
Observación X4 = 65 años, masculino, Francia, 45 dólares, 0 acompañantes, precio
8 Estadística Básica con Aplicaciones en Excel 2010
Ejercicio 1
De los universitarios que estudian en la ciudad de Lima, se quiere estimar el porcentaje de universi-tarios que trabajan. Determine la población, la muestra y la unidad elemental.
Población
Muestra
Unidad elemental
Ejercicio 2
Se desea estimar el promedio diario de clientes que ingresan a un supermercado, para lo cual se eligieron cinco días al azar del presente mes y se registró el número de clientes que ingresó cada día al supermercado. Los resultados registrados fueron los siguientes: 554, 789, 487, 553 y 625 per-sonas. Determine la población, la muestra y la unidad elemental.
Población
Muestra
Unidad elemental
Ejercicio 3
La Oficina de Turismo de Cusco recopiló datos sobre los turistas que llegaron a la ciudad. Entre las 16 preguntas de un cuestionario que se entregó a los pasajeros que llegaron en el mes de enero del presente año, figuraban, entre otras, las siguientes preguntas:
Esta visita a Cusco es la: ………………… vez (primera, segunda, tercera, etc.).
El motivo principal de este viaje es: ………………… (16 categorías incluyendo vacaciones, trabajo).
Voy a estar alojado en: …………………… (10 categorías incluyendo hotel, apartamento, parientes).
Mi estadía en Cusco va a durar: …………………. días.
Población
Unidad elemental
Capítulo 1. Organización de datos 9
Métodos de recolección de datos
La forma de obtener la información original de las unidades elementales por investigar puede ser efectuada a través de:
Censo
• Es una encuesta de todos los elementos de la población.
Encuesta muestral
• Es una encuesta de una parte de la población.
El uso de la encuesta ha ido en rápido aumento, debido a:
1. Que las instituciones que producen información
disponen de personal capacitado para efectuar su organización, diseño y análisis.
2. Su menor costo con respecto al censo que, en determinadas circunstancias, la información resulta más exacta que la de un censo. Esto se debe a que los errores en la recolección y procesamiento de los datos pueden ser reducidos a través de una mejor capacitación de los empadronadores y la utilización de métodos de captación de información más objetivos.
10 Estadística Básica con Aplicaciones en Excel 2010
Ejemplo 2
Aprobación de Ollanta Humala cayó a 39% según reveló encuesta de Datum
ElComercio.pe lunes 8 de julio del 2013
La aprobación del jefe de Estado, Ollanta Humala, registró su por-centaje más bajo desde que se inició la gestión presidencial. En
una encuesta realizada por Datum, la popularidad de Humala apenas alcanzó 39%. Esto es siete puntos menos que el mes anterior y un retroceso de 21 unidades respecto de abril.
El estudio puntualizó además que el nivel de desconfianza hacia Humala Tasso aumentó de 69% a 81%, también tomando en cuenta las cifras del mes que pasó. La esposa del jefe de Estado, Nadine Heredia, obtuvo 47% de respaldo. Un 46% la desaprobó.
Capítulo 1. Organización de datos 11
Registro administrativo
Existen oficinas públicas que llevan registros administrativos para sus propios fines. Por ejemplo:
los Registros Civiles registran nacimientos, casamientos o defunciones,
el Ministerio de Educación que lleva registros sobre matrícula de alumnos o deserción escolar,
la Aduana que registra las importaciones y exportaciones. Los registros administrativos constituyen la forma más económica de obtener información estadística. Sin embargo, esta información se obtiene tal como está disponible. Los fines del registro administrativo no siempre coinciden con los de nuestra investigación. Por ejemplo, se puede consultar las páginas web de las siguientes instituciones: • Ministerio de Educación http://minedu.gob.pe/ • Ministerio de Salud http://www.minsa.gob.pe/ • Superintendencia Nacional de Aduanas y de Administración Tributaria SUNAT
http://www.sunat.gob.pe/ • Registro Nacional de Identificación y Estado Civil http://www.reniec.gob.pe/ • Ministerio de Economía y Finanzas http://www.mef.gob.pe/ • Sistema Integrado de Información de Comercio Exterior http://www.siicex.gob.pe/ • Instituto Nacional de Estadística e Informática INEI. http://www.inei.gob.pe/
Ministerio de Trabajo y Promoción del Empleo. http://www.mintra.gob.pe/
12 Estadística Básica con Aplicaciones en Excel 2010
Variable
Variable
Se define así a una característica que presentan los elementos de una población y que puede asumir diferentes valores cuando se realiza su medición
Variables cualitativas
Son aquellas variables que al ser medidas
quedan expresadas por etiquetas o nombres que se utilizan para
identificar una característica o atributo.
Variables cuantitativas
Son aquellas variables que al ser medidas quedan expresadas por números que se utilizan para
identificar una característica o atributo.
Estas a su vez pueden clasificarse en discretas o continuas.
Variable cuantitativa
discreta
Es aquella variable cuyo número de posible de
valores es finito o infinito numerable; es decir, que sólo puede tomar ciertos valores en un intervalo
determinado.
Variable cuantitativa
continua
Es aquella variable cuyo número posible de
valores es infinito no numerable, es decir, que puede tomar cualquier valor en un intervalo
determinado.
En una variable continua, para dos valores
cualesquiera, siempre se puede encontrar un tercer
valor entre los dos primeros.
Capítulo 1. Organización de datos 13
Ejemplos de variables
Las siguientes variables corresponden a una encuesta aplicada a un postulante de una agencia pu-blicitaria:
Ejemplo 3 El hotel La Posada es relativamente nuevo en el mercado hotelero de Puno. La Gerencia General desea invertir en publicidad para incrementar la cantidad de huéspedes extranjeros en el hotel. Para conocer qué características del hotel es conveniente resaltar en la publicidad se aplicó una encuesta a una muestra aleatoria de 56 mujeres y 59 hombres extranjeros que se hospedaron en-tre enero y mayo del presente año. A continuación se presenta parte de la base de datos:
N° Edad Género País de
procedencia
Precio dispuesto a pagar por
habitación, en dólares
Número de acompañantes
por viaje
Criterio de selección del hotel
1 25 Masculino Inglaterra 80 0 Limpieza del dormitorio
2 35 Femenino Argentina 60 2 Precio
3 45 Masculino Francia 115 3 Buena calidad de las toallas y sábanas
4 65 Masculino Francia 45 0 Precio
5 72 Femenino Francia 55 1 Amigable y cordial staff de empleados
6 28 Masculino Estados Unidos 65 2 Precio
Identifique cada una de las variables que se presenta en la base de datos según su tipo.
Solución
Variable Tipo de variable
Edad Cuantitativa continua
Género Cualitativa
País de procedencia Cualitativa
Precio dispuesto a pagar por habitación, en dólares Cuantitativa continua
Número de acompañantes por viaje Cuantitativa discreta
Criterio de selección del hotel Cualitativa
Variable
Cualitativa
Lugar de nacimiento
Grado de instrucción
Cuantitativa discreta
Número de capacitaciones llevadas en el presente año
Número de hijos
Cuantitativa continua
Tiempo de demoran para trasladarse de
su casa al trabajo (en minutos)
Salario actual (en nuevos
soles)
14 Estadística Básica con Aplicaciones en Excel 2010
Ejercicio 4
Los clientes que se suscriben a la revista “Economía al Día” deben llenar un formato con informa-ción personal. Identifique el tipo de variable.
Variable Tipo de variable
Género
Profesión
Distrito donde vive
Ingreso mensual familiar (en nuevos soles)
Grado de instrucción
Número de teléfono
Estado civil
Ejercicio 5
El gerente de una red de librerías, con sucursales en Santiago de Surco, San Borja y San Luis ha ob-servado que en los últimos meses las ventas han disminuido, y desea conocer los factores que ori-ginan este problema. Por ello, realizó una encuesta a 210 clientes seleccionados aleatoriamente de todas las sucursales. Algunas de las variables recolectadas mediante la encuesta son las siguientes:
Ingreso mensual familiar (en nuevos soles)
Distrito de residencia
Número de hijos en edad escolar
Nivel de satisfacción con la atención recibida (muy buena, buena, mala, muy mala)
a. Del enunciado anterior identifique la población en estudio, la muestra y la unidad elemental.
Población
Muestra
Unidad elemental
b. Identifique las variables en estudio con su respectivo tipo.
Variable Tipo de variable
Ingreso mensual familiar (en nuevos soles)
Distrito de residencia
Número de hijos en edad escolar
Nivel de satisfacción con la atención recibida
Capítulo 1. Organización de datos 15
Escalas de medición
La medición de una variable consiste en asignar un valor a la
característica observada.
Por ejemplo, si la característica observada es el
género de las personas, hacemos una medición de la característica y le asignamos
un valor, el de femenino.
El proceso de medición utiliza las escalas: nominal, ordinal, intervalo y razón.
•Sólo permite asignar un nombre, etiqueta o valor al elemento sometido a medición.
•Los números que se puedan asignar a las propiedades de los elementos se utilizan sólo como etiquetas con la finalidad de clasificarlos.
•Con esta escala no tiene sentido realizar operaciones aritméticas.
Nominal
•Los datos son etiquetas y además el orden es significativo.
•Los datos se pueden ordenar en forma ascendente o descendente, de tal manera que puedan expresar grados de la característica medida.
Ordinal
•Además de asignar un nombre o etiqueta y establecer un orden entre los elementos, esta escala permite calcular diferencias entre los números asignados a las mediciones (el intervalo entre observaciones que se expresa en términos de una unidad fija de medida).
•Los datos son numéricos.
Intervalo
•Los datos tienen todas las propiedades de los datos de intervalo y el cociente de los dos valores es significativo.
•Tiene un punto cero absoluto, es decir, el cero indica la ausencia de la característica medida.
•Se puede realizar las operaciones aritméticas a los números asignados.
Razón
16 Estadística Básica con Aplicaciones en Excel 2010
Ejemplos de variables y sus escalas de medición
•El género de las personas
•La marca de celular
•La línea aérea de su preferencia
•La religión que profesa una persona
•El número de DNI
•……………………………..........………………
•………………………………………..........……
Nominal
•El orden de mérito de los alumnos de la UPC
•El grado académico de los empleados de un banco
•La opinión sobre la atención en un supermercado (bueno, regular, malo)
•……………………………..….............................
Ordinal
•Las escalas de la temperatura. Por ejemplo, T(°F) = 1.8 x T(°C) + 32
•El año 2000 fue 2753 en el calendario romano, 2749 en el calendario babilónico, 6236 en el egipcio, 2544 en el budista, 5119 en el maya
•La ubicación en una carretera respecto de un punto de referencia
•………………………...........……………………
Intervalo
•El sueldo de los trabajadores de un banco
•La altura de una persona.
•La velocidad de un auto en la carretera
•……………………………………………………………
•………………………………………..…….………......
Razón
Capítulo 1. Organización de datos 17
Ejemplo 4 El hotel La Posada es relativamente nuevo en el mercado hotelero de Puno. La gerencia general desea invertir en publicidad para incrementar la cantidad de huéspedes extranjeros en el hotel. Para conocer qué características del hotel es conveniente resaltar en la publicidad se aplicó una encuesta a una muestra aleatoria de 56 mujeres y 59 hombres extranjeros que se hospedaron en-tre enero y mayo del presente año. A continuación se presenta parte de la base de datos:
N° Edad Género País de
procedencia
Precio dispuesto a pagar por
habitación, en dólares
Número de acompañantes
por viaje
Criterio de selección del hotel
1 25 Masculino Inglaterra 80 0 Limpieza del dormitorio
2 35 Femenino Argentina 60 2 Precio
3 45 Masculino Francia 115 3 Buena calidad de las toallas y sábanas
4 65 Masculino Francia 45 0 Precio
5 72 Femenino Francia 55 1 Amigable y cordial staff de empleados
6 28 Masculino Estados Unidos 65 2 Precio
7 45 Femenino Estados Unidos 60 1 Precio
8 85 Masculino China 70 2 Precio
9 25 Masculino Inglaterra 65 3 Limpieza del dormitorio
10 35 Femenino Francia 45 1 Precio
11 20 Masculino Estados Unidos 55 2 Amigable y cordial staff de empleados
Identifique el tipo y la escala de medición de cada una de las variables que se presenta en la base de datos.
Solución
Variable Tipo de variable Escala de medición
Edad Cuantitativa continua Razón
Género Cualitativa Nominal
País de procedencia Cualitativa Nominal
Precio dispuesto a pagar por habitación, en dólares
Cuantitativa continua Razón
Número de acompañantes por viaje Cuantitativa discreta Razón
Criterio de selección del hotel Cualitativa Nominal
18 Estadística Básica con Aplicaciones en Excel 2010
Ejercicio 6
Indique el tipo y la escala de medición que corresponde a cada una de las siguientes variables.
Variable Tipo de variable Escala de medición
Edad
Marca de automóvil
Número de personas a favor de la pena de muerte
Ventas anuales (en dólares)
Tamaño de bebida (pequeño, mediano, grande)
Ejercicio 7
La Oficina de Turismo de Cusco recopila datos sobre los turistas que llegan a la ciudad. Entre las 16 preguntas de un cuestionario que se repartió a los pasajeros en los vuelos de llegada durante el mes pasado figuraban, entre otras, las siguientes:
Esta visita a Cusco es la: ___________________ vez. (1°, 2°, 3°, etc.)
El motivo principal de este viaje es: _______________ (16 categorías incluyendo vacaciones, trabajo, etc.)
Voy a estar alojado en: ________________ (11 categorías incluyendo hotel, apartamento, pa-rientes, etc.)
Mi estadía en Cusco va a durar: ________ días. Identifique el tipo y la escala de medición de cada una de las variables:
Variable Tipo de variable Escala de medición
Capítulo 1. Organización de datos 19
Parámetro y estimador
Algunos parámetros y estadísticos importantes
Nombre
Notación
Parámetro Estadístico
Media
N
xN
ii
1 n
x
x
n
i
i 1
Varianza
N
xN
ii
1
2
2
11
2
2
n
xx
s
n
i
i
Desviación estándar 2 2ss
Proporción N
Kp
n
kp ˆ
Moda Mo mo
Parámetro
Representa , en valor
numérico, la característica
de la población.
Para obtener su valor se
hace necesario contar con
toda la información que brindan
los elementos de una
población.
Estimador
Representa, en valor
numérico, la característica
de una muestra.
Para obtener su valor se
utiliza la información
muestral.
Al valor numérico del
estimador se le conoce como estimación.
Al estimador, se le llama
también estadígrafo o estadístico.
20 Estadística Básica con Aplicaciones en Excel 2010
Ejemplo 5 Este fue el flash electoral de CPI para las elecciones presidenciales del 2011.
Identifique la variable en estudio, un estadístico para esta variable y el valor del estadístico.
Solución
Variable en estudio: candidato de preferencia
Estadístico para esta variable: proporción del candidato de preferencia
El valor del estadístico es: 52,5% prefiere a Ollanta Humala y 47,5% prefiere a Keiko Fujimori. Ejemplo 6 El hotel La Posada es relativamente nuevo en el mercado hotelero de Puno. La gerencia general desea invertir en publicidad para incrementar la cantidad de huéspedes extranjeros en el hotel. Desea conocer qué características del hotel es conveniente resaltar en la publicidad, para ello apli-có una encuesta a una muestra aleatoria de 56 mujeres y 59 hombres extranjeros que se hospeda-ron entre enero y mayo del presente año. A continuación, se presenta parte de la base de datos:
N° Edad Género País de
procedencia
Precio dispuesto a pagar por
habitación en dólares
Número de acompañantes
por viaje
Criterio de selección del hotel
1 25 Masculino Inglaterra 80 0 Limpieza del dormitorio
2 35 Femenino Argentina 60 2 Precio
3 45 Masculino Francia 115 3 Buena calidad de las toallas y sábanas
4 65 Masculino Francia 45 0 Precio
5 72 Femenino Francia 55 1 Amigable y cordial staff de empleados
6 28 Masculino Estados Unidos 65 2 Precio
7 45 Femenino Estados Unidos 60 1 Precio
8 85 Masculino China 70 2 Precio
9 25 Masculino Inglaterra 65 3 Limpieza del dormitorio
10 35 Femenino Francia 45 1 Precio
11 20 Masculino Estados Unidos 55 2 Amigable y cordial staff de empleados
Capítulo 1. Organización de datos 21
Después de procesar la información se obtuvieron los siguientes resultados:
El 34% de los huéspedes extranjeros procede de los Estados Unidos.
La edad promedio de los huéspedes es de 35,2 años.
El número de acompañantes por huésped extranjero más frecuente es de dos personas.
El criterio de selección más frecuente es el precio. Identifique el estimador y el valor del estimador para cada una de las variables de la base de datos.
Solución
Variable Estimador Notación Valor del estimador
Lugar de procedencia Proporción EEUUp 0,34
Edad de los huéspedes Promedio x 35,2 años
Número de acompañantes Moda mo 2
Criterio de selección del hotel Moda mo Precio
Ejercicio 8
Un banco estatal ha estudiado la información que dieron sus clientes en el mes de marzo al solicitar un préstamo vehicular. Al seleccionar una muestra de 180 clientes algunos resultados fueron:
• El 12% declaró tener un trabajo independiente. • La edad promedio de los clientes al solicitar un préstamo fue de 41,3 años. • El 50% declaró ser casado. • El monto promedio de las solicitudes fue de 3025 nuevos soles. Identifique el estimador y el valor del estimador para cada una de las variables.
Solución
Variable Estimador Notación Valor
22 Estadística Básica con Aplicaciones en Excel 2010
Ejercicio 9
Como parte de un estudio de mercado se aplicó este año una encuesta a un grupo de 245 estudian-tes de la universidad A. Se sabe que en esta universidad el 72% del alumnado pertenece al área de Humanidades y el resto al área de Ciencias. Después de procesar la información se obtuvo que 56% de los encuestados era de sexo femenino, el 33,2% de los encuestados prefiere el rock como género musical, el 45,7% gusta de la emisora 104.7 VIVA F.M. Se sabe, además, que la media del número de veces que un oyente llamó a la radio en el último mes fue de 2,86 llamadas y la moda de esa misma variable fue igual a uno. Identifique el estimador o parámetro y su valor para cada una de las variables.
Solución
Variable Parámetro o estimador Notación Valor
Capítulo 1. Organización de datos 23
Ejercicios de aplicación
1. Conteste las siguientes preguntas justificando adecuadamente las respuestas:
a. ¿Qué diferencias existe entre la escala de intervalos y la escala de razón? Muestre ejemplos que sustenten su respuesta.
b. ¿Qué diferencia existe entre dato y observación? Muestre ejemplos que sustenten su res-puesta.
2. Se quiere estimar el ingreso mensual de los niños y adolescentes que viven en Iquitos. Identifi-que la población, la muestra, el elemento y la variable en estudio.
Población
Muestra
Elemento
Variable
3. La entidad bancaria Tubanco tiene presencia en Lima y Callao. Cuenta actualmente con 9 784 clientes distribuidos en diferentes agencias. Su gerente general desea determinar la situación de la entidad y la de sus clientes. Para ello, seleccionó una muestra de 120 clientes que solicita-ron préstamo durante el último semestre. Parte de la base de datos correspondiente a la muestra se presenta a continuación:
Número de
tarjetas
Edad del cliente (años)
Tipo de préstamo
Monto del préstamo
(en dólares)
Número de cuo-tas del préstamo
(meses)
Tipo de mone-da del présta-
mo
Giro del negocio
1 53 Capital trabajo 5000 6 Soles Bodega
3 36 Cuota fija 1500 12 Soles Restaurante
5 54 Cuota fija 4500 18 Soles Abarrotes
2 45 Mi local 12000 36 Soles Abarrotes
4 43 Mi local 6000 36 Dólares Mueblería
a. De acuerdo con el enunciado identifique la población, la muestra y la unidad elemental. b. Identifique un ejemplo de dato y uno de observación. c. Para cada una de las variables identifique su tipo y escala de medida. d. ¿Qué estadístico puede calcularse para la variable Monto del préstamo y cuál para la varia-
ble Tipo de préstamo?
4. Fernando, estudiante de administración, tiene la labor de conseguir información acerca de los turistas que llegaron a la ciudad del Cusco. En su búsqueda, encontró que la agencia de viajes Turismo Perú realizó un estudio a sus 15 000 turistas extranjeros que llegaron al Cusco el año pasado. Como parte de la información encontró que todos hablaban más de un idioma, el 35% eran americanos y el gasto promedio que hicieron en la ciudad fue de 2 000 nuevos soles.
24 Estadística Básica con Aplicaciones en Excel 2010
De acuerdo con el enunciado anterior: a. Identifique la población, la muestra y la unidad elemental. b. Para cada una de las variables identifique su tipo y escala de medida. c. Mencione dos parámetros y un estadígrafo de utilidad para cada variable.
5. Una entidad estatal realizó un estudio para determinar algunos indicadores socioeconómicos de los inmigrantes peruanos en Estados Unidos. El estudio se llevó a acabo aplicando encuestas a una muestra de 400 inmigrantes peruanos. Algunas de las preguntas del cuestionario fueron las siguientes:
Nivel educativo alcanzado en el Perú.
Monto enviado (en dólares) el último mes a sus familiares en el Perú.
¿Presenta alguno de los siguientes problemas? (indocumentado, discriminado, vivienda no adecuada, salud y otros).
Número de veces que ha visitado el Perú desde que viajó por primera vez a los Estados Unidos.
a. De acuerdo con el enunciado anterior identifique la población y la muestra. b. Para las respuestas generadas por cada una de las preguntas mostradas identifique el tipo
de variable y su respectiva escala de medida. c. Para cada una de las variables, proponga el estadístico más adecuado.
6. Edificar es una empresa dedicada al rubro de la construcción que ha crecido notablemente durante el último año. El gerente de Recursos Humanos ha recibido algunas quejas de los tra-bajadores y antes este problema ha decidido estudiar la situación laboral de los trabajadores para obtener algunas medidas de interés que le permita tomar algunas decisiones. Al seleccio-nar una muestra de 115 trabajadores obtuvo la siguiente información:
Trabajador Género Edad
(en años) Número de hijos
Cargo Ingreso mensual (en nuevos soles)
Motivo de la queja
1 M 32 1 Maestro de obra 2862 Mal remunerado
2 M 32 2 Peón 742 Sin bonificación
3 M 25 0 Oficial 2256 Sin horas extras
4 F 21 0 Operario 1696 Mal trato
115 M 37 3 Oficial 1438 Mal remunerado
De acuerdo con el enunciado anterior: a. Identifique la población, la muestra y la unidad elemental. b. Para cada una de las variables, proponga el estadístico más adecuado que ayude al gerente. c. Complete la siguiente tabla:
Variable en estudio Tipo de variable Escala de medida
Ingreso mensual (en nuevos soles)
Razón
Nominal
Cuantitativa discreta
Capítulo 1. Organización de datos 25
Organización y presentación de datos
Luego de aplicar una encuesta a una muestra de treinta empleados, una empresa obtiene la si-guiente base de datos. Se pide redactar un informe que resuma la información.
Tabla. Datos sobre satisfacción laboral
Género Función Edad
Tiempo en la empre-
sa
Ingreso anual
Número de promocio-
nes
Promoción posible
Número de capacitaciones
Relación con la gerencia
Femenino Obrero 19 1 11 400 0 Improbable 1 Buenas
Masculino Profesional 31 5 210 600 2 No está seguro 2 Buenas
Masculino Profesional 34 8 193 400 1 Probable 2 Buenas
Masculino Servicios 36 15 30 800 1 Improbable 0 Buenas
Masculino Obrero 44 4 9 850 0 Improbable 1 Regulares
Masculino Obrero 44 10 9 800 0 Improbable 1 Regulares
Masculino Técnico/ventas 31 5 40 840 0 Improbable 3 Buenas
Femenino Profesional 37 8 93 700 1 No está seguro 2 Buenas
Masculino Obrero 45 23 10 150 0 Improbable 1 Regulares
Masculino Obrero 54 18 9 050 0 Muy improbable 1 Regulares
Femenino Profesional 26 2 62 200 2 No está seguro 2 Buenas
Masculino Obrero 44 14 10 200 0 Probable 0 Regulares
Masculino Técnico/ventas 31 2 40 335 0 Muy improbable 2 Buenas
Femenino Producción 28 10 30 990 1 Muy improbable 1 Buenas
Femenino Obrero 23 5 9 360 1 Muy improbable 1 Buenas
Femenino Producción 38 20 33 800 0 Muy improbable 1 Buenas
Masculino Producción 38 9 35 500 1 Muy improbable 2 Buenas
Masculino Técnico/ventas 32 2 40 540 0 Improbable 2 Buenas
Masculino Servicios 36 18 27 500 1 Muy improbable 1 Buenas
Femenino Obrero 48 25 10 200 0 Muy improbable 1 Buenas
Masculino Obrero 45 20 9 650 0 Improbable 1 Regulares
Femenino Técnico/ventas 22 2 44 000 0 No está seguro 2 Buenas
Masculino Técnico/ventas 32 6 48 560 1 Improbable 2 Buenas
Masculino Obrero 46 20 10 300 0 Muy improbable 1 Regulares
Masculino Profesional 28 1 108 700 3 Improbable 5 Buenas
Femenino Producción 27 5 30 550 1 Muy improbable 2 Buenas
Masculino Producción 38 14 32 300 0 Muy improbable 1 Buenas
Masculino Obrero 40 20 9 130 0 No está seguro 0 Regulares
Masculino Profesional 24 1 70 000 1 Probable 3 Buenas
Masculino Obrero 56 30 9 740 0 Muy improbable 1 Regulares
¿Qué podemos hacer para resumir esta información?
Una vez recopilada la información, con las variables consideradas de mayor importancia, el siguiente paso es presentarla a través de una tabla de frecuencias o un gráfico que describa adecuadamente las características más importantes.
26 Estadística Básica con Aplicaciones en Excel 2010
Distribución de frecuencias
Frecuencias absolutas, relativas y porcentuales
La frecuencia absoluta (fi ) de una clase es la cantidad de elementos que pertenecen a esa cla-se.
La frecuencia relativa (hi ) de una clase es la proporción de elementos que pertenecen a esa clase.
n
f
datos de número
absoluta frecuenciahrelativa Frecuencia i
i
La frecuencia porcentual (pi) de una clase es la frecuencia relativa multiplicada por 100%.
%100 ii hpporcentual Frecuencia
Ejemplo
Tomado de Revista Peruana de Epidemiología. Prácticas laborales de riesgo en cultivadores de arroz del valle del Alto Mayo, Región San Martín, Perú. Romina Tejada Caminiti, Franco Romaní Romaní, Paolo Wong Chero, Jorge Alarcón Villaverde. Junio 2011 http://rpe.epiredperu.net/rpe_ediciones/2011_V15_N01/AO8_Vol15_No1_2011_Tb1.gif.
Es el resumen de un conjunto de datos,
presentado en una tabla llamada la tabla de
distribución de frecuencias
Esta tabla muestra las frecuencias absolutas, las frecuencias relativas y los
porcentajes
Las categorías o clases no se traslapan.
Capítulo 1. Organización de datos 27
Elementos de un cuadro estadístico
Una tabla de frecuencias o cuadro estadístico debe presentar los siguientes elementos básicos:
Elementos de un gráfico estadístico
La presentación gráfica de la información permite, en la mayoría de casos, obtener conclusiones descriptivas del comportamiento de la variable que se está analizando.
28 Estadística Básica con Aplicaciones en Excel 2010
Tabla de frecuencias para variables cualitativas
La distribución de frecuencias es un cuadro que se calcula de la siguiente manera.
Título: ……………………………………………………………..…………….
Categorías Frecuencia absoluta fi Frecuencia relativa hi
Categoría 1 f1 n
fh 1
1
Categoría 2 f2 n
fh 2
2
… … …
Categoría k fk n
fh k
k
Fuente: ……………………………………..
Tabla de frecuencias para variables cualitativas en Excel
• Asegúrese que cada columna represente una variable en estudio.
• Ubique el cursor en cualquier celda de los datos.
• Haga clic en la opción Insertar de la barra de menú.
• Seleccione Tabla dinámica y haga clic en Aceptar,
• Arrastre la variable de la cual desea el cuadro a la zona de Etiquetas de fila y también a la zona de ∑ Valores.
• Copie la tabla sin incluir los títulos, en otra celda.
• Calcule la frecuencia relativa (hi)
Se deberá presentar en la tabla las diferentes categorías que asume la variable cualitativa y en la columna de las frecuencias absolutas la cantidad de veces que se repite esta categoría de la
variable.
Si la medición está hecha en escala nominal sólo deberá mostrarse las frecuencias
absolutas y relativas.
Para elaborar el gráfico de Pareto es necesario que la tabla de distribución de frecuencias presente los valores de las frecuencias acumuladas, absolutas y
relativas, con la finalidad de elaborar la curva creciente .
Si la variable cualitativa está medida en escala ordinal, tendrá sentido mostrar las
frecuencias acumuladas absolutas y relativas.
Capítulo 1. Organización de datos 29
Ejemplo 7 La universidad América realizó una encuesta a 30 jóvenes que están terminando el colegio con la finalidad de conocer sus preferencias profesionales. Los datos obtenidos se presentan a continua-ción:
Derecho Periodismo Ingeniería Administración Derecho
Ingeniería Futbolista Chef Ingeniería Administración
Periodismo Ingeniería Periodismo Chef Periodismo
Administración Chef Futbolista Administración Ingeniería
Derecho Chef Ingeniería Derecho Futbolista
Ingeniería Ingeniería Chef Chef Administración
a. Obtenga la tabla de distribución de frecuencia. b. Interprete la frecuencia absoluta y la frecuencia relativa de la tercera categoría.
Solución
a. Obtenga la tabla de distribución de frecuencia.
Distribución de estudiantes de acuerdo a su preferencia profesional
Preferencia profesional fi hi pi
Administración 5 0,1667 16,67%
Chef 6 0,2000 20,00%
Derecho 4 0,1333 13,33%
Futbolista 3 0,1000 10,00%
Ingeniería 8 0,2667 26,67%
Periodismo 4 0,1333 13,33%
Total general 30 1,0000 100,00% Fuente: universidad América. 2013
b. Interprete la frecuencia absoluta y la frecuencia relativa de la tercera categoría.
f3 = de un total de treinta jóvenes, cuatro prefieren la carrera de Derecho.
p3 = el 13,3% de los jóvenes prefieren el Derecho como carrera profesional.
30 Estadística Básica con Aplicaciones en Excel 2010
Ejercicio 10
Luego de aplicar una encuesta a una muestra de treinta empleados, la empresa Motores S.A. desea obtener información acerca de la distribución de sus trabajadores de acuerdo a su Función. Los datos se presentan a continuación:
Obrero Profesional Profesional Servicios Obrero Obrero
Profesional Obrero Técnico/ventas Producción Obrero Producción
Obrero Técnico/ventas Técnico/ventas Obrero Profesional Producción
Obrero Obrero Obrero Profesional Servicios Obrero
Técnico/ventas Obrero Técnico/ventas Producción Producción Profesional
a. Presente la tabla de distribución de frecuencias. b. Interprete la frecuencia absoluta y la frecuencia relativa de la primera categoría.
Solución
a. Presente la tabla de distribución de frecuencias.
Título: ……………………………………………………………………………………………….
Función fi hi pi
Obrero
Producción
Profesional
Servicios
Técnico/ventas
Total general
Fuente: ……………………………………………………………………………
b. Interprete la frecuencia absoluta y la frecuencia relativa de la primera categoría.
f1 = de un total de ……….……. trabajadores, ………………. son …………………………… p1 = el ……….……% de los trabajadores son ……………………………………………….……
Capítulo 1. Organización de datos 31
Representación gráfica de variables cualitativas
Gráfico de barras
En el eje horizontal se representa las categorías de la variable y en el eje de ordenadas las frecuen-cias absolutas, relativas o porcentuales.
Gráfico de barras en Excel
• Seleccione las celdas de la variable y de la de frecuencia absoluta o relativa. Use la tecla Ctrl si necesita seleccionar celdas no contiguas.
• Haga clic en la opción Insertar de la barra de menú y active el icono Columnas. Seleccione la opción Columna y presione Aceptar.
• Elimine la leyenda que aparece en el lado derecho del gráfico.
• Haga doble clic en el área del gráfico, aparecerá una pestaña de Herramientas de gráficos con las opciones: Diseño, Presentación y Formato. Seleccione Presentación, luego escoja los boto-nes Título de gráfico, Rótulo del eje o Etiquetas de datos para darle el formato deseado a su gráfico.
• Para cambiar a porcentaje los valores del eje vertical haga doble clic en el eje vertical, seleccio-ne la opción Número y haga clic en Porcentaje.
32 Estadística Básica con Aplicaciones en Excel 2010
Ejemplo 8
La universidad América realizó una encuesta a 30 jóvenes que están terminando el colegio con la finalidad de conocer sus preferencias profesionales. Los datos obtenidos se presentan a continua-ción:
Derecho Periodismo Ingeniería Administración Derecho
Ingeniería Futbolista Chef Ingeniería Administración
Periodismo Ingeniería Periodismo Chef Periodismo
Administración Chef Futbolista Administración Ingeniería
Derecho Chef Ingeniería Derecho Futbolista
Ingeniería Ingeniería Chef Chef Administración
Presente el gráfico de barras porcentuales para los datos.
Solución
Interpretación Del gráfico se puede observar que el 26,7% de los estudiantes prefieren la carrera de Ingeniería mientras que el 10% prefiere la carrera de futbolista.
26.7%
20.0%
16.7%
13.3% 13.3%
10.0%
0%
5%
10%
15%
20%
25%
30%
Ingeniería Chef Administración Derecho Periodismo Futbolista
Po
rce
nta
je d
e a
lum
no
s
Preferencia profesional
Distribución de estudiantes que culminan el colegio de acuerdo a su preferencia profesional
Fuente: Universidad América. 2013
Capítulo 1. Organización de datos 33
Ejercicio 11
Luego de aplicar una encuesta a una muestra de treinta empleados, la empresa Motores S.A. desea obtener información acerca de la distribución de sus trabajadores de acuerdo a su función. Los datos se presentan a continuación:
Obrero Profesional Profesional Servicios Obrero Obrero
Profesional Obrero Técnico/ventas Producción Obrero Producción
Obrero Técnico/ventas Técnico/ventas Obrero Profesional Producción
Obrero Obrero Obrero Profesional Servicios Obrero
Técnico/ventas Obrero Técnico/ventas Producción Producción Profesional
Realice e interprete el gráfico de barras porcentuales.
Solución
Interpretación
0
2
4
6
8
10
12
14
Obrero Producción Profesional Servicios Técnico/ventas
Función
Cuenta de Preferencia
Fuente: ..........................................................
34 Estadística Básica con Aplicaciones en Excel 2010
Gráfico circular
En este caso las categorías de la variable cualitativa ocupan un espacio en el círculo que es propor-cional a la frecuencia que representan. También se denomina diagrama de sector circular, gráfico tipo torta o pastel. Si la variable cualitativa es de escala ordinal se recomienda usar el gráfico de barras
Gráfico circular en Excel
• Seleccione las columnas de la variable y la de frecuencia absoluta o relativa . Use la tecla Ctrl si necesita seleccionar celdas no contiguas.
• Haga clic en la opción Insertar de la barra de menú y active el icono Circular. Seleccione la op-ción Circular y presione Aceptar.
• Haciendo doble clic en el área del gráfico, aparecerá una pestaña de Herramientas de gráficos
con las opciones: Diseño, Presentación y Formato. • Seleccione Presentación y escoja el botón Título de gráfico y Etiquetas de datos.
Capítulo 1. Organización de datos 35
Ejemplo 9
La universidad América realizó una encuesta a 30 jóvenes que están terminando el colegio con la finalidad de conocer sus preferencias profesionales. Los datos obtenidos se presentan a continua-ción:
Derecho Periodismo Ingeniería Administración Derecho
Ingeniería Futbolista Chef Ingeniería Administración
Periodismo Ingeniería Periodismo Chef Periodismo
Administración Chef Futbolista Administración Ingeniería
Derecho Chef Ingeniería Derecho Futbolista
Ingeniería Ingeniería Chef Chef Administración
Presente el gráfico circular.
Solución
Interpretación Del gráfico se puede observar que el 26,7% de los estudiantes prefieren la carrera de Ingeniería y solo el 10% prefiere la carrera de Derecho.
Administración 17%
Chef 20%
Derecho 13%
Futbolista 10%
Ingeniería 27%
Periodismo 13%
Distribución de estudiantes de acuerdo a su preferencia profesional
Fuente: Universidad América. 2013
36 Estadística Básica con Aplicaciones en Excel 2010
Ejercicio 12
Luego de aplicar una encuesta a una muestra de treinta empleados, la empresa Motores S.A. desea obtener información acerca de la distribución de sus trabajadores de acuerdo a su función. Los datos se presentan a continuación:
Obrero Profesional Profesional Servicios Obrero Obrero
Profesional Obrero Técnico/ventas Producción Obrero Producción
Obrero Técnico/ventas Técnico/ventas Obrero Profesional Producción
Obrero Obrero Obrero Profesional Servicios Obrero
Técnico/ventas Obrero Técnico/ventas Producción Producción Profesional
Realice e interprete el gráfico circular.
Solución
Interpretación
Fuente: ..........................................................
Capítulo 1. Organización de datos 37
Diagrama de Pareto
El diagrama de Pareto permite ver que, en muchos casos, pocos factores pueden producir la mayo-ría de las consecuencias, lo que se podría resumir como “pocos factores son vitales y muchos son triviales”. Por ejemplo, en control de calidad, se puede mostrar que la mayoría de los defectos sur-gen de un número pequeño de causas.
Los pasos para realizar un diagrama de Pareto son los siguientes:
Diagrama de Pareto en Excel
Elija Insertar del menú principal y como tipo de gráfico Columna.
Haga clic derecho en cualquiera de las barras Hi y haga clic en Cambiar tipo de gráfico en serie y elija tipo de gráfico Líneas y presione Aceptar.
Haga clic derecho sobre el eje Y. Seleccione Dar formato a eje. Elija Opciones del eje y en Máxima ponga el valor 1 en Fija.
Haga clic derecho sobre cualquiera de los puntos de la línea y elija la opción Dar Formato de serie de datos... En el recuadro Opciones de serie, seleccione Eje secundario.
Haga clic derecho sobre el eje Y derecho. Seleccione Dar formato a eje. Elija Opciones del eje y en Máxima ponga el valor 1 en Fija.
Haga clic sobre el gráfico y seleccione Título de gráfico, Rótulos del eje y Etiquetas de datos para dar el formato al gráfico.
Construya la tabla de distribución de frecuencias, ordenando las categorías en forma descendente
respecto de la frecuencia absoluta o relativa.
De existir la categoría Otros colóquela en la última
posición.
Grafique dos ejes verticales
y un eje horizontal.
En el eje vertical
derecho, use una
escala de 0% a 100%.
En el eje vertical izquierdo, marque una escala de:
•0 hasta el número total de observaciones, si usa las frecuencias absolutas
•0 a 100%, si usa las frecuencias porcentuales
En el eje horizontal, marque los espacios donde estarán dibujadas las barras para cada una de las
categorías, incluida la categoría Otros.
Elabore el diagrama de barras y dibuje la línea de frecuencias acumuladas
(curva de Pareto).
38 Estadística Básica con Aplicaciones en Excel 2010
Ejemplo 10 En el cuadro se muestran, según la página web de la Oficina Nacional de Procesos Electorales, los resultados de las elecciones presidenciales del 2011 en el Perú. Elabore el diagrama de Pareto co-rrespondiente. Agrupe en la categoría Otros a los candidatos que obtuvieron menos del 1%.
Organización política Votos Organización política Votos
Gana Perú 4,643,064 Despertar Nacional 21,574
Fuerza 2011 3,449,595 Adelante 17,301
Alianza por el Gran Cambio 2,711,450 Fuerza Nacional 16,831
Perú Posible 2,289,561 Justicia, Tecnología, Ecología 11,275
Alianza Solidaridad Nacional 1,440,143 Partido Descentralista Fuerza Social 9,358
Fonavistas del Perú 37,011
Solución
Ordene las categorías en orden decreciente. La categoría Otros siempre va al final independien-temente de su valor.
Calcule las frecuencias porcentuales (pi ) y las porcentuales acumuladas (Pi )
Distribución de los encuestados según organización política
Organización política Votos pi Pi
Gana Perú 4,643,064 31,70% 31,70%
Fuerza 2011 3,449,595 23,55% 55,25%
Alianza por el Gran Cambio 2,711,450 18,51% 73,76%
Perú Posible 2,289,561 15,63% 89,39%
Alianza Solidaridad Nacional 1,440,143 9,83% 99,23%
Otros 113,350 0,77% 100,00% Fuente: Web de la Oficina de Procesos Electores ONPE
El resultado debe ser:
Capítulo 1. Organización de datos 39
Del gráfico, vemos que el 73,76% de las personas votó por las organizaciones políticas Gana Perú, Fuerza 2011 y Alianza por el gran cambio.
Ejercicio 13
Tito´s, empresa de venta de comida rápida por delivery, desea elevar el nivel de satisfacción de sus clientes. Para ello, llevó a cabo una encuesta por teléfono entre 100 clientes que realizaron pedidos durante el último mes. Las quejas manifestadas por estos clientes se resumen a continuación:
Quejas hi
Tiempo de entrega del pedido 0,40
Calidad del producto entregado 0,15
Error en el pedido 0,20
Otros 0,10
Cordialidad del empleado 0,10
No existe variedad 0,03
Precio 0,02
a. Presente la tabla de distribución de frecuencias. b. Complete el gráfico mostrado con los valores y títulos apropiados. c. ¿Qué recomendaría al gerente de esta empresa de venta de comida rápida por delivery según el
gráfico obtenido?
Solución
a. Presente la tabla de distribución de frecuencias.
Título: …………………………………………………………………………………………………………………………….
Quejas fi hi Hi
Tiempo de entrega del pedido
Error en el pedido
Calidad del producto entregado
Cordialidad del empleado
No existe variedad
Precio
Otros
Fuente: ………………………………………………………………………………………
40 Estadística Básica con Aplicaciones en Excel 2010
b. Complete el gráfico mostrado con los valores y títulos apropiados.
Fuente: ………………………………………………………..…………………………………………………
c. ¿Qué recomendaría al gerente de esta empresa de venta de comida rápida por delivery según el
gráfico obtenido?
qqqq
qqqq
Capítulo 1. Organización de datos 41
Tabulaciones cruzadas
Ejemplo 11 La siguiente tabla muestra el lugar de residencia y el giro de negocio que posee una muestra de clientes de la entidad bancaria Tubanco que solicitaron préstamo durante el primer trimestre año.
Distribución de clientes según lugar de residencia y giro del negocio
Giro del negocio Lugar de residencia
Total Lima Callao
Bodega 18 14 32
Frutería 15 8 23
Ferretería 7 6 13
Boutique 35 22 57
Otros 13 15 28
Total 88 65 153 Fuente: Entidad bancaria Tubanco. Primer trimestre
Complete adecuadamente los espacios en blanco:
a. El ………...….. % de los clientes de Tubanco en la muestra tienen ferretería.
b. El …………….. % de los clientes de Tubanco en la muestra que tienen bodega, son del Callao.
c. El ……..……… % de los clientes de Tubanco en la muestra tienen boutique y son de Lima.
Solución
Dividimos 13/153 = 0,084967, entonces el 8,5% de los clientes de Tubanco en la muestra tienen ferretería.
Dividimos 14/32 = 0,4375, entonces el 43,75% de los clientes de Tubanco en la muestra que tienen bodega, son de una de las agencias del Callao.
Dividimos 35/153 = 0,22875, entonces el 22,9% de los clientes de Tubanco en la muestra tienen boutique y son de una de las agencias de Lima.
Se usan para resumir de manera
simultánea los datos para dos variables.
También son llamadas tablas de contingencia o de
doble entrada.
Cuando hay dos variables, se suele estar interesado en observar si existe algún tipo
de dependencia entra las variables, de forma que una de ellas pudiera explicar el
comportamiento de la otra.
42 Estadística Básica con Aplicaciones en Excel 2010
Ejercicio 14
La tabla que se presenta a continuación fue publicada el mes pasado por el diario Siglo XXI. La en-cuesta se aplicó a una muestra de 805 hogares según nivel socioeconómico (NSE) y área de residen-cia. Los resultados se presentan a continuación:
Distribución de hogares según área de residencia y nivel socioeconómico
Nivel socioeconómico Área de residencia
Total Área urbana Área rural
NSE A 15 2 17
NSE B 48 3 51
NSE C 105 145 250
NSE D 94 175 269
NSE E 38 180 218
Total 300 505 805 Fuente: Diario Siglo XXI
De la tabla anterior, complete los espacios en blanco:
El número de hogares que pertenecen al NSE C o D es de ………………………………
…………………………. hogares pertenecen al NSE C y son del área urbana.
Del total de hogares del área rural, el ………………….% son del NSE E.
Del total de hogares del NSE D, el ……………………..% son del área urbana.
Ejercicio 15
En los Censos Nacionales 2007 ejecutados por el Instituto Nacional de Estadística e Informática se preguntó a todos los peruanos la religión que profesa, obteniéndose los siguientes resultados
Perú. Cuadro sobre religión que se profesa y género
Sexo Religión que profesa
Católica Cristiana - Evangélica Otra Ninguna Total
Hombre 8 379 120 1 200 953 324 445 374 024 10 278 542
Mujer 8 577 602 1 405 102 354 846 234 410 10 571 960
Total 16 956 722 2 606 055 679 291 608 434 20 850 502
Fuente: INEI - Censos Nacionales 2007: XI de Población y VI de Vivienda
Complete los espacios en blanco.
a. El número de cristianos evangélicos en el Perú es …………………..……
b. Del total de peruanos, ………………………………………. son católicos.
c. De …………………………………….. de católicos, ………………………..……………….. son mujeres.
d. El ………….…….% de los hombres peruanos profesa la religión católica.
e. El ………………..% de las peruanas no son cristianas-evangélicas.
f. El ………………..% de los hombres peruanos no profesa religión alguna.
Capítulo 1. Organización de datos 43
Recomendaciones sobre los títulos de tablas y gráficos
La tabla de doble entrada y su gráfico deben tener el mismo título.
Una manera ordenada de presentarlo es teniendo en cuenta si la tabla de doble entrada corres-ponde al total general o si ella corresponde al total de fila o al total de columna.
Tabulación cruzada en Excel
Ponga el cursor en cualquiera de las celdas de los datos y elija la opción Insertar y luego Tabla dinámica. Luego, seleccione los datos y haga clic en Aceptar
Arrastre una de las variables a la zona de Etiquetas de fila y la otra variable a la zona Etiquetas
de columna.
Luego, arrastre cualquiera de las variables, al campo ∑ valores.
Si la tabla o gráfico corresponde al total general entonces el título debe incluir las dos variables en estudio separadas por la letra y. El orden de
las variables es indistinto.
Si la tabla o gráfico corresponde al total de fila 100% o columna 100%, el título incluye dos
palabras claves: según y por, donde el según determina la variable que va en la leyenda y el
por la variable que totaliza el 100%.
44 Estadística Básica con Aplicaciones en Excel 2010
Ejemplo 12 El área de Recursos Humanos de una empresa de servicios desea analizar la relación de los trabaja-dores con la gerencia. Después de aplicar una encuesta se obtuvieron los siguientes resultados:
Distribución de trabajadores según su función y relación con la gerencia
Función Relación con la gerencia
Total general Buena Regular Mala
Apoyo/adm. 18 2 0 20
Obrero 10 29 20 59
Profesional 11 6 0 17
Técnico/ventas 19 7 0 26
Total general 58 44 20 122 Fuente: Área de Recursos Humanos.
Solución
Para interpretar los valores de una tabla absoluta cruzada hay que tener en cuenta si el valor que se va a interpretar corresponde a un total de fila, a un total de columna o al valor de una celda. Si deseamos interpretar el valor de una celda hay que tener presente que la celda tiene tres inter-pretaciones dado que existen tres totales, con respecto a su total de fila, con respecto a su total de columna y con respecto al gran total. Para ilustrarlo, tomaremos como ejemplo la tabla anterior.
Interpretación
• Total de fila: valor 59
De un total de 122 trabajadores, 59 son obreros.
• Total de columna: valor 58
De un total de 122 trabajadores, 58 manifiestan tener una buena relación con la gerencia.
• Valor de celda: 10
Con respecto al gran total, de un total de 122 trabajadores, 10 son obreros y manifestaron tener una buena relación con la gerencia.
Con respecto al total de su fila, de un total de 59 obreros, 10 manifestaron tener una buena relación con la gerencia.
Con respecto al total de su columna, de un total de 58 trabajadores que manifestaron tener una buena relación con la gerencia, 10 son obreros.
Capítulo 1. Organización de datos 45
Para obtener las frecuencias porcentuales respecto al total
Haga clic derecho sobre la celda Cuenta de Relación con la Gerencia.
En el menú despegable escoja Configuración de campo de valor.
Haga clic sobre Mostrar valores como y escoja la opción % del total general.
El resultado debe ser:
Distribución de trabajadores según su función y relación con la gerencia
Interpretación
Del total de trabajadores, - el 48,4% son obreros - el 47,5% manifestaron tener una buena relación con la gerencia. - el 23,8% son obreros y manifestaron tener una regular relación con la gerencia.
Fuente: Área de Recursos Humanos
Para obtener las frecuencias porcentuales respecto al total de filas
Haga clic derecho sobre la celda Cuenta de Relación con la Gerencia.
En el menú despegable escoja Configuración de campo de valor.
Haga clic sobre Mostrar valores como y escoja la opción % del total de filas.
El resultado debe ser:
Distribución de trabajadores según relación con la gerencia por función
Interpretación
Del total de obreros, el 49,2% tiene una regular relación con la gerencia.
Fuente: Área de Recursos Humanos
Para obtener las frecuencias porcentuales respecto al total de columnas
Haga clic derecho sobre la celda Cuenta de Relación con la Gerencia.
En el menú despegable escoja Configuración de campo de valor.
Haga clic sobre Mostrar valores como y escoja la opción % del total de columnas.
El resultado debe ser:
Distribución de trabajadores según función por tipo de relación con la gerencia
Interpretación Del total de trabajadores que tienen una relación regular con la gerencia, el 65,9% son obreros.
Fuente: Área de Recursos Humanos
Función Relación con la gerencia Total
general Buena Regular Mala
Apoyo/adm. 14,8% 1,6% 0,0% 16,4%
Obrero 8,2% 23,8% 16,4% 48,4%
Profesional 9,0% 4,9% 0,0% 13,9%
Técnico/ventas 15,6% 5,7% 0,0% 21,3%
Total general 47,5% 36,1% 16,4% 100,0%
Función Relación con la gerencia Total
general Buena Regular Mala
Apoyo/adm. 90,0% 10,0% 0,0% 100,0%
Obrero 16,9% 49,2% 33,9% 100,0%
Profesional 64,7% 35,3% 0,0% 100,0%
Técnico/ventas 73,1% 26,9% 0,0% 100,0%
Total general 47,5% 36,1% 16,4% 100,0%
Función Relación con la gerencia Total
general Buena Regular Mala
Apoyo/adm. 31,0% 4,6% 0,0% 16,4%
Obrero 17,2% 65,9% 100,0% 48,4%
Profesional 19,0% 13,6% 0,0% 13,9%
Técnico/ventas 32,8% 15,9% 0,0% 21,3%
Total general 100,0% 100,0% 100,0% 100,0%
46 Estadística Básica con Aplicaciones en Excel 2010
Gráfico de barras comparativas
Gráfico de barras comparativas en Excel
• Seleccione solo las celdas correspondientes a las categorías de ambas variables. No incluya los totales.
• Haga clic en la opción Insertar de la barra de menú y elija Columna/Columna agrupada.
• Haga clic a cualquier línea horizontal del gráfico y observará que todas las líneas horizontales se seleccionan. Presione la tecla Supr de su teclado para eliminarlas.
• Haga clic en el área del gráfico y aparecerá la pestaña Herramientas de gráficos con las opcio-nes: Diseño, Presentación y Formato.
• Seleccione Diseño y elija el estilo que desee haciendo clic en el menú despegable. El estilo 26 (segunda columna fila 4) es el que se presenta como modelo en este material.
• Seleccione ahora la pestaña Presentación, y de ahí escoja los botones Título de gráfico, Rótulo del eje y Etiqueta de datos para darle el formato deseado.
• Haga clic derecho sobre cualquier valor del eje Y y del menú elija Dar formato al eje… /Número/Porcentaje/Posiciones decimales: 0/Cerrar.
• Elimine los valores porcentuales iguales a cero para una mejor presentación.
Capítulo 1. Organización de datos 47
Gráfico porcentual con respecto al gran total
Distribución de trabajadores según su función y relación con la gerencia
Gráfico porcentual con respecto al total de filas
Distribución de trabajadores según relación con la gerencia por función
Gráfico porcentual respecto al total de columnas
Distribución de trabajadores según su función por tipo de relación con la gerencia
14.8%
8.2% 9.0%
15.6%
1.6%
23.8%
4.9% 5.7%
16.4%
0%
5%
10%
15%
20%
25%
Apoyo/adm. Obrero Profesional Técnico/ventas
Po
rce
nta
je d
e t
rab
ajad
ore
s
Función
Distribución de los trabajadores según su función y relación con la gerencia
Buenas Regulares Malas
90.0%
17.0%
64.7% 73.1%
10.0%
49.2%
35.3% 26.9%
33.9%
0%
20%
40%
60%
80%
100%
Apoyo/adm. Obrero Profesional Técnico/ventas
Po
rce
nta
je d
e t
rab
ajad
ore
s
Función
Distribución de los trabajadores según su relación con la gerencia por función
Buenas Regulares Malas
31%
4.6%
17.2%
65.9%
100%
19%
13.6%
32.8% 15.9%
0%
20%
40%
60%
80%
100%
Buenas Regulares Malas
Po
rce
nta
je d
e t
rab
ajad
ore
s
Relación con la gerencia
Distribución de los trabajadores según su función por tipo de relación con la gerencia
Apoyo/adm. Obrero
Profesional Técnico/ventas
Función Relación con la gerencia Total
general Buena Regular Mala
Apoyo/adm. 14,8% 1,6% 0,0% 16,4%
Obrero 8,2% 23,8% 16,4% 48,4%
Profesional 9,0% 4,9% 0,0% 13,9%
Técnico/ventas 15,6% 5,7% 0,0% 21,3%
Total general 47,5% 36,1% 16,4% 100,0%
Función Relación con la gerencia Total
general Buena Regular Mala
Apoyo/adm. 90,0% 10,0% 0,0% 100,0%
Obrero 17,0% 49,2% 33,9% 100,0%
Profesional 64,7% 35,3% 0,0% 100,0%
Técnico/ventas 73,1% 26,9% 0,0% 100,0%
Función Relación con la gerencia Total
general Buena Regular Mala
Apoyo/adm. 31,0% 4,6% 0,0% 16,4%
Obrero 17,2% 65,9% 100,0% 48,4%
Profesional 19,0% 13,6% 0,0% 13,9%
Técnico/ventas 32,8% 15,9% 0,0% 21,3%
Total general 100% 100% 100% 100,0%
Fuente: Área de Recursos Humanos
Fuente: Área de Recursos Humanos
Fuente: Área de Recursos Humanos
Fuente: Área de Recursos Humanos.
Fuente: Área de Recursos Humanos.
Fuente: Área de Recursos Humanos.
48 Estadística Básica con Aplicaciones en Excel 2010
Ejercicio 16
La estratificación de la población capitalina ha ocasionado que algunos problemas afecten más a ciertos estatus sociales. Cierto S.A, una encuestadora de la capital, realizó durante el último trimes-tre un estudio acerca de los principales problemas que enfrenta la capital. La información resumida se presenta en la siguiente tabla:
Distribución de encuestados según principales problemas de Lima y estatus social
Estatus social Principales problemas de Lima
Total Tráfico Delincuencia Basura
Alto 70 38 12 120
Medio 52 80 14 146
Bajo 48 88 10 146
Total 170 206 36 412
Fuente: Cierto S.A.
a. Según lo mencionado, complete los siguientes espacios en blanco:
De 412 ciudadanos, 14 ...……………………………………………….…………………………………………....……..…
Del total de ciudadanos de clase baja, 88 ………………………………………………………….……………...…..
Del total de ciudadanos que opinan que el principal problema en Lima es la delincuencia, el
……………..…… % de ellos son de clase media.
Del total de ciudadanos, el …………..…….% de ellos son de clase alta y opinan que el principal
problema en Lima es la delincuencia.
b. Presente la tabla cruzada para el título: “Distribución porcentual de los ciudadanos según princi-pal problema de Lima y estatus social”
Estatus social Principales problemas de Lima
Total Tráfico Delincuencia Basura
Alto
Medio
Bajo
Total
Fuente: Cierto S.A.
c. Presente la tabla cruzada para el título: “Distribución porcentual de los ciudadanos según princi-pal problema de Lima por estatus social”
Estatus social Principales problemas de Lima
Total Tráfico Delincuencia Basura
Alto
Medio
Bajo
Total
Fuente: Cierto S.A.
Capítulo 1. Organización de datos 49
d. Presente la tabla cruzada para el título: “Distribución porcentual de los ciudadanos según esta-tus social por principal problema de Lima”
Estatus social Principales problemas de Lima
Total Tráfico Delincuencia Basura
Alto
Medio
Bajo
Total
Fuente: Cierto S.A.
e. Elabore el gráfico de barras comparativas para el título: “Distribución porcentual de los ciudada-
nos según principal problema de Lima y estatus social”
50 Estadística Básica con Aplicaciones en Excel 2010
f. Elabore el gráfico de barras comparativas para el título: “Distribución porcentual de los ciudada-nos según principal problema de Lima por estatus social”
g. Elabore el gráfico de barras comparativas para el título: “Distribución porcentual de los ciudada-
nos según estatus social por principal problema de Lima”
Capítulo 1. Organización de datos 51
Gráfico de barras apiladas
Gráfico de barras apiladas en Excel
• Seleccione solo las celdas correspondientes a las categorías de ambas variables. No incluya los totales.
• Haga clic en la opción Insertar de la barra de menú y elija Columna/Columna apilada.
• Haga clic a cualquier línea horizontal del gráfico y observará que todas las líneas horizontales se seleccionan. Presione la tecla Supr de su teclado para eliminarlas.
• Haga clic en el área del gráfico y aparecerá la pestaña Herramientas de gráficos con las opcio-nes: Diseño, Presentación y Formato.
• Seleccione Diseño y elija el estilo que desee haciendo clic en el menú despegable. El estilo 26 (segunda columna fila 4) es el que se presenta como modelo en este material.
• Seleccione ahora la pestaña Presentación, y de ahí escoja los botones Título de gráfico, Rótulo del eje y Etiqueta de datos para darle el formato deseado.
• Haga clic derecho sobre cualquier valor del eje Y y del menú elija Dar formato al eje… /Número/Porcentaje/Posiciones decimales: 0/Cerrar.
• Elimine los valores porcentuales iguales a cero para una mejor presentación.
Los datos también pueden ser representados en barras apiladas de porcentajes donde la cantidad para cada
valor de la variable elegida para el eje horizontal representa el total parcial (o el 100%)
y las cantidades (o los porcentajes) de la segunda
variable van a dar lugar a dicha cantidad (o el 100%).
52 Estadística Básica con Aplicaciones en Excel 2010
Ejercicio 17
La tabla que se presenta a continuación fue publicada el mes pasado por el diario Siglo XXI. La en-cuesta se aplicó a una muestra de 737 hogares según nivel socioeconómico (NSE) y área de residen-cia. Los resultados se presentan a continuación:
Distribución de los encuestados según nivel socioeconómico y área de residencia
Nivel socioeconómico Área de residencia
Total Área urbana Área rural
NSE C 105 145 250
NSE D 94 175 269
NSE E 38 180 218
Total 237 500 737 Fuente: Diario Siglo XXI
a. Presente la tabla de contingencia porcentual con respecto al total. b. A partir de la tabla anterior, elabore e interprete el gráfico apilado.
Solución
a. Presente la tabla cruzada porcentual con respecto al total. Coloque el título apropiado.
Distribución de encuestados según nivel socioeconómico y área de residencia
Nivel socioeconómico Área de residencia
Total Área urbana Área rural
NSE C 14,25% 19,67% 33,92%
NSE D 12,75% 23,74% 36,50%
NSE E 5,16% 24,42% 29,58%
Total 32,16% 67,84% 100% Fuente: Diario Siglo XXI
b. A partir de la tabla anterior elabore e interprete el gráfico apilado.
El 24,42% de los hogares son del área rural y pertenecen al nivel socioeconómico E, mientras que el 14,25% de los hogares son del área urbana y pertenecen al nivel socioeconómico C.
14.25% 12.75% 5.16%
19.67% 23.74%
24.42%
0%
5%
10%
15%
20%
25%
30%
35%
40%
NSE C NSE D NSE E
Po
rce
nta
je d
e e
ncu
est
ado
s
Nivel socioeconómico
Distribución de encuestados según nivel socioeconómico y área de residencia
Área Rural
Área Urbana
Fuente: Diario Siglo XXI
Capítulo 1. Organización de datos 53
Ejercicio 18
Un productor musical de la empresa Creativa´s ha entrevistado a 200 personas haciéndolos oír una canción y pidiéndoles que la identifiquen.
Distribución de individuos según identificación de la canción y género musical
Género musical Plenamente Medianamente No identifica Total
Reggaetón 35% 3% 4% 42%
Vals 23% 7% 6% 36%
Cumbia 13% 8% 1% 22%
Total 71% 18% 11% 100% Fuente: Empresa Creativa´s
a. Presente la tabla de contingencia absoluta. Coloque el título apropiado. b. A partir de la tabla relativa elabore e interprete un gráfico apilado.
Solución
a. Presente la tabla de contingencia absoluta. Coloque el título apropiado.
Distribución de individuos …………………………………………………………………………………………….
Género musical Plenamente Medianamente No identifica Total
Reggaetón
Vals
Cumbia
Total Fuente: Empresa Creativa´s
b. A partir de la tabla relativa elabore e interprete el gráfico apilado.
Interpretación
54 Estadística Básica con Aplicaciones en Excel 2010
Gráfico de barras apiladas al 100%
Gráfico de barras apiladas al 100% en Excel
• Seleccione solo las celdas correspondientes a las categorías de ambas variables. No incluya los totales.
• Haga clic en la opción Insertar de la barra de menú y elija Columna/Columna 100% apilada.
• Haga clic en el área del gráfico y aparecerá la pestaña Herramientas de gráficos con las opcio-nes: Diseño, Presentación y Formato.
• Seleccione Diseño y elija el estilo que desee haciendo clic en el menú despegable. El estilo 26 (segunda columna fila 4) es el que se presenta como modelo en este material.
• Seleccione ahora la pestaña Presentación, y de ahí escoja los botones Título de gráfico, Rótulo del eje y Etiqueta de datos para darle el formato deseado.
• Haga clic derecho sobre cualquier valor del eje Y y del menú elija Dar formato al eje… /Número/Porcentaje/Posiciones decimales: 0/Cerrar.
• Elimine los valores porcentuales iguales a cero para una mejor presentación.
Un gráfico de barras apiladas al 100% muestra todas las series apiladas en una
sola barra para cada categoría.
El alto de cada barra es el mismo para cada categoría.
Capítulo 1. Organización de datos 55
Ejemplo 13 La tabla que se presenta a continuación fue publicada el mes pasado por el diario Siglo XXI. La en-cuesta se aplicó a una muestra de 737 hogares según nivel socioeconómico (NSE) y área de residen-cia. Los resultados se presentan a continuación:
Distribución de los encuestados según nivel socioeconómico y área de residencia
Nivel socioeconómico Área de residencia
Total Área urbana Área rural
NSE C 105 145 250
NSE D 94 175 269
NSE E 38 180 218
Total 237 500 737 Fuente: diario Siglo XXI
a. Presente la tabla cruzada porcentual por área de residencia. Coloque el título apropiado. b. A partir de la tabla anterior elabore e interprete un gráfico de barras apiladas al 100%.
Solución
a. Presente la tabla cruzada porcentual por área de residencia. Coloque el título apropiado.
Distribución de encuestados según nivel socioeconómico por área de residencia
Nivel socioeconómico Área de residencia
Área urbana Área rural
NSE C 35,00% 28,71%
NSE D 31,33% 34,65%
NSE E 12,67% 35,64%
Total 100,0% 100,0% Fuente: Diario Siglo XXI
b. A partir del cuadro anterior elabore e interprete un gráfico de barras apiladas al 100%.
Fuente: Diario Siglo XXI
Del total de encuestados cuya área de residencia es el área urbana, el 35% pertenece al NSE C mientras que el 12,67% pertenece al NSE E.
Del total de encuestados cuya área de residencia es del área rural, el 35,64% pertenece al NSE E mientras que el 28,71% pertenece al NSE C.
35.00% 28.71%
31.33%
34.65%
12.67% 35.64%
0%
20%
40%
60%
80%
100%
Área Urbana Área Rural
Po
rce
nta
je d
e e
ncu
est
ado
s
Área de residencia
Distribución de encuestados según nivel socioeconómico por área de residencia
NSE E
NSE D
NSE C
56 Estadística Básica con Aplicaciones en Excel 2010
Ejercicio 19
Un productor musical de la empresa Creativa´s ha entrevistado a 200 personas haciéndolos oír una canción y pidiéndoles que la identifiquen.
Distribución de individuos según identificación de la canción por género musical
Género musical Plenamente Medianamente No identifica Total
Reggaetón 84% 7% 9% 100%
Vals 63% 19% 18% 100%
Cumbia 59% 37% 4% 100% Fuente: Empresa Creativa´s
Presente e interprete el gráfico de barras apiladas al 100% para la tabla anterior.
Solución
Presente el gráfico de barras apiladas al 100%.
Fuente: ……………………………………………………………………. Interpretación
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
Reggaetón Vals Cumbia
Tít ulo del eje
Título del gráfic o
Capítulo 1. Organización de datos 57
Distribución de frecuencias de variables discretas
Título: …………………………………………………………………………………………….…………………….. Valores de la variable
discreta
Frecuencia absoluta fi
Frecuencia relativa hi
Frecuencia absoluta acumulada Fi
Frecuencia relativa acumulada Hi
x1 f1 n
fh 1
1 11 fF 11 hH
x2 f2 n
fh 2
2 122 FfF 122 HhH
… … … … …
xk fk n
fh k
k 1 kkk FfF 1 kkk HhH
Fuente:……………………………………………………………………………………..
Distribución de frecuencias de variables discretas en Excel
• Seleccione Insertar de la barra de menú y luego elija Tabla dinámica.
• Seleccione el rango de datos.
• Haga clic en Aceptar y arrastre Número de capacitaciones a la zona de Etiquetas de fila y a la zona de ∑ Valores. Coloque el cursor en la opción Suma de la variable y haga clic derecho, cambie Recuento en vez de Suma.
• Copie la tabla dinámica sin incluir la primera fila.
• Calcule la frecuencia relativa (h i) y las frecuencias acumuladas.
Es un resumen de un conjunto de datos que consiste en presentar para cada valor de la
variable el número de elementos (frecuencia) que la componen.
Es un cuadro que presenta además de las frecuencias absolutas y relativas las frecuencias acumuladas absolutas y
acumuladas relativas.
58 Estadística Básica con Aplicaciones en Excel 2010
Ejemplo 14 Los siguientes datos corresponden al número de capacitaciones recibidas por los colaboradores de la empresa Creativa’s en lo que va del año.
1 2 2 0 1 1 3 2 1 1 2 0 2 1 1
1 2 2 1 1 1 2 2 1 5 2 1 0 3 1
a. Presente la tabla de distribución de frecuencias. b. Interprete f2 , F2 , h3 y H2
Solución
El resultado debe ser:
Distribución del número de capacitaciones recibidas
Número de capacitaciones fi hi Fi Hi
0 3 0,100 3 0,1000
1 14 0,467 17 0,5667
2 10 0,333 27 0,9000
3 2 0,067 29 0,9667
5 1 0,033 30 1,0000
Total 30 1,000 Fuente: Empresa Creativa´s
Interprete:
f2 = 14 De 30 empleados, 14 han recibido solo una capacitación al año
F2 = 17 De 30 empleados, 17 han recibido de una a menos capacitaciones al año
h3 = 0,467 El 46,7% de los trabajadores han recibido solo una capacitación al año
H2 = 0,567 El 56,7% de los trabajadores han recibido de una a menos capacitaciones al año
Capítulo 1. Organización de datos 59
Ejercicio 20
Los siguientes datos corresponden a una encuesta realizada por un grupo de estudiantes de la uni-versidad San Vicente de Arequipa a una muestra de 40 aficionados al cine. Al formular la pregunta, ¿cuántas veces ha visto su película preferida? las respuestas fueron las siguientes:
1 2 3 4 3 3 2 3 5 3 3 4 5 5 2 3 3 2 4 1
2 3 4 3 1 1 2 4 1 2 2 3 1 3 4 2 1 4 5 2
a. Presente la tabla de distribución de frecuencias. b. Interprete f3 , h1, F2 y H4
Solución
a. Presente la tabla de distribución de frecuencias. TÍtulo: ………………………………………………………………………………………………………………………………………
fi hi Fi Hi
Fuente: …………………………………………………………………………………
b. Interprete:
f3 = …………...
F2 = ………..…
h1 = …………..
H4 = …………..
60 Estadística Básica con Aplicaciones en Excel 2010
Representación gráfica de variables discretas
Gráfico de bastones o líneas
Gráfico de bastones o líneas en Excel
• Construya la tabla de distribución de frecuencias
• Seleccione las columnas Número de capacitaciones y frecuencia absoluta (fi) o relativa (hi).
• En la barra de menú, elija la opción Insertar, seleccione el tipo Dispersión sólo con marcadores.
• Elimine la leyenda.
• Seleccione el gráfico, elija la opción Presentación y elija la opción Barras de error. En esa opción seleccione Más opciones de las barras de error…
• En Barras de error verticales seleccione la opción Menos. Luego en Cuantía de error, elija Por-centaje y coloque el valor 100%. Borre las barras de error horizontales que aparecen automáti-camente.
• Haga clic sobre el gráfico y seleccione Título de gráfico, Rótulos del eje y Etiquetas de datos
para dar el formato al gráfico.
• De ser necesario, coloque los valores del eje Y en formato Porcentaje.
Por lo general, el gráfico de bastones es utilizado cuando la variable es discreta.
Su uso es adecuado cuando existen muchas observaciones pero pocos valores de la
variable.
Capítulo 1. Organización de datos 61
Ejercicio 21
Los siguientes datos corresponden al número de capacitaciones recibidas por los colaboradores de la empresa Creativa’s en lo que va del año.
1 2 2 0 1 1 3 2 1 1 2 0 2 1 1
1 2 2 1 1 1 2 2 1 5 2 1 0 3 1
Presente e interprete el gráfico de bastones para los siguientes datos.
Solución
Distribución del número de capacitaciones recibidas
Número de capacitaciones fi hi Fi Hi
0 3 0,100 3 0,1000
1 14 0,467 17 0,5667
2 10 0,333 27 0,9000
3 2 0,067 29 0,9667
5 1 0,033 30 1,0000
Total 30 1,000 Fuente: Empresa Creativa´s
Fuente: Empresa Creativa´s
Interpretación
De un total de treinta empleados, catorce de ellos han recibido una capacitación y solo un colaborador ha recibido cinco capacitaciones en lo que va del año
3
14
10
2 1
0
2
4
6
8
10
12
14
16
0 1 2 3 4 5
Nú
me
ro d
e c
ola
bo
rad
ore
s
Número de capacitaciones
Distribución del número de capacitaciones recibidas
62 Estadística Básica con Aplicaciones en Excel 2010
Ejercicio 22
Los siguientes datos corresponden a una encuesta realizada por un grupo de estudiantes de la uni-versidad San Vicente de Arequipa a una muestra de 40 aficionados al cine. Al formular la pregunta, ¿cuántas veces ha visto su película preferida? las respuestas fueron las siguientes:
1 2 3 4 3 3 2 3 5 3 3 4 5 7 2 3 3 2 4 1
2 3 4 3 1 1 2 4 1 2 2 3 1 3 4 2 1 4 5 2
Presente e interprete el gráfico de bastones para los siguientes datos.
Solución
Presente el gráfico de bastones para los siguientes datos.
Interpretación
Capítulo 1. Organización de datos 63
Distribución de frecuencias de variables continuas
Cantidad de clases
Se recomienda usar entre 5 y 20 clases, inclusive.
La idea es emplear suficientes clases para mostrar la variación de los datos, pero no tantas, porque puede ocurrir que varias contengan ningún o pocos elementos.
Para determinar el número de clases se puede usar la regla de Sturges. Si la estimación tiene decimales, se toma el entero más próximo (redondeo simple).
Regla de Sturges: k = 1 + 3,322 x log n
Amplitud o ancho de cada clase
Usualmente se usa el mismo ancho para todas las clases.
Se calcula de la siguiente manera:
k
r
k
rangowAmplitud
La amplitud del intervalo debe tener la misma cantidad de cifras decimales que tienen los datos originales. El redondeo empleado es el redondeo a más. Por ejemplo:
Datos con
w
(redondeo a más)
Cero decimales w = 50,2387 w = 51
Una cifra decimal w = 12,1066 w = 12,2
Dos cifras decimales w = 125,4463 w = 125,45
Tres cifras decimales w = 587,9308 w = 587,931
Marcas de clase
Son los puntos medios de los límites de cada intervalo.
Su notación es 'iX
Se calcula de la siguiente manera:
22
supinf' LSLIeriorLímiteeriorLímiteXi
Es un resumen de un conjunto de datos que consiste en presentar para cada categoría el número de elementos
(frecuencia) que la componen.
Los tres pasos para elaborar una tabla de distribución de frecuencias para variables cuantitativas continuas son:
•Determinar la cantidad de clases
•Determinar el ancho de cada clase
•Determinar los límites de cada clase
64 Estadística Básica con Aplicaciones en Excel 2010
Límites de cada clase
Los límites de clase se escogen de tal manera que cada valor de dato pertenezca a una clase y sólo a una.
El límite inferior de clase es el valor mínimo posible de los datos que se asigna a la clase y el límite superior de clase es el valor máximo posible de los datos que se asigna a la clase.
Distribución de frecuencias de variables continuas en Excel
En el menú principal elija la opción Datos/Análisis de datos/Estadística descriptiva
En Rango de entrada seleccione las celdas donde se encuentran los datos.
Marque Rótulo en la primera fila si los datos han sido seleccionados desde el nombre de la va-riable en la primera fila, caso contrario no seleccione esta opción.
A continuación, haga clic en Rango de salida y ubique el cursor en el recuadro del lado derecho haga clic en una celda en blanco, en donde saldrán los resultados.
Finalmente, haga clic a Resumen de estadísticas y dé Aceptar Cálculo de las frecuencias
• Seleccione el rango en el cual aparecerán las frecuencias respectivas.
• Haga clic en el icono de Insertar función, seleccione =Frecuencia y dé Aceptar.
Capítulo 1. Organización de datos 65
• En la ventana de Frecuencia, en la opción Datos ingrese el rango de datos que se desea contar y en Grupos, ingrese solo el rango de celdas que corresponde a los límites superiores de los in-tervalos.
• A continuación mantenga presionadas las teclas Ctrl + Shift y a continuación presione Enter con lo cual aparecerán las frecuencias absolutas.
• Calcule las demás frecuencias y las marcas de clase para completar la tabla.
Ejemplo 15 El jefe de la Oficina de Rentas de una municipalidad ha realizado un estudio sobre los impuestos que pagan los vecinos del distrito. La tabla en Excel muestra los pagos de impuestos, en nuevos soles, de 48 viviendas elegidas al azar en el 2012.
A B C D E F G H I J K L
1 145,1 216,3 252,5 303,6 196,9 234,8 265,2 317,2 206,5 242,9 289,1 331,7
2 151,0 225,9 257,1 305,8 202,6 238,4 271,0 320,2 208,0 244,0 291,0 344,6
3 159,0 227,1 259,2 315,4 204,9 239,9 286,7 324,8 208,0 247,7 291,9 346,7
4 195,6 231,2 262,5 315,5 206,1 241,1 288,1 331,1 209,3 249,5 294,5 351,1
Elabore la tabla de frecuencias para la variable Pago por impuestos municipales año 2012.
Solución
El rango r se calcula con:
r = valor máximo – valor mínimo = 351,1 – 145,1 = 206 Siguiendo la regla de Sturges, el número de intervalos es:
7585,6)48(log322,31log322,31 1010 nk (Use redondeo simple)
La amplitud se calcula por:
5,29429,297
206
k
rw
Usamos redondeo por exceso a un decimal debido a que los datos tienen como máximo un deci-mal.
66 Estadística Básica con Aplicaciones en Excel 2010
Usando las funciones del Excel 2010 sería:
A B
6 Máximo 351,1 =MAX(A1:L4)
7 Mínimo 145,1 =MIN(A1:L4)
8 Rango 206 =B6-B7
9 Cantidad de datos (n) 48 =CONTAR(A1:L4)
10 k (por regla de Sturges) 6,58508 =1+3,322*LOG10(B9)
11 k (entero) 7
12 w (Amplitud) 29,4286 =B8/B11
13 Número de decimales de los datos 1
14 w (redondeada) 29,5
Otra manera de hacerlo en Excel 2010 es:
Copie los datos en la columna A del Excel y en la fila 1 agregue el nombre de la variable; por lo tanto los datos estarán comprendidos en el rango A2:A49
En el menú principal elija la opción Datos/Análisis de datos/Estadística descriptiva
En Rango de entrada seleccione las celdas A2:A49
Dé clic a Rótulo en la primera fila dado que nuestros datos tienen en la primera fila el nombre de la variable
Dé clic a Rango de salida y ubique el cursor dentro del recuadro para dar a continuación clic en una celda en blanco, por ejemplo C2.
Finalmente, haga clic a Resumen de estadísticas y dé Aceptar
La salida obtenida en la celda C2 será:
Impuestos
Media 257,25625
Error típico 7,6183196
Mediana 251
Moda 208
Desviación estándar 52,7812664
Varianza de la muestra 2785,86209
Curtosis -0,68012624
Coeficiente de asimetría -0,07342341
Rango 206
Mínimo 145,1
Máximo 351,1
Suma 12348,3
Cuenta 48
Capítulo 1. Organización de datos 67
Completamos los siguientes cálculos:
k (por regla de Sturges) 6,5851
k (entero) 7
w (Amplitud) 29,4286
Número de decimales de los datos 1
w (redondeada) 29,5
Cálculo de las frecuencias absolutas
• Seleccione el rango en el cual aparecerán las frecuencias absolutas.
• Haga clic en el icono de Insertar función, seleccione Frecuencia y de Aceptar.
• En la ventana de Frecuencia, ingrese en Datos el rango de los datos que se desea contar. En Grupos, ingrese el rango de celdas de los límites superiores de los intervalos.
• Manteniendo presionado Ctrl + Shift, presione Enter, con lo cual aparecerán las frecuencias absolutas.
• Calcule las demás frecuencias y las marcas de clase para completar la tabla. A continuación la tabla de distribución de frecuencias:
Distribución del pago de impuesto municipal (en nuevos soles)
Pago de impuestos Marca de clase fi hi Fi Hi
[145,1 ; 174,6] 159,85 3 0,0625 3 0,0625
]174,6 ; 204,1] 189,35 3 0,0625 6 0,1250
]204,1 ; 233,6] 218,85 10 0,2084 16 0,3334
]233,6 ; 263,1] 248,35 12 0,2500 28 0,5834
]263,1 ; 292,6] 277,85 7 0,1458 35 0,7292
]292,6 ; 322,1] 307,35 7 0,1458 42 0,8750
]322,1 ; 351,6] 336,85 6 0,1250 48 1,0000
Total 48
Fuente: Oficina de Rentas de la Municipalidad
68 Estadística Básica con Aplicaciones en Excel 2010
Interprete:
f2 = 3 En tres viviendas pagaron más de 174,60 nuevos soles y hasta de 204,10 nuevos soles
F2 = 6 En seis viviendas pagaron hasta 204,10 nuevos soles
h3 = 0,2084 El 20,84% de las viviendas pagaron más de 204,10 nuevos soles y hasta 233,6 nuevos soles
H3 = 0,3334 El 33,34% de las viviendas pagaron hasta 233,60 nuevos soles
Ejercicio 23
A continuación, se muestra el tiempo de servicio, en meses, de los trabajadores de la empresa Óp-tima, Usando la regla de Sturges construya la tabla de distribución de frecuencias.
10 24 38 40 43 44 51 53 55 57
16 25 39 40 43 46 51 53 55 57
21 31 39 40 43 46 52 53 55 58
21 31 40 43 44 47 53 54 55 62
23 33 40 43 44 48 53 54 55 65
Solución
Cálculo de los límites de los intervalos
Máximo =MAX(datos)
Mínimo =MIN(datos)
Rango =MAX(datos) – MIN(datos)
Cantidad de datos (n) =CONTAR(datos)
k (por regla de Sturges) =1+3,322*LOG10(n)
k (entero)
w (amplitud) =Rango/k (entero)
Número de decimales de los datos w (redondeada por exceso)
Distribución del tiempo de servicio, en meses, de los trabajadores de la empresa Óptima
Tiempo de servicio Marca de clase fi hi Fi Hi
Fuente: Empresa Óptima
Capítulo 1. Organización de datos 69
Interprete
f4 = …………..
F2 = ………….
h1 = …………..
H4 = ………….
Representación gráfica de variables cuantitativas continuas
Histograma de frecuencias
Histograma de frecuencias en Excel
Seleccione la columna de frecuencia absoluta o relativa, luego seleccione Insertar en la barra de menú, elija Columna, y luego Columna agrupada.
Este resumen gráfico se prepara a partir de una tabla de frecuencias
absolutas, relativas o porcentuales.
Se traza colocando la variable sobre el eje horizontal y las frecuencias sobre el eje vertical.
Cada frecuencia de clase se representa trazando un rectángulo, cuya base es el intervalo de clase sobre el eje
horizontal y cuya altura es proporcional a la frecuencia correspondiente.
Los rectángulos adyacentes se tocan entre sí.
70 Estadística Básica con Aplicaciones en Excel 2010
Elimine la leyenda.
Para que se junten los rectángulos: haga clic en una barra y elija Dar formato a serie de da-tos…, luego ponga Ancho del intervalo igual a 0%.
Para cambiar los valores del eje X haga clic derecho y seleccione Seleccionar datos – Editar.
Haga clic sobre el gráfico y seleccione Título de gráfico, Rótulos del eje y Etiquetas de datos para dar el formato al gráfico.
Ejemplo 16 La gerencia de una compañía, que brinda servicios de llamadas por celulares, está preocupada por el poco monto de las llamadas realizadas por sus clientes. Para corroborarlo se encargó al área de administración que eligiera, del mes de enero, una muestra de clientes de Lima y registrara el mon-to que representan sus llamadas, en nuevos soles. El encargado mostró los resultados en una tabla de distribución de frecuencias:
Monto de las llamadas en Lima (en nuevos soles)
Tiempo de servicio Marca de clase fi hi Fi Hi
0 10 5 12 0,1000 12 0,1000
10 20 15 22 0,1833 34 0,2833
20 30 25 45 0,3750 79 0,6583
30 40 35 23 0,1917 102 0,8500
40 50 45 12 0,1000 114 0,9500
50 60 55 6 0,0500 120 1,0000
120 1
Fuente: Área de Administración
Grafique el histograma de frecuencias porcentuales.
Capítulo 1. Organización de datos 71
Solución
Fuente: Área de Administración
Interpretación: A partir del gráfico podemos observar que el 37,5% de los clientes de Lima tienen montos superiores a 20 y como máximo de 30 nuevos soles y que solo el 5% de estos clientes tie-nen montos superiores a 50 y como máximo de 60 nuevos soles.
Ejercicio 24
A continuación, se muestra el tiempo de servicio, en meses, de los trabajadores de la empresa Óp-tima. Grafique el histograma de frecuencias relativas.
10 16 21 21 23 24 25 31 31 33 38 39 39 40 40 40 40
40 43 43 43 43 43 44 44 44 46 46 47 48 51 51 52 53
53 53 53 53 54 54 55 55 55 55 55 57 57 58 62 65
Solución
Título: ………………………………………………………………………………………………………………………………
Marca de clase fi hi Fi Hi
Fuente: ………………………………………………………………………………………………….
10.0%
18.3%
37.5%
19.2%
10.0%
5.0%
0%
5%
10%
15%
20%
25%
30%
35%
40%
0-10 10-20 20-30 30-40 40-50 50-60
Po
rce
nta
je d
e c
lien
tes
Monto de las llamadas
Distribución del monto de las llamadas en Lima (en nuevos soles)
72 Estadística Básica con Aplicaciones en Excel 2010
Fuente: ……………………………………………………………………. Interpretación
0%
5%
10%
15%
20%
25%
30%
35%
40%
-5 5 15 25 35 45 55 65
Po
rce
nta
je d
e ..
....
....
....
....
....
...
..................................................
Título: .............................................................................
Capítulo 1. Organización de datos 73
Polígono de frecuencias
Polígono de frecuencias en Excel
Antes de elaborar este gráfico deberá usar el siguiente artificio: agregue una primera marca de clase ficticia y una última marca de clase ficticia, con frecuencias relativas igual a cero, en am-bos casos. Su finalidad es obtener un polígono como figura geométrica cerrada.
A continuación, seleccione la columna de frecuencia absoluta o relativa.
Luego, seleccione Insertar en la barra de menú, elija Línea - Línea con marcadores.
Elimine la leyenda.
Para cambiar los valores del eje X haga clic derecho y seleccione Seleccionar datos –Editar.
Haga clic sobre el gráfico y seleccione Título de gráfico, Rótulos del eje y Etiquetas de datos para dar el formato al gráfico.
Coloque las etiquetas y los valores del eje Y en formato Porcentaje.
Es la representación de las frecuencias, absolutas,
relativas o relativas, mediante una figura
poligonal cerrada.
Se obtiene uniendo con segmentos de recta los
puntos de intersección de las marcas de clase con las
frecuencias.
Los polígonos de frecuencias se cierran creando dos marcas de
clase ficticias,
una antes de la primera marca de clase y la otra después de la
última marca de clase.
Las marcas de clase, creadas por el artificio pueden toman valores negativos.
La gráfica debe presentarse solo en el primer cuadrante aún las marcas de clase creadas por el
artificio sean negativas.
74 Estadística Básica con Aplicaciones en Excel 2010
Ejemplo 17 La gerencia de la compañía Óptima, que brinda servicios de llamadas por celulares, está preocupa-da por el poco monto de las llamadas realizadas por sus clientes. Para corroborarlo se encargó al área de Administración que eligiera, del mes de enero, una muestra de clientes de Lima y registrara el monto que representan sus llamadas, en nuevos soles. El encargado mostró los resultados en la siguiente tabla de distribución de frecuencias.
Monto de las llamadas en Lima (en nuevos soles)
Tiempo de servicio Marca de clase fi hi Fi Hi
0 10 5 12 0,1000 12 0,1000
10 20 15 22 0,1833 34 0,2833
20 30 25 45 0,3750 79 0,6583
30 40 35 23 0,1917 102 0,8500
40 50 45 12 0,1000 114 0,9500
50 60 55 6 0,0500 120 1,0000
120 1
Fuente: Empresa Óptima
Grafique el polígono de frecuencias relativas.
Solución
Para cerrar el gráfico del polígono, emplearemos el siguiente artificio: agregue una primera marca de clase ficticia y una última marca de clase ficticia, con frecuencias relativas igual a cero, en ambos casos.
Marca de clase Xi hi
-5 0
5 0,1000
15 0,1833
25 0,3750
35 0,1917
45 0,1000
55 0,0500
65 0
A continuación, seleccione la columna de frecuencia absoluta o relativa.
Artificio: X1 - amplitud
Artificio: X7 + amplitud
Capítulo 1. Organización de datos 75
Luego, seleccione Insertar en la barra de menú, elija Línea - Línea con marcadores.
Elimine la leyenda.
Para cambiar los valores del eje X haga clic derecho y seleccione Seleccionar datos –Editar.
Haga clic sobre el gráfico y seleccione Título de gráfico, Rótulos del eje y Etiquetas de datos para dar el formato al gráfico.
Si corresponde, coloque las etiquetas y los valores del eje Y en formato Porcentaje.
Fuente: Empresa Óptima
10.0%
18.3%
37.5%
19.2%
10.0%
5.0%
0%
5%
10%
15%
20%
25%
30%
35%
40%
-5 5 15 25 35 45 55 65
Po
rce
nta
je d
e c
lien
tes
Monto de las llamadas
Distribución del monto de las llamadas en Lima (en nuevos soles)
76 Estadística Básica con Aplicaciones en Excel 2010
Ejercicio 25
A continuación, se muestra el tiempo de servicio, en meses, de los trabajadores de la empresa Óp-tima. Grafique el polígono de frecuencias relativas.
10 24 38 40 43 44 51 53 55 57
16 25 39 40 43 46 51 53 55 57
21 31 39 40 43 46 52 53 55 58
21 31 40 43 44 47 53 54 55 62
23 33 40 43 44 48 53 54 55 65
Solución
Fuente: …………………………………………………………………………
0%
5%
10%
15%
20%
25%
30%
35%
40%
-5 5 15 25 35 45 55 65
Po
rce
nta
je d
e ..
....
....
....
....
....
...
..................................................
Título: .............................................................................
Capítulo 1. Organización de datos 77
Ojiva
Si se usa la frecuencia acumulada relativa, el valor máximo del eje Y debe ser igual a 1.
Si se usa el porcentaje acumulado, el valor máximo del eje Y debe ser igual a 100%.
Si se usa la frecuencia acumulada absoluta, el valor máximo del eje Y debe ser el tamaño de la muestra.
Ojiva en Excel
Para que la ojiva aplique el siguiente artificio: inserte una fila, escriba el mínimo valor de los datos en la celda correspondiente al límite superior y en la columna de frecuencias relativas acumuladas Hi coloque el valor cero.
A continuación, seleccione la columna de frecuencia acumulada absoluta o relativa.
Luego, seleccione Insertar en la barra de menú, elija Línea - Línea con marcadores.
Elimine la leyenda.
Elimine las líneas horizontales.
Para cambiar los valores del eje X haga clic derecho y seleccione Seleccionar datos –Editar.
Haga clic en Editar e indique la posición de los rótulos del eje.
Coloque las etiquetas y los valores del eje Y en formato Porcentaje.
Finalmente, coloque el título del gráfico y los rótulos de los ejes X e Y.
Es la gráfica de una distribución acumulada de frecuencias, absoluta o
relativa.
Con la ojiva se puede estimar el número o porcentaje de observaciones que corresponden a
un intervalo determinado.
Se obtiene uniendo con segmentos de recta los puntos de intersección del límite superior de cada
intervalo y la frecuencia acumulada respectiva.
La ojiva siempre es un gráfico creciente.
78 Estadística Básica con Aplicaciones en Excel 2010
Ejemplo 18 La gerencia de una compañía Óptima, que brinda servicios de llamadas por celulares, está preocu-pada por el poco monto de las llamadas realizadas por sus clientes. Para corroborarlo se encargó al área de Administración que eligiera, del mes de enero, una muestra de clientes de Lima y registrara el monto que representan sus llamadas, en nuevos soles. El monto más pequeño que se registró fue de 5 nuevos soles. El encargado mostró los resultados en la siguiente tabla de distribución de frecuencias:
Monto de las llamadas en Lima (en nuevos soles)
Tiempo de servicio Marca de clase fi hi Fi Hi
0 10 5 12 0,1000 12 0,1000
10 20 15 22 0,1833 34 0,2833
20 30 25 45 0,3750 79 0,6583
30 40 35 23 0,1917 102 0,8500
40 50 45 12 0,1000 114 0,9500
50 60 55 6 0,0500 120 1,0000
120 1
Grafique la ojiva de frecuencias relativas.
Solución
Para que la ojiva comience a crecer desde el límite inferior del primer intervalo, inserte una fila, escriba el mínimo valor de los datos en la celda correspondiente al límite superior y en la co-lumna de frecuencias relativas acumuladas Hi coloque el valor cero.
Límite superior Hi
5 0
10 0,1000
20 0,2833
30 0,6583
40 0,8500
50 0,9500
60 1,0000
A continuación, seleccione la columna de frecuencia acumulada absoluta o relativa.
Luego, seleccione Insertar en la barra de menú, elija Línea - Línea con marcadores.
Límite superior = mínimo valor
Escriba Hi = 0
Capítulo 1. Organización de datos 79
Elimine la leyenda.
Si lo desea, elimine las líneas horizontales.
Para cambiar los valores del eje X, haga clic derecho y seleccione Seleccionar datos –Editar.
Haga clic en Editar e indique la posición de los rótulos del eje.
Si corresponde, coloque las etiquetas y los valores del eje Y en formato Porcentaje.
Finalmente, coloque el título del gráfico y los rótulos de los ejes X e Y.
Fuente: Empresa Óptima
Interpretación A partir del gráfico podemos observar que el 85% de los clientes de Lima tienen montos de llamada como máximo de 40 nuevos soles y que solo el 10% de estos clientes tienen montos de llamadas como máximo de 10 nuevos soles.
10.0%
28.3%
65.8%
85.0%
95.0% 100.0%
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
5 10 20 30 40 50 60
Po
rce
nta
je d
e c
lien
tes
Monto de las llamadas
Distribución del monto de las llamadas en Lima (en nuevos soles)
80 Estadística Básica con Aplicaciones en Excel 2010
Ejercicio 26
A continuación, se muestra el tiempo de servicio, en meses, de los trabajadores de la empresa Óp-tima. Presente la ojiva de frecuencias relativas para los siguientes datos.
10 24 38 40 43 44 51 53 55 57
16 25 39 40 43 46 51 53 55 57
21 31 39 40 43 46 52 53 55 58
21 31 40 43 44 47 53 54 55 62
23 33 40 43 44 48 53 54 55 65
Solución
Fuente: ……………………………………………………………….
Interpretación
0%
5%
10%
15%
20%
25%
30%
35%
40%
-5 5 15 25 35 45 55 65
Po
rce
nta
je d
e ..
....
....
....
....
....
...
..................................................
Título: .............................................................................
Capítulo 1. Organización de datos 81
Ejercicios de aplicación
1. El gerente de un banco está interesado en estudiar el comportamiento del número de cuentas
de ahorros cerradas por día. La información disponible para este fin se muestra a continuación:
0 3 1 2 1 0 2 3 0 1
1 5 0 5 4 1 0 2 1 3
4 1 4 4 0 4 3 1 2 2
0 3 2 1 1 2 5 4 0 1
a. Construya la tabla de distribución de frecuencias para la variable en estudio. b. Construya el gráfico de bastones para representar la variable en estudio.
2. Una entidad estatal realizó un estudio para determinar algunos indicadores socioeconómicos
de los inmigrantes peruanos en Estados Unidos. El estudio se llevó a cabo aplicando encuestas a una muestra de 400 inmigrantes peruanos. Una de las preguntas buscaba identificar el pro-blema principal que estos inmigrantes presentaban. Con los datos recogidos se elaboró el si-guiente gráfico:
a. Construya el gráfico de Pareto. b. Presente sus conclusiones basándose en el gráfico de Pareto.
3. El departamento de logística de una aerolínea ha registrado el día 12 de marzo del 2006, en
cada uno de sus 20 vuelos, el número de asientos sobrantes (con negativos), esto es cuando se presentaron menos pasajeros que la capacidad total del avión y el número de asientos faltantes (con positivos), cuando se presentaron más pasajeros que la capacidad total del avión.
-2 0 0 1 1
0 -1 0 2 -1
0 -1 -2 -1 1
-1 2 1 -3 0
Elabore un gráfico para representar la información anterior.
82 Estadística Básica con Aplicaciones en Excel 2010
4. Se realizó un estudio a los establecimientos dedicados a la venta de alimentos del distrito de San Miguel en Lima, para este propósito se han elegido aleatoriamente una muestra de 20 es-tablecimientos y se han considerado algunas variables como: número de empleados, condición del establecimiento e ingreso mensual, en miles de dólares.
Establecimiento Número de empleados
Condición del establecimiento
Ingreso Establecimiento Número de empleados
Condición del establecimiento
Ingreso
1 6 Buena 20,0 11 5 Regular 35,1
2 4 Buena 20,4 12 5 Mala 40,0
3 3 Regular 20,5 13 4 Buena 40,4
4 5 Regular 25,9 14 3 Buena 45,1
5 7 Mala 28,8 15 3 Mala 45,3
6 8 Buena 29,1 16 8 Muy buena 46,0
7 5 Regular 30,0 17 4 Buena 50,4
8 5 Regular 30,1 18 3 Muy buena 50,5
9 3 Muy buena 30,5 19 9 Buena 50,8
10 4 Buena 30,9 20 7 Muy buena 60,6
Elabore un gráfico que represente la información de la variable cualitativa. Además, elabore un cuadro que resuma la información de la variable cuantitativa continua.
5. En los X Censos Nacionales de Población y V de Vivienda de año 2005 se preguntó por el tipo de
alumbrado de la vivienda según área (urbana o rural).
Tipo de alumbrado del hogar Área Urbana Área Rural Total
Electricidad 3 875 390 353 544 4 228 934
Kerosene (mechero / lamparín) 148 084 817 581 965 665
Petróleo / gas (lámpara) 6 219 11 479 17 698
Vela 201 220 312 327 513 547
Generador 6 562 6 819 13 381
Otro 70 647 20 608 91 255
No tiene 17 949 9 720 27 669
Total 4 326 071 1 532 078 5 858 149
Elabore una gráfica de barras apiladas al 100% que permita ver la composición del tipo de alumbrado dentro de cada área.
6. Los siguientes datos corresponden a los ingresos de una muestra de 60 clientes del banco Nue-vo Horizonte, los montos están expresados en cientos de nuevos soles.
5,25 7,22 8,53 9,27 9,54 10,21 10,32 10,45 10,52 10,76
10,85 11,25 11,56 12,42 13,27 14,65 15,72 16,85 17,22 18,56
19,32 20,56 21,72 22,85 23,12 24,32 25,65 26,72 28,72 29,65
31,42 32,71 33,55 34,28 35,21 37,45 38,32 39,65 41,22 43,28
45,72 47,32 49,45 51,27 52,38 54,75 55,81 56,27 57,45 58,22
59,32 61,45 63,75 65,72 66,85 69,32 69,54 72,30 75,81 77,42
a. Construya una tabla completa de distribución de frecuencias usando la regla de Sturges. b. Interprete los valores de f2, h3 y H4. c. Elabore el gráfico de histograma de frecuencia absoluta. d. Elabore el gráfico de ojiva de frecuencia relativa.
Capítulo 1. Organización de datos 83
7. Los directivos de una empresa solicitaron a los gerentes de cada una de sus dos locales de ven-tas, A y B, que informen sobre los sueldos de todos sus trabajadores correspondientes al mes de marzo del año en curso. La información proporcionada (en nuevos soles) por el gerente del local A se muestra a continuación.
i Sueldos fi
1 [ 1 000 – 2 000 2
2 2 000 – 3 000 3
3 3 000 – 4 000 14
4 4 000 – 5 000 15
5 5 000 – 6 000 5
6 6 000 – 7 000] 1
a. Complete la tabla anterior con la frecuencia relativa y las frecuencias acumuladas, absolu-
tas y relativas. b. Interprete los valores de f3, h4 y H2. c. Elabore el gráfico de la ojiva para los sueldos del local A. d. Los siguientes datos corresponden a los sueldos (en nuevos soles) del local B. Construya la
tabla de distribución de frecuencias usando la regla de Sturges.
Local B
58,7 99,3 118,1 173,3 177,5 205,3 206,2 206,3 222,9 224,4
242,9 245,7 260,9 262,0 265,9 272,9 273,2 274,0 275,9 295,0
299,8 319,7 319,9 324,5 328,1 330,0 332,3 338,9 342,1 364,1
372,3 373,0 381,3 393,8 394,5 419,2 432,4 435,0 436,1 441,6
454,1 459,7 463,3 501,2 503,3 505,7 518,8 522,2 544,8 602,7
e. Elabore el gráfico comparativo de la ojiva para los sueldos de los locales A y B.
8. A continuación, se presenta la información del número de veces que una muestra de clientes
elegidos al azar del banco América presentaron solicitudes de préstamo, así como el destino de dichos préstamos: V (vivienda), N (negocio), E (estudio) y D (viaje).
Número de solicitudes de préstamo
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2
2 2 2 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4
Destino del préstamo
V V E E E E E E D D D D D V V V D E E E V V V V N
N N N E E D D D E E D N N N V V V V V E E E E E D
a. Presente la tabla de distribución de frecuencias que resuma la información de la variable
cuantitativa. Interprete f3. b. Represente gráficamente la variable cuantitativa. Presente su conclusión. c. Presente la tabla de distribución de frecuencias que resuma la información de la variable
cualitativa. Interprete f2. d. Represente gráficamente la variable cualitativa. Presente su conclusión.
84 Estadística Básica con Aplicaciones en Excel 2010
9. A un grupo de personas tomadas al azar entre aquellas que ayer ingresaron a una tienda de automóviles, se les preguntó sobre el color de carro que pensaban comprar. Los resultados ob-tenidos fueron:
Blanco Azul Verde Verde Verde Negro Rojo Negro Rojo Verde
Negro Rojo Rojo Azul Azul Azul Rojo Verde Negro Azul
Azul Blanco Verde Blanco Blanco Rojo Blanco Rojo Azul Verde
Negro Rojo Negro Rojo Rojo Verde Negro Negro Blanco Blanco
Blanco Blanco Negro Negro Azul Negro Azul Blanco Verde Blanco
a. Realice un gráfico circular b. Realice un gráfico de barras de frecuencia absoluta c. Con los gráficos obtenidos ¿Qué puede observar acerca del color de auto?
10. La gerente de la tienda de ropa Fashion Woman desea elaborar un gráfico que le permita iden-
tificar claramente las principales quejas de sus clientas. Además, desea mostrar en el mismo gráfico, las frecuencias acumuladas de las principales quejas. En el presente mes, la gerente realizó entre algunas de sus clientas una encuesta obteniendo los siguientes resultados:
Queja Número de clientas
Los precios son muy caros 10
La atención de las vendedoras no es cordial 30
Los diseños no son muy de moda 37
El horario de atención es muy restringido 5
Otras razones 18
¿A qué conclusión llegará el gerente con el gráfico obtenido?
11. Se tiene información de una muestra de 805 hogares según nivel socioeconómico y área de
residencia. Los resultados se presentan a continuación:
Nivel socioeconómico Área de residencia
Total Área urbana Área rural
NSE A 15 2 17
NSE B 48 3 51
NSE C 105 145 250
NSE D 94 175 269
NSE E 38 180 218
Total 300 505 805
a. ¿Cuál sería el título apropiado para la tabla anterior?
b. De la tabla anterior:
Calcule el número de hogares que pertenecen al NSE B o C.
Calcule el número de hogares que pertenecen al NSE B y son del área urbana.
Del total de hogares del área rural, calcule el porcentaje que son del NSE A.
Del total de hogares del NSE C, calcule el porcentaje que son del área urbana. c. Elabore una gráfica de barras apiladas al 100%. Interprete.
Capítulo 1. Organización de datos 85
12. La siguiente tabla muestra el total de productos con quiebre de stock por sección y por motivo del quiebre en el supermercado El Regalón.
Sección Artículo
descontinuado
Problema comercial
Problema stock teórico
Quiebre logístico
Total
Bebidas 2 12 16 88 118
Comestibles 4 25 56 220 305
Cuidado personal 2 14 15 84 115
Total 8 51 87 392 538
Construya un gráfico de barras apiladas al 100% por motivo del quiebre según sección.
Capítulo 2. Resúmenes de datos 87
Capítulo 2. Resúmenes de datos
Medidas de tendencia central
Son aquellas medidas que localizan el centro de una distribución, indicando el valor alrededor del cual tienden a concentrarse o distribuirse las demás observaciones. El objetivo es conseguir un va-lor que sea representativo del conjunto total de datos que se está analizando.
Media aritmética
La media aritmética (media o promedio) de un conjunto de valores de una variable es la suma de dichos valores dividida entre el número de valores. Se denota por x , M(X)
Para su cálculo se usará la siguiente expresión n
x
x
n
i
i 1
El ingreso promedio mensual en Lima aumentó un 3,9%
Noviembre del 2012
El mayor crecimiento, de 7,2%, se observó entre la población con educación técnica.
El INEI informó que durante el tercer trimestre móvil (agosto-octubre) del 2012 el ingreso promedio mensual en Lima Metropolitana fue de S/.1 311,8; registrando un incremento de 3,9%(S/.49,3 nue-vos soles) en relación al año anterior.
El salario mensual de los hombres llegó a S/.1 536 y el de las mujeres, a S/. 1016,9; lo que represen-tó un aumento de 4,3% y 3,5%, respectivamente.
Fuente: http:// www.gestion.pe/
Media aritmética en Excel
Con Excel 2010, use la función =PROMEDIO(datos)
Medidas de tendencia central
Media Mediana Moda
88 Estadística Básica con Aplicaciones en Excel 2010
Ejemplo 19 Los siguientes datos corresponden al número de visitas al mes que una muestra de 30 estudiantes realizó a la cafetería de la universidad.
4 2 4 2 1 3 3 1 3 3 4 1 1 4 1
5 5 5 3 1 3 1 4 1 1 2 4 1 4 1
Calcule e interprete la media de la variable en estudio.
Solución
Con Excel 2010, use la función =PROMEDIO(datos)
El promedio de los ingresos mensuales de una muestra de 2,6 visitas al mes. Esto significa que en promedio los estudiantes visitan la cafetería de la universidad 2,6 veces al mes.
Ejercicio 27
Los siguientes datos corresponden a la estatura, en metros, de una muestra aleatoria de hombres peruanos de 18 años. Calcule e interprete la media de la estatura de la muestra.
1,73 1,73 1,84 1,71 1,61 1,50 1,78 1,50 1,90 1,81 1,72 1,84 1,75 1,69 1,63
1,51 1,77 1,81 1,77 1,80 1,68 1,56 1,71 1,78 1,49 1,57 1,71 1,82 1,66 1,69
Calcule e interprete el promedio de la variable en estudio
Solución
Con Excel 2010, use la función =PROMEDIO(datos)
El promedio de la estatura de una muestra de hombres peruanos de 18 años es ………………………..…. Esto significa que………………………………………………………………………………………………………………….……………
Propiedades de la media aritmética
• La media aritmética de una cantidad constante es la misma constante.
M(k) = k
• La media de una variable a la que se le suma o resta una constante equivale a la media de la variable más o menos dicha constante.
M(X k) = M(X) k
• La media de una variable multiplicada por una constante equivale a la media de la variable mul-tiplicada por dicha constante.
M(kX) = kM(X)
• En general, para dos constantes a y b tenemos.
M(aX b) = aM(X) b
Capítulo 2. Resúmenes de datos 89
Ejemplo 20 Se sabe que los ingresos mensuales que perciben los trabajadores de una empresa tienen un pro-medio de 2800 nuevos soles, determine el nuevo ingreso promedio que se obtendría luego de reali-zar los siguientes aumentos: a. los ingresos de los trabajadores se incrementan en 250 nuevos soles. b. los ingresos se incrementan en un 7,5%. c. los ingresos se incrementan en un 12,5% más una bonificación de 125 nuevos soles.
Solución
Definamos las variables: X := antiguo ingreso de un trabajador y Y = nuevo ingreso de un trabajador
a. Y = X + 250, entonces M(Y) = M(X) + 250 = 2800 + 250 = 3 050 nuevos soles. b. Y = X + 0,075X = 1,075X, entonces M(Y) = M(1,075X) = (1,075)(2 800) = 3 010 nuevos soles. c. Y = X + 0,125X + 125 = 1,125X + 125. Entonces, M(Y) = (1,125)(2 800) + 125 = 3 275 nuevos soles.
90 Estadística Básica con Aplicaciones en Excel 2010
Ejercicio 28
En una negociación por aumento de salarios, la gerencia de una empresa ofrece a sus empleados dos alternativas. La primera consiste en un aumento general del 5%, mientras que, la segunda con-siste en un aumento general del 2% más un bono de 150 nuevos soles. Indique la alternativa que da a los empleados el mayor promedio de sueldos, si la media de los sueldos es actualmente de 1 800 nuevos soles.
Solución
Alternativa 1
Alternativa 2
Mejor alternativa
Capítulo 2. Resúmenes de datos 91
Ejercicio 29
La siguiente base de datos muestra las respuestas obtenidas de una encuesta realizada a una mues-tra de 40 empleados de una empresa de servicios.
ID Género Edad
(años) Categoría
laboral Tiempo de servicio
(meses) Número de hijos
Estado Civil
Ingreso mensual (en soles)
1 Masculino 35 Técnico/ventas 94 1 Divorciado 4658
2 Masculino 74 Gerencial 274 2 Casado 5678
3 Femenino 36 Profesional 99 0 Divorciado 4818
4 Masculino 42 Obrero 109 1 Conviviente 2550
5 Masculino 46 Producción 127 1 Casado 3220
6 Femenino 54 Obrero 142 1 Casado 2918
7 Femenino 45 Servicios 124 1 Divorciado 2855
8 Masculino 38 Obrero 94 1 Casado 2500
9 Femenino 25 Servicios 62 2 Divorciado 1405
10 Femenino 29 Producción 61 3 Divorciado 2699
11 Masculino 49 Apoyo/adm. 132 3 Divorciado 3053
12 Masculino 48 Gerencial 132 1 Casado 5711
13 Masculino 41 Obrero 108 1 Casado 4957
14 Masculino 59 Gerencial 160 0 Divorciado 5784
15 Masculino 63 Gerencial 200 3 Casado 6316
16 Masculino 73 Profesional 200 2 Divorciado 4670
17 Masculino 35 Gerencial 94 1 Casado 5940
18 Masculino 43 Obrero 120 4 Casado 4860
19 Masculino 43 Gerencial 121 4 Casado 5315
20 Masculino 72 Obrero 280 2 Conviviente 5071
21 Masculino 45 Gerencial 124 3 Divorciado 5612
22 Masculino 35 Técnico/ventas 94 3 Casado 4956
23 Masculino 74 Obrero 192 4 Casado 4831
24 Masculino 57 Gerencial 146 3 Casado 6512
25 Masculino 72 Obrero 186 4 Divorciado 4892
26 Masculino 42 Gerencial 112 1 Casado 5599
27 Masculino 48 Gerencial 132 1 Conviviente 4978
28 Masculino 42 Obrero 111 2 Divorciado 4602
29 Masculino 36 Gerencial 100 1 Conviviente 5678
30 Masculino 57 Gerencial 145 1 Casado 5475
31 Masculino 59 Profesional 150 1 Casado 4313
32 Masculino 59 Profesional 160 3 Casado 4818
33 Masculino 63 Obrero 200 2 Divorciado 4892
34 Masculino 38 Profesional 99 1 Conviviente 4978
35 Masculino 42 Gerencial 112 4 Divorciado 6036
36 Femenino 65 Producción 171 2 Conviviente 4032
37 Masculino 52 Producción 139 4 Divorciado 3904
38 Masculino 42 Gerencial 112 1 Conviviente 5599
39 Masculino 72 Profesional 186 2 Divorciado 4670
40 Masculino 69 Profesional 182 2 Divorciado 3482
En una negociación por aumento de salarios, la gerencia de la empresa ofrece a sus empleados dos alternativas. La primera consiste en un aumento general del 6%, mientras que, la segunda consiste en un aumento general del 3% más un bono de 120 nuevos soles por concepto de refrigerio. Indi-que la alternativa que da a los empleados el mayor promedio de sueldos.
92 Estadística Básica con Aplicaciones en Excel 2010
Solución
Alternativa 1
Alternativa 2
Mejor alternativa
Capítulo 2. Resúmenes de datos 93
Mediana
La mediana de un conjunto de datos observados de una variable es el valor que ocupa la posición central una vez puestos los datos en orden de magnitud. La mediana es el valor tal que aproxima-damente el 50% de las observaciones son menores o iguales a su valor.
Características de la mediana
Se puede calcular para variables medidas en escala de ordinal, intervalo o razón.
La mediana es un estadístico robusto, es decir, no se ve afectada por valores extremos. Por eso se le utiliza cuando hay datos inusuales o la distribución de frecuencias no es simétrica.
Mediana en Excel
Con Excel 2010, use la función =MEDIANA(datos) Ejemplo 21 Los siguientes datos corresponden al número de visitas que realizó el presente mes una muestra de30 estudiantes a la cafetería de la universidad.
4 2 4 2 1 3 3 1 3 3
5 5 5 3 1 3 1 4 1 1
4 1 1 4 1 2 4 1 4 1
Calcule e interprete la mediana de la variable en estudio.
Solución
Con Excel 2010, use la función =MEDIANA(datos) La mediana del número de visitas es igual a tres veces al mes, esto significa que el 50% de los estu-diantes visitaron la cafetería de la universidad como máximo tres veces al mes.
94 Estadística Básica con Aplicaciones en Excel 2010
Ejercicio 30
A continuación, se presenta la información de una muestra aleatoria de 15 profesionales egresados de la carrera de Administración.
Número Género Edad Estatura Número Género Edad Estatura
1 Hombre 15 154 9 Hombre 22 168
2 Hombre 19 154 10 Mujer 31 161
3 Hombre 21 156 11 Mujer 31 171
4 Hombre 34 184 12 Mujer 28 175
5 Hombre 21 173 13 Mujer 31 187
6 Hombre 24 170 14 Mujer 28 161
7 Hombre 30 176 15 Mujer 24 172
8 Hombre 26 188
Calcule e interprete el valor de la mediana de la edad para el grupo de hombres y para el grupo de mujeres.
Solución
Con Excel 2010, use la función =MEDIANA(datos) La mediana de la edad para el grupo de hombres es igual a 22 años, esto significa que el 50% de los hombres tiene una edad igual o menor a 22 años
La mediana de la edad para el grupo de mujeres es igual a ……………………………….. años, esto significa
que….………………………………………………………………………………………………………………………………………….……..
Ejercicio 31
La siguiente base de datos muestra las respuestas obtenidas de una encuesta realizada a una mues-tra de 40 empleados de una empresa de servicios.
ID Género Edad
(años) Categoría
laboral Tiempo de servicio
(meses) Número de hijos
Estado Civil
Ingreso mensual (en soles)
1 Masculino 35 Técnico/ventas 94 1 Divorciado 4658
2 Masculino 74 Gerencial 274 2 Casado 5678
3 Femenino 36 Profesional 99 0 Divorciado 4818
4 Masculino 42 Obrero 109 1 Conviviente 2550
5 Masculino 46 Producción 127 1 Casado 3220
6 Femenino 54 Obrero 142 1 Casado 2918
7 Femenino 45 Servicios 124 1 Divorciado 2855
8 Masculino 38 Obrero 94 1 Casado 2500
9 Femenino 25 Servicios 62 2 Divorciado 1405
10 Femenino 29 Producción 61 3 Divorciado 2699
11 Masculino 49 Apoyo/adm. 132 3 Divorciado 3053
12 Masculino 48 Gerencial 132 1 Casado 5711
13 Masculino 41 Obrero 108 1 Casado 4957
14 Masculino 59 Gerencial 160 0 Divorciado 5784
15 Masculino 63 Gerencial 200 3 Casado 6316
16 Masculino 73 Profesional 200 2 Divorciado 4670
Capítulo 2. Resúmenes de datos 95
17 Masculino 35 Gerencial 94 1 Casado 5940
18 Masculino 43 Obrero 120 4 Casado 4860
19 Masculino 43 Gerencial 121 4 Casado 5315
20 Masculino 72 Obrero 280 2 Conviviente 5071
21 Masculino 45 Gerencial 124 3 Divorciado 5612
22 Masculino 35 Técnico/ventas 94 3 Casado 4956
23 Masculino 74 Obrero 192 4 Casado 4831
24 Masculino 57 Gerencial 146 3 Casado 6512
25 Masculino 72 Obrero 186 4 Divorciado 4892
26 Masculino 42 Gerencial 112 1 Casado 5599
27 Masculino 48 Gerencial 132 1 Conviviente 4978
28 Masculino 42 Obrero 111 2 Divorciado 4602
29 Masculino 36 Gerencial 100 1 Conviviente 5678
30 Masculino 57 Gerencial 145 1 Casado 5475
31 Masculino 59 Profesional 150 1 Casado 4313
32 Masculino 59 Profesional 160 3 Casado 4818
33 Masculino 63 Obrero 200 2 Divorciado 4892
34 Masculino 38 Profesional 99 1 Conviviente 4978
35 Masculino 42 Gerencial 112 4 Divorciado 6036
36 Femenino 65 Producción 171 2 Conviviente 4032
37 Masculino 52 Producción 139 4 Divorciado 3904
38 Masculino 42 Gerencial 112 1 Conviviente 5599
39 Masculino 72 Profesional 186 2 Divorciado 4670
40 Masculino 69 Profesional 182 2 Divorciado 3482
Calcule e interprete el valor de la mediana del tiempo de servicio para el grupo de hombres y para el grupo de mujeres.
Solución
Ubique el cursor en cualquier celda de la primera fila de la base de datos.
Del menú principal elija la opción Inicio/Ordenar y filtrar
Haga clic en el menú despegable de la variable Género, desactive la opción Seleccionar todo y active la opción Femenino.
Una vez obtenido el filtro seleccione el Rango de celdas de la variable Tiempo de servicio. Copie y pegue el filtro en una hoja nueva o por debajo de la base de datos pero nunca al costado.
Con Excel 2010, use la función =MEDIANA(datos)
Repita el mismo procedimiento para el caso del grupo Masculino.
Entonces el resultado será: La mediana del tiempo de servicio para el grupo de hombres es igual a ………………………… meses,
esto significa que el 50% de ………………………………………………………………………………………………………………
………………………………………………………………………………………………………………………………………………………….
La mediana del tiempo de servicio para el grupo de mujeres es igual a ………………………… meses, esto
significa que ………………………………………………………………………………………………………………………………………
96 Estadística Básica con Aplicaciones en Excel 2010
Moda
La moda de un conjunto de datos observados de una variable es el valor que se presenta con mayor frecuencia. Características de la moda
La moda se puede calcular para cualquier escala de medición.
El valor de la moda no se ve afectada por valores extremos.
La moda no siempre es un valor único. Una serie de datos puede tener dos modas (bimodal) o más de dos modas (multimodal). Algunas series de datos no tienen moda.
Un conjunto de datos pudiera incluso no tener moda.
La moda es una medida menos importante que la mediana o la media debido a su ambigüe-dad.
Moda en Excel
En Excel 2010, existen dos funciones para calcular la moda .
use la función =MODA.UNO(datos) solo si los datos tuvieran una moda.
use la función =MODA.VARIOS(datos) si los datos tuvieran más de una moda. Recomendamos usar esta función pues de antemano no sabemos si el conjunto de datos con los cuales esta-mos trabajando tienen más de una moda.
Ejemplo 22 Los siguientes datos corresponden al número de visitas que realizó el presente mes una muestra de 30 estudiantes a la cafetería de la universidad.
4 2 4 2 1 3 3 1
5 5 5 3 1 3 1 4
4 1 1 4 1 2 4 1
3 1 1 3 1 4
Calcule e interprete la moda de la variable en estudio.
Solución
En este caso, el resultado es igual a una vez al mes. Esto significa que los estudiantes visitan con mayor frecuencia la cafetería de la universidad una vez al mes.
Capítulo 2. Resúmenes de datos 97
Ejercicio 32
A continuación, se presenta la información de una muestra aleatoria de 15 profesionales egresados de la carrera de Administración.
Número Género Edad Estatura (en cm)
Número Género Edad Estatura (en cm)
1 Hombre 15 154 9 Hombre 22 168
2 Hombre 19 154 10 Mujer 31 161
3 Hombre 21 156 11 Mujer 31 171
4 Hombre 34 184 12 Mujer 28 175
5 Hombre 21 173 13 Mujer 31 187
6 Hombre 24 170 14 Mujer 28 161
7 Hombre 30 176 15 Mujer 24 172
8 Hombre 26 188
Calcule e interprete la moda de la estatura.
Solución
Primero, seleccione un rango de celdas donde aparecerá la moda o las modas.
A continuación, use la función =MODA.VARIOS(datos)
Finalmente, presione las teclas Ctrl, Shift y Enter En este caso, el resultado son dos modas, la primera moda es igual a ………………….. cm. y la segunda
moda es igual a ………………………….. cm. Esto significa que .………………………………………………………………..
…………………………………………………………………………………………………………………………………………………………..
Ejercicio 33
La siguiente base de datos muestra las respuestas obtenidas de una encuesta realizada a una mues-tra de 40 empleados de una empresa de servicios.
ID Género Edad
(años) Categoría
laboral Tiempo de servicio
(meses) Número de hijos
Estado Civil
Ingreso mensual (en soles)
1 Masculino 35 Técnico/ventas 94 1 Divorciado 4658
2 Masculino 74 Gerencial 274 2 Casado 5678
3 Femenino 36 Profesional 99 0 Divorciado 4818
4 Masculino 42 Obrero 109 1 Conviviente 2550
5 Masculino 46 Producción 127 1 Casado 3220
6 Femenino 54 Obrero 142 1 Casado 2918
7 Femenino 45 Servicios 124 1 Divorciado 2855
8 Masculino 38 Obrero 94 1 Casado 2500
9 Femenino 25 Servicios 62 2 Divorciado 1405
10 Femenino 29 Producción 61 3 Divorciado 2699
11 Masculino 49 Apoyo/adm. 132 3 Divorciado 3053
12 Masculino 48 Gerencial 132 1 Casado 5711
13 Masculino 41 Obrero 108 1 Casado 4957
14 Masculino 59 Gerencial 160 0 Divorciado 5784
15 Masculino 63 Gerencial 200 3 Casado 6316
16 Masculino 73 Profesional 200 2 Divorciado 4670
17 Masculino 35 Gerencial 94 1 Casado 5940
18 Masculino 43 Obrero 120 4 Casado 4860
98 Estadística Básica con Aplicaciones en Excel 2010
19 Masculino 43 Gerencial 121 4 Casado 5315
20 Masculino 72 Obrero 280 2 Conviviente 5071
21 Masculino 45 Gerencial 124 3 Divorciado 5612
22 Masculino 35 Técnico/ventas 94 3 Casado 4956
23 Masculino 74 Obrero 192 4 Casado 4831
24 Masculino 57 Gerencial 146 3 Casado 6512
25 Masculino 72 Obrero 186 4 Divorciado 4892
26 Masculino 42 Gerencial 112 1 Casado 5599
27 Masculino 48 Gerencial 132 1 Conviviente 4978
28 Masculino 42 Obrero 111 2 Divorciado 4602
29 Masculino 36 Gerencial 100 1 Conviviente 5678
30 Masculino 57 Gerencial 145 1 Casado 5475
31 Masculino 59 Profesional 150 1 Casado 4313
32 Masculino 59 Profesional 160 3 Casado 4818
33 Masculino 63 Obrero 200 2 Divorciado 4892
34 Masculino 38 Profesional 99 1 Conviviente 4978
35 Masculino 42 Gerencial 112 4 Divorciado 6036
36 Femenino 65 Producción 171 2 Conviviente 4032
37 Masculino 52 Producción 139 4 Divorciado 3904
38 Masculino 42 Gerencial 112 1 Conviviente 5599
39 Masculino 72 Profesional 186 2 Divorciado 4670
40 Masculino 69 Profesional 182 2 Divorciado 3482
Calcule e interprete el valor de la moda del número de hijos para el grupo de hombres y para el grupo de mujeres.
Solución
Ubique el cursor en cualquier celda de la primera fila de la base de datos.
Del menú principal elija la opción Inicio/Ordenar y filtrar
Haga clic en el menú despegable de la variable Género, desactive la opción Seleccionar todo y active la opción Femenino.
Una vez obtenido el filtro seleccione el Rango de celdas de la variable Número de hijos. Copie y pegue el filtro en una hoja nueva o por debajo de la base de datos pero nunca al costado.
Con Excel 2010, use la función =MODA.VARIOS(datos)
Repita el mismo procedimiento para el caso del grupo Masculino.
Entonces el resultado será: La moda del número de hijos para el grupo de hombres es igual a ………………………… hijos, esto signi-
fica que ……………………………..………………………………………………………………………………………………………………
………………………………………………………………………………………………………………………………………………………….
La moda del número de hijos para el grupo de mujeres es igual a ………………………… hijos, esto signi-
fica que ……………………………..………………………………………………………………………………………………………………
………………………………………………………………………………………………………………………………………………………….
Capítulo 2. Resúmenes de datos 99
Ejercicio 34
La siguiente base de datos muestra las respuestas obtenidas de una encuesta realizada a una mues-tra de 40 empleados de una empresa de servicios.
ID Género Edad
(años) Categoría
laboral Tiempo de servicio
(meses) Número de hijos
Estado Civil
Ingreso mensual (en soles)
1 Masculino 35 Técnico/ventas 94 1 Divorciado 4658
2 Masculino 74 Gerencial 274 2 Casado 5678
3 Femenino 36 Profesional 99 0 Divorciado 4818
4 Masculino 42 Obrero 109 1 Conviviente 2550
5 Masculino 46 Producción 127 1 Casado 3220
6 Femenino 54 Obrero 142 1 Casado 2918
7 Femenino 45 Servicios 124 1 Divorciado 2855
8 Masculino 38 Obrero 94 1 Casado 2500
9 Femenino 25 Servicios 62 2 Divorciado 1405
10 Femenino 29 Producción 61 3 Divorciado 2699
11 Masculino 49 Apoyo/adm. 132 3 Divorciado 3053
12 Masculino 48 Gerencial 132 1 Casado 5711
13 Masculino 41 Obrero 108 1 Casado 4957
14 Masculino 59 Gerencial 160 0 Divorciado 5784
15 Masculino 63 Gerencial 200 3 Casado 6316
16 Masculino 73 Profesional 200 2 Divorciado 4670
17 Masculino 35 Gerencial 94 1 Casado 5940
18 Masculino 43 Obrero 120 4 Casado 4860
19 Masculino 43 Gerencial 121 4 Casado 5315
20 Masculino 72 Obrero 280 2 Conviviente 5071
21 Masculino 45 Gerencial 124 3 Divorciado 5612
22 Masculino 35 Técnico/ventas 94 3 Casado 4956
23 Masculino 74 Obrero 192 4 Casado 4831
24 Masculino 57 Gerencial 146 3 Casado 6512
25 Masculino 72 Obrero 186 4 Divorciado 4892
26 Masculino 42 Gerencial 112 1 Casado 5599
27 Masculino 48 Gerencial 132 1 Conviviente 4978
28 Masculino 42 Obrero 111 2 Divorciado 4602
29 Masculino 36 Gerencial 100 1 Conviviente 5678
30 Masculino 57 Gerencial 145 1 Casado 5475
31 Masculino 59 Profesional 150 1 Casado 4313
32 Masculino 59 Profesional 160 3 Casado 4818
33 Masculino 63 Obrero 200 2 Divorciado 4892
34 Masculino 38 Profesional 99 1 Conviviente 4978
35 Masculino 42 Gerencial 112 4 Divorciado 6036
36 Femenino 65 Producción 171 2 Conviviente 4032
37 Masculino 52 Producción 139 4 Divorciado 3904
38 Masculino 42 Gerencial 112 1 Conviviente 5599
39 Masculino 72 Profesional 186 2 Divorciado 4670
40 Masculino 69 Profesional 182 2 Divorciado 3482
Calcule e interprete el valor de las medidas de tendencia central para el tiempo de servicio por ca-tegoría laboral.
100 Estadística Básica con Aplicaciones en Excel 2010
Solución
Ubique el cursor en cualquier celda de la primera fila de la base de datos
Del menú principal elija la opción Inicio/Ordenar y filtrar
Haga clic en el menú despegable de la variable Estado civil, desactive la opción Seleccionar todo y active la opción Casado.
Una vez obtenido el filtro seleccione el Rango de celdas de la variable Tiempo de servicio. Copie y pegue el filtro en una hoja nueva o por debajo de la base de datos pero nunca al costado.
A continuación usaremos la opción Análisis de datos para obtener las medidas de tendencia central:
En el menú principal elija la opción Datos/Análisis de datos/Estadística descriptiva
En Rango de entrada seleccione el rango de celdas que contiene los datos de la variable fil-trada.
Dé clic a Rótulo en la primera fila dado que nuestros datos tienen en la primera fila el nombre de la variable.
Dé clic a Rango de salida y ubique el cursor dentro del recuadro y a continuación dé clic en una celda en blanco donde Excel le colocará los resultados del análisis.
Finalmente, dé clic a Resumen de estadísticas y Aceptar
Realice el mismo procedimiento para las categorías Conviviente y Divorciado.
La salida obtenida:
Estadísticos Tiempo de servicio
(meses) Casado
Tiempo de servicio (meses)
Conviviente
Tiempo de servicio (meses)
Divorciado
Media 141.823529 143.285714 135.75
Error típico 11.166927 24.6766849 11.4802366
Mediana 132 112 128
Moda 94 #N/A 124
Desviación estándar 46.0424197 65.2883713 45.9209466
Varianza de la muestra 2119.90441 4262.57143 2108.73333
Curtosis 3.26127103 3.8372381 1.06145333
Coeficiente de asimetría 1.61260652 1.95880668 0.05949087
Rango 180 181 139
Mínimo 94 99 61
Máximo 274 280 200
Suma 2411 1003 2172
Cuenta 17 7 16
Observaciones • Con la opción Análisis de datos Excel no puede identificar si los datos tienen más de una moda. • De existir más de una moda Excel solo le mostrará la primera que encuentre. • Se recomienda usar la función Moda. Varios vista anteriormente. • El valor #N/A significa que no existe moda para el conjunto de datos.
Capítulo 2. Resúmenes de datos 101
Casado:
Media: ………….….
Mediana: ……….…
Moda: ……………..
Conviviente:
Media: ………….….
Mediana: ……….…
Moda: ……………..
Divorciado:
Media: ………….….
Mediana: ……….…
Moda: ……………..
102 Estadística Básica con Aplicaciones en Excel 2010
Media ponderada
Se usará la siguiente expresión para su cálculo:
n
i
i
n
i
ii
w
w
wx
x
1
1
donde:
ix : Dato individual.
iw : Peso asignado a cada dato
Ejemplo 23 María y Pedro dedican ocho horas por semana a hacer deporte. Otros ocho estudiantes dedican cada semana cuatro horas a hacer deporte. María y Pedro dedican, además, una hora cada semana a escuchar música y los otros ocho estudiantes, tres horas. a. ¿Cuál es el número medio de horas que hacen deporte cada semana los 10 estudiantes? b. ¿Cuál es el número medio de horas que escuchan música los 10 estudiantes? c. ¿Cuál sería el número medio de horas que estos 10 estudiantes dedican, cada semana, entre las
dos actividades: hacer deporte y escuchar música? Solución a. ¿Cuál es el número medio de horas que hacen deporte cada semana los 10 estudiantes?
horasxDeporte 8,482
4882
b. ¿Cuál es el número medio de horas que escuchan música los 10 estudiantes?
horasxMúsica 6,282
3812
c. ¿Cuál sería el número medio de horas que estos 10 estudiantes dedican, cada semana, entre las
dos actividades: hacer deporte y escuchar música?
horasx músicay Deporte 7,31010
6,2108,410
Se utiliza cuando los datos a promediar no tienen la misma importancia relativa
dentro del conjunto total,
es decir, algunos datos tiene mayor importancia, peso o ponderación dentro del
conjunto de observaciones.
Capítulo 2. Resúmenes de datos 103
Ejercicio 35
Las notas de un alumno de cierto curso son:
EC1 EC2 EC3 CL Trabajo EB
12 18 15 14 15 14
Si el peso de las evaluaciones continuas (EC) son 5%, 7% y 8% respectivamente, del control de lec-tura (CL) 20%, del examen final 35% y del trabajo final 25% ¿cuál es el promedio final del alumno?
Solución
En Excel 2010, construya la siguiente tabla:
Evaluación Nota Peso Nota x Peso
EC1 12
EC2 18
EC3 15
CL 14
Trabajo 15
EB 14
Multiplique cada nota por su peso.
Calcule los totales de las columnas Peso y Nota x Peso
Divida según la fórmula.
.............................................
...........................
1
1
n
i
i
n
i
ii
w
w
wx
x
El promedio final del alumno es ………………………
104 Estadística Básica con Aplicaciones en Excel 2010
Medidas de posición o cuantiles
Las medidas de posición o cuantiles son los valores que determinan la posición de un dato respecto a todos los demás datos de una serie y que previamente ha sido ordenada de menor a mayor. Los cuantiles más importantes dividen a los datos ordenados de menor a mayor en 4, 10 y 100 can-tidades iguales de datos, denominándose cuartiles, deciles y percentiles, respectivamente.
Percentil k
Cuantiles
Cuartiles
(en 4)
Dividen el conjunto de datos en cuatro partes porcentualmente iguales
Se les denota como Q1, Q2 y Q3 respectivamente.
Se denomina así a cada uno de los tres percentiles: P25, P50, P75.
Deciles
(en 10)
Dividen el conjunto de datos en 10 partes porcentualmente iguales.
Se les denota como D1 , D2, D3, …, D9 respectivamente.
Se denomina así a cada uno de los nueve percentiles: P10, P20, ..., P90.
Percentiles
(en 100)
Dividen el conjunto de datos en 100 partes porcentualmente iguales.
El percentil k, Pk. es el valor numérico tal que aproximadamente el k por ciento de los datos ordenados está por debajo de ese valor y el (100 – k) por ciento de los datos está por encima de ese valor.
Capítulo 2. Resúmenes de datos 105
Percentil en Excel
En Excel 2010, hay dos funciones para calcular un percentil:
Para calcular el percentil k use la función =PERCENTIL.EXC(datos,k/100)
Para calcular el percentil k use la función =PERCENTIL.INC(datos,k/100)
La diferencia entre las funciones =PERCENTIL.INC y =PERCENTIL.EXC es que, en la primera el valor de k es está dentro del rango de 0 a 1, ambos inclusive, y en la segunda, el valor de k está dentro del intervalo 0 a 1 exclusivo. Ejemplo 24 A continuación se presentan los ingresos mensuales (en nuevos soles) de 12 trabajadores.
2710 2755 2850 2880 2880 2890 2920 2940 2950 3050 3130 3325
a. Calcule el valor del percentil 25 b. Calcule el valor del percentil 85
Solución
a. Calcule el valor del percentil 25 Para calcular el percentil 25 en Excel 2010, use la función =PERCENTIL.EXC(datos,0.25) El valor del percentil 25 es 2857,50 nuevos soles; esto quiere decir que el 25% de los trabajadores tienen un ingreso mensual máximo de 2857,50 nuevos soles.
b. Calcule el valor del percentil 85 Para calcular el percentil 85 en Excel 2010, use la función =PERCENTIL.EXC(datos,0.85) El valor del percentil 85 es 3139,75 nuevos soles; esto quiere decir que el 85% de los trabajadores tienen un ingreso mensual máximo de 3139,75 nuevos soles.
106 Estadística Básica con Aplicaciones en Excel 2010
Ejercicio 36
En muchos procesos de manufactura se utiliza el término “Trabajo en proceso” (TEM). En un taller que procesa libros, el TEM representa el tiempo que transcurre para que se doblen, junten, cosan, peguen por un extremo y encuadernen las hojas procedentes de la prensa. El tiempo de procesa-miento (TDP), se define de forma operacional como el tiempo, en días, transcurrido desde que las hojas salen de la prensa hasta que los libros se empacan en cajas. Para una muestra de 80 libros se ha registrado el TDP en la siguiente tabla:
10,4 11,6 7,1 8,1 10,4 11,7 10,3 8,1 11,6 10,4 11,6 9,7 8,9 7,9 9,8 7,4
6,8 11,1 6,5 5,4 8,0 13,7 12,3 9,6 13,3 10,6 14,1 11,5 9,5 13,6 7,4 8,7
10,2 14,7 10,3 10,0 13,9 9,3 7,4 12,1 8,7 12,6 6,9 10,8 9,6 6,0 10,2 8,0
11,7 7,2 10,9 6,1 13,0 10,8 9,9 10,0 14,3 9,8 9,2 11,5 11,5 10,9 8,5 11,1
9,8 9,0 9,6 9,8 10,8 11,1 10,3 10,1 9,8 12,8 7,4 9,4 8,8 9,6 11,2 9,8
a. Calcule e interprete el percentil 25 de los tiempos de procesamiento (TDP).
Solución
Para calcular el percentil 25 en Excel 2010, use la función =PERCENTIL.EXC(datos,0,25) El valor del percentil 25 es ……………………., esto quiere decir que ……………..
b. Calcule el tiempo de procesamiento (TDP) mínimo para estar en el 15% de los libros con mayo-
res tiempos de procesamiento (TDP).
Solución
Para cumplir con lo pedido debemos calcular el percentil ………….. cuyo valor es: …………..… c. Calcule el tiempo de procesamiento (TDP) máximo para estar en el 15% de los libros con meno-
res tiempos de procesamiento (TDP).
Solución
Para cumplir con lo pedido debemos calcular el percentil …………... cuyo valor es: …………..…
Capítulo 2. Resúmenes de datos 107
Ejercicio 37
La siguiente base de datos muestra las respuestas obtenidas de una encuesta realizada a una mues-tra de 40 empleados de una empresa de servicios.
ID Género Edad
(años) Categoría
laboral Tiempo de servicio
(meses) Número de hijos
Estado Civil
Ingreso mensual (en soles)
1 Masculino 35 Técnico/ventas 94 1 Divorciado 4658
2 Masculino 74 Gerencial 274 2 Casado 5678
3 Femenino 36 Profesional 99 0 Divorciado 4818
4 Masculino 42 Obrero 109 1 Conviviente 2550
5 Masculino 46 Producción 127 1 Casado 3220
6 Femenino 54 Obrero 142 1 Casado 2918
7 Femenino 45 Servicios 124 1 Divorciado 2855
8 Masculino 38 Obrero 94 1 Casado 2500
9 Femenino 25 Servicios 62 2 Divorciado 1405
10 Femenino 29 Producción 61 3 Divorciado 2699
11 Masculino 49 Apoyo/adm. 132 3 Divorciado 3053
12 Masculino 48 Gerencial 132 1 Casado 5711
13 Masculino 41 Obrero 108 1 Casado 4957
14 Masculino 59 Gerencial 160 0 Divorciado 5784
15 Masculino 63 Gerencial 200 3 Casado 6316
16 Masculino 73 Profesional 200 2 Divorciado 4670
17 Masculino 35 Gerencial 94 1 Casado 5940
18 Masculino 43 Obrero 120 4 Casado 4860
19 Masculino 43 Gerencial 121 4 Casado 5315
20 Masculino 72 Obrero 280 2 Conviviente 5071
21 Masculino 45 Gerencial 124 3 Divorciado 5612
22 Masculino 35 Técnico/ventas 94 3 Casado 4956
23 Masculino 74 Obrero 192 4 Casado 4831
24 Masculino 57 Gerencial 146 3 Casado 6512
25 Masculino 72 Obrero 186 4 Divorciado 4892
26 Masculino 42 Gerencial 112 1 Casado 5599
27 Masculino 48 Gerencial 132 1 Conviviente 4978
28 Masculino 42 Obrero 111 2 Divorciado 4602
29 Masculino 36 Gerencial 100 1 Conviviente 5678
30 Masculino 57 Gerencial 145 1 Casado 5475
31 Masculino 59 Profesional 150 1 Casado 4313
32 Masculino 59 Profesional 160 3 Casado 4818
33 Masculino 63 Obrero 200 2 Divorciado 4892
34 Masculino 38 Profesional 99 1 Conviviente 4978
35 Masculino 42 Gerencial 112 4 Divorciado 6036
36 Femenino 65 Producción 171 2 Conviviente 4032
37 Masculino 52 Producción 139 4 Divorciado 3904
38 Masculino 42 Gerencial 112 1 Conviviente 5599
39 Masculino 72 Profesional 186 2 Divorciado 4670
40 Masculino 69 Profesional 182 2 Divorciado 3482
a. Calcule e interprete el valor de los percentiles P25 y P60 para el ingreso mensual por género.
b. Calcule e interprete el valor de los percentiles P20 y P90 para el tiempo de servicio por género.
108 Estadística Básica con Aplicaciones en Excel 2010
Solución
a. Calcule e interprete el valor de los percentiles P25 y P60 para el ingreso mensual por género. Ingreso mensual del grupo de hombres:
P25 : ………….….
P60 : ……………..
Ingreso mensual del grupo de mujeres:
P25 : ………….….
P60 : ……………..
b. Calcule e interprete el valor de los percentiles P20 y P90 para el tiempo de servicio por género.
Tiempo de servicio para el grupo de hombres:
P20 : ………….….
P90 : ……………..
Tiempo de servicio para el grupo de mujeres:
P20 : ………….….
P90 : ……………..
Capítulo 2. Resúmenes de datos 109
Ejercicios de aplicación
1. Una compañía vende cuatro tipos de vallas a los propietarios de locales. La instalación de la
valla del tipo A le cuesta a la compañía 20 nuevos soles por metro lineal, la tipo B le cuesta 12 nuevos soles por metro lineal, la tipo C le cuesta 8 nuevos soles por metro lineal y la tipo D le cuesta 6,5 nuevos soles por metro lineal. Ayer la compañía instaló 100 metros de A, 150 metros de B, 75 metros de C y 200 metros de D. ¿cuál fue el costo medio del metro de valla instalado ayer?
2. Una empresa de consultorías se especializa en leyes empresariales. Cobran 275 dólares la hora
de investigación de un caso, 180 dólares la hora de asesoría, y 200 dólares la hora de redacción de un expediente. La semana pasada uno de los consultores dedicó 12 horas a la investigación del caso, 10 horas de asesoría a un cliente, y 16 horas a la redacción del expediente. ¿Cuál fue el monto promedio de honorarios de este consultor por hora?
3. En la actualidad todos los vehículos que circulan en Lima Metropolitana deben pasar las revi-
siones técnicas con el fin de reducir el nivel de contaminación en la ciudad. Inicialmente la em-presa encargada de dichas revisiones contaba con dos plantas (Cono Norte y Cono Sur) y era de interés investigar si se necesitaba abrir más plantas analizando el tiempo de atención por vehículo. Los tiempos (en minutos) que se demoraron en ser atendidos una muestra aleatoria de vehículos particulares que asistieron a cada una de las plantas se presenta a continuación:
Cono Norte Cono Sur
Número de vehículo
Tiempo Número de
vehículo Tiempo
Número de vehículo
Tiempo Número de
vehículo Tiempo
1 9,0 12 13,1 1 10,2 12 11,8
2 11,9 13 13,2 2 10,2 13 11,8
3 12,6 14 13,5 3 10,3 14 12,2
4 12,6 15 13,5 4 10,8 15 12,2
5 12,6 16 13,7 5 10,8 16 12,3
6 12,8 17 13,8 6 10,9 17 13,3
7 12,8 18 13,8 7 10,9 18 13,3
8 12,8 19 14,1 8 10,9 19 13,4
9 12,9 20 14,1 9 11,2 20 13,4
10 12,9 21 14,3 10 11,6 21 13,4
11 13,1 22 15,1 11 11,8 22 21,3
a. ¿En cuál de las plantas el tiempo promedio de atención es mayor? b. ¿En cuál de las plantas se tiene una mayor mediana? Interprete. c. ¿Cuál es el tiempo de atención más frecuente en ambas plantas? Interprete. d. ¿Cuál de be ser el tiempo de atención mínimo en la planta del cono norte para pertenecer
al 25% de los clientes que esperan más? e. ¿Cuál debe ser el tiempo de atención máximo en la planta del cono sur para pertenecer al
52% de los clientes que esperan menos? 4. Un agente de compras puso a prueba una muestra de 20 baterías de calculadoras de bolsillo de
un cierto fabricante. Cada batería se probó en una calculadora que estaba programada para lle-var a cabo un ciclo de cálculos ordinarios. El tiempo de vida, en horas, de cada batería se mues-tra a continuación:
110 Estadística Básica con Aplicaciones en Excel 2010
11,98 11,99 12,02 12,03 12,04 12,05 12,06 12,08 12,08 12,08
12,09 12,09 12,14 12,18 12,19 12,20 12,21 12,21 12,23 12,25
Si el agente de compras quiere encontrar un tiempo máximo para el 18% de las baterías que du-ran menos y un tiempo mínimo para el 23% de los que duran más, ¿cuál serían esos tiempos de vida? Justifique numéricamente su respuesta.
5. Los gastos semanales en transporte urbano (nuevos soles) que efectúan los habitantes de las
ciudades en Vista Grande y Pueblo Hermoso han sido estudiados mediante muestras aleatorias independientes. Los datos captados fueron:
Gastos semanales en movilidad en Vista Grande
Gastos semanales en movilidad en Pueblo Hermoso
22,0 22,0 22,1 23,2 23,2 23,2 23,6 23,6
18,1 18,5 18,7 19,9 20,4 20,5 21,1
24,0 24,1 24,1 24,2 24,2 24,5 24,7 25,5
21,3 21,3 21,5 22,0 22,0 22,2 22,4
a. Estime e interprete las siguientes medidas de tendencia central: media, mediana y moda
para los gastos semanales en movilidad en la ciudad de Vista Grande. b. Calcule e interprete Q3, P10 y P36 para los gastos semanales en movilidad en la ciudad de
Pueblo Hermoso. 6. Un fabricante desea adquirir una máquina empaquetadora para el llenado de bolsas de apro-
ximadamente 150 gramos. Se realizan 20 ensayos con la máquina obteniéndose los siguientes pesos, en gramos:
143 145 146 148 149 150 150 150 150 150
150 150 150 150 150 151 152 154 155 155
a. Calcule e interprete la media, mediana y moda del peso de las bolsas empaquetadas por la
máquina. b. Si el equipo de medición que se empleó para medir los pesos de las bolsas producidas por
la máquina estaba descalibrado y los verdaderos pesos serían 10% menores a los medidos y, además, con una constante de menos dos gramos, ¿cuál es el peso promedio verdadero de bolsas de la máquina?
Capítulo 2. Resúmenes de datos 111
Medidas de dispersión
Rango
El rango (amplitud o recorrido) de un conjunto de datos observados es la diferencia entre el dato mayor y el dato menor.
R = Xmax - Xmin
Características del rango
Se puede calcular en variables medidas en escala de intervalo o razón
Se ve muy afectado por valores extremos.
Con las medidas de tendencia central es posible determinar el valor central de una distribución, pero no indican qué tan cercanos o lejanos están los
datos de dicho valor central.
Las medidas de variabilidad indican cuán alejados están los valores de una variable del valor que los representa y
por lo tanto permiten evaluar la confiabilidad de ese valor central.
Cuando la medida de dispersión tiene un valor pequeño, los datos están concentrados alrededor de la medida de tendencia central,
en cambio si la medida de dispersión tiene un valor grande, los datos no están concentrados alrededor de la medida de tendencia central.
Algunas medidas de dispersión
Rango Rango
intercuartil Varianza
Desviación estándar
Coeficiente de variación
112 Estadística Básica con Aplicaciones en Excel 2010
Rango intercuartil
Es la diferencia entre el tercer y primer cuartil. Es el rango del 50% central de los datos. El rango intercuartil elimina la influencia de los valores extremos.
Rango intercuartil = RIC = Q3 – Q1= P75 – P25
donde:
Q1 es el primer cuartil o percentil 25 Q3 es el tercer cuartil o percentil 75
Características del rango intercuartil
Se puede calcular en variables medidas en escala de intervalo o razón
No se ve afectado por valores extremos.
Rango intercuartil en Excel
Excel no calcula directamente el rango intercuartil, por lo que es necesario usar las funciones:
=PERCENTIL.EXC(datos,0.75) para calcular el valor del percentil 75,
=PERCENTIL.EXC(datos,0.25) para calcular el valor del percentil 25,
Luego el valor del rango intercuartil es P75 – P25.
Ejemplo 25 Ante la pregunta sobre el número de hijos por familia, una muestra de 12 hogares marcó las res-puestas mostradas en la siguiente tabla:
2 1 2 4 1 3 2 3 2 0 5 1
Calcule e interprete los valores del rango y rango intercuartil.
Solución
El rango R = máximo – mínimo = 5 - 0 = 5. Esto significa, que el rango o amplitud para el número de hijos por familia en la muestra de 12 hogares es 5 hijos.
El rango intercuartil RIC = 3 – 1= 2. Esto significa que la dispersión en el 50% de los datos centra-les del número de hijos en las familias es igual a dos hijos.
Capítulo 2. Resúmenes de datos 113
Ejercicio 38
FibraTex S.A. es una empresa exportadora de fibra textil, actualmente cuenta con 18 operarios. Los datos que se presentan a continuación corresponden al tiempo de horas extras semanales trabaja-dos por todos sus operarios.
2,8 2,0 3,2 4,0 4,0 4,4 1,3 2,9 3,9 2,1 2,3 1,6 1,5 2,2 2,4 1,2 2,5 2,7
Calcule e interprete el rango y el rango intercuartil.
Solución
Para calcular el rango, en Excel use la función =MAX(datos) y =MIN(datos) para calcular el valor del máximo y mínimo valor de los datos, respectivamente. El dato mayor es ……………………………y el dato menor es ………………………………., luego el valor del rango es igual a …………………………….………. Esto significa que ……………………………………………………………………………………………………………………….…….. ……………………………………………………………………………………………………….………………………………………….…….. Para calcular el rango intercuartil, en Excel use la función:
=PERCENTIL.EXC(datos,0.75) para calcular el valor del percentil 75,
=PERCENTIL.EXC(datos,0.25) para calcular el valor del percentil 25,
El percentil 75 es igual a …………………………………y el percentil 25 es igual a ……………………..……………., luego el valor del rango intercuartil es …………………………………..……. Esto significa que ……………………………………………………………………………………………………………………..…….. ……………………………………………………………………………………………………….………………………………………..……..
114 Estadística Básica con Aplicaciones en Excel 2010
Varianza
Se define como el promedio de los cuadrados de las desviaciones de los datos respecto de su media aritmética.
La varianza mide el grado de dispersión o variación de los valores de una variable con respecto a su media aritmética.
Las unidades de la varianza son las unidades de los datos al cuadrado.
Se denota por V(X), 2 (varianza poblacional), 2s (varianza muestral). Se calcula usando la siguiente fórmula:
Varianza poblacional:
N
xN
i
i
1
2
2
Varianza muestral:
11
2
2
n
xx
s
n
i
i
Desviación estándar
Se define como la raíz cuadrada positiva de la varianza. Se denota por (desviación estándar po-blacional) o s (desviación estándar muestral).
Características de la varianza y la desviación estándar
La varianza y la desviación estándar son números reales no negativos.
Se pueden calcular para variables medidas en escala de intervalo o razón.
Se ven afectadas por valores extremos.
La varianza es expresada en unidades cuadráticas a las unidades de los datos, mientras que la desviación estándar es expresada en las mismas unidades de los datos.
Varianza y la desviación estándar en Excel
En Excel 2010, use la función:
=VAR.S para calcular la varianza muestral.
=DESVEST.M para calcular la desviación estándar muestral.
=VAR.P para calcular la varianza poblacional.
=DESVEST.P para calcular la desviación estándar poblacional.
Capítulo 2. Resúmenes de datos 115
Ejemplo 26 Ante la pregunta sobre el número de hijos por familia, una muestra de 12 hogares marcó las res-puestas mostradas en la siguiente tabla:
2 1 2 4 1 3 2 3 2 0 5 1
Calcule la varianza y la desviación estándar de la variable en estudio.
Solución
En Excel 2010, use la función:
=VAR.S para calcular la varianza muestral, s2 = 1,9697 hijos2.
=DESVEST.M para calcular la desviación estándar muestral, s = 1,4035 hijos.
Ejercicio 39
FibraTex S.A. es una empresa exportadora de prendas de vestir. Los datos que se presentan a con-tinuación corresponden a la edad de todos los trabajadores de esta empresa.
41 45 49 46 52 42 39 49 44 39 47 49 40 43 51 41 58 59 49 44 41 48 50 44 51
40 37 38 40 41 50 54 41 40 45 37 40 36 36 42 39 55 45 44 38 40 37 47 33 48
44 50 51 41 47 56 44 41 59 38 41 44 49 45 37 40 28 49 45 39 59 51 40 43 44
40 38 44 43 39 45 43 44 43 40 42 29 37 48 49 51 46 39 43 56 44 60 57 47 49
Calcule la varianza y la desviación estándar de la variable en estudio.
Solución
En Excel 2010, use la función:
=VAR.P para calcular la varianza poblacional, σ2 = ………….…………...……. ……………………………….
(unidades)
=DESVEST.P para calcular la desviación estándar poblacional, σ = ……..………. .........................
(unidades)
116 Estadística Básica con Aplicaciones en Excel 2010
Coeficiente de variación
Coeficiente de variación poblacional Coeficiente de variación muestral
%100
CV %100
x
scv
Coeficiente de variación en Excel
Excel no calcula directamente el coeficiente de variación, por lo que es necesario usar las funciones:
=PROMEDIO(datos) para calcular la media
=DESVEST.M(datos) para calcular la desviación estándar
Para luego, dividir la desviación estándar entre su respectiva media. Ejemplo 27 Los siguientes datos representan resúmenes del número de mediciones de resistencia de cierto artículo que realizaron dos grupos de técnicos.
Grupo 1: Media = 3 y desviación estándar = 1,10 Grupo 2: Media = 5 y desviación estándar = 1,66
¿En cuál de los grupos el número de mediciones es más disperso?
Solución
Como los promedios son diferentes, se usa como indicador el coeficiente de variación:
%67,36%1003
10,1%100
2
11
x
sCV
%207,33%1005
66,1%100
2
22
x
sCV
El número de mediciones es más disperso en el grupo 1, puesto que su coeficiente de variación es mayor.
Las medidas de dispersión estudiadas son medidas de variación absolutas pues estas se
expresan en las mismas unidades que la variable original, excepto la varianza que se
expresa en unidades al cuadrado.
El coeficiente de variación es una medida de dispersión relativa libre de unidades por lo que es
útil para comparar la variabilidad de dos o más grupos de datos aunque estén expresados en
distintas unidades de medida.
Es útil al comparar la variabilidad de dos o más series de datos que se expresan en distintas o iguales unidades, pero difieren a tal punto que
una comparación directa de las respectivas desviaciones estándar no es muy útil, por ejemplo, cuando las medias están muy distantes.
El coeficiente de variación se calcula en variables medidas en escala de
razón.
Capítulo 2. Resúmenes de datos 117
Ejercicio 40
Los datos presentados a continuación corresponden a los montos y el tipo de pago realizados por una muestra de 100 clientes de una cadena de supermercados. Los directivos de esta empresa pi-dieron tomar la muestra para conocer el comportamiento de los pagos de los clientes. Cheque
5,00 17,87 18,77 21,11 22,67 25,96 30,60 31,07 31,74 34,67
35,38 36,09 36,48 37,20 37,60 37,94 38,58 39,55 40,51 41,10
41,58 42,69 42,83 43,14 48,95 49,21 50,58 51,66 52,04 52,87
54,84 55,40 57,59 58,11 58,64 58,75 59,78 69,22 72,46 78,16
Efectivo
1,09 1,27 1,85 2,44 2,87 2,96 3,31 3,65 4,34 4,75
5,08 5,15 5,91 5,98 6,93 7,02 7,17 7,22 7,40 7,41
7,88 8,81 8,85 9,00 11,17 11,54 11,77 12,07 13,09 14,28
15,07 15,10 15,57 16,28 16,38 16,69 18,09 20,48
Tarjeta
14,44 19,78 22,59 25,57 26,57 26,91 27,66 27,89 33,76 44,53
46,13 46,24 48,11 50,30 52,35 52,63 53,32 54,19 55,21 57,55
69,77 94,36
¿Cuál de las tres formas de pago presenta mayor homogeneidad?
Solución
Para calcular el coeficiente de variación use las funciones:
=PROMEDIO(datos) para calcular la media
=DESVEST.M(datos) para calcular la desviación estándar. Luego, divida cada desviación estándar entre su respectiva media. El resultado debe ser:
Forma de pago Promedio Desviación Estándar Coeficiente de variación
Cheque
Efectivo
Tarjeta
Por lo tanto, la forma de pago más homogénea es……………………………………………………………….. porque …………………………………………………………………………………………………………………………………………………………..
118 Estadística Básica con Aplicaciones en Excel 2010
Ejercicio 41
La siguiente base de datos muestra las respuestas obtenidas de una encuesta realizada a una mues-tra de 40 empleados de una empresa de servicios.
ID Género Edad
(años) Categoría
laboral Tiempo de servicio
(meses) Número de hijos
Estado Civil
Ingreso mensual (en soles)
1 Masculino 35 Técnico/ventas 94 1 Divorciado 4658
2 Masculino 74 Gerencial 274 2 Casado 5678
3 Femenino 36 Profesional 99 0 Divorciado 4818
4 Masculino 42 Obrero 109 1 Conviviente 2550
5 Masculino 46 Producción 127 1 Casado 3220
6 Femenino 54 Obrero 142 1 Casado 2918
7 Femenino 45 Servicios 124 1 Divorciado 2855
8 Masculino 38 Obrero 94 1 Casado 2500
9 Femenino 25 Servicios 62 2 Divorciado 1405
10 Femenino 29 Producción 61 3 Divorciado 2699
11 Masculino 49 Apoyo/adm. 132 3 Divorciado 3053
12 Masculino 48 Gerencial 132 1 Casado 5711
13 Masculino 41 Obrero 108 1 Casado 4957
14 Masculino 59 Gerencial 160 0 Divorciado 5784
15 Masculino 63 Gerencial 200 3 Casado 6316
16 Masculino 73 Profesional 200 2 Divorciado 4670
17 Masculino 35 Gerencial 94 1 Casado 5940
18 Masculino 43 Obrero 120 4 Casado 4860
19 Masculino 43 Gerencial 121 4 Casado 5315
20 Masculino 72 Obrero 280 2 Conviviente 5071
21 Masculino 45 Gerencial 124 3 Divorciado 5612
22 Masculino 35 Técnico/ventas 94 3 Casado 4956
23 Masculino 74 Obrero 192 4 Casado 4831
24 Masculino 57 Gerencial 146 3 Casado 6512
25 Masculino 72 Obrero 186 4 Divorciado 4892
26 Masculino 42 Gerencial 112 1 Casado 5599
27 Masculino 48 Gerencial 132 1 Conviviente 4978
28 Masculino 42 Obrero 111 2 Divorciado 4602
29 Masculino 36 Gerencial 100 1 Conviviente 5678
30 Masculino 57 Gerencial 145 1 Casado 5475
31 Masculino 59 Profesional 150 1 Casado 4313
32 Masculino 59 Profesional 160 3 Casado 4818
33 Masculino 63 Obrero 200 2 Divorciado 4892
34 Masculino 38 Profesional 99 1 Conviviente 4978
35 Masculino 42 Gerencial 112 4 Divorciado 6036
36 Femenino 65 Producción 171 2 Conviviente 4032
37 Masculino 52 Producción 139 4 Divorciado 3904
38 Masculino 42 Gerencial 112 1 Conviviente 5599
39 Masculino 72 Profesional 186 2 Divorciado 4670
40 Masculino 69 Profesional 182 2 Divorciado 3482
a. ¿En qué categoría laboral el tiempo de servicio presenta mayor dispersión? b. ¿En qué categoría laboral el tiempo de servicio es más disperso en el 50% central?
Capítulo 2. Resúmenes de datos 119
Solución Cuando se tiene una base de datos, una manera más rápida de obtener las medidas de dispersión es utilizando la opción de Datos/Análisis de datos tal como se muestra a continuación:
Estadísticos Casado Conviviente Divorciado
Media 141,823529 143,285714 135,75
Mediana 132 112 128
Moda 94 #N/A 124
Desviación estándar 46,0424197 65,2883713 45,9209466
Varianza de la muestra 2119,90441 4262,57143 2108,73333
Coeficiente de asimetría 1,61260652 1,95880668 0,05949087
Rango 180 181 139
Mínimo 94 99 61
Máximo 274 280 200
Cuenta 17 7 16
De la salida obtenida, Excel nos arroja solo los valores de la varianza, desviación estándar y rango. a. ¿En qué categoría laboral el tiempo de servicio presenta mayor dispersión?
Para dar respuesta a la pregunta completaremos la siguiente tabla:
Estado civil Promedio Desviación Estándar Coeficiente de variación
Casado
Conviviente
Divorciado
Por lo tanto, el tiempo de servicio es más disperso en el estado civil …………………………….…..... porque ………………………………………………………………………………………………………………………………………………………….. b. ¿En qué categoría laboral el tiempo de servicio es más dispersión en el 50% central?
Para dar respuesta a la pregunta completaremos la siguiente tabla:
Estado civil Q1 Q3 RIC
Casado
Conviviente
Divorciado
Por lo tanto, el tiempo de servicio es más disperso en el 50% central de los datos es en el estado
civil …………………………….. porque …………………………………………………………………………………………….…………
120 Estadística Básica con Aplicaciones en Excel 2010
Medidas de asimetría
Relación entre media, mediana y moda
Para una distribución unimodal, es decir, que tenga una sola moda, se cumplen de manera general las siguientes relaciones.
Para una distribución simétrica: ModaMediana x
Para una distribución asimétrica positiva: ModaMediana x
Para una distribución asimétrica negativa: ModaMedianax
Además de las medidas de tendencia central y
dispersión, podemos estar interesados en saber la forma que presenta un conjunto unimodal de
datos.
Si los datos se distribuyen con igual frecuencia y
alejamiento por debajo y por encima de la media, se dice que la distribución es
simétrica.
Si los datos por debajo de la media son más frecuentes
que aquellos por encima de la media o viceversa, se
dice que la distribución es asimétrica.
Media < Mediana < Moda
Media = Mediana = Moda
Moda < Mediana < Media
Simetría o sesgo nulo
Sesgo izquierdo o negativo
Sesgo derecho o positivo
Capítulo 2. Resúmenes de datos 121
Coeficiente de asimetría de Fisher
El coeficiente de asimetría de Fisher se define como:
3
121
n
i
i
s
xx
nn
nAs
Se tiene que:
Para una distribución simétrica As = 0
Para una distribución asimétrica positiva As > 0
Para una distribución asimétrica negativa As < 0
Coeficiente de asimetría de Fisher en Excel
En Excel 2010, use la función =COEFICIENTE.ASIMETRIA(datos).
Ejercicio 42
Los datos presentados corresponden a la cantidad de dinero gastado, en nuevos soles, para com-prar regalos navideños entre un grupo de hombres y de mujeres durante el diciembre pasado en Lima Metropolitana. Calcule e interprete el coeficiente de asimetría de Fisher en ambos grupos.
Mujeres
460 507 575 420 568 558 581 334 400 426 434 290 468 546 419 726 364 432 519 503
470 519 430 250 514 447 504 543 350 473 614 441 630 432 417 421 531 523 321 405
450 393 553 430 421 461 320 930 290 718 361 383 477 280 385 416 398 503 431 406
407 558 313 387 585 503 527 511 383 402 453 429 499 179 600 373 459 410 850 847
Hombres
498 349 185 80 324 616 680 355 352 648 696 308 581 481 297 205 285 175 447 603
626 368 275 149 100 254 540 279 275 200 538 604 575 600 137 734 436 284 198 610
767 80 266 537 358 624 120 244 341 724 425 305 75 688 253 514 236 475 606 475
271 230 466 120 398 60 429 517 268 580 431 173 612 317 529 647 542 544 464 610
Solución
En Excel 2010, para calcular el coeficiente de asimetría de Fisher, use la función: =COEFICIENTE.ASIMETRIA(datos).
Género Coeficiente de asimetría de Fisher
Femenino
Masculino
Por lo tanto,
el gasto de las mujeres presenta ………………………………………………….…………………..…
el gasto de los hombres presenta ………………………………………………………..………………
122 Estadística Básica con Aplicaciones en Excel 2010
Ejercicio 43
La siguiente base de datos muestra las respuestas obtenidas de una encuesta realizada a una mues-tra de 40 empleados de una empresa de servicios.
ID Género Edad
(años) Categoría
laboral Tiempo de servicio
(meses) Número de hijos
Estado civil
Ingreso mensual (en soles)
1 Masculino 35 Técnico/ventas 94 1 Divorciado 4658
2 Masculino 74 Gerencial 274 2 Casado 5678
3 Femenino 36 Profesional 99 0 Divorciado 4818
4 Masculino 42 Obrero 109 1 Conviviente 2550
5 Masculino 46 Producción 127 1 Casado 3220
6 Femenino 54 Obrero 142 1 Casado 2918
7 Femenino 45 Servicios 124 1 Divorciado 2855
8 Masculino 38 Obrero 94 1 Casado 2500
9 Femenino 25 Servicios 62 2 Divorciado 1405
10 Femenino 29 Producción 61 3 Divorciado 2699
11 Masculino 49 Apoyo/adm. 132 3 Divorciado 3053
12 Masculino 48 Gerencial 132 1 Casado 5711
13 Masculino 41 Obrero 108 1 Casado 4957
14 Masculino 59 Gerencial 160 0 Divorciado 5784
15 Masculino 63 Gerencial 200 3 Casado 6316
16 Masculino 73 Profesional 200 2 Divorciado 4670
17 Masculino 35 Gerencial 94 1 Casado 5940
18 Masculino 43 Obrero 120 4 Casado 4860
19 Masculino 43 Gerencial 121 4 Casado 5315
20 Masculino 72 Obrero 280 2 Conviviente 5071
21 Masculino 45 Gerencial 124 3 Divorciado 5612
22 Masculino 35 Técnico/ventas 94 3 Casado 4956
23 Masculino 74 Obrero 192 4 Casado 4831
24 Masculino 57 Gerencial 146 3 Casado 6512
25 Masculino 72 Obrero 186 4 Divorciado 4892
26 Masculino 42 Gerencial 112 1 Casado 5599
27 Masculino 48 Gerencial 132 1 Conviviente 4978
28 Masculino 42 Obrero 111 2 Divorciado 4602
29 Masculino 36 Gerencial 100 1 Conviviente 5678
30 Masculino 57 Gerencial 145 1 Casado 5475
31 Masculino 59 Profesional 150 1 Casado 4313
32 Masculino 59 Profesional 160 3 Casado 4818
33 Masculino 63 Obrero 200 2 Divorciado 4892
34 Masculino 38 Profesional 99 1 Conviviente 4978
35 Masculino 42 Gerencial 112 4 Divorciado 6036
36 Femenino 65 Producción 171 2 Conviviente 4032
37 Masculino 52 Producción 139 4 Divorciado 3904
38 Masculino 42 Gerencial 112 1 Conviviente 5599
39 Masculino 72 Profesional 186 2 Divorciado 4670
40 Masculino 69 Profesional 182 2 Divorciado 3482
a. Determine la forma de la distribución del ingreso mensual, en soles, por género. b. Determine la forma de la distribución del tiempo de servicio, en meses, por género.
Capítulo 2. Resúmenes de datos 123
Solución
a. Determine la forma de la distribución del ingreso mensual, en soles, por género.
Género Coeficiente de asimetría de Fisher
Femenino
Masculino
Por lo tanto,
el ingreso mensual de las mujeres presenta ……………………………………………………..…
el ingreso mensual de los hombres presenta ……………………………………………………… b. Determine la forma de la distribución del tiempo de servicio, en meses, por género.
Género Coeficiente de asimetría de Fisher
Femenino
Masculino
Por lo tanto,
el tiempo de servicio de las mujeres presenta ……………………………………………………..…
el tiempo de servicio de los hombres presenta ………………………………………………………
124 Estadística Básica con Aplicaciones en Excel 2010
Ejercicios de aplicación
1. Una empresa tiene sucursales en dos países. En el primer país, el sueldo promedio mensual es
de 450 dólares, con una desviación estándar de 50 dólares, mientras que en el otro país el sueldo promedio es de 1500 nuevos soles y una varianza de 8500 nuevos soles2 ¿En qué país los sueldos presentan mayor variabilidad?
2. En la Bolsa de Valores de Lima se analiza la cotización de las acciones de dos empresas. En Las
acciones de C&M S.A. se cotizan en promedio a 4,50 nuevos soles con una desviación estándar de 0,50 nuevos soles, mientras que las acciones de Damis S.A se cotizan en promedio a 15 nuevos soles con una varianza de 0,85 nuevos soles2 ¿Qué empresa tiene las acciones más riesgosas (mayor variabilidad)?
3. Los gastos semanales en transporte urbano (nuevos soles) que efectúan los habitantes de las
ciudades Vista Grande y Pueblo Hermoso han sido estudiados mediante muestras aleatorias independientes. Los datos captados fueron:
Gastos semanales en movilidad en
Vista Grande
Gastos semanales en movilidad en Pueblo Hermoso
22,0 22,0 22,1 23,2 23,2 23,2 23,6 23,6
18,1 18,5 18,7 19,9 20,4 20,5 21,1
24,0 24,1 24,1 24,2 24,2 24,5 24,7 25,5
21,3 21,3 21,5 22,0 22,0 22,2 22,4
a. ¿En qué ciudad los gastos semanales en movilidad son más homogéneos? b. Evalúe la asimetría de los gastos semanales en movilidad en las dos ciudades usando el coe-
ficiente de simetría de Pearson. 4. En la actualidad todos los vehículos que circulan en Lima Metropolitana deben pasar las revi-
siones técnicas con el fin de reducir el nivel de contaminación en la ciudad. Inicialmente la em-presa encargada de dichas revisiones contaba con dos plantas (Cono Norte y Cono Sur) y era de interés investigar si se necesitaba abrir más plantas analizando el tiempo de atención por vehículo. Los tiempos (en minutos) que se demoraron en ser atendidos una muestra aleatoria de vehículos particulares que asistieron a cada una de las plantas se presenta a continuación:
Cono Norte Cono Sur
Número de vehículo
Tiempo Número de
vehículo Tiempo
Número de vehículo
Tiempo Número de
vehículo Tiempo
1 9,0 12 13,1 1 10,2 12 11,8
2 11,9 13 13,2 2 10,2 13 11,8
3 12,6 14 13,5 3 10,3 14 12,2
4 12,6 15 13,5 4 10,8 15 12,2
5 12,6 16 13,7 5 10,8 16 12,3
6 12,8 17 13,8 6 10,9 17 13,3
7 12,8 18 13,8 7 10,9 18 13,3
8 12,8 19 14,1 8 10,9 19 13,4
9 12,9 20 14,1 9 11,2 20 13,4
10 13,1 21 14,3 10 11,6 21 13,4
11 13,4 22 15,1 11 11,8 22 21,3
Capítulo 2. Resúmenes de datos 125
a. Calcule las medidas de dispersión para el tiempo, en minutos, que demoraron en ser aten-
didos los vehículos particulares que asistieron a la planta del Cono Sur. b. Calcule las medidas de dispersión para el tiempo, en minutos, que demoraron en ser aten-
didos los vehículos particulares que asistieron a la planta del Cono Norte. c. ¿Es posible afirmar que el tiempo de atención es más homogéneo en el Cono Norte? Justi-
fique numéricamente su respuesta. d. ¿Es posible afirmar que en el Cono Sur el tiempo de atención es más homogéneo en el 50%
central? Justifique numéricamente su respuesta. e. Compare la simetría del tiempo que demoran en ser atendidos los vehículos particulares
que asistieron a las plantas del Cono Norte y cono sur usando el coeficiente de Fisher. Co-mente.
5. La siguiente información corresponde al tiempo de servicio (en meses) de una muestra de pu-
blicistas que laboran en dos conocidas agencias de la capital.
Agencia Omega
Media 18,93
Mediana 14,00
Moda 6,00
Desviación estándar 15,78
Muestra 15
Agencia Sigma
Media 19,64
Mediana 15,00
Moda 11,00
Varianza 94,2841
Muestra 25
a. ¿Qué tipo de asimetría presenta la distribución del tiempo de servicio de la agencia publici-
taria Omega? ¿Por qué? b. ¿En cuál de las agencias publicitarias el tiempo de servicio (en meses) es más homogéneo?
Justifique su respuesta. 6. Se han analizado los puntajes de un examen en un curso de capacitación en una empresa, y se
ha obtenido la siguiente información: el puntaje medio en la sección A es de 74, el puntaje modal es 83 y la mediana es 77, mientras que en la sección B, el puntaje medio es de 80, el puntaje modal es 71 y la mediana es 77. Indique el tipo de asimetría de la distribución de los puntajes para cada sección.
126 Estadística Básica con Aplicaciones en Excel 2010
Resumen
Estadístico Fórmula Función en Excel
Media
n
x
x
n
i
i 1
=promedio(datos)
Mediana =mediana(datos)
Moda =moda.uno(datos) =moda.varios(datos)
Media ponderada
n
i
i
n
i
ii
w
w
wx
x
1
1
Rango r = Xmax - Xmin =max(datos)-min(datos)
Percentil k =percentil.exc(datos, k/100)
Rango intercuartil RIC = Q3 – Q1= P75 – P25 =percentil.exc(datos, 0.75) - per-centil.exc(datos, 0.25)
Coeficiente de variación muestral
%100x
scv
=desvest.m(datos)/promedio(datos)
Coeficiente de asimetría de Fisher
3
121
n
i
i
s
xx
nn
nAs
=coeficiente.asimetria(datos)
Capítulo 3. Probabilidades 127
Capítulo 3. Probabilidades
Definiciones básicas de probabilidad
Experimento no aleatorio o determinístico
Un experimento determinista es aquel en el que se puede predecir el resultado de su realización y existe ley o fórmula matemática que permite explicarlo. Los experimentos de la física son determi-nistas. Por ejemplo, el movimiento de caída libre.
Experimento aleatorio, espacio muestral, evento y probabilidad
Los conceptos probabilísticos se aplican sobre experimentos aleatorios.
Experimento aleatorio
•Es un proceso que al ser realizado u observado repetidas veces, bajo las mismas condiciones, genera más de un posible resultado que no puede ser determinado de antemano.
Espacio muestral
•Es el conjunto de todos los posibles resultados que genera un experimento aleatorio.
Evento
•Es todo subconjunto de un espacio muestral.
Probabilidad
•Es una medida de la posibilidad de ocurrencia de un evento.
128 Estadística Básica con Aplicaciones en Excel 2010
Espacio muestral
Se denota mediante el símbolo . Cada elemento del espacio muestral se denomina punto mues-tral.
Evento
Es todo subconjunto de un espacio muestral. Se denotan mediante letras mayúsculas, por ejemplo, A y B.
Evento simple: Es un evento formado por un solo punto muestral. No se puede descomponer.
Evento compuesto: Es un evento formado por más de un punto muestral.
Probabilidad
Es una medida de la posibilidad de ocurrencia de un evento.
Ejemplo de experimento aleatorio, espacio muestral, eventos y probabilidad
Experimento aleatorio
• Lanzar un dado
Espacio muestral
•Ω = 1, 2, 3, 4, 5, 6
Eventos
•A = 1
•B = 1, 2, 3
•C = 2, 4, 6, etc.
Probabilidad
•P(A) = n(A) / n(Ω) = 1 / 6 = 0,1667
•P(B) = n(B) / n(Ω) = 3 / 6 = 0,5
•P(C) = n(C) / n(Ω) = 3 / 6 = 0,5
Capítulo 3. Probabilidades 129
Combinación de eventos
Con frecuencia se construyen eventos mediante la combinación de eventos más sencillos. Es usual emplear la notación de conjuntos para describir los eventos construidos de esta forma. Sea un experimento aleatorio y Ω el espacio muestral asociado. Si A y B son dos eventos definidos en Ω, se define:
Complemento (AC)
Para un evento A cualquiera se define su complemento, CA , como el evento consistente en todos los puntos de Ω que no están en A.
Unión (A B)
Para dos eventos A y B, la unión del evento A con el evento B es el evento que contienen todos los puntos de Ω que pertenecen a A o a B o a ambos.
Intersección (A∩B)
Para dos eventos A y B, la intersección de los eventos A y B es el evento que contienen todos los puntos de Ω que pertenecen tanto a A como a B.
130 Estadística Básica con Aplicaciones en Excel 2010
Eventos mutuamente excluyentes Dos eventos son mutuamente excluyentes o disjuntos si no tienen puntos de Ω en común. Los
eventos A y B son mutuamente excluyentes si y solo si A B = .
Axiomas de la probabilidad Sea un experimento aleatorio, Ω el espacio muestral asociado a dicho experimento aleatorio y A un evento definido en Ω, entonces la probabilidad del evento A, denotada por P(A), es aquel número que cumple los siguientes axiomas:
Axioma 1: 0 P(A) 1
Axioma 2: P(Ω) = 1
Axioma 3: Si A y B son dos eventos mutuamente excluyentes entonces:
P(A B) = P(A) + P(B)
Definición clásica de probabilidad
Algunos autores definen la probabilidad como una medida de la posibilidad de ocurrencia de un evento. La definición clásica propone que si el espacio muestral es numerable y cada punto mues-tral tiene la misma posibilidad de ocurrencia, entonces la probabilidad de ocurrencia de un evento
A definido sobre es:
totalescasosdeNúmero
A eventoal favorablescasosdeNúmero
n
AnAP
Teoremas básicos de probabilidad
P() = 0, donde es el evento imposible.
P(AC) = 1 – P(A)
Si A y B son eventos cualesquiera, entonces:
P(A B) = P(A) + P(B) – P(A B)
Capítulo 3. Probabilidades 131
Ejercicio 44
Se seleccionó una muestra aleatoria de trabajadores de la empresa Óptima para determinar sus planes de jubilación después de cumplir los 65 años de edad. Los trabajadores en la muestra se dividieron en: ejecutivos, empleados y obreros. Los resultados obtenidos fueron:
Trabajador Planes después de los 65 años
Se jubile No se jubile No ha decidido su jubilación
Ejecutivo 8 3 1
Empleado 20 10 5
Obrero 50 22 11
Si se selecciona un trabajador al azar. a. ¿Cuál es la probabilidad de que no se jubile del trabajo?
Solución
Sea el evento ……… : ……………………………………………………………. Se pide calcular:
P(…………….) = ………………………………………..
b. ¿Cuál es la probabilidad de que se jubile o no sea ejecutivo?
Solución
Sean los eventos ……… : ……………………………………………………………………………………………………………………. ……… : ……………………………………………………………………………………………………………………. Se pide calcular:
P(…………….) = ………………………………………..
c. ¿Cuál es la probabilidad de que sea obrero y no haya decidido su jubilación?
Solución
Sean los eventos ……… : ………………………………………………………………………………………………..…………………. ……… : ……………………………………………………………………………………..……………………………. Se pide calcular:
P(…………….) = ………………………………………..
132 Estadística Básica con Aplicaciones en Excel 2010
Ejercicio 45
En la ciudad de Arequipa se realizó una encuesta a personas adultas para conocer la opinión que tienen respecto a una nueva ley del gobierno. La siguiente tabla muestra los resultados de la en-cuesta. Los entrevistados fueron clasificados según su género.
Género Opinión
Total A favor En contra Abstinencia
Masculino 11 29 9
Femenino 14 17 15
Total
Si se elige una persona al azar, a. ¿Cuál es la probabilidad de que no esté a favor de la nueva ley de gobierno y sea hombre?
Solución
Sea el evento ……… : …………………………………………………………………..……………………………. Sea el evento ……… : ……………………………………………………………………………..………………….
Se pide calcular:
P(…………….) = ………………………………………..
b. ¿Cuál es la probabilidad de que esté a favor o en contra de la nueva ley del gobierno?
Solución
Sea el evento ……… : ………………………………………………………………………………………………. Sea el evento ……… : ……………………………………………………………………………..……………….
Se pide calcular:
P(…………….) = ………………………………………..
c. ¿Cuál es la probabilidad de que esté en contra de la nueva ley de gobierno?
Solución
Sea el evento ……… : ……………………………………………………………………………………………….
Se pide calcular:
P(…………….) = ………………………………………..
Capítulo 3. Probabilidades 133
Ejemplo 28 Un instituto de investigaciones académicas desea determinar si existe relación entre el interés de un estudiante en finanzas, su habilidad en matemáticas y su género. Se selecciona una muestra de 200 estudiantes y mediante una prueba se mide su habilidad matemática y su interés en finanzas. Los resultados fueron los siguientes:
Interés en finanzas
Género
Total Femenino (A1) Masculino (A2)
Habilidad en matemáticas Habilidad en matemáticas
Baja (C1) Media (C2) Alta (C3) Baja (C1) Media (C2) Alta (C3)
Bajo (B1) 25 9 6 35 6 10 91
Medio (B2) 4 22 7 11 21 3 68
Alto (B3) 2 5 15 3 7 9 41
Total 31 36 28 49 34 22 200
Si se selecciona un estudiante al azar, a. ¿Cuál es la probabilidad de seleccionar un estudiante con un interés alto en finanzas?
Solución
Sea el evento B3: Interés alto en finanzas
205,0200
413 BP
b. ¿Cuál es la probabilidad de que no tenga una alta habilidad en matemáticas y tenga un interés
medio en finanzas?
Solución
Sean los eventos:
C3: Habilidad alta en matemáticas B2: Interés medio en finanzas
29,0200
21112242
BCP C
3
c. ¿Cuál es la probabilidad de que sea hombre o tenga un bajo interés en finanzas?
Solución
Sean los eventos:
A2: Masculino B1: Interés bajo en finanzas
725,0200
51
200
91
200
22344912
121212
BAP
BAPBPAPBAP
134 Estadística Básica con Aplicaciones en Excel 2010
Ejemplo 29 Una encuesta entre suscriptores de una revista local indicó que 45,8% de ellos habían rentado un automóvil por motivos de negocios, 54% por motivos personales y 30% por motivos de negocios y personales a la vez. a. ¿Cuál es la probabilidad de que un suscriptor rente un automóvil por motivos de negocios o
personales? b. ¿Cuál es la probabilidad de que un suscriptor rente un automóvil por motivos que no sean de
negocios ni personales? c. ¿Cuál es la probabilidad de que un suscriptor rente un automóvil por motivos exclusivamente
de negocios?
Solución
Definamos los eventos: A: Rentar un automóvil por negocios B: Rentar un automóvil por motivos personales Luego, hagamos un diagrama de Venn y completemos todos los espacios con las probabilidades respectivas. Del texto se tiene que 458,0AP , 54,0BP y 30,0BAP .
Con esta información completemos el diagrama.
Del diagrama se tiene que: a. 698,030,054,0458,0 BAPBPAPBAP
b. 302,0698,011 BAPBAPBAP CCC
c. 158,0 CBAP
Capítulo 3. Probabilidades 135
Ejercicio 46
En una ciudad el 28% de los trabajadores toma vacaciones dos veces al año, el 45% de los trabaja-dores toma tres cursos de capacitación al año y el 7% de los trabajadores toma vacaciones dos ve-ces al año y toma tres cursos de capacitación al año. a. ¿Cuál es la probabilidad que al elegir un trabajador al azar solo tome vacaciones dos veces al
año? b. ¿Cuál es la probabilidad que al elegir un trabajador al azar solo tome vacaciones dos veces al año
o solo tome tres cursos de capacitación al año? c. ¿Cuál es la probabilidad que al elegir un trabajador al azar no tome vacaciones dos veces al año
ni tome tres cursos de capacitación al año?
Solución
Sean los eventos …… : …………………………………………………………………………………………………………… …… : ……………………………………………………………………………………………………………
a. ¿Cuál es la probabilidad que al elegir un trabajador al azar solo tome vacaciones dos veces al año?
Se pide calcular: ..................................................................................................................... P
b. ¿Cuál es la probabilidad que al elegir un trabajador al azar solo tome vacaciones dos veces al año
o solo tome tres cursos de capacitación al año?
Se pide calcular:
........................................................................................................... P
c. ¿Cuál es la probabilidad que al elegir un trabajador al azar no tome vacaciones dos veces al año
ni tome tres cursos de capacitación al año?
Se pide calcular: ........................................................................................................... P
136 Estadística Básica con Aplicaciones en Excel 2010
Ejercicio 47
La probabilidad de que un alumno de administración lea la revista “Finanzas” es igual al 40% y la probabilidad de que lea la revista “Actualidad” es igual al 30%, además la probabilidad de que lea ambas revistas es igual al 10%. a. ¿Cuál es la probabilidad de que un alumno seleccionado al azar no lea ninguna de estas dos re-
vistas? b. ¿Cuál es la probabilidad de que un alumno seleccionado al azar lea al menos una de estas dos
revistas?
Solución
Sean los eventos
…… : ……………………………………………………………………
……. : ……………………………………………………………………
a. ¿Cuál es la probabilidad de que un alumno seleccionado al azar no lea ninguna de estas dos re-
vistas?
Se pide calcular:
..................................................................................................................... P
b. ¿Cuál es la probabilidad de que un alumno seleccionado al azar lea al menos una de estas dos
revistas?
Se pide calcular:
........................................................................................................... P
Capítulo 3. Probabilidades 137
Probabilidad condicional
Sea un experimento aleatorio y el espacio muestral asociado. Sean A, B dos eventos definidos
en . La probabilidad de ocurrencia del evento A sabiendo que el evento B ha ocurrido se denota por P(A/B) y se llama probabilidad condicional de A dado B:
0;
BPBP
BAPA/BP
Ejemplo 30 La mayoría de las estaciones de servicio venden tres tipos de gasolina: 90 octanos, 95 octanos y 97 octanos que, a su vez, pueden estar enriquecidas con un aditivo. La tabla siguiente ilustra los por-centajes de clientes que prefieren cada tipo de gasolina.
Tipo de gasolina 90 octanos (B) 95 octanos (C) 97 octanos (D) Total
Con aditivo(A) 0,05 0,10 0,05 0,20
Sin aditivo (A/) 0,15 0,40 0,25 0,80
Total 0,20 0,50 0,30 1,00
Se selecciona al azar un cliente que ha comprado uno de estos tipos de gasolina: a. ¿Cuál es la probabilidad de que haya comprado gasolina con aditivo o no sea de 95 octanos?
60,0)05,005,0(50,020,0 CCC CAPCPAPCAP
b. Si el cliente no compró gasolina de 95 octanos, ¿cuál es la probabilidad de que hay comprado
gasolina de 97 octanos?
60,050,0
30,0)(
C
CC
CP
CDPCDP
c. Si el cliente no compró gasolina de 90 0ctanos, ¿cuál es la probabilidad de que haya comprado
gasolina sin aditivo?
8125,080,0
65,0
)(
)(
C
CCCC
BP
BAPBAP
138 Estadística Básica con Aplicaciones en Excel 2010
Ejercicio 48
El administrador de una tienda de ropa de vestir para caballeros ha recopilado la siguiente informa-ción sobre el número de boletas de pago entregadas a sus clientes por la compra de camisas de manga corta, manga larga y manga tres cuartos durante el primer trimestre del año en curso.
Mes evaluado Manga corta Manga larga Manga tres cuartos Total
Enero 25 45 43
Febrero 35 25 35
Marzo 29 29 12
Total
a. Si se elige una boleta al azar, ¿cuál es la probabilidad que haya sido entregada por la venta de
una camisa de manga corta?
Sea el evento ……… : ………………………………………………………………………………….…………………. Se pide calcular:
.......................................P
b. Si se elige una boleta al azar y ésta fue del mes de febrero, ¿cuál es la probabilidad de que haya
sido por la compra de una camisa de manga corta?
Sea el evento ……… : ……………………………………………………………. Sea el evento ……… : ……………………………………………………………. Se pide calcular:
.............................
...............
....................
......................................... P
c. Si se elige una boleta al azar y ésta fue por la compra de una camisa de manga larga, ¿cuál es la
probabilidad de que haya sido entregada en el mes de enero?
Sea el evento ……… : ……………………………………………………………. Sea el evento ……… : ……………………………………………………………. Se pide calcular:
.............................
...............
....................
......................................... P
Capítulo 3. Probabilidades 139
Ejercicio 49
En los Censos Nacionales 2007 ejecutados por el Instituto Nacional de Estadística e Informática se preguntó a todos los peruanos por los servicios de comunicación con los que contaba su hogar y su área de residencia, obteniéndose los siguientes resultados:
Servicios con que los cuenta el hogar Urbano Rural Total
Hogares sin ningún tipo de servicio 1 682 454 1 468 889 3 151 343
Solo tienen teléfono fijo 480 831 6 170 487 001
Solo tienen teléfono celular 1 299 037 138 721 1 437 758
Solo tienen Internet 3 336 275 3 611
Solo tienen TV por cable 56 343 2 688 59 031
Tienen teléfono fijo y teléfono celular 506 759 2 912 509 671
Tienen teléfono fijo e Internet 15 684 31 15 715
Tienen teléfono fijo y TV por cable 117 733 186 117 919
Tienen teléfono celular e Internet 9 970 84 10 054
Tienen teléfono celular y TV por cable 204 563 1 981 206 544
Tienen Internet y TV por cable 1 288 19 1 307
Tienen teléfono fijo, teléfono celular e Internet 93 103 110 93 213
Tienen teléfono fijo, teléfono celular y TV por cable 326 181 468 326 649
Tienen teléfono fijo, Internet y TV por cable 19 732 9 19 741
Tienen teléfono celular, Internet y TV por cable 15 424 49 15 473
Los cuatro servicios 298 911 133 299 044
Total 5 131 349 1 622 725 6 754 074
a. Indique el elemento y las variables estudiadas en esta investigación. b. Si se selecciona un hogar que no cuenta con ningún servicio, ¿cuál es la probabilidad de que sea
de zona rural? c. Si se selecciona un hogar de la zona urbana, ¿cuál es la probabilidad de que cuente con tres ser-
vicios por lo menos? d. Si se selecciona un hogar al azar, ¿cuál es la probabilidad de que sea de la zona rural y que tenga
todos los servicios?
Solución
a. Indique el elemento y las variables estudiadas en esta investigación.
140 Estadística Básica con Aplicaciones en Excel 2010
b. Si se selecciona un hogar que no cuenta con ningún servicio, ¿cuál es la probabilidad de que sea de zona rural?
Sean los eventos
…… : ……………………………………………………………………
……. : ……………………………………………………………………
Se pide calcular:
................................................................................................................. P
c. Si se selecciona un hogar de la zona urbana, ¿cuál es la probabilidad de que cuente con tres ser-
vicios por lo menos?
Sean los eventos
…… : ……………………………………………………………………
……. : ……………………………………………………………………
Se pide calcular:
................................................................................................................. P
d. Si se selecciona un hogar al azar, ¿cuál es la probabilidad de que sea de la zona rural y tenga
todos los servicios?
Sean los eventos
…… : ……………………………………………………………………
……. : ……………………………………………………………………
Se pide calcular:
................................................................................................................. P
Capítulo 3. Probabilidades 141
Eventos independientes
Dos eventos son independientes si la ocurrencia de uno de ellos no afecta la ocurrencia del otro. Lo anterior se traduce, usando probabilidades condicionales, en:
P(A/B) = P(A) P(B/A) = P(B)
Propiedad de los eventos independientes
Dos eventos cualesquiera A y B son independientes si y solo si
P(A B) = P(A) × P(B) Ejemplo 31 La probabilidad que Jorge dispare y de en el blanco es 0,25 y para Luis la probabilidad correspon-diente es 0,40. Suponga que Jorge y Luis disparan de forma independiente: a. ¿Cuál es la probabilidad de que ambos den en el blanco? b. ¿Cuál es la probabilidad de al menos uno de en el blanco?
Solución
Sean los eventos: A: Jorge dispara y da en el blanco. B: Luis dispara y da en el blanco. Se tiene que 25,0AP y 40,0BP
a. 10,040,025,0 BPAPBAP
b. 55,010,040,025,0 BAPBPAPBAP
142 Estadística Básica con Aplicaciones en Excel 2010
Ejemplo 32 En una gran área metropolitana se seleccionó una muestra de 500 encuestados para determinar información diversa respecto al comportamiento de los consumidores. Entre las preguntas formu-ladas estaba “¿Disfruta comprar ropa?” De 240 hombres, 136 respondieron que sí, mientras que, de las 260 mujeres, 244 respondieron que sí. Se definen los eventos: A = El consumidor disfruta comprar ropa B = El consumidor es hombre ¿Son los eventos A y B independientes?
Solución
Para que los eventos sean independientes se debe cumplir que BPAPBP A . De acuerdo
con los datos, se tiene que:
Género Sí No Total
Hombres 136 104 240
Mujeres 244 16 260
Total 380 120 500
Calculamos:
272,0500
136BAP
3648,0500
240
500
380 BPAP
Por lo tanto, como BPAPBAP entonces A y B no son eventos independientes.
Ejercicio 50
Una empresa desea establecer dos negocios adicionales, una juguería y una heladería, en dos loca-les diferentes. Por experiencias pasadas sabe que la probabilidad de que tenga éxito en la juguería es del 60%, mientras que tenga éxito en la heladería es del 70%. Si podemos considerar a los dos negocios como independientes,
a. Calcule la probabilidad de que se tenga éxito en al menos uno de los negocios.
b. Calcule la probabilidad de que se tenga éxito solo en la juguería.
c. Calcule la probabilidad de que no tenga éxito en ninguno de los negocios.
Capítulo 3. Probabilidades 143
Solución
Sean los eventos: ……. : ...……………………………………………………..……….. luego, ........................P
……. : ...……………………………………………………..……….. luego, ........................P
Se pide:
a. Calcule la probabilidad de que se tenga éxito en al menos uno de los negocios.
................................................................................................P
b. Calcule la probabilidad de que se tenga éxito solo en la juguería.
................................................................................................P
c. Calcule la probabilidad de que no tenga éxito en ninguno de los negocios.
................................................................................................P
144 Estadística Básica con Aplicaciones en Excel 2010
Partición de un espacio muestral
Sean E1, E2, ... , Ek eventos definidos en Ω, tales que:
i. Ei Ej = , para todo i j (disjuntos dos a dos)
ii.
k
i
iE1
(eventos colectivamente exhaustivos)
Entonces se dice que los eventos E1, E2, ... , Ek definen una partición del espacio muestral Ω.
Teorema de la probabilidad total
Sea A un evento cualquiera definido sobre Ω y sea E1, E2,..., Ek una partición del espacio muestral entonces:
k
1i
ii EPEAPAP
Ejemplo 33 Una empresa de manufactura recibe embarques de una determinada pieza de dos proveedores. Actualmente el 65% de las piezas adquiridas por la empresa provienen del proveedor 1 y 35% res-tante del proveedor 2. La calidad de las piezas adquiridas varía con la fuente de suministro. Con base a los datos históricos se sabe que la probabilidad que una pieza del proveedor 1 sea defectuo-sa es 0,02 y la probabilidad de que una pieza del proveedor 2 sea defectuosa es 0,05. Si seleccio-namos al azar una de las piezas adquiridas por la empresa, ¿cuál es la probabilidad de que sea de-fectuosa?
Solución
Sean los eventos: E1 = La pieza proviene del proveedor 1, luego se tiene que P(E1) = 0,65 E2 = La pieza proviene del proveedor 2, luego se tiene que P(E2) = 0,35 A = Pieza defectuosa. Ac = Pieza no defectuosa.
Capítulo 3. Probabilidades 145
P(A/E1) = 0,02 y consecuentemente P(Ac/E1) = 0,98. Asimismo, P(A/E2) = 0,05 y consecuentemente P(Ac/E2) = 0,95. Luego, el diagrama de árbol correspondiente es:
Entonces, P(A) = P(A/E1) P(E1) + P(A/E2) P(E2) = 0,02 × 0,65 + 0,05 × 0,35 = 0,0305
Teorema de Bayes
Sea un experimento aleatorio, A un evento cualquiera definido sobre Ω y E1, E2, ... , Ek una parti-ción del espacio muestral Ω, entonces
k
1i
ii
jjj
EPE/AP
EPE/AP/AEP para j = 1, 2,…, k
Diagrama de árbol
Es la representación gráfica de los resultados posibles de la realización de un experimento aleato-rio. Cada parte terminal representa un resultado posible del experimento aleatorio y las probabili-dades se indican en las ramas.
146 Estadística Básica con Aplicaciones en Excel 2010
Ejercicio 51
El departamento de créditos de una tienda comercial sabe que sus ventas se pagan con dinero en efectivo, con cheque o al crédito, con probabilidades respectivas de 0,35; 0,25 y 0,4. La probabili-dad de que una venta sea por más de 50 dólares, es igual a 0,2 si ésta es en efectivo, es igual a 0,9 si ésta es con cheque y es igual a 0,6 si ésta es al crédito. a. ¿Cuál es la probabilidad de que una persona compre por más de 50 dólares? b. Si compra por más de 50 dólares, ¿cuál es la probabilidad de que la compra se haya realizado en
efectivo?
Solución
Sean los eventos:
E: La compra se realiza con dinero en efectivo CH: La compra se realiza con cheque C: La compra se realiza al crédito M: La compra es por más de 50 dólares MC: La compra no es por más de 50 dólares
Complete el diagrama del árbol.
Se pide calcular: a. .......................................................................................................................... P
b. ............................................................................................................../....... P
Capítulo 3. Probabilidades 147
Ejercicio 52
Un banco comercial que opera en Lima ha estimado por experiencias anteriores, que el 15% de clientes a los que se les hizo préstamo resultaron morosos. Además, se sabe que el 27% de los clientes morosos utilizaron el préstamo para financiar ampliaciones en la vivienda y el 68% de los préstamos pagados a tiempo se hicieron para realizar ampliaciones en la vivienda. Si el día de hoy se hizo préstamo a un cliente, determine: a. La probabilidad de que dicho préstamo no se utilice para realizar ampliaciones en la vivienda. b. Si el préstamo se utilizó para ampliar la vivienda, ¿cuál es la probabilidad de que el cliente no
sea moroso? c. Si el préstamo no se utilizó para ampliar la vivienda, ¿cuál es la probabilidad de que el cliente
sea moroso?
Solución
Sean los eventos: ……….... : ………………………………………………………………………………………………………….………..
……….... : …………………………………………………………………………………………………………….……..
……….... : …………………………………………………………………………………………………….……………..
……….... : ………………………………………………………………………………………………….………………..
Elabore el diagrama del árbol.
Se pide calcular: a. .......................................................................................................................... P
b. ............................................................................................................../....... P
c. ............................................................................................................../....... P
148 Estadística Básica con Aplicaciones en Excel 2010
Ejercicios de aplicación
1. La probabilidad de que María no apruebe su curso de Estadística es de 1/3, que apruebe María
o Pedro es 5/6 y que no apruebe Pedro es 1/2. Determine la probabilidad de que solo uno de ellos apruebe el curso. Rpta: 1/2
2. La probabilidad de que una empresa alemana invierta en minería en el departamento de Junín
es de 0,7; de que invierta en Cajamarca es de 0,4 y de que invierta en al menos una de ellas es de 0,8. Determine la probabilidad de que dicha empresa finalmente se localice: a. sólo en Cajamarca. Rpta: 0,4 b. en ninguno de los lugares mencionados. Rpta: 0,2
3. En una muestra de 2000 hogares de Lima Metropolitana se registró el nivel educativo alcanza-
do por el jefe de hogar y el nivel socioeconómico al cual pertenece.
Nivel educativo del jefe Nivel Socioeconómico (NSE) Total
de hogar A B C D E
Ningún nivel alcanzado 0 1 5 120 180 306
Primaria 2 5 200 220 120 547
Secundaria 20 150 300 280 95 845
Superior 78 44 95 80 5 302
Total 100 200 600 700 400 2000
Si se selecciona un hogar al azar, determine la probabilidad de que el jefe de hogar:
a. pertenezca al NSE A o D Rpta: 800/2000 b. tenga como mínimo un nivel educativo primario. Rpta: 1694/2000 c. tenga un nivel educativo secundario y no sea de NSE C. Rpta: 545/2000 d. tenga un nivel educativo primario o pertenezca al NSE D. Rpta: 1027/2000
4. En una encuesta de hogares realizada en la ciudad de Lima se entrevistó 248 hogares. La si-
guiente tabla muestra los hogares clasificados según sus ingresos familiares, tenencia de auto y tenencia de casa propia.
Hogares con ingresos de $1000 o menos Hogares con ingresos de más de $1000
Con casa propia Sin casa propia Con casa propia Sin casa propia
Con auto 37 14 37 8
Sin auto 48 40 49 15
Si elegimos un hogar encuestado al azar de esta ciudad, calcule la probabilidad de que: a. tenga casa propia. Rpta: 171/248 b. tenga un ingreso mayor a $1000. Rpta: 109/248 c. tenga un ingreso máximo de $1000 y tenga auto. Rpta: 51/248 d. tenga casa propia o no tenga auto. Rpta: 226/248 e. tenga un ingreso máximo de $1000 y que no tenga casa propia. Rpta: 54/248
5. La compañía de investigación de mercado “Seria Opinión”, realiza un estudio para evaluar la
aceptación de un nuevo producto que se desea lanzar al mercado. Por estudios previos en pro-ductos similares, se pronostica una probabilidad del 78% de que el producto resulte exitoso.
Capítulo 3. Probabilidades 149
Sin embargo, se ha comprobado que sólo el 65% de los productos que se pronosticaban como exitosos lo fueron efectivamente, y que de los productos pronosticados como no exitosos por las encuestas, el 13% resultaron siendo exitosos.
a. ¿Cuál es la probabilidad de que el producto resulte realmente exitoso en el mercado?
Rpta: 0,5356 b. Si el producto no ha resultado exitoso. ¿cuál es la probabilidad de que se haya pronosticado
como tal? Rpta: 0,4121 6. En una empresa el 25% son mujeres y el 75% son hombres. Un día ha llegado tarde a trabajar el
3% de las mujeres y el 5% de los hombres. Si se elige, al azar, a un trabajador que ha llegado tarde, calcule la probabilidad de que sea elegida una mujer. Rpta: 0,1667
7. Una encuesta realizada en universidades privadas entre alumnos de maestría presenta los re-
sultados que se muestran en la siguiente tabla:
Modalidad de estudio
Principal motivo para solicitar ingreso a universidad Total
Calidad de la universidad Costo o comodidad Otros
Tiempo completo 421 393 76 890
Tiempo parcial 400 593 46 1039
Total 821 986 122 1929
Se elige al azar un alumno de maestría en una universidad privada, determine: a. ¿Cuál es la probabilidad de que sea de tiempo parcial y haya solicitado su ingreso conside-
rando la calidad de la universidad? b. Si el alumno es de tiempo completo, ¿cuál es la probabilidad de que la calidad de la institu-
ción no sea el motivo principal para elegirla? c. Sean los eventos: A = Alumno es de tiempo completo, B = El costo o comodidad es el prin-
cipal motivo de elección. ¿Son independientes los eventos A y B?
8. Se han llevado a cabo numerosos estudios de la planeación de los consumidores para la com-pra de bienes duraderos como televisores, refrigeradores, lavadoras, estufas, y automóviles. En uno de estos estudios se le preguntó a 1000 individuos elegidos al azar si estaban planeando comprar una nueva televisión en los siguientes 12 meses. Un año después se entrevistó a las mismas personas para ver si realmente hicieron la compra. La respuesta a ambas entrevistas se muestran en la siguiente tabla.
Planea comprar TV en los siguientes 12 meses
Finalmente compró una nueva TV
Finalmente no compró una nueva TV
Sí 200 50
No 100 650
Si de la muestra anterior se selecciona un individuo aleatoriamente: a. ¿Cuál es la probabilidad de que en el último año haya planeado comprar o finalmente haya
comprado una nueva televisión? b. Si el encuestado planeó comprar una nueva televisión, ¿cuál es la probabilidad de que fi-
nalmente haya comprado una?
150 Estadística Básica con Aplicaciones en Excel 2010
9. Debido al auge de la comunicación en línea, las empresas colocan cada vez más órdenes elec-
trónicas. Una empresa de estudios socioeconómicos ha recopilado información acerca de las órdenes llenadas correctamente por cuatro tipos de empresas. Los resultados obtenidos se muestran en la siguiente tabla:
Orden Industria
Farmacéutica Consumo Computadoras Telecomunicaciones
Correcta 207 136 151 178
Incorrecta 3 4 9 12
Si elegimos al azar una empresa de los rubros mencionados. a. ¿Cuál es la probabilidad de que se elija una empresa de consumo y haya solicitado su orden
de manera incorrecta? Rpta: 4/700 b. Si la empresa elegida es de telecomunicaciones, ¿cuál es la probabilidad de que la orden
haya sido llenada de manera correcta? Rpta: 178/190
10. Un joven estima, por experiencias pasadas, que en una gran fiesta la probabilidad de que en una chica acepte bailar con él es del 4%. Si en una fiesta saca a bailar a 40 chicas. Asuma inde-pendencia entre la decisión de una chica y otra. Calcule la probabilidad de que baile por lo me-nos con una de ellas. Rpta: 0,8046
11. La investigación de mercados es el proceso de recopilación, procesamiento y análisis de infor-mación, respecto a temas relacionados con el marketing, como: clientes, competidores y mer-cado. En una compañía hay dos bases de datos sobre clientes, en la primera el 4,1% de los da-tos están equivocados, mientras que en la segunda el 3,4% de los datos están equivocados. De la primera base de datos, se saca el 75% de los datos de los clientes y el 25% restante viene de la segunda. Si se elige un cliente al azar y sus datos están equivocados, calcule la probabilidad de que provengan de la segunda base de datos. Rpta: 0,2166
12. Una empresa necesita aportaciones de sus socios para dos proyectos. La probabilidad de que
sus socios aporten para el proyecto de pago anticipado de deuda es 0,3 y que aporten para el proyecto de expansión de la capacidad productiva es de 0,6; la probabilidad de que aporten para ambos proyectos es de 0,08. a. ¿Cuál es la probabilidad de que los socios solamente aporten para uno de los proyectos?
Rpta: 0,74 b. ¿Cuál es la probabilidad de que los socios aporten para la expansión, si no aportaron para el
pago anticipado de deuda? Rpta: 0,7429
Capítulo 4. Variable aleatoria y distribución de probabilidad 151
Capítulo 4. Variable aleatoria y distribución de probabilidad
Variable aleatoria
Sea un experimento aleatorio y el espacio muestral asociado. Una variable aleatoria asocia un valor numérico a cada uno de los resultados experimentales. El valor numérico de la variable alea-toria depende del resultado del experimento. Las variables aleatorias se designan por letras mayúsculas (X, Y, Z, etc.), y a sus valores por letras latinas minúsculas.
Ejemplo de variable aleatoria discreta
Sea el experimento aleatorio consistente en lanzar dos monedas, entonces este experimento determina el espacio muestral Ω = C1C2, C1S2, S1C2, S1S2. Si se define la variable aleatoria X como número de caras obtenidas, entonces el rango o recorrido es RX = 0, 1, 2
Ejemplo de variable aleatoria continua
Sea el experimento aleatorio consistente en registrar el tiempo en que se mete el primer gol de un partido de fútbol durante los 90 minutos de juego, 900/ xx . Si se define la varia-
ble aleatoria X como el tiempo registrado, entonces el rango o recorrido es 900/ xxRX .
Variable aletoria
Una variable aleatoria es una descripción numérica
del resultado de un experimento.
Rango o recorrido de una variable aleatoria
Se denomina así al conjunto de valores posibles que puede asumir la variable aleatoria X. Se denota por RX.
Discreta
Si el rango está determinado por un conjunto finito o infinito numerable de valores.
Continua
Si el rango está determinado por un conjunto infinito no numerable de valores.
152 Estadística Básica con Aplicaciones en Excel 2010
Variable aleatoria discreta
Una variable aleatoria es discreta si el conjunto de valores que puede tomar es finito o infinito nu-merable. Una variable aleatoria discreta asume cada uno de los valores con cierta probabilidad que se deno-ta por P(X = x)
Distribución de probabilidad de una variable aleatoria discreta
La distribución de probabilidad de una variable aleatoria discreta X se describe como una función de probabilidad representada por f(x) que asigna a cada valor de la variable aleatoria, la probabili-dad de que X asuma ese valor, esto es:
f(x) = P(X = x) Toda función de probabilidad debe cumplir que:
f(x) 0
n
i
ixf1
1
Ejemplo 34 Sea el experimento aleatorio : lanzar una moneda dos veces. El espacio muestra es Ω = C1C2, C1S2, S1C2, S1S2 y n(Ω) = 4 Sea la variable aleatoria X: número de caras obtenidas, entonces el rango de X es RX = 0, 1, 2 Donde: La probabilidad de no obtener cara: f(0) = P(X = 0) = ¼ = 0,25 La probabilidad de obtener una cara: f(1) = P(X = 1) = ¼ + ¼ = 2/4 = 0,50 La probabilidad de obtener dos caras: f(2) = P(X = 2) = ¼ = 0,25 La tabla de función de probabilidad sería:
x 0 1 2
f(x) = P(X = x) 0,25 0,50 0,25
Esta tabla cumple con las siguientes condiciones:
f(x) 0 cada probabilidad es positiva y mayor o igual que cero
n
i
ixf1
1 la suma de todas las probabilidades es igual a uno
Capítulo 4. Variable aleatoria y distribución de probabilidad 153
Ejemplo 35 La distribución de probabilidad de la variable aleatoria X definida como número de defectos por cada 10 metros de una tela sintética en rollos continuos de ancho uniforme, es:
x 0 1 2 3 4
f(x) = P(X = x) 0,41 0,37 k 0,05 0,01
a. Determine la constante k.
b. Calcule las siguientes probabilidades: P(X > 3), P(X > 1 / X < 3) y P(1 < X 4)
Solución
a. Para hallar la constante k, usamos la condición que
4
i
ixf1
1
4
0
i 143210xi
ffffff , por lo tanto k = 0,16
b. Calcule las siguientes probabilidades:
01,043 fXP
1702,016,037,041,0
16,0
3210
2
)3
231
ffff
f
XP
XPXXP
22,001,005,016,043241 fffXP
Ejercicio 53
La solicitud de préstamo que presentan los clientes de un banco está compuesta por cinco rubros. El gerente de préstamos desea realizar un estudio sobre la distribución de la cantidad de rubros rechazados por cada solicitud. La siguiente tabla muestra la distribución de probabilidad de la va-riable aleatoria X definida como el número de rubros rechazados por solicitud.
X = x 0 1 2 3 4 5
xXPxf 0,79 2k k 0,03 0,02 0,01
a. Determine la constante k y grafique la función f(x)
Si se elige una solicitud al azar: b. Calcule la probabilidad de que tengan dos rubros rechazados. c. Calcule la probabilidad de que tenga más de un rubro rechazado. d. Calcule la probabilidad de que tenga menos de tres rubros rechazados. e. Calcule la probabilidad de que tenga más de uno pero menos de cuatro rubros rechazados.
Solución
a. Para hallar la constante k, usamos la condición que
4
i
ixf1
........., por lo tanto, k =……………
Remplazando tenemos:
X = x 0 1 2 3 4 5
xXPxf 0,79
0,03 0,02 0,01
154 Estadística Básica con Aplicaciones en Excel 2010
Si se elige una solicitud al azar: b. Calcule la probabilidad de que tenga dos rubros rechazados.
......................................................................................................... P
c. Calcule la probabilidad de que tenga más de un rubro rechazado.
......................................................................................................... P
d. Calcule la probabilidad de que tenga menos de tres rubros rechazados.
......................................................................................................... P
e. Calcule la probabilidad de que tenga más de uno pero menos de cuatro rubros rechazados.
......................................................................................................... P
Valor esperado de una variable aleatoria discreta
El valor esperado o esperanza matemática de una variable aleatoria X o media de una distribución de probabilidad de X se denota E(X).
nn
n
i
iiX xfxxfxxfxxfxXE
...22
1
11
Propiedades del valor esperado
Sean a, b y k constantes numéricas y X una variable aleatoria, entonces:
E(k) = k
E(aX+b) = aE(X)+b
0.0
0.2
0.4
0.6
0.8
1.0
1.2
0 1 2 3 4 5
f(x
)
X
Capítulo 4. Variable aleatoria y distribución de probabilidad 155
Varianza de una variable aleatoria discreta
La varianza V(X) de una variable aleatoria discreta X con distribución de probabilidad f(x) se calcula por:
22 XEXEXV
La varianza de la variable aleatoria X, V(X), también se denota por 2X , o simplemente como 2 .
Propiedades de la varianza
Sean a, b y k constantes numéricas y X una variable aleatoria, entonces:
V(k) = 0
V(aX+b) = a2V(X)
Desviación estándar
Se denota por o DE(X). Sea X una variable aleatoria discreta con función de probabilidad f(x). La desviación estándar de X es dada por la siguiente expresión:
)XV(
Ejemplo 36 Uno de los mayores errores cometidos por la mayoría de las empresas es la ausencia de planifica-ción. Los negocios han de tener en cuenta que abrir un perfil en las redes sociales no significa ha-blar solo de la empresa o de sus productos y/o servicios sino que es vital la elaboración de una es-trategia adecuada a las necesidades y en la que se determine el público al que se quiere llegar me-diante estos medios. En el siguiente gráfico se muestra la distribución de la variable aleatoria X, definida como número de veces que la empresa actualiza su perfil a la semana.
k
0,12
0,20
6k
0,14 0,16
0,10
0.00
0.05
0.10
0.15
0.20
0.25
0.30
1 2 3 4 5 6 7
Pro
bab
ilid
ad
Número de veces que actualiza su perfil
Distribución de probabilidad del número de veces que actualiza su perfil a la semana
156 Estadística Básica con Aplicaciones en Excel 2010
a. En base a la información mostrada en el gráfico, obtenga el valor de la constante k y complete la tabla de distribución de probabilidades:
Para hallar la constante k, usamos la condición que
4
i
ixf1
1 , por lo tanto, k =0,04
Remplazando tenemos:
b. Calcule las veces que se espera que las empresas actualicen su perfil a la semana. Interprete
2,410,07...12,0204,01 XE veces por semana
Si el experimento se repitiera muchas veces, a la larga las veces que se espera que las empresas actualicen su perfil a la semana es de 4,2 veces. Ejemplo 37 Según un reporte histórico de ventas de la empresa Kallpa, se ha podido determinar que el número de días transcurrido hasta la venta de un auto presenta la siguiente distribución de probabilidades:
X = número de días hasta la venta 2 3 4 5 6 7
xXPxf 0,1 0,2 0,4 0,15 0,1 0,05
Cada auto vendido, le reporta a la empresa una ganancia fija de $800; sin embargo, si el tiempo para la venta es menos de cuatro días gana adicionalmente $120, pero si el tiempo para la venta está entre 4 y 5 días gana adicionalmente $80, en otro caso no obtiene ganancia adicional. a. Determine el tiempo esperado para la venta de un auto y su desviación estándar.
1,405,071,0615,054,042,013,02 XE días
4,1805,071,0615,054,042,031,02 2222222 XE
Luego, calculamos la varianza 59,11,44,18 2 XV días2 siendo el valor de la desviación es-
tándar 26,159,1 días.
b. Calcule la ganancia que espera obtener la empresa.
G = ganancia en dólares 800 880 920
f(G) = Probabilidad 0,15 0,55 0,30
E(G) = 800 x 0,15 + 880 x 0,55 + 920 x 0,30 = $880
X = veces que actualiza su perfil a la semana 1 2 3 4 5 6 7
xXPxf 0,04 0,12 0,2 0,24 0,14 0,16 0,10
Capítulo 4. Variable aleatoria y distribución de probabilidad 157
Ejercicio 54
La demanda diaria de un producto es una variable aleatoria X cuya distribución probabilidades está dada por la siguiente tabla:
x 1 2 3 4 5
f(x) 1/16 4/16 6/16 4/16 1/16
La empresa obtiene por cada unidad demandada de producto 100 nuevos soles de utilidad. Si la cantidad demanda en un día es mayor a dos unidades, se obtiene una utilidad adicional de 15 nue-vos soles por unidad demandada de producto. Calcule el valor esperado de la utilidad por la de-manda diaria de productos.
Solución
Completamos la tabla calculando primero la utilidad:
Utilidad (U) f(U) U x f(U)
Esperado de la utilidad E(U)
Por lo tanto, el valor esperado de la utilidad por la demanda diaria de productos es………………...
Ejercicio 55
La siguiente tabla muestra la distribución de probabilidad de la variable aleatoria X: Número de cuentas de correo que tiene un estudiante universitario.
X:= número de cuentas de correo 1 2 3 4
Probabilidad f(x) 2k + 0,03 0,30 0,40 k
a. Determine el valor de k para que f(x) sea función de probabilidad
158 Estadística Básica con Aplicaciones en Excel 2010
b. Obtenga la probabilidad de que un estudiante universitario tenga al menos uno pero menos de cuatro cuentas de correo.
c. Determine e interprete el valor esperado del número de cuentas de correo.
d. Si por cada cuenta de correo le demanda al alumno 15 minutos diarios revisar cada cuenta
¿cuántos minutos esperaría un estudiante dedicar a sus cuentas de correo diariamente?
Ejercicios
1. El número de días necesario para que un obrero procese cierta pieza se modela con una varia-
ble aleatoria X con la siguiente función de probabilidad:
X:= número de días 2 3 4 5 6 7
f(x) 0,1 0,1 0,3 0,2 0,2 0,1
a. Calcule el tiempo medio de procesamiento de una pieza y la varianza. Rpta: 4,6 y 2,04
b. Para cada pieza procesada el obrero gana una cantidad fija de S/.5, pero si utiliza menos de
seis minutos gana S/.1,20 por cada minuto ahorrado. Determinar la media y la varianza de
la variable aleatoria ganancia obtenida por pieza ensamblada. Rpta: 6,8 y 2,38
2. La siguiente tabla muestra la distribución de probabilidad de la variable aleatoria X:= número
de papeletas impuestas a un taxista por exceso de velocidad en las zonas restringidas de una ciudad durante el último año.
X:= número de papeletas 0 1 2 3 4
Probabilidad f(x) 0,40 b 2b 0,07 0,08
Capítulo 4. Variable aleatoria y distribución de probabilidad 159
a. Determine el valor de b para que f(x) sea función de probabilidad. Rpta: 0,15 b. Calcule la probabilidad que un taxista tenga por lo menos una pero menos de cuatro pape-
letas por exceso de velocidad. Rpta: 0,52 c. Si el costo de una papeleta por exceso de velocidad es de 430 nuevos soles, calcule el valor
esperado que paga un taxista por este tipo de papeletas durante el último año. Rpta: 550,40 nuevos soles
d. Si a la municipalidad le genera una utilidad por papeleta impuesta por exceso de velocidad
con la siguiente función 220150)( xxxU . Obtenga la utilidad que espera tener la muni-
cipalidad por taxista. Rpta: 126,80 nuevos soles 3. La siguiente tabla muestra la distribución de probabilidad de la variable aleatoria X: Número de
cuentas de correo que tiene un estudiante universitario.
X:= número de cuentas de correo 1 2 3 4
Probabilidad f(x) 2k+0,03 0,30 0,40 k
a. Determine el valor de k para que f(x) sea función de probabilidad
Rpta: 0,09 b. Obtenga la probabilidad que un estudiante universitario tenga al menos uno pero menos
de cuatro cuentas de correo. Rpta: 0,91
c. Determine e interprete el valor esperado del número de cuentas de correo. Rpta: 2,37 cuentas
d. Si por cada cuenta de correo le demanda al alumno15 minutos diarios revisar cada cuenta ¿cuántos minutos espera un estudiante dedicar a sus cuentas de correo diariamente?
Rpta: 35,55 min. 4. Uno de los mayores errores cometidos por la mayoría de las empresas es la ausencia de planifi-
cación. Los negocios han de tener en cuenta que abrir un perfil en las redes sociales no significa hablar solo de la empresa o de sus productos y/o servicios sino que es vital la elaboración de una estrategia adecuada a las necesidades y en la que se determine el público al que se quiere llegar mediante estos medios. En el siguiente gráfico se muestra la distribución de la variable aleatoria X: Número de veces que la empresa actualiza su perfil a la semana.
a. Si seleccionamos una empresa al azar, calcule la P(X 2 / X < 6) Rpta: 0,9459
k
0.12
0.2 6k
0.14 0.16
0.1
0.00
0.05
0.10
0.15
0.20
0.25
0.30
1 2 3 4 5 6 7
Pro
bab
ilid
ad
Número de veces que actualiza su perfil
Distribución de probabilidad del número de veces que actualiza su perfil a la semana
160 Estadística Básica con Aplicaciones en Excel 2010
b. Si el coeficiente de variación de la variable aleatoria X es mayor o igual al 15% entonces la distribución de probabilidades es heterogénea. ¿Esta distribución es heterogénea?
Rpta: 38,97%
c. Si cada actualización de perfil demora 35 minutos, calcule el tiempo que se espera dedicar a la actualización del perfil a la semana. Rpta: 147 min.
5. La solicitud de préstamo que presentan los clientes de un banco puede ser aceptada o negada
por el gerente de préstamos. Se desea realizar un estudio sobre la distribución de la cantidad de solicitudes aceptadas por el gerente de préstamos. La siguiente tabla muestra la distribu-ción de probabilidad de la variable aleatoria X: Número de solicitudes aceptadas por día por el gerente de préstamos.
a. Determine el valor de k para que f(x) sea función de probabilidad. Rpta: 0,20 b. Si se sabe que el gerente puede aceptar al menos una solicitud al día, ¿cuál sería la probabi-
lidad que tenga que aceptar a lo más cuatro solicitudes al día? Rpta: 0,79 c. Determine e interprete el valor esperado de la variable X. Rpta: 3,05 solicitudes d. Calcule el coeficiente de variación de X. Rpta: CV(X)= 46,91%
X:=número de solicitudes aceptadas por día 0 1 2 3 4 5
Probabilidad f(x) 0,05 0,15 0,05 2k 0,15 k
Capítulo 4. Variable aleatoria y distribución de probabilidad 161
Variable aleatoria continua
Función de densidad de probabilidad
Es la función que cumple las siguientes condiciones:
i. f(x) 0, para todo x de RX
ii. 1)( XR
dxxf
Esta función no asigna probabilidades en un punto como si lo hace la función de probabilidad de una variable aleatoria discreta. Para determinar probabilidades en un intervalo [a, b] contenido en el rango de X se usa:
b
a
dxxfbXaP )(
Valor esperado de una variable aleatoria continua
El valor esperado de una variable aleatoria continua definida en RX está dado por:
XR
dxxfxXE
Varianza de una variable aleatoria continua
La varianza para una variable aleatoria continua definida en RX está dada por:
22 XEXEXV , donde XR
2 dx)x(fxXE 2
162 Estadística Básica con Aplicaciones en Excel 2010
Distribuciones discretas especiales
Distribución binomial
Entonces, si se tiene un experimento binomial con n intentos y la probabilidad p de éxito en cual-quier intento, la probabilidad de tener x éxitos en los n intentos está dada por:
xnxnx ppCxXPxf
1 x = 0, 1, 2,... , n
Se dice que la variable aleatoria X sigue una distribución binomial con parámetros n y p
Se denota X ~ B (n, p)
Características
Es simétrica si p = 0,5. Para valores de p < 0,5 la distribución tiene sesgo derecho y para valores p>0,5 tiene sesgo izquierdo, independientemente de los valores de n.
Para valores de n suficientemente grandes (n > 50), y sólo tomando en cuenta los valores rele-vantes de probabilidad, la distribución es prácticamente simétrica.
El esperado de una variable binomial es npXE
La varianza de una variable binomial es pnpXV 12
Un experimento binomial consiste en una serie de n pruebas o ensayos, donde n se fija antes de realizar el
experimento.
Las pruebas son idénticas y cada una de ellos puede resultar en uno de dos
posibles resultados que denotan éxito o fracaso.
Las pruebas son independientes entre sí por lo
que el resultado de un intento en particular no
influye en el resultado de cualquier otro.
La probabilidad de éxito es constante de una prueba a
otra y la denotamos como p.
Capítulo 4. Variable aleatoria y distribución de probabilidad 163
Distribución binomial en Excel
En Excel 2010, use la función =DISTR.BINOM.N(Núm_éxito, Ensayos, Prob_éxito, acumulado) Ejemplo 38
La probabilidad de obtener éxito en un negocio de exportación de productos naturales es igual a 0,4. Un empresario está interesado en invertir en cinco sucursales de este rubro de manera inde-pendiente. a. Defina la variable, su distribución y rango o recorrido. b. ¿Cuál es la probabilidad que el empresario tenga éxito en al menos una sucursal? c. Determine el número esperado de sucursales en el que tendrá éxito. d. Determine la probabilidad de que no tenga éxito en al menos cuatro sucursales.
Solución
a. Defina la variable, su distribución, parámetros y rango o recorrido.
Definamos la variable aleatoria X = Número de sucursales con éxito.
Su distribución y parámetros: X B (n = 5, p = 0,4) Rango o recorrido: RX = 0, 1, 2, 3, 4, 5
b. ¿Cuál es la probabilidad que el empresario tenga éxito en al menos una sucursal?
En Excel 2010, use la función =DISTR.BINOM.N(Núm_éxito, Ensayos, Prob_éxito, acumulado)
En la ventana que aparece realice lo siguiente:
Núm_éxito: digite o haga clic a la celda que contiene el menor valor del rango de la variable, en este caso A5
Ensayos: se refiere al tamaño de muestra. Digite 5 o haga clic a la celda B2. Presione F4 para fijar la celda.
Prob_éxito: se refiere a la probabilidad de éxito. Digite 0.4 o haga clic a la celda B1. Presione F4 para fijar la celda.
Acumulado: Como vamos a obtener la tabla de función de probabilidad digitamos el valor 0. Colocamos el valor cero porque lo que se va a obtener son probabilidades puntuales.
Finalmente, compruebe que la suma de las probabilidades debe darle uno. Con esta tabla esta-remos listos para obtener cualquier valor de probabilidad.
164 Estadística Básica con Aplicaciones en Excel 2010
La probabilidad solicitada será:
9222,00102,00768,02304,03456,02592,01 XP
c. Determine el número esperado de sucursales en el que tendrá éxito.
24,05 pnXE
d. Determine la probabilidad de que no tenga éxito en al menos cuatro sucursales.
Debemos observar que en esta pregunta la variable ha cambiado, ahora estamos interesados en las que no tienen éxitos; por lo tanto, ha cambiado también la probabilidad de éxito. Realice los pasos mostrados en la pregunta a. para dar respuesta a la pregunta. Definamos la variable aleatoria Y= Número de sucursales sin éxito.
Su distribución y parámetros: Y B (n = 5, p = 0,6) Rango o recorrido: Ry =0, 1, 2, 3, 4, 5
La probabilidad solicitada será: 33696,04 YP
Ejercicio 56
Una empresa especializada en proyectos de inversión tiene en cartera 10 proyectos elaborados y expeditos para ser sometidos a la evaluación de concursos de licitación pública estatal. De acuerdo con su experiencia, el gerente de la empresa sabe que el 20% de los proyectos ganan la buena pro. Suponga que en un concurso de licitación pública se presentan estos diez proyectos. a. Calcule la probabilidad de que dos proyectos ganen la licitación.
b. Calcule la probabilidad de que por lo menos ocho proyectos ganen la licitación.
c. Calcule la probabilidad de que a lo más cuatro proyectos ganen la licitación.
d. Calcule la probabilidad de que más de tres pero como máximo 7 proyectos ganen la licitación.
Capítulo 4. Variable aleatoria y distribución de probabilidad 165
Solución
La variable en estudio es ………………….…………………………………………………….. Sus parámetros son: n = ………………………..………. y p = …………………….………….. El rango de la variable X es ………………………………………………………………..…… En Excel 2010, use la función =DISTR.BINOM.N(…………, …………, ……..…, …….…) a. Calcule la probabilidad de que dos proyectos ganen la licitación. La probabilidad pedida es: …………………........ cuyo valor es: ………..………………… b. Calcule la probabilidad de que por lo menos ocho proyectos ganen la licitación. La probabilidad pedida es: …………………........ cuyo valor es: ………..………………… c. Calcule la probabilidad de que a lo más cuatro proyectos ganen la licitación. La probabilidad pedida es: …………………........ cuyo valor es: ………..………………… d. Calcule la probabilidad de que más de tres pero como máximo siete proyectos ganen la licita-
ción. La probabilidad pedida es: …………………........ cuyo valor es: ………..…………………
166 Estadística Básica con Aplicaciones en Excel 2010
Distribución hipergeométrica
La probabilidad de obtener de x éxitos en la muestra de n elementos es:
,Nn
rNxn
rx
C
CCxf
x = máximo0, n+r- N,…,mínimon, r
Se dice que la variable X sigue una distribución hipergeométrica con parámetros N, r y n.
Se denota X ~ H (N, n, r)
Características
El esperado de una variable hipergeométrica es N
rnXE
La varianza de una variable hipergeométrica es
112
N
nN
N
r
N
rnXV
Consideremos N elementos, de los cuales r son
considerados éxitos y por lo tanto N - r como fracasos.
Como en el caso de la distribución binomial se desea
calcular la probabilidad de obtener x éxitos en una
muestra de n elementos.
El experimento hipergeométrico consiste en
extraer al azar y sin reemplazo n elementos de un conjunto
de N elementos, r de los cuales son éxitos y (N - r )son
fracasos.
0.00
0.10
0.20
0.30
0.40
0.50
0 1 2 3 4 5
f(x
)
X
Capítulo 4. Variable aleatoria y distribución de probabilidad 167
Distribución hipergeométrica en Excel
En Excel 2010, use la función =DISTR.HIPERGEOM.N(Muestra_éxito, Núm_de_muestra, Pobla-ción_éxito,Núm_de_población, Acumulado) Ejemplo 39 La SUNAT tiene en su almacén diversos artículos producto de la incautación por evasión tributaria. Entre los productos incautados se encuentran 11 camionetas, de las cuales cinco son de marca ja-ponesa y el resto de procedencia china. Si el encargado selecciona al azar siete camionetas para un remate, a. Determine la probabilidad de que se encuentren a lo más tres camionetas de procedencia chi-
na. b. Determine la probabilidad de que se encuentren más de tres camionetas de procedencia china. c. Determine la probabilidad de que se encuentren más de tres pero como máximo cinco camio-
netas de procedencia china.
Solución
Definimos la variable aleatoria X: número de camionetas de procedencia china.
Su distribución y parámetros: X H (N = 11, n = 7, r = 6) Rango o recorrido: RX = máximo0, 7+6-11,…, mínimo7, 6, luego RX = 2, 3, 4, 5, 6 En Excel 2010, use la función =DISTR.HIPERGEOM.N(Muestra_éxito, Núm_de_muestra, Pobla-ción_éxito, Núm_de_población, acumulado) En la ventana que aparece realice lo siguiente:
Muestra_éxito: digite o haga clic a la celda que contiene el menor valor del rango de la variable. En este caso la celda A6 contiene al menor valor del rango de la variable.
Núm_de_muestra: se refiere al tamaño de muestra. Digite 7 o haga clic a la celda B2. Presione F4 para fijar la celda.
Población_éxito: se refiere al número de éxitos en la población. Digite 6 o haga clic a la celda B3. Presione F4 para fijar la celda.
Núm_de_población: se refiere al tamaño de la población. Digite 11 o haga clic a la celda B1. Presione F4 para fijar la celda.
Acumulado: Como vamos a obtener la tabla de función de probabilidad digitamos el valor 0. Colocamos el valor cero porque lo que vamos a obtener son probabilidades puntuales.
168 Estadística Básica con Aplicaciones en Excel 2010
Finalmente, compruebe que la suma de las probabilidades debe darle uno. Con esta tabla estare-mos listos para obtener cualquier valor de probabilidad.
a. Determine la probabilidad de que se encuentren a lo más tres camionetas de procedencia chi-
na.
3485,0)3()2(3 XPXPXP
b. Determine la probabilidad de que se encuentren más de tres camionetas de procedencia china.
6515,0)6()5()4(3 XPXPXPXP
c. Determine la probabilidad de que se encuentren más de tres pero como máximo cinco camio-netas de procedencia china.
6364,0)5()4(53 XPXPXP
Capítulo 4. Variable aleatoria y distribución de probabilidad 169
Ejercicio 57
Una florería tiene 10 vehículos de reparto que se utilizan principalmente para llevar flores y arre-glos florales en la ciudad. Suponga que dos de los 10 camiones tienen problemas con los frenos. Si se seleccionan al azar cuatro vehículos al azar para probarlos, ¿cuál es la probabilidad de que dos de los camiones probados no tengan frenos defectuosos?
Solución
La variable en estudio es ………………………….…………………………………………………………………………….….…….. Sus parámetros son: N = ………………. , n = …………………. y r = ……………………….. El rango de la variable X es ……………………………………………………………………… En Excel 2010, use la función =DISTR.HIPERGEOM.N(………., ………., ………., ………., ) La probabilidad pedida es: …………………........ cuyo valor es: ……………………………
170 Estadística Básica con Aplicaciones en Excel 2010
Distribución de Poisson
La probabilidad de tener x resultados en un intervalo dado o en una región específica es:
!)(
x
exf
x , donde RX = 0, 1, 2, 3,…
x = número de éxitos por unidad de tiempo o región.
= número esperado de éxitos por unidad de tiempo o región o razón promedio de ocurrencia. t = periodo de evaluación e = 2,71828…
Se dice que la variable aleatoria X sigue una distribución de Poisson con parámetro
Se denota X ~ P()
Siempre es una distribución sesgada a la derecha. A medida que aumenta y tomando en cuenta sólo los valores relevantes de probabilidad, la distribución tiende a hacerse simétrica.
El experimento que origina una variable aleatoria que sigue una distribución de Poisson se denomina proceso de Poisson y posee las siguientes propiedades:
El número de resultados que ocurre en un intervalo o
región de espacio cualquiera es independiente
del número que ocurre en cualquier otro intervalo o
región del espacio disjunto.
La probabilidad de que ocurra un solo resultado durante el intervalo muy
corto o región muy pequeña es proporcional a la longitud del intervalo o al tamaño de la región y no depende del número de resultados que ocurren fuera del intervalo
o región.
La probabilidad de que ocurra más de un resultado
en tal intervalo corto o caiga en tal región pequeña es
insignificante.
0.00
0.02
0.04
0.06
0.08
0.10
0.12
0.14
0.16
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
f(x
)
X
Capítulo 4. Variable aleatoria y distribución de probabilidad 171
El esperado de una variable Poisson es tXE
La varianza de una variable Poisson es tXV 2
Distribución de Poisson en Excel
En Excel 2010, use la función =POISSON.DIST(x, media, acumulado) Ejemplo 40 Entre las 10:00 am. y 11:00 am. en promedio ocho personas hacen uso de un cajero automático, ubicado al lado de la puerta de entrada de un banco. Asimismo, el número de clientes que ingresan al banco entre las 10:00 am. y 11:00 am. en promedio es 15 clientes. Considere que el número de clientes que hacen uso del cajero es independiente del número de clientes que ingresan al banco y ambos siguen un proceso de Poisson.
a. ¿Cuál es la probabilidad de que menos de 10 pero más de 8 usen el cajero en ese horario? b. ¿Cuál es la probabilidad de que entre las 10:00 am y las 10:30 am, ingresen al banco menos de
tres clientes?
Solución
a. Definamos la variable aleatoria X = Número de clientes que hacen uso del cajero entre las 10 y
11 am. X P( = 8) En Excel 2010, use la función =POISSON.DIST(x, 8, 0) La probabilidad pedida es P(8 < X < 10) = P(X = 9) = 0,1241
b. Definamos la variable aleatoria:
X = Número de clientes que ingresan al banco entre las 10 y 10:30 am. X P( = 7,5) En Excel 2010, use la función =POISSON.DIST(x, 7.5, 0) La probabilidad pedida es: P(X < 3) = 0,0203
Ejercicio 58
El número de barcos que llegan a un puerto cada semana (siete días) es una variable aleatoria que tiene distribución de Poisson con media igual a 14 barcos. ¿Cuál es la probabilidad de que en tres días lleguen más de dos barcos?
Solución
La variable en estudio es ……………………………………………………………….…….. La razón promedio es ………………………………………………………………………… El periodo de evaluación t = ………………………………………………………………….. Por lo tanto, la media es …………………………………………………………………..….
172 Estadística Básica con Aplicaciones en Excel 2010
En Excel 2010, use la función =POISSON.DIST(……..…………, …..…………., …..………….) La probabilidad pedida es: …………………………………......... cuyo valor es: ……………………………………………
Ejercicio 59
El banco Credibank ha planificado abrir una agencia frente a una universidad. Asumiendo que lle-gan a la agencia en promedio tres personas por minuto. Calcule la probabilidad de que en dos mi-nutos lleguen como mínimo dos y como máximo cuatro personas a la agencia.
Solución
La variable en estudio es ……………………………………………………………………………………………….………….……..
La razón promedio es …………………………………………………………………………..…… El periodo de evaluación t = …………………………………………………………….……….. Por lo tanto, la media es ………………………………………………………………………..…. En Excel 2010, use la función =POISSON.DIST(……..…………, …..…………., …..………….) La probabilidad pedida es: ………………………………….…........ cuyo valor es: …………………………………………
Ejercicios de aplicación
1. La empresa textil Pima sabe por experiencias previas que el porcentaje de pedidos que cumple
con la entrega en el plazo establecido con sus clientes del exterior es del 92%. a. Si se eligen al azar cinco pedidos, calcule la probabilidad de tres pedidos se entreguen en el
plazo establecido. Rpta: 0,0498 b. Si se eligen al azar cinco pedidos, calcule la probabilidad de que por lo menos cuatro pedi-
dos no se entreguen en el plazo establecido. Rpta: 0,0002 2. Un fabricante de piezas garantiza que una caja de sus piezas contendrá como máximo un defec-
tuoso. Si la caja contiene 10 piezas, y la experiencia ha demostrado que ese proceso de fabrica-ción produce 5% de piezas defectuosas, ¿cuál es la probabilidad de que una caja elegida al azar satisfaga la garantía? Rpta: 0,9139
3. La empresa Copimix alquila máquinas fotocopiadoras usadas, debido a que tiene muchas solici-
tudes de sus clientes no se abastece a darle un mantenimiento efectivo, por lo que algunos de sus clientes devuelven las fotocopiadoras por mal funcionamiento. Entre ocho fotocopiadoras usadas que se suministraron, tres funcionan mal. Un cliente desea alquilar cuatro máquinas rá-pidamente y se le envían sin verificarlas. Calcule la probabilidad que el cliente reciba, por lo menos una de las máquinas que trabajan mal.
4. Los tipos de usuarios que frecuentan las redes sociales son:
Los usuarios creadores, aquellos que crean blogs y comparten información
Los usuarios críticos, que comentan en blogs y escriben opiniones.
Capítulo 4. Variable aleatoria y distribución de probabilidad 173
Si de un total de 14 usuarios, de los cuales 11 son creadores se seleccionan al azar a cinco usuarios, ¿cuál es la probabilidad de encontrar por lo menos tres usuarios creadores?
Rpta: 0,9725 5. A una garita de peaje en promedio llegan 240 autos por hora según un proceso de Poisson. El
administrador de la garita ordena atender inicialmente solamente una caseta, pero si en el lap-so de dos minutos llegan como mínimo 10 autos (considera que se produce una congestión), entonces ordena inmediatamente atender en otra caseta más hasta que se produzca el des-congestionamiento. ¿Cuál es la probabilidad que el administrador tenga que ordenar atender en otra caseta?
6. La llegada de reclamos a una oficina reguladora sigue un proceso Poisson con media de dos
reclamos cada cuatro minutos. a. Calcule la probabilidad que en un minuto se reciba 2 reclamos. b. Determine la probabilidad que en 10 minutos se presenten por lo menos dos reclamos. c. Calcule la probabilidad de que en 1 hora se reciba exactamente 28 reclamos.
7. Una florería tiene quince camiones de reparto que se utilizan principalmente para llevar flores y
arreglos en una ciudad. Supóngase que seis de los quince camiones tienen frenos defectuosos. Se seleccionaron cinco camiones al azar para probarlos. ¿Cuál es la probabilidad que menos de dos de los camiones probados tengan frenos defectuosos?
8. Al pintar planchas de acero con cierto tipo de pintura ocurren pequeños defectos que se distri-
buyen aleatoriamente en la superficie según una distribución de Poisson con un promedio de 2,5 defectos por cada 100 cm2. Calcule la probabilidad de que presente por lo menos dos defec-tos en una plancha de acero de 20 cm2.
9. En un almacén de una empresa importadora de electrodomésticos se tienen 23 equipos de
sonido para su comercialización, 15 de estos equipos de sonido son de la marca Sonyc y el resto son de la marca Power. El gerente de ventas de la empresa le ha encargado a uno de los em-pleados que seleccione al azar 5 equipos de sonido para llevarlos a la tienda para la venta del día. Calcule la probabilidad que el empleado lleve más de dos equipos de sonido de la marca Power.
10. Una empresa especializada en proyectos de inversión tiene en cartera 10 proyectos elaborados y expeditos para ser sometidos a la evaluación de concursos de licitación pública estatal. De acuerdo con su experiencia, el gerente de la empresa sabe que el 20% de los proyectos ganan la buena pro. Suponga que en un concurso de licitación pública se presentan estos diez proyectos. Calcule la probabilidad de que dos o tres proyectos ganen la licitación.
174 Estadística Básica con Aplicaciones en Excel 2010
Distribuciones continuas especiales
Distribución de probabilidad uniforme
Función de densidad
casootroen
bxaabxf
0
1
Se dice que X tiene una distribución uniforme con parámetros a y b.
Se denota X ~ U (a, b)
Características
Es simétrica respecto al eje 2
baX
El esperado de una variable uniforme es 2
baXE
La varianza de una variable uniforme es
12
22 ab
XV
Capítulo 4. Variable aleatoria y distribución de probabilidad 175
Ejemplo 41 Las ventas semanales (en miles de nuevos soles) en un restaurante tiene distribución uniforme entre 2,5 y 12,5 a. Si el restaurante necesita vender como mínimo 5000 nuevos soles para cubrir sus gastos, de-
termine la probabilidad de que en una semana cualquiera no pueda cubrir sus gastos. b. ¿Cuál es la probabilidad de que en la siguiente semana las ventas se desvíen del promedio a lo
más en 800 nuevos soles?
Solución
Sea la variable aleatoria X = Las ventas semanales (en miles de nuevos soles) en un restaurante.
5,12;5,2~ b aUX
a. Si el restaurante necesita vender como mínimo 5000 nuevos soles para cubrir sus gastos, de-termine la probabilidad de que en una semana cualquiera no pueda cubrir sus gastos.
La probabilidad pedida es 25,00,10
5,25 XP
b. ¿Cuál es la probabilidad de que en la siguiente semana las ventas se desvíen del promedio a lo
más en 800 nuevos soles?
La probabilidad pedida es: 16,00,10
6,13,87,6 XP
Ejercicio 60
La empresa Almacenes Unidos se encarga de la distribución de cierto producto a los supermercados de Lima. El tiempo que transcurre entre la recepción del pedido y su entrega es una variable aleato-ria que se distribuye uniformemente entre 18 y 36 minutos. a. Determine la probabilidad de que el tiempo que transcurre entre la recepción del pedido y su
entrega sea a lo más en de media hora. b. Determine la probabilidad de que el tiempo que transcurre entre la recepción del pedido y su
entrega esté comprendido entre 20 y 30 minutos. c. Determine la probabilidad de que el tiempo que transcurre entre la recepción del pedido y su
entrega sea por más de 25 minutos.
Solución
La variable en estudio es ……………………………………………………………….…..….. Sus parámetros son: a = ……………………..………. , b = ………………………………….
176 Estadística Básica con Aplicaciones en Excel 2010
a. Determine la probabilidad de que el tiempo que transcurre entre la recepción del pedido y su
entrega sea a lo más media hora.
La probabilidad pedida es …………………........ cuyo valor es ………………..…………… b. Determine la probabilidad de que el tiempo que transcurre entre la recepción del pedido y su
entrega esté comprendido entre 20 y 30 minutos.
La probabilidad pedida es …………………........ cuyo valor es ………………..…………… c. Determine la probabilidad de que el tiempo que transcurre entre la recepción del pedido y su
entrega sea por más de 25 minutos.
La probabilidad pedida es …………………........ cuyo valor es ………………..……………
Capítulo 4. Variable aleatoria y distribución de probabilidad 177
Distribución normal
Función de densidad
2
2
1
2
1
x
exf
Se dice que la variable aleatoria X sigue una distribución normal con parámetros media y va-
rianza 2.
Se denota X N (, 2)
Características
La función de densidad tiene forma de campana y es simétrica, por lo que las medidas de ten-dencia central coinciden.
El rango de la variable normal es toda la recta real, esto es, de – a + .
Estandarización
Se toma como referencia una distribución normal estándar ( = 0 y 2 = 1). Se trabaja con la distan-
cia entre x y en función de la desviación estándar, tal como se muestra.
XZ
178 Estadística Básica con Aplicaciones en Excel 2010
Distribución normal en Excel
En Excel 2010, use la función:
P(X ≤ x)=DISTR.NORM.N(x, media, desviación estándar, acumulado)
k =INV.NORM(α, media, desviación estándar), tal que P(X ≤ k) = α Ejemplo 42 En un proceso fotográfico, el tiempo de revelado de las impresiones puede considerarse una varia-ble aleatoria con distribución normal con media 16,28 segundos y desviación estándar de 0,12 se-gundos. a. Si se elige una impresión al azar, calcule la probabilidad de que el tiempo de revelado sea me-
nor de 16,55 segundos. b. Calcule el tiempo máximo de impresión para ser considerada en el grupo del 10% con los me-
nores tiempos de revelados.
Solución
a. Sea la variable aleatoria X =tiempo de revelado de las impresiones (en segundos), entonces
X N( = 16,28; 2 = 0,122)
En Excel 2010, use la función =DISTR.NORM.N(16,55, 16.28, 0.12, 1) = 0,9878
La probabilidad pedida es 9878,055,16 XP
b. El tiempo máximo de impresión para ser considerada en el grupo del 10% con los menores
tiempos de revelados cumple que 10,0 kXP
En Excel 2010, use la función =INV.NORM(0,1, 16.28, 0.12); de donde, k = 16,13 segundos.
Ejercicio 61
El consumo mensual de energía eléctrica en KW de una ciudad tiene distribución normal con media
de 140 KW, con una desviación estándar de 20 KW.
a. ¿Cuál es la probabilidad que un hogar tenga un consumo menor de 150 KW? b. ¿Qué porcentaje de hogares registran un consumo entre 115 y 160 KW? c. Calcule el consumo mínimo de energía eléctrica para pertenecer al 15% de los mayores consu-
midores.
Solución
La variable en estudio es …...…………………………………………………………………….……..
Sus parámetros son: = ……………………..………. y 2 = ………………………………..……. a. La probabilidad pedida es …………………..……........ cuyo valor es …………….……
b. La probabilidad pedida es …………………..……........ cuyo valor es …………….…… c. El percentil a calcular es …………………..………...... cuyo valor es ……………………
Capítulo 4. Variable aleatoria y distribución de probabilidad 179
Distribución Función de probabilidad o
función de densidad Rango E(X) V(X)
Binomial xnxnx ppCxf
1 0, 1, 2, . . ., n np pnp 1
Hipergeométrica Nn
rNxn
rx
C
CCxf
)(
,min,...,
)(,0max
rn
rNn
N
rn
11
N
nN
N
r
N
rn
Poisson !
)(x
exf
x 0, 1, 2, 3, ... .t .t 2
Uniforme ab
xf
1
a ≤ x ≤ b 2
ba
12
2ab
Normal
2
2
1
2
1
x
exf Toda la recta real 2
180 Estadística Básica con Aplicaciones en Excel 2010
Ejercicios de aplicación
1. La llegada de cada uno de los empleados a su centro de labores se produce independiente-
mente, de acuerdo con la distribución uniforme en el intervalo de 8:00 a 8:25 am.
a. Calcule la probabilidad de que un empleado llegue a su centro de labores después de las 8:17 am. Rpta: 8/25
b. Si le informan que un empleado llegó después de 8:17 am, calcule la probabilidad de que haya llegado entre las 8:18 y las 8:20 am. Rpta: 2/8
2. La cantidad de productos (demanda diaria de cierto producto) que se vende en una distribui-
dora tiene distribución uniforme en el intervalo [5000, 8000]. Para la venta diaria esta distri-
buidora debe almacenar el producto al inicio del día. Determine la cantidad que se debe alma-
cenar de modo que el 1% de días esta distribuidora no pueda satisfacer la demanda.
Rpta: 7 970
3. Asuma que los ingresos mensuales, en nuevos soles, de los trabajadores del sector público
están distribuidos uniformemente con parámetros a y b. Si se sabe que el ingreso promedio
mensual es 1350 nuevos soles y la varianza es 123002 nuevos soles2.
a. Determine los parámetros de la distribución. Rpta: a = 1200, b = 1500 b. Calcule la probabilidad de que un trabajador elegido al azar tenga un ingreso mensual entre
1350 y 1520 nuevos soles. Rpta: 170/300 4. Actualmente se está realizando una auditoria a los dos bancos financieros que operan en una
ciudad norteña a los que llamaremos Alfa y Beta. Se ha determinado que el banco Alfa tiene el
65% de clientes y Beta el resto. Además, los depósitos bancarios de Alfa tienen distribución uni-
forme entre 1500 y 5000 dólares mensuales, mientras que los depósitos bancarios de Beta tie-
nen distribución normal con media de 3000 dólares y desviación estándar 1800 dólares por mes.
Si los auditores encargados tienen a disposición los depósitos bancarios de ambos bancos y eli-
gen uno al azar, determine:
a. La probabilidad de que dicho depósito exceda los 3500 dólares. Rpta: 0,4153 b. Si el depósito bancario elegido excede los 3500 dólares, determine la probabilidad de que
dicho depósito pertenezca al banco Beta. Rpta: 0,3292
5. Una máquina llena recipientes con determinado producto. Se sabe que la media y desviación
estándar para los pesos de llenado, de acuerdo con datos históricos, son 18,123 onzas y 0,6 on-
zas. El peso de llenado se modelo mediante una variable aleatoria normal.
a. Si se selecciona un recipiente al azar, ¿cuál es la probabilidad que su peso sea mayor a 16 onzas pero menor o igual que 20 onzas? Rpta: 0,9989
b. ¿Cuál es el peso máximo de un recipiente para estar considerado dentro del 25% de los re-cipientes menos pesados? Rpta: 17,72 onzas
6. El salario semanal que percibe un trabajador de una empresa dedicada a la construcción civil se
distribuye normalmente con una media de 900 nuevos soles y desviación estándar de 100 nue-
vos soles.
a. ¿Cuál es la probabilidad de que un trabajador elegido al azar tenga un salario semanal me-nor de 910 nuevos soles? Rpta: 0,5398
b. El 10% de los trabajadores de esta empresa son jefes de cuadrillas y son los mejores paga-dos. ¿Cuál es salario mínimo de un jefe de cuadrilla? Rpta: 1028,16 nuevos soles
Capítulo 4. Variable aleatoria y distribución de probabilidad 181
7. Perubank, es una institución bancaria que proporciona una amplia gama de servicios financieros,
que comprende todo tipo de depósitos, prestamos, hipotecas, seguros, entre otros servicios de inversión, todos dentro del marco de una estrategia única. Se ha determinado que un cliente de Perubank con una buena historia crediticia tiene una deuda que se distribuye normalmente con promedio de 15015 soles y una desviación estándar de 3540 soles. a. Si se selecciona a un cliente con buena historia crediticia, ¿cuál es la probabilidad de que el
monto de su deuda se encuentre entre 12000 y 18000 soles? Rpta: 0,6033 b. La gerencia de Perubank ha determinado amonestar a los clientes que hayan alcanzado
deudas muy altas al final del mes. Determine el valor de la deuda mínima a partir del cual se amoneste al 11% de los clientes con deudas muy altas. Rpta: 19357
8. Suponga que el tiempo utilizado en revisar sugerencias y comentarios de los clientes tiene dis-tribución normal con media de 8,5 horas y una desviación estándar de 2,5 horas.
a. Calcule la probabilidad de que el tiempo sea mayor a 7,5 horas Rpta: 0,65542 b. Determine el tiempo mínimo que emplea un ejecutivo para atender al 15,38% de los
clientes que tienen muchas dudas, lo que implica que dedican más tiempo en consultas. Rpta: 11,05 minutos
9. El tiempo que demoran en atender a un cliente en la ventanilla de una empresa financiera se
considera una variable aleatoria que tiene distribución uniforme con media 6,5 minutos y va-rianza 3 minutos2. Calcule la probabilidad de demorar en atender a un cliente entre 5 y 7 minu-tos. Rpta: 0,33
10. Así como el uso de redes sociales tiene ventajas para las empresas, también se presentan ries-
gos. El valor medio de las pérdidas se estima en 15 mil soles. Si esta variable se considera uni-
formemente distribuida con varianza
mil soles2. Determine la probabilidad de que una em-
presa haya registrado una pérdida superior de 14,2 miles de soles. Rpta: 0,66
Capítulo 5. Muestreo 183
Capítulo 5 Muestreo
Unidad elemental
Es el objeto sobre el cual se hace la medición. También es llamada unidad de observación, unidad de análisis, unidad estadística, caso o elemento. Por ejemplo, en estudios de poblaciones humanas, con frecuencia ocurre que la unidad elemental es cada individuo.
Población muestreada
Es el conjunto de todas las unidades de elementales posibles que podrían extraerse en una mues-tra; es decir, es la población de donde se extrae la muestra.
Unidad de muestreo
Es la unidad donde realizamos la muestra. Por ejemplo, podríamos querer estudiar a las personas, pero no tenemos una lista de todos los individuos que pertenecen a la población objetivo. En vez de eso, la unidad de muestreo es cada familia y la unidad elemental es cada individuo que vive en una familia.
Marco muestral
Es una lista de las unidades de muestreo que están disponibles para elección.
Ejemplo
Para las encuestas telefónicas el marco de muestreo podría ser una lista de todos los números tele-fónicos residenciales de la ciudad; para las entrevistas personales una lista de las direcciones de todas las calles; para una encuesta de agricultura una lista de todas las granjas o un mapa con todas las áreas que contienen granjas.
Ejemplo
184 Estadística Básica con Aplicaciones en Excel 2010
Censo
Es el estudio completo de todas unidades elementales de la población.
Muestreo
Un estudio estadístico se inicia con la selección de una muestra, este proceso recibe el nombre de muestreo el cual comprende por lo menos dos etapas:
La selección de las unidades
El registro de las observaciones.
Ejemplo
Niveles socioeconómicos en Lima Metropolitana y Callao Asociación Peruana de Empresas de Investigación de Mercados (APEIM)
Miraflores, Abril de 2005 Ficha técnica Universo de estudio Se consideró como universo de estudio a todos los hogares pertenecientes a Lima Metropolitana entendi-da como los distritos de Lima ubicados en el núcleo urbano (sin considerar balnearios) y la Provincia Consti-tucional del Callao. Se definió como hogar, al conjunto de personas que, habitando en la misma vivienda, preparan y consu-men sus alimentos en común. La persona informante fue el jefe de familia, definido como aquella persona que más aporta económica-mente en el hogar. Marco muestral Para el desarrollo de la investigación se consideró como marco muestral:
La base de datos de viviendas del Instituto Nacional de Estadística e Informática (INEI).
Actualización mediante aplicación de rastreo de campo efectuada por APEIM en las zonas de mayor crecimiento de la ciudad (conos)
Tamaño de la muestra Se entrevistó a un total de 3 598 hogares distribuidos en 41 distritos. El margen de error máximo probable con un nivel de confianza del 95,1 % y considerando el máximo de dispersión (p = q = 50%) fue de ± 1,63%. Dentro de esta muestra se realizaron 200 entrevistas en Distritos con predominio de los N.S.E. Muy Al-to/Alto con el propósito de obtener una submuestra estadísticamente significativa para este segmento. El total de entrevistas fue desagregado proporcionalmente a la distribución poblacional de cada uno de los distritos de Lima Metropolitana. Selección de la muestra Determinada la cantidad de entrevistas a aplicar por distrito, se procedió a sortear tantas manzanas como entrevistas se requerían. Dentro de cada manzana se seleccionó por un sistema aleatorio simple cinco viviendas: una titular y cuatro reemplazos o suplentes. Los hogares originalmente seleccionados (titulares), fueron visitados hasta en tres oportunidades antes de proceder al reemplazo. Se controló que la tasa de reemplazo no excediera el 10% del total de entrevistas originalmente sorteadas.
Capítulo 5. Muestreo 185
Muestreo probabilístico
En el muestreo probabilístico, la selección de cada elemento de la muestra se hace siguiendo reglas matemáticas de decisión. Todos los elementos de la población tienen una probabilidad real y cono-cida de ser seleccionados. Existen diversos métodos de muestreo probabilístico, como por ejemplo:
Muestreo aleatorio simple
En este procedimiento, se selecciona una muestra en forma aleatoria y sin reemplazo a n unidades de muestreo de una población que contiene un total de N unidades. Se garantiza que cada una de las muestras posibles tiene la misma probabilidad de ser elegida.
Pasos a seguir para seleccionar una muestra simple aleatoria
1. Enumere las unidades del marco muestral con números sucesivos.
2. Seleccione tantos elementos del marco muestral como sea el tamaño requerido de la muestra, usando una tabla de números aleatorios.
El muestreo aleatorio simple presenta dos propiedades:
Representativa: Cada unidad tiene las mismas posibilidades de ser escogida.
Independencia: La selección de una unidad no influye en la selección de otras unidades.
Pero en el mundo real es difícil encontrar muestras completamente independientes y representati-vas. Por ejemplo, hacer una encuesta a los votantes marcando números de teléfono al azar es un método no representativo pues no tiene en cuenta a los votantes que no disponen de teléfono y cuenta varias veces a los que tienen varios números.
Muestreo aleatorio simple
•Se selecciona una muestra en forma aleatoria y sin reemplazo a n unidades de muestreo de una población que contiene un total de N unidades.
•Se garantiza que cada una de las muestras posibles tiene la misma probabilidad de ser elegida.
Muestreo sistemático
•Se selecciona un primer elemento aleatoriamente y, luego, los demás elementos que conformarán la muestra cada cierto intervalo.
•Este muestreo supone que se cuenta con una enumeración completa de los elementos de la población.
Muestreo estratificado
•Se selecciona la muestra de los diversos estratos. Un estrato es una parte de la población, cuyos elementos tienen características similares.
•El objetivo de estratificar la población es buscar homogeneidad entre los estratos.
186 Estadística Básica con Aplicaciones en Excel 2010
Ejercicio 62
Una empresa de consumo tiene un total de 150 trabajadores y ha registrado en el cuadro siguiente, información acerca del ingreso mensual (en nuevos soles) y años cumplidos en la empresa de cada uno de sus trabajadores.
Trabajadores registrados
Nº Ingreso
(en soles) Años en la empresa
Nº Ingreso
(en soles) Años en la empresa
Nº Ingreso
(en soles) Años en la empresa
1 2300 5
51 2100 13
101 2400 16
2 2800 11
52 2100 9
102 1700 0
3 2400 4
53 1800 1
103 2500 12
4 2500 2
54 2000 9
104 1700 3
5 2300 3
55 2100 10
105 2400 17
6 2100 2
56 1900 4
106 2400 16
7 1700 2
57 2000 10
107 1900 7
8 2000 0
58 2300 11
108 1700 1
9 2200 7
59 2000 7
109 2100 6
10 2100 4
60 1700 1
110 2000 5
11 1700 0
61 1900 6
111 2000 3
12 2500 2
62 2000 9
112 2500 13
13 2800 13
63 2400 17
113 1700 0
14 2400 9
64 1700 0
114 2500 19
15 1700 1
65 1700 2
115 1700 3
16 2400 9
66 2400 17
116 2600 19
17 2200 10
67 2500 13
117 1600 1
18 2200 4
68 2600 16
118 1800 6
19 2300 10
69 2100 14
119 2100 10
20 2800 11
70 1900 7
120 1700 0
21 2100 7
71 2000 9
121 2400 16
22 1700 1
72 1800 7
122 2600 17
23 2500 6
73 2100 10
123 2100 10
24 2400 9
74 2300 12
124 2100 8
25 2700 17
75 2700 20
125 2400 17
26 1700 0
76 2800 20
126 1700 1
27 1600 2
77 1800 3
127 2600 20
28 2600 17
78 1700 5
128 2400 16
29 2500 13
79 1700 4
129 2700 17
30 2500 16
80 1700 0
130 2100 12
31 2700 17
81 1700 1
131 1600 0
32 1700 1
82 2100 6
132 2100 15
33 1600 1
83 2600 17
133 1900 5
34 2400 11
84 2400 9
134 2100 12
35 1900 3
85 2600 19
135 2200 12
36 1800 5
86 1900 7
136 2400 13
37 1800 3
87 1600 0
137 1800 4
38 2400 14
88 1900 3
138 2600 17
39 2600 16
89 2100 14
139 2700 20
40 2700 18
90 1700 0
140 2500 16
41 2100 11
91 2100 15
141 2500 16
42 2300 14
92 1700 1
142 1900 6
43 1700 0
93 2300 14
143 2100 15
44 2200 13
94 2500 16
144 1700 9
45 2900 20
95 2600 18
145 1500 0
46 1800 5
96 1900 3
146 1800 18
47 2100 16
97 2500 19
147 2100 10
Capítulo 5. Muestreo 187
48 2000 12
98 1800 6
148 2700 19
49 2000 12
99 1700 2
149 1800 9
50 2900 20
100 2000 10
150 2100 15
a. Seleccione una muestra de 15 trabajadores usando muestreo simple aleatorio. Use las colum-nas C4, C8, C11 y C15 de la tabla de números aleatorios.
Solución
Seleccionemos tantos elementos del marco muestral como sea el tamaño requerido de la muestra. Como el marco muestral tiene 150 elementos usemos las columnas C4, C5 y C6, para elegir números de tres cifras y luego C8, C9 y C10.
Tabla de números aleatorios C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20 4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9 9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0 0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4 9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4 1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9 2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7 6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7 1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8 4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9 0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6 7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4 4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4 6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5 9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8 1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5 0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5 3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0 9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1 5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1 8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8 0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3 9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8 6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8 7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7 3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0 9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6 4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0 8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8 4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8 6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4 2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6 2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6 5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0 9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4 8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3 1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9 5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3 8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1 3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8
Los elementos seleccionados son:
Posición 114 81 134 148 39 97 105 98 126 64 109 122 142 145 149
188 Estadística Básica con Aplicaciones en Excel 2010
b. Seleccione una muestra de diez trabajadores usando muestreo simple aleatorio. Use las colum-nas C11, C6, C1 y C9 de la tabla de números aleatorios.
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20 4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9 9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0 0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4 9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4 1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9 2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7 6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7 1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8 4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9 0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6 7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4 4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4 6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5 9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8 1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5 0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5 3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0 9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1 5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1 8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8 0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3 9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8 6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8 7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7 3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0 9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6 4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0 8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8 4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8 6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4 9 2 0 9 8 2 8 3 4 3 2 8 9 4 8 7 9 4 9 4 1 3 7 9 4 8 3 7 0 8 6 6 6 8 4 1 1 3 1 3 3 3 2 5 6 7 6 1 6 6 1 7 6 5 8 1 6 2 2 7 9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 8 6 1 4 4 1 7 5 4 0 9 5 7 8 7 5 0 8 6 6 2 5 3 2 3 2 7 1 7 8 8 3 8 6 9 9 2 7 4 5 9 5 6 6 6 6 0 9 2 6 1 5 1 2 3 1 8 1 2 0 8 6 4 4 0 3 3 6 3 4 9 6 4 4 9 8 5 7 3 3 4 2 3 2 8 0 1 9 7 9 7 9 4 4 1 6 6 7 7 0 7 9 8 6 8 4 7 1 5 3 7 0 9 2 5 2 1 0 0 4 0 4 6 8 8 7 8 9 9 6 8 5 6 8 1 9 2 7 5 1 7 0 1 5 5 2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6 2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6 5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0 9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4 8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3 1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9 5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3 8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1 3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8
Los elementos seleccionados son: Posición
Capítulo 5. Muestreo 189
Muestreo sistemático
En el muestreo sistemático se elige un elemento del marco muestral cada cierto intervalo. Este muestreo supone que se cuenta con una enumeración completa de los elementos de la población.
Procedimiento para seleccionar una muestra sistemática
1. Calcule el valor de k, donde n
Nk . El valor de k se redondea al valor del entero menor.
2. Seleccione aleatoriamente un número entero entre 1 y k llamado arranque aleatorio (A) 3. A partir de este número elegido, seleccione el siguiente que ocupa la posición (A + k) del lista-
do del marco muestral y así sucesivamente hasta completar la muestra.
Ejemplo 43 Se tiene una población de 12 personas y se desea elegir a cuatro de ellas mediante un muestreo sistemático. ¿Cuál es el arranque aleatorio para este ejemplo? Use la columna C3, C6 y C12
Solución
Calculemos el valor de k, donde 34
12
n
Nk . El valor de k se redondea al valor del entero menor,
luego k = 3. Seleccionemos aleatoriamente un número entero entre 1 y k = 3, llamado arranque aleatorio (A). Observando la columna C3 de la tabla de números aleatorios tenemos que A = 2.
Tabla de números aleatorios
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20 4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9 9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0 0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
A partir de este número elegido, seleccionemos el dato que ocupa la posición (A + k), es decir la quinta posición (3 + 2 = 5) del listado del marco muestral y así sucesivamente hasta completar la muestra. Es decir, elegiremos los datos de las posiciones 2, 5, 8 y 11.
190 Estadística Básica con Aplicaciones en Excel 2010
Ejemplo 44 Se tiene una población de 15 personas y se desea elegir a seis de ellas mediante un muestreo sis-temático. ¿Cuál es el arranque aleatorio para este ejemplo? Use la columna C4, C8 y C1
Solución
Calculemos el valor de k, donde 5,26
15
n
Nk . El valor de k se redondea al valor del entero me-
nor, luego k = 2. Seleccionemos aleatoriamente un número entero entre 1 y k = 2, llamado arranque aleatorio (A). Observando la columna C4 de la tabla de números aleatorios tenemos que A = 1.
Tabla de números aleatorios C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20 4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9 9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0 0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4 9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4 1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9 2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
A partir de este número elegido, seleccionemos el dato que ocupa la posición (A + k), es decir la tercera posición (1 + 2 = 3) del listado del marco muestral y así sucesivamente hasta completar la muestra. Es decir, elegiremos los datos de las posiciones 1, 3, 5, 7, 9 y 11. Ejemplo 45 Se tiene información de 40 personas de un barrio de Lima Metropolitana. Obtenga una muestra aleatoria de ocho personas usando el muestreo sistemático y elabore una tabla con los elementos seleccionados. Utilice las columnas C8; C10; C11 de la tabla de números aleatorios.
Individuos registrados Nº Sexo Edad Estatura Nº Sexo Edad Estatura Nº Sexo Edad Estatura
1 Mujer 15 154 15 Mujer 19 178 29 Hombre 33 147
2 Hombre 16 154 16 Mujer 30 163 30 Hombre 17 167
3 Hombre 21 156 17 Hombre 29 180 31 Mujer 34 69
4 Mujer 31 184 18 Mujer 25 174 32 Mujer 20 76
5 Hombre 21 173 19 Hombre 29 137 33 Mujer 26 74
6 Mujer 24 170 20 Hombre 25 153 34 Hombre 25 90
7 Hombre 32 176 21 Mujer 16 168 35 Mujer 23 164
8 Hombre 26 188 22 Hombre 31 161 36 Hombre 20 164
9 Mujer 21 169 23 Hombre 18 270 37 Mujer 34 176
10 Mujer 22 173 24 Hombre 21 173 38 Hombre 35 188
11 Hombre 18 177 25 Hombre 31 187 39 Mujer 30 155
12 Hombre 25 181 26 Mujer 28 161 40 Mujer 29 141
13 Mujer 29 164 27 Mujer 19 172
14 Hombre 25 159 28 Hombre 31 162
Solución
Calculemos el valor de k, donde 58
40
n
Nk
El valor de k se redondea al valor del entero menor, luego k = 5.
Capítulo 5. Muestreo 191
Seleccionemos aleatoriamente un número entero entre 1 y k = 5, llamado arranque aleatorio (A). Observando la columna C8 de la tabla de números aleatorios tenemos que A = 5.
Tabla de números aleatorios C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20 4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9 9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0 0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4 9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4 1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9 2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
A partir de este número elegido, seleccionemos el dato que ocupa la posición (A + k), es decir la décima posición (5+5 = 10) del listado del marco muestral y así sucesivamente hasta completar la muestra. Es decir, elegiremos los datos de las posiciones 5, 10, 15, 20, 25, 30, 35 y 40. Los elementos seleccionados son:
Posición 5 10 15 20 25 30 35 40
Ejercicio 63
Una empresa de telecomunicaciones tiene un total de 150 empleados y ha registrado en la tabla que se muestra a continuación información acerca de las variables: ingreso mensual (en soles), nivel de educación y años cumplidos en la empresa.
Trabajadores registrados
Nº Ingreso (soles)
Nivel de Educación
Años en empresa
Nº Ingreso (soles)
Nivel de Educación
Años en empresa
Nº Ingreso (soles)
Nivel de Educación
Años en empresa
1 2300 Secundaria 5
51 2100 Técnica 13
101 2400 Técnica 16
2 2800 Secundaria 11
52 2100 Técnica 9
102 1700 Técnica 0
3 2400 Secundaria 4
53 1800 Técnica 1
103 2500 Técnica 12
4 2500 Secundaria 2
54 2000 Técnica 9
104 1700 Técnica 3
5 2300 Secundaria 3
55 2100 Técnica 10
105 2400 Técnica 17
6 2100 Secundaria 2
56 1900 Técnica 4
106 2400 Técnica 16
7 1700 Secundaria 2
57 2000 Técnica 10
107 1900 Técnica 7
8 2000 Secundaria 0
58 2300 Técnica 11
108 1700 Técnica 1
9 2200 Secundaria 7
59 2000 Técnica 7
109 2100 Técnica 6
10 2100 Secundaria 4
60 1700 Técnica 1
110 2000 Técnica 5
11 1700 Secundaria 1
61 1900 Técnica 6
111 2000 Superior 3
12 2500 Secundaria 2
62 2000 Técnica 9
112 2500 Superior 13
13 2800 Secundaria 13
63 2400 Técnica 17
113 1700 Superior 0
14 2400 Secundaria 9
64 1700 Técnica 0
114 2500 Superior 19
15 1700 Secundaria 1
65 1700 Técnica 2
115 1700 Superior 3
16 2400 Secundaria 9
66 2400 Técnica 17
116 2600 Superior 19
17 2200 Secundaria 10
67 2500 Técnica 13
117 1600 Superior 1
18 2200 Secundaria 4
68 2600 Técnica 16
118 1800 Superior 6
19 2300 Secundaria 10
69 2100 Técnica 14
119 2100 Superior 10
20 2800 Secundaria 11
70 1900 Técnica 7
120 1700 Superior 0
21 2100 Secundaria 7
71 2000 Técnica 9
121 2400 Superior 16
22 1700 Secundaria 1
72 1800 Técnica 7
122 2600 Superior 17
23 2500 Secundaria 6
73 2100 Técnica 10
123 2100 Superior 10
24 2400 Secundaria 9
74 2300 Técnica 12
124 2100 Superior 8
25 2700 Secundaria 17
75 2700 Técnica 20
125 2400 Superior 17
26 1700 Secundaria 0
76 2800 Técnica 20
126 1700 Superior 1
192 Estadística Básica con Aplicaciones en Excel 2010
27 1600 Secundaria 2
77 1800 Técnica 3
127 2600 Superior 20
28 2600 Secundaria 17
78 1700 Técnica 5
128 2400 Superior 16
29 2500 Secundaria 13
79 1700 Técnica 4
129 2700 Superior 17
30 2500 Secundaria 16
80 1700 Técnica 0
130 2100 Superior 12
31 2700 Secundaria 17
81 1700 Técnica 1
131 1600 Superior 0
32 1700 Secundaria 1
82 2100 Técnica 6
132 2100 Superior 15
33 1600 Secundaria 1
83 2600 Técnica 17
133 1900 Superior 5
34 2400 Secundaria 11
84 2400 Técnica 9
134 2100 Superior 12
35 1900 Secundaria 3
85 2600 Técnica 19
135 2200 Superior 12
36 1800 Secundaria 5
86 1900 Técnica 7
136 2400 Superior 13
37 1800 Secundaria 3
87 1600 Técnica 0
137 1800 Superior 4
38 2400 Secundaria 14
88 1900 Técnica 3
138 2600 Superior 17
39 2600 Secundaria 16
89 2100 Técnica 14
139 2700 Superior 20
40 2700 Secundaria 18
90 1700 Técnica 0
140 2500 Superior 16
41 2100 Técnica 11
91 2100 Técnica 15
141 2500 Superior 16
42 2300 Técnica 14
92 1700 Técnica 1
142 1900 Superior 6
43 1700 Técnica 0
93 2300 Técnica 14
143 2100 Superior 15
44 2200 Técnica 13
94 2500 Técnica 16
144 1700 Superior 9
45 2900 Técnica 20
95 2600 Técnica 18
145 1500 Superior 0
46 1800 Técnica 5
96 1900 Técnica 3
146 1800 Superior 18
47 2100 Técnica 16
97 2500 Técnica 19
147 2100 Superior 10
48 2000 Técnica 12
98 1800 Técnica 6
148 2700 Superior 19
49 2000 Técnica 12
99 1700 Técnica 2
149 1800 Superior 9
50 2900 Técnica 20
100 2000 Técnica 10
150 2100 Superior 15
Aplique el muestreo sistemático para seleccionar una muestra de ocho empleados. Elabore un lis-tado con el número seleccionado. Utilice la columna C7, C10, y C15 de la tabla de números aleatorios.
Solución
Calculemos el valor de k, donde n
Nk ………………………...
El valor de k se redondea al valor del entero menor, luego k = ……………..…….. Seleccionemos aleatoriamente un número entero entre 1 y k, llamado arranque aleatorio (A). Observando la columna C7 y C8 de la tabla de números aleatorios tenemos que A = …………….....
Tabla de números aleatorios C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20 4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9 9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0 0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4 9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4 1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9 2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7 6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7 1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
A partir de este número elegido, seleccionemos el dato que ocupa la posición (A + k) del listado del marco muestral y así sucesivamente hasta completar la muestra. Los elementos seleccionados son:
Posición
Capítulo 5. Muestreo 193
Tabla de números aleatorios
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20 4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9 9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0 0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4 9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4 1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9 2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7 6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7 1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8 4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9 0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6 7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4 4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4 6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5 9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8 1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5 0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5 3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0 9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1 5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1 8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8 0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3 9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8 6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8 7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7 3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0 9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6 4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0 8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8 4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8 6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4 9 2 0 9 8 2 8 3 4 3 2 8 9 4 8 7 9 4 9 4 1 3 7 9 4 8 3 7 0 8 6 6 6 8 4 1 1 3 1 3 3 3 2 5 6 7 6 1 6 6 1 7 6 5 8 1 6 2 2 7 9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 8 6 1 4 4 1 7 5 4 0 9 5 7 8 7 5 0 8 6 6 2 5 3 2 3 2 7 1 7 8 8 3 8 6 9 9 2 7 4 5 9 5 6 6 6 6 0 9 2 6 1 5 1 2 3 1 8 1 2 0 8 6 4 4 0 3 3 6 3 4 9 6 4 4 9 8 5 7 3 3 4 2 3 2 8 0 1 9 7 9 7 9 4 4 1 6 6 7 7 0 7 9 8 6 8 4 7 1 5 3 7 0 9 2 5 2 1 0 0 4 0 4 6 8 8 7 8 9 9 6 8 5 6 8 1 9 2 7 5 1 7 0 1 5 5 2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6 2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6 5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0 9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4 8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3 1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9 5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3 8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1 3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8
194 Estadística Básica con Aplicaciones en Excel 2010
Muestreo estratificado
Estratificar significa dividir a la población en varias partes de acuerdo con ciertas características de sus elementos. El objetivo de estratificar la población es buscar homogeneidad entre los estratos.
Pasos a seguir para seleccionar una muestra estratificada
1. Divida a la población en estratos que sean mutuamente excluyentes. Esto es, que incluyan a
todos los elementos de la población y que cada elemento pertenezca solamente a un estrato.
2. Calcule la cantidad de elementos a seleccionar en cada estrato.
3. Seleccione muestras aleatorias simples para cada uno de los estratos.
Recomendaciones para el uso de muestras estratificadas
Si se tiene que usar más de una variable para formar los estratos, cuidar que estas no estén relacionadas entre sí.
No se deben considerar la formación de muchos estratos, generalmente se usan entre tres y ocho estratos.
Los estratos pequeños no contribuyen mucho a la reducción del error, por lo tanto pueden no ser considerados.
Capítulo 5. Muestreo 195
Ejemplo 46 La empresa de telecomunicaciones RTV tiene 120 empleados de los cuales tiene información de las variables: ingreso en soles, nivel de educación y años en la empresa.
Nº Ingreso
(en soles)
Nivel de educación
Años cumplidos
en la empresa Nº
Ingreso (en
soles)
Nivel de educación
Años cumplidos
en la empre-sa
Nº Ingreso
(en soles)
Nivel de educación
Años cumplidos
en la empresa
1 2300 Secundaria 5
41 2100 Técnica 13
81 2000 Superior 3
2 2800 Secundaria 11
42 2100 Técnica 9
82 2500 Superior 13
3 2400 Secundaria 4
43 1800 Técnica 1
83 1700 Superior 0
4 2500 Secundaria 2
44 2000 Técnica 9
84 2500 Superior 19
5 2300 Secundaria 3
45 2100 Técnica 10
85 1700 Superior 3
6 2100 Secundaria 2
46 1900 Técnica 4
86 2600 Superior 19
7 1700 Secundaria 2
47 2000 Técnica 10
87 1600 Superior 1
8 2000 Secundaria 0
48 2300 Técnica 11
88 1800 Superior 6
9 2200 Secundaria 7
49 2000 Técnica 7
89 2100 Superior 10
10 2100 Secundaria 4
50 1700 Técnica 1
90 1700 Superior 0
11 1700 Secundaria 0
51 1700 Técnica 1
91 2400 Superior 16
12 2500 Secundaria 2
52 2100 Técnica 6
92 2600 Superior 17
13 2800 Secundaria 13
53 2600 Técnica 17
93 2100 Superior 10
14 2400 Secundaria 9
54 2400 Técnica 9
94 2100 Superior 8
15 1700 Secundaria 1
55 2600 Técnica 19
95 2400 Superior 17
16 2400 Secundaria 9
56 1900 Técnica 7
96 1700 Superior 1
17 2200 Secundaria 10
57 1600 Técnica 0
97 2600 Superior 20
18 2200 Secundaria 4
58 1900 Técnica 3
98 2400 Superior 16
19 2300 Secundaria 10
59 2100 Técnica 14
99 2700 Superior 17
20 2800 Secundaria 11
60 1700 Técnica 0
100 2100 Superior 12
21 2100 Secundaria 7
61 2100 Técnica 15
101 1600 Superior 0
22 1700 Secundaria 1
62 1700 Técnica 1
102 2100 Superior 15
23 2500 Secundaria 6
63 2300 Técnica 14
103 1900 Superior 5
24 2400 Secundaria 9
64 2500 Técnica 16
104 2100 Superior 12
25 2700 Secundaria 17
65 2600 Técnica 18
105 2200 Superior 12
26 1700 Secundaria 0
66 1900 Técnica 3
106 2400 Superior 13
27 1600 Secundaria 2
67 2500 Técnica 19
107 1800 Superior 4
28 2600 Secundaria 17
68 1800 Técnica 6
108 2600 Superior 17
29 2500 Secundaria 13
69 1700 Técnica 2
109 2700 Superior 20
30 2500 Secundaria 16
70 2000 Técnica 10
110 2500 Superior 16
31 2100 Técnica 11
71 2400 Técnica 16
111 2500 Superior 16
32 2300 Técnica 14
72 1700 Técnica 0
112 1900 Superior 6
33 1700 Técnica 0
73 2500 Técnica 12
113 2100 Superior 15
34 2200 Técnica 13
74 1700 Técnica 3
114 1700 Superior 9
35 2900 Técnica 20
75 2400 Técnica 17
115 1500 Superior 0
36 1800 Técnica 5
76 2400 Técnica 16
116 1800 Superior 18
37 2100 Técnica 16
77 1900 Técnica 7
117 2100 Superior 10
38 2000 Técnica 12
78 1700 Técnica 1
118 2700 Superior 19
39 2000 Técnica 12
79 2100 Técnica 6
119 1800 Superior 9
40 2900 Técnica 20
80 2000 Técnica 5
120 2100 Superior 15
Aplique el muestreo estratificado para seleccionar una muestra de 16 empleados. Use como varia-ble de estratificación el nivel educacional. Elabore un listado identificando el número de dato selec-cionado. Para el estrato 1 use las columnas C1, C3 y C5, para el estrato 2 use las columnas C8, C9, C10 y C11 y para el estrato 3 use las columnas C4, C3, C5 y C7.
196 Estadística Básica con Aplicaciones en Excel 2010
Solución
Se divide a la población en estratos que sean mutuamente excluyentes, luego los estratos 1, 2 y 3 son: secundaria, técnica y superior, respectivamente. Para cada uno de los estratos, seleccionamos muestras aleatorias simples.
Estratos Números de elemen-tos en el estrato Nh
Posiciones (desde – hasta)
Cantidad seleccionada por estrato nN
Nn h
h
1. Secundaria N1 = 30 1 – 30 416120
3011 n
N
Nn
2. Técnica N2 = 50 31 – 80 767,616120
5022 n
N
Nn
3. Superior N3 = 40 81 – 120 533,516120
4033 n
N
Nn
Total N = 120 n = 16
Para el estrato Secundaria, realizamos un muestreo aleatorio simple usando las columnas C1, C3 y C5. Observemos que las posiciones de los elementos a elegir están entre el 1 y el 30.
Tabla de números aleatorios
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20 4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9 9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0 0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4 9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4 1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9 2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7 6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7 1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
Luego, el cuadro con los datos elementos seleccionados para el estrato Secundaria es:
Estrato Secundaria Posición 2 16 29 13
Para el estrato Técnica, realizamos un muestreo aleatorio simple usando las columnas C8, C9, C10 y C11. Observemos que las posiciones de los elementos a elegir están entre el 31 y el 80.
Tabla de números aleatorios
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20 4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9 9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0 0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4 9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4 1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9 2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
Luego, el cuadro con los datos elementos seleccionados para el estrato Técnica es:
Estrato Técnica Posición 54 62 66 77 48 67 44
Capítulo 5. Muestreo 197
Para el estrato Superior, realizamos un muestreo aleatorio simple usando las columnas C4, C3, C5 y C7. Observemos que las posiciones de los elementos a elegir están entre el 81 y el 120.
Tabla de números aleatorios
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20 4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9 9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0 0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4 9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4 1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9 2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7 6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7 1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8 4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9 0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6 7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
Luego, el cuadro con los datos elementos seleccionados para el estrato Superior es:
Estrato Superior Posición 114 81 97 105 83
Ejercicio 64
La siguiente tabla muestra a los 120 alumnos de la especialidad de Administración, de la universi-dad El Saber, a quienes se les preguntó por su emisora radial preferida y por la cantidad de horas a la semana que la escucha. Posición Radio Horas Posición Radio Horas Posición Radio Horas
1 Estudio 92 6 41 Oxígeno 6 81 Oxígeno 4
2 Estudio 92 10 42 Oxígeno 6 82 Oxígeno 3
3 Estudio 92 4 43 Oxígeno 8 83 Oxígeno 3
4 Estudio 92 2 44 Oxígeno 9 84 Oxígeno 5
5 Estudio 92 3 45 Oxígeno 4 85 Oxígeno 5
6 Estudio 92 6 46 Oxígeno 6 86 Oxígeno 8
7 Estudio 92 7 47 Oxígeno 7 87 Planeta 7
8 Estudio 92 6 48 Oxígeno 9 88 Planeta 6
9 Estudio 92 8 49 Oxígeno 8 89 Planeta 9
10 Estudio 92 9 50 Oxígeno 10 90 Planeta 9
11 Estudio 92 11 51 Oxígeno 12 91 Planeta 4
12 Estudio 92 3 52 Oxígeno 9 92 Planeta 2
13 Estudio 92 4 53 Oxígeno 9 93 Planeta 11
14 Estudio 92 2 54 Oxígeno 8 94 Planeta 2
15 Estudio 92 6 55 Oxígeno 4 95 Planeta 3
16 Estudio 92 4 56 Oxígeno 6 96 Planeta 8
17 Estudio 92 9 57 Oxígeno 7 97 Planeta 6
18 Estudio 92 5 58 Oxígeno 8 98 Planeta 7
19 Estudio 92 2 59 Oxígeno 7 99 Planeta 9
20 Estudio 92 7 60 Oxígeno 3 100 Planeta 4
21 Estudio 92 4 61 Oxígeno 6 101 Planeta 8
22 Estudio 92 6 62 Oxígeno 9 102 Planeta 7
23 Estudio 92 7 63 Oxígeno 2 103 Planeta 7
198 Estadística Básica con Aplicaciones en Excel 2010
24 Estudio 92 8 64 Oxígeno 5 104 Planeta 9
25 Estudio 92 9 65 Oxígeno 1 105 Planeta 6
26 Estudio 92 10 66 Oxígeno 4 106 Planeta 7
27 Estudio 92 5 67 Oxígeno 7 107 Planeta 9
28 Estudio 92 4 68 Oxígeno 6 108 Planeta 8
29 Estudio 92 7 69 Oxígeno 7 109 Planeta 3
30 Estudio 92 8 70 Oxígeno 8 110 Planeta 11
31 Estudio 92 4 71 Oxígeno 4 111 Planeta 13
32 Oxígeno 6 72 Oxígeno 5 112 Planeta 14
33 Oxígeno 7 73 Oxígeno 3 113 Planeta 9
34 Oxígeno 5 74 Oxígeno 6 114 Planeta 8
35 Oxígeno 8 75 Oxígeno 5 115 Planeta 6
36 Oxígeno 9 76 Oxígeno 8 116 Planeta 5
37 Oxígeno 4 77 Oxígeno 7 117 Planeta 7
38 Oxígeno 5 78 Oxígeno 9 118 Planeta 3
39 Oxígeno 2 79 Oxígeno 10 119 Planeta 6
40 Oxígeno 9 80 Oxígeno 3 120 Planeta 5
Seleccione una muestra aleatoria de tamaño 12 mediante muestreo estratificado. Use la variable radio de su preferencia como variable de estratificación. Elabore un listado con el alumno seleccionado. Para el estrato 1 use las columnas C6, C4 y C2, para el estrato 2 use las columnas C15, C10, C2 y C11 y para el estrato 3 use las columnas C6, C17, C12; C4, C1, y C7.
Estrato Nh Posición
(desde – hasta) n
N
Nn h
h
Estudio 92
N1=
n1=
Oxígeno
N2=
n2=
Planeta
N3=
n3=
Total
Estrato 1: Estudio 92
Posición
Estrato 2: Oxígeno
Posición
Estrato 3: Planeta
Posición
Capítulo 5. Muestreo 199
Tabla de números aleatorios
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20 4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9 9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0 0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4 9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4 1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9 2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7 6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7 1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8 4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9 0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6 7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4 4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4 6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5 9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8 1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5 0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5 3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0 9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1 5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1 8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8 0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3 9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8 6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8 7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7 3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0 9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6 4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0 8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8 4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8 6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4 9 2 0 9 8 2 8 3 4 3 2 8 9 4 8 7 9 4 9 4 1 3 7 9 4 8 3 7 0 8 6 6 6 8 4 1 1 3 1 3 3 3 2 5 6 7 6 1 6 6 1 7 6 5 8 1 6 2 2 7 9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 8 6 1 4 4 1 7 5 4 0 9 5 7 8 7 5 0 8 6 6 2 5 3 2 3 2 7 1 7 8 8 3 8 6 9 9 2 7 4 5 9 5 6 6 6 6 0 9 2 6 1 5 1 2 3 1 8 1 2 0 8 6 4 4 0 3 3 6 3 4 9 6 4 4 9 8 5 7 3 3 4 2 3 2 8 0 1 9 7 9 7 9 4 4 1 6 6 7 7 0 7 9 8 6 8 4 7 1 5 3 7 0 9 2 5 2 1 0 0 4 0 4 6 8 8 7 8 9 9 6 8 5 6 8 1 9 2 7 5 1 7 0 1 5 5 2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6 2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6 5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0 9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4 8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3 1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9 5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3 8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1 3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8
200 Estadística Básica con Aplicaciones en Excel 2010
Ejercicios de aplicación
1. La empresa de telecomunicaciones R&M tiene un total de 140 empleados, de los cuales tiene información sobre: el ingreso mensual (en nuevos soles) y años cumplidos en la empresa.
Nº Ingreso Años Nº Ingreso Años Nº Ingreso Años Nº Ingreso Años
1 2300 5 36 1800 5 71 2000 9 106 2400 16
2 2800 11 37 1800 3 72 1800 7 107 1900 7
3 2400 4 38 2400 14 73 2100 10 108 1700 1
4 2500 2 39 2600 16 74 2300 12 109 2100 6
5 2300 3 40 2700 18 75 2700 20 110 2000 5
6 2100 2 41 2100 11 76 2800 20 111 2500 16
7 1700 2 42 2300 14 77 1800 3 112 1900 6
8 2000 0 43 1700 0 78 1700 5 113 2100 15
9 2200 7 44 2200 13 79 1700 4 114 1700 9
10 2100 4 45 2900 20 80 1700 0 115 1500 0
11 1700 0 46 1800 5 81 1700 1 116 1800 18
12 2500 2 47 2100 16 82 2100 6 117 2100 10
13 2800 13 48 2000 12 83 2600 17 118 2700 19
14 2400 9 49 2000 12 84 2400 9 119 1800 9
15 1700 1 50 2900 20 85 2600 19 120 2100 15
16 2400 9 51 2100 13 86 1900 7 121 2400 16
17 2200 10 52 2100 9 87 1600 0 122 2600 17
18 2200 4 53 1800 1 88 1900 3 123 2100 10
19 2300 10 54 2000 9 89 2100 14 124 2100 8
20 2800 11 55 2100 10 90 1700 0 125 2400 17
21 2100 7 56 1900 4 91 2100 15 126 1700 1
22 1700 1 57 2000 10 92 1700 1 127 2600 20
23 2500 6 58 2300 11 93 2300 14 128 2400 16
24 2400 9 59 2000 7 94 2500 16 129 2700 17
25 2700 17 60 1700 1 95 2600 18 130 2100 12
26 1700 0 61 1900 6 96 1900 3 131 1600 0
27 1600 2 62 2000 9 97 2500 19 132 2100 15
28 2600 17 63 2400 17 98 1800 6 133 1900 5
29 2500 13 64 1700 0 99 1700 2 134 2100 12
30 2500 16 65 1700 2 100 2000 10 135 2200 12
31 2700 17 66 2400 17 101 2400 16 136 2400 13
32 1700 1 67 2500 13 102 1700 0 137 1800 4
33 1600 1 68 2600 16 103 2500 12 138 2600 17
34 2400 11 69 2100 14 104 1700 3 139 2700 20
35 1900 3 70 1900 7 105 2400 17 140 2500 16
a. Seleccione una muestra de ocho empleados utilizando el muestreo aleatorio simple. Elabore
un listado con los trabajadores seleccionados. Utilice las columnas: C7, C5, C10 y C15 de la tabla de números aleatorios.
b. Seleccione una muestra sistemática de tamaño 11 empleados. Elabore un listado con los tra-
bajadores seleccionados. Use las columnas C4, C10 y C6 de la tabla de números aleatorios.
Capítulo 5. Muestreo 201
2. La siguiente tabla muestra el registro de todos los clientes de una empresa de señal por cable del distrito de Los Olivos. Las variables consideradas fueron: ingreso semanal (en dólares), nú-mero de televisores en el hogar y nivel educativo alcanzado por el jefe de familia.
N° Ingreso semanal
Número de televi-
sores
Nivel educativo
N° Ingreso semanal
Número de televi-
sores
Nivel educativo
N° Ingreso semanal
Número de televi-
sores
Nivel educativo
1 100 3 Primaria
35 190 1 Primaria
69 430 3 Secundaria
2 80 2 Primaria
36 250 2 Primaria
70 400 3 Secundaria
3 100 3 Primaria
37 205 2 Primaria
71 220 2 Secundaria
4 85 1 Primaria
38 220 3 Primaria
72 230 2 Secundaria
5 105 2 Primaria
39 285 4 Primaria
73 300 2 Secundaria
6 110 2 Primaria
40 220 2 Primaria
74 340 3 Superior
7 102 4 Primaria
41 400 3 Primaria
75 420 2 Superior
8 110 2 Primaria
42 350 2 Primaria
76 550 2 Superior
9 90 2 Primaria
43 400 2 Primaria
77 430 2 Superior
10 130 3 Primaria
44 540 2 Primaria
78 690 3 Superior
11 180 1 Primaria
45 250 3 Primaria
79 500 2 Superior
12 90 3 Primaria
46 295 4 Primaria
80 430 2 Superior
13 104 3 Primaria
47 230 1 Primaria
81 620 3 Superior
14 100 2 Primaria
48 240 2 Primaria
82 400 3 Superior
15 90 2 Primaria
49 400 3 Primaria
83 630 2 Superior
16 80 1 Primaria
50 270 5 Primaria
84 585 1 Superior
17 120 1 Primaria
51 320 2 Secundaria
85 350 2 Superior
18 85 1 Primaria
52 200 1 Secundaria
86 520 2 Superior
19 100 2 Primaria
53 335 1 Secundaria
87 402 2 Superior
20 98 3 Primaria
54 250 2 Secundaria
88 220 3 Superior
21 120 2 Primaria
55 250 3 Secundaria
89 690 1 Superior
22 105 2 Primaria
56 120 2 Secundaria
90 420 2 Superior
23 120 1 Primaria
57 130 2 Secundaria
91 450 2 Superior
24 250 3 Primaria
58 235 2 Secundaria
92 530 2 Superior
25 300 4 Primaria
59 500 3 Secundaria
93 300 3 Superior
26 120 2 Primaria
60 200 1 Secundaria
94 335 1 Superior
27 195 3 Primaria
61 395 2 Secundaria
95 330 1 Superior
28 120 3 Primaria
62 330 3 Secundaria
96 380 2 Superior
29 250 2 Primaria
63 310 3 Secundaria
97 230 2 Superior
30 300 3 Primaria
64 300 3 Secundaria
98 385 1 Superior
31 250 2 Primaria
65 530 3 Secundaria
99 303 2 Superior
32 230 2 Primaria
66 540 2 Secundaria
100 540 2 Superior
33 150 2 Primaria
67 200 2 Secundaria
101 490 3 Superior
34 200 3 Primaria
68 285 1 Secundaria
102 495 2 Superior
Seleccione una muestra de 12 clientes aplicando el muestreo sistemático. Elabore un listado con el número. Utilice la columna C4, C9 y C15 de la tabla de números aleatorios.
202 Estadística Básica con Aplicaciones en Excel 2010
3. Los siguientes datos han sido extraídos de una investigación realizada por La Defensoría del Pueblo, Comisión de la Verdad y Reconciliación, Comité Internacional Cruz Roja y Coordinadora Nacional de Derechos Humanos sobre un total de 150 personas extraviadas en el Perú entre los años 1980 y 1996 en los tres principales departamentos donde hubo el brote terrorista: Ayacu-cho, Huánuco y San Martín.
Nº Lugar de
procedencia Sexo
Edad al momento de la
desaparición
Nº Lugar de
procedencia Sexo
Edad al momento de la desaparición
Nº Lugar de
procedencia Sexo
Edad al momento de la desaparición
1 Ayacucho M 12 51 Ayacucho M 44 101 Huánuco M 24
2 Ayacucho M 40 52 Ayacucho M 39 102 Huánuco M 28
3 Ayacucho M 20 53 Ayacucho M 17 103 Huánuco F 4
4 Ayacucho M 43 54 Ayacucho F 19 104 Huánuco F 2
5 Ayacucho M 28 55 Ayacucho M 24 105 Huánuco M 33
6 Ayacucho M 12 56 Ayacucho F 15 106 Huánuco M 25
7 Ayacucho F 15 57 Ayacucho M 17 107 Huánuco M 21
8 Ayacucho M 28 58 Ayacucho M 22 108 Huánuco M 21
9 Ayacucho M 13 59 Ayacucho M 50 109 Huánuco M 30
10 Ayacucho M 45 60 Ayacucho M 42 110 Huánuco M 21
11 Ayacucho M 10 61 Ayacucho M 19 111 Huánuco M 21
12 Ayacucho F 25 62 Ayacucho M 21 112 Huánuco M 54
13 Ayacucho M 24 63 Ayacucho M 15 113 Huánuco M 38
14 Ayacucho M 32 64 Ayacucho M 43 114 Huánuco M 16
15 Ayacucho M 48 65 Ayacucho M 16 115 Huánuco M 28
16 Ayacucho M 23 66 Ayacucho M 30 116 Huánuco M 36
17 Ayacucho F 7 67 Ayacucho M 48 117 Huánuco M 27
18 Ayacucho F 5 68 Ayacucho M 45 118 Huánuco M 24
19 Ayacucho M 4 69 Ayacucho M 41 119 Huánuco M 45
20 Ayacucho F 9 70 Ayacucho M 23 120 Huánuco M 21
21 Ayacucho M 6 71 Ayacucho M 22 121 Huánuco M 66
22 Ayacucho M 66 72 Ayacucho M 20 122 Huánuco F 70
23 Ayacucho M 18 73 Ayacucho M 22 123 Huánuco F 26
24 Ayacucho F 36 74 Ayacucho M 16 124 Huánuco M 26
25 Ayacucho M 26 75 Ayacucho M 45 125 Huánuco M 14
26 Ayacucho M 17 76 Ayacucho F 56 126 Huánuco M 18
27 Ayacucho M 28 77 Ayacucho M 33 127 Huánuco M 28
28 Ayacucho M 30 78 Ayacucho M 22 128 San Martín M 25
29 Ayacucho F 19 79 Ayacucho M 70 129 San Martín M 32
30 Ayacucho M 17 80 Ayacucho M 34 130 San Martín M 22
31 Ayacucho F 20 81 Ayacucho M 69 131 San Martín M 21
32 Ayacucho M 21 82 Ayacucho F 31 132 San Martín M 28
33 Ayacucho M 37 83 Huánuco M 21 133 San Martín M 18
34 Ayacucho M 58 84 Huánuco M 27 134 San Martín M 29
35 Ayacucho M 18 85 Huánuco F 19 135 San Martín M 20
36 Ayacucho F 18 86 Huánuco M 27 136 San Martín M 18
37 Ayacucho M 19 87 Huánuco M 20 137 San Martín M 21
38 Ayacucho M 18 88 Huánuco M 25 138 San Martín M 26
39 Ayacucho M 22 89 Huánuco M 18 139 San Martín M 23
40 Ayacucho F 23 90 Huánuco M 47 140 San Martín M 35
41 Ayacucho M 50 91 Huánuco M 28 141 San Martín M 17
Capítulo 5. Muestreo 203
42 Ayacucho M 26 92 Huánuco M 32 142 San Martín M 32
43 Ayacucho F 19 93 Huánuco M 18 143 San Martín F 32
44 Ayacucho M 54 94 Huánuco M 22 144 San Martín M 41
45 Ayacucho M 13 95 Huánuco M 28 145 San Martín M 26
46 Ayacucho M 46 96 Huánuco M 31 146 San Martín M 20
47 Ayacucho M 28 97 Huánuco M 34 147 San Martín M 21
48 Ayacucho M 46 98 Huánuco M 25 148 San Martín M 15
49 Ayacucho M 42 99 Huánuco M 27 149 San Martín M 22
50 Ayacucho M 40 100 Huánuco M 19 150 San Martín M 45
a. Aplique el muestreo sistemático para obtener una muestra de 10 personas desaparecidas. Elabore un listado con el número seleccionado. Utilice las columnas C14, C2 y C8 de la tabla de números aleatorios.
b. Aplique el muestreo aleatorio simple para obtener una muestra de 14 personas desaparecidas.
Elabore un listado con el número seleccionado. Utilice las columnas C7, C12, C5, C16 y C3 de la tabla de números aleatorios.
c. Aplique el muestreo estratificado para obtener una muestra de 10 personas desaparecidas. Elabore un listado con el número seleccionado. Utilice como variable de estratificación: Lugar de procedencia.
Estrato 1: Ayacucho C3, C5, C7
Estrato 2: Huánuco C5; C9, C10, C12
Estrato 3: San Martín C4, C8, C11,C15
204 Estadística
204
TABLA DE NÚMEROS ALEATORIOS
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20 4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9 9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0 0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4 9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4 1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9 2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7 6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7 1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8 4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9 0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6 7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4 4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4 6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5 9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8 1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5 0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5 3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0 9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1 5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1 8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8 0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3 9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8 6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8 7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7 3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0 9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6 4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0 8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8 4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8 6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4 9 2 0 9 8 2 8 3 4 3 2 8 9 4 8 7 9 4 9 4 1 3 7 9 4 8 3 7 0 8 6 6 6 8 4 1 1 3 1 3 3 3 2 5 6 7 6 1 6 6 1 7 6 5 8 1 6 2 2 7 9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 8 6 1 4 4 1 7 5 4 0 9 5 7 8 7 5 0 8 6 6 2 5 3 2 3 2 7 1 7 8 8 3 8 6 9 9 2 7 4 5 9 5 6 6 6 6 0 9 2 6 1 5 1 2 3 1 8 1 2 0 8 6 4 4 0 3 3 6 3 4 9 6 4 4 9 8 5 7 3 3 4 2 3 2 8 0 1 9 7 9 7 9 4 4 1 6 6 7 7 0 7 9 8 6 8 4 7 1 5 3 7 0 9 2 5 2 1 0 0 4 0 4 6 8 8 7 8 9 9 6 8 5 6 8 1 9 2 7 5 1 7 0 1 5 5 2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6 2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6 5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0 9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4 8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3 1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9 5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3 8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1 3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8
Anexos 205
205
Índice Axiomas de la probabilidad 128 Censo 182 Coeficiente de asimetría
de Fisher 119 Coeficiente de variación 114 Cuantiles 102 Desviación estándar 112
de una variable aleatoria 153 Diagrama de árbol 143 Distribución
binomial 160 de frecuencias 26, 57, 63, 64 hipergeométrica 164 normal 176 Poisson 168 t-Student 208 uniforme 173
Escalas de medición 15 Espacio muestral 126
Partición de un 142 Estimación
por intervalo 203 puntual 203
Estimador 19 Evento 126
Complemento 127 Eventos
independientes 139 Intersección de 127 mutuamente excluyentes 128 Unión de 127
Gráfico circular 34 de barras 31 de barras apiladas 46, 51 de barras apiladas al 100% 46, 54 de Pareto 37 Histograma 69 Ojiva 76 Polígono de frecuencias 72, 73
Intervalo de confianza para la media poblacional 204 proporción poblacional 218
Marco muestral 181 Margen de error 203 Media aritmética 85
propiedades 86 Media ponderada 100 Mediana 91 Medidas de asimetría 118 Medidas de dispersión 109 Medidas de tendencia central 85 Moda 94 Muestreo 182
aleatorio simple 183 estratificado 192 probabilístico 183 sistemático 187
Nivel de confianza 203 Interpretación 204
Población muestreada 181 Probabilidad
condicional 135 Definición clásica de 128 Teoremas básicos de 128
Rango de una variable 109
Rango intercuartil 110 Registro administrativo 11 Tabulaciones cruzadas 41 Tamaño de muestra
para estimar la media 215 para estimar la proporción poblacional 222
Teorema de Bayes 143 Teorema de la probabilidad total 142 Unidad de muestreo 181 Unidad elemental 181 Valor esperado
de una variable aleatoria continua 159 de una variable aleatoria discreta 152
Variable definición 12
Variable aleatoria continua 159 definición 149 discreta 150 Función de densidad de probabilidad 159 Función de probabilidad 150
Varianza 112 de una variable aleatoria continua 159 de una variable aleatoria discreta 153