Upload
tequilastudio-digital-media
View
1.866
Download
1
Embed Size (px)
Citation preview
Los Datos y la Estadística
MATERIAL DIDÁCTICO REALIZADO POR:
Dr. en C.D.H. Leopoldo Xavier Cárdenas González
PARA LA MATERIA DE: HERRAMIENTAS DE APLICACIÓN ESTADÍSTICA
AÑO 2010
Objetivo
El uso de modelos probabilísticos y métodos estadísticos para analizar datos, se ha vuelto práctica común en casi todas las disciplinas científicas.
Se pretende en este curso proporcionar una introducción completa a los modelos y métodos que los estudiantes de este módulo encontrarán en sus actividades profesionales.
Los ejercicios y ejemplos están diseñados esencialmente con un adecuado análisis estadístico, con diferentes métodos y sus diversas aplicaciones al conocimiento científico.
¿Qué es la estadística?
1.- ¿Qué entiendes por Estadística? ¿Cuál es su utilidad?
2.- Describa tres aplicaciones de la estadística en su área de trabajo
3.- ¿Qué tipo de datos se manejan en la estadística?
4.- ¿Para qué se recopilan datos en una investigación?
5.- ¿Cuáles son las fuentes de datos para una investigación?
6.- Mencione algún experimento en donde existan variaciones en las mediciones con diferentes periodos de
tiempo
MAPA PARA SELECCIONAR UN MÉTODO ESTADÍSTICO
Descripción de un grupo o diversos grupos
Arreglo ordenado, diagrama de tallo y hoja, distribución de frecuencias, distribuciones de: frecuencia, frecuencia relativa, porcentajes, porcentajes acumulados; Histograma, polígono, polígono de porcentaje acumulado
Tabla de resumen, gráfica de barras, gráfica de pastel, diagrama de Paretto
Media, mediana, moda, cuartiles, media geométrica, rango, rango intercuartil, desviación estándar, varianza, coeficiente de variación, gráfica de caja y bigote
TIPO DE ANÁLISIS NUMÉRICOS CATEGÓRICOS
TIPO DE DATOS
MAPA PARA SELECCIONAR UN MÉTODO ESTADÍSTICO
Inferencia acerca de un grupo
Estimación del intervalo de confianza para la media
Prueba Z para la media
Prueba t para la media
Estimación de intervalo de confianza para una proporción
Prueba Z de hipótesis para la proporción
Comparación de dos grupos
Pruebas para la diferencia en las medias de dos poblaciones independientesPrueba t apareadaPrueba F para la diferencia entre dos varianzas
Prueba Z para la diferencia entre 2 proporciones
Prueba Chi cuadrada para la diferencia entre 2 proporciones
TIPO DE ANÁLISIS NUMÉRICOS CATEGÓRICOS
MAPA PARA SELECCIONAR UN MÉTODO ESTADÍSTICO
Comparación de más de dos grupos
Análisis de varianza de una vía
Prueba chi cuadrada para las diferencias entre más de dos proporciones
Análisis de la relación entre dos variables
Diagrama de dispersión, gráfica de series de tiempoCovarianza, coeficiente de correlaciónRegresión lineal simplePrueba t de correlación
Tabla de contingencia, gráfica de barras agrupadas
Prueba de chi cuadrada de independencia
Análisis de la relación entre dos o más variables
Regresión múltiple
TIPO DE ANÁLISIS NUMÉRICOS CATEGÓRICOS
Diferencias en las aplicaciones de la estadística en las diversas disciplinas
académicas La mayor diferencia radica en los ejemplos que se utiliza En la facultad de Administración nos interesan cosas
como: ganancias, horas trabajadas y salarios. En el depto. de Psicología se interesan por las
calificaciones obtenidas en las pruebas de algún test aplicado a determinada población de alumnos
En la facultad de Ingeniería quizá se interesen por la cantidades de unidades que se fabrican en una máquina en particular.
Sin embargo las 3 áreas se interesan en el valor típico y la variación que existe en la información.
Quizá haya también una diferencia en el nivel de matemáticas que se requiere.
Razones para estudiar Estadística
1.- La información está en todas partes
2.- Las técnicas estadísticas se emplean para tomar muchas decisiones que afectan nuestra vida
3.- Sin importar cuál sea su profesión, tomará decisiones más profesionales que comprenden información
Razones para estudiar Estadística
Como ciudadano, estará expuesto a, y tal vez incluso ayude a generar, descripciones estadísticas y análisis de datos que sean de vital importancia para su comunidad local, estatal, nacional y mundial.
Como profesional de negocios, encarará mediciones estadísticas de desempeño y éxito, y conocerá empresarios que esperarán que ud. pueda utilizar las técnicas estadísticas y herramientas de software para computadora más recientes al trabajar con estas mediciones.
Casos de Negocios
En todos los casos, la empresa u organización necesita apoyo estadístico para analizar su base de datos con el fin de ganar más dinero, tomar mejores decisiones o sencillamente llegar al siguiente año fiscal.
Se deben tomar muy en cuenta algunos lineamientos en forma de preguntas o cuestiones específicas que el estudiante podría abordar al emplear la estadística para negocios como recurso, con el fin de formular observaciones y recomendaciones informativas o útiles para su “cliente”.
¿Qué se necesita a fin de tomar una decisión adecuada?
1.- Determinar si la información existente es adecuada o si se necesita una información adicional
2.- Recopilar información adicional, en caso de ser necesaria, de manera que no proporcione resultados erróneos.
3.- Resumir la información en forma útil y organizada
4.- Analizar la información disponible
5.- Sacar conclusiones y hacer deducciones al tiempo que evalúa el riesgo de una conclusión incorrecta
6.- Debe existir ética en el análisis y preparación de los informes estadísticos
LOS DATOS Y LA ESTADÍSTICA
¿QUÉ ES LA ESTADÍSTICA?
Es el arte y ciencia de reunir, analizar, presentar e interpretar datos. La disciplina de la estadística enseña cómo razonar de manera lógica y tomar decisiones informadas en
presencia de incertidumbre y variación. Sin estas dos últimas, habría poca necesidad de los métodos estadísticos o de los profesionales de la
estadística
EJEMPLOS QUE ILUSTRAN ALGUNAS APLICACIONES DE LA ESTADÍSTICA: a) Contabilidad b) Finanzas c) Mercadotecnia d) Producción e) Economía f) Educación g) Psicología h) Ingeniería i) Control estadístico de procesos y la calidad j) Administración k) Recursos Humanos l) Valuación
Los datos
Los datos son los hechos y los números que se reúnen y resumen para su presentación.
Al estar reunidos, los datos recopilados en determinado estudio se denominan conjunto de datos.
Datos Cuantitativos y Cualitativos Los datos cualitativos: son identificadores o nombres asignados
a un atributo de cada elemento. Pueden ser numéricos o no numéricos: Ejemplo: los números de seguro social, como 310-22-7924 están formados por valores numéricos, sin embargo, son cualitativos, porque en realidad identifican a determinado individuo.
Los datos cuantitativos: indican cuánto o cuántos. Siempre son numéricos. Ejemplo: Ventas de refrescos en determinada empresa, número de alumnos/grupo en la universidad, ganancias por acción, cantidad de agua que contiene el cuerpo humano, número de palabras/página promedio que contiene la obra Don Quijote de la Mancha.
DIFERENCIA ENTRE DATOS CUALITATIVOS Y CUANTITATIVOS
La diferencia consiste en que las operaciones aritméticas ordinarias sólo tienen sentido con los datos cuantitativos.
Por ejemplo: cuando los datos son cuantitativos, sus valores se pueden sumar y después dividir entre la cantidad de valores para calcular el valor promedio de ellos. Este promedio tiene sentido y, por lo general se interpreta con facilidad.
Sin embargo, cuando se registran datos cualitativos en forma de valores numéricos, esas operaciones aritméticas producen resultados sin importancia.
Tipos de Estadística La Estadística Descriptiva: estudia
las técnicas que se utilizan para describir o caracterizar los datos obtenidos
La Estadística Inferencial :incluye las técnicas que emplean los datos obtenidos en la muestra para, a partir de ellos, hacer inferencias sobre sus respectivas poblaciones.
Ejemplos de Estadística Descriptiva Durante el 2009, los miembros del Congreso recibieron un total
de 90 millones de mensajes por correo electrónico, más del doble de la cantidad recibida durante 2007
Más de 8.5 millones de habitantes viven en la ciudad de Nueva York (año 2007) y viven 10,000 personas por km2 .
Loving County (Texas) tiene 67 residentes y una densidad de población de una persona por 10 millas cuadradas.
Más de 1800 plantas y animales están en la lista de especies en peligro de extinción del Departamento del Interior del gobierno de E.U.
De enero de 2008 a la fecha, 80.6% de los vuelos de Continental Airlines arribó a tiempo.
Ejemplos de estadística inferencial Una investigación de Nielsen/NertRaitings estima que 162.8
millones de estadounidenses (58% de la población) tiene acceso a sitios web en su domicilio.
A partir de un estudio de 340 mujeres divididas en 4 grupos según su ocupación, los investigadores de la Universidad de Pittsburg encontraron que las empleadas de oficina tienen el mayor riesgo de padecimientos cardiovasculares.
De 1400 directores corporativos de finanzas encuestados, 38% dijo que “el reconocimiento frecuente de los logros” era el mejor modo de motivar a sus empleados.
En una encuesta realizada a alumnos de último semestre de preparatoria que aspiraban a matricularse en una universidad, 33% dijo que “el nivel académico” era la característica más importante al elegir una universidad.
Estadística Descriptiva La mayor parte de la información
estadística que aparece en los diarios, revistas, informes y demás publicaciones consiste en datos resumidos y presentados en forma comprensible para el lector.
Esos resúmenes de datos, que puede ser tabulares, gráficos o numéricos, se llaman estadísticas descriptivas
Inferencia Estadística
Uno de los mayores aportes de la estadística es que los datos de una muestra pueden emplearse para elaborar estimaciones y probar hipótesis (indican lo que estamos buscando o tratando de lograr) acerca de las características de una población.
A este proceso se le denomina inferencia estadística.
LA ESTADÍSTICA Y EL MUNDO REAL
En áreas de verdadera importancia para usted, debe preguntarse cosas como:
¿Están respaldadas estas afirmaciones por datos?
¿Qué tan confiables son esos datos?
¿Es el azar una explicación razonable para los datos?
LA ESTADÍSTICA Y EL MUNDO REAL
Si no existen datos, o si éstos se presentan con expresiones como:
“mi experiencia es que……….” en lugar de haber sido obtenidos por medio de experimentos bien controlados, usted comenzará a cuestionarse si debe considerar en serio el consejo de esa autoridad.
OBTENCIÓN DE DATOS MEDIANTE ENCUESTAS DE INVESTIGACIÓN
Es muy probable que un especialista en estadística que realiza una encuesta desee desarrollar un instrumento que le permita hacer varias preguntas y manejar diversos fenómenos o características.
A estos fenómenos o características se les denomina variables aleatorias
TIPOS DE VARIABLES Cualitativas Cuantitativas
Marca de PC Discretas Continuas Estado civil Color del cabello *Hijos en la familia *Cantidad de *Letras del alfabeto impuesto
pagado *TV en una casa *Peso de un
alumno *Precipitación
anual en Zapopan,
Jal
VARIABLES ALEATORIAS
TIPOS DE DATOS TIPOS DE PREGUNTAS RESPUESTAS
CUALITATIVOS ¿Posee actualmente bonos Si No de ahorro del gobierno? ¿Ud. es? Hombre
Mujer Su cabello es: castaño, negro, rojizo, rubio o canoso CUANTITATIVO: DISCRETO: ¿A cuántas revistas está ______número suscrito actualmente?
CONTÍNUO: ¿Cuál es su estatura? _______ cm ¿Cuál es el volumen de un líquido en un recipiente? _______ cm3
TIPOS DE DATOS
Los datos cuantitativos discretos son respuestas numéricas que surgen de un proceso de conteo (su respuesta puede ser sólo un número finito de números)
Por ejem: 8 personas, 3 revistas, 12 automóviles.
Los datos cuantitativos continuos son respuestas numéricas que surgen de un proceso de medición (la respuesta puede tomar cualquier valor dentro de un intervalo).
Por ejemplo: 1.75 mts, 16.97% de interés mensual, 19.4 lb/pulg2 de presión
ESCALAS DE MEDICIÓN La asignación de un valor numérico a una variable es un
proceso llamado medición. Por ejemplo: a) La temperatura en la cd. de Guadalajara en este
momento es de 25°C b) 8 focos rotos en una caja c) 4 llantas radiales en un automóvil d) El volumen de una lata de refresco es de 100 ml
Los números 25, 8, 4 y 100 constituyen mediciones
NIVELES o ESCALAS DE MEDICIÓN NOMINAL ORDINAL DE INTERVALO DE RAZÓN Los datos sólo Los datos se Diferencia significativa Punto “0”
signi- se clasifican ordenan entre los valores ficativo y
razón entre
valores
Números en las Su número de Temperatura Número de playeras de los lista en clase pacientes
vistos jugadores de futbol Posición de Número de Marca de un auto llegada en una llamadas
de carrera de ventas el
dia de maratón hoy
NIVELES o ESCALAS DE MEDICIÓN
Las Áreas Sociales utilizan normalmente el nivel cualitativo de medición: nominal y ordinal.
¿Qué operaciones matemáticas se pueden realizar con estas escalas?
proporciones, porcentajes y razones
Cuando la variable puede medirse se utilizan las escalas de intervalo o de razón
¿Qué operaciones matemáticas se pueden realizar con estas escalas?
proporciones, porcentajes y razones, media aritmética, moda,
mediana, rango y desviación estándar
ESCALAS DE MEDICIÓN“Nominales, Ordinales, de Intervalos y de
Razón” ESCALA NOMINAL: Representa el nivel mínimo de medición y se utiliza con
frecuencia para variables de naturaleza cualitativa y no cuantitativa.
Ejemplos de variables cualitativas: Marcas de zapatos deportivos, distintos tipos de frutas o
música, los días de la semana, la nacionalidad, creencias religiosas y el color de los ojos.
Al utilizar una escala nominal, la variable se divide en sus diversas categorías.
La medición con una escala nominal EQUIVALE en realidad, a clasificar los objetos y a darles el nombre de la categoría a la cual pertenecen.
ESCALA DE MEDICIÓN: Nominal
EJEMPLO DE ESCALA NOMINAL “Zapatos deportivos Nike, Brooks y New Balance” VARIABLE: “marca de Zapatos Deportivos” TIPO: Cualitativo CATEGORÍA: (Diversas marcas de zapatos deportivos) Categoría zapatos deportivos 1 (Nike) Categoría zapatos deportivos 2 (Brooks) Categoría zapatos deportivos 3 (New Balance) De lo anterior podemos, contar el número de zapatos que
pertenecen a cada categoría. Por ejemplo: Nike: 20 pares, Brooks: 26 pares y de New Balance: 17
pares, y con esta información tener las frecuencias que nos permitan comparar el número de zapatos en cada categoría.
Ejemplo de la medición en la escala nominalen un cuestionario
EJEMPLO DE LA ESCALA NOMINAL EN UN CUESTIONARIO:Estado civil: soltero, casado, viudo, divorciado (son mutuamente excluyentes)
Estos indicadores sólo pueden clasificarse, no medirse.
Las operaciones matemáticas que se aplican en el análisis de estos datos son: razones, proporciones y porcentajes
ESCALA DE MEDICIÓN: Ordinal
Con esta escala ordenamos los objetos medidos, tomando como base si poseen más, menos o la misma cantidad de la variable medida.
Así, una escala ordinal permite determinar si: A > B, A = B ó A < B
Ejemplo: ordenamiento de los 5 mejores participantes en un concurso de Oratoria, según facilidad de palabra.
Nombre de la persona Rango que ocuparon Karla Icela Méndez 1° Carolina Beltrán 2° Brian Muñoz 3° Felipe Solís 4°
ESCALA DE MEDICIÓN: Ordinal
Entre los oradores, la persona de rango 1 fue considerada mejor que la persona con rango 2, quien a su vez fue mejor que la de rango 3, etc.
Es importante observar que aunque esta escala permite hacer comparaciones del tipo: “mejor que, igual que o menor que”, no dice nada sobre la magnitud de la diferencia entre las unidades adyacentes que pertenecen a dicha escala.
Otros ejemplos: Clasificación de los corredores que participaron en el
Maratón de Guadalajara según su orden de llegada. El orden de los maestros según su capacidad de enseñanza El orden de los estudiantes según su nivel de motivación
Ejemplo de la medición en la escala ordinal en un cuestionario
¿La clase de matemáticas es interesante? a) de acuerdo b) duda c) en desacuerdo
Resultados de la encuesta a 100 alumnos en una universidad:
60% de acuerdo 15% en duda 25% en desacuerdo
ESCALA DE MEDICIÓN: de Intervalo Representa un nivel superior de medición respecto a la escala
ordinal. Posee las propiedades de magnitud e igualdad de intervalos
entre las unidades adyacentes, pero no tiene un cero absoluto.
Ejemplo: Escala Celsius para medir la temperatura. Tiene la propiedad
de poseer intervalos iguales entre las unidades adyacentes, pero no tiene un punto correspondiente al cero absoluto.
Así la cantidad de adicional de calor que provoca un cambio de lectura de la temperatura de 2° a 3° Celsius producirá también un cambio en la lectura de 51° a 52° o de 105° a 106° Celsius.
Podemos determinar si: A = B, A > B ó A < B
Ejemplo de la medición en la escala de intervalo en un cuestionario
¿Cual es el intervalo en la edad de los alumnos de primer año?
a) de 14 a 16 años b) de 17 a 19 años c) de 20 a 22 años
¿Qué operaciones matemáticas se pueden hacer en este tipo de escala?
Media aritmética, mediana, moda, desviación estándar, etc.
ESCALA DE MEDICIÓN: de Razón El siguiente y máximo nivel de medición es la Escala de
Razón. Tiene todas las propiedades de una escala de intervalo y
además, posee un cero absoluto. Ejemplos: Tiempo de reacción La longitud El peso La edad La frecuencia de cualquier evento La temperatura en °Kelvin (tiene un cero absoluto, ausencia completa de calor)
Se pueden realizar todas las operaciones matemáticas asociadas por lo general con los números (+, -, x , /)
ESCALA DE MEDICIÓN: de Razón Ejemplo para ilustrar la diferencia entre la escala de
Intervalo y la de Razón: Experimento: Comparar la escala °C y la escala °K El cero en la escala Celsius es la temperatura a la cual se
congela el agua El cero de la escala Kelvin es el cero absoluto La diferencia de calor entre 8° y 9° es igual a la diferencia
entre 99° y 100° sin importar que la escala sea °C o °K Una lectura de 20°C no es el doble de caliente que 10°C,
¿porqué? Convertimos a calor real (°K) estas temperaturas: °K = °C + 273 = 20° + 273° = 293°K = 10° + 273° = 283°K Es obvio que 293° no es el doble que 283°
ESCALAS DE MEDICIÓN EN LAS CIENCIAS DEL COMPORTAMIENTO
Muchas de las escalas utilizadas se consideran con frecuencia como si fuesen de intervalo sin establecer con claridad que la escala, en realidad, posee intervalos iguales entre unidades adyacentes.
Ejemplos: La medición del CI Las variables emocionales: ansiedad y depresión Las variables de personalidad: autosuficiencia, introversión, extroversión y la dominancia. Variables de eficiencia o logros terminales Variables de actitud Nota: Para todas estas variables, sus escalas no son de razón (no tienen un cero absoluto como referencia)
Ejemplo del C.I. Si una persona ha obtenido un cero en la escala de
inteligencia para adultos de Wechsler (WAIS), no podríamos decir que tiene inteligencia nula.
Se supone que se encontrarían algunas preguntas que podría contestar el individuo en cuestión, de modo que tendría un CI > 0
Así la prueba WAIS no tiene un punto cero absoluto y la escala de razón no es adecuada
Por lo tanto no es correcto decir que una persona con un CI de 160 es lo doble de inteligente que alguien con un CI de 80
Influencia del nivel de escalas en la selección del tipo de prueba que se usará en el Análisis de
Datos Existen 2 criterios: 1° El primero afirma que el uso de ciertas pruebas: “t” de Student “ANOVA” (análisis de varianza) deben limitarse a los datos que pertenecen a escalas de intervalo y de razón.
2° El segundo criterio no concuerda con lo anterior y afirma que esas pruebas también se pueden utilizar con datos nominales y ordinales
Práctica # 1 Indicar cuáles de las siguientes variables son
continuas y cuáles son discretas
a) La hora del día b) Número de mujeres en este grupo c) Número de veces que una rata oprime la
palanca en una caja de Skinner d) Edad de los sujetos en un experimento e) Número de palabras recordadas f) Peso del alimento ingerido g) % de estudiantes de su grupo que son mujeres h) Velocidad de los corredores en una carrera
PRÁCTICA # 2Identificar la escala de cada una de las siguientes
variables (Nominales, Ordinales, de Intervalos y de Razón)
A) Número de automóviles que utilizan los alumnos de primer cuatrimestre
B) Tipos de autos utilizados por los estudiantes de 2° cuatrimestre
C) El C.I. de los maestros de la Universidad (suponga que utiliza una escala con intervalos iguales)
D) El dominio de las matemáticas, clasificado en las categorías de: malo, regular y bueno
E) Sensación de ansiedad al hablar en público, calificada según una escala de 0 a 100 (suponga que la diferencia en el grado de ansiedad entre las unidades adyacentes de toda la escala no siempre es la misma)
F) El peso de un grupo de personas sometidas a una dieta
PRÁCTICA # 2Identificar la escala de cada una de las
siguientes variables G) El tiempo de reacción al escuchar un sonido
H) El dominio de las matemáticas, medido en una escala de 0 a 100. La escala está bien normalizada y se puede considerar que tiene intervalos iguales entre las unidades adyacentes.
I) Las calificaciones de los maestros asignados por los estudiantes, en una escala de 50 puntos. No existe una base suficiente para suponer que los intervalos entre las unidades adyacentes son iguales.
PROCESO DE INFERENCIA ESTADÍSTICA EN UN EJEMPLO DE UNA EMPRESA QUE FABRICA
BOMBILLAS ELÉCTRICAS
LA POBLACIÓN ES IGUALA TODAS LASBOMBILLAS FABRICADAS
CON EL NUEVOFILAMENTO.
SE ESCONOCE LADURACIÓN PROMEDIO
(1)
SE FABRICA UNA MUESTRA DE 200BOMBILLAS CON EL NUEVO
FILAMENTO(2)
EL RESUMEN DE LOS DATOS DE LAMUESTRA DA COMO RESULTADOUNA DURACIÓN PROMEDIO DE
76 HORAS POR BOMBILLA(3)
EL VALOR DEL PROMEDIO DE LA MUESTRASE EMPLEA PARA ESTIMAR EL PROMEDIO
DE LA POBLACIÓN(4)
POBLACIÓN Y MUESTRA
Población: “Es el conjunto completo de individuos,
objetos o datos que el investigador está interesado en estudiar”.
Muestra: “Es un subconjunto de la población”.
VARIABLES
Variable: “Es cualquier propiedad o característica de algún evento, objeto o persona que puede tener diversos valores en diferentes instantes, según las condiciones”.
Ejemplos: La altura, el peso, el tiempo de reacción y la dosis de un medicamento.
Constante: “No asume diferentes valores en diferentes instantes”.
Ejemplo: el símbolo matemático pi: Π
Variable independiente La variable independiente de un experimento es aquella
que es controlada en forma sistemática por el investigador. El experimentador controla los niveles de la variable y mide el efecto que produce sobre las demás variables.
EJEMPLO: Un científico podría estar interesado en el efecto del
alcohol sobre el comportamiento social. Para investigar esto, es probable que el experimentador varíe la cantidad de alcohol y mida sus consecuencias sobre la conducta social de las personas.
La cantidad de Alcohol es la variable independiente.
Variable dependiente La variable dependiente en un experimento es
la que el investigador mide para determinar el efecto de la variable independiente.
Ejemplo: En el experimento que estudia los efectos del
alcohol sobre el comportamiento social, la variable dependiente es el comportamiento social.
El comportamiento social de los sujetos se mide para ver si resulta afectado por la cantidad de alcohol consumida.
Estadístico y Parámetro Estadígrafo: es un número calculado a
partir de los datos de la muestra. ejemplo: promedio de un conjunto de
datos de la muestra.(Muestra)
Parámetro: es un número calculado sobre los datos de una población.
ejemplo: valor promedio de un conjunto de datos poblacionales.(habla de la población)
Práctica # 3 identificar: Variable independiente, dependiente, muestra,
población, datos, estadístico y parámetro
Un psicólogo clínico está interesado en evaluar tres métodos para tratar la depresión:
la medicación, la reestructuración cognitiva y el ejercicio.
Se incluye una cuarta condición de tratamiento: un grupo que sólo estará en espera de tratamiento, para tener un grupo de control de línea base.
Se recluta a 60 personas deprimidas entre los estudiantes de licenciatura de una universidad, 15 de ellos son asignados a cada método de tratamiento.
….. continuación práctica # 3
Los tratamientos se administran durante 6 meses, después de lo cual cada estudiante recibe un cuestionario diseñado para medir el grado de depresión.
El cuestionario tiene una escala de 0 a 100, donde los puntajes mayores indican un mayor grado de depresión.
Luego se calculan las medias de los valores de depresión para los 4 tratamientos y se comparan entre sí para determinar la eficiencia relativa de cada tratamiento.
Práctica # 4Indicar cuáles de las siguientes afirmaciones
representan una variable y cuáles una constante
A) El número de letras del alfabeto B) El número de horas que tiene un día C) La hora en que Ud. come D) El número de estudiantes que se
especializan en Administración cada año, en esta Universidad
E) El número de cm en un metro F) La cantidad de horas que duerme usted cada
noche G) Su peso H) El volumen de 1 litro de agua
Práctica # 5Indicar cuáles de las siguientes situaciones
corresponden a la estadística descriptiva y cuáles a la estadística inferencial
A) Un informe anual para accionistas que detalla los bienes de la corporación
B) Un maestro de Contabilidad que anuncia a su grupo el número de estudiantes que obtuvieron la máxima calificación en un examen reciente
C) El cálculo de la media de un conjunto de datos de una muestra para caracterizarla.
D) El uso de los datos de una muestra en una encuesta para estimar la opinión de la población
E) Realizar un estudio de correlación sobre una muestra para determinar si el nivel educativo y el ingreso de la población están relacionados
F) Un artículo de un periódico sobre los salarios promedio de los empleados federales a partir de los datos reunidos de todos los interesados.
Practica # 6 (en equipos)
1.- Diseñen un experimento y mencionen la metodología que utilizarían para obtener los datos necesarios.
2.- Estructuren una encuesta (10 preguntas) para obtener información necesaria en una investigación de mercado referente a la promoción de un producto de su preferencia.
3.- Den un ejemplo en un área de interés grupal, en la que los datos sean útiles para la toma de decisiones. ¿Que datos son utiles? ¿Cómo podrían obtenerse? ¿Cómo podrán usarse los datos en el proceso de toma de decisiones?
4.- ¿Qué significado tiene?: a) El Error de Muestreo b) Error de Medicion 5.- ¿Cuales son las ventajas y desventajas de las entrevistas
personales, las encuestas telefónicas y las encuestas por correo?
DISTRIBUCIONES DE FRECUENCIA
Una distribución de frecuencias presenta los valores de los datos y la frecuencia con que se presentan.
Al ser mostrados en una tabla, los valores de los datos se presentan en orden y, por lo general, el valor del dato más bajo aparece en la parte inferior de la tabla.
Elaboración de una distribución de frecuencias de datos agrupados
Pasos: 1.- Encontrar el rango de los datos 2.- Determinación del número de intervalos de clase 5 < i < 18 3.- Determinar la amplitud (ancho) de cada intervalo de
clase 4.- Formamos los intervalos de clase agregando i – 1 5.- Hacer una lista con los límites de cada intervalo de clase,
colocando en la parte inferior de la misma al intervalo que contenga el dato más pequeño (mínimo)
6.- Contar los datos en bruto contenidos en los intervalos de clase correspondientes
7.- Sumar las cuentas de cada intervalo para obtener la frecuencia del intervalo
ELABORE UNA DISTRIBUCIÓN DE FRECUENCIAS CON LOS SIGUIENTES DATOS DEL COSTO ANUAL (en miles de $) DE
ENERGÍA ELÉCTRICA EN 70 EMPRESAS METAL MECÁNICAS EN MÉXICO EN EL AÑO 2009
95 57 76 93 86 80 89 76 76 63 74 94 96 77 65 79 60 56 72 82 70 67 79 71 77 52 76 68 72 88 84 70 83 93 76 82 96 87 69 89 77 81 87 65 77 72 56 78 78 58 54 82 82 66 73 79 86 81 63 46 62 99 93 82 92 75 76 90 74 67
Pasos para la “Elaboración de la distribución de frecuencias”
1.- Determinación del rango: Rango = dato máximo menos dato mínimo = 99 – 46 = 53
2.- Determinamos el número de intervalos de clase: Nota: 5 < i < 18 para este caso tomamos 10 3.- Determinación de la amplitud (ancho) del intervalo de
clase (i): i = rango = 53 = 5.3 5 Número de intervalos de clase 10 se redondea al mismo número de decimales que aparece en los datos en bruto
Pasos para la “Elaboración de la distribución de frecuencias”
4.- Formamos los intervalos de clase agregando i – 1 tenemos: 5 – 1 = 4 (es decir a cada valor empezando por el límite inferior agregamos 4 unidades) 5.- La lista de los intervalos: debemos determinar el límite
inferior de dicho intervalo. Requisitos: a) El límite inferior de este intervalo debe ser tal
que el intervalo contenga al dato mínimo b) Se “acostumbra” hacer que el límite inferior de
este intervalo sea exactamente divisible entre “i”
Para nuestro ejemplo, el número más pequeño es 46 (no es exactamente divisible entre 5), por tanto el límite inferior del intervalo más bajo debe ser 45
Diagrama de tallos y hojas Son una alternativa sencilla para acomodar los datos
desagrupados y resultan sumamente útiles para resumir y describir datos cuando el número de éstos no es mayor de 100.
En los diagramas de tallos y hojas no se pierde ninguno de los datos originales.
Al hacer un diagrama de este tipo, cada dato es representado mediante un tallo y una hoja.
El tallo se coloca a la izquierda de la línea vertical y la hoja a la derecha.
Por ejemplo, los tallos y hojas de los dos primeros números de la primer columna serían:
Tallo hoja 9 5 7 6
Diagrama de tallos y hojas 4 6
5 2, 4, 6, 6, 7, 8
6 0, 2, 3, 3, 5, 5, 6, 7, 7, 8, 9
7 0, 0, 1, 2, 2, 2, 3, 4, 4, 5, 6, 6, 6, 6, 6, 6, 7, 7, 7, 7, 8, 8, 9, 9, 9
8 0, 1, 1, 2, 2, 2, 2, 2, 3, 4, 6, 6, 7, 7, 8, 9, 9
9 0, 2, 3, 3, 3, 4, 5, 6, 6, 9
Construcción de una distribución de frecuencias para el costo anual agrupado
de las Empresas metal mecánica en México Intervalos de clase límites reales
frecuencias 45-49 44.5-49.5 1 50-54 49.5-54.5 2 55-59 54.5-59.5 4 60-64 59.5-64.5 4 65-69 64.5-69.5 7 70-74 69.5-74.5 9 75-79 74.5-79.5 16 80-84 79.5-84.5 10 85-89 84.5-89.5 7 90-94 89.5-94.5 6 95-99 94.5-99.5 4
Frecuencia relativa, frecuencia acumulada y distribuciones de porcentajes acumulados
Una distribución de frecuencias relativas: indica la proporción del número total de datos que aparecen en cada intervalo.
Una distribución de frecuencias acumuladas: indica el número de datos que están por debajo del límite real superior de cada intervalo
Una distribución de porcentajes acumulados: indica el porcentaje de datos que están por debajo del límite real superior de cada intervalo
Distribuciones de frecuencias relativas, frecuencias acumuladas y porcentajes acumulados para los datos agrupados
Intervalos de clase f f.a. f.r.(%) f.r.a. 45-49 1 1 1.43 1.43 50-54 2 3 2.86 4.29 55-59 4 7 5.71 10.00 60-64 4 11 5.71 15.71 65-69 7 18 10.00 25.71 70-74 9 27 12.85 38.56 75-79 16 43 22.85 61.41 80-84 10 53 14.28 75.69 85-89 7 60 10.00 85.69 90-94 6 66 8.57 94.26 95-99 4 70 5.71 100 70 100
REPRESENTACIÓN GRÁFICA DE LOS DATOSMÉTODOS GRÁFICOS USUALES
EL HISTOGRAMA: Describe una distribución de frecuencias mediante una serie de
rectángulos adyacentes, cada uno de los cuales tiene una amplitud proporcional a la frecuencia o la frecuencia relativa de la clase que representa.
EL POLÍGONO DE FRECUENCIA: Está relacionado con el histograma y consiste en segmentos de líneas
que conectan los puntos formados por las intersecciones de las marcas de clase y las frecuencias de clase. También se emplean las frecuencias relativas o los porcentajes para construir este tipo de gráfica.
También se relaciona con el polígono de frecuencia la OJIVA, una representación gráfica de los valores acumulados de las frecuencias, las frecuencias relativas o los porcentajes.
REPRESENTACIÓN GRÁFICA DE LOS DATOSMÉTODOS GRÁFICOS USUALES
LÁ GRÁFICA DE BARRAS: Igual que el histograma, la gráfica de barras
representa las frecuencias de acuerdo con las alturas relativas de un conjunto de rectángulos, pero difiere del histograma en dos aspectos:
a) El histograma se utiliza para representar datos cuantitativos
b) La gráfica de barras representa datos cualitativos c) Los rectángulos adyacentes en el histograma
comparten un lado común d) En la gráfica de barras tienen una separación
entre ellos
REPRESENTACIÓN GRÁFICA DE LOS DATOSMÉTODOS GRÁFICOS USUALES
LA GRÁFICA DE BARRAS MÚLTIPLES: En la gráfica de barras múltiples, cada periodo, empresa,
subsidiaria u otra unidades se representa mediante dos o más barras, y así apreciar de un vistazo la relación de la información de dos tipos de datos.
LA GRÁFICA DE LÍNEAS: La gráfica de líneas se construye para mostrar la
dependencia entre dos variables cuantitativas (“y” en el eje vertical, y “x” en el eje horizintal). Ésta consiste en segmentos de rectas que conectan los puntos observados o medidos para ambas variables.
REPRESENTACIÓN GRÁFICA DE LOS DATOSMÉTODOS GRÁFICOS USUALES
LA GRÁFICA DE PASTEL: Es un círculo dividido en secciones según la cantidad de
observaciones que caen en cada una de ellas o los valores relativos de las mismas. Si la gráfica de pastel no se genera mediante computadora, puede construirse teniendo en cuenta que un círculo tiene 360°. El ángulo utilizado para cada sector del círculo se calcula del modo siguiente:
Cantidad de grados Valor relativo de para la categoría = la categoría x 360
EL PICTOGRAMA: El pictograma describe las frecuencias u otros valores de
interés empleando símbolos en lugar de barras.
Histograma del Costo Anual de Energía Eléctrica en México en el año 2009 en diferentes empresas metal mecánicas
02
46
810
1214
1618
44.5-49.5
49.5-54.5
54.5-595
59.5-64.4
64.5-69.5
69.5-74.5
74.4-79.5
79.5-84.5
84.5-89.5
89.5-94.5
94.5-99.5
límites reales
frec
uenc
ia
Histograma de frecuencias acumuladas del Costo Anual de Energía Eléctrica en México en el año 2009 en diferentes
empresas metal mecánicas
0
10
20
30
40
50
60
70
80
44.5-49.5
49.5-54.5
54.5-595
59.5-64.4
64.5-69.5
69.5-74.5
74.4-79.5
79.5-84.5
84.5-89.5
89.5-94.5
94.5-99.5
Límites reales
frec
uen
cia
acu
mu
lad
a
Histograma de Frecuencias Relativas del Costo Anual de Energía Eléctrica en México en el año 2009 en diferentes empresas metal
mecánicas
44.5-49.5
49.5-54.5
54.5-595
59.5-64.4
64.5-69.5
69.5-74.5
74.4-79.5
79.5-84.5
84.5-89.5
89.5-94.5
94.5-99.5
Límites reales
Fre
cuen
cia
Rel
ativ
a
Histograma de frecuencias relativas acumuladas del Costo Anual de Energía Eléctrica en México en el año 2009 en
diferentes empresas metal mecánicas
0
20
40
60
80
100
120
44.5-49.5
49.5-54.5
54.5-595
59.5-64.4
64.5-69.5
69.5-74.5
74.4-79.5
79.5-84.5
84.5-89.5
89.5-94.5
94.5-99.5
Limites reales
Frec
uen
cia
rela
tiva
acu
mul
ada
EJERCICIOS PARA ALUMNOS
A continuación se presentan algunos ejercicios para que los resuelvas y los
entregues al facilitador del módulo
Ejercicio # 1 Aplicacionespág. 55, Estadística para Administración y Economía
Anderson, Sweeney y Williams (THOMSON)
La conclusión de una encuesta en 40 estados, que llevó a cabo el Joint Council on Economic Education fue que los alumnos no aprenden suficiente economía. Las conclusiones se basaron en resultados de pruebas a los alumnos de 2do. y 3ero. de Preparatoria, cada una con 46 preguntas de opción múltiple de respuesta acerca de conceptos económicos básicos, como por ejemplo las utilidades y la ley de la oferta y la demanda.
La tabla siguiente es una muestra de datos sobre la cantidad de preguntas contestadas en forma correcta
Continuación Ejercicio #1 Aplicacionespág. 55, Estadística para Administración y Economía
Anderson, Sweeney y Williams (THOMSON)
12 10 16 24 12 14 18 23 31 14 15 19 17 9 19 28 24 16 21 13 20 12 22 18 22 18 30 16 26 18 16 14 8 25 22 15 33 24 17 19
Continuación del Ejercicio #1:Resuma estos datos empleando:
a) Un diagrama de tallo y hojas
b) Una distribución de frecuencias
c) Una distribución de frecuencias relativas
d) Una distribución de frecuencias acumuladas
e) Con base en estos datos, ¿concuerda usted con la afirmación de que los alumnos no aprenden suficiente economía? Explique su respuesta
Ejercicio # 2 Aplicaciones pág. 37, Estadística para Administración y Economía
Anderson, Sweeney y Williams (THOMSON)
El personal de un consultorio ha estudiado los tiempos de espera de pacientes que llegan solicitando servicio de emergencia. Los siguientes datos fueron reunidos en un periodo de un mes, con los tiempos de espera en minutos
2 5 10 12 4 4 5 17 11 8 9 8 12 21 6 8 7 13 18 3 Emplee clases de 0 a 4, 5 a 9, etc. a) Forme la distribución de frecuencias
b) Forme la distribución de frecuencias relativas c) Forme la distribución de frecuencias acumuladas d) Forme la distribución de frecuencias relativas acumuladas e) ¿Qué proporción de pacientes que necesitan servicio de emergencia
tienen tiempo de espera de 9 minutos o menos?
Ejercicio num. 3 Aplicaciones pág. 55, Estadística para Administración y Economía
Anderson, Sweeney y Williams (THOMSON)
A continuación se presentan las temperaturas máxima y mínima diarias (en grados Farhenheit) para 20 ciudades del mundo.
Ciudad Máxima Mínima Ciudad Máxima Mínima
Atenas 75 54 Melbourne 66 50 Bangkok 92 74 Montreal 64 52 Cairo 84 57 París 77 55 Copenhagen 64 39 Río de Janeiro 80 61 Dublin 64 46 Roma 81 54 Habana 86 68 Seúl 64 50 Hong Kong 81 72 Singapur 90 75 Johanesburgo 61 50 Sydney 68 55 Londres 73 48 Tokyo 79 59 Manila 93 75 Vancouver 57 43
Continuación del ejercicio # 3
a) Elabore un diagrama de tallos y hojas para las temperaturas máximas
b) Elabore un diagrama de tallos y hojas para las temperaturas mínimas
c) Compare los diagramas de tallos y hojas de los incisos (a) y (b) y haga comentarios acerca de las diferencias entre las temperaturas máxima y mínima diarias
d) Use el diagrama de tallos y hojas del inciso (a) para determinar el número de ciudades con temperatura alta de 80°F o más
e) Forme la distribución de frecuencias para los datos de temperatura máxima y mínima con sus respectivas gráficas
Datos para elaborar una Gráfica de Barras Múltiple
Tenencia de acciones en E.U. por tipo de inversionista
1995 1996 1997 1998
Households $3,995 $4,525 $5,319 $6,300
Institutions $4,337 $5,538 $7,457 $9,138
Gráfico de Barras Múltiple elaborado en Excel
TENENCIA DE ACCIONES EN E.U. POR TIPO DE INVERSIONISTA
$0
$2,000
$4,000
$6,000
$8,000
$10,000
1995 1996 1997 1998
AÑO
TE
NE
NC
IA (
MIL
ES
MIL
LO
NE
S)
Households
Institutions
Datos para elaborar unaGráfica de Barras
Nonrecreational Airplane Pilot Certificates
Certificate Type Number (thousands)
Student 97.736
Private 247.226
Commercial 122.053
Transport 134.612
Gráfico de Barras
U.S. Airplane Pilot Certificates
0 50 100 150 200 250 300
Student
Private
Commercial
Transport
Cert
ific
ate
Typ
e
Number (thousands)
Datos para elaborar una Gráfica de LíneasEjemplo de los ingresos de la compañía
Mc. Donald´s
Año Ingresos Totales ($Billones de U.S.D.)
1993 1.08
1994 1.22
1995 1.43
1996 1.57
1997 1.64
1998 1.55
1999 1.95
2000 1.98
2001 1.64
2002 0.89
Gráfico de Líneas
Mc. Donald´s Corporation
0
0.5
1
1.5
2
2.5
1992 1994 1996 1998 2000 2002 2004
Año
Ing
res
os
To
tale
s (
$
Bill
on
es
U.S
.D.)
La Gráfica de PastelEjemplo de las ventas ($millones de U.S.D.)
de la compañía Black & Decker
Segment Sales
Power Tools 3,209
Hardware & Home 882
Fasteners 498
Gráfica de Pastel
Black and Decker Corporation
Pow er Tools70%
Hardw are & Home19%
Fasteners11%
Pow er Tools
Hardw are & Home
Fasteners
Diagrama de Pareto
En un diagrama de Pareto las respuestas categorizadas se trazan en orden descendente de acuerdo con sus frecuencias y se combinan con la línea de porcentaje acumulado en la misma gráfica.
El diagrama de Pareto permite separar a lo “poco vital” de lo “mucho trivial”, lo que nos permite enfocarnos en las categorías importantes.
En las situaciones en las que los datos en estudio consisten en información “defectuosa” o “incompleta”, el diagrama de Pareto se convierte en una herramienta valiosa para dar prioridad a los esfuerzos de mejoramiento
Diagrama de Pareto
El análisis de Pareto es una técnica para llevar la cuenta del número de defectos que aparecen dentro de un producto o servicio.
Su concepto, con frecuencia denominado regla 80-20, es que 80% de la actividad se debe a 20% de los factores.
Al concentrarse en 20% de los factores, los gerentes pueden dedicarse a 80% del problema.
Ejemplo de Aplicación a través del Diagrama de Pareto
La siguiente tabla presenta datos de una gran compañía de moldeado de inyección que produce componentes moldeados de plástico para teclados de computadora, lavadoras, automóviles y televisores.
Los datos presentados consisten en todos los teclados de computadora defectuosos producidos durante un periodo de tres meses.
Se presenta un resumen para los defectos de los teclados de computadora, en las que las categorías están ordenadas de acuerdo con el porcentaje (y no alfabéticamente). Los porcentajes acumulados para las categorías ordenadas también forman parte de la tabla.
Tabla ordenada de resumen de las causas de los defectos en los teclados de computadora en un
periodo de 3 meses
Causa Frecuencia Porcentaje Porc. Acum.
Deformación 1,987 31.42 31.42 Daño 1,039 16.43 47.85 Marca de clavijas 834 13.19 61.04 Rasguños 442 6.99 68.03 Mancha negra 413 6.53 74.56 Raya plateada 413 6.53 81.09 Marca de hundimiento 371 5.87 86.96 Marca de spray 292 4.62 91.58 Impacto en el molde 275 4.35 95.93 Embarque 258 4.08 100.00 Total 6,324 100.01
Defectos en el teclado de Computadoras para un periodo de tres meses
258 275 292 371 413 413 442 83410391987
4.1 4.3 4.6 5.9 6.5 6.5 7.013.216.431.4100.0 95.9 91.6 87.0 81.1 74.6 68.0 61.0 47.8 31.4
6000
5000
4000
3000
2000
1000
0
100
80
60
40
20
0
Defect
CountPercentCum %
Perc
ent
Coun
t
Gráfica de Pareto de las Razones
Interpretación del Diagrama de Pareto
La figura anterior presenta las barras de forma vertical a lo largo de al línea de porcentaje acumulado. La línea acumulativa está trazada en el punto medio de cada barra a una altura semejante al porcentaje acumulado.
Si sigue la línea, verá, por ejemplo, que las 3 primeras categorías abarcan más del 60% de las correcciones.
Como las categorías del diagrama de Pareto están ordenadas por la frecuencia de ocurrencia, quienes toman decisiones podrán ver dónde concentrar sus esfuerzos para mejorar el proceso.
Los intentos de reducir los defectos por deformación, daño y marcas de clavijas deberán generar el mayor gasto. Después podrán hacerse esfuerzos para reducir los rasguños y las manchas negras.
Cómo construir un Diagrama de Pareto utilizando el programa MINITAB
Ejemplo: (pág. 715, Lind-Marchal, edit. Mc. Graw-Hill, 13ª. Edic)
El administrador de una ciudad, está preocupado por
consumo de agua, en particular en los hogares unifamiliares.
Le gustaría desarrollar un plan para reducir el consumo de agua en esa ciudad.
Para investigar esto, selecciona una muestra de 100 hogares y determina el consumo normal de agua diario para diversos fines.
En la siguiente diapositiva se muestran los resultados de la muestra:
Cómo construir un Diagrama de Pareto utilizando el programa MINITAB
Consumo de agua Galones por día
Lavandería 24.9
Regar el jardín 143.7
Baño personal 106.7
Cocinar 5.1
Alberca 28.3
Lavar trastos 12.3
Lavar automóvil 10.4
Beber 7.9
Pasos para realizar el Diagrama de Pareto en Minitab
Un diagrama de Pareto es útil para identificar las áreas principales de consumo de agua y enfocarse en aquéllas donde se obtenga la mayor reducción.
Es conveniente convertir cada actividad en porcentaje y luego, ordenarlas de mayor a menor.
El consumo total de agua es de 339.3 galones
Paso # 1 Escriba las razones del consumo de agua en la columna C1, los galones consumidos en C2 y el porcentaje en C3. Anote los nombres
adecuados en cada columna
Paso 2: Haga clic en Stat, Quality Tols, Pareto Chart y luego oprima enter
Paso 3: seleccione Chart defects table, e indique la ubicación de las clasificaciones y frecuencias
Paso 4:Se anotan los datos de las columnas tal como se indicó en
el paso anterior, en Chart defects table
Paso 5:Haga clic en Options y escriba el título de la gráfica,
después haga clic en OK
Paso 6Se observa como resultado de los pasos
anteriores la gráfica del diagrama de Pareto
Matriz de datos y la Tabla de distribución de Frecuencias
Cuando los datos son cuantitativos, dos de las formas en que podemos organizar los datos son:
a) La matriz de datos b) La tabla de distribución de
frecuencias
Representación de datos
A continuación se lista la tasa de natalidad (nacimientos por cada 1000 habitantes) para 105 países.
Al examinar estas cifras, observamos que algunos países tenían una tasa de natalidad más alta que otros.
Si quisiéramos aprender más de esta información, sería útil que los datos se listaran de un modo más ordenado.
(A) Datos originales42.7 29 45.1 19.5 14.1 11.2 22.1
34.6 13 11.5 47.3 31.6 21.2 11.8
48.1 28 43.4 44.4 40.4 13.7 42.1
20.3 17.8 21.9 46.2 14.5 13.5 12.4
24.1 25.1 28.7 32.4 46.7 12.2 13
15.8 11 43.6 10.6 34.7 43.4 38.6
34.1 12 12.7 27.8 24.1 34.9 43.6
20.4 10.9 10.7 19.3 41.7 23.3 15.6
44.9 44.8 49.8 28 51.9 26.6 27.9
44.6 37.3 12.4 54.8 43.3 41.8 31.5
24.9 30.4 13.3 11.7 13.7 12.6 48.5
38.8 42.9 14.2 14.5 45.5 33.4 11.2
18.1 41.3 13.2 12 43.2 15.3 34.1
45.3 18.9 22.5 25.3 48 12.3 13.2
29.5 25.1 26.3 44.9 48.3 45.5 36.4
b) Matríz de datos (de menor a mayor)
10.6 12.6 15.6 24.1 31.5 41.7 44.9
10.7 12.7 15.8 24.9 31.6 41.8 45.1
10.9 13 17.8 25.1 32.4 42.1 45.3
11 13 18.1 25.1 33.4 42.7 45.5
11.2 13.2 18.9 25.3 34.1 42.9 45.5
11.2 13.2 19.3 26.3 34.1 43.2 46.2
11.5 13.3 19.5 26.6 34.6 43.3 46.7
11.7 13.5 20.3 27.8 34.7 43.4 47.3
11.8 13.7 20.4 27.9 34.9 43.4 48
12 13.7 21.2 28 36.4 43.6 48.1
12 14.1 21.9 28 37.3 43.6 48.3
12.2 14.2 22.1 28.7 38.6 44.4 48.5
12.3 14.5 22.5 29 38.8 44.6 49.8
12.4 14.5 23.3 29.5 40.4 44.8 51.9
12.4 15.3 24.1 30.4 41.3 44.9 54.8
c) Tabla de Distribución de Frecuencias (número de países en cada categoría)
Nacimientos (por cada 1000 habitantes) Número de países
10 – menos de 15 29 15 – menos de 20 8 20 – menos de 25 10 25 – menos de 30 12 30 – menos de 35 10 35 – menos de 40 4 40 – menos de 45 18 45 – menos de 50 12 50 – menos de 55 2
La matriz de datos En comparación con la lista original de datos, la matriz de datos
es útil porque presenta los datos en orden numérico creciente o decreciente.
VENTAJAS: 1) Podemos determinar de un vistazo el menor y el mayor valor
de los datos. Observamos con facilidad que las tasas de natalidad van desde un mínimo de 10.6 (Grecia) hasta un máximo de 54.8 (Nigeria)
2) Podemos identificar grupos de valores de datos similares. Por ejemplo, observamos que tres países tenían una tasa de natalidad menor que 11 y que dos tenían una tasa de natalidad mayor que 50
3) Apreciamos las diferencias entre los valores de los datos. Por ejemplo, el país con la más alta tasa de natalidad (54.8) está 2.9 unidades por encima del segundo lugar (51.9)
Tasa de natalidad de 105 países
10.6 12.6 15.6 24.1 31.5 41.7 44.9
10.7 12.7 15.8 24.9 31.6 41.8 45.1
10.9 13 17.8 25.1 32.4 42.1 45.3
11 13 18.1 25.1 33.4 42.7 45.5
11.2 13.2 18.9 25.3 34.1 42.9 45.5
11.2 13.2 19.3 26.3 34.1 43.2 46.2
11.5 13.3 19.5 26.6 34.6 43.3 46.7
11.7 13.5 20.3 27.8 34.7 43.4 47.3
11.8 13.7 20.4 27.9 34.9 43.4 48
12 13.7 21.2 28 36.4 43.6 48.1
12 14.1 21.9 28 37.3 43.6 48.3
12.2 14.2 22.1 28.7 38.6 44.4 48.5
12.3 14.5 22.5 29 38.8 44.6 49.8
12.4 14.5 23.3 29.5 40.4 44.8 51.9
12.4 15.3 24.1 30.4 41.3 44.9 54.8
Pasos para hacer en Excel la Matriz de Datos
1. Acomodar en una sola columna los datos 2.- Seleccionar: Herramientas, Análisis de Datos,
“Rango y Percentiles” y Aceptar 3.- En el Rango de entrada: seleccionar los datos
dependiendo de la columna donde se encuentren 4.- Agrupar por columnas 5.- Si tenemos en la columna algún nombre,
seleccionar “etiquetas en la primera fila” 6.- En Rango de salida: darle clic a cualquier
casillero donde queramos que aparezcan los resultados de la matriz
Resultados parciales del Excel de la matriz de datos
Posición TASA DE NATALIDAD Jerarquía Porcentaje
105 54.8 1 100.00%
104 51.9 2 99.00%
103 49.8 3 98.00%
102 48.5 4 97.10%
101 48.3 5 96.10%
100 48.1 6 95.10%
99 48 7 94.20%
98 47.3 8 93.20%
97 46.7 9 92.30%
96 46.2 10 91.30%
94 45.5 11 89.40%
95 45.5 11 89.40%
93 45.3 13 88.40%
92 45.1 14 87.50%
90 44.9 15 85.50%
“Tabla de Distribución de Frecuencia”Presenta los datos de una manera condensada que
se comprende con rapidez y se interpreta con facilidad
En el programa EXCEL anotamos lo siguiente: a) Escribimos “clase” en la celda C1 b) Introduzca las divisiones de las clases: de 10 a 55 en
múltiplos de 5 en alguna de las celdas (D24-D33) por ejemplo c) Haga clic en: Herramientas, Análisis de Datos. seleccione: Histograma y OK d) Escriba el rango de datos: A1:A106 en el Rango de Entrada Escriba en el Rango de clases: D24-D33 Haga clic para marcar el cuadro de etiquetas (si cada variable
tiene su nombre en la primera celda de su bloque) e) Seleccione Rango de salida: E23
Continuación de la tabla de distribución de frecuencias en Excel
f) Haga clic para marcar el cuadro: Porcentaje Acumulado
Haga clic para marcar el cuadro: Crear Gráfica Haga clic en Aceptar (OK)
h) Dentro de la gráfica, haga clic con botón derecho e irse a
opciones de gráfico En Eje de categorías escribir: Tasa de Natalidad Haga doble clic en cualquiera de las barras de la gráfica Seleccione Opciones y ponga Ancho de separación en 0 Haga clic en Aceptar
TABLA DE DISTRIBUCIÓN DE FRECUENCIAS (EXCEL)
Histograma
0
5
10
15
20
25
30
35
10
Fre
cu
en
cia
.00%
20.00%
40.00%
60.00%
80.00%
100.00%
120.00%
Frecuencia
% acumulado
INFORMACIÓN QUE APARECE JUNTO CON LA TABLA DE DISTRIBUCIÓN DE FRECUENCIAS (EXCEL)
CLASE 10 Frecuencia % acumulado 10 Frecuencia % acumulado
10 15 29 27.62% 15 29 27.62%
15 20 8 35.24% 45 18 44.76%
20 25 10 44.76% 30 12 56.19%
25 30 12 56.19% 50 12 67.62%
30 35 10 65.71% 25 10 77.14%
35 40 4 69.52% 35 10 86.67%
40 45 18 86.67% 20 8 94.29%
45 50 12 98.10% 40 4 98.10%
50 55 2 100.00% 55 2 100.00%
55 y mayor... 0 100.00% y mayor... 0 100.00%
FORMAS DE LAS CURVAS DE FRECUENCIA
CALIFICACIÓN
FRECUENCIA
CALIFICACIÓN
FRECUENCIA
CALIFICACIÓN
FRECUENCIA
CALIFICACIÓN
FRECUENCIA
EN FORMA DE CAMPANA RECTANGULAR O UNIFORME
EN FORMA DE UEN FORMA DE J
FORMAS DE LAS CURVAS DE FRECUENCIA
FRECUENCIA FRECUENCIA
CALIFICACIÓN CALIFICACIÓN
SESGO POSITIVO SESGO NEGATIVO
SESGO POSITIVO: LA MAYOR PARTE DE LOS DATOS SE CONCENTRA EN LOS VALORES BAJOSDEL EJE HORIZONTAL Y LA CURVA DISMINUYE HACIA EL EXTREMO DE LOS VALORES ALTOS
SESGO NEGATIVO: LA MAYOR PARTE DE LOS DATOS SE CONCENTRA EN LOS VALORES ALTOS DELEJE HORIZONTAL Y LA CURVA SE REDUCE HACIA EL EXTREMO DE LOS VALORES BAJOS
TÉCNICAS DE OBSERVACIÓN DE FENÓMENOS O HECHOS
• POBLACIÓN Y MUESTRA
• OPERACIONALIZACIÓN DE VARIABLES
• CONSTRUCCIÓN DE INSTRUMENTOS
• ELABORACIÓN DE BASE DE DATOS
• ANÁLISIS DE DATOS
POBLACIÓN Y MUESTRA
• ¿Qué es la muestra?
• Es la parte de la población que se selecciona, y de la cual realmente se obtiene la información para el desarrollo del estudio y sobre la cual se efectuarán la medición y la observación de las variables objeto de estudio
POBLACIÓN Y MUESTRA
• ¿De qué depende el tamaño de la muestra que se necesita para un estudio?
• ¿Cómo sabemos si una muestra es representativa de la población?
• ¿Cuáles son los beneficios de tomar información de una muestra?
• ¿Mediante qué tipo de instrumento puedo obtener información de una muestra de una población?
• ¿Qué es un muestreo con reemplazo?
• ¿Qué es un muestreo sin reemplazo?
PASOS PARA LA SELECCIÓN DE UNA MUESTRA
• 1. Definir la Población (elementos o Individuos con características similares y sobre las cuales se desea hacer inferencia)
• 2. Identificar el marco muestral (es la lista, el mapa o la fuente de donde pueden extraerse todas las unidades de muestreo)
• 3. Determinar el tamaño de la muestra (estimación estadística del tamaño de la muestra que desea realizarse)
• 4. Seleccionar la muestra (parte representativa de la población a estudiar en forma probabilística o no probabilística)
MÉTODOS o TÉCNICAS DE MUESTREO
• 1. MUESTREO PROBABILÍSTICO:
• - Aleatorio simple
• - Sistemático
• - Aleatorio estratificado
• - Por cúmulos
• 2. NO PROBABILÍSTICO
• - Por conveniencia
• - Por cuotas
• NOTA: La selección del tipo de muestreo va de acuerdo a la investigación que estás realizando
ESTRATEGIA DE MUESTREO PROBABILÍSTICA
Posibilidad de que los miembros de las unidades difieran entre sí y reduzcan la efectividad del muestreo
Fácil y cómodoCuando la población consiste en unidades más que en individuos
MUESTREO POR CÚMULOS
Tardado y tediosoAsegura un alto grado de
representatividad de todos los
estratos de la población
Cuando la población es de
naturaleza heterogénea y contiene varios grupos distintos
MUESTREO ALEATORIO
ESTRATIFICADO
Menos verdaderamente aleatorio que el
muestreo aleatorio simple
Asegura un alto grado de
representatividad
No hay que usar una tabla de
números aleatorios
Cuando los miembros de la población son todos similares
MUESTREO SISTEMÁTICO
Tardado y tediosoAsegura un alto grado de
representatividad
Cuando los miembros de la población son
similares
MUESTREO ALEATORIO SIMPLE
DESVENTAJASVENTAJASCUÁNDO DEBE USARSE
TIPO DE MUESTREO
ESTRATEGIA DE MUESTREO NO PROBABILÍSTICA
La representatividad
es dudosa
Asegura cierto grado de
representatividad de todos los estratos de la
población
Cuando hay estratos pero no es posible un muestreo estratificado
Muestreo por cuotas
Desventajas
La representatividad
es dudosa
Ventajas
Cómodo y económico
Cuándo debe usarse
Cuando la muestra es
cautiva
Tipo de muestreo
Muestreo de Conveniencia
Técnicas de Muestreo
Hay dos maneras de elegir los individuos de la muestra:
A. Por muestreo ProbabilísticoB. Por muestreo No Probabilístico
Solamente el muestreo Probabilístico permite generalizar (con determinado margen de error) en la población total los resultados obtenidos (hacer inferencias)
El muestreo No Probabilístico no autoriza la generalización
Requisitos para que una muestra sea representativa en un estudio
Para que una realmente la muestra sea representativa deberá cumplir con los requisitos que marca la teoría de la probabilidad, es decir:
¡QUE SEAN ELEGIDOS AL AZAR !
Cálculo del tamaño de la Muestra
El cálculo del tamaño de una muestra depende de 3 factores:
1. El porcentaje de confianza con que se desea generalizar los datos en la población total
2. El porcentaje de error que se está dispuesto a aceptar en tal generalización
3. El nivel de variabilidad que se calcula para la comprobación de la hipótesis
Porcentaje de Confianza
El 100% de confianza para generalizar los resultados indicaría que todos los individuos de la población, sin excepción, comparten las conclusiones obtenidas del estudio de los individuos de la muestra.
Pero para lograr 100% de confianza hay que estudiar todos los casos de la población.
Como esto resulta costoso en tiempo y dinero, lo que se hace es tolerar que haya algunos sujetos de cada cien (de la población) que no compartan las conclusiones del estudio de la muestra
…… porcentaje de confianza
Si se eligiera 80% de confianza en la selección de una muestra, el tamaño resultante indicaría:
Que existe la seguridad de generalizar sólo 80% de sujetos de la población.
Cuanto mayor sea el % de confianza que se escoja, mayor será la cantidad de sujetos necesarios para la muestra.
En investigaciones de tipo social, por lo general, se busca un 95% de confianza
Porcentaje de error
Elegir el porcentaje de error significa seleccionar la probabilidad de aceptar una hipótesis falsa, o a la inversa: rechazar una hipótesis verdadera
Si se buscara un 0% de error, significaría que no se está dispuesto a correr este tipo de riesgos y entonces, la muestra podría ser igual a la población, por tanto, es preferible aceptar algún riesgo.
Es frecuente que los investigadores acepten de 4 a 8% de error.
Por ejemplo: 4 % de error significa que existen 4 de 100 posibilidades de equivocarse.
NOTA: No debe entenderse que el porcentaje de error es complementario del porcentaje de confianza:
ejemplo: se puede tener 96% de confianza y 6% de error
Variabilidad
Cuando se ha aplicado el instrumento de recolección de datos en otros estudios, se puede esperar que la nueva contrastación en otro lugar sea similar a las anteriores.
Ejemplo: suponga que se aplicó un cuestionario y se obtuvo que el 70% de los sujetos de la muestra confirmó la hipótesis, mientras que las respuestas del otro 30% sugerían que la hipótesis debía rechazarse.
Suele darse un valor simbólico a la variabilidad: Se usa “p” para indicar los cuestionarios a favor de la hipótesis =
70% Se usa “q” para indicar los cuestionarios en contra de la hipótesis
= 30%
resumiendo: p = 0.7 y q = 0.3
Variabilidad
En caso de que no se haya aplicado nunca el instrumento de recolección, se pueden seleccionar algunas personas de la población a encuestar (digamos 20 por ejemplo) para que contesten el instrumento y analizar sus respuestas a fin de conocer el grado de variabilidad que se espera en la población.
Cuando no se dispone de tiempo suficiente para realizar esta «preprueba» o «piloteo» lo que se recomienda es aceptar la máxima variabilidad que consiste en:
p = 0.5 y q = 0.5
TAMAÑO DE LA MUESTRACuando se desconoce el tamaño de la población
Fórmula:
n= (Z2pq) (e2) Donde: n = tamaño de la muestra Z2 = nivel de confianza p = variabilidad positiva q = variabilidad negativa e2 = precisión o error
Ejemplo del cálculo del tamaño de la muestra cuando se desconoce el tamaño de la población
Datos: Nivel de confianza del 95%: Z = 1.96 (tablas de curva normal) Máxima variabilidad: p= 0.5 y q = 0.5 Nivel de error = 5% = 0.05
n = (1.96)2(0.5)(0.5) = 384.16 (.05)2
TAMAÑO DE LA MUESTRACuando se conoce el tamaño de la población
Fórmula:
n = (Z2 pq N)__ (Ne2 + Z2 pq)
Donde: n = Tamaño de la muestra Z = nivel de confianza p = variabilidad positiva q = variabilidad negativa N = tamaño de la población e = precisión o error
CÁLCULO DEL TAMAÑO DE LA MUESTRACuando se conoce el tamaño de la población
Datos: n = Tamaño de la muestra = ? Z = nivel de confianza = 95% = 1.96 p = variabilidad positiva = 0.5 q = variabilidad negativa = 0.5 N = tamaño de la población = 11,730 e = precisión o error = 5% = 0.05
n = [(1.962) (0.5)(0.5)(11,730)] [(11,730)(.052) + (1.962)(0.5)(0.5)]
n = 371.977
Ejercicios para el alumno
1.- Calcule el tamaño de una muestra en que se pide 4% de error, 94% de confiabilidad y la máxima variabilidad
2.- Con estos mismos datos del ejercicio anterior, calcule el tamaño de una muestra en la que además, se conoce que el tamaño de la población es de 3,267
3.- Calcule el nivel de error si tenemos 250 elementos en la muestra,
92 % de confiabilidad y variabilidad positiva del 60%
4.- Calcule el nivel de confianza si tenemos un nivel de error del 3%, la muestra se compone de 500 elementos y existe una máxima variabilidad
¿A quiénes de la población se debe escoger si ya tenemos la muestra calculada?
Para esta situación, se tienen diversas técnicas de muestreo
Tipos (técnicas) de Muestreo: a) Probabilístico: consiste en escoger al azar
cada uno de los individuos en la muestra b) No probabilístico: este tipo de muestreo no
permite generalizar los resultados a la población, por tanto se usa en estudios de tipo exploratorios, de casos o cualquier otro que no requiera generalizar
Muestreo ProbabilísticoTécnicas: muestreo aleatorio simple, muestreo aleatorio estratificado y muestreo sistemático
a) Muestreo aleatorio simple: garantiza, en teoría, que cada uno de los individuos de la población tenga la misma oportunidad de aparecer en la muestra.
Por ejemplo: se selecciona totalmente al azar a los sujetos de una población, escribimos su nombre en un papelito, luego todos los nombres se ponen en una esfera abierta, se revuelven y después se van sacando de uno en uno hasta completar la cantidad deseada.
Otra manera de hacerlo es a través de generar números aleatorios para conformar la muestra necesaria de una población
Por ejemplo para generar números aleatorios menores que 100 escribimos en el programa excel: =ALEATORIO()*100
Paso I:Imagen de una hoja en el programa Excel para
empezar a generar números aleatorios menores que 100
Paso IIVamos a suprimir las decimales que aparecen en la
generación de los números aleatorios, dando clic botón derecho a la celda generada
Paso IIIsecuencia para quitar los decimales que
aparecen en las celdas
Paso IVYa generado el primer número aleatorio, podemos copiar desde
la primer celda hacia abajo la cantidad que se requiera
Uso del Análisis de Datos en Excel Muestreo Aleatorio Simple
Las sritas. Alexandra y Myriam administran “El Popeye Inn”, una pensión donde dan alojamiento y desayuno, localizada en cd. Guzmán, Jal. Se rentan ocho habitaciones en esta pensión.
A continuación aparece el número de estas ocho
habitaciones rentadas diariamente durante el mes de Octubre del 2009.
Utilice el programa “Análisis de datos” en Excel para seleccionar una muestra de cinco noches de Octubre
Tabla con los datos de las habitaciones en renta en el mes de Octubre del 2009, en la pensión “El
Popeye Inn”
Paso 1: en el Análisis de Datos de Excel para seleccionar una muestra de 5 noches de Octubre:
dar clic en: Datos, Análisis de datos y Muestra
Paso 2: llenar el cuadro de la Muestra:Rango de entrada: B1: B31; dar clic en Rótulos
Método de muestreo: AleatorioNúmero de muestras: 5
Rango de Salida: D1
Paso 3:Revisar que la información capturada esté correcta
posteriormente darle clic en Aceptar
Paso 4:La respuesta por parte del programa Excel es la siguiente
NOTA: Excel toma muestras con reemplazo, así que es posible que el valor de una población aparezca más de una
vez en la muestra
b) Muestreo aleatorio estratificado(muestreo probabilístico)
Implica el mismo procedimiento que el aleatorio simple; la diferencia radica en que la población se subdivide en grupos o estratos más pequeños.
Por ejemplo: encuestar a los trabajadores de una empresa de
polímeros. La subdividimos en obreros y empleados administrativos.
El total de trabajadores es = 836 El estrato de obreros es = 489 El estrato de empleados = 347 Confiabilidad = 90% Precisión o error = 5% Máxima variabilidad: p = 0.5 y q = 0.5
b) Muestreo aleatorio estratificado(muestreo probabilístico)
Fórmula: n = (Z2 pq N)/(Ne2 + Z2 pq)
Cálculo: n = [(1.652)(0.5)(0.5)(836)] = 205.34
[(836)(.052) + (1.652)(0.5)(0.5)] Cálculo de la cantidad de elementos en los estratos: % obreros = (489/836) = 0.5849 % administrativos = (347/836) = 0.415 Muestra estratificada: Obreros: 205.34 (0.5849) = 120 Empleados: 205.34 (0.415) = 85
Tabla de la muestra estratificada
Población Tamaño de población por
estratos
Tamaño de muestra por estratos
Obreros 489 120
Empleados 347 85
Total 836 205
Muestreo no probabilístico
Las técnicas de muestreo no probabilísticos que vamos a estudiar son dos:
1.- MUESTREO POR CUOTAS 2.- MUESTREO POR ACCIDENTE
Nota: hay que recordar que este tipo de muestreo no permite generalizar los resultados a la población.
Este tipo de muestreo se usa en estudios de tipo:a) EXPLORATORIOb) DE CASOSc) CUALQUIER OTRO TIPO QUE NO REQUIERA GENERALIZAR
Muestreo por CUOTAS(no probabilístico)
En el muestreo por cuotas se determina la cantidad (cuota) de individuos de una población, para que sean miembros de la muestra. No hay un procedimiento especial para establecer la cuota.
El criterio es arbitrario, simplemente puede determinarse encuestar, por ejemplo, a 35 hombres y a 35 mujeres que compartan ciertas características específicas según la definición que el estudio señale.
Muestreo por accidente(no probabilístico)
Consiste en seleccionar de manera arbitraria los individuos para la muestra.
Por ejemplo, los investigadores que se van a una plaza comercial y, sin ningún otro criterio, encuestan a cualquier persona que se encuentre de paso por ahí. Por eso se denomina muestreo accidental.
Las conclusiones que obtenga el investigador con este tipo de muestreo impiden suponer que «las personas que van a la plaza comercial piensan y opinan de tal forma», ya que la muestra no es aleatoria.
Técnicas de Recolección de Datos
Objetivo
Presentar un procedimiento para diseñar instrumentos de recolección: desde la hipótesis hasta el instrumento
Técnicas e instrumentos de recolección
Método: es el camino que se que se sigue para lograr una meta u objetivo; es el procedimiento que se recorre en la investigación para obtener conocimientos.
Cabe mencionar que existen muchos métodos y, por ello, una gran variedad de formas de lograr los objetivos.
Es casi imposible hablar de «todos los pasos» de cada método, ya que dependen del objeto de estudio y de los objetivos que se pretendan alcanzar en una investigación
Técnicas e instrumentos de recolección
Técnica se define como: «un conjunto de reglas y operaciones para el manejo de los instrumentos que auxilian al individuo en la aplicación de los métodos» (Rojas Soriano, R. 1991, p.63)
El instrumento puede entenderse como el dispositivo o conector que permite captar los datos que se obtendrán para, después de analizarlos, decidir si se acepta o se rechaza la hipótesis de investigación.
Ejemplo de Instrumento: Un cuestionario
Técnicas e instrumentos de recolección
La captación de datos es válida, si el o los instrumentos se aplican con las condiciones de la técnica respectiva.
Por ejemplo: Que un conjunto de personas conteste un cuestionario
(instrumento), a través de la indicación de las normas técnicas de la encuesta (indicaciones iguales a todos, un tiempo igual para contestar, condiciones iguales de aplicación, etc). El instrumento es sólo el listado de preguntas.
Hacer que los datos sean válidos y confiables depende de que se sigan los preceptos de la técnica, en este caso de la encuesta.
Instrumentos de recolección de datos
Operacionalización es el nombre que recibe el proceso mediante el cual se determina el instrumento
El término "Indicador" en el lenguaje común, se refiere a datos esencialmente cuantitativos, que nos permiten darnos cuenta de cómo se encuentran las cosas en relación con algún aspecto de la realidad que nos interesa conocer. Los Indicadores pueden ser medidas, números, hechos, opiniones o percepciones que señalen condiciones o situaciones específicas.
¿Cuál es la importancia de los indicadores?
1. Permite medir cambios en esa condición o situación a través del tiempo.
2. Facilitan mirar de cerca los resultados de iniciativas o acciones
3. Son instrumentos muy importantes para evaluar y dar surgimiento al proceso de desarrollo.
4. Son instrumentos valiosos para orientarnos de cómo se pueden alcanzar mejores resultados en proyectos de desarrollo.
Ejemplos de indicadores
Administrativos: Eficiencia, efectividad y eficacia
Económicos: PIB, inflación, Devaluación, tasa de interés, exportaciones, imprtaciones, IED, tasa de la deuda neta del Gobierno Federal (% PIB), tipo de cambio, etc.
Calidad: satisfacción del cliente, evaluación, seguimiento y comparación de los servicios, tiempo de entrega, tiempo de demora.
Salud: la tasa de hemorragias cerebrales en pacientes con infarto agudo de miocardio sometidos a fibrinolisis; número de pacientes que reingresa en urgencias en las 48 siguientes al alta o proporción de salidas falsas en servicios de emergencia.
Técnicas e instrumentos de recolección
Los analistas utilizan una variedad de métodos a fin de recopilar los datos sobre una situación existente, como
Observación Entrevista Encuesta Tests Cuestionarios Generalmente, se utilizan dos o tres para
complementar el trabajo de cada una y ayudar a asegurar una investigación completa
Técnicas de recolección de datos:«Observación»
La observación es por excelencia la técnica de investigación de cualquier ciencia
La observación científica se define como:
«la percepción dirigida de los objetos o fenómenos de la realidad»
Para la Observación, se pueden emplear los siguientes instrumentos
para recolectar datos:
1. El cuaderno de notas
2. El diario3. Grabador y reproductor de sonidos
4. Video-grabadora
Técnicas de recolección de datos:«Observación»
En el acto de la observación se puede distinguir:1.El objeto de la observación2.El sujeto de la observación3.Los medios para la observación4.Las condiciones de la observación5.El sistema de conocimientos a partir del cual se formula la finalidad de la observación y se interpretan los resultados de ésta
Técnicas de recolección de datos:«Tipos de Observación»
Observación No participante: En este paradigma de observación el investigador
intenta actuar como una cámara fotográfica, como una mente con manos que registra la naturaleza tal como ocurre, sin perturbarla o modificándola lo menos posible.
La objetividad consiste en que el observador se convierta casi en una máquina que únicamente registre lo que ve y oye.
Técnicas de recolección de datos:«Tipos de Observación»
Observación participante: Se parte del supuesto, en las ciencias sociales,
de que «lo observado» tiene las mismas características que el observador y, por ello, es mucho más difícil ser objetivos.
Cuando se actúa con el mismo esquema de objetividad que en las ciencias naturales se pierde objetividad, debido a que se capta al sujeto de manera distorsionada, es decir, «participa» con los sujetos que observa.
Técnicas de recolección de datos:«Tipos de Observación»
El observador participante tiene que cumplir dos papeles o roles:
1) Ubicarse como uno más entre los objetos que observa
2) Por otra parte, excluirse para registrar, de la forma más objetiva, lo que allí ocurre
Técnicas e instrumentos de recolección«Entrevista Abierta»
Entrevista abierta o no estructurada
Se trata de una conversación que dirige el entrevistado, pero que controla el entrevistador. Este tipo de entrevistas se privilegian en la investigación clínica.
Generalmente, el entrevistado informará respecto de sí mismo: su desempeño, capacidad, personalidad, síntomas o enfermedades, etc. según el tipo de especialista que lo entrevista.
La información vertida se analiza y se evalúa después.
Técnicas e instrumentos de recolección«Entrevista Abierta»
En la mayor parte de los estudios lo más común es la entrevista semiabierta. Esto significa que sí se tipifican algunas preguntas que sirven como guía de la entrevista (instrumento), pero que conforme se formulan pueden conducir a otras no previstas inicialmente.
Esto es más común en profesionales como periodistas, trabajadores sociales, sociólogos, economistas, entre otros.
Técnicas e instrumentos de recolección«Entrevista Cerrada»
Se conduce de manera rígida por medio de una lista de preguntas que funciona como una guía, de la cual el entrevistador no puede desviarse.
El entrevistador memorizará un formulismo que repetirá exactamente igual con todos sus entrevistados.
Este tipo de entrevistas, por ejemplo, puede tener el propósito de recabar opiniones de grupos con características similares para conocer su posición respecto de algo o bien recabar opiniones de grupos diferentes para comparar efectos de alguna decisión tomada antes
Técnicas e instrumentos de recolección«Entrevista Cerrada»
En este tipo de entrevistas, el instrumento es exactamente igual que el de una encuesta. La diferencia consiste en que, en esta técnica de recolección, el entrevistador contesta el cuestionario, no el entrevistado.
Suele usarse para censos en que se parte del supuesto de que no todas las personas saben leer
Técnicas e instrumentos de recolección«Encuesta»
La técnica de la encuesta consiste en la interrogación sistemática de individuos a fin de generalizar.
Se usa para conocer la opinión de un determinado grupo de personas respecto de un tema que define el investigador.
Se usa principalmente para conocer la opinión de las personas respecto a una variedad de temas: servicios públicos, desempeño de profesores en una universidad, productos comerciales, etc.
Técnicas e instrumentos de recolección«Encuesta»
En la técnica de la encuesta, primero se selecciona una cantidad de sujetos que sea representativa de la población (o clase de sujetos) de interés.
Esa muestra contestará un cuestionario (instrumento) y después la información recabada se usará para generalizar a todos los individuos de la población
Al procedimiento de seleccionar sólo algunos sujetos de la población se le denomina «muestreo».
Diseño de Cuestionario
El cuestionario es el listado de preguntas que deberán contestar los sujetos de la muestra.
Las preguntas o los reactivos que contiene el instrumento se deducen de las hipótesis y de los objetivos de la investigación.
El instrumento de la encuesta o cuestionario debe diseñarse de modo que resulte de fácil comprensión y que no sea necesaria ninguna información adicional.
Diseño de Cuestionario
Antes de escribir las preguntas debe decidirse si para lograr los objetivos y probar las hipótesis es más conveniente usar preguntas cerradas o abiertas, o bien una combinación de ambas.
Preguntas cerradas Se llama pregunta cerrada a la que proporciona
opciones de respuesta para que el sujeto respondedor elija la que más se acerque a su situación.
El investigador puede diseñar diferentes formas de preguntas cerradas:
1) Opción mutuamente excluyente2) Opción múltiple con más de una elección3) Elección de un número determinado de opciones4) Ordenación jerárquica de opciones
Preguntas cerradas
1) Opción mutuamente excluyente En esta opción el encuestado deberá
seleccionar una de las dos o más opciones de respuesta.
Por ejemplo: verdadero o falso; si o no; solero, casado, divorciado, viudo etc.
Lo importante es que al elegir una se excluyan las demás.
Preguntas cerradas
2) Opción múltiple con más de una elección El encuestado elige más de una opción, por ejemplo, ante la indicación: «de las siguientes materias, subraya las que te gusten más:a)Matemáticasb)Psicologíac)Economíad)Administracióne)Literatura»Nota: aquí el respondedor pude elegir más de una opción
Preguntas cerradas
3) Elección de un número determinado de opciones
En este caso, las preguntas podrían ser como en el caso # 2, con la única diferencia de que se indica la cantidad y el orden en la instrucción
Una opción de pregunta sería la siguiente: «enumere en orden de importancia las tres materias que le gusten más»
Preguntas cerradas
4) Ordenación jerárquica de opciones
Aquí se ofrecen opciones de respuesta que el sujeto debe numerar en orden de importancia, según su opinión.
La diferencia entre este tipo de ítem y el anterior consiste que en éste se deben ordenar todas las opciones
Preguntas Abiertas
Las preguntas abiertas son las que se formulan sin escribir opciones de respuesta. En éstas el encuestado contestará lo que le parezca pertinente.
Este tipo de preguntas se usan con mayor frecuencia en los estudios exploratorios.
Habrá tantas respuestas como personas encuestadas.
Es usual clasificar las respuestas en grupos, de acuerdo con un criterio que impone el investigador, según lo requiera el estudio.
Este procedimiento recibe el nombre de cerrar preguntas
Redacción de las preguntas
1) Debe cuidarse en el diseño del cuestionario la redacción de las preguntas (ítems o reactivos).
2) Aunque los indicadores estén bien definidos, de acuerdo con el marco referencial de la investigación, es preciso que el lenguaje se adecue al tipo personas que se consultarán.
3) La redacción de las preguntas debe ser sencilla, clara y concisa.
4) Evitar en lo posible cansar al que responde el cuestionario con preguntas que exigen de él muchos datos.
Redacción de las preguntas
5) La pregunta debe redactarse con ideas afirmativas, evitando negaciones. Por ejemplo: ¿no está satisfecho con su empleo actual? Será mejor cambiarla por: ¿está satisfecho con su empleo actual?
6) Es mejor la redacción desprovista de carga emocional, es decir, seleccionar palabras que no sean peyorativas (que indica una idea desfavorable o despectiva)
7) Redactar la pregunta de manera que no sugiera la respuesta
8) Deben evitarse las preguntas en las que sea muy probable que todos contesten igual. Por ejemplo: ¿te gustaría ganar más sueldo?
9) Deben evitarse las preguntas sin relación directa con el estudio actual (de relleno)
Validez y Confiabilidad de un cuestionario
1. Validez:
Es la capacidad de captar de manera significativa y con un grado de
exactitud satisfactoria, las variables de la hipótesis que se ponen a
prueba.
2) Se trata que el instrumento mida aquello para lo que se diseñó.
3) Cuando existe otro instrumento validado, se aplican ambos y luego se comparan los resultados, así se juzga el nivel de precisión con que el cuestionario capta aquello para lo que se diseñó.
4) En la mayoría de las veces, no se cuenta con este recurso de comparación externa.
Validez y Confiabilidad de un cuestionario
…. Validez
5) Una segunda manera de validar un cuestionario es aplicarlo a personas con actitud conocida, conocimiento u opinión respecto al tema que el instrumento mide y comprobar su validez de ese modo
6) Una tercera forma, es la «administración de los reactivos o preguntas a jueces». Este método parte del supuesto de que todo instrumento de recolección es producto del proceso de operacionalización.
Derivación de un cuestionario a partir de la operacionalización de variables
A B
a1 a2 b1 b2
Variables
dim
ensi
ones
indic
adore
s
Las preguntas del cuestionario captan todos los indicadores
Confiablidad
La confiabilidad es la capacidad de un instrumento de arrojar resultados equivalentes entre los que responden, independientemente de quién lo aplique
Para lograr esto, el instrumento (cuestionario) debe aplicarse exactamente en las mismas condiciones a todos los sujetos. Esto significa que cada uno recibe una copia del mismo instrumento y, por tanto, la presentación y el orden de las preguntas será el mismo para todos.
Se deben cuidar las condiciones de aplicación: espacio, horario, iluminación, actitud del encuestado, etc.
Confiablidad
Cuando quienes están respondiendo un cuestionario preguntan mucho respecto de los ítems, se puede deducir que no está bien diseñado, ya que un buen instrumento no requiere información adicional.
Para evitar este tipo de problemas debe realizarse una prueba piloto antes de la aplicación definitiva.
Confiablidad Los cuestionarios con preguntas cerradas pueden
contener un promedio de 50 preguntas, sin que con ello se corran riesgos de sesgo debido al cansancio.
Las preguntas abiertas suelen despertar incomodidad en quien responde, debido a que le exigen mayor cuidado y esfuerzo.
Cuando el instrumento de recolección tiene preguntas abiertas, el agotamiento llega primero que con las cerradas, de modo que no es conveniente que incluya más de 20
Confiablidad
Si se quiere realizar otra prueba de confiabilidad se pueden seleccionar 2 muestras de la misma población y comparar los resultados.
Si en ambas muestras las diferencias no son significativas, se deducirá que el instrumento es fiable.
Preparación del Análisis del cuestionario
Se deben determinar el número y orden de las preguntas en el instrumento
Se fotocopiará tantas veces necesario, según la cantidad de la muestra a analizar.
Se deben de numerar cada uno de ellos
Las preguntas abiertas es conveniente cerrarlas.
Proceso del cierre de las preguntas abiertas
o Una vez que se aplica a todos los sujetos, los investigadores estudian las respuestas
o Esta actividad debe hacerse por separado (dos o más investigadores) para no viciar su interpretación
o Ante la misma pregunta los investigadores tipificarán o clasificarán los modos en que pueden agruparse las diferentes respuestas
Proceso del cierre de las preguntas abiertas
Por ejemplo ante las diferentes preguntas, un investigador puede clasificar las respuestas en digamos 10 modos distintos y otro investigador en 14 formas.
Después de revisar encontrarán concordancias y divergencias respecto al modo de clasificar cada uno.
Las concordancias se adoptan, mientras que las divergencias se pasan a un apartado con el título de “otras”
FÓRMULA PROBABILÍSTICA PARA DETERMINAR EL TAMAÑO DE LA MUESTRA
• n = Z2 p(1 – p) N• (N – 1) E2 + Z2 p(1-p)
• DATOS:• n = x (Tamaño de la muestra)•• N = 700 (Población general de maestros)•• p = 0.5 (Probabilidad)•• Z = 1.96 (Nivel de confianza deseado) (0.95/2 = 0.475, búsqueda en la tabla de Z)•• E = 0.0428 (Error muestral)•• SUBSTITUCIÓN DE LA FÓRMULA:•• n = (1.96)2 (0.5) (0.5) (700)• (700 -1)(0.0428)2 + (1.96)2 (0.5) (0.5)
• n = 672.28• 2.24086
• n = 300 MAESTROS• CON 95% DE CONFIANZA Y UN ERROR DE 0.0428, EL TAMAÑO DE LA MUESTRA ES
DE: 300 maestros
OPERACIONALIZACIÓN DE LAS VARIABLES
-Variable de interacciónVariable relacionada con las variables dep. o indep. y que tiene un impacto en la variable
dependiente
MODERADORA
-Variable amenazadoraVariable relacionada con la variable dep. o
indep. pero que no forma parte del
experimento
EXTRAÑA
-Variable restrictoraVariable relacionada con la variable
dependiente y cuya influencia es preciso
eliminar
DE CONTROL
-Tratamiento
-Factor
-Variable predictora
Variable que se manipula para
examinar su impacto en una variable
dependiente
INDEPENDIENTE
-Variable resutante
-Variable de criterio
-Efecto
Variable que indica si la manipulación de la
variable independiente tuvo algún efecto
DEPENDIENTE
SinónimosDefiniciónTipo de variables
PREPARACIÓN PARA LA RECOPILACIÓN DE DATOS
• El proceso de recopilación de datos implica 4 pasos:
• 1. La construcción de formatos para recabar la información
• 2. La codificación (sirve para representar esos datos en un formato de recopilación)
• 3. La recopilación de los datos
• 4. Su asentamiento en el formato de recopilación de datos
CONSTRUCCIÓN DE FORMAS DE RECOPILACIÓN DE DATOS
• Idear un esquema de organización
• Crear un formato de recopilación de datos: Sirve para registrar los puntajes e informaciones después de calificar las pruebas
• Ordenar la información
• Analizar los datos
Ejemplo: los primeros cinco de 200 casos en el conjunto de puntajes de competencia
32326102005
5956642004
3739681003
4441622002
6055182001
Puntaje en matemáticas
Puntaje en lectura
Edificio
(1 al 6)
Año escolar
(2,4,6,8,10)
Género
1 = Masculino
2 = Femenino
Número de identificación
CODIFICACIÓN DE DATOS
• Los datos se codifican cuando se transfieren del formato de recopilación original (cuadernillos, papel milimétrico) a un formato que se presta para el análisis de datos
• Dá un ejemplo de códigos que normalmente se usan en la vida cotidiana
EJEMPLO DE CODIFICACIÓN DE DATOS
681 al 100PUNTAJE EN MATEMÁTICAS
781 al 100PUNTAJE EN LECTURA
11 al 6EDIFICIO
41, 2, 4, 6, 8 o 10AÑO ESCOLAR
21 o 2GÉNERO
138001 AL 200NÚMERO DE IDENTIFICACIÓN
EJEMPLOINTERVALO DE DATOS POSIBLES
VARIABLE
Los 10 mandamientos de la recopilación de datos
• 1. Piense en el tipo de datos que tendrá que recopilar• 2. De dónde se van a obtener estos datos• 3. Asegúrese de que el formato de recopilación de datos
que está usando sea claro y fácil de usar• 4. Prepare una copia del archivo de datos y guárdela en un
lugar distinto• 5. No dependa de otras personas para que recopilen o
transfieran sus datos• 6. Haga un programa detallado de cuándo y dónde
recabará sus datos• 7. Cutive las posibles fuentes de su grupo de sujetos
(obtener una muestra de una población sin tantos competidores)
• 8. Ponerse en contacto otra vez con los sujetos que faltaron a su sesión de pruebas o entrevista
• 9. Nunca deseche los datos originales• 10. Obedezca los otros nueve
Medidas de Tendencia Central
MEDIDAS DE TENDENCIA CENTRAL Las medidas de tendencia central (también
llamadas medidas de localización) son: Media aritmética, Mediana, Moda, cuartiles
y percentiles
Las medidas de variabilidad son: Rango, Desviación estándar y Varianza La tendencia central y la variabilidad son
las dos características de las distribuciones que son objeto de cuantificación más frecuentemente
Introducción Anteriormente analizamos la forma de organizar y presentar
los datos de manera significativa. La distribución de frecuencias son útiles a este respecto, pero
en sí mismas, no nos permiten hacer afirmaciones cuantitativas que caractericen a la distribución como un todo, ni tampoco permiten realizar comparaciones cuantitativas entre dos o más distribuciones.
Por ejemplo: suponga que una psicóloga ha realizado un experimento para averiguar si los hombres y las mujeres tienen aptitudes matemáticas diferentes. Esta investigadora cuenta con 2 conjuntos de calificaciones (uno para hombres y otro para mujeres) del experimento.
¿Cómo puede comparar esas distribuciones? Para hacerlo ella necesita ¨cuantificarlas¨
Introducción
La forma en que esto se realiza más a menudo consiste en calcular la calificación promedio de cada grupo y después comparar el resultado.
La cantidad calculada es una medida de la tendencia central de cada distribución.
Una 2da. característica de las distribuciones que resulta de gran utilidad para cuantificarlas es la variabilidad de la distribución.
La variabilidad especifica la medida en la cual los datos son diferentes unos de otros debido a su dispersión.
Media aritmética Se define como la suma de los datos dividida entre el
número de los mismos. En forma de ecuación
X = Σ Xi = X1 + X2 + X3 + ….. Xn media de una muestra
n n
µ = Σ Xi = X1 + X2 + X3 + ….. XN media de una población
N N
La media global Esta ecuación establece que la media global es igual a la
suma de la media de cada grupo multiplicada por el número de datos del grupo, entre la suma del número de datos de cada grupo
Xglobal = Suma de todos los datos
N
= Σ X1(primer grupo) + Σ X2(segundo grupo) +Σ X3 (primer grupo) + … ΣXi (primer grupo)
n1 + n2 + n3 + ….. nk
Ejemplo de Media Un analista estadístico toma una muestra aleatoria de n=11
laboratorios de investigación tecnológica de una Empresa con la siguiente información:
Laboratorio Num. Investigadores Laboratorio Num. Invest. A 54 G 43 B 39 H 57 C 26 I 28 D 45 J 61 E 36 K 54 F 52
Calcule la media
Ejemplo de la media global Un investigador realizó un experimento con tres grupos de
sujetos. La media del primer grupo fue de 75 y había en él 50 sujetos. La media del segundo grupo fue de 80 y estaba integrado por 40 sujetos. En el tercer grupo había 25 sujetos y la media fue de 70. Calcule la media global de los tres grupos combinados
Solución: Xglobal = n1 X1 + n2 X2 + n3 X3
n1 + n2 + n3
= 50(75) + 40(80) + 25(70) = 75.65 50 + 40 + 25
LA MEDIANA• La mediana es el puntaje de una distribución por
arriba del cual se encuentra la mitad de los puntajes.
• Pasos para calcular la mediana:• 1. Ordenar los datos de menor a mayor
• 2. Si ¨n¨ es par, entonces: posición de la mediana = (n + 1)/2 y después obtener el promedio de los 2
números centrales
3. Si ¨n¨ es impar: entonces:posición de la mediana = (n + 1)/2
Efecto de los datos extremos sobre la media y la mediana
Datos Media Mediana
3, 4, 6, 7, 10 6 6 3, 4, 6, 7, 100 24 6 3, 4, 6, 7, 1000 204 6
Ejemplo de Mediana
Calcule la mediana de la siguiente serie de datos
a) Calificaciones de 11 alumnos en la materia de Epistemología: 8.5, 8.9, 9.4, 7.5, 9.1, 9.6, 7.7, 8.3, 9.5, 8.2, 9.3
b) Calificaciones de 14 alumnos en la materia de Metodología de la Investigación: 9, 10, 8, 9, 10, 8, 7, 6, 6, 7, 8, 9, 9, 10
NOTA: Recuerde que debe acomodar los datos en orden
ascendente
LA MODA
Es el puntaje que ocurre con mayor frecuencia.
Por ejemplo: calcular el valor de la moda:
58, 27, 24, 42, 27, 26, 42, 53, 14, 29, 42, 53, 47, 28, 56, 14, 58, 27
Para resolverlo
1°Acomodar de menor a mayor los números
2° Calcular la Moda
EJEMPLO: CALCULAR LA MEDIA, MEDIANA Y MODA
• (a) Datos: 7, 22, 24, 50, 66, 76, 100• (b) Datos: 49, 50, 51
• Solución: • a) Media = 49.28• b) Media = 50
• a) Mediana = 50 • b) Mediana = 50
• a) Moda = no hay • b) Moda = no hay
Medidas de tendencia central y simetría
Asimetría negativa
Media MedianaModa
Frecuencia
Medidas de tendencia central y simetría
Curva en forma de campana
Frecuencia
MediaMediana
Moda
Medidas de tendencia central y simetría
Moda Mediana Media
Frecuencia
Asimetría positiva
MEDIDAS DE VARIABILIDAD
• La variabilidad es el grado de dispersión que caracteriza a un grupo de puntajes y es el grado en que un conjunto de puntajes difiere de alguna medida de tendencia central, generalmente la media.
• Por ejemplo: calcular la media e indicar cual de las dos series de números está más disperso.
• (a) 1, 3, 5, 7 y 9
• (b) 3, 4, 5, 6 y 7
El intervalo
• El intervalo es la diferencia entre el puntaje más alto y el más bajo de una distribución; es la medida más sencilla y directa de qué tan disperso está un conjunto de puntajes.
• Por ejemplo:
• 31, 33, 35, 38, 40, 41, 41, 41, 42, 43, 44, 46, 47, 48, 49, 49, 50, 51
Intervalo = 51 – 31 = 20
Propiedades de la Desviación Estándar 1º Nos proporciona una medida de la dispersión con
respecto a la media.
2º Es sensible a cada uno de los datos de la distribución:
a) Si se cambiara un dato por un valor más cercano a la media, entonces la desviación estándar sería menor.
b) Inversamente, si se le cambiara por otro más alejado de la media, entonces la desviación estándar aumentaría.
3º Es estable con respecto a las variaciones debidas al muestreo.
La varianza La varianza de un conjunto de datos es simplemente el
cuadrado de la desviación estándar.
La varianza no se usa muy a menudo en Estadística Descriptiva porque proporciona unidades de medición elevadas al cuadrado.
Sin embargo, se utiliza muy frecuentemente en Estadística Inferencial
Desviación estándar
En general, la desviación estándar se emplea como una medida para comparar la dispersión en 2 o más conjuntos de observaciones.
En una distribución de frecuencias simétrica, con forma de campana, aproximadamente 68% de las observaciones estarán entre más una y menos una desviación estándar desde la media; aproximadamente 95% de las observaciones se encontrarán entre dos y menos dos desviaciones estándar desde la media; prácticamente todas las observaciones (99.7%) se hallarán entre más tres y menos tres desviaciones estándar, a partir del valor medio.
Gráfica simétrica de campana, que muestra las relaciones entre la desviación estándar y la media
TRANSFORMACIÓN DE ESCALAS
-4 -3 -2 -1 0 1 2 3 4
ESCALA "Z"
34.13% 34.13%
13.59%13.59%
2.15%2.15%
0.13%0.13%
µ µ + µ + µ +µ µ µ
Cuartiles
Con frecuencia se dividen los datos en cuatro partes, cada una con aproximadamente la cuarta parte, o el 25% de las observaciones.
A los puntos de división se les llama cuartiles y se definen como sigue:
Q1 = primer cuartil o percentil 25 Q2 = segundo cuartil o percentil 50 (mediana) Q3 = tercer cuartil o percentil 75
Cuartiles (las fórmulas dan las posiciones o ubicación)
Q1 = N/4
Q2 = N/2
Q3 = 3N/4NOTA:a) Si el resultado es un número entero, entonces el cuartil
es el promedio entre ese valor y el siguiente.b) Si el resultado contiene decimales, entonces el cuartil es
el siguiente valor de la serie acomodada en orden ascendente.
Localización de los Cuartiles
Q1 Q2 Q3Percentil 25 Percentil 50 Percentil 75
25% 25% 25%25%
Ejemplo para calcular los Cuartiles
Millones de personas se levantan cada mañana en Norteamérica y trabajan en sus propias casas. Se sugiere que el uso creciente de computadoras es una de las razones por las que las personas pueden trabajar en empresas caseras. A continuación vemos una muestra de datos sobre las edades de esas personas:
22 58 24 50 29 52 57 31 30 41
44 40 46 29 31 37 32 44 49 29
a) Calcule los 3 cuartiles: Q1 , Q2 y Q3
Solución al ejercicio anterior (cuartiles):primero acomodaremos en orden ascendente los
datos
22, 24, 29, 29, 29, 30, 31, 31, 32, 37, 40, 41, 44, 44, 46, 49, 50,52, 57, 58
Q1 = N/4 = 20/4 = 5, entonces el primer cuartil es el promedio entre la 5a y 6ta posición: (29 + 30)/2 = 29.5
Q2 = N/2 = 20/2 = 10, entonces el 2do cuartil es el promedio entre la 10a y 11ava posición: (37 + 40)/2 = 38.5
Q = 3N/4 = 3(20)/4 =15, entonces el 3er cuartil es el promedio entre la 15ava y 16ava posición: (46+49)/2 = 47.5
Percentiles
El p-ésimo percentil es un valor tal que por lo menos “p” por ciento de las observaciones son menores o iguales que este valor y por lo menos (100 – p) por ciento de las observaciones son mayores o iguales que este valor.
Percentiles
Por ejemplo, suponga que un solicitante alcanza una calificación bruta de 54 en la parte verbal del examen de admisión en una Universidad mexicana. No se sabe con facilidad cómo se desempeñó ese alumno en relación con otros que presentaron la misma prueba; sin embargo, si la calificación bruta de 54 corresponde al percentil 70, sabemos que, aproximadamente, 70% de los alumnos tuvo calificaciones menores que este valor y más o menos el 30% tuvo calificaciones mayores que él.
¿Cómo calcular Percentiles?
Paso 1: Ordene los datos de manera ascendente Paso 2: Calcule un índice i:
i = (p/100)*n en donde “p” es el percentil de interés y “n” la cantidad
de observaciones.
Paso 3: a) Si “i” no es entero, se redondea. El valor entero
inmediato mayor que “i” indica la posición del p-ésimo percentil
b) Si “i” es entero, el p-ésimo percentil es el promedio de los valores de los datos ubicados en los lugares i e i + 1
Ejemplo del cálculo del percentil
Determinar el percentil 85 de los datos de salarios de una compañía acerera:
Paso 1: acomodamos los datos en orden ascendente:$2,710 2,755 2,850 2,880 2,880 2,890 2,920
2,940 2,950 3,050 3,130 3,325
Paso 2: i = (p/100)*n = (85/100)*12 = 10.2Paso 3: como i no es entero, redondeamos. El lugar
del percentil 85 es el siguiente entero mayor que 10.2, o sea, el lugar 11 (es = 3130)
Continuación del ejemplo del cálculo del percentil
Ahora calculemos el percentil 50 del mismo ejemplo anterior:
i = (50/100)*12 = 6
Como i es entero, el paso 3b) establece que el percentil 50 es el promedio de los valores de los datos sexto y séptimo; es por lo tanto: (2890 + 2920)/2 = 2,905.
Observe que el percentil 50, es también la mediana
LA DESVIACIÓN ESTÁNDAR
• La desviación estándar es la medida de variabilidad de uso más común. La desviación estándar es la cantidad promedio en que cada uno de los puntajes individuales varía respecto a la media del conjunto de datos.
• Fórmula: S = desviación estándar
• X = puntaje bruto
• x = media de la distribución
• n = tamaño de la muestra
•
• S = (x – x)2
n – 1
EJEMPLO DEL CÁLCULO DE LA DESVIACIÓN ESTÁNDAR
• Calcule la desviación estándar de la siguiente serie de números:
• 13, 14, 15, 12, 13, 14, 13, 21, 15, 9
• Solución:
• 1° Obtenemos la media = 13.9
• 2° Obtenemos la desv. estándar
s = 3.03
Ejemplo num 1MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN DE
UNA POBLACIÓN (Medidas descriptivas)
Los siguientes datos representan las razones de PU (precio/utilidad) de las 20 compañías que participan en la rama industrial de procesamiento de alimentos, publicados por el ¨Bussines Week Corporate Scoreboard¨ (Año 2008)
Continuación ejemplo 1°
Compañía: Razón PU: Compañía: Razón PU:
1 11 11 19 2 13 12 20 3 14 13 20 4 17 14 21 5 17 15 21 6 17 16 21 7 17 17 21 8 18 18 22 9 18 19 24 10 19 20 25
Calcular del ejemplo núm. 1
a) Media aritmética b) Mediana c) Moda d) El rango medio (dato mayor – dato menor)/2 e) El rango f) Varianza g) Desviación estándar h) Coeficiente de variación CV = (desv. estándar/media) x 100 i) Cuartiles j) Rango intercuartílico (Q3 – Q1) k) Eje medio (Q3 + Q1)/2
Solución
a) Media = 375/20= 18.75
b) Mediana = (n+1)/2 * debemos ordenar de menor a mayor los datos para hacer
este cálculo: Mediana = (20 + 1)/2 = 10.5 *esto significa que debemos obtener la media entre la
posición 10 y la 11: (19 + 19)/2 = 19 c) Moda: 17 y 21
d) Rango Medio: (25 – 11)/2 =14/2 = 7
e) Rango: 25 – 11 = 14
Solución e) Varianza = 12.09
g) Desv. Estándar = 3.47
h) Coeficiente de variación = (3.47/18.75)x100 = 18.5%
i) Cuartiles: (posiciones) Q1 = 20/4 = 5 prom. entre 5 y 6 posición = 17
Q2 = 20/2 = 10 prom. entre 10 y 11 posición = 19
Q3 = 3(20)/4 = 15 prom. entre 15 y 16 posición = 21
Solución
j) Rango intercuartílico: Q3 - Q1 = 21 – 17 = 4
k) Eje medio : (Q3 + Q1 )/2 = (21+ 17)/2 = 19
RESULTADOS en EXCEL del ejercicio anterior
Herramientas-Análisis de datos-estadística descriptiva
Media 18.75
Error típico 0.777563671
Mediana 19
Moda 17
Desviación estándar 3.477370452
Varianza de la muestra 12.09210526
Curtosis 0.290848679
Coeficiente de asimetría -0.434437474
RESULTADOS en EXCEL del ejercicio anterior
Herramientas-Análisis de datos-estadística descriptiva
Rango 14
Mínimo 11
Máximo 25
Suma 375
Cuenta 20
Mayor (1) 25
Menor(1) 11
Nivel de confianza(95.0%) 1.627459974
Prácticas para los alumnos
Resolver los ejercicios siguientes y entregarlos al facilitador del módulo
Ejercicio # 1 de Aplicación de Estadística Descriptiva en EXCEL (ALUMNOS)
Evalúe las medidas de tendencia central
La compensación anual total para un miembro del consejo en una de las 100 compañías públicas más grandes de E.U. se basa en parte en la cuota fija, un pago anual por servir al consejo. Además de la cuota fija de efectivo, un miembro del consejo podría recibir una cuota fija de acciones, un subsidio accionario, una opción de compra de acciones y una cuota por asistir a las reuniones del consejo.
La compensación fácilmente puede ser mayor de $100,000 dólares, incluso con una cuota fija anual tan baja como $15,000 dólares. Los datos siguientes muestran la cuota fija de efectivo para una muestra de 20 de las compañías públicas más grandes de E.U. (USA Today, 14 de Mayo del 2008)
Continuación del Ejercicio # 1 de Aplicación Estadística en EXCEL (ALUMNOS)
Compañía Cuota fija de efectivo American Express 64 Bank of América 36 Boeing 26 Chevron 35 Dell Computer 40 DuPont 35 ExxonMobil 40 Ford Motor 30 General Motors 60 International Paper 36
Continuación del Ejercicio # 1 de Aplicación Estadística en EXCEL (ALUMNOS)
Compañía Cuota fija de efectivo Kroger 28 Lucent Technologies 50 Motorola 20 Procter & Gamble 55 Raytheon 40 Sears Roebuck 30 Texaco 15 United Parcel Service 55 Wal-Mart Stores 25 Xerox 40
Ejercicio # 2 de Aplicación de Estadística Descriptiva en EXCEL (ALUMNOS)
Evalúe las medidas de tendencia central
Se efectuó una encuesta acerca de la capacidad de los fabricantes de computadoras para resolver con rapidez sus problemas (PC Computing, noviembre de 1977). Se obtuvieron los siguientes resultados:
Empresa Días para resolver el problema Compaq 13 Packard Bell 27 Quantex 11 Dell 14 NEC 14 AST 17 Acer 16
Continuación ejercicio # 2
Empresa Días para resolver el problema Gateway 21 Digital 27 IBM 12 Hewlett-Packard 14 AT & T 20 Toshiba 37 Micron 17
Ejercicios # 3 y # 4Calcule la Desviación estándar y la varianza
e interprete los resultados 3.- Una organización de protección al consumidor se preocupa
por las deudas de las tarjetas de crédito. Una encuesta entre 10 adultos jóvenes que tienen deudas de más de $2,000 con tarjetas de crédito mostró que pagaban un promedio de poco más de $100 al mes. A continuación se presenta una lista de las cantidades que cada adulto joven abonó a su saldo el mes pasado:
$110 $126 $103 $93 $99 $113 $87 $101 $109 $100
4.- Los siguientes son los números de cambios de aceite durante los últimos 7 días en un taller mecánico de la cd. de
Guadalajara, Jal. 41 15 39 54 31 15 33
DATOS AGRUPADOS
Medidas de tendencia central
Media, Mediana, Moda, Desviación Estándar y
Varianza
MEDIA, MEDIANA Y MODA, DE DATOS AGRUPADOS
Con frecuencia los datos relacionados con ingresos, edades y demás, se agrupan y presentan en forma de distribución de frecuencias.
Por lo general, resulta imposible obtener los datos originales.
De modo que si interesa un valor típico que represente a los datos, es necesario “estimarlo” basándose en la distribución de frecuencias.
MEDIA ARITMÉTICA DE DATOS AGRUPADOS
x = ΣfX n
X = es la media aritmética X = es el valor central o punto medio, de
cada clase f = es la frecuencia de cada clase n = es el número total de frecuencias
Cálculo de la Media del precio de venta de 80 vehículos que se vendieron el mes pasado en una
agencia VW
Precio de venta (miles de dólares) Frec.
(f )Punto medio
(X) fX
12 hasta 15 8 $13.50 $108
15 hasta 18 23 16.5 379.5
18 hasta 21 17 19.5 331.5
21 hasta 24 18 22.5 405
24 hasta 27 8 25.5 204
27 hasta 30 4 28.5 114
30 hasta 33 2 31.5 63
total 80 $1,605
Cálculo de la Media del precio de venta de 80 vehículos que se vendieron el mes pasado en una agencia VW
X = ΣfX = $1,605 = $20.1 miles n 80
Por tanto se concluye que la media del precio de venta de
los vehículos es aproximadamente $20,100.
MEDIANA DE DATOS AGRUPADOS
Mediana = L + (n/2 – FA) (i) f
L = es el límite inferior de la clase que contiene a la mediana
n = número total de frecuencias f = es la frecuencia de la clase que contiene a la
mediana FA = es el número acumulado de frecuencias en todas
las clases que preceden a la clase que contiene a la mediana
i = es la amplitud (o anchura) de la clase en que se encuentra la mediana
Cálculo de la Mediana del precio de venta de 80 vehículos que se vendieron el mes pasado en una
agencia VWPrecio de venta Número vendido Frecuencia acumulada
(miles de dólares) ( f ) (FA)
12 hasta 15 8 8
15 hasta 18 23 31
18 hasta 21 17 48
21 hasta 24 18 66
24 hasta 27 8 74
27 hasta 30 4 78
30 hasta 33 2 80
total 80
Cálculo de la Mediana del precio de venta de 80 vehículos que se vendieron el mes pasado en una
agencia VW
Mediana = L + (n/2 – FA) (i) f
Mediana = $18,000 + (80/2 – 31)($3,000) 17
Mediana = $18,000 + $1,588 = $19,588
Moda de datos agrupados
Recuérdese que la moda se define como el valor que ocurre con más frecuencia.
Para datos agrupados en una distribución de frecuencias, es posible aproximar la moda usando “el punto medio de la clase que contiene el mayor número de frecuencias de clase”
Ejemplo del cálculo de la Moda (datos agrupados)
Ventas netas (millones de $) Porcentaje del total
1 hasta 4 13
4 hasta 7 14 7 hasta 10 40
10 hasta 13 23 13 y superior 10
Resultado del ejemplo del cálculo de la Moda (datos agrupados)
Moda = (7 + 10)/2 = 8.5 millones
Desviación estándar de datos agrupados en una distribución de frecuencias
S = Σfx2 – (ΣfX)2
n n – 1
s = desv. estándar X = punto medio de una clase f = es la frecuencia de clase n = num. total de
observaciones en la muestra
Calcule la desviación estándar de una muestra de las inversiones quincenales realizadas por
empleados de acuerdo con el plan de participación de utilidades
Cantidad Inv. Frecuencia f Punto Medio X fX fX2
$30 hasta $35 3 $32.5 $97.50 3,168.75
35 hasta 40 7 37.5 262.5 9,843.75
40 hasta 45 11 42.5 467.5 19,868.75
45 hasta 50 22 47.5 1045 49,637.50
50 hasta 55 40 52.5 2100 110,250
55 hasta 60 24 57.5 1380 79,350
60 hasta 65 9 62.5 562.5 35,156.25
65 hasta 70 4 67.5 270 18,225
total 120 $6,185 325,500
Obtenemos ahora la desviación estándar muestral con los resultados de la tabulación anterior
S = 325,500 – (6185)2/120 (120 – 1)
S = $7.51
Ejercicio # 1 para el alumno (DATOS AGRUPADOS)
Calcular: la media, la mediana, la moda, la desviación estándar y la varianza
En una gasolinera se formó la siguiente distribución de frecuencias de galones de gasolina vendidos por automóvil, en una muestra de 680 vehículos:
Gasolina (galones) Frecuencia 0-4 74 5-9 192 10-14 280 15-19 105 20-24 23 25-29 6 Total 680
Ejercicio # 2 para el alumno (DATOS AGRUPADOS)
Calcular: la media, la moda, la mediana, la desviación estándar y la varianza
Las cuestiones de salud son de interés para directores, o gerentes de empresa, en especial porque evalúan el costo del seguro médico. En un estudio reciente con 150 ejecutivos de varias empresas de polímeros, una gran aseguradora y financiera localizada en una cd. de los E.U., aparecieron las cifras de sobrepeso en libras de los ejecutivos.
Sobrepeso (libras) frecuencia 0 hasta 6 14 6 hasta 12 42 12 hasta 18 58 18 hasta 24 28 24 hasta 30 8
Ejercicio # 3 para el alumno (DATOS AGRUPADOS)
Calcular: la media, la desviación estándar y la varianza
A continuación se presenta una distribución de frecuencias de la duración de 20 llamadas telefónicas de larga distancia, en minutos.
Duración de la llamada (min) Frecuencia 4 – 7 4 8 – 11 5 12 – 15 7 16 – 19 2 20 – 23 1 24 – 27 1 Total 20
Ejercicio # 4 para el alumno (DATOS AGRUPADOS)
Calcular: la media, la desviación estándar y la varianza
Un radar policiaco vigila la velocidad de los automóviles que viajan por la carretera transversal del estado de Nueva York.
En la tabla siguiente se presenta una distribución de frecuencia de las velocidades:
Velocidad (millas/hr) Frecuencia 45 – 49 10 50 – 54 40 55 – 59 150 60 – 64 175 65 – 69 75 70 – 74 15 75 – 79 10 Total 475
Diagramas de Control de Calidad
Los diagramas de control identifican el momento en que entran al proceso las causas asignables de variación o los cambios.
Estos diagramas indican a los trabajadores, líderes de grupos, ingenieros de control de calidad, supervisores de producción y gerentes, si la producción de la parte o el servicio está “bajo control” o “fuera de control”.
Si algo está fuera de control, la persona responsable ajustará la máquina, fabricará la pieza o hará lo que sea necesario para poner la producción “bajo control”.
Ejemplo
La compañía “G ξ L” que produce artículos de papelería, ofrece un número telefónico de larga distancia sin costo al cual los clientes pueden llamar todos los días, de 7 a.m. a 11 p.m., para resolver problemas con sus productos.
Es imposible que un representante técnico conteste de
inmediato, pero es importante que los clientes no esperen demasiado en línea.
Los clientes se molestan cuando escuchan demasiadas
veces el mensaje “su llamada es importante para nosotros. En breve le contestará un representante”
Ejemplo
Para comprender el proceso, la compañía decidió elaborar una tabla de control con el tiempo total desde el momento en que se recibe una llamada hasta que el representante la responde y soluciona el problema del cliente.
El día de ayer se tomó una muestra de cinco llamadas cada hora durante las 16 horas de operación del servicio de atención al cliente.
Con base en esa información, elabore una tabla de control para la duración media de la llamada. ¿Parece existir una tendencia en las horas de las llamadas? ¿Hay algún periodo donde parece que los clientes esperan más que otros?
Tabla de la duración de 16 muestras de cinco sesiones de ayuda
Pasos en Minitab para realizar el Diagrama de Control de Rangos
Paso 1: Haga clic en Stat, Control Charts, Variables Charts for subgroups, Xbar-R y oprima enter
Paso 2: Seleccione Observations for a subgroup are in one row of columns; seleccione las columnas C2, C3, C4, C5 y
C6 con un clic a c/u
Paso 3: dar clic a Labels, para poner el nombre de la gráfica, después darle clic en OK dos veces
Xbar-R Chart of MinutesPaso 4, Resultado: Diagrama de Control de Rangos de la duración de
las llamadas de los clientes en la compañía “G ξ L”
Comentarios acerca de los resultados del Diagrama de control de rangos
La media es de 9.413 minutos, el límite de control superior se ubica en 13.093 minutos y el límite de control inferior en 5.732 minutos.
Hay una variación en la duración de las llamadas, pero todas las medias de la muestra están dentro de los límites de control.
Por tanto, con base en 16 muestras de 5 llamadas, la conclusión es que, 99.74% (seis sigmas) de las veces, la duración media de una muestra de 5 llamadas estará entre 5.732 min y 13.093 min
x
Conclusión
Puesto que la teoría estadística se basa en la normalidad de muestras grandes, los diagramas de control deben tener como base un proceso estable, es decir, una muestra muy grande tomada durante un periodo.
Una regla básica es diseñar el diagrama después de seleccionar al menos 25 muestras.
BIBLIOGRAFÍA 1.- Estadística Básica en Administración Conceptos y Aplicaciones 6ª Edición Berenson/Levine Ed. Prentice-Hall 2.- Estadística para Administración y Economía Anderson, Sweeney y Williams 8. Edición Ed. Thomson 3.- Estadística para Administradores Richard Levin Ed. Prentice-Hall 4.- Estadística para Administradores y Economía Mason y Lind Ed. Alfaomega
BIBLIOGRAFÍA 5.- Estadística Aplicada a los Negocios y a la Economía 12ª. Edición Lind, Marchal & Wathen Ed. Mc. Graw-Hill 6.- Probabilidad & Estadística 8ª Edición Walpole, Myers, Myers & Ye PEARSON, Prentice Hall 7.- Introducción a la PROBABILIDAD Y ESTADÍSTICA Décima segunda edición Mendenhall, Beaver & Beaver THOMSON 8.- PROBABILIDAD Y ESTADÍSTICA Sexta Edición Devore THOMSON
BIBLIOGRAFÍA 9.- Control Estadístico de Calidad Montgomery, Douglas C. Limusa, 2005 10.- Diseño y Análisis de experimentos Montgomery, Douglas C. Iberoamérica, 2001 11.- Probabilidad y Estadística aplicadas a la Ingeniería Montgomery, Douglas y Runger George Mc. Graw-Hill, 2003 12.- Métodos Cuantitativos para los Negocios Render, Stair &Hanna 9ª edición PEARSON Prentice-Hall 13.- ESTADÍSTICA Para las Ciencias del Comportamiento 7ª. Edición Pagano, Robert R. THOMSON