Upload
carlos-rojas
View
729
Download
0
Embed Size (px)
Citation preview
Investigación de Mercado
Investigación de Mercado
Medidas de Tendencias Central
56% de la población
22,3% de la población
13,7% de la población
7% de la población
1% de la población
• En estadística, un parámetro es un número que resume la ingente cantidad de datos que pueden derivarse del estudio de una variable estadística
• El cálculo de este número está bien definido, usualmente mediante una fórmula aritmética obtenida a partir de datos de la población
• Los parámetros estadísticos son una consecuencia inevitable del propósito esencial de la estadística: crear un modelo de la realidad
Parámetros estadísticos
¿Qué técnica de análisis debe emplearse?
• ¿Cuántas variables van a analizarse de manera simultánea?• 1, 2 o más
• ¿Queremos describir la realidad o conocer el comportamiento de la población?• Descriptiva o inferencial
• ¿Cuál es el tipo de medición disponible para la o las variables de interés?• Nominal, ordinal o de intervalos
Preguntas fundamentales del análisis de datos
Visión general de las técnicas de análisis de datos
¿Cuántas variables se analizan a la vez?
Análisis bivariadode datos
Análisis univariadode datos
Análisis multivariadode datos
una Más de dos
dos
• Medidas de posición: son valores de la variable estadística que se caracterizan por la posición que ocupan dentro del rango de valores posibles de esta. • Las medidas de tendencia central: medias, moda y
mediana.• Las medidas de posición no central: cuantiles
Principales parámetros estadísticos
• Medidas de dispersión: resumen la heterogeneidad de los datos, lo separados que estos están entre sí
• Hay dos tipos, básicamente:• Medidas de dispersión absolutas, que vienen dadas en las
mismas unidades en las que se mide la variable: recorridos, desviaciones medias, varianza, desviación típica y media
• Medidas de dispersión relativa, que informan de la dispersión en términos relativos, como un porcentaje: coeficiente de variación, de apertura, los recorridos relativos
• Medidas de forma: su valor informa sobre el aspecto que tiene la gráfica de la distribución• Coeficientes de asimetría y de curtosis
Principales parámetros estadísticos
¿Qué tipo de escala he utilizado?
¿Cuál es el tipode escala utilizada?
MediaDesviación estándar
MedianaRango intercuartil
ModaFrecuencias relativas
PruebaKolmogorov-Smirnov
Prueba zPrueba t
PruebaChi-cuadrado
Descriptivos:
Tendencia centralDispersión
Inferencial:
intervalo nominal
ordinal
• La estadística descriptiva, se dedica a los métodos de recolección, descripción, visualización y resumen de datos originados a partir de los fenómenos de estudio
• Los datos pueden ser resumidos numérica o gráficamente
• Ejemplos de parámetros estadísticos son: la media y la desviación estándar
• Algunos ejemplos gráficos son: histograma, pirámide poblacional, clústers, entre otros
La estadística descriptiva
• La estadística inferencial, se dedica a la generación de los modelos, inferencias y predicciones asociadas a los fenómenos en cuestión teniendo en cuenta la aleatoriedad de las observaciones
• Se usa para modelar patrones en los datos y extraer inferencias acerca de la población bajo estudio
• Pueden ser pruebas de hipótesis, estimaciones de características numéricas, pronósticos de futuras observaciones, descripciones de correlación o modelamiento de relaciones entre variables, análisis de regresión
• Otras técnicas de modelamiento incluyen anova, series de tiempo y minería de datos
La estadística inferencial
• Cuando buscamos un valor típico, usualmente lo buscamos en el centro de la distribución
• Para una distribución unimodal y simétrica, es fácil encontrar su centro, está en el medio de la simetría
• Podríamos sacar el promedio entre el máx. y el min. como medida de centralidad– Los valores centrales son muy sensibles a las
distribuciones sesgadas y a los puntos extremos
Encontrando el centro
• La moda es el valor con una mayor frecuencia en una distribución de datos
• Ventajas: • Cálculo sencillo• Interpretación muy clara• Al depender sólo de las frecuencias, puede calcularse
para variables cualitativas
La moda
• La moda es el valor con una mayor frecuencia en una distribución de datos
• Desventajas: • Su valor es independiente de la mayor parte de los
datos, lo que la hace muy sensible a variaciones muestrales
• Usa muy pocas observaciones, grandes variaciones en los datos fuera de la moda, no afectan su valor
• No siempre se sitúa hacia el centro de la distribución• Puede haber más de una moda en el caso en que dos o
más valores de la variable presenten la misma frecuencia
La moda
• Una elección más razonable como medida de tendencia central, es el valor que acumula exactamente la mitad de los datos sobre ella y bajo ella– Esto se llama mediana
La mediana
• Una elección más razonable como medida de tendencia central, es el valor que acumula exactamente la mitad de los datos sobre ella y bajo ella– Esto se llama mediana
• La mediana es el valor medio de los datos (una vez que los valores de los datos han sido ordenados) que divide el histograma en dos áreas iguales
• La mediana usa las mismas unidades que los datos
La mediana
• La media aritmética es un promedio estándar que a menudo se denomina "promedio”
• La media de 34, 27, 45, 55, 22, 34
La media
• Independiente de la forma de la distribución, la media es el punto en donde el histograma de los datos está balanceado
• En distribuciones simétricas, la media y la mediana toman aproximadamente el mismo valor, a si que se puede usar cualquiera de los dos
• Para datos sesgados, es mejor la mediana como medida de tendencia central
Media, moda o mediana
• Nos permiten conocer otros puntos característicos de la distribución que no son los valores centrales.
• Entre las medidas de posición no central más importantes están los cuantiles
• Los cuartiles suelen usarse por grupos que dividen la distribución en partes iguales• Los Cuartiles, dividen a la distribución en cuatro partes
(corresponden a los cuantiles 0.25, 0.50 y 0.75)• Los Quintiles, dividen a la distribución en cinco partes
(corresponden a los cuantiles 0.20, 0.40, 0.60 y 0.80)• Los Deciles, dividen a la distribución en diez partes• Los Percentiles, dividen a la distribución en cien partes
Medidas de posición no central
• La mediana sirve para identificar el centro en las distribuciones sesgadas
• Cuando tenemos datos simétricos, la media es una buena medida de tendencia central
• Encontramos la media sumando todos los valores de los datos y dividiendo por n, el número de valores que contengan los datos
Resumen de distribuciones simétricas
Muchas Gracias
Email: [email protected]
Blog: economiaymedios.blogspot.com
Twitter: reds_cl
Slideshare: www.slideshare.net/reds_cl
LinkedIn: http://cl.linkedin.com/in/carlosrojasa
Skype: reds_cl