50
Estadística Descriptiva: 1. Muestreo y Presentación de los Datos. Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María

Estadística Descriptiva: 1. Muestreo y Presentación de los Datos

  • Upload
    sibyl

  • View
    48

  • Download
    0

Embed Size (px)

DESCRIPTION

Estadística Descriptiva: 1. Muestreo y Presentación de los Datos. Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María. Estadística: Dos conceptos fundamentales: muestra y población. Población o Población Objetivo: conjunto de elementos sobre los que queremos hacer afirmaciones - PowerPoint PPT Presentation

Citation preview

Page 1: Estadística Descriptiva: 1. Muestreo y Presentación de los Datos

Estadística Descriptiva:1. Muestreo y Presentación de los Datos.

Ricardo Ñanculef AlegríaUniversidad Técnica Federico Santa María

Page 2: Estadística Descriptiva: 1. Muestreo y Presentación de los Datos

Estadística: Dos conceptos fundamentales: muestra y población

• Población o Población Objetivo: conjunto de elementos sobre los que queremos hacer afirmaciones• Muestra: subconjunto de la población que se extrae para ser estudiado

Page 3: Estadística Descriptiva: 1. Muestreo y Presentación de los Datos

Estadística: ¿Porqué una muestra? • Imposibilidad o costo excesivo de realizar un censo en que se mide toda la población

Page 4: Estadística Descriptiva: 1. Muestreo y Presentación de los Datos

Estadística: Herramientas con dos Objetivos Básicos • Describir la muestra: Estadística Descriptiva:• Obtener conclusiones de la población a partir de la muestra: Inferencia Estadística.

Page 5: Estadística Descriptiva: 1. Muestreo y Presentación de los Datos

Qué es la Estadística? Dos conceptos fundamentales: muestra y población• Marco Muestral: conjunto de elementos de la población suceptible de ser muestreada. Ejemplo: Domingo 24 Agosto en La Tercera

Page 6: Estadística Descriptiva: 1. Muestreo y Presentación de los Datos

Qué es la Estadística? Dos conceptos fundamentales: muestra y población

¿Porqué candidato votaría usted?

Page 7: Estadística Descriptiva: 1. Muestreo y Presentación de los Datos

Qué es la Estadística? Dos conceptos fundamentales: muestra y población

Si la elección tuviera que definir entre ellos dos¿Por cuál votaría usted?

Page 8: Estadística Descriptiva: 1. Muestreo y Presentación de los Datos

Qué es la Estadística? Dos conceptos fundamentales: muestra y población

• Población Objetivo?• Marco Muestral?• Muestra?

Page 9: Estadística Descriptiva: 1. Muestreo y Presentación de los Datos

Técnicas de Muestreo¿Cómo recolectar los datos?

• Muestreo No-Aleatorizado (o No-Probabilista)• Se basa en el juicio personal del investigador.• Puede generar buenas muestras pero no permite una evaluación estadística de confianza.

• Muestreo Aleatorizado (o Probabilista)• Se controla la probabilidad de seleccionar un determinado individuo del marco muestral.• Permite estudiar objetivamente la confianza de las generalizaciones hacia la población objetivo.

Page 10: Estadística Descriptiva: 1. Muestreo y Presentación de los Datos

Técnicas de Muestreo¿Cómo recolectar los datos?

• Muestreo Aleatorizado o Probabilista: • Muestreo aleatorio simple• Muestreo sistemático • Muestreo estratificado• Muestreo clusterizado

• Muestreo no-Aleatorizado o no-Probabilista• Muestreo por convenciencia • Muestreo por juicio• Muestreo por cuota• Muestreo tipo “bola de nieve” (snowball)

Page 11: Estadística Descriptiva: 1. Muestreo y Presentación de los Datos

Técnicas de MuestreoMuestreo por Conveniencia

• Los elementos de la muestra se eligen por estar en el lugar o en el momento adecuado para la investigación.• El criterio de selección (lugar, tiempo y demases) es completamente dependiente del investigador, sin reglas predeterminadas.

Page 12: Estadística Descriptiva: 1. Muestreo y Presentación de los Datos

Técnicas de MuestreoMuestreo por Conveniencia

• Ejemplos: encuestas en la calle, encuestas a estudiantes, encuestas web

Page 13: Estadística Descriptiva: 1. Muestreo y Presentación de los Datos

Técnicas de MuestreoMuestreo por Juicio• Un tipo de muestreo por conveniencia• Se selecciona de acuerdo a alguna característica especifica del encuestado juzgada por el encuestador

• Clientes/Consumidores de un cierto tipo• Expertos en un tema o aspecto de la organización • Personajes “líderes de opinión”

Page 14: Estadística Descriptiva: 1. Muestreo y Presentación de los Datos

Técnicas de MuestreoMuestreo por Juicio

Page 15: Estadística Descriptiva: 1. Muestreo y Presentación de los Datos

Técnicas de MuestreoMuestreo por Cuota• Intenta mejorar la representatividad de la muestra separando a la población de acuerdo a variables de control: edad, sexo, raza, nivel socio-económico• A casa subgrupo o estrato se le asigna una cuota o proporción de muestreo, típicamente % de la población• Otros criterios: varianza. • Dentro del grupo se muestrea por conveniencia

Page 16: Estadística Descriptiva: 1. Muestreo y Presentación de los Datos

Técnicas de MuestreoMuestreo tipo bola de nieve• Se selecciona un grupo inicial (usualmente de forma probabilista aunque el resultado final no lo sea)• Los nuevos encuestados se seleccionan en base a las referencias de los encuestados anteriores, explotando sus “redes sociales”• Muy utilizado en ciencias sociales, cuando la característica a estudiar es rara o escasa y cuando es difícil conseguir encuestados.

Page 17: Estadística Descriptiva: 1. Muestreo y Presentación de los Datos

Técnicas de MuestreoMuestreo tipo bola de nieve (ejemplo)

Page 18: Estadística Descriptiva: 1. Muestreo y Presentación de los Datos

Técnicas de MuestreoMuestreo Aleatorio Simple• Cada elemento del marco muestral tiene la misma probabilidad de ser seleccionado y cada elemento se selecciona de manera independiente de los otros

• con reemplazo: se pueden repetir elementos• sin reemplazo: no se pueden repetir elementos

• Procedimiento: se indexa a la población y luego se elige un índice de manera aleatoria hasta completar el tamaño deseado de la muestra.

Page 19: Estadística Descriptiva: 1. Muestreo y Presentación de los Datos

Técnicas de MuestreoMuestreo Aleatorio Simple• Para muchos estudios se siguen utilizando tablas de números aleatorios aunque existen muchos algoritmos generadores de los mismos. • ¿cómo usar una tabla de números aleatorios?

Page 20: Estadística Descriptiva: 1. Muestreo y Presentación de los Datos

Técnicas de MuestreoMuestreo Aleatorio Simple

Page 21: Estadística Descriptiva: 1. Muestreo y Presentación de los Datos

Técnicas de MuestreoMuestreo Aleatorio Sistemático

• Se elige un elemento de partida aleatoriamente y el resto se elige en sucesión hasta completar la muestra• Regla de sucesión: Si n es el tamaño de la muestra y N el de la población muestral se determina s = floor(N/n)

• El genera un número aleatorio x. El k-ésimo seleccionado es (x+k·s) mod N

• Se elige el x-ésimo• Luego el (x+s)-ésimo• Luego el (x+2s)-ésimo• etc

Page 22: Estadística Descriptiva: 1. Muestreo y Presentación de los Datos

Técnicas de MuestreoMuestreo Aleatorio Sistemático

• ¿Tiene cada elemento la misma probabilidad de ser seleccionado? ¿tiene cada subconjunto la misma probabilidad de ser seleccionado?• Importante: el registro de donde se selecciona no debe presentar sesgo periódico, sino se reduce la representatividad de la muestra. • Si el registro está ordenado de acuerdo a lo que se estudia se puede aumentar la representatividad.• Se puede prescindir de identificar exactamente el tamaño del marco muestral

Page 23: Estadística Descriptiva: 1. Muestreo y Presentación de los Datos

Técnicas de MuestreoMuestreo Aleatorio Estratificado

• Antes de seleccionar los elementos, se agrupa la población muestral en estratos de acuerdo a una variable importante: edad, sexo, • Objetivo: reducir la variabilidad que se puede observar dentro de cada estrato• Dentro de cada estrato se puede proceder con muestreo simple o sistemático• El número de elementos a elegir puede ser proporcional al tamaño o inversamente proporcional a la variabilidad del estrato

Page 24: Estadística Descriptiva: 1. Muestreo y Presentación de los Datos

Técnicas de MuestreoMuestreo Aleatorio ór Grupos

• Se divide a la población en grupos lo más homogéneos entre ellos y lo más heterogéneos internamente• Se seleccionan aleatoriamente los grupos a encuestar ya sea de manera simple o sistemática• Cada grupo seleccionado se muestrea completamente: se toman todos sus elementos. • En ocasiones sólo se conocen los grupos y no los elementos que componen cada grupo.

Page 25: Estadística Descriptiva: 1. Muestreo y Presentación de los Datos

Técnicas de MuestreoMuestreo Aleatorio por Grupos

• Ejemplo: Encuesta a los espectadores de una película: se muestrean los horarios a encuestar.

Page 26: Estadística Descriptiva: 1. Muestreo y Presentación de los Datos

En el muestreo aleatorizado se elige controlando la probabilidad de selección de los elementos. Mejorable segmentando.

Page 27: Estadística Descriptiva: 1. Muestreo y Presentación de los Datos

En el muestreo no aleatorizado se elige de acuerdo al criterio del investigador: por conveniencia o juicio.Mejorable segmentando.

Page 28: Estadística Descriptiva: 1. Muestreo y Presentación de los Datos

Técnicas de Muestreo

Técnica Fortalezas Debilidades

Muestreo NO

probabilístico

Muestreo por conveniencia

Menos costoso, toma menos tiempo, más conveniente.

Tendencias en la selección, muestra no representativa, *no se recomienda para la investigación descriptiva o causal.

Muestreo por juicio

Costo bajo, conveniente, no toma mucho tiempo.Puede a aumentar la representatividad del muestreo por conveniencia

No permite la generalización, es subjetivo.Puede generar una muestra para avalar pre-juicios del investigador.

Muestreo por cuota

La muestra puede controlarse para ciertas características.

Tendencias en la selección, no asegura la representatividad.

Muestreo de bola de nieve

Puede estimar características poco comunes.

Toma mucho tiempo.

Page 29: Estadística Descriptiva: 1. Muestreo y Presentación de los Datos

Técnicas de Muestreo

Técnica Fortalezas Debilidades

Muestreo probabilístico

Muestreo aleatorio

simple

Se entiende con facilidad, resultados proyectables.

Es difícil construir el marco de la muestra, costoso, menor precisión, no asegura la representatividad.

Muestreo sistemático

Puede aumentar la representatividad, más fácil de poner en práctica que el MAS, no es necesario el marco exacto de la muestra.

Puede reducir la representatividad.

Muestreo estratificado

Incluye todas las sub-poblaciones importantes, precisión.

Es difícil seleccionar las variables de estratificación relevantes, no es factible estratificar conforme a muchas variables, costoso.

Muestreo de grupo

Fácil de poner en práctica, costo efectivo.

Inexacto, es difícil calcular e interpretar los resultados.

Page 30: Estadística Descriptiva: 1. Muestreo y Presentación de los Datos

Técnicas de MuestreoTamaño de la Muestra (n)

• Problema duro de la Estadística Inferencial• Criterios Generales

• Qué se va a medir• Qué se quiere determinar• Nivel máximo de error admisible• Nivel de confianza con qué se quiere obtener la estimación del tamaño muestral• Variabilidad de las características a medir

Page 31: Estadística Descriptiva: 1. Muestreo y Presentación de los Datos

Estadística Descriptiva¿Cómo organizar y presentar los datos?

Page 32: Estadística Descriptiva: 1. Muestreo y Presentación de los Datos

Estadística DescriptivaExperimento, Medición y Tipos de Datos

• El muestreo se realiza con el objetivo de llevar a cabo un experimento: observación, medición o registro de características o atributos de la población de las cuáles se tiene incertidumbre.

• Lo último es lo que define un experimento• Se conocen los posibles valores, pero• No se sabe a-priori cuáles van a ser los resultados• Es repetible bajo condiciones esencialmente equivalentes

Page 33: Estadística Descriptiva: 1. Muestreo y Presentación de los Datos

Estadística DescriptivaExperimento, Medición y Tipos de Datos

• Producto del muestreo y la medición obtenemos datos • Para propósitos estadísticos es útil distinguir entre los siguientes tipos de datos:

• Numéricos o Cuantitativos• Cualitativos• Estructurados: formados por conjuntos de los anteriores, pero correspondientes a una misma medición (ejemplo: grafos, matrices)

Page 34: Estadística Descriptiva: 1. Muestreo y Presentación de los Datos

Estadística DescriptivaExperimento, Medición y Tipos de Datos

• Numéricos o Cuantitativos: operables aritméticamente• Escala Intervalar: Tienen sentido las diferencias.• Escala de Razón: Tienen sentido los cuocientes.• Discretos/Continuos.

• Cualitativos:• Categóricos: Son sólo nombres de referencia.• Ordinales: Se pueden jerarquizar u ordenar.

Page 35: Estadística Descriptiva: 1. Muestreo y Presentación de los Datos

Estadística DescriptivaExperimento, Medición y Tipos de Datos

• Ejercicio: Deseamos estudiar los hábitos de estudio de un conjunto de sansanos y su impacto sobre el rendimiento académico

• Sugiera variables a medir en cada una de las categorías definidas anteriormente

Page 36: Estadística Descriptiva: 1. Muestreo y Presentación de los Datos

Estadística DescriptivaConcepto Fundamental: Frecuencia

• La frecuencia de un suceso en la muestra es el número de veces que éste se repite en la muestra (valor de una característica o de un subconjunto de valores).

• Llamaremos frecuencia relativa a la fracción de veces que éste aparece en la muestra.

• Si la frecuencia del suceso es k y la muestra es de tamaño n llamaremos: k/n

Page 37: Estadística Descriptiva: 1. Muestreo y Presentación de los Datos

Estadística DescriptivaPresentación de los Datos

• Datos Categóricos: Usualmente se presenta la frecuencia con la que ocurre cada uno de los valores posibles

• Diagramas de sectores (“de torta”)• Diagramas de barras

Page 38: Estadística Descriptiva: 1. Muestreo y Presentación de los Datos

Estadística DescriptivaPresentación de los Datos

• Datos Categóricos: Usualmente se presenta la frecuencia con la que ocurre cada uno de los valores posibles

• Diagramas de Pareto: diagrama de barras ordenado descendentemente por frecuencia. Se suele incluir la frecuencia acumulada hasta cada elemento.

Page 39: Estadística Descriptiva: 1. Muestreo y Presentación de los Datos

Estadística DescriptivaPresentación de los Datos

Page 40: Estadística Descriptiva: 1. Muestreo y Presentación de los Datos

Estadística DescriptivaPresentación de los Datos

• Datos Ordinales: Los diagramas de barras se suelen ordenar de acuerdo a la jerarquía natural de los valores posibles. Ejemplo: estratos económicos:

Page 41: Estadística Descriptiva: 1. Muestreo y Presentación de los Datos

Estadística DescriptivaPresentación de los Datos

• Datos Cualitativos: Cuando son muchos es posible agruparlos en subconjuntos, pero generados en gral. por criterios no-estadísticos.

Page 42: Estadística Descriptiva: 1. Muestreo y Presentación de los Datos

Estadística DescriptivaPresentación de los Datos

• Datos Cuantitativos: En universo de posibles valores es infinito o muy grande. En la muestra puede no repetirse ningún valor. ¿Cómo presentarlos?

Page 43: Estadística Descriptiva: 1. Muestreo y Presentación de los Datos

Estadística DescriptivaPresentación de los Datos

• Datos Cuantitativos. Tabligrama: El último dígito se expresa separado de los más significativos. • Consideremos los siguientes datos

Page 44: Estadística Descriptiva: 1. Muestreo y Presentación de los Datos

Estadística DescriptivaPresentación de los Datos

• Datos Cuantitativos: Tabligrama

15 455677888888 16 000000122333345556677799 17 001233344456788 18 05

Page 45: Estadística Descriptiva: 1. Muestreo y Presentación de los Datos

Estadística DescriptivaPresentación de los Datos

• Datos Cuantitativos. Tablas de frecuencias: Agrupar los valores en intervalos y registrar la frecuencia (relativa o absoluta) de ese grupo de valores en la muestra

Page 46: Estadística Descriptiva: 1. Muestreo y Presentación de los Datos

Estadística DescriptivaPresentación de los Datos

•Tablas de frecuencias. ¿Cuántos intervalos K considerar? ¿Cómo deben estar estos distribuidos?• Histograma: Los intervalos son todos del mismo tamaño y cubren uniformemente el rango de los datos.

• Rango = máximo – mínimo• Amplitud de cada clase: A = (Rango+1)/K• 1er Intervalo: [a1,b1]=[(min – 0.5), (min – 0.5)+A]• 2do Intervalo: [a2,b2]=[b1, b1 + A]• …• k-ésimo: [ak,bk]=[bk-1, bk-1 + A]

Page 47: Estadística Descriptiva: 1. Muestreo y Presentación de los Datos

Estadística DescriptivaPresentación de los Datos

K := N° Clases R := Rango = máx { xi } - mín { xi } = 162 - 107 = 55A := Amplitud = ( R + 1 ) / K = ( 55 + 1 ) / 7 = 8

Límites

106,5-114,5114,5-122,5122,5-130,5130,5-138,5138,5-146,5146,5-154,5154,5-162,5

Marca

110,5118,5126,5134,5142,5150,5158,5

FrecuenciasABS - REL - REL. AC. 5 0,125 0,125 3 0,075 0,2 5 0,125 0,325 8 0,2 0,525 6 0,15 0,675 7 0,175 0,85 6 0,15 1

Page 48: Estadística Descriptiva: 1. Muestreo y Presentación de los Datos

Estadística DescriptivaPresentación de los Datos

0

1

2

3

4

5

6

7

8

9

110,5 118,5 126,5 134,5 142,5 150,5 158,5

Histograma

Page 49: Estadística Descriptiva: 1. Muestreo y Presentación de los Datos

Estadística DescriptivaPresentación de los Datos

0

1

2

3

4

5

6

7

8

9

110.5 118,5 126,5 134,5 142,5 150,5 158,5102,5 166,5

Polígono de Frecuencias

Page 50: Estadística Descriptiva: 1. Muestreo y Presentación de los Datos

Estadística DescriptivaPresentación de los Datos

110,5 118,5 126,5 134,5 142,5 150,5 158,5102,5 166,5

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

OJIVA