Upload
maria-gracia-costa-caballero
View
215
Download
0
Embed Size (px)
DESCRIPTION
Clase de Estadística. Variables de dispersión
Citation preview
RECOLECCION DE DATOS
●En esta etapa empieza la ejecución de la investigación; es decir; el investigador pone en marcha la etapa de Planeamiento.
●A través de la recolección, se obtienen los datos que se requieren para alcanzar los objetivos y demostrar las hipótesis de la investigación. La obtención de los datos se hace teniendo en cuenta La fuente de información, los sistemas de recolección y la técnica de recolección.
FUENTES DE INFORMACION
●Cuando se recoge información es posible que los datos ya hayan sido obtenidos de las unidades de observación y publicados o registrados por otros; o que los datos se tengan que obtener directamente de las unidades de observación en forma personal.
●Fuente Primaria●Fuente Secundaria
FUENTE PRIMARIA
●Si la información se obtiene directamente de la misma persona o entidad utilizando ciertas técnicas (encuesta, entrevistas, discusión grupal, etc..)
●Ejemplo: Observar la reacción de un grupo de pacientes con determinada enfermedad.
FUENTE SECUNDARIA
●Si la información a obtener ya ha sido recopilada y elaborada por otras personas o instituciones.
●Este tipo de información la encontramos en los informes estadísticos de las instituciones publicas y privadas. En el Perú, el Instituto Nacional de Estadística e Informática publica boletines estadísticos con respecto a la Producción, Inversión, población, migración, salud, etc..
TÉCNICAS: corresponde a las distintas maneras de obtener los datos que luego de ser procesados, se convertirán en información. Entre estas se tiene: la observación (participante y no participante), la entrevista, la encuesta, y la discusión grupal.
INSTRUMENTOS: medios materiales que se emplean para la recolección de datos. Entre estos se tiene: el guión de observación, la lista de cotejo, el cuestionario, la guía de entrevista o guión de entrevista, el guión de discusión grupal.
TÉCNICAS DE RECOLECCIÓN DE DATOS
ENCUESTA: su propósito radica en obtener información relativa a características predominantes de una población mediante la aplicación de procesos de interrogación y registro de datos.
ENTREVISTA: se apoya básicamente en la comunicación verbal, por lo que generalmente se exige un entrevistador garantizando mejor y más información
OBSERVACIÓN: permite captar la realidad sin distorsionar información, pues lleva a establecer la verdadera realidad del fenómeno.
DISCUSIÓN GRUPAL: permite captar representaciones afectivas, de valores, de tipo ideológico, en una determinada sociedad .
Diapositiva 7
Población y Muestra
Población
• TODOS los posibles• Individuos, objetos,
mediciones y conteos• Un PARÁMETRO describe a una Población.
Muestra
• PARTE “representativa” de la Población.• Un ESTADÍSTICO describe a una Muestra.
Variable
1-7
X=edadNúmeros
Se pueden definir muchas variables
Diapositiva 9
Resumen de Tipos de Variables
1-11
Cualitativos o de atributos
Discretos(Conteo)
Continuos(Medición)
Cuantitativos o numéricos
DATOS
1-11
CualitativasSi se expresan con las
escalas nominal u ordinal
CuantitativasSi se expresan con las
escalas intervalar y de razón
Tipos de variables
Tipo de variable
Diapositiva 11
Distribución en Categorías• Mutuamente excluyente: un individuo, objeto o
artículo, al ser incluido en una categoría, debe excluirse de las demás.
• Completamente incluyente: cada individuo, objeto o artículo debe clasificarse en al menos una categoría.
1-14
Diapositiva 12
Ordenamiento de Datos
Datos Numéricos
Arreglo de Datos
Distribución de FrecuenciasDistribución Acumulada
Histograma
Polígono
Ojiva
Tablas
Diapositiva 13
Distribución de Frecuencias• Ordenamiento de los datos en clases.• Indica el número de observaciones (datos) que caen
en cada clase.• Clase
• Grupo de valores que describe una característica de los datos.
• Tipos de Clases• Cualitativas • Cuantitativas
• Discretas• Continuas
Diapositiva 14
Pasos para construir una Distribución de Frecuencias
• 1. Calcule el alcance o rango • (Dato mayor - Dato menor).
• 2. Determine el número de clases.• Usualmente entre 6 y 15. (Ley Sturges)
• 3. Calcule el intervalo de clase.• Divida el alcance entre el número de clases
• 4. Determine los límites de cada clase.• Límite Superior y Límite Inferior
• 6. Asigne las observaciones a cada clase y efectúe el conteo.
Diapositiva 15
Frec. RelativaClase Frecuencia Frec. Relativa Acumulada 48.8-49.2 2 0.07 0.0749.3-49.7 5 0.16 0.2349.8-50.2 11 0.37 0.6050.3-50.7 6 0.20 0.8050.8-51.2 3 0.10 0.9051.3-51.7 3 0.10 1.00
30 1.00
Distribución de Frecuencias
Distribuciónde
FrecuenciasRelativas
Acumuladas
Organización de los datos
Variable
Tablas de frecuencias
Discreta
Gráficos
Continua
Tablas de frecuencias
Gráfico de barras
Barras
Sectores Circulares
Tabla de frecuencias por intervalos de clase
Histogramas
Cualitativa
Cuantitativa
Diapositiva 17
Ordenamiento de Datos
Datos Numéricos
Arreglo de Datos
Distribución de FrecuenciasDistribución Acumulada
Histograma
Polígono
Ojiva
Tablas
Diapositiva 18
Histograma
0
2
4
6
8
10
48.8 49.3 49.8 50.3 50.8 51.3 49.2 49.7 50.2 50.7 51.2 51.7
Clase Frecuencia
12
Fre
cuen
cia
48.8-49.2 249.3-49.7 549.8-50.2 1150.3-50.7 650.8-51.2 351.3-51.7 3
Diapositiva 19
Polígono de Frecuencias
48.5 49.0 49.5 50.0 50.5 51.0 51.5 52.0
Clase Marca FrecuenciaF
recu
enci
a
0
2
4
6
8
10
1248.8-49.2 49.0 249.3-49.7 49.5 549.8-50.2 50.0 1150.3-50.7 50.5 650.8-51.2 51.0 351.3-51.7 51.5 3
Diapositiva 20
Ojiva
Clase Frec. Menor Frec. Abs. que Acum.
Fre
cuen
cia
Acu
mu
lad
a R
elat
iva
0 48.8 49.3 49.8 50.3 50.8 51.3 51.8
3027
24
18
7
2
48.8-49.2 2 48.8 049.3-49.7 5 49.3 249.8-50.2 11 49.8 7 50.3-50.7 6 50.3 1850.8-51.2 3 50.8 2451.3-51.7 3 51.3 27
51.8 30
Diapositiva 21
68125557889911455666777789990001223456789991166712
1
2
3
4
5
6
Diagrama de Tallo y Hoja
Diapositiva 22
Características de los Datos
1-2
Resúmenesnuméricos
Medidas de Tendencia central
Medidas de Simetría y apuntamiento
Medidas dedispersión
Moda
Mediana
Media
Rango Varianza, desv.Estándar,Rango intercuartil
Indice de simetría
Diapositiva 24
Características de los Datos
Tendencia Central (Posición)
Dispersión(Variación)
Sesgo
Diapositiva 25
Tendencia Central
MediaAritmética
Mediana ModaMediaPonderada
MediaGeométrica
Diapositiva 26
Media de una Muestra• Para datos no agrupados, la media de una
muestra es la suma de todos los valores divididos entre el número total de los mismos:
• donde denota la media muestral• n es el número total de valores en la muestra.
3-4
nxx /
x
Diapositiva 27
Propiedades de la Media Aritmética
• Todo conjunto de datos tiene un valor medio.• Al evaluar la media se incluyen todos los valores.• Un conjunto de valores sólo tiene una media.
• Desventaja• Es afectada por los valores extremos.
3-6
Diapositiva 28
Media Aritmética
• Es la medida más común de tendencia central.• Es afectada por valores extremos.
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14
Media = 5 Media = 6
Diapositiva 29
Mediana
• Mediana: es el punto medio de los valores después de ordenarlos de menor a mayor, o de mayor a menor. La misma cantidad de valores se encuentra por arriba de la mediana que por debajo de ella.
• Nota: para un conjunto con un número par de números, la mediana será el promedio aritmético de los dos números medios.
3-10
Diapositiva 30
Mediana• No es afectada por los valores extremos.
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14
Mediana = 5 Mediana = 5
21nMediana
Diapositiva 31
Propiedades de la mediana
• La mediana es única para cada conjunto de datos.
• No se ve afectada por valores muy grandes o muy pequeños.
3-12
Diapositiva 32
Moda
• Valor que ocurre más a menudo. • No es afectada por valores extremos. • Puede no existir una moda.• Pueden haber varias modas.
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Moda = 9
0 1 2 3 4 5 6
Sin Moda
Diapositiva 33
Medidas de Dispersión
1-2
Diapositiva 34
Dispersión
Varianza Desviación Estándar Coeficiente de Variación
Varianza dela Población
Varianza de la Muestra
Desviación Estándar de la Población
Alcance
Alcance Intercuartil
Desviación Estándar de la Muestra
Diapositiva 35
Alcance o Rango
Diapositiva 36
Alcance
• Diferencia entre la mayor y la menor de las observacionesAlcance = xmayor – xmenor
• No toma en cuenta la forma en que están distribuidos los datos.
7 8 9 10 11 12
Alcance: 12 - 7 = 5
7 8 9 10 11 12
Alcance: 12 - 7 = 5
Diapositiva 37
Cuartiles
• Los datos se ordenan de menor a mayor.
• El alcance intercuartil es la distancia entre el tercer cuartil Q3 y el primer cuartil Q1.
25% 25% 25% 25%
1Q 2Q 3QObservación
MenorObservación
Mayor
Diapositiva 38
Desviación de la Media
Diapositiva 39
Promedio de desviación de cada dato
0 1 2 3 4 5
-1
-2
1
2
0)( x
Diapositiva 40
• Desviación cuadrática promedio con relación a la media de la Población
Varianza de la Población
Nx 2
2 )(
22
2 Nx
Diapositiva 41
• Raíz Cuadrada de la Varianza de la Población
Desviación Estándarde la Población
22
2 Nx
Nx 2
2 )(
Diapositiva 42
• Desviación cuadrática promedio (n-1) con relación a la media de la Muestra
Varianza de la Muestra
1)( 2
2
nxx
s
11
222
nxn
nx
s
Diapositiva 43
• Raíz Cuadrada de la Varianza de la Muestra
Desviación Estándarde la Muestra
1)( 2
2
nxx
ss
11
222
nxn
nx
ss
Diapositiva 44
Varianza de la PoblaciónDatos Agrupados
Nxf 2
2 )(
22
2 Nfx
clase de marcax
Diapositiva 45
Desviación Estándarde la PoblaciónDatos Agrupados
22
2 Nfx
Nxf 2
2 )(
clase de marcax
Diapositiva 46
Varianza de la MuestraDatos agrupados
1)( 2
2
nxxf
s
11
222
nxn
nfx
s
clase de marcax
Diapositiva 47
Desviación Estándarde la MuestraDatos Agrupados
1)( 2
2
nxxf
ss
11
222
nxn
nfx
ss
clase de marcax