Upload
lissethperez
View
6.061
Download
1
Embed Size (px)
DESCRIPTION
Citation preview
PROCESAR LA INFORMACION RECOLECTADA DE ACUERDO A LOS
MANUALES DE MANEJO DE INFORMACION
PROCESAR LA INFORMACION RECOLECTADA DE ACUERDO A LOS
MANUALES DE MANEJO DE INFORMACION
• PROCESAMIENTO DE DATOS ESTADISTICOS
CONTENIDO
• Estadística descriptiva• Tipos de variables• Clasificación de las variables• Variables discretas y continuas• Individuo, población y muestra• Distribución de frecuencia• Tabla de frecuencia (absolutas y
relativas)
• Medidas de tendencia central– Media (aritmética y geométrica)– Mediana– Moda
• Medidas de dispersión– Rango– Varianza– Desviación típica– Coeficiente de Pearson
• Histogramas estadísticos
ESTADISTICA DESCRIPTIVA
• La estadística descriptiva es una gran parte de la estadística que se dedica a analizar y representar los datos. Este análisis es muy básico. Aunque hay tendencia a generalizar a toda la población, las primeras conclusiones obtenidas tras un análisis descriptivo, es un estudio calculando una serie de medidas de tendencia central, para ver en qué medida los datos se agrupan o dispersan en torno a un valor central.
TIPOS DE VARIABLES
Variable cualitativa: Las variables cualitativas se refieren a
características o cualidades que no pueden ser medidas con números. Podemos distinguir dos tipos:
Variable cualitativa nominal: Una variable cualitativa nominal presenta
modalidades no numéricas que no admiten un criterio de orden. Por ejemplo:
El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y viudo.
Variable cualitativa ordinal o variable cuasicuantitativa:
Una variable cualitativa ordinal presenta modalidades no numéricas, en las que existe un orden.
Por ejemplo: La nota en un examen: suspenso,
aprobado, notable, sobresaliente. Puesto conseguido en una prueba
deportiva: 1º, 2º, 3º, ... Medallas de una prueba deportiva: oro,
plata, bronce.
Variable cuantitativa: Una variable cuantitativa es la que se
expresa mediante un número. Podemos distinguir dos tipos:
Variable discreta: Una variable discreta es aquella que toma
valores aislados, es decir no admite valores intermedios entre dos valores específicos.
Por ejemplo: El número de hermanos de 5 amigos: 2, 1,
0, 1, 3.
Variable continua Una variable continua es aquella que
puede tomar valores comprendidos entre dos números.
Por ejemplo: La altura de los 5 amigos: 1.73,
1.82, 1.77, 1.69, 1.75.
CLASIFICACIÓN DE LAS VARIABLES
SEGÚN LA MEDICIÓNSon las variables que expresan distintas cualidades,
características o modalidad. Cada modalidad que se presenta se denomina atributo o categoría y la medición consiste en una clasificación de dichos
atributos. Dentro de ellas podemos distinguir:
Variable cualitativa ordinal: También llamada variable cuasicuantitativa. La variable puede tomar distintos valores ordenados siguiendo una escala establecida, aunque no es necesario que el intervalo entre mediciones sea uniforme.
por ejemplo: leve, moderado, grave. Variable cualitativa nominal: En esta variable los
valores no pueden ser sometidos a un criterio de orden.
por ejemplo los colores o el lugar de residencia.
Variables cuantitativas Son las variables que se expresan mediante
cantidades numéricas. Las variables cuantitativas además pueden ser:
Variable discreta: Es la variable que presenta separaciones o interrupciones en la escala de valores que puede tomar.
Ejemplo: El número de hijos (1, 2, 3, 4, 5). Variable continua: Es la variable que puede adquirir
cualquier valor dentro de un intervalo especificado de valores.
Por ejemplo la masa (2,3 kg, 2,4 kg, 2,5 kg, ...) o la altura (1,64 m, 1,65 m, 1,66 m, ...), que solamente está limitado por la precisión del aparato medidor, en teoría permiten que siempre exista un valor entre dos cualesquiera.
Según la influencia
• Según la influencia que asignemos a unas variables sobre otras, podrán ser:
Variables independientes Son las que el investigador escoge para
establecer agrupaciones en el estudio, clasificando intrínsecamente a los casos del mismo. Un tipo especial son las variables de control, que modifican al resto de las variables independientes y que de no tenerse en cuenta adecuadamente pueden alterar los resultados por medio de un sesgo.
1. Variables dependientes Son las variables de respuesta que se observan
en el estudio y que podrían estar influenciadas por los valores de las variables independientes.
Hayman (1974 : 69) la define como propiedad o característica que se trata de cambiar mediante la manipulación de la variable independiente.
1. Variable interviniente Son aquellas características o propiedades que
de una manera u otra afectan el resultado que se espera y están vinculadas con las variables independientes y dependientes.
2. Variable moderadora Según Tuckman: representan un tipo especial
de variable independiente, que es secundaria, y se selecciona con la finalidad de determinar si afecta la relación entre la variable independiente primaria y las variables dependientes.
Variables discretas y continuas
La variable que tiene resultados o valores que tienden a variar de observación en observación debido a los factores relacionados con el azar recibe le nombre de variable aleatoria.
Las variables aleatorias pueden ser discretas y continuas
Una variable discreta se considera así si los valores que asume se pueden contar.
Una variable continua es aquella que pueden asumir cualquier valor dentro de un intervalo, por lo cual tiene un numero infinito de valores posibles.
• INDIVIDUO: Se llama unidad estadística o individuo a cada uno
de los elementos que componen la población estadística..
• POBLACION : Llamamos población estadística, universo o
colectivo al conjunto de referencia sobre el cual van a recaer las observaciones.
• MUESTRA: es un subconjunto de elementos de la población. Se suelen tomar muestras cuando es difícil o costosa la observación de todos los elementos de la población estadística.
Distribución de frecuencia
Es como se denomina en estadística a la agrupación de datos en categorías mutuamente excluyentes que indican el número de observaciones en cada categoría.
TABLA DE FRECUENCIA
MEDIDAS DE TENDENCIA CENTRAL
Al describir grupos de observaciones, con frecuencia es conveniente resumir la información con un solo número. Este número que, para tal fin, suele situarse hacia el centro de la distribución de datos se denomina medida o parámetro de tendencia central o de centralización.
• MEDIA ARITMETICA:(también llamada promedio o simplemente media) de un conjunto finito de números es igual a la suma de todos sus valores dividida entre el número de sumandos
• la media geométrica: de una cantidad arbitraria de números (digamos n números) es la raíz n-ésima del producto de todos los números.
1. Por ejemplo, la media geométrica de 2 y 18 es
• MEDIANA: es el valor de la variable que deja el mismo número de datos antes y después que él, una vez ordenados estos. De acuerdo con esta definición el conjunto de datos menores o iguales que la mediana representarán el 50% de los datos.
• Moda: es el valor con una mayor frecuencia en una distribución de datos.
• Hablaremos de una distribución bimodal de los datos cuando encontremos dos modas, es decir, dos datos que tengan la misma frecuencia absoluta máxima. Una distribución trimodal de los datos es en la que encontramos tres modas. Si todas las variables tienen la misma frecuencia diremos que no hay moda.
MEDIDAS DE DISPERSION
también llamadas medidas de variabilidad, muestran la variabilidad de una distribución, indicando por medio de un número, si las diferentes puntuaciones de una variable están muy alejadas de la media. Cuanto mayor sea ese valor, mayor será la variabilidad, cuanto menor sea, más homogénea será a la media. Así se sabe si todos los casos son parecidos o varían mucho entre ellos
• RANGO: se denomina rango estadístico (R) o recorrido estadístico al intervalo de menor tamaño que contiene a los datos; es calculable mediante la resta del valor mínimo al valor máximo; por ello,comparte unidades con los datos. Permite obtener una idea de la dispersión de los datos. • VARIANZA (σ2) de una variable aleatoria es una medida de su dispersión definida como la esperanza del cuadrado de la desviación de dicha variable respecto a su media. Está medida en unidades distintas de las de la variable. Por ejemplo, si la variable mide una distancia en metros, la varianza se expresa en metros al cuadrado.
desviación típica• (σ) es una medida de centralización o dispersión para variables
de razón (ratio o cociente) y de intervalo, de gran utilidad en la estadística descriptiva.
Se define como la raíz cuadrada de la varianza. Junto con este valor, la desviación típica es una medida (cuadrática) que informa de la media de distancias que tienen los datos respecto de su media aritmética, expresada en las mismas unidades que la variable
coeficiente de correlación de Pearson• es un índice que mide la relación lineal entre dos variables
aleatorias cuantitativas. A diferencia de la covarianza, la correlación de Pearson es independiente de la escala de medida de las variables.
Definición El coeficiente de correlación entre dos variables aleatorias X e Y
es el cociente
HISTOGRAMAS ESTADISTICOS
• histograma es una representación gráfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados. En el eje vertical se representan las frecuencias, y en el eje horizontal los valores de las variables, normalmente señalando las marcas de clase, es decir, la mitad del intervalo en el que están agrupados los datos.