ESTADISTICA

PROCESAR LA INFORMACION RECOLECTADA DE ACUERDO A LOS

MANUALES DE MANEJO DE INFORMACION

PROCESAR LA INFORMACION RECOLECTADA DE ACUERDO A LOS

MANUALES DE MANEJO DE INFORMACION

• PROCESAMIENTO DE DATOS ESTADISTICOS

CONTENIDO

• Estadística descriptiva• Tipos de variables• Clasificación de las variables• Variables discretas y continuas• Individuo, población y muestra• Distribución de frecuencia• Tabla de frecuencia (absolutas y

relativas)

• Medidas de tendencia central– Media (aritmética y geométrica)– Mediana– Moda

• Medidas de dispersión– Rango– Varianza– Desviación típica– Coeficiente de Pearson

• Histogramas estadísticos

ESTADISTICA DESCRIPTIVA

• La estadística descriptiva es una gran parte de la estadística que se dedica a analizar y representar los datos. Este análisis es muy básico. Aunque hay tendencia a generalizar a toda la población, las primeras conclusiones obtenidas tras un análisis descriptivo, es un estudio calculando una serie de medidas de tendencia central, para ver en qué medida los datos se agrupan o dispersan en torno a un valor central.

TIPOS DE VARIABLES

Variable cualitativa: Las variables cualitativas se refieren a

características o cualidades que no pueden ser medidas con números. Podemos distinguir dos tipos:

Variable cualitativa nominal: Una variable cualitativa nominal presenta

modalidades no numéricas que no admiten un criterio de orden. Por ejemplo:

El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y viudo.

Variable cualitativa ordinal o variable cuasicuantitativa:

Una variable cualitativa ordinal presenta modalidades no numéricas, en las que existe un orden.

Por ejemplo: La nota en un examen: suspenso,

aprobado, notable, sobresaliente. Puesto conseguido en una prueba

deportiva: 1º, 2º, 3º, ... Medallas de una prueba deportiva: oro,

plata, bronce.

Variable cuantitativa: Una variable cuantitativa es la que se

expresa mediante un número. Podemos distinguir dos tipos:

Variable discreta: Una variable discreta es aquella que toma

valores aislados, es decir no admite valores intermedios entre dos valores específicos.

Por ejemplo: El número de hermanos de 5 amigos: 2, 1,

0, 1, 3.

Variable continua Una variable continua es aquella que

puede tomar valores comprendidos entre dos números.

Por ejemplo: La altura de los 5 amigos: 1.73,

1.82, 1.77, 1.69, 1.75.

CLASIFICACIÓN DE LAS VARIABLES

SEGÚN LA MEDICIÓNSon las variables que expresan distintas cualidades,

características o modalidad. Cada modalidad que se presenta se denomina atributo o categoría y la medición consiste en una clasificación de dichos

atributos. Dentro de ellas podemos distinguir:

Variable cualitativa ordinal: También llamada variable cuasicuantitativa. La variable puede tomar distintos valores ordenados siguiendo una escala establecida, aunque no es necesario que el intervalo entre mediciones sea uniforme.

por ejemplo: leve, moderado, grave. Variable cualitativa nominal: En esta variable los

valores no pueden ser sometidos a un criterio de orden.

por ejemplo los colores o el lugar de residencia.

Variables cuantitativas Son las variables que se expresan mediante

cantidades numéricas. Las variables cuantitativas además pueden ser:

Variable discreta: Es la variable que presenta separaciones o interrupciones en la escala de valores que puede tomar.

Ejemplo: El número de hijos (1, 2, 3, 4, 5). Variable continua: Es la variable que puede adquirir

cualquier valor dentro de un intervalo especificado de valores.

Por ejemplo la masa (2,3 kg, 2,4 kg, 2,5 kg, ...) o la altura (1,64 m, 1,65 m, 1,66 m, ...), que solamente está limitado por la precisión del aparato medidor, en teoría permiten que siempre exista un valor entre dos cualesquiera.

Según la influencia

• Según la influencia que asignemos a unas variables sobre otras, podrán ser:

Variables independientes Son las que el investigador escoge para

establecer agrupaciones en el estudio, clasificando intrínsecamente a los casos del mismo. Un tipo especial son las variables de control, que modifican al resto de las variables independientes y que de no tenerse en cuenta adecuadamente pueden alterar los resultados por medio de un sesgo.

1. Variables dependientes Son las variables de respuesta que se observan

en el estudio y que podrían estar influenciadas por los valores de las variables independientes.

Hayman (1974 : 69) la define como propiedad o característica que se trata de cambiar mediante la manipulación de la variable independiente.

1. Variable interviniente Son aquellas características o propiedades que

de una manera u otra afectan el resultado que se espera y están vinculadas con las variables independientes y dependientes.

2. Variable moderadora Según Tuckman: representan un tipo especial

de variable independiente, que es secundaria, y se selecciona con la finalidad de determinar si afecta la relación entre la variable independiente primaria y las variables dependientes.

Variables discretas y continuas

La variable que tiene resultados o valores que tienden a variar de observación en observación debido a los factores relacionados con el azar recibe le nombre de variable aleatoria.

Las variables aleatorias pueden ser discretas y continuas

Una variable discreta se considera así si los valores que asume se pueden contar.

Una variable continua es aquella que pueden asumir cualquier valor dentro de un intervalo, por lo cual tiene un numero infinito de valores posibles.

• INDIVIDUO: Se llama unidad estadística o individuo a cada uno

de los elementos que componen la población estadística..

• POBLACION : Llamamos población estadística, universo o

colectivo al conjunto de referencia sobre el cual van a recaer las observaciones.

• MUESTRA: es un subconjunto de elementos de la población. Se suelen tomar muestras cuando es difícil o costosa la observación de todos los elementos de la población estadística.

Distribución de frecuencia

Es como se denomina en estadística a la agrupación de datos en categorías mutuamente excluyentes que indican el número de observaciones en cada categoría.

TABLA DE FRECUENCIA

MEDIDAS DE TENDENCIA CENTRAL

Al describir grupos de observaciones, con frecuencia es conveniente resumir la información con un solo número. Este número que, para tal fin, suele situarse hacia el centro de la distribución de datos se denomina medida o parámetro de tendencia central o de centralización.

• MEDIA ARITMETICA:(también llamada promedio o simplemente media) de un conjunto finito de números es igual a la suma de todos sus valores dividida entre el número de sumandos

• la media geométrica: de una cantidad arbitraria de números (digamos n números) es la raíz n-ésima del producto de todos los números.

1. Por ejemplo, la media geométrica de 2 y 18 es

• MEDIANA: es el valor de la variable que deja el mismo número de datos antes y después que él, una vez ordenados estos. De acuerdo con esta definición el conjunto de datos menores o iguales que la mediana representarán el 50% de los datos.

• Moda: es el valor con una mayor frecuencia en una distribución de datos.

• Hablaremos de una distribución bimodal de los datos cuando encontremos dos modas, es decir, dos datos que tengan la misma frecuencia absoluta máxima. Una distribución trimodal de los datos es en la que encontramos tres modas. Si todas las variables tienen la misma frecuencia diremos que no hay moda.

MEDIDAS DE DISPERSION

también llamadas medidas de variabilidad, muestran la variabilidad de una distribución, indicando por medio de un número, si las diferentes puntuaciones de una variable están muy alejadas de la media. Cuanto mayor sea ese valor, mayor será la variabilidad, cuanto menor sea, más homogénea será a la media. Así se sabe si todos los casos son parecidos o varían mucho entre ellos

• RANGO: se denomina rango estadístico (R) o recorrido estadístico al intervalo de menor tamaño que contiene a los datos; es calculable mediante la resta del valor mínimo al valor máximo; por ello,comparte unidades con los datos. Permite obtener una idea de la dispersión de los datos. • VARIANZA (σ2) de una variable aleatoria es una medida de su dispersión definida como la esperanza del cuadrado de la desviación de dicha variable respecto a su media. Está medida en unidades distintas de las de la variable. Por ejemplo, si la variable mide una distancia en metros, la varianza se expresa en metros al cuadrado.

desviación típica• (σ) es una medida de centralización o dispersión para variables

de razón (ratio o cociente) y de intervalo, de gran utilidad en la estadística descriptiva.

Se define como la raíz cuadrada de la varianza. Junto con este valor, la desviación típica es una medida (cuadrática) que informa de la media de distancias que tienen los datos respecto de su media aritmética, expresada en las mismas unidades que la variable

coeficiente de correlación de Pearson• es un índice que mide la relación lineal entre dos variables

aleatorias cuantitativas. A diferencia de la covarianza, la correlación de Pearson es independiente de la escala de medida de las variables.

Definición El coeficiente de correlación entre dos variables aleatorias X e Y

es el cociente

HISTOGRAMAS ESTADISTICOS

• histograma es una representación gráfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados. En el eje vertical se representan las frecuencias, y en el eje horizontal los valores de las variables, normalmente señalando las marcas de clase, es decir, la mitad del intervalo en el que están agrupados los datos.

Education

ESTADISTICA