19
Términos Básicos en la Estadística Integrante: Maria Falconi c.i 23.998.809

Términos básicos en la estadística

Embed Size (px)

Citation preview

Page 1: Términos básicos en la estadística

Términos Básicos en la Estadística

Integrante: Maria Falconi c.i 23.998.809

Page 2: Términos básicos en la estadística

Definición de Variable

Una variable estadística es el conjunto de valores que puede tomar cierta característica de la población sobre la que se realiza el estudio estadístico. Estas variables pueden ser: la edad, el peso, las notas de un examen, etc.

Page 3: Términos básicos en la estadística

Tipos de Variables• Las variables estadísticas se pueden

clasificar por diferentes criterios. Según su medición existen dos tipos de variables:

Variables cualitativas Son las variables que expresan distintas

cualidades, características o modalidad. Cada modalidad que se presenta se denomina atributo o categoría y la medición consiste en una clasificación de dichos atributos. Las variables cualitativas pueden ser dicotómicas cuando sólo pueden tomar dos valores posibles como sí y no, hombre y mujer o son politómicas cuando pueden adquirir tres o más valores. Dentro de ellas podemos distinguir:

Variable cualitativa ordinal: También llamada variable cuasi cuantitativa. La variable puede tomar

distintos valores ordenados siguiendo una escala establecida, aunque no es necesario que el intervalo entre mediciones sea uniforme, por ejemplo: leve, moderado, grave.

Medallas de una prueba deportiva: oro, plata, bronce.

El grado de satisfacción de algo: Mucho, poco, nada. Bueno, regular, malo.

Variable cualitativa nominal: En esta variable los valores no pueden ser sometidos a un criterio de orden como por ejemplo:

Los colores o el lugar de residencia. El estado civil, con las siguientes modalidades:

soltero, casado, separado, divorciado y viudo. Profesión, Maestro, Doctor, Ingeniero, entre

otras.

Page 4: Términos básicos en la estadística

Ejemplo de variablesEjemplo 1Se desea realizar una estudio estadístico con algunas personas de la

ciudad de Medellín, acerca de lo viable o no del horario del pico y placa para los automóviles.

La Población es el conjunto de estudio más grande, para este caso las personas de la Ciudad de Medellín.

La Muestra es el conjunto de estudio más pequeño que la población, para este caso algunas personas de la Ciudad de Medellín. La Variables es el horario del pico y placa para los automóviles, la cual vendría hacer una Variable Cualitativa Ordinal.

Ejemplo 2 La Institución Educativa Escuela Normal

Superior del bajo Cauca, se llevará a cabo un estudio estadístico con los estudiantes del grado sexto, para saber su deporte favorito.

La Población para este caso son: los estudiantes de la Institución Educativa Escuela Normal Superior del bajo Cauca.

La Muestra son los estudiantes del grado sexto de la Institución Educativa Escuela Normal Superior del bajo Cauca. La Variables vendría siendo el deporte favorito la cual es una Variable Cualitativa Nominal.

Page 5: Términos básicos en la estadística

Población

Población estadística, en estadística, también llamada universo o colectivo, es el conjunto de elementos de referencia sobre el que se realizan las observaciones.

Page 6: Términos básicos en la estadística

Ejemplo de Población Ejemplo 2

En la Institución Educativa Escuela Normal Superior del bajo Cauca su Rectora Fanny, realiza una encuesta en los grados 10º y 11º para saber en que estado se encuentran los pupitres.

La Población es: la Institución Educativa Escuela Normal Superior del bajo Cauca.

Ejemplo 1

Un salón de 30 estudiantes, se le pregunta a 12 alumnos sobre su edad.

La Población son: los 30 estudiantes.

Page 7: Términos básicos en la estadística

Muestra En estadística una muestra estadística (también llamada muestra complicada o

simplificada muestra) es un subconjunto de casos o individuos de una población estadística.

Las muestras se obtienen con la intención de inferir propiedades de la totalidad de la población, para lo cual deben ser representativas de la misma. Para cumplir esta característica la inclusión de sujetos en la muestra debe seguir una técnica de muestreo. En tales casos, puede obtenerse una información similar a la de un estudio exhaustivo con mayor rapidez y menor coste (véanse las ventajas de la elección de una muestra, más abajo).

Por otra parte, en ocasiones, el muestreo puede ser más exacto que el estudio de toda la población porque el manejo de un menor número de datos provoca también menos errores en su manipulación. En cualquier caso, el conjunto de individuos de la muestra son los sujetos realmente estudiados.

El número de sujetos que componen la muestra suele ser inferior que el de la población, pero suficiente para que la estimación de los parámetros determinados tenga un nivel de confianza adecuado. Para que el tamaño de la muestra sea idóneo es preciso recurrir a su cálculo.

Page 8: Términos básicos en la estadística

Ejemplos de MuestraEjemplo 1

En la Institución Educativa Escuela Normal Superior del bajo Cauca, se llevará a cabo un estudio estadístico con los estudiantes del grado sexto, para saber su deporte favorito.

La Muestra son los estudiantes del grado sexto de la Institución Educativa Escuela Normal Superior del bajo Cauca.

Ejemplo 2

En la Institución Educativa Escuela Normal Superior del bajo Cauca su Rectora Fanny, realiza una encuesta en los grados 10º y 11º para saber en que estado se encuentran los pupitres.

La Muestra son los estudiantes de los grados 10º y once de la Institución Educativa Escuela Normal Superior del bajo Cauca.

Page 9: Términos básicos en la estadística

Parámetro Estadístico

Parámetro Estadístico Un parámetro estadístico es

un número que se obtiene a partir de los datos de una distribución estadística.

Los parámetros estadísticos sirven para sintetizar la

información dada por una tabla o por una gráfica.

Tipos Parámetros de dispersión. Son datos

que informan de la concentración o dispersión de los datos respecto de los parámetros de centralización.

Por ejemplo el recorrido, la desviación media, la varianza y la desviación típica.

Parámetros de centralización. Son datos que representan de forma global a toda la población. Entre ellos vamos a estudiar la media aritmética, la moda y la mediana.

Page 10: Términos básicos en la estadística

Ejemplo de Parámetros Estadísticos Si estas observando un grupo de personas, digamos 50 personas, debes caracterizar tu

grupo como? haciendo observaciones de cada elemento para esto, hay parámetros numéricosy parámetros binarios quieres saber que promedio de estatura tiene tu grupodebes medir a las 50 personas, y obtener por tanto 50 observaciones (parámetro numérico, estatura, cm o m) con esos datos puedes calcular los parámetros de tendencia central:el promedio (media), la mediana y la moda

lo mismo puedes hacer para otras características: peso, edad, etc.

Quieres saber que característica predomina mas en tu grupo, color de pelo, color de ojos, color de piel, complexión, es decir, que vas a evaluar a cada elemento y obtendrás una observación de cada parámetro, y por tanto tendrás 50 observaciones de cada parámetro cuando tienes la información, debes asignarle un valor a cada condición: ojos cafés (1), ojos azules (2), ojos verdes (3) para el parámetro color de ojos, pelo negro (1), pelo rubio (2), pelo rojizo (3), pelo castaño (4) para el parámetro color de pelo, y así para cada característica al transformar tus valores cualitativos (color) a cuantitativos (1,2,3,...n) puedes ver que valor predomina y puedes ahora si caracterizar a tu grupo .

Page 11: Términos básicos en la estadística

Escalas de medición

Todos los datos son generados por una de las cuatro escalas de medición: nominal, ordinal, de intervalo o de razón.

A continuación se definen cada una de estas escalas de medición.

Page 12: Términos básicos en la estadística

Tipos de escalas de medición ejemplos

Escala nominal Una escala de medición es

nominal si los datos son etiquetas o categorías que se usan para definir un atributo de un elemento.

Los datos nominales pueden ser numéricos o no numéricos.

Ejemplo

El sexo de una persona es un dato nominal no numérico. El numero de seguro social de una persona es un dato nominal numérico.

Page 13: Términos básicos en la estadística

Escala Ordinal

Escala ordinal Una escala de medición

es ordinal si los datos pueden usarse para jerarquizar u ordenar las observaciones. Los datos ordinales pueden ser numéricos o no numéricos.

Ejemplo

Las medidas pequeño, mediano y grande para dar el tamaño de un objeto son datos ordinales no numéricos

Page 14: Términos básicos en la estadística

Escala de intervalo, escala de razón.

Escala de intervalo

Una escala de medición es de intervalo si los datos tienen las propiedades de los datos ordinales y los intervalos entre observaciones se expresan en términos de una unidad de medición fija. Los datos de intervalo tienen que ser numéricos.

Ejemplo Las mediciones de temperatura son datos de

intervalo. Suponga que la temperatura en un lugar es de 21°C y en otro es de 4°C. Estos lugares se pueden jerarquizar de acuerdo con lo calurosos que son: el primero es más caliente que el segundo. La unidad fija de medición, 1°C , permite decir cuán más caliente es el primer lugar: 17°C .

Escala de razón

Una escala de medición es de razón si los datos tienen las propiedades

de los datos de intervalo y el cociente (o razón) entre dos medidas tiene sentido. Los datos de razón tienen que ser numéricos.

Ejemplo Variables como la distancia, la

altura, el peso y el tiempo se miden con una escala de razón.

Page 15: Términos básicos en la estadística

Sumatoria Razón, ProporciónRAZON

Es un cociente en el que el numerador no está incluido en el denominador. A menudo las cantidades se miden en las mismas unidades, pero no es esencial. El rango oscila entre 0 e infinito.

Ejemplo

Cociente entre el número de casos de TBC en varones y mujeres en 2005:

Razón=135/53=2,55

Cociente entre los casos de TBC ocurridos en individuos con edades superiores a 55 y el grupo de individuos con edades inferiores a 55 :

Razón=95/93=1,02

PROPORCION

Es un cociente en el que el numerador está incluido en el denominador. Una proporción no es más que la expresión de la probabilidad de que un suceso ocurra.El rango esta comprendido entre 0 y 1 o bien en términos porcentuales de 0% a 100%, y no tiene dimensión.

Ejemplo Cociente entre el número de casos ocurridos en

varones y el total de casos en el año 2005. 135/188=0,72

El 72% de los casos han ocurrido en varones.

Cociente entre el número de casos ocurrido en individuos con más de 65 años y el total de casos en el año 2005.

77/188=0,41 El 41% de los casos se han detectado en personas mayores de 65 años.

Page 16: Términos básicos en la estadística

Tasa y frecuenciaTASA

La tasa es una forma especial de proporción o de razón que tiene en cuenta el tiempo. Es una medida que relaciona el cambio de una magnitud por unidad de cambio en otra magnitud (por regla general, tiempo). La utilización de las tasas es esencial para comparar experiencias entre poblaciones en diferentes tiempos, diferentes lugares o entre diferentes tipos de personas. Su rango oscila entre 0 e infinito y su medida es tiempo.

Ejemplo Cociente entre el número de casos de TBC en varones

durante el años 2005 y la población estimada de varones en el año 2005:

135/516.329=0,000261 La tasa es de 26,1 casos de TBC por cada 100.000 habitantes varones en 1 año (2005).

Cociente entre los casos de defunción por TBC y la población estimada en el año 2005:

8/1076635=0,000007 La tasa de mortalidad es de 0,7 por 100.000 habitantes en 1 año.

Frecuencia

En estadística, la frecuencia (o frecuencia absoluta) de un evento x, es

el número de veces ni que dicho evento se repite durante un experimento o muestra estadística. Comúnmente, la distribución de la frecuencia suele visualizarse con el uso de histogramas.

Page 17: Términos básicos en la estadística

Ejemplo de frecuencia Supongamos que las calificaciones de un estudiante de secundaria

fueran las siguientes: 18, 13, 12, 14, 11, 08, 12, 15, 05, 20, 18, 14, 15, 11, 10, 10, 11, 13.

Entonces: La frecuencia absoluta de 11 es 3, pues 11 aparece 3 veces. La frecuencia relativa de 11 es 0.17, porque corresponde a la división

3/18 ( 3 de las veces que aparece de las 18 notas que aparecen en total).

La frecuencia absoluta acumulada para el valor 11 es 7, porque hay 7 valores menores o iguales a 11.

La frecuencia relativa acumulada para el valor 11 es 0.38, porque corresponde a la división 7/18 (frecuencia absoluta acumulada dividida entre el número total de muestras).

Page 18: Términos básicos en la estadística

Ejemplo GeneralREGLAS GENERALES PARA FORMAS DISTRIBUCIONES DE FRECUENCIAS PARA DATOS AGRUPADOS EN INTERVALOS Cuando los datos contienen una gran cantidad de elementos, para facilitar los cálculos es necesario

agruparlos, a estos grupos se los llama intervalos o clases. Un intervalo es una serie de números incluidos entre dos extremos, así por ejemplo, el intervalo 40 – 45 está formado por 40, 41, 42, 43, 44 y 45, siendo 40 el límite inferior, 45 el límite superior, 39,5 límite real inferior (límite inferior disminuido en 5 décimas) y 40,5 el límite real superior (límite superior aumentado en 5 décimas).

Las reglas generales para formas distribuciones de frecuencias para datos agrupados en intervalos son:1) Calcule el Recorrido Verdadero (Rv).- También se llama rango o amplitud total. Es la diferencia entre el valor

mayor y el menor de los datos.2) Seleccione el Número Aproximado de Intervalos de Clase (ni).- No debe ser menor de 5 y mayor de 12, ya que

un número mayor o menor de clases podría oscurecer el comportamiento de los datos. Para calcular la amplitud de los intervalos el valor del número de intervalos se ofrecerá como dato del ejercicio.

3) Calcule la Amplitud del Intervalo (i).- Se obtiene dividiendo el Recorrido Verdadero (Rv)entre el Número Aproximado de Intervalos de Clase (ni):

Se procede a calcular la Amplitud la Aproximada del Intervalo (≈)i ≈ Rv / niPudiendo resultar el valor de i de diferentes formas, esto quiere decir que no sea exacto o un numero expresado

decimales, que sea entero par o un entero impar. Para efectos de nuestro curso estableceremos un criterio para poder decidir el valor de la amplitud del intervalo definitivo el cual nos permita construir los intervalos de clases. Por ejemplo:

Si una distribución de 40 datos el valor mayor es 41 y el menor es 20 se tiene:

Page 19: Términos básicos en la estadística

Ejemplo GeneralCalculando el Rango se obtiene:Rv = Vmax – Vmin = 41 -20 = 21 (si la variable es discreta)Rv = Vmax – Vmin + S = 41 -20 + 1 = 22 (si la variable es continua)Siendo Vmax el valor máximo de los valores reportados, Vmin el valor mínimo de los valores reportados y S la sensibilidad

del conjunto de los datos.Para este ejemplo supondremos que Número Aproximado de Intervalos de Clase (ni) es seis, (ni= 6)Calculando, se obtiene:i ≈ Rv / ni ≈ 22 / 6 ≈ 3,67•

Para determinar el valor final de la amplitud del intervalo aplicaremos e siguiente criterio (que llamaremos Regla de Oro):

1. Si el valor calculado de i es un numero decimal, tomaremos el número impar más cercano a él.2. Si el valor calculado de i es un numero entero par, tomaremos el menor número impar cercano a él.3. Si el valor calculado de i es un numero entero impar, entonces el valor de i es igual al mismo valor calculado.Aplicando la Regla de Oro para el ejemplo, al valor calculado de i, tenemos que es un numero decimal y al aplicar el

primer criterio, se obtiene que: i = 34) Forme los Intervalos de Clase agregando i-1 al límite inferior de cada clase, comenzando por el Xmín del rango.5) Se realiza el Conteo de Datos que cae dentro de cada clase (frecuencia absoluta)6) Calcule el Punto Medio para cada Clase (Xi).- Es el valor del Punto Medio de cada clase, se obtiene sumando los límites

superior (Lim. Sup) e inferior (Lim. Inf.) del intervalo y dividiendo ésta suma entre 2Xi = (Lim. Sup. + Lim. Inf. ) / 2