7

Click here to load reader

Taller n°4 estadistica i medidas de tendencia central

Embed Size (px)

Citation preview

Page 1: Taller n°4 estadistica i medidas de tendencia central

MEDIDAS DE TENDENCIA CENTRAL

Los métodos y análisis que se hacen en estadística

tratan, en primer lugar, de una recolección,

organización, y descripción de datos numéricos que

forman la muestra o parte de ella, por medio de

tablas y graficas específicas. Luego, basados en las

características de estas se obtienen conclusiones

acerca de las características de la población.

¿Podríamos resumir los datos de estas tablas en un solo valor? La respuesta es sí. Al

observar la mayoría de los datos, estos se agrupan hacia el centro de su distribución con la

tendencia de estar los demás datos alrededor de él. Para encontrar dicho número

representativo, es necesario el estudio de algunos conceptos estadísticos básicos llamados

MEDIDAS DE TENDENCIA CENTRAL, que en otras palabras es, asignar un número

representativo de toda la colección de datos.

Las medidas de posición o promedios son números que indican una cierta

acumulación de los datos de la variable alrededor de una determinada posición

central, es decir, un promedio resume todos los datos en uno solo, que los

representa.

Si los datos de la variable están muy concentrados alrededor del promedio, este

es muy representativo. Por el contrario, si los citados valores están muy alejados

con relación al promedio, este es poco representativo.

MEDIA ARITMETICA SIMPLE

Definimos la media aritmética simple, como el cociente que resulta de dividir la suma de

todos los valores de las observaciones entre el número total de observaciones. Este valor

es de uso muy frecuente y es sinónimo de las expresiones: puntaje medio, Salario medio,

Temperatura media, etc. Representamos la media aritmética muestral por medio de una

barra sobre la letra que representa la magnitud que estamos midiendo. Por lo tanto, la

media de la magnitud x queda determinada:

Siendo n el número de datos de la muestra y X1 X2 X3 … Xn los datos.

Page 2: Taller n°4 estadistica i medidas de tendencia central

PROPIEDADES DE LA MEDIA ARITMETICA.

Todo conjunto de datos numérico (discreto o continuo) tiene una media.

Para calcular la media se toman todos los valores o datos.

Un conjunto de datos solo tiene una media, la media es única.

La media es una medida útil para comparar dos o más poblaciones y ver donde es más representativa, así para datos que contienen uno o dos datos muy grandes o muy pequeños, la media aritmética puede no ser representativa, es decir, la media se ve afectada por valores muy grandes o muy pequeños, debido a la dispersión de los datos.

EJEMPLO: Mostrar donde es más representativo el promedio al comparar los valores de dos muestras: por ejemplo, las notas obtenidas por el aula (A) o por el aula (B) de un programa de la CUN, de nueve estudiantes, donde un puntaje por encima de 7,5 es satisfactorio y la nota máxima es 15 puntos:

XA= ∑ [ Xi ] / n =

XB = ∑ [ Xi ] / n =

-Calcula el promedio de notas del aula (A) y luego el de (B) ¿Que encontraste?

¿Dónde es más representativa la media? ¿Porque?

DESVENTAJAS DE LA MEDIA. La media emplea el valor de cada individuo u objeto en su cálculo, razón por la cual si uno o dos de estos valores es extremadamente grande o extremadamente pequeño, la media puede no ser un promedio adecuado para representar a los datos.

Ejercicio. Los ingresos anuales de un pequeño grupo de corredores de la bolsa de Bogotá (en millones de pesos) son $62,9; $ 61,6; $62,5; $60,8 y $976,5. ¿Cuál es el ingreso medio? ¿Es representativa la media? Explique.

Aula A Aula B

8,2 15,0

8,1 10,0

8,0 6,0

8,0 8,0

7,8 2,0

8,0 8,0

7,9 10,0

7,9 6,0

8,1 8,0

Page 3: Taller n°4 estadistica i medidas de tendencia central

LA MEDIANA (Me)

El punto central de un conjunto de valores se puede describir mejor usando preferiblemente la mediana que la media, dado las ventajas que ofrece.

La mediana de una colección de datos ordenados de menor a mayor según su magnitud, es un número que supera a la mitad de los valores de la distribución y es superada por la otra mitad. De este modo, la mediana es un valor de posición que divide a la distribución de los datos en dos partes iguales, estableciendo un 50% de los datos por debajo de él y el otro 50% por encima de él.

Si el número de términos es impar, la mediana es el valor del término que ocupa el lugar central.

Si el número de términos de la distribución es par, la mediana es el valor medio de los datos centrales, en dicho caso puede no ser ninguno de los valores dados. .

PROPIEDADES Y VENTAJAS DE LA MEDIANA.

La mediana es única, hay solo una para un conjunto de datos.

La mediana no se ve afectada por valores extremadamente grandes o extremadamente pequeños.

Observemos en el siguiente ejemplo que la mediana no se ve afectada por los valores extremos como si puede suceder con la media.

EJEMPLO: Mostrar que la mediana es una medida de posición más confiable que la media:

En las notas obtenidas por el aula (A) o por el aula (B) de un programa de la CUN, de nueve estudiantes, donde un puntaje por encima de 7,5 es satisfactorio y la nota máxima es 15 puntos:

-Primero ordenamos los datos de menor a mayor. Luego ubicamos el valor central, que divide a los datos en dos partes iguales.

Ordenamos datos AULA (A):

Me(A)=

Ordenamos datos AULA (B):

Me(B)=

Aula A Aula B

Page 4: Taller n°4 estadistica i medidas de tendencia central

¿Se ve afectada la mediana por valores en la variable muy grandes o muy pequeños?, ¿podría decirse que es más confiable que la media?

Ejercicio. En los ingresos anuales de un pequeño grupo de corredores de la bolsa de Bogotá (en millones de pesos) $62,9; $ 61,6; $62,5; $60,8 y $976,5. ¿Cuál es el ingreso anual mediano? ¿Es útil la mediana en este caso? Explique.

MODA (Mo).

La moda corresponde al valor de la variable que más se repite; es decir, el dato cuya frecuencia es mayor en una tabla de frecuencias absolutas. Hablar de moda no tiene sentido en distribuciones de datos que no se repiten. La moda se conoce abreviadamente como MO.

PROPIEDADES, VENTAJAS Y DESVENTAJAS DE LA MODA.

La moda corresponde al dato que aparece con más frecuencia. La moda es bastante útil para describir niveles de medición nominal (atributos) y

ordinal (numero entero). La moda no se ve afectada por valores extremadamente grandes o

extremadamente pequeños. La moda no resulta ser útil cuando el conjunto de datos no tiene moda, tiene

exactamente dos modas y se denomina bimodal o el conjunto de datos presenta más de dos modas, en dicho caso se le llama multimodal.

EJEMPLO: En una entrevista realizada a un grupo de empresarios se le pregunto por la revista de su preferencia, las respuestas (nominal) fueron:

Semana, alo, semana, alo, diner, diner, alo, semana, alo, semana, diner, diner, alo, alo, diner, semana, alo, diner, alo, diner, semana, alo, semana, diner, diner, semana, diner, diner.

Moda corresponde al dato Mo =

EJEMPLO: El gerente del HUS ordena realizar una encuesta en un barrio subnormal de Sincelejo y se pregunto por la cantidad de niños en edad escolar que sufren desnutrición en familias desplazadas. Los datos (ordinal) obtenidos fueron los siguientes:

2,7,3,3,4,6,7,8,2,2,7,5,2,3,6,5,7,2,7,7,5,2,2,3,4,5,6,3,2,5,2,2,2. Mo =

Page 5: Taller n°4 estadistica i medidas de tendencia central

MEDIA, MEDIANA Y MODA PARA DATOS NO AGRUPADOS

A cualquier característica de la población (media, desviación media, varianza,etc)

que puede ser medida se le llama parámetro poblacional, en tanto que la medida de una característica que se basa en datos muéstrales se le llama estadístico. En estadística los parámetros suelen representarse por letras griegas, mientras que los estadísticos con letras romanas. 1. Si un dato se repite, debemos usar LA MEDIA PONDERADA POBLACIONAL

(cuando en el estudio se toman todos los datos de la población) o LA MEDIA PONDERADA MUESTRAL (cuando en el estudio se toma solo una muestra de los datos que hace parte de la población), las cuales proveen el mismo resultado que la media aritmética, ahorrando varios pasos.

Primero debemos organizar los datos en una tabla, visualizando las frecuencias absolutas de los datos (numero de veces que se repite un valor); luego multiplicamos la frecuencia absoluta por el valor del dato correspondiente, sumamos los resultados parciales y dividimos la suma entre (N) si se trata del numero de elementos una población o entre (n) si se trata del numero de elementos de una muestra. En forma de algoritmo, la media poblacional µ y la media muestral X están dadas por:

µ = ∑ [ f . X ] / N y x = ∑ [ f . X ] / n

Siendo f = f1, f2, f3,… ,fn la frecuencia absoluta de cada dato, y X = X1,X2, X3, … ,Xn los datos.

2. LA MODA

La moda corresponde al dato de la variable que más se repite; es decir, a dato cuya frecuencia es mayor en una tabla de frecuencias absolutas. Hablar de moda no tiene sentido en distribuciones de datos que no se repiten. La moda se conoce abreviadamente como MO.

3. LA MEDIANA

Para el tercer caso, calculamos las frecuencias absolutas acumuladas, de manera que la mediana será el valor de la variable cuya frecuencia absoluta acumulada sea inmediatamente mayor a la mitad de los datos.

EJERCICIO (RESOLVER Y ENTREGAR): La ministra de Salud preocupada por las metas

planteadas por el nuevo gobierno, le pide cada gerente administrativo de la ESE en cada

municipio, investigar el número de pacientes atendidos por día. El gerente administrativo

de la ESE Sincelejo entrega los siguientes datos recogidos en 20 días:

12, 14, 20, 18, 20,12, 15, 13, 15,18,18, 19,15, 15, 12,14,15, 15,20,18.

Page 6: Taller n°4 estadistica i medidas de tendencia central

Construya una tabla de distribución de frecuencias.

Pacientes atendidos

X

Frecuencia absoluta

f

Frecuencia absoluta acumulada

F

f . X

n = ∑ f = ∑ f . X =

El promedio de los datos es la suma de todas las frecuencias absolutas

multiplicadas por cada dato y dividido entre el total de datos:

x = ∑ [f . X] / n =

¿Qué significado tiene el valor encontrado de la media ponderada?

La moda corresponde al valor del dato que tiene la mayor frecuencia absoluta, es

decir al dato que más se repite.

Mo =

¿Qué quiere decir el valor encontrado de la moda?

La mediana corresponde al valor de la variable o dato cuya frecuencia absoluta

acumulada sea inmediatamente mayor a la mitad de los datos. Calculamos la

mitad de los datos: n/2 = Luego, Me = ¿Que indica el valor de la mediana encontrada?

Page 7: Taller n°4 estadistica i medidas de tendencia central

EJEMPLO: A fin de organizar la contabilidad en el almacén “El surtidor”, el gerente

recolecta la información del salario quincenal de sus 68 empleados. Los datos se dan en

miles de pesos:

305 305 315 295 285 285 265 275 275 255 265 295 315 255 285 285 265 275 275 315

305 295 285 275 255 265 275 285 305 255 275 275 275 285 295 265 285 295 275 255

285 275 305 295 295 285 275 275 295 255 255 265 255 285 285 285 275 275 275 295

285 265 285 265 265 265 265 295.

Construya una tabla de distribución de frecuencias.

Salario Quincenal

X

Frecuencia absoluta

f

Frecuencia absoluta acumulada

F

f . X

N = ∑ f = ∑ f . X =

El salario promedio de todos los empleados es la suma de todas las frecuencias

absolutas multiplicadas por cada dato y dividido entre el total de datos:

µ = ∑ [f . X] / N =

El salario de la mayoría de los empleados (moda) corresponde al valor del dato que

tiene la mayor frecuencia absoluta: Mo = El salario mediano (a la mitad) de los empleados corresponde al valor de la variable

o dato cuya frecuencia absoluta acumulada sea inmediatamente mayor a la mitad

de los datos.

Calculamos la mitad de los datos: N/2 = Luego, Me=