10
CONCEPTOS ESTADÍSTICOS FUNDAMENTALES PERO: ¿Qué representa una Población de datos? El análisis estadístico de una población o universo de datos tiene como objetivo final descubrir las características y propiedades de aquello que generó los datos. Por ejemplo, se tiene una población de escolares (Población física, población humana) y se les mide la altura. El conjunto de datos de altura constituye una población o universo estadístico. El análisis de estos datos de altura (Universo estadístico) sirve para caracterizar y estudiar a la población de estudiantes (Que no es una Población estadística). ALUMNOS DAR EJEMPLOS!!!

Ce ps 2-08.01.2011-parte iii

Embed Size (px)

DESCRIPTION

Bases Estadísticas y Principales Conceptos para el Control Estadístico de Procesos

Citation preview

Page 1: Ce ps 2-08.01.2011-parte iii

CONCEPTOS ESTADÍSTICOS FUNDAMENTALES

• PERO: ¿Qué representa una Población de datos?

• El análisis estadístico de una población o universo de datos tiene como objetivo final descubrir las características y propiedades de aquello que generó los datos. Por ejemplo, se tiene una población de escolares (Población física, población humana) y se les mide la altura. El conjunto de datos de altura constituye una población o universo estadístico.

• El análisis de estos datos de altura (Universo estadístico) sirve para caracterizar y estudiar a la población de estudiantes (Que no es una Población estadística).

• ALUMNOS DAR EJEMPLOS!!!

Page 2: Ce ps 2-08.01.2011-parte iii

CONCEPTOS ESTADÍSTICOS FUNDAMENTALES

• EJEMPLO: Un ingeniero controla un proceso industrial, que genera a diario muchos lotes de un producto (Población de lotes). Para cada lote se mide una característica de calidad, obteniéndose una gran cantidad de resultados numéricos (Población de datos). El ingeniero realiza esta tarea porque a través de los datos numéricos obtenidos se puede evaluar el comportamiento del proceso, que es lo que realmente le interesa.

Page 3: Ce ps 2-08.01.2011-parte iii

CONCEPTOS ESTADÍSTICOS FUNDAMENTALES

• IMPORTANTE: Detrás de un universo o población de datos se encuentra una población física, formada por elementos de la realidad que nos rodea, de la cual, a través de algún tipo de medición, se obtuvieron los datos numéricos. Es esa población física subyacente (Elementos de la realidad, seres humanos, lotes de material, etc.) la que deseamos estudiar y caracterizar por medio del análisis estadístico de los datos obtenidos.

• La población estadística está representando, entonces, una población física o natural formada por elementos de la realidad, con respecto a una característica o propiedad de esa población física.

• Al utilizar métodos estadísticos, no confundir la población física, formada por elementos de la realidad que estamos estudiando, con la población o universo de datos generados a partir de la primera. Cuando se utilice los términos “población” o “universo” sin otro adjetivo nos estamos refiriendo a población o universo de datos numéricos (También llamados observaciones, mediciones o valores).

Page 4: Ce ps 2-08.01.2011-parte iii

• Una Población o Universo de datos es un conjunto muy grande de números. Estos números pueden estar en un gran listado o puede ser un conjunto hipotético, es decir, podemos imaginar los números pero no los tenemos realmente. Una gran tabla de números ordenados al azar prácticamente no nos muestra información acerca de la población de datos. Suponiendo que disponemos de los datos del universo, ¿cómo podemos clasificar y ordenar los números para obtener más información acerca de ese universo de datos?

• Una forma sería escribir los números desde el menor hasta el mayor y colocar encima de cada uno tantas cruces o cuadraditos como veces que figure repetido en la población.

• El número de veces que aparece repetido cada dato es la frecuencia de dicho valor. La representación gráfica que hemos visto se denomina Distribución de Frecuencias de la población.

La Distribución de Frecuencias

Page 5: Ce ps 2-08.01.2011-parte iii

• La representación gráfica permite ver información que antes no aparecía tan evidente. Por ejemplo, sin hacer ningún cálculo nos damos cuenta donde está aproximadamente el promedio de la población. También nos muestra cuales son los valores máximo y mínimo de la población, es decir, el rango o recorrido.

La Distribución de Frecuencias

Page 6: Ce ps 2-08.01.2011-parte iii

• En el caso anterior, los datos de la población son números enteros. Cuando los números no son enteros o cuando tenemos un número muy grande de datos, se divide el rango total en subintervalos y se cuenta el número de valores que cae dentro de cada subintervalo.

• Vamos a suponer, ahora, que tenemos una cierta población de N = 500 datos, por ejemplo el peso de varones adultos de 40 años. Una manera de caracterizar esta población es construir una distribución de frecuencias o gráfico de frecuencias. Para ello seguimos los pasos siguientes:

1) Tomamos nota del valor máximo y el valor mínimo de la serie de datos que estamos considerando.

2) Subdividimos el intervalo entre el máximo y el mínimo en algún número de intervalos (15 ó 20) más pequeños iguales entre sí.

3) Contamos el número de datos que encontramos dentro de cada intervalo (Frecuencia). Por ejemplo, supongamos que en el intervalo i hay ni observaciones (S*ni = N).

4) Para construir el gráfico, colocamos en el eje de abscisas (Horizontal) los intervalos y levantamos en cada intervalo un rectángulo de altura proporcional al número ni de datos dentro del mismo.

• Si hacemos el área del rectángulo levantado sobre el intervalo i-ésimo igual a la frecuencia relativa ni/N, el área total bajo el histograma será igual a la unidad:

La Distribución de Frecuencias

Page 7: Ce ps 2-08.01.2011-parte iii

• Obtenemos así un histograma que nos muestra la distribución de frecuencias de la población:

• Esta distribución de frecuencias nos muestra si hay resultados que son mas frecuentes que otros; si los valores están ubicados alrededor de un valor central, si están muy dispersos o poco dispersos. Podemos observar que fracción de todas las mediciones cae por ejemplo, entre 70 y 80 Kg.

La Distribución de Frecuencias

Page 8: Ce ps 2-08.01.2011-parte iii

• Si elegimos una persona del grupo y la pesamos, el resultado es un dato que pertenece a la población de datos representada en el gráfico. Decimos, entonces, que estamos extrayendo un dato de la población de datos. Pero hay distintas maneras de elegir la persona, es decir, distintas maneras de realizar la extracción del dato.

• Si nos paramos frente al grupo y elegimos una persona, estaremos seleccionando al más gordo, al más flaco o al más alto (y por lo tanto pesa más que otros), de acuerdo a criterios subjetivos que no podemos evitar. En cambio, si escribimos los nombres de todas las personas en una etiqueta, metemos todas las etiquetas en una caja y luego le pedimos a alguien que retire una etiqueta, la selección no estará influida por nuestra subjetividad. En este caso, decimos que la extracción es aleatoria.

• Una extracción aleatoria es aquella en que cada miembro de la población tiene la misma posibilidad de ser elegido.

La Distribución de Frecuencias

Page 9: Ce ps 2-08.01.2011-parte iii

Medidas de Tendencia Central

• Una característica importante de cualquier población es su posición, es decir, donde está situada con respecto al eje de abscisas (Eje horizontal). En nuestro caso, es importante saber si los datos se agrupan alrededor de 60 Kg. o de 90 Kg. o alrededor de 12 Kg. Una manera de obtener un dato numérico que nos dé idea de la posición de nuestra población es calcular el Promedio o Media de todas las observaciones:

METRICA EN EL ESPACIO ESTADÍSTICO

Page 10: Ce ps 2-08.01.2011-parte iii

• Este importante parámetro nos permite efectuar comparaciones entre distintas poblaciones. Por ejemplo, si tuviéramos una población formada por mediciones del peso de mujeres de 30 años, otra de peso de varones de 40 años y una tercera de peso de niños de 8 años, es indudable que los promedios van a ser diferentes. El promedio, entonces, nos está diciendo que las tres poblaciones son diferentes y también en que medida difieren.

• Ahora, si tuviéramos una población de varones con peso promedio 70 Kg. y otra población de varones con el mismo promedio, ¿se puede afirmar que ambas poblaciones son equivalentes? Para responder esta pregunta necesitamos tener medidas de la dispersión de la población de datos

METRICA EN EL ESPACIO ESTADÍSTICO