108
Estadística Básica El uso de herramientas cuantitativas para el tratamiento de datos , tiene origen en épocas remotas. Las antiguas civilizaciones, como la Egipcia, aplicaron continuamente censos que ayudaban a la organización del estado y la construcción de las pirámides. En la antigua Grecia y el Imperio Romano, era común la aplicación de censos para la planificación de impuestos y la prestación del

Estadística Básica

Embed Size (px)

DESCRIPTION

Introducción a la estadística.

Citation preview

Estadstica Bsica

Estadstica BsicaEl uso de herramientas cuantitativas para el tratamiento de datos, tiene origen en pocas remotas.

Las antiguas civilizaciones, como la Egipcia, aplicaron continuamente censos que ayudaban a la organizacin del estado y la construccin de las pirmides.

En la antigua Grecia y el Imperio Romano, era comn la aplicacin de censos para la planificacin de impuestos y la prestacin del servicio militar.

Estadstica BsicaA comienzos del siglo XIX, la palabra estadstica adopta un significado ms generalizado hacia la recoleccin y clasificacin de cualquier tipo de datos cuantitativos.

Estadstica BsicaLa primera persona que introdujo el trmino estadstica en Inglaterra fue Sir John Sinclair (1754-1835) con su trabajo Statistical Account of Scotland (1791-,1799) trabajo compilado en 21 volumenes.

La emple como generadora de informacin interna para encontrar quiebras y proponer mejoras en el pas.

Estadstica BsicaSir Francis Galton (1822-1911) cre los conceptos estadsticos de regresin y correlacin, y fue el primero en aplicar mtodos estadsticos para estudiar las diferencias humanas basado en el uso de cuestionarios y entrevistas para recolectar los datos.

Estadstica BsicaMajor Greenwood (1880-1949) investig los problemas de salud asociados al trabajo en fbricas.

Desarroll la Epidemiologa y en 1919 cre el Ministerio de la Salud en Inglaterra, responsable de datos estadsticos mdicos.

Estadstica BsicaDefinicin de Estadstica;

Ciencia encargada de recolectar, analizar, presentar e interpretar datos.

Enciclopedia Britnica

Estadstica BsicaDefinicin de Estadstica;

rea de la matemtica dedicada a la recoleccin e interpretacin de datos cuantitativos y al uso de la teora de la probabilidad para calcular los parmetros de una poblacin.

Diccionario Ingles Word Reference

Estadstica BsicaDefinicin de Estadstico;Cualquier caracterstica medible calculada sobre una muestrao poblacin.

Definicin de Muestra;Es un subconjunto de una poblacin.

Estadstica Bsica

Una muestra es representativa cuando los elementos son seleccionados de tal forma que pongan de manifiesto las caractersticas de una poblacin.

Clasificacin de la EstadsticaEstadstica descriptiva:se emplea para resumir de forma numrica o grfica un conjunto de datos, describe los datos que se analizan, no generaliza la informacin hacia la poblacin.

Estadstica inferencial:permite realizar conclusiones o inferencias, basndose en los datos simplificados y analizados de una muestra hacia la poblacin.Error de aproximacin

Grficos EstadsticosSon representaciones visuales que emplean smbolos, barras, polgonos y sectores, de los datos contenidos en tablas de frecuencias, algunos son :

Grfico de sectores o pastelGrficos de columnasHistograma

EjercicioUna muestra de 100 estudiantes del programa de ingeniera de una universidad, mostraron sus preferencias respecto a la creacin de un nuevo laboratorio en una encuesta para el diario estudiantil:

Muestre los datos grficamente empleando:Un grfico de columnaUn grfico de sectores

Caso para resolverUna importante empresa desea contratar el suministro de tubos de acero.

Para la licitacin se presentaron tres empresas (A, B y C), las cuales venden la unidad al mismo precio y con las mismas especificaciones del material.

La empresa solicita que el proveedor mantenga un dimetro promedio por cada 30 tubos entregados de 200 mm; para lo cual solicit a cada empresa una muestra de este tamao, obteniendo los siguientes dimetros (las unidades estn en milmetros):

Cul de los tres proveedores escogera usted?

Justifique su respuesta

Variabilidad

Como disciplina, podemos decir informalmenteque la estadstica es el estudio de lavariabilidad. Las tcnicas estadsticas permiten describir lavariabilidad y plantear hiptesis con el objetivode comprenderla.

VariabilidadEjemplos:

Masa corporal, estatura, metabolismoReaccin ante un medicamentoResultados de un experimentoProducto de un proceso industrialCriterio en la eleccin de un producto o servicio

VariabilidadDe acuerdo con los ejemplos anteriores,podemos distinguir dos tipos de variabilidad:

Variabilidad debido a diferencias entre individuos respeto de alguna caracterstica. 2) Variabilidad debida a errores de medicin.

DatosSon los valores de la variable en estudio, pueden ser cuantitativos (numrico) o categricos (cualitativo o de atributo).

Ejemplo. Consideremos el voltaje de salida de cierto tipo de generadores:5.10, 5.25, 5.80, 4.92, 6.10, 5.71, 5.94 los datos son una medida, son cuantitativos y debemos expresarlos en unidades de voltaje

Datos

Supongamos que las normas especifican que el voltaje desalida debe estar en un rango de 5.1 a 5.9 yconsideramos las categoras:

cumple con las normas no con las normas

tendremos datos categricos.

DatosSi adems, se asigna 1 cuando el generadorcumple con los requerimientos y 0 si no cumple,obtendremos los siguientes datos: 1, 1, 1, 0, 0, 1, 0(5.10, 5.25, 5.80, 4.92, 6.10, 5.71, 5.94)

CalidadUna definicin moderna de Calidad es:Aquella que es inversamente proporcional a la variabilidad

Por lo tanto la Mejora de la Calidad consiste en la reduccin de la variabilidad en procesos y productos

DatosPara presentar datos cualitativos se utilizan los diagramas de pastel y las grficas de barras.

Una de las grficas de barras que es muy importante y se utiliza como herramienta de la calidad es el llamado Diagrama de Pareto

Historia del principio de ParetoEn 1909 el economista y socilogo Vilfredo Pareto(1848 1923) public los resultados de sus estudios sobre la distribucin de la riqueza, observando que el 80% de la misma se encontraba concentrada en el 20% de la poblacin.En la dcada de 1930, Joseph M. Juran analizaba mediante tcnicas estadsticas la produccin defectuosa y observ que los defectos se concentraban en unos cuantos tipos.

La relacin 80/20 ha sido encontrada en distintos campos. Por ejemplo, el 80% de los problemas de una organizacin son debidos a un 20% de las causas posibles. El 80% de los defectos de un producto se debe al 20% de causas potenciales, la relacin no debe ser exactamente 80/20, pero s se puede aventurar que unas pocas causas son responsables de la mayor parte de los problemas.

Diagrama de ParetoGrfica de barras dispuestas de la categora mas numerosa a la menos numerosa.

Incluye una grfica hecha a base de rectas que muestra los porcentajes acumulados y la cantidad de datos representada en cada barra.

El eje vertical izquierdo es la frecuencia con la que ocurren los valores individuales y el eje vertical derecho es el porcentaje acumulado.

Elaboracin del Diagrama de Pareto

Los pasos a seguir para la elaboracin de un diagrama de Pareto son:1.Seleccionar los datosque se van a analizar, as como el periodo de tiempo al que se refieren dichos datos.2.Agrupar los datospor categoras, de acuerdo con un criterio determinado.

Elaboracin del Diagrama de Pareto

3.Tabular los datos.Comenzando por la categora que contenga ms elementos y, siguiendo en orden descendente, calcular:Frecuencia absoluta.Frecuencia absoluta acumulada.Frecuencia relativa unitaria.Frecuencia relativa acumulada.

Elaboracin del Diagrama de Pareto

4. Dibujar el diagrama de Pareto.5. Representar el grfico de barrascorrespondiente que, en el eje horizontal, aparecer tambin en orden descendente.

Elaboracin del Diagrama de Pareto

6.Delinear la curva acumulativa. Se dibuja un punto que represente el total de cada categora. Tras la conexin de estos puntos se formar una lnea poligonal.7.Identificar el diagrama, etiquetndolo con datos como: ttulo, fecha de realizacin, periodo estudiado,8.Analizar el diagrama de Pareto.

Ejemplo de la aplicacin del diagrama de Pareto

Diagrama de Pareto

Otro Ejemplo de unDiagrama de Pareto

Los datos se preparan y ordenan como en la siguiente tabla

EjercicioElabore el Diagrama de Pareto

Respuesta

Conclusin

Distribucin

Listado, a menudo expresado en forma de diagrama, que asocia cada valor de una variable con su frecuencia.

La frecuencia f es el nmero de veces que aparece el valor x en la muestra.

Frecuencias no agrupadasFrecuencias agrupadas

Diagrama de Tallos y Hojas

Permite obtener simultneamente una distribucin de frecuencias de la variable y su representacin grfica.

Para construirlo basta separar en cada dato el ltimo dgito de la derecha (que constituye lahoja) del bloque de cifras restantes (que formar eltallo).

Esta representacin de los datos presenta ms informacin que un histograma.

Diagrama de Tallos y Hojas

Como ejemplo expongamos los horarios de los trenes de una cierta ruta de Espaa

Diagrama de Tallos y Hojas

Para elaborarlo, se representa lahoraa la izquierda de la barra de separacin|y los minutosde la salida de cada tren a la derecha.

Lafrecuenciade los trenes se deduce fcilmente de lalongitud de las filasy es muy fcil ver en que minutos de cada hora pasan tpicamente los mismos.

Diagrama de Tallos y Hojas

Diagrama de Tallos y Hojas(reducido)

Diagrama de Tallos y Hojas

Tambin puede utilizarse para comparar dos distribuciones, por ejemplo si tenemos las dos siguientes distribuciones (edades de 20 personas):Distrib. 1

Distrib. 2

Diagrama de Tallos y Hojas

El resultado es el siguiente:

Distrib. 2 Distrib. 1

Ejercicio

Respuesta

Grfica de puntos

Muestra cada elemento de un conjunto de datos numricos por encima de una recta numrica, o eje horizontal.

Las grficas de puntos facilitan ver los espacios vacos y los agrupamientos en un conjunto de datos, as como la manera en que se distribuyen los datos a lo largo del eje.

Grfica de puntos

Ejemplo:

El pulso vara de una persona a otra, pero por lo general, el pulso de una persona saludable en reposo se mantiene entre ciertos valores. Una persona con un pulso muy rpido o muy lento podra necesitar atencin mdica.

Grfica de puntos

El siguiente conjunto de datos refleja las pulsaciones por minuto de un grupo de 30 estudiantes:

68 60 76 68 64 80 72 76 92 68 56 72 68 60 8472 56 88 76 80 68 80 84 64 80 72 64 68 76 72

Elaborando la grfica de puntos nos queda como sigue.

Grfica de puntos

Diagrama o grfica de caja y bigotes

Es una presentacin visual que describe varias caractersticas importantes, al mismo tiempo, tales como la dispersin y simetra.

Para su realizacin se representanlos tres cuartilesy los valoresmnimoymximode los datos, sobre un rectngulo, alineado horizontal o verticalmente.

Diagrama o grfica de caja y bigotes

Una grfica de este tipo consiste en unacajarectangular, donde los lados ms largos muestran elrecorrido intercuartlico.

Este rectngulo est dividido por un segmento vertical que indica donde se posiciona la mediana y por lo tanto su relacin con los cuartiles primero y tercero (el segundo cuartil coincide con la mediana).

Diagrama o grfica de caja y bigotes

Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores mnimo y mximo de la variable. Las lineas que sobresalen de la caja se llamanbigotes.

Diagrama o grfica de caja y bigotes

Ejemplo: la distribucin de frecuencias que representan la edad de un colectivo de 20 personas.

Para elaborar el diagrama, se siguen los pasos descritos a continuacin:

Diagrama o grfica de caja y bigotes

1. ORDENAR LOS DATOS20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45

2. CALCULar los CUARTILESQ1, el cuartil Primero es el valor mayor que el 25% de los valores de la distribucin.

Como N = 20 resulta que N/4 = 5; el primer cuartil es la media aritmtica de dicho valor y el siguiente:

Q1=(24 + 25) / 2 = 24,5

Diagrama o grfica de caja y bigotes

Q2, el Segundo Cuartil es, evidentemente, la mediana de la distribucin, es el valor de la variable que ocupa el lugar central en un conjunto de datos ordenados. Como N/2 =10 ; la mediana es la media aritmtica de dicho valor y el siguiente:

Q2= (33 + 34)/ 2 = 33,5

Q3, el Tercer Cuartil, es el valor que sobrepasa al 75% de los valores de la distribucin. En nuestro caso, como 3N / 4 = 15, resulta:

Q3 = (39 + 39) / 2 = 39

Diagrama o grfica de caja y bigotes

3. Dibujar la caja y los bigotes:

Informacin del Diagrama

La parte izquierda de la caja es mayor que la de la derecha; ello quiere decir que las edades comprendidas entre el 25% y el 50% de la poblacin est ms dispersa que entre el 50% y el 75%.

El bigote de la izquierda (Xmm, Q1) es ms corto que el de la derecha; por ello el 25% de los ms jvenes estn ms concentrados que el 25% de los mayores.

Elrango intercuartlico= Q3- Q1= 14,5; es decir, el 50% de la poblacin est comprendido en 14,5 aos.

Comparando dos distribuciones

Realice el diagrama de caja y bigotes de la segunda distribucin , compare con la primera, compruebe que el resultado debe ser como sigue:

Diagrama o grfica de caja y bigotes (comparando dos distribuciones)

Ejercicio

Los datos a continuacin representan lecturas de viscosidad en tres diferentes mezclas de material sin procesar en una lnea de manufactura:Mezcla 1 Mezcla 2 Mezcla 3 22.02 21.49 20.3323.83 22.67 21.6726.67 24.62 24.6725.38 24.18 22.4525.49 22.78 22.2823.50 22.56 21.9525.90 24.46 20.4924.98 23.79 21.81

Elabore diagramas de cajas para los datos de viscosidad de mezclas y compare.

Aplicaciones en el Control de Calidad

Parte de un estudio de control de calidad tuvo como objetivo mejorar una lnea de produccin. Se midieron los pesos (en onzas) de 50 barras de jabn. Los resultados son los siguientes, ordenados de menor a mayor:

11.7 12.2 13.2 13.4 14.4 14.4 14.7 14.7 14.8 14.8 15.1 15.2 15.3 15.4 15.5 15.7 15.7 15.8 15.8 15.9 15.9 15.9 15.9 16.0 16.2 16.4 16.7 16.7 16.8 16.8 16.8 17.0 17.1 17.2 17.2 17.2 17.4 17.5 17.5 17.5 17.6 17.6 17.8 17.8 17.9 18.2 18.2 18.7 19.0 19.1

Aplicaciones en el Control de Calidad

a) Construye un diagrama de tallos y hojas para estos datos.b) Construye un histograma para estos datos.c) Construye un diagrama de cajas para estos datos.d) Construye un grfico de puntos para estos datos.e) Realiza un reporte con tus conclusiones.

* Investiga paquetes computacionales, softwares, excel, etc para realizar clculos y grficos de esta Unidad de Aprendizaje, aprende a usarlos y preprate para resolver tareas y quiz una presentacin en power point.

Medidas de tendencia centralMediaMedianaRango medioModa

Medidas de dispersinRango

Varianza

Desviacin estndar

Desviacin con respecto a la mediaEs la diferencia entre el valor de un dato y la media de los datos.

El valor promedio de estas desviaciones siempre resultar en cero (por lo cual no es un estadstico de calidad).

Las desviaciones al cuadrado se usan para determinar la varianza.

Varianza muestral Se puede definir como la media de las desviaciones al cuadrado de los datos con respecto a la media muestral, calculada usando como divisor n-1. Su formula matemtica para el caso de datos referentes a una muestra es:

Dos propiedades importantes de la varianza son:

La varianza de una constante es cero

Si se tiene la varianzade un conjunto de datos y a cada observacin se multiplica por una constanteb, entonces la nueva varianza de los datos se obtiene multiplicando a la varianza de los datos porb al cuadrado.

Desviacin estndar muestralSe define como la raz cuadrada de la varianza:

Coeficiente de variacinEs una medida que se emplea fundamentalmente para:

Comparar la variabilidad entre dos grupos de datos referidos a distintos sistemas de unidades de medida.Comparar la variabilidad entre dos grupos de datos obtenidos por dos o ms personas distintas.Comparar dos grupos de datos que tienen distinta media.Determinar si cierta media es consistente con cierta varianza.

Coeficiente de variacin

Se define con la siguiente ecuacin:

EjemploCon un micrmetro, se realizan mediciones del dimetro de un balero, que tienen una media de 4.03 mm y una desviacin estndar de 0.012 mm; con otro micrmetro se toman mediciones de la longitud de un tornillo que tiene una media de 1.76 pulgadas y una desviacin estndar de 0.0075 pulgadas. Cul de los dos micrmetros presenta una variabilidad relativamente menor?.

Respuesta

En consecuencia, las mediciones hechas por el primer micrmetro exhiben una variabilidad relativamente menor con respecto a su media que las efectuadas por el otro.

Distribucin Normal Es la distribucin de probabilidad mas importante.

Aunque la desviacin estndar proporciona una medida de la dispersin de un conjunto de resultados alrededor del valor medio, no indica la forma de la distribucin.

Ejemplo de sistemas que siguen una distribucin normal

Distribucin Normal Para describir la forma de la poblacin (de la que se extrae una muestra) de los datos de concentracin de ion nitrato, se necesita una curva continua.

El modelo matemtico que habitualmente se emplea es la distribucin normal o Gausiana.

Distribucin Normal Es descrita por la siguiente ecuacin:

Curva acampanada o Gausiana

Propiedades de la Distribucin Normal

Distribucin Normal estndar

Obtencin de el valor estandarizado z

Propiedades de la Distribucin Normal Estndar El rea bajo la curva normal es igual a 1La distribucin es simtricaLa distribucin tiene una media de 0 y una desviacin estndar de 1La media divide el rea a la mitad (0.5 de cada lado)Casi toda el rea est entre z = -3 y z = 3

Ejercicios Determinar el valor del rea bajo la curva normal

Entre z = 0 y z = 1.52, P(0