Unidad II Estadística Descriptiva

Embed Size (px)

Text of Unidad II Estadística Descriptiva

FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE TECNOLOGA MDICA

UNIDAD II: ESTADISTICA DESCRIPTIVAIntroduccin: La estadstica descriptiva es un conjunto de procedimientos que tienen por objeto presentar conjuntos de datos por medio de tablas, grficos y/o medidas de resumen. De acuerdo a lo anterior, la estadstica descriptiva es la primera etapa a desarrollar en un anlisis de informacin. Qu es la Estadstica? La estadstica es una disciplina que disea los procedimientos para la obtencin de los datos, como asimismo proporciona las herramientas que permiten extraer la informacin. Propsito de la Estadstica. El anlisis estadstico se usa para manipular, resumir e investigar datos con el fin de obtener informacin til en la toma de decisiones. Observacin: No olvide que el propsito de todos los procedimientos estadsticos, independientemente de su complejidad, es extraer informacin til de los datos disponibles. Algunas aplicaciones de conceptos estadsticos pueden ser: a) b) c) d) e) En contabilidad: Recoleccin de datos. En prevencin de riesgos: La prevalencia de accidentarte el trabajador. En sistemas de informacin administrativas: Recoleccin de datos, Regresin. En administracin de operaciones: Nmeros ndices. En control de calidad: Presentacin de datos, Estadstica descriptiva.

1. Definiciones 1.1. Poblacin y muestra Poblacin: es el conjunto completo de individuos o elementos de inters. Existen momentos en los que se puede medir o examinar cada elemento de la poblacin, por ejemplo, todos los estudiantes de una clase contestarn un cuestionario. Si hay 35 estudiantes en la clase y slo se desea la informacin sobre esta clase, los estudiantes constituyen la poblacin, y se puede medir a cada uno por sus respuestas al cuestionario. Cuando se intenta medir a todos los miembros de una poblacin de inters, el resultado es un censo.Asignatura: Bioestadstica y Metodologa de la Investigacin (TMED0011) Profesor: Jorge Gmez M.

1

FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE TECNOLOGA MDICA

Censo: es medir todos los elementos de una poblacin de inters. En la mayora de las investigaciones estadsticas es imposible estudiar a toda la poblacin, debido que los censos son difciles y muy costosos. De esta manera es necesario seleccionar un pedazo de esta poblacin o mejor llamado muestra. Muestra: es un subconjunto representativo seleccionado de la poblacin. El concepto de representativo es muy importante ya que una buena muestra es aquella que refleje las caractersticas esenciales de la poblacin de la cual se obtuvo. Nota: Un parmetro es cualquier caracterstica medible de la poblacin, y un estadstico o estadgrafo es cualquier caracterstica medible de una muestra. 1.2. Variables y atributos: Tipo de datos Unidad: es el objeto que observamos. Cuando el objeto es una persona, lo referimos como sujeto. Observacin: es la informacin o caracterstica que registramos de cada unidad. Una caracterstica que puede variar de unidad en unidad es llamada variable. Una coleccin de observaciones con una o ms variables se llama base de datos. Los datos estadsticos generalmente se obtienen contando o midiendo objetos. Algunos ejemplos de medidas son el promedio de notas, la tasa de desempleo, las ventas mensuales de un supermercado, la tasa de accidentes vehiculares, etc. Estas medidas se llaman variables, porque pueden tomar muchos valores diferentes. Una variable es un elemento de inters que pude tomar muchos valores numricos diferentes. Una constante tiene un valor fijo. Las variables se pueden clasificar en dos tipos: cuantitativas o cualitativas. Una variable cuantitativa es aquella que posee valores numricos que representan medidas (largo, peso, etc.) o frecuencias (nmero de accidentes). Tiene sentido realizar operaciones numricas con estas variables. Adems estas variables se subdividen en discretas y continuas. Una variable cuantitativa discreta se dice de la cual se puede contar el nmero posible de valores (por ejemplo: nmero de accidentes en el metro, cantidad de ilesos, etc). Una variable cuantitativa continua puede tomar cualquier valor en un intervalo dado y est sujeto a la precisin de los instrumentos de medicin (por ejemplo: el tiempo en que un trabajador realiza una tarea, el cual depende de la precisin del cronmetro usado).

Asignatura: Bioestadstica y Metodologa de la Investigacin (TMED0011) Profesor: Jorge Gmez M.

2

FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE TECNOLOGA MDICA

Una variable cualitativa es aquella que clasifica las unidades en categoras. Las categoras pueden tener un orden natural (ordinales) o no (nominales), de esta manera las variables cualitativas se dividen en ordinales y nominales. Las variables cualitativas tambin se llaman variables categricas. Con estas variables podemos contar nmero de casos, comparar entre categoras, pero no podemos realizar operaciones numricas. Un ejemplo de variable categrica ordinal podra ser el nivel de accidentacin del trabajador (nunca sucede, la mitad de las veces sucede o siempre sucede) y para una variable categrica nominal podra ser el sexo del individuo (femenino o masculino). Lo anterior se mostrar como la siguiente tabla:

Ejemplo 1: Determine qu tipo son las siguientes variables. Si son variables cualitativas (nominal u ordinal) o cuantitativas (discretas o continuas). a) Marca de automvil variable cualitativa nominal b) Duracin de un compacto (segundos) variable cuantitativa continua c) Nmero de temas de un compacto variable cuantitativa discreta d) Nivel educacional (bsica, media, universitaria) variable cualitativa ordinal e) Temperatura al medioda en Talca (grados Celcius) variable cuantitativa continua f) Estado civil (soltero, casado, divorciado, viudo) variable cualitativa nominal g) Cantidad de lluvia en un ao en Talca (mm3) variable cuantitativa continua

Asignatura: Bioestadstica y Metodologa de la Investigacin (TMED0011) Profesor: Jorge Gmez M.

3

FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE TECNOLOGA MDICA

2. Recoleccin y presentacin de datos: Distribucin de frecuencias Una vez que se hayan reunido los datos, deben procesarse de tal manera que pueda observarse cualquier patrn significativo. En esta etapa se debe estudiar algunas tcnicas que permitan convertir los datos brutos en informacin relevante en la toma de decisiones. En este tem se darn las tcnicas bsicas ms usadas para presentar el conjunto de datos en forma resumida. Estas tcnicas son importantes tanto para datos cuantitativos como para los cualitativos. Una forma comn y muy til para resumir el conjunto de datos es la distribucin de frecuencias o tabla de frecuencias. Este mtodo de presentacin de datos muestra la frecuencia (nmero de ocurrencias) para cada una de las categoras. Ejemplo 2 (Variable cualitativa o atributo): Los resultados obtenidos al observar el estado de 80 artculos que componen un lote, dio origen a los siguientes datos: A A D R A ARRAAADAAARAAAARRAADAAAARAAARAAAARARAA A A A A A A R A A A D A A A A A A A A A R R A A A A A A A A A A A R A R D. Solucin: La tabla de distribucin de frecuencias est dada por: Categoras Piezas aceptadas (A) Piezas rechazadas (R) Piezas dudosas (D) Total Frecuencia absoluta ( n i ) 60 15 5 n = 80 Frecuencia relativa ( f i ) 0.75 (60/80) 0.19 (15/80) 0.06 (5/80) 1.00 (80/80)

Ejemplo 3 (Variable cuantitativa discreta): Para estimar el nmero de alumnos ausentes en las clases de Estadstica, un profesor decide seleccionar 25 clases al azar (muestra) y contar el nmero de alumnos que faltan por clase (variable). Los datos son los siguientes: 7,10,8,6,8,9,9,9,8,6,3,9,8,7,9,10,4,5,10,2,7,8,7,8 y 6.

Asignatura: Bioestadstica y Metodologa de la Investigacin (TMED0011) Profesor: Jorge Gmez M.

4

FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE TECNOLOGA MDICA

Solucin: La tabla de distribucin de frecuencias est dada por: i 1 2 3 4 5 6 7 8 9 Categoras(xi ) 2 3 4 5 6 7 8 9 10 Total ni 1 1 1 1 3 4 6 5 3 n = 25 fi 0.04 0.04 0.04 0.04 0.12 0.16 0.24 0.20 0.12 1.00 Ni

Fi1/25 = 0.04 2/25 = 0.08 3/25 = 0.12 4/25 = 0.16 7/25 = 0.28 11/25 = 0.44 17/25 = 0.68 22/25 = 0.88 25/25 = 1

1 2 3 4 7 11 17 22 25

Donde: n i : Es la frecuencia absoluta (nmero de coincidencias en la categora). Por ejemplo en la categora 5 hay 3 coincidencias o sea n 5 = 3 . fi =

ni se llama frecuencia relativa de la i-sima categora (se acostumbra expresarla n en porcentaje). Por ejemplo para la categora 5 f 5 = 0 . 1 2 indica que el 12% de las veces faltaron 6 alumnos a clases. N Adems de las frecuencias relativas es conveniente indicar las frecuencias absolutas acumuladas ( N i ) y las frecuencias relativas acumuladas ( F i ), donde por ejemplo:5

= n1 + n2 + n3 + n4 + n5 = 7 N 7 F5 = 5 = = 0 .2 8 o l o n 2 5

y s q lu o e m e F 5i =s fm1 + fo 2 + f 3 + f 4 + f 5 = 0 . 2 8

N 5 = 7 indica que con siete clases se tiene a lo ms 6 alumnos ausentes. F 5 = 0 . 2 8indica que el 28% de las veces faltaron 6 alumnos o menos, mientras que el 72% restante faltaron ms de 6 alumnos. Cuando el nmero de valores posibles de una variable cuantitativa discreta o continua sea grande, conviene agrupar en intervalos de clase.

Asignatura: Bioestadstica y Metodologa de la Investigacin (TMED0011) Profesor: Jorge Gmez M.

5

FACULTAD DE CIENCIAS DE LA SALUD CARRERA DE TECNOLOGA MDICA

Los intervalos pueden ser de amplitud variable o constante. La seleccin del nmero de intervalos o clases (k), depende de cada caso. Es aconsejable que haya menos de 15 clases (para un fcil manejo y con el fin de asegurar una compactacin suficiente de informacin) y por lo menos 5 (para evitar la prdida de informacin que se producira al reunir en un grupo datos muy diferentes). Por lo general, las clases se eligen de modo que la amplitud de cada una de ellas sea igual para todas las categoras o intervalos de clase. Pasos para la construccin de una d