47
PRESENTACIÓN DE LOS DATOS: TABLAS Y GRÁFICOS Lic. Esperanza García Cribilleros

estadiisstiicaa

Embed Size (px)

DESCRIPTION

estadistica 01

Citation preview

  • PRESENTACIN DE LOS DATOS: TABLAS Y GRFICOS

    Lic. Esperanza Garca Cribilleros

  • ANLISIS EXPLORATORIO: Evaluacin previa de los datos que consiste en:

    Revisin de la calidad de los datos recolectados.

    Revisar la simetra de la distribucin de los datos los datos, mediante:

    :ELABORACIN DE DATOS

    Proceso en el que los datos se revisan, se ordenan y se resumen antes de interpretarlos.

  • ANLISIS EXPLORATORIO: Revisin del instrumento llenado para

    evaluar errores de llenado, omisiones etc. GRFICO DE TALLO Y HOJAS (Stem-

    and-Leaf): Se visualizan todos los datos. Se puede apreciar grficamente su distribucin.

    GRFICO DE CAJA : Se puede visualizar la simetra y la presencia o no de out liers.

  • Ejemplo: A continuacin se presentan las notas ordenadas del segundo examen terico de Estadstica de un grupo de estudiantes de la Facultad de Medicina, en el ao 2002.

    1716161514.514131211

    191716161514.513.512.51211

    191716161514.513.512.51210.5

    191716161514.513.512.51210.5

    18171615.5151413.512.51210.5

    1816.51615.5151413.512.51210.5

    1816.51615.5151413.512.51210

    1816.51615.515141312.511.59.5

    17161615.515141312.511.58.5

    1716161515141312.5117.5

    1. Revisar las bondades de los datos

  • TEORA fC 7.5 1 8.5 1 9.5 1 10.0 1 10.5 4 11.0 3 11.5 2 12.0 7 12.5 9 13.0 4 13.5 6 14.0 7 14.5 4 15.0 11 15.5 5 16.0 16 16.5 3 17.0 7 18.0 4 19.0 3 N= 99 *= 1

    20

    15

    10

    T

    E

    O

    R

    A

    7 52 8 53 9 58 10 05555

    13 11 0005529 12 000000055555555539 13 0000555555(11)14 0000000555549 15 000000000005555533 16 000000000000000055514 17 00000007 18 00003 19 000

    2. Analizar la simetra de la distribucin de los datos (Anlisis exploratorio)

    Grfico de tallo y hojas

    Grfico de caja

  • DISTRIBUCIN DE FRECUENCIAS SIMPLES Y AGRUPADAS: FRECUENCIA:

    Nmero de veces que una caracterstica o valor se repite en un conjunto de datos (poblacin o muestra).

    TIPOS:Frecuencia absoluta: Nmero de veces que un valor se repite, se obtiene mediante el conteo o paloteo. Frecuencia relativa: a/a+bFrecuencia acumulada: absoluta y relativa:nmero de valores igual o menores de un valor determinado.

  • 40total

    214

    823

    622

    621

    319

    718

    517

    316

    FrecuenciaEdad

    SIMPLEDISTRIBUCIN

    80TOTAL

    135-39

    430-34

    1225-29

    2720-24

    2815 - 19

    810-14

    frecuenciaHoras

    AGRUPADADISTRIBUCIN

    Cuando la variable es cuantitativa:

  • Distribucin simple de Frecuencias

    Ejemplo: Los siguientes datos corresponden a la talla de una muestra de 30 recin nacidos durante el mes de enero de 2002 en el Instituto Materno Infantil: Construya una tabla de distribucin de frecuencias.

    1 2 3 4 5 6 7 8 9 10 11 12 13 14 1554 49 49 52 49 40 50 47 50 51 49 47 51 40 47

    16 17 18 19 20 21 22 23 24 25 26 27 28 29 3046 48 45 51 51 47 50 48 51 51 50 48 49 47 53

  • DISTRIBUCIN DE FRECUENCIAS DE LA VARIABLE TALLA DEL RECIN NACIDO.

    clases

    f frecuencia absolutaF frecuencia absoluta acumuladafr frecuencia relativaFr frecuencia relativa acumulada

    Recin nacidos segn talla. Comunidad XTalla f F % % acumulado

    40 2 2 0.0667 0.0667 6.67 6.6745 1 3 0.0333 0.1000 3.33 10.0046 1 4 0.0333 0.1333 3.33 13.3347 5 9 0.1667 0.3000 16.67 30.0048 3 12 0.1000 0.4000 10.00 40.0049 5 17 0.1667 0.5667 16.67 56.6750 4 21 0.1333 0.7000 13.33 70.0051 6 27 0.2000 0.9000 20 90.0052 1 28 0.0333 0.9333 3.33 93.3353 1 29 0.0333 0.9667 3.33 96.6754 1 30 0.0333 100.00 3.33 100.00

    Total 30 1.00 100.00

  • DISTRIBUCIN DE FRECUENCIAS EN FORMA AGRUPADA

    Edades de 60 gestantes:

    353535343434333333333332323232

    323030303030302828282828262626

    252525242424232323232323232322

    222222222222222222212121212121

    151413121110987654321

    1. Ubicar los valores mximo y mnimo:35 y 21

    2. Determinar el rango: 35 21 = 14

    3. Determinamos el nmero de intervalos de clase: 5

    4. Determinar la amplitud del intervalo de clase: 14/5 = 2.8 3

    5. Organizar las frecuencias

    6. Calcular el punto medio

  • Organizacin de datos:Edad de 60pacientes

    22.525.528.531.534.5

    40.0055.0063.3481.67

    100.00

    0.40000.55000.63340.81671.000

    40.0015.00

    8.3418.3318.33

    100.0

    0.40000.15000.08340.18330.1833

    1.0000

    2433384960

    24951111

    60

    21-2424-2727-3030-3333-36

    TOTAL

    Pm% ac.Fra.%FrFfEdad

    Frecuencias absolutas: 24, 9, 5, , 11

    Frecuencia relativa: 24/60, 9/60, , 11/60

    Frecuencia absoluta acumulada: 24+9+5++ 11

    Frecuencia relativa acumulada: o.4000 + 0.1500 + +0.8167

    Intervalo de clase

    Generalmente el resumen se hace con frecuencias absolutas y relativas en forma de porcentaje.

  • Ejemplo: Supongamos que se desea reducir las muertes infantiles provocadas por lesiones en una comunidad X. Los datos de la siguiente tabla corresponden a las causas de muerte por lesiones en nios entre 5 y 9 aos en dicha comunidad.

    Cuando la variable es cualitativa o categrica:

    1 5 3 1 2 4 1 3 1 52 1 1 5 3 1 2 1 4 14 1 3 1 5 1 2 1 1 25 1 1 5 1 5 3 1 2 12 3 1 1 2 1 5 1 5 11 2 5 1 1 1 3 4 1 11 1 2 1 1 2 1 1 2 33 3 1 5 2 3 5 1 3 41 1 2 4 5 4 1 5 1 55 1 1 5 1 1 5 1 1 5

    CAUSA DE MUERTE (Variable)1, representa un accidente

    vehicular2, ahogamiento3, incendio en casa4, homicidio y5, otras causas como asfixia,

    cadas o envenenamientos.

  • Distribucin de nios fallecidos entre 5 y 9 aos segn causa de muerteCausa f F fr FrVehcuo motorizadoAhogamientoQuemaduras en domicilioHomicidiosOtros

    Total

    Defunciones por lesiones de nios entre 5-9 aosen una comunidad X.f F fr Fr % % ac.

    Vehculo motorizado 48 48 0.48 0.48 48 48Ahogamiento 14 62 0.14 0.62 14 62Quemaduras en domicilio 12 74 0.12 0.74 12 74Homicidios 7 81 0.07 0.81 7 81Otros 19 100 0.19 1 19 100

    100Total 100 1

  • PRESENTACIN DE LOS DATOS:

    Definicin: Etapa en la cual los datos ordenados y debidamente clasificados son presentados en forma de tablas y grficos para facilitar su comprensin.

    Formas: Tabular y Grfica

  • PARTES DE UNA TABLA:1. Ttulo2. Taln3. Cuerpo4. Notas explicativas

    PRESENTACIN TABULAR

    Tabla Estadstica Es la presentacin de los datos ordenados, y debidamente clasificados de acuerdo a un criterio especfico, para su mejor interpretacin y anlisis.

  • Tabla 1. Niveles de Ansiedad Estado en Estudiantes de Medicina del 1 y 6 Ao. UNMSM, 2 000.

    Niveles de Ansiedad EstudiantesPrimero Sexto

    Ansiedad Leve 6.4 30.3

    Ansiedad Moderada 66.2 59.8

    Ansiedad Severa 27.4 9.9

    TOTAL 100 100* Datos en porcentajes

    Qu, cmo,dnde, cuando

    Cuerpo

    Nmero d la tabla Ttulo de la tabla

    Taln CuerpoCategoras Total (filas)

    Categoras

    Total (Columnas) Total*Notas explicativas

    Partes de una tabla

  • TIPOS DE TABLAS: Univariadas y Bivariadas

    UNIVARIADAS:

    Son aquellas que contienen informacin de una sola variable

    Tabla N 4. Recin nacidos segn sexo. IPMI, 2002

    Sexo NMasculino 62

    Femenino 51

    Total 113

    Tabla 2.Defunciones por lesiones de nios entre 5-9 aos. Comunidad X

    Causa f %Vehculo motorizado 48 48Ahogamiento 14 14Quemaduras en domicilio 12 12Homicidios 7 7Otros 19 19

    Total 100 100

  • Tabla 5. Madres adolescentes segn planificacin de embarazo e intento de abortar

    Planificacin Intento de aborto TotalSi NO

    Si 1 14 15

    No 18 18 36

    Total 19 32 51Fuente: Tomado de investigacin realizada por grupo de estudiantes de Medicina, 2002.

    TABLAS BIVARIADASSon aquellas en las cuales se presentan dos variables, con la finalidad de observar la relacin existente entre ellas. Tambin se conocen como tablas de asociacin.

    Tabla 6. Madres segn complicacin del embarazo e Hipertensin.Complicacin del Hipertensinembarazo si no TotalPresente 23 55 78

    Ausente 12 100 112

    Total 35 155 190

    Tablas de contingencia 2 x 2

  • Tabla 7. Pacientes Segn edad y peso.Lima. 2000.

    Edad (X) PSS (Y)20 12043 12863 14126 12653 13431 12858 13646 13258 14070 14446 12853 13670 14620 12463 143

    TABLAS BIVARIADAS:

    Tabla de contingencia r x f

    Tabla 8. Individuos segn severidad de la afeccin y tipo de sangre. Comunidad BSeveridad de la Tipo de sangreafeccin A B AB O totalAusente 543 211 90 476 1320Moderada 44 22 8 31 105Severa 28 9 7 31 75

    Total 615 242 105 538 1500

    Son aquellas que relacionan dos variables. Las variables pueden ser cualitativas (tablas de contingencia), o cuantitativas.

  • NUMERO: Permite ubicar la tabla en un documento.TTULO: Expresa el contenido de la tabla y responde a:

    QU?: Unidad elemental (muestra o poblacin)CMO?: Variable (s)DNDE?: LugarCUNDO?: tiempo en el que realiz el estudio

    EL TALN: Se ubica en la primera columna, EL CUERPO: Interseccin de filas y columnas (celdas),

    contienen los datos incluyendo totalesNOTAS ACLARATORIAS: Informacin adicional,

    ayuda a interpretar la tabla

    PARTES DE LA TABLA

  • REQUISITOS DE UNA BUENA TABLA

    Debe ser lo ms sencilla posibleDebe explicarse por si misma: Las abreviaturas deben aclararse en las notas explicativas.Cada fila y columna deben titularse clara y concisamenteEl ttulo debe ser claro preciso y exacto: debe responder a las preguntas Qu? Cmo? Dnde? Y Cundo?. El ttulo debe tener el nmero de tabla.Se deben consignar los totales de filas y de columnas, si es necesarioSi los datos no son originales debe mencionarse la fuente en las notas explicativas.

  • PRESENTACIN GRFICA

    Presentacin de los datos en forma de ilustraciones que permiten visualizar rpidamente el comportamiento de la (s) variable (s).

    PARTES DE UN GRFICO:NmeroTtuloEscalasCuerpo de grficoNotas explicativas

  • 0102030405060708090

    1er trim. 2dotrim.

    3er trim.4to trim.

    EsteOesteNorte

    Leyenda

    CuerpoEscala 2

    Escala 1

    GRFICO N.

    TTULO

    %

  • ALGUNAS RECOMENDACIONESDebe ser impactante y a la vez sencillo

    Debe explicarse por s mismo: debe tener ttulo, escalas, origen de las escalas y leyenda.

    La leyenda debe ser clara, precisa y solo cuando es necesario.

    Las ordenadas y abscisas deben estar lo suficientemente rotuladas. En el eje vertical va la frecuencia y en el horizontal la variable.

  • La escala de la frecuencia siempre debe comenzar en cero.

    Cuando se grafican dos variables que guardan relacin, en el eje vertical se coloca la variable dependiente y en la horizontal la variable independiente.

    ALGUNAS RECOMENDACIONES

  • TIPOS DE GRFICOS

    De cajaDe tallo y hojas

    CuantitativasEXPLORATORIOS

    Curvas Grficos lineales semilogartmico

    CuantitativaTENDENCIAS

    HistogramaPolgono de Frec.

    Cuantitativacontinua

    Cuantitativadiscreta

    Barras simples y en todas sus formas, grficos circulares, pictogramas

    CualitativaDISTRIBUCIN DE FRECUENCIA

    GRFICOVARIABLETIPO DE DATOS

  • GRFICO CIRCULAR:

    Estudiantes de enfermera Segn calificacin. UNMSM, 2001Calificacin f %Aprobado 8 8.1

    Desaprobado 91 91.9

    Total 99 100

    Grfico N 1. Estudiantes de enfermera segn calificacin.

    UNMSM, 2001

    Aprobado

    Desaproba

    PACIENTES SEGUN SEXO. LIMA, 2002

    Masculino

    Femenino

    Es un crculo con divisiones que representan a las categoras de una variable cualitativa. Cada seccin del crculo es proporcional a las frecuencias absolutas o su respectivo porcentaje. Se recomienda seguir el sentido de las agujas del reloj al construirlo

    PACIENTES SEGN SEXO. LIMA,2002Pacientes segn sexo frSEXOMasculino 43Femenino 17TOTAL 60

  • GRFICO DE BARRAS

    Grfico de Barras Simples: Son rectngulos, cada uno de ellos representa una categora. Se usa para variables cualitativas y cuantitativas discretas. Se pueden construir barras simples, dobles o ms de dos.

    Pacientes segn sexoSexo f

    Masculino 43

    Femenino 17

    Total 60

    43

    17

    0

    20

    40

    60N

    Masculino Femenino

    SEXO

    PACIENTES SEGN SEXO. LIMA, 2002

  • 0 10 20 30 40 50

    Vehculo motorizado

    Ahogamiento

    Quemaduras en domicilio

    Homicidios

    Otros

    Grfico 2. Defuciones por lesiones de nios entre 5-9 aos. Comunidad X

    Tabla 2.Defunciones por lesiones de nios entre 5-9 aos. Comunidad X

    Causa f %Vehculo motorizado 48 48Ahogamiento 14 14Quemaduras en domicilio 12 12Homicidios 7 7Otros 19 19

    Total 100 100

  • BARRAS COMPUESTAS:Se usan cuando los datos se presentan en tablas de contingencia.

    Tabla 8. Individuos segn severidad de la afeccin y tipo de sangreComunidad BSeveridad de la Tipo de sangreafeccin A B AB O totalAusente 543 211 90 476 1320Moderada 44 22 8 31 105Severa 28 9 7 31 75

    Total 615 242 105 538 1500

    Grfico 8. Individuos segn severidad de la afeccin y tipo de sangre.

    Comunidad B

    0100200300400500600

    Ausente Moderada Severa

    Severidad de la afeccin

    N

    ABABO

  • BARRAS COMPUESTAS (PORCENTUALES):

    Primero Sexto

    Ansiedad leve 6.40 30.30

    Ansiedad moderada 66.20 59.80

    Ansiedad severa 27.40 9.90

    TOTAL 100.00 100.00*Datos en porcentajes

    EstudiantesNiveles de Ansiedad

    Tabla 2.- Niveles de Ansiedad Estado en Estudiantes de Medicina del 1 y 6 ao

    UNMSM 2000

    0%

    20%

    40%

    60%

    80%

    100%

    Primer ao Sexto ao

    Ansiedad leve Ansiedad moderada Ansiedad severa

    Enfatiza la proporcin con que intervienen cada una de las categoras de las variables

  • 4852N =

    SEXO

    FemeninoMasculino

    9

    5

    %

    C

    I

    C

    O

    L

    E

    S

    T

    E

    R

    O

    L

    330

    320

    310

    300

    290

    280

    270

    260

    ERROR BAR

  • PIRMIDE POBLACIONAL

    PER 2002 PER 20032

    Son histogramas que representan a las edades de hombres y mujeres

    Hombres Mujeres

  • 020

    40

    60

    80

    100

    120

    140

    Estrato I Estrato II Estrato III Estrato IV Estrato V

    T

    a

    s

    a

    p

    o

    r

    1

    0

    0

    ,

    0

    0

    0

    H

    b

    .

    19871997

    Mortalidad por Ciertas Afecciones Originadas en el Periodo Perinatal segn Estratos de Pobreza. Per1987-1997

  • PICTOGRAMASon figuras que representan los valores de la variable. Son impactantes y auto explicativas.

    DISTRIBUCIN DE LOS ALUMNOS SEGN SEXO.

  • Porcentaje de hogares que

    presentan dficit calrico segn departamento.

    Per, 2002

    Fuente: ENAHO 2002 IV Trimestre - Elaboracin: IRD- INEI

    Ms del 50 %

    De 40 a 50 %

    De 30 a 40 %

    Menos de 30 %

    Hogares con dficit calrico (%)

    Puno

  • MAPA CARTOGRFICO

  • GRFICOS PARA VARIABLES CUANTITATIVAS

    NOTAS

    20.018.016.014.012.010.08.0

    Grfico 4. Gestantes segn edad. Hospital

    Dos de Mayo, 200040

    30

    20

    10

    0

    Std. Dev = 2.37 Mean = 14.3

    N = 99.00

    HISTOGRAMA: Refleja la continuidad de la variable, por ello las barras estn unidas. El ancho se relaciona con el rango del intervalo de clase y la altura est dada por la frecuencia

    1716161514.514131211

    191716161514.513.512.51211

    191716161514.513.512.51210.5

    191716161514.513.512.51210.5

    18171615.5151413.512.51210.5

    1816.51615.5151413.512.51210.5

    1816.51615.5151413.512.51210

    1816.51615.515141312.511.59.5

    17161615.515141312.511.58.5

    1716161515141312.5117.5

    1716161514.514131211

    191716161514.513.512.51211

    191716161514.513.512.51210.5

    191716161514.513.512.51210.5

    18171615.5151413.512.51210.5

    1816.51615.5151413.512.51210.5

    1816.51615.5151413.512.51210

    1816.51615.515141312.511.59.5

    17161615.515141312.511.58.5

    1716161515141312.5117.5

    Notas de enfermera 2001

  • POLGONO DE FRECUENCIAS: Es un grfico de rea que se construye cuando se quiere comparar dos variables cuantitativas.

    Tabla N! 3Edad de los padres de familia. Centro educativo estatal. San Juan de Lurigancho. 2003edad f punto medio15 - 19 0 17.520 - 24 6 22.525 - 29 23 27.530 - 34 24 32.535 - 39 17 37.540 - 44 14 42.545 - 49 7 47.550 - 54 5 52.555 - 59 4 57.564 - 64 0Total 100

    0

    5

    10

    15

    20

    25

    0 22.5 27.5 32.5 37.5 42.5 47.5 52.5 57.5

    Nota: Participantes de un Programa de Prevencin de Drogas

    Grfico N03Edades de los Padres de Familia. Centro Educativo Estatal.

    San Juan de Miraflores. 2003

    Tabla N 3. Edad de los padres de familia. Centro educativo estatal. San Juan de

    Miraflores. 2003.

    05

    1015202530

    17.5 22.5 27.5 32.5 37.5 42.5 47.5 52.5 57.5 62.5

    Edad

    N

    Histograma y polgono de frecuencias son grficos cuya rea es igual a 1

  • POLGONO DE FRECUENCIAS

  • Edad

    F

    r

    e

    c

    u

    e

    n

    c

    i

    a

    6050403020

    12

    10

    8

    6

    4

    2

    0

    Edad de un grupo de pacientes atendidos en una emergencia para adultos

  • GRFICO DE DISPERSIN:

    12323

    12631

    12119

    12426

    13043

    14363

    12420

    14670

    13653

    12846

    14470

    14058

    13246

    13658

    12831

    13453

    12626

    14163

    12843

    12020

    PSS (Y)

    Edad (X)

    20 30 40 50 60 70

    120

    130

    140

    Edad(X)

    P

    S

    S

    (

    Y

    )

    PACIENTES SEGN EDAD Y PRESIN SISTLICA

  • Mortalidad infantil por Enfermedades transmisibles y Ciertas afecciones originadas en el periodo perinatal segn niveles de pobreza. Per, 2000

    0

    500

    1000

    1500

    2000

    2500

    3000

    20 30 40 50 60 70 80 90

    % de la poblacin en situacin de pobreza

    T

    a

    s

    a

    d

    e

    m

    o

    r

    t

    a

    l

    i

    d

    a

    d

    p

    o

    r

    1

    0

    0

    ,

    0

    0

    0

    n

    a

    c

    i

    d

    o

    s

    v

    i

    v

    o

    s

    Coeficiente de correlacin

    Fuente: Pobreza: INEI. Encuesta Nacional de Hogares IV Trimestre 2002

    Enf. transmisibles:

    Ciertas afecciones originadas en el periodo perinatal:

  • GRFICO LINEAL: Se usa para presentar una variable en el tiempo. El grfico refleja el comportamiento de la variable en eltiempo.

    Frecuencia de diarreas en elAgustino en el ao 1998Mes fEnero 35Febrero 40Marzo 45Abril 30Mayo 25Junio 20Julio 18Agosto 15Setiembre 17Octubre 20Noviembre 25Diciembre 28

    Frecuencia de diarreas segn meses.El Agustino, 1 998

    01020304050

    En Fe Ma Ab Ma Ju Jul Ag Se Oc No Di

    Meses

    N

    C

    a

    s

    o

    s

  • 05000

    10000

    15000

    20000

    25000

    ENE FEB MAR ABR MAY JUN JUL AGO SET OCT NOV DIC

    Q1Q2Q3

    Curva endmica de la malaria por F. falciparum

    Construida con la informacin de los aos 1996-2002

    SIN RIESGO

    Alarma

    Amenaza Epidemia

  • Grfica 13. Curva endmica de tos ferina.

    1997 - 2002

    Q3

    Q2=Me

    Q1Ao x