19
Bioestadística TABLAS DE CONTIGENCIA DE DOS FORMAS 1

CLASE1 Tablas de Contigencia 2015

Embed Size (px)

DESCRIPTION

Se describe la teoría de tablas de contingencia

Citation preview

  • Bioestadstica

    TABLAS DE CONTIGENCIA DE DOS FORMAS

    1

  • Que se busca ?

    Introducir parmetros que describen la asociacin poblacional entre dos variables categricas.

    Datos Categoricos:

    Consisten en el conteo de frecuencias de ocurrencia de las observaciones categoricas de la variable respuesta.

    Para v. categoricas que tienen solamente dos nivels, se estudia los odds ratios , las diferencia de proporciones y la razon de proporciones.

    2

  • TIPOS DE VARIABLES Cualitativas

    Si sus valores (modalidades) no se pueden asociar naturalmente a un nmero (no se pueden hacer operaciones algebraicas con ellos)

    Nominales: Si sus valores no se pueden ordenar Sexo, Grupo Sanguneo, Religin, Nacionalidad, Fumar (S/No)

    Ordinales: Si sus valores se pueden ordenar Mejora a un tratamiento, Grado de satisfaccin, Intensidad del dolor

    Cuantitativas o NumricasSi sus valores son numricos (tiene sentido hacer operaciones algebraicas con ellos)

    Discretas: Si toma valores enteros Nmero de hijos, Nmero de cigarrillos, Num. de cumpleaos

    Continuas: Si entre dos valores, son posibles infinitos valores intermedios. Altura, Presin intraocular, Dosis de medicamento administrado, edad

    3

  • Estructura para las tablasde dos Dimensiones

    4

    X / Y 1 2 .. j J i+

    1 11 12 1j 1J 1+

    2 21 22 2j 2J 2+

    . .. ..

    i i1 i2 ij iJ i+

    . ..

    .

    I I1 I2 Ij IJ I+

    +j

    +1 +2 +j +J

  • Estructura para las tablas de dos Dimensiones

    Una relacin bivariada es definida por ladistribucin conjunta de dos variablesasociadas.

    La distribucin de probabilidad { TT ij } es ladistribucion conjunta de X e Y .

    Las distribuciones marginales son las filas ycolumnas de totales obtenidas mediante lasuma de probabilidades conjuntas.

    5

  • Estructura para las tablas de dos Dimensiones

    { TT i+ } denota la distribucin marginalpara la variable fila.

    { TT +j } denota la distribucion marginal parala variable columna.

    donde + denota la suma sobre el indice queremplaza, esto es:

    6

  • Estructura para las tablasde dos Dimensiones

    Y donde se verifica que:

    Las distribuciones marginales soninformaciones de una sola variable , yno intervienen la asociacin entre lasvariables.

    7

  • Estructura para las tablasde dos Dimensiones

    En una Tabla de Contingencia ( Person 1904) otabla de clasificacin cruzada, una variable (Y) es una variable respuesta y otra ( X) es unavariable explicativa.

    Cuando X es fijo en vez de aleatorio ,la nocinde distribucin conjunta para X e Y no essignificativa.

    Pero para niveles fijos de X e Y tiene unadistribucin de probabilidad.

    8

  • Estructura para las tablasde dos Dimensiones

    Pero para niveles fijos de X e Y tiene una distribucin de probabilidad.

    Ya que TT j/I denota la probabilidad de clasificacionen la columna j de Y , j= 1,2J

    Y donde:

    Luego: las propabilidades { } forma la distribucin condicional de Y en el nivel de i de X

    9

  • Estructura para las tablas de dos Dimensiones

    Entonces : un objetivo principal en muchosestudios es comparar la distribucincondicional de Y en varios niveles de lasvariables explicativas .

    En otras palabras es usar la funcin deDistribucin condicional ( que es la sumade probabilidad de clasificacin en una de lasprimeras j columna, dado que esta en la fila i.

    10

  • INDEPENDENCIA EN Tablas de dos Dimensiones

    Si ambas variables son variablesrespuestas, se puede describir la asociacinusando su distribucin conjunta,Distribucin condicional de X dada la variableY, o la distribucin condicional de Y dada Xdada:

    11

  • INDEPENDENCIA EN Tablas de dos Dimensiones

    Las variables son estocsticamenteindependientes si todas las probabilidadesconjuntas es igual al producto de susprobabilidades marginales, esto es:

    12

  • INDEPENDENCIA EN Tablas de dos Dimensiones

    Cuando X e Y son independientes se

    Cada distribucin condicional de Y es idntica ala distribucin marginal de Y.

    Luego dos variables son independientes cuandola probabilidad de respuesta columna j es lamisma en cada fila , para j= 1,2 J.

    13

  • INDEPENDENCIA EN Tablas de dos Dimensiones

    Cuando Y es una respuesta e X una variable explicativa, la distribucin condicional esta expresada por :

    queda una definicin mas natural de independencia.

    14

    X / Y 1 2

    1 111/1

    121/2

    1+1

    2 121/2

    222/2

    2+1

    Total +1 +2

  • Formas de Comparar proporciones

    Las variables de respuesta con dos categoras sondenominadas binarias.

    Frecuentemente se comparan varios grupos en unarespuesta binaria Y

    15

    vacuna cura No cura

    A A11 A12

    B A21 A22

    C A31 A23

    D A41 A24

  • Diferencias de proporciones

    Para sujetos en la fila i i= 1,2,..del grupoI, 1/i es la probabilidad respuesta (1). Y ( 1/i ,2/i ) = ( 1/i , 1 - 1/i ) es la distribucincondicional de la respuesta binaria.

    Para comparar dos filas : h e i , usando la diferencia de proporciones seria:

    ( 1/h _ 1/i ) (2) , la respuesta en esta comparacin es equivalente a la comparacin en (1):

    ( 2/h - 2/i ) = ( 1 - 1/h ) - ( 1 _ 1/i ) = 1/i _ 1/h (*)

    16

    X / Y 1 2

    1 111/1

    121/2

    1+1

    2 212/1

    222/2

    2+1

    Total +1 +2

    Esta diferencia cae entre -1 a +1. Es igual a cero cuando las filas h e i tienen distribuciones

    condicionales idnticas.

  • Diferencias de proporciones

    Luego la v. respuesta Y es estadsticamente independiente de la clasificacin de la fila i, cuando se cumple que : 1/h - 1/i = 0 , para todo par de filas

    h e i.

    Para tablas de contingencia I x J se puede comparar las probabilides condicionales de la respuesta j para las filas h e i , usando la diferencia j/h - j /i

    17

  • Diferencias de proporciones

    Cuando ambas variables son variables respuestas y existe una distribucin conjunta

    {TT ij }, la comparasion de proporciones dentro de la filah e I satisface :

    1/h - 1/i = h1 / h+ - i1 / i+

    Para el caso 2 x2 :

    P(col 1 /fila 1 ) - P(col 1 /fila 2 )= 11 / 1+ - 21 / 2+

    18

  • Odds Ratio=

    Con respecto a las tablas 2 x 2

    Para la fila 1 , el odds que es la respuesta esta en la columna 1 y esta definido por

    Para una distribucin conjunta la definicin equivalente es:

    i= 1,2

    Cada i es no negativo, con valor mayor que 120

    2

    1

    i

    i

    i

    12

    11

    1

    12

    1

    11

    1/2

    1/1

    1