Upload
alonso-manrique
View
220
Download
4
Embed Size (px)
DESCRIPTION
Se describe la teoría de tablas de contingencia
Citation preview
Bioestadstica
TABLAS DE CONTIGENCIA DE DOS FORMAS
1
Que se busca ?
Introducir parmetros que describen la asociacin poblacional entre dos variables categricas.
Datos Categoricos:
Consisten en el conteo de frecuencias de ocurrencia de las observaciones categoricas de la variable respuesta.
Para v. categoricas que tienen solamente dos nivels, se estudia los odds ratios , las diferencia de proporciones y la razon de proporciones.
2
TIPOS DE VARIABLES Cualitativas
Si sus valores (modalidades) no se pueden asociar naturalmente a un nmero (no se pueden hacer operaciones algebraicas con ellos)
Nominales: Si sus valores no se pueden ordenar Sexo, Grupo Sanguneo, Religin, Nacionalidad, Fumar (S/No)
Ordinales: Si sus valores se pueden ordenar Mejora a un tratamiento, Grado de satisfaccin, Intensidad del dolor
Cuantitativas o NumricasSi sus valores son numricos (tiene sentido hacer operaciones algebraicas con ellos)
Discretas: Si toma valores enteros Nmero de hijos, Nmero de cigarrillos, Num. de cumpleaos
Continuas: Si entre dos valores, son posibles infinitos valores intermedios. Altura, Presin intraocular, Dosis de medicamento administrado, edad
3
Estructura para las tablasde dos Dimensiones
4
X / Y 1 2 .. j J i+
1 11 12 1j 1J 1+
2 21 22 2j 2J 2+
. .. ..
i i1 i2 ij iJ i+
. ..
.
I I1 I2 Ij IJ I+
+j
+1 +2 +j +J
Estructura para las tablas de dos Dimensiones
Una relacin bivariada es definida por ladistribucin conjunta de dos variablesasociadas.
La distribucin de probabilidad { TT ij } es ladistribucion conjunta de X e Y .
Las distribuciones marginales son las filas ycolumnas de totales obtenidas mediante lasuma de probabilidades conjuntas.
5
Estructura para las tablas de dos Dimensiones
{ TT i+ } denota la distribucin marginalpara la variable fila.
{ TT +j } denota la distribucion marginal parala variable columna.
donde + denota la suma sobre el indice queremplaza, esto es:
6
Estructura para las tablasde dos Dimensiones
Y donde se verifica que:
Las distribuciones marginales soninformaciones de una sola variable , yno intervienen la asociacin entre lasvariables.
7
Estructura para las tablasde dos Dimensiones
En una Tabla de Contingencia ( Person 1904) otabla de clasificacin cruzada, una variable (Y) es una variable respuesta y otra ( X) es unavariable explicativa.
Cuando X es fijo en vez de aleatorio ,la nocinde distribucin conjunta para X e Y no essignificativa.
Pero para niveles fijos de X e Y tiene unadistribucin de probabilidad.
8
Estructura para las tablasde dos Dimensiones
Pero para niveles fijos de X e Y tiene una distribucin de probabilidad.
Ya que TT j/I denota la probabilidad de clasificacionen la columna j de Y , j= 1,2J
Y donde:
Luego: las propabilidades { } forma la distribucin condicional de Y en el nivel de i de X
9
Estructura para las tablas de dos Dimensiones
Entonces : un objetivo principal en muchosestudios es comparar la distribucincondicional de Y en varios niveles de lasvariables explicativas .
En otras palabras es usar la funcin deDistribucin condicional ( que es la sumade probabilidad de clasificacin en una de lasprimeras j columna, dado que esta en la fila i.
10
INDEPENDENCIA EN Tablas de dos Dimensiones
Si ambas variables son variablesrespuestas, se puede describir la asociacinusando su distribucin conjunta,Distribucin condicional de X dada la variableY, o la distribucin condicional de Y dada Xdada:
11
INDEPENDENCIA EN Tablas de dos Dimensiones
Las variables son estocsticamenteindependientes si todas las probabilidadesconjuntas es igual al producto de susprobabilidades marginales, esto es:
12
INDEPENDENCIA EN Tablas de dos Dimensiones
Cuando X e Y son independientes se
Cada distribucin condicional de Y es idntica ala distribucin marginal de Y.
Luego dos variables son independientes cuandola probabilidad de respuesta columna j es lamisma en cada fila , para j= 1,2 J.
13
INDEPENDENCIA EN Tablas de dos Dimensiones
Cuando Y es una respuesta e X una variable explicativa, la distribucin condicional esta expresada por :
queda una definicin mas natural de independencia.
14
X / Y 1 2
1 111/1
121/2
1+1
2 121/2
222/2
2+1
Total +1 +2
Formas de Comparar proporciones
Las variables de respuesta con dos categoras sondenominadas binarias.
Frecuentemente se comparan varios grupos en unarespuesta binaria Y
15
vacuna cura No cura
A A11 A12
B A21 A22
C A31 A23
D A41 A24
Diferencias de proporciones
Para sujetos en la fila i i= 1,2,..del grupoI, 1/i es la probabilidad respuesta (1). Y ( 1/i ,2/i ) = ( 1/i , 1 - 1/i ) es la distribucincondicional de la respuesta binaria.
Para comparar dos filas : h e i , usando la diferencia de proporciones seria:
( 1/h _ 1/i ) (2) , la respuesta en esta comparacin es equivalente a la comparacin en (1):
( 2/h - 2/i ) = ( 1 - 1/h ) - ( 1 _ 1/i ) = 1/i _ 1/h (*)
16
X / Y 1 2
1 111/1
121/2
1+1
2 212/1
222/2
2+1
Total +1 +2
Esta diferencia cae entre -1 a +1. Es igual a cero cuando las filas h e i tienen distribuciones
condicionales idnticas.
Diferencias de proporciones
Luego la v. respuesta Y es estadsticamente independiente de la clasificacin de la fila i, cuando se cumple que : 1/h - 1/i = 0 , para todo par de filas
h e i.
Para tablas de contingencia I x J se puede comparar las probabilides condicionales de la respuesta j para las filas h e i , usando la diferencia j/h - j /i
17
Diferencias de proporciones
Cuando ambas variables son variables respuestas y existe una distribucin conjunta
{TT ij }, la comparasion de proporciones dentro de la filah e I satisface :
1/h - 1/i = h1 / h+ - i1 / i+
Para el caso 2 x2 :
P(col 1 /fila 1 ) - P(col 1 /fila 2 )= 11 / 1+ - 21 / 2+
18
Odds Ratio=
Con respecto a las tablas 2 x 2
Para la fila 1 , el odds que es la respuesta esta en la columna 1 y esta definido por
Para una distribucin conjunta la definicin equivalente es:
i= 1,2
Cada i es no negativo, con valor mayor que 120
2
1
i
i
i
12
11
1
12
1
11
1/2
1/1
1