Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
1 2 3 4
CURSO DE CURSO DE FUNDAMENTOS DE FUNDAMENTOS DE BIOESTADBIOESTAD ÍÍSTICASTICA
Guadalupe Ruiz Merino Guadalupe Ruiz Merino -- Curso de Fundamentos de BioestadCurso de Fundamentos de Bioestadíísticastica
1 2 3 4
Guadalupe Ruiz Merino Guadalupe Ruiz Merino -- Curso de Fundamentos de BioestadCurso de Fundamentos de Bioestadíísticastica
ESQUEMA DEL CURSOESQUEMA DEL CURSO
INFERENCIA ESTADÍSTICA
ESTIMACIÓNCONTRASTE DE HIPÓTESIS
PUNTUAL POR INTERVALOSMÉTODOS
PARAMÉTRICOSMÉTODOS
NO PARAMÉTRICOS
T-STUDENT
ANOVA
FISHER
U-MANN WHITNEY
K-W
TABLAS DE CONTINGENCIA
PEARSON
1 2 3 4
Guadalupe Ruiz Merino Guadalupe Ruiz Merino -- Curso de Fundamentos de BioestadCurso de Fundamentos de Bioestadíísticastica
SESIÓN I
ESTIMACIÓNSESISESIÓÓN IN I
ESTIMACIESTIMACIÓÓNN
1
1
1 2 3 4
Guadalupe Ruiz Merino Guadalupe Ruiz Merino -- Curso de Fundamentos de BioestadCurso de Fundamentos de Bioestadíísticastica
SESISESIÓÓN IIN II
2
Contraste de hipótesisEstadísticas básicas:
2.1-Paramétricas2.2-No Paramétricas
Contraste de hipContraste de hipóótesistesisEstadEstadíísticas bsticas báásicas:sicas:
2.12.1--ParamParaméétricastricas2.22.2--No No ParamParaméétricastricas
1 2 3 4
Guadalupe Ruiz Merino Guadalupe Ruiz Merino -- Curso de Fundamentos de BioestadCurso de Fundamentos de Bioestadíísticastica
Tablas de contingenciaAnálisis de residuos
Tests estadísticos
Tablas de contingenciaTablas de contingenciaAnAnáálisis de residuoslisis de residuos
TestsTests estadestadíísticos sticos
SESISESIÓÓNN IIIIII
3
1 2 3 4
Guadalupe Ruiz Merino Guadalupe Ruiz Merino -- Curso de Fundamentos de BioestadCurso de Fundamentos de Bioestadíísticastica
CorrelaciónRegresión Lineal Simple
CorrelaciCorrelacióónnRegresiRegresióón Lineal Simplen Lineal Simple
SESISESIÓÓN IVN IV
4
1 2 3 4
Guadalupe Ruiz Merino Guadalupe Ruiz Merino -- Curso de Fundamentos de BioestadCurso de Fundamentos de Bioestadíísticastica
““Si oigo algo lo olvido.Si oigo algo lo olvido.
Si lo veo lo entiendo.Si lo veo lo entiendo.
Si lo hago lo aprendoSi lo hago lo aprendo””..
Confucio (551Confucio (551--478 A.C)478 A.C)
1 2 3 4
Guadalupe Ruiz Merino Guadalupe Ruiz Merino -- Curso de Fundamentos de BioestadCurso de Fundamentos de Bioestadíísticastica
Concepto de EstimaciConcepto de Estimacióónn
Error estError estáándarndar
Intervalo de ConfianzaIntervalo de Confianza
SESISESIÓÓN I ESTIMACIN I ESTIMACIÓÓNN
1
1 2 3 4
Guadalupe Ruiz Merino Guadalupe Ruiz Merino -- Curso de Fundamentos de BioestadCurso de Fundamentos de Bioestadíísticastica
DEFINICIDEFINICIÓÓN DE ESTIMACIN DE ESTIMACIÓÓNN
Proceso de utilizar informaciProceso de utilizar informacióón de una muestra n de una muestra
para extraer conclusiones acerca de toda la para extraer conclusiones acerca de toda la
poblacipoblacióón.n.
Se utiliza la informaciSe utiliza la informacióón para estimar un valor.n para estimar un valor.
1
1 2 3 4
Guadalupe Ruiz Merino Guadalupe Ruiz Merino -- Curso de Fundamentos de BioestadCurso de Fundamentos de Bioestadíísticastica
No tener sesgos.No tener sesgos.
Poca variabilidad de una muestra a otra.Poca variabilidad de una muestra a otra.
PROPIEDADES ESTIMACIPROPIEDADES ESTIMACIÓÓNN
1
1 2 3 4
Guadalupe Ruiz Merino Guadalupe Ruiz Merino -- Curso de Fundamentos de BioestadCurso de Fundamentos de Bioestadíísticastica
PUNTUALPUNTUAL: Se obtiene un : Se obtiene un úúnico nnico núúmero al que se le puede mero al que se le puede
asignar un punto de la recta.asignar un punto de la recta.
POR INTERVALOSPOR INTERVALOS: Se obtienen dos puntos que : Se obtienen dos puntos que
representan un (representan un (lili, , lsls).).
TIPOS DE ESTIMACITIPOS DE ESTIMACIÓÓNN
1
1 2 3 4
Guadalupe Ruiz Merino Guadalupe Ruiz Merino -- Curso de Fundamentos de BioestadCurso de Fundamentos de Bioestadíísticastica
CONCEPTO DE ESTIMACICONCEPTO DE ESTIMACIÓÓNN
Ser un estimador adecuado no significa ..., significa ...
... manejo de la incertidumbrey de la imprecisión
1
1 2 3 4
Guadalupe Ruiz Merino Guadalupe Ruiz Merino -- Curso de Fundamentos de BioestadCurso de Fundamentos de Bioestadíísticastica
Estimador puntual difiere del Estimador puntual difiere del verdadero valor.verdadero valor.
Es deseable acompaEs deseable acompa ññar la estimaciar la estimaci óón n de alguna medida posible de error.de alguna medida posible de error.
1
1 2 3 4
Guadalupe Ruiz Merino Guadalupe Ruiz Merino -- Curso de Fundamentos de BioestadCurso de Fundamentos de Bioestadíísticastica
ERROR ESTERROR ESTÁÁNDARNDAR
Diferencia entre el valor probable y los Diferencia entre el valor probable y los valores reales de la variable dependiente.valores reales de la variable dependiente.
1
1 2 3 4
Guadalupe Ruiz Merino Guadalupe Ruiz Merino -- Curso de Fundamentos de BioestadCurso de Fundamentos de Bioestadíísticastica
Asociado a cada estimaciAsociado a cada estimaci óón:n:
Un intervalo.Un intervalo.
Una medida de confianzaUna medida de confianza ..
EstimaciEstimaci óón por intervalosn por intervalos
1
1 2 3 4
Guadalupe Ruiz Merino Guadalupe Ruiz Merino -- Curso de Fundamentos de BioestadCurso de Fundamentos de Bioestadíísticastica
INTERVALO DE CONFIANZAINTERVALO DE CONFIANZA
Un espacio que tiene una cierta Un espacio que tiene una cierta probabilidad de contener el verdadero probabilidad de contener el verdadero
valor del parvalor del par áámetro desconocido.metro desconocido.
1
1 2 3 4
Guadalupe Ruiz Merino Guadalupe Ruiz Merino -- Curso de Fundamentos de BioestadCurso de Fundamentos de Bioestadíísticastica
MEDIDA DE CONFIANZAMEDIDA DE CONFIANZA
Coeficiente de confianza 1Coeficiente de confianza 1 --αα..
Nivel de confianza 100(1Nivel de confianza 100(1 -- αα)%.)%.
1
1 2 3 4
Guadalupe Ruiz Merino Guadalupe Ruiz Merino -- Curso de Fundamentos de BioestadCurso de Fundamentos de Bioestadíísticastica
Elegiremos probabilidades cercanas a Elegiremos probabilidades cercanas a la unidad.la unidad.
Lo decidimos nosotros.Lo decidimos nosotros.
95%95%--------------11--αα=0.95=0.95--------------αα=0.05=0.0590%90%--------------11--αα=0.90=0.90--------------αα=0.01 99%=0.01 99%--------------11--αα=0.99=0.99--------------αα=0.001=0.001
1
1 2 3 4
Guadalupe Ruiz Merino Guadalupe Ruiz Merino -- Curso de Fundamentos de BioestadCurso de Fundamentos de Bioestadíísticastica
Los Los I.CI.C. se utilizan como indicadores de la . se utilizan como indicadores de la
variabilidad de las estimaciones.variabilidad de las estimaciones.
CuCuáánto mnto m áás s ““ estrechoestrecho ”” sea mejor.sea mejor.
1
1 2 3 4
Guadalupe Ruiz Merino Guadalupe Ruiz Merino -- Curso de Fundamentos de BioestadCurso de Fundamentos de Bioestadíísticastica
MediaMedia : tiempo medio de recuperaci: tiempo medio de recuperaci óónn
ProporciProporci óónn: de ni: de ni ñños que sufren apendicitis.os que sufren apendicitis.
DesviaciDesviaci óón estn est áándarndar : del error de medida de un : del error de medida de un
aparato maparato m éédico.dico.
Los Los I.CI.C. se pueden crear para . se pueden crear para cualquier parcualquier par áámetro de la poblacimetro de la poblaci óón:n:
1
1 2 3 4
Guadalupe Ruiz Merino Guadalupe Ruiz Merino -- Curso de Fundamentos de BioestadCurso de Fundamentos de Bioestadíísticastica
1
+≤≤−= −
−−
−n
stx
n
stxIC n
nn
n1
11
1%95 µ
Factor relacionadocon la confianza Parámetro: Media Poblacional Error Estándar
Estimo
Nivel deconfianza Límites de confianza
IC95%
1 2 3 4
Guadalupe Ruiz Merino Guadalupe Ruiz Merino -- Curso de Fundamentos de BioestadCurso de Fundamentos de Bioestadíísticastica
Nivel de confianza
Límites de confianza
Parámetro: Prevalencia Poblacional Error Estándar
−⋅+≤≤−⋅−=n
ppzp
n
ppzpIC
)1()1(%95 2/2/ αα π
1
IC95%
1 2 3 4
Guadalupe Ruiz Merino Guadalupe Ruiz Merino -- Curso de Fundamentos de BioestadCurso de Fundamentos de Bioestadíísticastica
AnAn áálisis lisis
Tablas Tablas a|ba|b
Dos proporciones datos agrupadosDos proporciones datos agrupados
PARPARÁÁMETROSMETROS
1
1 2 3 4
Guadalupe Ruiz Merino Guadalupe Ruiz Merino -- Curso de Fundamentos de BioestadCurso de Fundamentos de Bioestadíísticastica
Contraste de HipContraste de Hip óótesis.tesis.
MMéétodos todos ParamParam éétricostricos ..
Trasformaciones de datos.Trasformaciones de datos.
MMéétodos No todos No ParamParam éétricostricos ..
INFERENCIAINFERENCIA ESTADESTADÍÍSTICASTICA
1
1 2 3 4
Guadalupe Ruiz Merino Guadalupe Ruiz Merino -- Curso de Fundamentos de BioestadCurso de Fundamentos de Bioestadíísticastica
INFERENCIAINFERENCIA ESTADESTADÍÍSTICASTICA
MMéétodos empleados para sacar conclusiones a todos empleados para sacar conclusiones a
partir de una muestra y extenderlas a una partir de una muestra y extenderlas a una
poblacipoblaci óón.n.
1
1 2 3 4
CONTRASTE DE HIPCONTRASTE DE HIPÓÓTESISTESIS
A diferencia que en la estimaciA diferencia que en la estimaci óónn
primero se formula una hipprimero se formula una hip óótesis ytesis y
despudespu éés se rechaza o no.s se rechaza o no.
2
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4
PASO 1PASO 1
Expresar el interrogante de la investigaciExpresar el interrogante de la investigaci óón como n como
una hipuna hip óótesis estadtesis estad íística.stica.
H0: H0: ““ No hay diferenciaNo hay diferencia ””
H1: H1: ““ Hay diferenciaHay diferencia ””
2
CONTRASTE DE HIPCONTRASTE DE HIPÓÓTESISTESIS
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4
PASO 2PASO 2
Decidir sobre la prueba estadDecidir sobre la prueba estad íística adecuada.stica adecuada.
SegSegúún la poblacin la poblaci óón y el tipo de variables. n y el tipo de variables.
2
CONTRASTE DE HIPCONTRASTE DE HIPÓÓTESISTESIS
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4
PASO 3PASO 3
Seleccionar grado de significaciSeleccionar grado de significaci óón para la prueba n para la prueba
estadestad íística.stica.
Grado de significaciGrado de significaci óón = alfa = probabilidad de n = alfa = probabilidad de
rechazar de manera incorrecta H0 cuando sea cierta rechazar de manera incorrecta H0 cuando sea cierta
(normalmente 0.05,0.01,0.001)(normalmente 0.05,0.01,0.001)
2
CONTRASTE DE HIPCONTRASTE DE HIPÓÓTESISTESIS
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4
PASO 4PASO 4
Realizar los cRealizar los c áálculos y exponer conclusiones.lculos y exponer conclusiones.
2
CONTRASTE DE HIPCONTRASTE DE HIPÓÓTESISTESIS
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4
ERRORES EN LAS PRUEBAS DE HIPERRORES EN LAS PRUEBAS DE HIP ÓÓTESISTESIS
Falso negativo,Falso negativo, ββ
Error tipo IIError tipo II
No existe No existe
diferenciadiferencia
Falso positivo,Falso positivo, αα
Error tipo IError tipo I
Poder 1Poder 1 --ββExiste Existe
diferencia diferencia
No existe No existe
diferencia H0diferencia H0
Existe diferencia Existe diferencia
H1H1
2
CONTRASTE DE HIPCONTRASTE DE HIPÓÓTESISTESIS
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4
ERRORES:ERRORES:
ββ= Probabilidad de error tipo II= Probabilidad de error tipo II
Potencia=1Potencia=1 --ββ
Los Los testtest serser áán mn m áás adecuados cus adecuados cu áánto mnto m áás potentes.s potentes.
2
CONTRASTE DE HIPCONTRASTE DE HIPÓÓTESISTESIS
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4
ERRORES:ERRORES:
¿¿CCóómo se puede aumentar la potencia de un mo se puede aumentar la potencia de un testtest ??
Aumentando el tamaAumentando el tama ñño de la muestra. o de la muestra.
2
CONTRASTE DE HIPCONTRASTE DE HIPÓÓTESISTESIS
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4
Valor de pValor de p
Se puede considerar p como la probabilidad de que e l Se puede considerar p como la probabilidad de que e l
resultado obtenido sea debido al azar.resultado obtenido sea debido al azar.
p se calcula despup se calcula despu éés de la prueba estads de la prueba estad íística. Si p<stica. Si p< αα
se rechaza H0.se rechaza H0.
¿¿Y si no lo es? Y si no lo es? ¿¿QuQuéé conclusiconclusi óón sacamos?n sacamos?
2
CONTRASTE DE HIPCONTRASTE DE HIPÓÓTESISTESIS
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4
Métodos para el
Si rechazo una hipSi rechazo una hip óótesis con un nivel de tesis con un nivel de
significacisignificaci óón ,n ,αα,, de 0.001 de 0.001 ¿¿Se rechazarSe rechazar íía a un nivel a a un nivel
de 0.01?de 0.01?
SSíí porque si la rechazamos es porque p<0.001 lo que porque si la rechazamos es porque p<0.001 lo que
implica que p<0.01.implica que p<0.01.
2
CONTRASTE DE HIPCONTRASTE DE HIPÓÓTESISTESIS
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4
Métodos para el
¿¿Y si fuera al revY si fuera al rev éés?s?
En ese caso no puedo asegurar que la regiEn ese caso no puedo asegurar que la regi óón de n de
rechazo siga siendo la misma.rechazo siga siendo la misma.
2
CONTRASTE DE HIPCONTRASTE DE HIPÓÓTESISTESIS
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4
Métodos para el
Si un Si un testtest se rechaza con una potencia de 0.90, se rechaza con una potencia de 0.90,
¿¿se seguirse seguir áá rechazando si rebajamos la potencia a rechazando si rebajamos la potencia a
0.80?0.80?
No. Estamos aumentando la probabilidad de error No. Estamos aumentando la probabilidad de error
de tipo II (aceptar H0| de tipo II (aceptar H0| H0H0 falsa) y habrfalsa) y habr íía que rehacer a que rehacer
el contraste.el contraste.
2
CONTRASTE DE HIPCONTRASTE DE HIPÓÓTESISTESIS
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4
Métodos para el
MMéétodos todos paramparam éétricostricos ..
Variables independientes.Variables independientes.
Variables dependientes.Variables dependientes.
Trasformaciones logarTrasformaciones logar íítmicas.tmicas.
MMéétodos no todos no paramparam éétricostricos ..
2
CONTRASTE DE HIPCONTRASTE DE HIPÓÓTESISTESIS
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4
TIPOS DE DISEÑO
2
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
FisherFisherCualitativa Cualitativa dicotdicotóómiamiaCualitativa dicotCualitativa dicotóómicamica
ANOVAANOVACuantitativaCuantitativaCualitativa ordinalCualitativa ordinal
TT--StudentStudentCuantitativaCuantitativaCualitativa dicotCualitativa dicotóómicamica
TestTestVariable Variable independienteindependiente
Variable dependienteVariable dependiente
1 2 3 4
Métodos paramétricosTT--StudentStudent ::
MMéétodo estadtodo estad íístico mstico m áás utilizado.s utilizado.
Condiciones:Condiciones:
--La muestra se ajuste a un modelo lineal.La muestra se ajuste a un modelo lineal.
--Datos distribuidos normalmente e independientesDatos distribuidos normalmente e independientes
--Variable dependiente cualitativa dicotVariable dependiente cualitativa dicot óómicamica
Variable independiente cuantitativa.Variable independiente cuantitativa.
2
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4
Se ajuste a un modelo lineal:Se ajuste a un modelo lineal:
Una observaciUna observaci óón directa (recoger los datos) sigue un n directa (recoger los datos) sigue un
modelo lineal.modelo lineal.
2
Métodos para elCONTRASTE DE HIPCONTRASTE DE HIPÓÓTESISTESIS
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4
Datos distribuidos normalmente.Datos distribuidos normalmente.
�� Es lo mEs lo m áás frecuente.s frecuente.
�� BibliografBibliograf íía anterior. a anterior.
�� El TCL nos asegura que cualquier muestra de un El TCL nos asegura que cualquier muestra de un
tamatama ñño > 30 sigue una distribucio > 30 sigue una distribuci óón normal.n normal.
�� TestTest de contraste de normalidad.de contraste de normalidad.
2
Métodos para elCONTRASTE DE HIPCONTRASTE DE HIPÓÓTESISTESIS
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4
Datos independientes:Datos independientes:
No se puede asignar los dos No se puede asignar los dos tratamientos a la muestra.tratamientos a la muestra.
Nota: CondiciNota: Condici óón indispensable que las n indispensable que las
unidades de las variables seanunidades de las variables sean
homoghomog ééneas.neas.
2
Métodos para elCONTRASTE DE HIPCONTRASTE DE HIPÓÓTESISTESIS
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4
Los Los testtest de contraste de hipde contraste de hip óótesis pueden ser tesis pueden ser unilaterales o bilaterales.unilaterales o bilaterales.
Se usan los Se usan los testtest unilaterales cuando sospechas que unilaterales cuando sospechas que una media es mayor que otrauna media es mayor que otra
En este caso el nivel de significaciEn este caso el nivel de significaci óón pasa a ser 2n pasa a ser 2 αα
2
Métodos para elCONTRASTE DE HIPCONTRASTE DE HIPÓÓTESISTESIS
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 42
Métodos para elCONTRASTE DE HIPCONTRASTE DE HIPÓÓTESISTESIS
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4
Datos pareadosEjemplo:Ejemplo:
2
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
9090959566
10310310810855
9393989844
7878838333
8484898922
959510010011
PESO DESPUPESO DESPUÉÉS (S (kgkg ))PESO ANTES (PESO ANTES (kgkg ))PACIENTEPACIENTE
1 2 3 4
Datos pareados
Extraemos una muestra de 3 individuos y calculamos Extraemos una muestra de 3 individuos y calculamos su peso medio antes de la dieta: su peso medio antes de la dieta: 89 kg89 kg ..
Extraemos otra muestra de 3 individuos y calculamos Extraemos otra muestra de 3 individuos y calculamos que su peso despuque su peso despuéés de la dieta es de s de la dieta es de 97 kg97 kg ..
2
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
Concluimos por tanto que la dieta no es eficaz.Concluimos por tanto que la dieta no es eficaz.
¡¡FALSO!FALSO!
1 2 3 4
Datos pareados
El fallo estEl fallo estáá en que la variable de estudio, en en que la variable de estudio, en este caso este caso el pesoel peso , es muy distinta de un , es muy distinta de un individuo a otro.individuo a otro.
Una manera de controlar esta variabilidad es Una manera de controlar esta variabilidad es coger una coger una úúnica muestra de pacientes y nica muestra de pacientes y calcular su peso antes y despucalcular su peso antes y despuéés de la dieta.s de la dieta.
2
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4
Datos pareados
Hacemos un estudio de datos apareados cuando Hacemos un estudio de datos apareados cuando el mismo grupo se mide dos veces:el mismo grupo se mide dos veces:
Los individuos se miden al principio del Los individuos se miden al principio del tratamiento para establecer una ltratamiento para establecer una líínea basal y nea basal y despudespuéés de alguna intervencis de alguna intervencióón se repite la n se repite la medicimedicióón n en los mismos sujetosen los mismos sujetos..
2
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4
Datos pareados
� Éstos estudios necesitan una manera de controlar los datos entre pacientes. El objetivo es controlar factores extraños que podrían influir en el resultado.
� La prueba estadística que se utiliza cuando los mismos individuos son objeto de medición de una variable numérica es la prueba t-Student para datos apareados .
� Debemos asumir que la diferencia de las medias sigue una distribución normal.
2
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4
¿¿Y SI QUEREMOS ESTUDIAR LA Y SI QUEREMOS ESTUDIAR LA INFLUENCIA DE MINFLUENCIA DE M ÁÁS DE UN FACTOR?S DE UN FACTOR?
2
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
ANOVAANOVA
1 2 3 4
ANOVA
�� El tEl téérmino factor se refiere a la variable por la rmino factor se refiere a la variable por la cual se forman los grupos.cual se forman los grupos.
�� EjEj: dividir en grupos con base a su estado de : dividir en grupos con base a su estado de tiroides y terapia.tiroides y terapia.
�� Al nAl núúmero de grupos definido por un factor se mero de grupos definido por un factor se le conoce como nle conoce como núúmero de niveles.mero de niveles.
�� En estudios experimentales en medicina a los En estudios experimentales en medicina a los niveles se les llama tratamiento. niveles se les llama tratamiento.
2
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4
ANOVA
Muchos de los proyectos en medicina utilizan Muchos de los proyectos en medicina utilizan mmáás de dos grupos.s de dos grupos.
Hay estudios que analizan la influencia de mHay estudios que analizan la influencia de máás s de un factor.de un factor.
DespuDespuéés se comprueban las distintas s se comprueban las distintas combinaciones para determinar las diferencias combinaciones para determinar las diferencias entre los grupos.entre los grupos.
2
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4
ANOVA
P corregidaP corregida
Si no se realiza la prueba mSi no se realiza la prueba múúltiple, las distintas ltiple, las distintas combinaciones entre los grupos alteran el combinaciones entre los grupos alteran el nivel de significacinivel de significacióón n αα..
2
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4
ANOVA
Ejemplo:Ejemplo:
Supongamos que queremos estudiar las posibles Supongamos que queremos estudiar las posibles diferencias entre las medias de 4 grupos dos a dos. diferencias entre las medias de 4 grupos dos a dos.
TendrTendrííamos 4*2=8 posibilidades de cometer un error de amos 4*2=8 posibilidades de cometer un error de tipo I con un nivel tipo I con un nivel αα=0.05.=0.05.
La posibilidad de que cada comparaciLa posibilidad de que cada comparacióón significativa fuera n significativa fuera falsa serfalsa seríía de 5%,a de 5%,e.de.d, el total de posibilidad de declarar , el total de posibilidad de declarar una de las comparaciones como significativa, de forma una de las comparaciones como significativa, de forma incorrecta serincorrecta seríía de un 40%.a de un 40%.
2
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4
ANOVA
Una manera de compensar las comparaciones Una manera de compensar las comparaciones mmúúltiples es disminuir el nivel ltiples es disminuir el nivel αα dividiendo dividiendo ααentre el nentre el núúmero de comparaciones hechas.mero de comparaciones hechas.
Por ejemplo en el caso anterior si se hacen 4 Por ejemplo en el caso anterior si se hacen 4 comparaciones comparaciones αα se divide entre 4 para se divide entre 4 para obtener una comparaciobtener una comparacióón de 0.05/4=0.0125.n de 0.05/4=0.0125.
Con este mCon este méétodo cada comparacitodo cada comparacióón debe ser n debe ser significativa al nivel de 0.0125 para declararla significativa al nivel de 0.0125 para declararla como tal.como tal.
2
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4
ANOVA
La forma de analizar los datos con La forma de analizar los datos con observaciones mobservaciones múúltiples se llama ANOVA.ltiples se llama ANOVA.
ÉÉste mste méétodo protege al investigador contra el todo protege al investigador contra el ““errorerror”” inflacciinflaccióón, preguntando primero si hay n, preguntando primero si hay diferencias entre las medias de los grupos.diferencias entre las medias de los grupos.
2
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4
ANOVA
Se asumen grupos de variable con distribuciSe asumen grupos de variable con distribucióón n normal.normal.
Debe haber homogeneidad en las varianzas.Debe haber homogeneidad en las varianzas.
Las variables son independientes, Las variables son independientes, e.de.d, no se , no se relaciona en forma alguna con el valor de otra.relaciona en forma alguna con el valor de otra.
Si el ANOVA da significativo, estudiamos la Si el ANOVA da significativo, estudiamos la diferencia entre las medias.diferencia entre las medias.
2
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4TRANSFORMACIÓN DE
OBSERVACIONES
Si las observaciones estSi las observaciones estáán muy sesgadas no n muy sesgadas no debe emplearse la tdebe emplearse la t--StudentStudent. En este caso las . En este caso las observaciones deben ser transformadas o observaciones deben ser transformadas o readaptadas. readaptadas.
TambiTambiéén se pueden usar mn se pueden usar méétodos no todos no paramparaméétricostricos..
2
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4TRANSFORMACIÓN DE
OBSERVACIONESTransfomarTransfomar observaciones significa expresar los observaciones significa expresar los
valores en otra escala.valores en otra escala.EjEj: Si el peso se expresa en libras, se multiplica : Si el peso se expresa en libras, se multiplica
por 2.2 para obtener el valor en por 2.2 para obtener el valor en kg.kg.De esta forma se pueden usar pruebas De esta forma se pueden usar pruebas
estadestadíísticas que de otra manera no sersticas que de otra manera no seríían an apropiadas.apropiadas.
TambiTambiéén resultan adecuadas cuando la n resultan adecuadas cuando la dispersidispersióón es muy alta.n es muy alta.
2
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4TRANSFORMACIÓN DE
OBSERVACIONESLas transformaciones mLas transformaciones máás comunes son las s comunes son las
logarlogaríítmicas, tanto en base 10 como logaritmo tmicas, tanto en base 10 como logaritmo neperiano aunque hay que tener cuidado con neperiano aunque hay que tener cuidado con los valores iguales a cero.los valores iguales a cero.
Las transformaciones logarLas transformaciones logaríítmicas se emplean tmicas se emplean con frecuencia cuando se trata de valores de con frecuencia cuando se trata de valores de laboratorio que tienen distribucilaboratorio que tienen distribucióón sesgada o n sesgada o cuando hay mucha dispersicuando hay mucha dispersióón.n.
Otra transformaciOtra transformacióón, menos utilizada, es la ran, menos utilizada, es la raííz z cuadrada.cuadrada.
2
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4
MÉTODOS NO PARAMÉTRICOS
Son pruebas estadSon pruebas estadíísticas que no genera sticas que no genera premisas sobre la distribucipremisas sobre la distribucióón de las n de las observaciones.observaciones.
Usar la prueba t requiere que se dUsar la prueba t requiere que se déé por supuesto por supuesto que las diferencias siguen una distribucique las diferencias siguen una distribucióón n normal, lo cual es especialmente importante normal, lo cual es especialmente importante cuando los tamacuando los tamañños de muestra son os de muestra son pequepequeñños (n<30).os (n<30).
2
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4
MÉTODOS NO PARAMÉTRICOS
La mayorLa mayoríía de los a de los testtest no no paramparaméétricostricos implican implican el anel anáálisis del rango de los datos por lo que no lisis del rango de los datos por lo que no se utilizan los valores de la muestra.se utilizan los valores de la muestra.
2
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4
MÉTODOS NO PARAMÉTRICOS
Variable dependiente: cualitativa dicotVariable dependiente: cualitativa dicotóómica.mica.
Variable independiente: cuantitativa.Variable independiente: cuantitativa.
--Para un solo grupo:Para un solo grupo:
Variables independientes.Variables independientes.
--testtest de la prueba de signo.de la prueba de signo.
2
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4
MÉTODOS NO PARAMÉTRICOS
Variable dependiente: cualitativa dicotVariable dependiente: cualitativa dicotóómica.mica.
Variable independiente: cuantitativa.Variable independiente: cuantitativa.
--Para un solo grupo:Para un solo grupo:
Variables independientes.Variables independientes.
--testtest de la prueba de signo.de la prueba de signo.
Variables dependientes:Variables dependientes:
--teststests de la prueba de signo aplicado a la de la prueba de signo aplicado a la diferencia (de medias, proporcidiferencia (de medias, proporcióón,n,……))
--prueba de prueba de WilcoxonWilcoxon (U(U--MannMann WhitneyWhitney))
2
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4
MÉTODOS NO PARAMÉTRICOS
Se recomienda la prueba de Se recomienda la prueba de WilcoxonWilcoxon por por encima de la prueba de signo para encima de la prueba de signo para comparaciones pareadas, por ser mcomparaciones pareadas, por ser máás s potente.potente.
2
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4
VARIOS GRUPOS
La alternativa no La alternativa no paramparaméétricatrica al ANOVA es el al ANOVA es el contraste de contraste de KruskalKruskal--WallisWallis..
Sirve para contrastar la hipSirve para contrastar la hipóótesis de que k tesis de que k muestras alternativas provienen de la misma muestras alternativas provienen de la misma poblacipoblacióón.n.
En el caso de existir diferencias podemos hacer En el caso de existir diferencias podemos hacer comparaciones a posteriori.comparaciones a posteriori.
2
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4
RESUMEN
�� Denominamos variables cualitativas a Denominamos variables cualitativas a aquellas cuyo resultado es un valor o aquellas cuyo resultado es un valor o categorcategoríía de entre un conjunto finito de a de entre un conjunto finito de respuestas.respuestas.
�� El sexo, el estado civil o el grupo sanguEl sexo, el estado civil o el grupo sanguííneo neo son ejemplos de variables cualitativasson ejemplos de variables cualitativas
2
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4
Guadalupe Ruiz Merino Guadalupe Ruiz Merino -- Curso de Fundamentos de BioestadCurso de Fundamentos de Bioestadíísticastica
Tablas de contingenciaAnálisis de residuos
Tests estadísticos
Tablas de contingenciaTablas de contingenciaAnAnáálisis de residuoslisis de residuos
TestsTests estadestadíísticos sticos
SESISESIÓÓNN IIIIII
3
1 2 3 4
CONSTRUCCIÓN DE UNA TABLA DE CONTINGENCIA
�� Para analizar la relaciPara analizar la relacióón de dependencia o n de dependencia o independencia entre dos variables cualitativas independencia entre dos variables cualitativas es necesario estudiar su distribucies necesario estudiar su distribucióón conjunta o n conjunta o tabla de contingencia.tabla de contingencia.
�� Tabla de contingenciaTabla de contingencia : Tabla de doble : Tabla de doble entrada donde en cada casilla figura el nentrada donde en cada casilla figura el núúmero mero de individuos que posee esas caracterde individuos que posee esas caracteríísticas.sticas.
3
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4
CONSTRUCCIÓN DE UNA TABLA DE CONTINGENCIA
EJEMPLO:EJEMPLO:
�� Estudiar la relaciEstudiar la relacióón entre el sexo y el hn entre el sexo y el háábito bito de fumar.de fumar.
�� Entre el grupo sanguEntre el grupo sanguííneo y la posibilidad de neo y la posibilidad de rechazar un trasplante.rechazar un trasplante.
�� Entre la prEntre la prááctica de ejercicio y el riesgo de ctica de ejercicio y el riesgo de infarto.infarto.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
3
1 2 3 4CONTRASTE DE HIPÓTESIS
Ejemplo:Ejemplo:
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
3
233233125125108108MARGINALMARGINAL
11011067674343NONO
12312358586565SI SI
MARGINALMARGINALMUJERMUJERHOMBREHOMBRE
1 2 3 4
CONSTRUCCIÓN DE UNA TABLA DE CONTINGENCIA
OBJETIVOS:OBJETIVOS:Las tablas de contingencia tienen dos objetivos Las tablas de contingencia tienen dos objetivos
fundamentales:fundamentales:
1.1.-- Organizar la informaciOrganizar la informacióón, cuando estn, cuando estááreferida a factores.referida a factores.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
3
1 2 3 4
CONSTRUCCIÓN DE UNA TABLA DE CONTINGENCIA
OBJETIVOS:OBJETIVOS:
2.2.--Analizar si existe alguna relaciAnalizar si existe alguna relacióón de n de dependencia o independencia entre los niveles dependencia o independencia entre los niveles de las variables objeto de estudio.de las variables objeto de estudio.
El hecho de que dos variables sean El hecho de que dos variables sean independientes significa que los valores de una independientes significa que los valores de una de ellas no estde ellas no estáán influidos por la otra.n influidos por la otra.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
3
1 2 3 4
CONSTRUCCIÓN DE UNA TABLA DE CONTINGENCIA
En los ejemplos anteriores:En los ejemplos anteriores:
�� ¿¿Influye el sexo en el hInfluye el sexo en el háábito de fumar?bito de fumar?
�� ¿¿Tienen mTienen máás posibilidades los de un cierto s posibilidades los de un cierto grupo sangugrupo sanguííneo de rechazar un trasplante?neo de rechazar un trasplante?
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
3
1 2 3 4
CONTRASTE DE HIPÓTESIS
�� Para identificar relaciones entre variables Para identificar relaciones entre variables cualitativas se utiliza el cualitativas se utiliza el testtest estadestad íístico de la stico de la ChiChi --cuadradocuadrado ..
�� Para las tablas 2x2 el Para las tablas 2x2 el testtest de de FisherFisher..
�� La hipLa hipóótesis que plantearemos sertesis que plantearemos seráá�� H0: independenciaH0: independencia�� H1: dependenciaH1: dependencia
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
3
1 2 3 4
CONTRASTE DE HIPÓTESIS
�� El resultado nos permitirEl resultado nos permitiráá afirmar con un nivel afirmar con un nivel de confianza que nosotros determinaremos si de confianza que nosotros determinaremos si los niveles de una variable influyen en los los niveles de una variable influyen en los niveles de la otra.niveles de la otra.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
3
1 2 3 4CONTRASTE DE HIPÓTESIS
DefiniciDefinicióón:n:
Frecuencia: NFrecuencia: Núúmero de veces que se presenta un valor dado mero de veces que se presenta un valor dado de una observacide una observacióón.n.
nnijij=n=nºº observaciones de la fila i y la columna j.observaciones de la fila i y la columna j.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
3
nn....nn.2.2nn.1.1MARGINALMARGINAL
NN2.2.nn2222nn2121NONO
nn1.1.nn1212nn1111SI SI
MARGINALMARGINALMUJERMUJERHOMBREHOMBRE
1 2 3 4
CONTRASTE DE HIPÓTESIS
�� El razonamiento para contrastar si existe o no El razonamiento para contrastar si existe o no asociaciasociacióón entre dos variables cualitativas se n entre dos variables cualitativas se basa en basa en calcularcalcular cucuáál serl seríían los valores de an los valores de frecuencia esperados para cada una de las frecuencia esperados para cada una de las celdas en el caso de que efectivamente las celdas en el caso de que efectivamente las variables fuesen independientes y variables fuesen independientes y compararloscompararloscon los valores realmente observados.con los valores realmente observados.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
3
1 2 3 4
CONTRASTE DE HIPÓTESIS
�� Si no existe mucha diferencia entre ambos no Si no existe mucha diferencia entre ambos no hay razones para dudar de que las variables hay razones para dudar de que las variables sean independientes.sean independientes.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
3
1 2 3 4
CONTRASTE DE HIPÓTESIS
�� Una vez que hayamos hecho los cUna vez que hayamos hecho los cáálculos, lculos, obtendremos un obtendremos un nivel de significacinivel de significaci óónn , , e.de.d, la , la probabilidad de equivocarnos si rechazamos la probabilidad de equivocarnos si rechazamos la hiphipóótesis nula.tesis nula.
�� Si es Si es p<0.05p<0.05 rechazamos la hiprechazamos la hipóótesis nula y decimos tesis nula y decimos que las variables son dependientes.que las variables son dependientes.
�� Si es Si es p>0.05p>0.05 no podrno podrííamos rechazar H0 porque la amos rechazar H0 porque la probabilidad de equivocarnos serprobabilidad de equivocarnos seríía muy alta.a muy alta.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
3
1 2 3 4
CONTRASTE DE HIPÓTESIS
PROBLEMASPROBLEMAS
1.1.-- La ChiLa Chi--cuadaradocuadarado estestáá influenciada por el influenciada por el tamatama ñño o muestralmuestral . .
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
3
A mayor nA mayor núúmero de casos analizados el valor de mero de casos analizados el valor de la Chila Chi--cuadrado tiende a aumentar por lo que si cuadrado tiende a aumentar por lo que si la muestra es excesivamente grande mla muestra es excesivamente grande máás fs fáácil cil serseráá que rechacemos la hipque rechacemos la hipóótesis nula de tesis nula de independencia cuando a lo mejor podrindependencia cuando a lo mejor podríían ser an ser independientes.independientes.
1 2 3 4
CONTRASTE DE HIPÓTESIS
Si no fuera asSi no fuera asíí::
�� Se agrupan filas o columnas (excepto tablas 2x2).Se agrupan filas o columnas (excepto tablas 2x2).
�� Se elimina la fila que da la frecuencia <5Se elimina la fila que da la frecuencia <5
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
3
PROBLEMASPROBLEMAS
2.2.-- En cada celda de la tabla deberEn cada celda de la tabla deberáá existir un existir un mmíínimo nimo de 5 observaciones esperadasde 5 observaciones esperadas . .
1 2 3 4CONTRASTE DE HIPÓTESIS
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
3
PROBLEMASPROBLEMAS
774433OCASIONALMENTEOCASIONALMENTE
282810101818NONO
444432321212SI SI
MARGINALMARGINALMUJERMUJERHOMBREHOMBRE
1 2 3 4
CONTRASTE DE HIPÓTESIS
�� Se aplica la Se aplica la correccicorrecci óón de Yates.n de Yates.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
3
PROBLEMASPROBLEMAS
2.2.-- ¿¿Y si la tabla es de 2x2?Y si la tabla es de 2x2?
1 2 3 4
CONTRASTE DE HIPÓTESIS
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
3
PROBLEMASPROBLEMAS
3.3.-- La ChiLa Chi--cuadrado permite contrastar la hipcuadrado permite contrastar la hipóótesis de tesis de independencia pero independencia pero en el caso de que se rechace en el caso de que se rechace dicha hipdicha hip óótesistesis no dice nada sobre la fuerza de la no dice nada sobre la fuerza de la asociaciasociacióón entre las variables estudiadas.n entre las variables estudiadas.
1 2 3 4
MEDIDAS DE ASOCIACIÓN
�� Las medidas de asociaciLas medidas de asociacióón distinguen entre n distinguen entre que las variables sean ordinales o nominales.que las variables sean ordinales o nominales.
�� Las Las medidas de asociacimedidas de asociaci óón nominalesn nominales ssóólo lo informan del grado de asociaciinforman del grado de asociacióón existente n existente pero no de la direccipero no de la direccióón.n.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
3
1 2 3 4
MEDIDAS DE ASOCIACIÓN
�� Las Las medidas de asociacimedidas de asociaci óón ordinalesn ordinalesaportan informaciaportan informacióón sobre la direccin sobre la direccióón de la n de la relacirelacióón, pudiendo tomar tanto valores n, pudiendo tomar tanto valores positivos como negativos.positivos como negativos.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
3
1 2 3 4
MEDIDAS DE ASOCIACIÓN
�� Valores positivosValores positivos significa que existe una significa que existe una relacirelacióón directa entre las variables, valores n directa entre las variables, valores altos de una se corresponden con valores altos de una se corresponden con valores altos de la otra y al contrario.altos de la otra y al contrario.
�� Valores negativosValores negativos implica una relaciimplica una relacióón n inversa, inversa, e.de.d, valores altos de una variable se , valores altos de una variable se corresponden con valores bajos de la otra y al corresponden con valores bajos de la otra y al contrario.contrario.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
3
1 2 3 4
RESIDUOS
�� Los residuos son calculados como la Los residuos son calculados como la diferencia entre la frecuencia observada y diferencia entre la frecuencia observada y esperadaesperada en cada casilla. en cada casilla.
�� Son muy Son muy úútiles para interpretar las tiles para interpretar las relacionesrelaciones que se observan en la tabla.que se observan en la tabla.
�� Los residuos tipificados indican que la Los residuos tipificados indican que la diferencia entre las frecuencias es elevada diferencia entre las frecuencias es elevada cuando su valor es superior a 1.96 cuando su valor es superior a 1.96 óó inferior a inferior a --1.96.1.96.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
3
1 2 3 4
RESIDUOS
�� Un residuo tipificado mayor a 1.96 en valor Un residuo tipificado mayor a 1.96 en valor absoluto en una casilla indica que hay mabsoluto en una casilla indica que hay máás s casos, si es positivo, o menos, si es negativo, casos, si es positivo, o menos, si es negativo, de los que deberde los que deberíía haber en esa casilla si las a haber en esa casilla si las variables fueran independientes.variables fueran independientes.
�� Un valor comprendido entre Un valor comprendido entre ±± 1.96 indica que 1.96 indica que la diferencia es pequela diferencia es pequeñña por lo que las a por lo que las variables en esa casilla son independientes.variables en esa casilla son independientes.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
3
1 2 3 4
USO EXCESIVO
Debido a que la prueba ChiDebido a que la prueba Chi--cuadrado es fcuadrado es fáácil de cil de entender y calcular en ocasiones se utiliza entender y calcular en ocasiones se utiliza cuando es mcuando es máás apropiado otro ms apropiado otro méétodo.todo.
Por ejemplo: Cuando se analizan dos grupos y Por ejemplo: Cuando se analizan dos grupos y las caracterlas caracteríísticas de intersticas de interéés se miden en s se miden en escala numescala numéérica.rica.
Cuando los correcto es aplicar la prueba tCuando los correcto es aplicar la prueba t--Student,conviertenStudent,convierten la escala numla escala numéérica en una rica en una ordinal o incluso binaria.ordinal o incluso binaria.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
3
1 2 3 4
USO EXCESIVO
Ejemplo:Ejemplo:
Pacientes de una intervenciPacientes de una intervencióón tienen mayor probabilidad n tienen mayor probabilidad de padecer complicaciones que otros.de padecer complicaciones que otros.
Se recogen datos de pacientes que sufrieron Se recogen datos de pacientes que sufrieron complicaciones y de otros pacientes que no las complicaciones y de otros pacientes que no las sufrieron.sufrieron.
Los investigadores querLos investigadores queríían saber si existe relacian saber si existe relacióón entre la n entre la edad y la probabilidad de tener edad y la probabilidad de tener complicacicomplicacióónesnes..
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
3
1 2 3 4
USO EXCESIVO
Ejemplo:Ejemplo:Formaron una tabla de Formaron una tabla de contingeniacontingenia 2x2 y 2x2 y
agruparon la edad en agruparon la edad en ≤≤45 o >45.45 o >45.
Los investigadores emplearon la prueba de Los investigadores emplearon la prueba de chichi--cuadrado para la independencia y los cuadrado para la independencia y los resultados indicaron que no habresultados indicaron que no habíía relacia relacióón n entre la edad y la presencia de entre la edad y la presencia de complicaciones.complicaciones.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
3
1 2 3 4
USO EXCESIVO
¿¿DDóónde estnde estáá el error?el error?
En la selecciEn la seleccióón arbitraria de los 45 an arbitraria de los 45 añños como os como punto de corte para la edad.punto de corte para la edad.
Y en usar una prueba de forma incorrecta.Y en usar una prueba de forma incorrecta.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
3
1 2 3 4
USO EXCESIVO
Cuando las variables numCuando las variables numééricas se analizan con ricas se analizan con mméétodos disetodos diseññados para variables categados para variables categóóricas ricas u ordinales, se pierde la mayor especificidad u ordinales, se pierde la mayor especificidad de las mediciones numde las mediciones numééricas.ricas.
Antes de hacerlo hay que investigar si las Antes de hacerlo hay que investigar si las categorcategoríías son correctas.as son correctas.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
3
1 2 3 4
McNemar
Una variante de las tablas longitudinales es Una variante de las tablas longitudinales es medir una misma variable dicotmedir una misma variable dicotóómica mica (tratamiento(tratamiento--no tratamiento, rechazono tratamiento, rechazo--no no rechazo) en dos momentos temporales rechazo) en dos momentos temporales distintos.distintos.
Resulta especialmente Resulta especialmente úútil para medir el cambio.til para medir el cambio.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
3
1 2 3 4
McNemar
Se toma una medida de una variable dicotSe toma una medida de una variable dicotóómica, mica, se aplica el tratamiento ( o se deja pasar el se aplica el tratamiento ( o se deja pasar el tiempo) y se vuelve a tomar una medida de la tiempo) y se vuelve a tomar una medida de la misma variable en los mismos sujetos.misma variable en los mismos sujetos.
Se contrasta la hipSe contrasta la hipóótesis de igualdad de tesis de igualdad de proporciones antes y despuproporciones antes y despuéés.s.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
3
1 2 3 4
Guadalupe Ruiz Merino Guadalupe Ruiz Merino -- Curso de Fundamentos de BioestadCurso de Fundamentos de Bioestadíísticastica
CorrelaciónRegresión Lineal Simple
CorrelaciCorrelacióónnRegresiRegresióón Lineal Simplen Lineal Simple
SESISESIÓÓN IVN IV
4
1 2 3 4
Correlación
�� Se considera que dos variables Se considera que dos variables cuantitativascuantitativasestestáán relacionadas entre sn relacionadas entre síí cuando cuando
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
4
los valores de una de ellas varlos valores de una de ellas var íían an de forma sistemde forma sistem áática conforme a tica conforme a los valores de la otra.los valores de la otra.
1 2 3 4
Correlación
�� El El coeficiente de correlacicoeficiente de correlaci óón de n de PearsonPearson es es un un ííndice estadndice estadíístico que permite definir de stico que permite definir de forma mforma máás concisa la relacis concisa la relacióón entre las n entre las variables.variables.
�� Es una medida de la relaciEs una medida de la relacióón lineal entre dos n lineal entre dos variables medidas con escala numvariables medidas con escala numéérica.rica.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
4
1 2 3 4
Correlación
�� Su resultado es un valor que fluctSu resultado es un valor que fluctúúa entre a entre --1 1 (relaci(relacióón perfecta en sentido negativo) y +1 n perfecta en sentido negativo) y +1 (relaci(relacióón perfecta en sentido positivo).n perfecta en sentido positivo).
�� Cuanto mCuanto máás cercanos a 0 sean los valores s cercanos a 0 sean los valores significarsignificaráá una relaciuna relacióón mn máás ds déébil o incluso bil o incluso ausencia de relaciausencia de relacióón.n.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
4
1 2 3 4
Correlación
�� El valor del coeficiente de correlaciEl valor del coeficiente de correlacióón estn estáá muy muy influenciado por los valores extremos, igual que influenciado por los valores extremos, igual que la desviacila desviacióón estn estáándar. Por tanto la correlacindar. Por tanto la correlacióón n no describe bien la relacino describe bien la relacióón entre dos variables n entre dos variables cuando cada una de ellas tiene valores cuando cada una de ellas tiene valores extremos.extremos.
�� En estos casos debe hacerse una En estos casos debe hacerse una transformacitransformacióón de los datos o usarse la n de los datos o usarse la correlacicorrelacióón de n de SpearmanSpearman..
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
4
1 2 3 4
Correlación
�� Finalmente, correlaciFinalmente, correlacióón no es igual a causa. n no es igual a causa.
�� El juicio de que una caracterEl juicio de que una caracteríística causa otra stica causa otra debe justificarse con argumentos no sdebe justificarse con argumentos no sóólo con el lo con el coeficiente de correlacicoeficiente de correlacióón.n.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
4
1 2 3 4
Coeficiente de Pearson
Valores:Valores:
Perfecta Perfecta R=1R=1
Excelente Excelente 0.9<R<10.9<R<1
Buena Buena 0.8<R<0.90.8<R<0.9
Regular Regular 0.5<R<0.8 0.5<R<0.8
Mala Mala R<0.5R<0.5
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
4
1 2 3 4
Diagramas de dispersión
Un diagrama de dispersiUn diagrama de dispersióón ofrece una idea n ofrece una idea bastante aproximada sobre el tipo de relacibastante aproximada sobre el tipo de relacióón n existente entre dos variables.existente entre dos variables.
Un diagrama de dispersiUn diagrama de dispersióón tambin tambiéén puede n puede utilizarse como una forma de cuantificar el utilizarse como una forma de cuantificar el grado de relacigrado de relacióón lineal existente entre dos n lineal existente entre dos variables.variables.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
4
1 2 3 4
Coeficiente de Coeficiente de PearsonPearson
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
4
1 2 3 4
Coeficiente de Coeficiente de PearsonPearson
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
4
1 2 3 4
Diagramas de dispersión
�� El diagrama de dispersiEl diagrama de dispersióón permite formarse una n permite formarse una primera impresiprimera impresióón sobre el tipo de relacin sobre el tipo de relacióón n existente entre variables.existente entre variables.
�� Intentar cuantificar esa relaciIntentar cuantificar esa relacióón tiene n tiene inconvenientes porque la relaciinconvenientes porque la relacióón entre dos n entre dos variables no siempre es perfecta o nula. variables no siempre es perfecta o nula. Normalmente ni lo uno ni lo otro.Normalmente ni lo uno ni lo otro.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
4
1 2 3 4
Regresión
�� Una vez que sabemos que estUna vez que sabemos que estáán relacionadas.n relacionadas.
�� ¿¿QuQuéé tipo de relacitipo de relacióón tiene?n tiene?
�� Para esto utilizamos Para esto utilizamos los modelos de regresilos modelos de regresi óónn
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
4
1 2 3 4
Diagramas de dispersión
�� El diagrama de dispersiEl diagrama de dispersióón permite formarse una n permite formarse una primera impresiprimera impresióón sobre el tipo de relacin sobre el tipo de relacióón n existente entre variables.existente entre variables.
�� Intentar cuantificar esa relaciIntentar cuantificar esa relacióón tiene n tiene inconvenientes porque la relaciinconvenientes porque la relacióón entre dos n entre dos variables no siempre es perfecta o nula. variables no siempre es perfecta o nula. Normalmente ni lo uno ni lo otro.Normalmente ni lo uno ni lo otro.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
4
1 2 3 4
Regresión
�� La regresiLa regresióón como tn como téécnica estadcnica estadíística analiza stica analiza la la relacirelaci óón de dos o mn de dos o m áás variables s variables contcont íínuasnuas ..
�� La regresiLa regresióón se utiliza para n se utiliza para inferir datos a inferir datos a partir de otrospartir de otros y hallar una respuesta a lo y hallar una respuesta a lo que pueda suceder.que pueda suceder.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
4
1 2 3 4
Correlación-Regresión
DIFERENCIAS:DIFERENCIAS:
--La correlaciLa correlacióón es independiente de la escala pero no la n es independiente de la escala pero no la regresiregresióón.n.
Ejemplo:Ejemplo:
La correlaciLa correlacióón entre estatura y peso es la misma sin n entre estatura y peso es la misma sin importar que la estatura se mida en metros o importar que la estatura se mida en metros o centcentíímetros.metros.
Sin embargo la ecuaciSin embargo la ecuacióón de regresin de regresióón entre el peso y la n entre el peso y la estatura depende de las unidades que utilicemos.estatura depende de las unidades que utilicemos.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
4
1 2 3 4
Correlación-Regresión
SIMILITUDES:SIMILITUDES:
La pendiente de la lLa pendiente de la líínea de regresinea de regresióón tiene el mismo n tiene el mismo signo que el coeficiente de correlacisigno que el coeficiente de correlacióón.n.
La correlaciLa correlacióón y la regresin y la regresióón sn sóólo describen relaciones lo describen relaciones lineales.Silineales.Si los coeficientes de correlacilos coeficientes de correlacióón y las n y las ecuaciones de regresiecuaciones de regresióón se calculan a ciegas, sin n se calculan a ciegas, sin examinar las grexaminar las grááficas, los investigadores pasarficas, los investigadores pasaráán por n por alto relaciones muy estrechas pero no lineales.alto relaciones muy estrechas pero no lineales.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
4
1 2 3 4
Regresión
�� Las Las variablesvariables del modelo de regresidel modelo de regresióón deben ser n deben ser cuantitativascuantitativas ..
�� Dada la robustez de la regresiDada la robustez de la regresióón es frecuente n es frecuente encontrar incluidas como variable independiente encontrar incluidas como variable independiente variables nominales transformadas.variables nominales transformadas.
�� La La variable dependientevariable dependiente debe ser debe ser siempre siempre cuantitativa.cuantitativa.
�� Robustez:Robustez: un estadun estadíístico se dice que es robusto stico se dice que es robusto cuando es vcuando es váálido aunque no se cumpla alguno de lido aunque no se cumpla alguno de sus supuestos.sus supuestos.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
4
1 2 3 4
Regresión
Se pueden encontrar distintos Se pueden encontrar distintos tipos de regresitipos de regresi óónn ::
�� RegresiRegresióón Linealn Lineal
�� RegresiRegresióón Mn Múúltipleltiple
�� RegresiRegresióón Logn Logíísticastica
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
4
1 2 3 4
Regresión Lineal
�� Consideremos una variable aleatoria Consideremos una variable aleatoria respuesta Yrespuesta Y , , relacionada con otra variable que llamaremos relacionada con otra variable que llamaremos explicativa Xexplicativa X ..
�� Supongamos una Supongamos una muestra de n individuosmuestra de n individuos para para los que se conocen los valores de ambas variables.los que se conocen los valores de ambas variables.
�� Hacer una Hacer una representacirepresentaci óón grn gr ááficafica ::
en el eje X la variable explicativa, en el en el eje X la variable explicativa, en el Y la respuesta.Y la respuesta.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
4
1 2 3 4
Regresión Lineal
�� En el caso de la RegresiEn el caso de la Regresióón Lineal el n Lineal el objetivoobjetivo es es encontrar una recta que se ajuste a la nube de encontrar una recta que se ajuste a la nube de puntos.puntos.
�� A partir de esa recta podemos A partir de esa recta podemos usar los valores usar los valores de X para predecir los de Yde X para predecir los de Y ..
�� Normalmente se utiliza el Normalmente se utiliza el ““ mméétodo de los todo de los mmíínimos cuadradosnimos cuadrados ”” que minimiza la distancia que minimiza la distancia de las observaciones a la recta.de las observaciones a la recta.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
4
1 2 3 4
Regresión Lineal
�� En el caso de la RegresiEn el caso de la Regresióón Lineal el n Lineal el objetivoobjetivo es es encontrar una recta que se ajuste a la nube de encontrar una recta que se ajuste a la nube de puntos.puntos.
�� A partir de esa recta podemos A partir de esa recta podemos usar los valores usar los valores de X para predecir los de Yde X para predecir los de Y ..
�� Normalmente se utiliza el Normalmente se utiliza el ““ mméétodo de los todo de los mmíínimos cuadradosnimos cuadrados ”” que minimiza la distancia que minimiza la distancia de las observaciones a la recta.de las observaciones a la recta.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
4
1 2 3 4
Regresión Lineal
�� Una recta tiene una ecuaciUna recta tiene una ecuacióón muy simple:n muy simple:
Y=a+Y=a+bXbX..
HabrHabríía que calcular los coeficientes a que calcular los coeficientes a,ba,b..
a es la pendiente de la recta.a es la pendiente de la recta.
b el punto en que la recta corta el eje vertical.b el punto en que la recta corta el eje vertical.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
4
1 2 3 4
Regresión Lineal
�� Conociendo los valores de estos dos coeficientes Conociendo los valores de estos dos coeficientes podrpodrííamos reproducir la recta y describir con ella amos reproducir la recta y describir con ella la relacila relacióón entre las variables.n entre las variables.
�� AdemAdemáás de representar la recta con su fs de representar la recta con su fóórmula rmula tambitambiéén es n es úútil disponer de alguna informacitil disponer de alguna informacióón n sobre el grado en que la recta se ajusta a la nube sobre el grado en que la recta se ajusta a la nube de puntos.de puntos.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
4
1 2 3 4
Bondad de ajuste
�� Una medida de ajuste muy aceptada es el coeficiente de Una medida de ajuste muy aceptada es el coeficiente de determinacideterminacióón Rn R22:cuadrado del coeficiente de correlaci:cuadrado del coeficiente de correlacióón n lineal.lineal.
�� Una medida RUna medida R22=0.86, significar=0.86, significaríía que la recta explica un a que la recta explica un 86% de la variabilidad de Y en funci86% de la variabilidad de Y en funcióón de X.n de X.
�� Se trata de una medida estandarizada que toma valores Se trata de una medida estandarizada que toma valores entre 0 y 1.entre 0 y 1.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
4