IntroducciónProbabilidad, estadística e inferencia científica
Marco PavesiSenior EpidemiologistCIS Clinical EpidemiologyNovartis Farmacéutica S.A.
Mayo-2007 M.Pavesi: inferencia y estadística 2
Intro: hace 2.500 años…
• Antístenes: “…yo veo estos caballos, blancos, negros, grises……¡¡pero la ‘caballinidad’ no la he visto nunca!!”
• Platón: “Cierto, porque tienes los ojos del cuerpo para ver los caballos blancos y negros, pero los ojos de la mente para ver la idea de ‘caballo’ no los tienes…”
Mayo-2007 M.Pavesi: inferencia y estadística 3
Intro: el método científico (I)
En el siglo XIV, los científicos empezaron a darle la razón al pobre filósofo ridiculizado por Platón:
• La ciencia se basa en EXPERIENCIAS OBJETIVAS
• ‘Experiencia objetiva’ significa OBSERVACIONES PÚBLICAS (intersubjetivas) y REPETIBLES
Mayo-2007 M.Pavesi: inferencia y estadística 4
Intro: el método científico (II)
Otras características de la ciencia moderna son:
• EL RIGOR metodológico
• La MODELIZACIÓN de la realidad
• La importancia vital del ERROR en el desarrollo científico
Mayo-2007 M.Pavesi: inferencia y estadística 5
El arco del conocimiento
Experiencia: datos Predicciones: datos
Inducción Deducción
TEORÍA Hipótesis
Mayo-2007 M.Pavesi: inferencia y estadística 6
InducciónLa parte ascendiente del “arco” se basa en el
PRINCIPIO DE INDUCCIÓN:
X1 ==> Y1
X2 ==> Y2
…..
Xn ==> Yn
X ==> Y
Mayo-2007 M.Pavesi: inferencia y estadística 7
Inducción y Verdad
Bertrand Russell presenta…
El pavo inductivista
Mayo-2007 M.Pavesi: inferencia y estadística 8
Problemas para el inductivista “pavo”
1) …cree que el resultado observado en una muestra de la población es verdadero para la población.
2) …cree que la inducción es el método científico para demostrar la verdad
3) …cree que la estadística es el instrumento para llegar a esta demostración “matemática”
Mayo-2007 M.Pavesi: inferencia y estadística 9
Problemas para el inductivista “pavo”
Resultado...
Mayo-2007 M.Pavesi: inferencia y estadística 10
El inductivista “sofisticado”
1) …reconoce que las inferencias científicas siempre tienen un “valor” que depende del nº de observaciones realizadas (tamaño de la muestra).
Mayo-2007 M.Pavesi: inferencia y estadística 11
El inductivista “sofisticado”
2) …sabe que solo es posible APROXIMAR / MODELIZAR / ESTIMAR la realidad y que cada estimación tiene su margen de error.
Mayo-2007 M.Pavesi: inferencia y estadística 12
El inductivista “sofisticado”
3) …sabe que no existen hipótesis verdaderas, pero podemos rechazar una hipótesis y aceptar otra en función de las “evidencias” de las que disponemos.
Mayo-2007 M.Pavesi: inferencia y estadística 13
Karl Popper: gorilas y contrastes de hipótesis
Hipótesis: todos los gorilas son negros
C1 ==> negro
C2 ==> negro
...
Cn ==> ‘Copito de nieve’
Rechazo la hipótesis inicial
No es posible verificar una hipótesis, pero sí es posible
rechazarla a partir de un número suficiente de evidencias
contrarias
Mayo-2007 M.Pavesi: inferencia y estadística 14
Cualquier tipo de conocimiento de las ciencias naturales (empíricas) es probabilístico:
• Se aproxima la realidad con una determinada precisión
• Se acepta un determinado margen de error para cualquier aproximación
• No se “demuestra” una hipótesis, se descarta (con un margen de error) la hipótesis contraria.
Desplazamiento probabilístico
Mayo-2007 M.Pavesi: inferencia y estadística 15
Probabilidades directas e inversas
• “Sé (asumo) que este dado no está trucado: ¿qué probabilidad tengo de sacar siempre un 1 en 15 jugadas seguidas”
==> CÁLCULO (matemáticas)
• “He sacado siempre 1 en 15 jugadas seguidas.
¿Estará trucado el dado?
==> ESTADÍSTICA (inferencial)
Mayo-2007 M.Pavesi: inferencia y estadística 16
Estadística inferencial y cálculo de probabilidades
Experiencia: datos Probabilidades (frecuencias)
Inducción Deducción
HIPÓTESIS/TEORÍA
Cálculo de probabilidades
Estadística inferencial
Mayo-2007 M.Pavesi: inferencia y estadística 17
La estadística en los contrastes de hipótesis
Únicamente se tiene en cuenta la información
experimental (muestral)
PUNTOS FUERTES: Objetividad de los datos.
Métodos (relativamente) sencillos.
PUNTOS DÉBILES: no conocemos la probabilidad de
una hipótesis o de un resultado, sino la probabilidad
del resultado observado asumiendo H0.
Mayo-2007 M.Pavesi: inferencia y estadística 18
Contrastes de hipótesis (I)
Hipótesis de trabajo del investigador:
El fármaco F es eficaz para reducir de forma
clínicamente relevante la TAS después de “x” días
de tratamiento
Mayo-2007 M.Pavesi: inferencia y estadística 19
Contrastes de hipótesis (II)
Hipótesis nula (H0): el fármaco F no tiene ningún
efecto sobre la tensión arterial sistólica
…¿qué significa “efecto cero”?
H0 para el estadístico: la diferencia entre el fármaco F
y un placebo en la reducción de la TAS después de
“x” días de tratamiento es inferior o igual a 10 mm
Hg (diferencia CLÍNICAMENTE RELEVANTE)
Mayo-2007 M.Pavesi: inferencia y estadística 20
Contrastes de hipótesis (III)
Hipótesis alternativa (H1): la diferencia entre el
fármaco F y un placebo en la reducción de la TAS
después de “x” días de tratamiento es mayor de 10
mm Hg (diferencia CLÍNICAMENTE
RELEVANTE)
Mayo-2007 M.Pavesi: inferencia y estadística 21
Contrastes de hipótesis (IV)
Ingredientes:
• Mínima diferencia clínicamente relevante (Delta)
• Márgenes de error del contraste de hipótesis
• Poder estadístico del contraste
• Tamaño de la muestra (representativa de la
población): la “N” depende de todo lo anterior
Mayo-2007 M.Pavesi: inferencia y estadística 22
Un pequeño margen de error... α
En cada contraste de hipótesis asumimos 2 riesgos:
El RIESGO α (error Tipo I):
• Probabilidad de observar Delta y rechazar H0
cuando, en realidad, H0 es verdadera.
• Porcentaje de resultados FALSOS POSITIVOS
que decidimos asumir.
Mayo-2007 M.Pavesi: inferencia y estadística 23
Un pequeño margen de error... β
En cada contraste de hipótesis asumimos 2 riesgos:
El RIESGO β (error Tipo II):
• probabilidad de NO llegar a observar Delta y
aceptar H0 cuando, en realidad, H1 es verdadera.
• Porcentaje de resultados FALSOS NEGATIVOS
que decidimos asumir.
Mayo-2007 M.Pavesi: inferencia y estadística 24
Un gran poder...estadístico
El PODER ESTADÍSTICO (P = 1-β):
• es la probabilidad de acertar cuando rechazamos H0
• puede interpretarse como el VALOR PREDICTIVO
DE LA PRUEBA PARA LOS RESULTADOS
POSITIVOS.
Mayo-2007 M.Pavesi: inferencia y estadística 25
Errores en un contraste de hipótesis
Realidad
H0 cierta H0 falsa
Resultado de la prueba estadística
p<α(rechazo H0)
Error tipo I (α)
Poder estadístico
(1- β)p≥α
(no rechazo H0)No error Error tipo II
(β)
Mayo-2007 M.Pavesi: inferencia y estadística 26
Y por fin...…la “p” ! (1)
El VALOR DE SIGNIFICACIÓN (p-value):
• Es la probabilidad de observar un resultado como el
que hemos observado en la muestra cuando, en la
realidad, H0 es verdadera.
….es decir, la PROBABILIDAD DE OBSERVAR
ESTE RESULTADO ÚNICAMENTE POR AZAR.
Mayo-2007 M.Pavesi: inferencia y estadística 27
Y por fin...…la “p” ! (2)
El VALOR DE SIGNIFICACIÓN (p-value):
• es un índice de la EVIDENCIA del resultado
observado, de cuanto es FIABLE el resultado
comparado con su variabilidad.
Mayo-2007 M.Pavesi: inferencia y estadística 28
Y por fin...…la “p” ! (3)
• valor de significación GRANDE =
PROBABILIDAD ELEVADA de que el resultados
obtenido se deba al AZAR.
P = 0,750 ==> hay un 75% de posibilidades (3 de cada
4 estudios) de equivocarnos al rechazar H0
Mayo-2007 M.Pavesi: inferencia y estadística 29
Y por fin...…la “p” ! (4)
• valor de significación PEQUEÑO = PROBABILIDAD
MUY BAJA de que el resultados obtenido se deba al
AZAR.
P = 0,015 ==> hay un 1,5% de posibilidades (15 de cada
1000 estudios) de equivocarnos al rechazar H0
Mayo-2007 M.Pavesi: inferencia y estadística 30
Y por fin...…la “p” ! (5)
¿Qué es un VALOR DE SIGNIFICACIÓN PEQUEÑO?
POR CONVENCIÓN (no porque lo diga la Biblia…) descartamos el papel del azar si la ‘p’ es inferior a ciertos valores (0,05 ó 0,01, por ejemplo).
La decisión se basa en criterios CLÍNICOS: ¿qué tasa de FALSOS POSITIVOS estamos dispuestos a aceptar?
Mayo-2007 M.Pavesi: inferencia y estadística 31
Y por fin...…la “p” ! (6)
…sobre todo, recordad:
¡¡LA p NO NOS DICE NADA SOBRE
LA RELEVANCIA CLÍNICA DEL
RESULTADO OBSERVADO!!
Mayo-2007 M.Pavesi: inferencia y estadística 32
Y por fin...…la “p” ! (7)
…por ejemplo...
Fármaco A. Tasa de curación: 22%
Fármaco B. Tasa de curación: 11%
…y efectivamente…
Fármaco A. Tasa de curación: 2/9
Fármaco B. Tasa de curación: 1/9
P=0,98
Mayo-2007 M.Pavesi: inferencia y estadística 33
Y por fin...…la “p” ! (8)
…por ejemplo...
Fármaco A. Tasa de curación: 22%
Fármaco B. Tasa de curación: 11%
…y efectivamente…
Fármaco A. Tasa de curación: 35/154
Fármaco B. Tasa de curación: 18/158
P=0,008
Mayo-2007 M.Pavesi: inferencia y estadística 34
Y por fin...…la “p” ! (9)
…y por otra parte...
Fármaco A. Tasa de curación conocida: 50%
Fármaco B. Tasa de curación esperada: 52%
Δ=2%; Riesgo Tipo I: 0,05; Riesgo Tipo II: 0,20
N (por grupo): 9.806
Mayo-2007 M.Pavesi: inferencia y estadística 35
…y el riesgo β y el Poder, ¿qué?...
¡NO SON MENOS IMPORTANTES!
• Con un riesgo β elevado y un Poder insuficiente, un
resultado NEGATIVO no permite llegar a NINGUNA
CONCLUSIÓN
• En algunos estudios (ej., nuevos fármacos) queremos estar
muy seguros de un resultado NO SIGNIFICATIVO
• CONVENCIÓN: Riesgo β <= 0,20-0,10
Mayo-2007 M.Pavesi: inferencia y estadística 36
Y para acabar: pequeña galería de los horrores...
“No se observan diferencias estadísticamente significativas
entre los dos grupos de tratamiento.
Conclusión: los dos tratamientos son igual de efectivos…”
….NNNOOOOORRRRRRLLLLL….!!!!!!
“Absence of evidence is not evidence of absence” (Douglas G. Altman)
Mayo-2007 M.Pavesi: inferencia y estadística 37
La ‘p’ de la comparación entre el tratamiento A y el
Placebo és menor de la ‘p’ de la comparación entre el
tratamiento B y el Placebo.
Conclusión: A es mejor que B...
….NNNOOOOORRRRRRLLLLL….!!!!!!
Y para acabar: pequeña galería de los horrores...
La ‘p’ solo nos informa sobre la fiabilidad del resultado de un contraste de hipótesis.
Mayo-2007 M.Pavesi: inferencia y estadística 38
Y para acabar: pequeña galería de los horrores...
Estadístico: “¿Cuál es tu hipótesis de trabajo?”
Investigador (es un decir...): “¿Hipótesis? Todas, las
tengo todas…”
….NNNNOOOOORRRRLLLLLL….!!!!!!
UN estudio, UNA hipótesis de trabajo, UN contraste de hipótesis. EL ESTUDIO
UNIVERSAL NO EXISTE !
Mayo-2007 M.Pavesi: inferencia y estadística 39
Y para acabar: pequeña galería de los horrores...
Investigador (al pobre estadístico): “Mira, he venido a
verte porque tengo una base de datos…”
….NNNOOOOORRRRRRLLLLL….!!!!!!
El riesgo α se incrementa exponencialmente al multiplicar los contrastes de hipótesis:
1 test: Riesgo α = 5%……5 tests: Riesgo α > 20%
….en fin...
(Darrell Huff: “How to lie with statistics”)
…¡¡ Gracias por vuestra
atención !!...Marco PavesiSenior Epidemiologist
CIS Clinical Epidemiology
Novartis Farmacéutica S.A.