Download ppt - Introducción Probabilidad, estadística e inferencia científica Marco Pavesi Senior Epidemiologist CIS Clinical Epidemiology Novartis Farmacéutica S.A

IntroducciónProbabilidad, estadística e inferencia científica

Marco PavesiSenior EpidemiologistCIS Clinical EpidemiologyNovartis Farmacéutica S.A.

Mayo-2007 M.Pavesi: inferencia y estadística 2

Intro: hace 2.500 años…

• Antístenes: “…yo veo estos caballos, blancos, negros, grises……¡¡pero la ‘caballinidad’ no la he visto nunca!!”

• Platón: “Cierto, porque tienes los ojos del cuerpo para ver los caballos blancos y negros, pero los ojos de la mente para ver la idea de ‘caballo’ no los tienes…”


Intro: el método científico (I)

En el siglo XIV, los científicos empezaron a darle la razón al pobre filósofo ridiculizado por Platón:

• La ciencia se basa en EXPERIENCIAS OBJETIVAS

• ‘Experiencia objetiva’ significa OBSERVACIONES PÚBLICAS (intersubjetivas) y REPETIBLES


Intro: el método científico (II)

Otras características de la ciencia moderna son:

• EL RIGOR metodológico

• La MODELIZACIÓN de la realidad

• La importancia vital del ERROR en el desarrollo científico


El arco del conocimiento

Experiencia: datos Predicciones: datos

Inducción Deducción

TEORÍA Hipótesis


InducciónLa parte ascendiente del “arco” se basa en el

PRINCIPIO DE INDUCCIÓN:

X1 ==> Y1

X2 ==> Y2

…..

Xn ==> Yn

X ==> Y


Inducción y Verdad

Bertrand Russell presenta…

El pavo inductivista


Problemas para el inductivista “pavo”

1) …cree que el resultado observado en una muestra de la población es verdadero para la población.

2) …cree que la inducción es el método científico para demostrar la verdad

3) …cree que la estadística es el instrumento para llegar a esta demostración “matemática”


Problemas para el inductivista “pavo”

Resultado...


El inductivista “sofisticado”

1) …reconoce que las inferencias científicas siempre tienen un “valor” que depende del nº de observaciones realizadas (tamaño de la muestra).



2) …sabe que solo es posible APROXIMAR / MODELIZAR / ESTIMAR la realidad y que cada estimación tiene su margen de error.



3) …sabe que no existen hipótesis verdaderas, pero podemos rechazar una hipótesis y aceptar otra en función de las “evidencias” de las que disponemos.


Karl Popper: gorilas y contrastes de hipótesis

Hipótesis: todos los gorilas son negros

C1 ==> negro

C2 ==> negro

...

Cn ==> ‘Copito de nieve’

Rechazo la hipótesis inicial

No es posible verificar una hipótesis, pero sí es posible

rechazarla a partir de un número suficiente de evidencias

contrarias


Cualquier tipo de conocimiento de las ciencias naturales (empíricas) es probabilístico:

• Se aproxima la realidad con una determinada precisión

• Se acepta un determinado margen de error para cualquier aproximación

• No se “demuestra” una hipótesis, se descarta (con un margen de error) la hipótesis contraria.

Desplazamiento probabilístico


Probabilidades directas e inversas

• “Sé (asumo) que este dado no está trucado: ¿qué probabilidad tengo de sacar siempre un 1 en 15 jugadas seguidas”

==> CÁLCULO (matemáticas)

• “He sacado siempre 1 en 15 jugadas seguidas.

¿Estará trucado el dado?

==> ESTADÍSTICA (inferencial)


Estadística inferencial y cálculo de probabilidades

Experiencia: datos Probabilidades (frecuencias)

Inducción Deducción

HIPÓTESIS/TEORÍA

Cálculo de probabilidades

Estadística inferencial


La estadística en los contrastes de hipótesis

Únicamente se tiene en cuenta la información

experimental (muestral)

PUNTOS FUERTES: Objetividad de los datos.

Métodos (relativamente) sencillos.

PUNTOS DÉBILES: no conocemos la probabilidad de

una hipótesis o de un resultado, sino la probabilidad

del resultado observado asumiendo H0.


Contrastes de hipótesis (I)

Hipótesis de trabajo del investigador:

El fármaco F es eficaz para reducir de forma

clínicamente relevante la TAS después de “x” días

de tratamiento


Contrastes de hipótesis (II)

Hipótesis nula (H0): el fármaco F no tiene ningún

efecto sobre la tensión arterial sistólica

…¿qué significa “efecto cero”?

H0 para el estadístico: la diferencia entre el fármaco F

y un placebo en la reducción de la TAS después de

“x” días de tratamiento es inferior o igual a 10 mm

Hg (diferencia CLÍNICAMENTE RELEVANTE)


Contrastes de hipótesis (III)

Hipótesis alternativa (H1): la diferencia entre el

fármaco F y un placebo en la reducción de la TAS

después de “x” días de tratamiento es mayor de 10

mm Hg (diferencia CLÍNICAMENTE

RELEVANTE)


Contrastes de hipótesis (IV)

Ingredientes:

• Mínima diferencia clínicamente relevante (Delta)

• Márgenes de error del contraste de hipótesis

• Poder estadístico del contraste

• Tamaño de la muestra (representativa de la

población): la “N” depende de todo lo anterior


Un pequeño margen de error... α

En cada contraste de hipótesis asumimos 2 riesgos:

El RIESGO α (error Tipo I):

• Probabilidad de observar Delta y rechazar H0

cuando, en realidad, H0 es verdadera.

• Porcentaje de resultados FALSOS POSITIVOS

que decidimos asumir.


Un pequeño margen de error... β

En cada contraste de hipótesis asumimos 2 riesgos:

El RIESGO β (error Tipo II):

• probabilidad de NO llegar a observar Delta y

aceptar H0 cuando, en realidad, H1 es verdadera.

• Porcentaje de resultados FALSOS NEGATIVOS

que decidimos asumir.


Un gran poder...estadístico

El PODER ESTADÍSTICO (P = 1-β):

• es la probabilidad de acertar cuando rechazamos H0

• puede interpretarse como el VALOR PREDICTIVO

DE LA PRUEBA PARA LOS RESULTADOS

POSITIVOS.


Errores en un contraste de hipótesis

Realidad

H0 cierta H0 falsa

Resultado de la prueba estadística

p<α(rechazo H0)

Error tipo I (α)

Poder estadístico

(1- β)p≥α

(no rechazo H0)No error Error tipo II

(β)


Y por fin...…la “p” ! (1)

El VALOR DE SIGNIFICACIÓN (p-value):

• Es la probabilidad de observar un resultado como el

que hemos observado en la muestra cuando, en la

realidad, H0 es verdadera.

….es decir, la PROBABILIDAD DE OBSERVAR

ESTE RESULTADO ÚNICAMENTE POR AZAR.



El VALOR DE SIGNIFICACIÓN (p-value):

• es un índice de la EVIDENCIA del resultado

observado, de cuanto es FIABLE el resultado

comparado con su variabilidad.



• valor de significación GRANDE =

PROBABILIDAD ELEVADA de que el resultados

obtenido se deba al AZAR.

P = 0,750 ==> hay un 75% de posibilidades (3 de cada

4 estudios) de equivocarnos al rechazar H0



• valor de significación PEQUEÑO = PROBABILIDAD

MUY BAJA de que el resultados obtenido se deba al

AZAR.

P = 0,015 ==> hay un 1,5% de posibilidades (15 de cada

1000 estudios) de equivocarnos al rechazar H0



¿Qué es un VALOR DE SIGNIFICACIÓN PEQUEÑO?

POR CONVENCIÓN (no porque lo diga la Biblia…) descartamos el papel del azar si la ‘p’ es inferior a ciertos valores (0,05 ó 0,01, por ejemplo).

La decisión se basa en criterios CLÍNICOS: ¿qué tasa de FALSOS POSITIVOS estamos dispuestos a aceptar?



…sobre todo, recordad:

¡¡LA p NO NOS DICE NADA SOBRE

LA RELEVANCIA CLÍNICA DEL

RESULTADO OBSERVADO!!



…por ejemplo...

Fármaco A. Tasa de curación: 22%

Fármaco B. Tasa de curación: 11%

…y efectivamente…

Fármaco A. Tasa de curación: 2/9

Fármaco B. Tasa de curación: 1/9

P=0,98



…por ejemplo...

Fármaco A. Tasa de curación: 22%

Fármaco B. Tasa de curación: 11%

…y efectivamente…

Fármaco A. Tasa de curación: 35/154

Fármaco B. Tasa de curación: 18/158

P=0,008



…y por otra parte...

Fármaco A. Tasa de curación conocida: 50%

Fármaco B. Tasa de curación esperada: 52%

Δ=2%; Riesgo Tipo I: 0,05; Riesgo Tipo II: 0,20

N (por grupo): 9.806


…y el riesgo β y el Poder, ¿qué?...

¡NO SON MENOS IMPORTANTES!

• Con un riesgo β elevado y un Poder insuficiente, un

resultado NEGATIVO no permite llegar a NINGUNA

CONCLUSIÓN

• En algunos estudios (ej., nuevos fármacos) queremos estar

muy seguros de un resultado NO SIGNIFICATIVO

• CONVENCIÓN: Riesgo β <= 0,20-0,10


Y para acabar: pequeña galería de los horrores...

“No se observan diferencias estadísticamente significativas

entre los dos grupos de tratamiento.

Conclusión: los dos tratamientos son igual de efectivos…”

….NNNOOOOORRRRRRLLLLL….!!!!!!

“Absence of evidence is not evidence of absence” (Douglas G. Altman)


La ‘p’ de la comparación entre el tratamiento A y el

Placebo és menor de la ‘p’ de la comparación entre el

tratamiento B y el Placebo.

Conclusión: A es mejor que B...



La ‘p’ solo nos informa sobre la fiabilidad del resultado de un contraste de hipótesis.



Estadístico: “¿Cuál es tu hipótesis de trabajo?”

Investigador (es un decir...): “¿Hipótesis? Todas, las

tengo todas…”

….NNNNOOOOORRRRLLLLLL….!!!!!!

UN estudio, UNA hipótesis de trabajo, UN contraste de hipótesis. EL ESTUDIO

UNIVERSAL NO EXISTE !



Investigador (al pobre estadístico): “Mira, he venido a

verte porque tengo una base de datos…”


El riesgo α se incrementa exponencialmente al multiplicar los contrastes de hipótesis:

1 test: Riesgo α = 5%……5 tests: Riesgo α > 20%

….en fin...

(Darrell Huff: “How to lie with statistics”)

…¡¡ Gracias por vuestra

atención !!...Marco PavesiSenior Epidemiologist

CIS Clinical Epidemiology

Novartis Farmacéutica S.A.

([email protected])