Upload
lydieu
View
231
Download
0
Embed Size (px)
Citation preview
LECTURE ET ANALYSE CRITIQUE
DES ESSAIS CLINIQUES
Dr. Emmanuel Amsallem
CETAF, Responsable service Qualité – Évaluation – Études
OBJECTIFS
Connaitre la finalité de l’évaluation de l’efficacité
d’une stratégie de prise en charge (traitement,
prévention, dépistage, etc.) ?
Connaitre les grands principes de l’essai randomisé
Savoir cibler l’interprétation sur l’intérêt en pratique
clinique pour la prise de décision médicale
Analyse critique : approche du point de vue de l’utilisateur
(médecin)
Savoir apprécier le bénéfice et le risque pour le
consultant
SUPPORTS
Méthodologie des essais cliniques
www.spc.univ-lyon1.fr/polycop/
Lecture critique des essais cliniques
www.spc.univ-lyon1.fr/lecture-critique
Calculs d’indices d’efficacité
www.spc.univ-lyon1.fr/mfcalc/
LA LECTURE CRITIQUE
Le problème
Existe-t-il des preuves fiables qu’une stratégie de prise
en charge (traitement, prévention, dépistage, etc.)
apportera en pratique un bénéfice suffisant et pertinent
au patient, et supérieur au risque encouru ?
LA LECTURE CRITIQUE
Les questions
Validité interne du résultat d’une étude ?
Le résultat est-il réel ?
Le résultat est-il non biaisé ?
Pertinence clinique et représentativité ?
Bénéfice intéressant en pratique ?
Extrapolable à nos patients ?
Cohérence externe ?
Concordant avec d’autres connaissances ?
LA LECTURE CRITIQUE
Les sources d’informations
Primaire
Rapport publié de l’essai
Secondaires
Collègues
Livres
Recommandations
Experts (formation continue)
Industrie pharmaceutique
LA LECTURE CRITIQUE
Mais !
Source primaire
Notoriété pas un gage de qualité et pertinence
Effet de mode
Sources secondaires
Pas à jour
Partial : conflits d’intérêt, interprétation partisane
Effet de mode
DISTORSION DE LA
REALITE ET DU RESULTAT
LA LECTURE CRITIQUE
Conflit d’intérêt
Stelfox HT, NEJM 1998
Inhibiteur Ca2+ : surcroît d’infarctus chez
hypertendus traités (méta-analyse)
Analyse de l’avis de leader d’opinion en fonction de
leurs liens avec l’industrie
Ceux qui contestent : 96% avaient un lien
Avis neutre : 60% avaient un lien
Ceux qui défendent : 37% avaient un lien
LA LECTURE CRITIQUE
Les recommandations pour la pratique
Grilli R, Lancet 2000
Analyse de 431 publications
Critères de qualité : description des personnes impliquées,
description de la méthode pour identifier les études et
description de la gradation (niveau de preuve)
5% avaient tous les critères de qualité
67% ne donnaient pas les personnes impliquées
88% ne décrivaient pas la méthode
82% n’avaient pas de gradation
LA LECTURE CRITIQUE
Intérêts
PatientMédecin
Formation
Initiale
Expérience
personnelle
Préférences
du patient
Essais
cliniques
Sources
secondaires
Contexte social
et de vieContexte
économique
Contexte
législatif
Décision médicale
Analyse critique
Balance Bénéfice – Risque
PatientMédecin
Formation
Initiale
Expérience
personnelle
Préférences
du patient
Essais
cliniques
Sources
secondaires
Contexte social
et de vieContexte
économique
Contexte
législatif
Décision médicale
Analyse critique
Balance Bénéfice – Risque
Intégrer dans la pratique
les résultats des essais
Finalité de l’évaluation de l’efficacité
d’une stratégie de prise en charge
La notion de preuve de l’efficacité
OBJECTIF CLINIQUE
Description
Objectifs de prévention et/ou thérapeutique
Particularité de la prévention : consultant sain qui ne demande rien
Nécessité d’un gain perceptible par le patient
Types
Éviter la survenue d’un événement morbide ou d’un décès
Retarder la survenue d’un événement morbide ou d’un décès
Diminuer la fréquence de survenue d’un événement morbide ou
d’un décès
Augmenter la qualité de vie, etc.
OBJECTIF CLINIQUE
Exemples
Réduire le taux de LDL Cholestérol
Augmenter le périmètre de marche en mètres
Augmenter la couverture vaccinale
Augmenter la fréquence des cancers dépistés
Réduire le risque de survenue d’AVC ischémique
Augmenter la fréquence des patients marchant plus d’1 km
Réduire le risque de cirrhose ou de cancer hépatique
Réduire le risque de décès, quelle que soit la cause
PREUVE DE L’EFFICACITE
Le problème
La médecine : une pratique
Fondement de cette pratique : les données scientifiques
Décision rationnelle (pas basée sur l’intuition, la croyance ou l’ésotérisme)
La recherche fondamentale permet de générer l’hypothèse qu’un
traitement peut apporter un bénéfice
Il faut vérifier cette hypothèse (sinon elle n’est que pure spéculation) par une expérimentation rigoureuse et impartiale
L’hypothèse est alors corroborée ou infirmée
PREUVE DE L’EFFICACITE
Induction - Déduction
Induction Raisonnement physiopathologique
Déduction Test par expérimentation
A
B
C Donc
1 2 A C = ?
PREUVE DE L’EFFICACITE
Essai CAST
Extrasystoles
ventriculaires Mort subite
Anti-arythmique de classe I Infarctus
Démontré
Dém
on
tré non vérifié dans la
confrontation à la
réalité
Surmortalité x 2
Plus de décès que la guerre
du Vietnam
PREUVE DE L’EFFICACITE
Essais CIBIS II, MERIT-HF
Effet inotrope négatif Mortalité
Béta-bloquants Insuffisance cardiaque
Démontré
Dém
on
tré non vérifié dans la
confrontation à la
réalité
Réduction mortalité de 20%
Perte de chance
PREUVE DE L’EFFICACITE
Obtenir des preuves fiables
Ne retenir que les études les plus fiables = risque minime d’être biaisées (faux positif)
Nécessité de répéter l’expérience
ELITE I Réduction significative de 46% du risque de
décès (N=747)
ELITE II Tendance non significative d’augmentation
de 13% du risque de décès (N=1 500)
Pas de sélection arbitraire (tendance à ne retenir que les résultats positifs) !
PREUVE DE L’EFFICACITE
Effet de sélection
Ravnskov et al, BMJ 1992
Hypocholestérolémiants vs Placebo
Nombre de citations
14 essais avec résultats favorables 40 / an
10 essais avec résultats non favorables 7,4 / an
2 essais publiés dans le JAMA
Année post publication 1er 2ème 3éme 4éme
LRC, favorable 109 121 202 180
Miettinen, non favorable 6 5 3
Comment évaluer l’efficacité d’une
stratégie de prise en charge ?
Les grands principes de l’essai randomisé
EXPRESSION DE L’EFFICACITÉ
Critère de jugement clinique
Quel critère de jugement choisir pour exprimer l’effet d’un traitement ?
Objectif d’un traitement : apporter un bénéfice perceptible par le patient
Critère de jugement en terme de bénéfice perceptible par le consultant
Réduire la fréquence des décès
Réduire la fréquence d’une intervention chirurgicale
Amélioration fonctionnelle
CRITÈRE DE JUGEMENT CLINIQUE
APPROCHE OBSERVATIONNELLE
Ce qui est observé est-il différent de ce qui
serait observé sans traitement ?
Quels facteurs peuvent être confondus avec
l’effet du traitement ?
Évolution propre de la maladie
Effets des traitements concomitants
Effets du contexte de soins
Phénomène de régression à la moyenne
etc.
APPROCHE COMPARATIVE
Contrôle historique
Les méthodes diagnostiques diffèrent dans le temps
Les caractéristiques des patients diffèrent dans le temps
Les traitements concomitants et soins diffèrent dans le temps
Contrôle géographique
Les méthodes diagnostiques diffèrent dans l’espace
Les caractéristiques des patients diffèrent dans l’espace
Les traitements concomitants et soins diffèrent dans l’espace
Absence de traitement Effet du traitement peut être confondu avec l’effet placebo
LE COMPARATEUR : PLACEBO
Eff
et
ob
serv
é Effet placebo
Effet nocebo
Information Placebo
Placebo
Actif
Placebo
Placebo
Actif
Actif
Actif Produit réel
Beecher HK et al. Épreuve stressante chez le volontaire sain
Anxiolytique vs Placebo
L’ATTRIBUTION DU TRAITEMENT
Exemples
Le médecin choisit si le
patient aura le traitement ou
le placebo Les patients les plus
graves auront le
traitement Opération chirurgicale ou
surveillance médicale en
fonction de la disponibilité de
la salle
Le patient aura le traitement
si son année de naissance est
un nombre pair
Le patient aura le
traitement si la pièce
tombe sur face
L’ATTRIBUTION DU TRAITEMENT
Problèmes
Quelle est la comparabilité des groupes ainsi constitués ?
La répartition dépend-elle
– du médecin ou du patient ?
– de la maladie, du traitement ?
Conséquences
Effet observé est-il dû au traitement ou à la différence des groupes
constitués au départ ?
Prévisibilité
Mise en évidence d’un effet du traitement qui n’existe pas
L’ATTRIBUTION DU TRAITEMENT
Importance de la randomisation
Essais cliniques randomisés
augmentation de 20 % de la
mortalité cardiovasculaire
Études d'observations
réduction de plus de 25 % de
la mortalité cardiovasculaire
BIAIS DE CONFUSION
Une étude a été menée sur 2 500 sujets tirés au sort dans une
population d’hypertendus et ne recevant auparavant aucun traitement
médicamenteux, pour savoir si un an de traitement par un nouveau
antihypertenseur permettrait de faire diminuer la pression artérielle
systolique (PAS).
A l’entrée dans l’essai, les moyennes de PAS pour les sujets étaient
de 154 ± 5,4 mmHg. Après un an de traitement, la PAS moyenne était
de 123 ± 4,3 mmHg.
La différence entre ces deux chiffres est statistiquement significative,
p<0,0001. Cette étude montre donc l’efficacité de ce nouvel
antihypertenseur pour faire baisser la PAS.
La conclusion proposée est-elle justifiée ? OUI NON
LE MAINTIEN DE LA COMPARABILITÉ
Problèmes
Les groupes qui étaient comparables au début de l’essai le sont-ils encore à la fin du suivi ?
Prise en charge identique
Mêmes traitements concomitants
Critère de jugement attribué de la même façon
Critère de jugement disponible pour tous les patients
Conséquences
Effet observé est-il dû au traitement ou à la différence
de suivi des groupes ?
Sur ou sous-estimation de l’effet du traitement
LE MAINTIEN DE LA COMPARABILITÉ
Les solutions
Évaluation objective du
critère de jugement
Comité d’événements en
aveugle de la thérapeutique
Évaluateur du médecin
prenant en charge le patient
Pas de perdus de vue
Traité Placebo
=
Même forme galénique
Même couleur
Même goût
Même conditionnement
Etc.
Le double aveugle (ou insu)
LE MAINTIEN DE LA COMPARABILITÉ
Le double aveugle
Les patients ne peuvent se distinguer en fonction
de leur appartenance à un groupe ou à un autre
Ni le patient, ni l’investigateur ne connaît la nature
réelle du traitement
Traitements strictement identiques
Placebo
Double placebo (comparaison avec produit de référence)
Randomisation complètement imprévisible
Codage des traitements reçus
PERDUS DE VUE - DONNÉES MANQUANTES
Exemples
T + T - RR
N randomisés 100 100
Evénements 10 20
Perdus de vue 10 30
N analysables 90 70
Risque mesurable % 10 / 90 20 / 70
11% 29% 0,39
Biais maximum % (10+10)/100 20/100
20% 20% 1,00
PERDUS DE VUE - DONNÉES MANQUANTES
Problèmes
Ne pas prendre en compte tous les patients
dans l’analyse finale introduit un biais
Les arrêts du traitement et les sorties
d’essai représentent un échec du
traitement en pratique clinique
Le critère de jugement n’est pas disponible
pour les perdus de vue, ils ne peuvent être
pris en compte dans l’analyse finale même
en intention de traiter
PERDUS DE VUE - DONNÉES MANQUANTES
Solutions
Analyse en intention de traiter
Tous les patients randomisés sont analysés
Dans le groupe où ils ont été randomisés
Pas de perdus de vue
il existe un nb de perdus de vue par critère de jugement
Hypothèse du biais maximum
Tous les patients perdus de vue du groupe traité ont fait
l’événement
Aucun des patients perdus de vue du groupe contrôle ont fait
l’événement
Arrêt du traitement
Suivis jusqu’à la fin de l’étude
CONCLUSION
Les grands principes de l’essai clinique
Prospectif
Comparatif
Contrôlé par un placebo
Randomisé
Suivi en double aveugle
Analyse en intention de traiter sans donnée
manquante
CONCLUSION
Schéma
Randomisation Double aveugle
AIT
Randomisation
Grp T
Grp C
Critère
Critère
Groupes
comparables Maintient de la comparabilité
Biais de sélection Biais de réalisation Biais d'évaluation
Biais d'attrition
Biais de confusion
Contrôle
LA MESURE DE L’EFFICACITÉ
Nouvel antiagrégant plaquettaire contre placebo
Patients aux antécédents d’AVC ischémique
Prévention II du risque de récidive d’AVC
46 %
54 %
100% 0% 46% 54%
Grp T
Grp C
Effectifs AVC Risques
GRp T 100 4646/100=0,46
(p1)
Grp C 100 5454/100=0,54
(p0)
LE RAPPORT DES COTES (ODDS RATIO)
Calcul
%) (en RC1RRC
p01p0
p11p1RC
Le risque est de la cote
Risque T- = p0 54 %
Cote T- = p0 / (1 - p0) 1,17 (6 contre 5)
LE RAPPORT DES COTES (ODDS RATIO)
Mauvaise interprétation
1.0
0.0
0.2
0.4
0.6
0.8
0.00 0.25 0.50 0.75 1.00
Risque de base dans le groupe contrôle
Ra
pp
ort
de
s c
ote
s
RR=0.8
Le RC n’est pas le RR
Le RC peut s’interpréter comme un RR mais sous
certaines conditions
!
BENEFICE ABSOLU – BENEFICE RELATIF
Bénéfice
relatif
Bénéfice
absolu
Grp T+ Grp T- RR RRR RC RRC DR NNT
46/10046 %
54/10054 %
0,85 15 % 0,73 27 % - 8 % - 13
Récapitulatif des différents indices
Relation entre DR, RR et p0
DR = (1 - RR) x p0 Simulation
LA PRÉCISION DE CETTE MESURE
Problème
On ne connaît jamais la vraie valeur de l’effet d’un
traitement
En réalisant un essai clinique on tente d’approcher
cette vraie valeur en effectuant une mesure de l’effet
du traitement dans une population donnée
Comme toute mesure, celle-ci est plus ou moins
précise
La précision de cette mesure est donnée par
l’intervalle de confiance
Comment interprète-t-on un intervalle de confiance ?
LA PRÉCISION DE CETTE MESURE
Interprétation
Essai A :
RR = 0,77 [0,70 - 0,84]
RRR = 23 % [16 % - 30 %]
L’effet du traitement est
une réduction relative de
23 % du risque de survenue
de l’événement et cette
valeur est compatible avec
une réduction de 30 % au
mieux et de 16 % au pire
Au pire la réduction est de
16 % et est > 10 %, donc
cliniquement pertinente
L ’IC n’englobe pas la valeur 1 : la
différence observée entre les groupes
est donc statistiquement significative
Il y a 95 % de chance que la vraie
valeur de l’effet du traitement soit
comprise entre une réduction de 16 %
et une réduction de 30 %
SIGNIFICATIVITÉ STATISTIQUE
Exemple
Pas d'effet du
traitement
Groupe traité p1 = 10%
Groupe contrôle p0 = 10%
12%
7%
Différence apparente non réelle
Conclusion à tort à l’effet du traitement
Risques observés
Différence observée due
au hasard
La différence observée est-elle due au hasard ?
La différence observée est-elle due à l’effet du traitement ?
SIGNIFICATIVITÉ STATISTIQUE
Problèmes
Comment décider entre les deux
conclusions ?
Conclure avec certitude (à 100 %) à
l’existence ou non d’un effet du
traitement est impossible
SIGNIFICATIVITÉ STATISTIQUE
Solutions
Faire l’hypothèse que l’effet du traitement observé
est dû au hasard
Calculer la probabilité que l ’effet observé soit
compatible avec cette hypothèse
Choisir une probabilité de se tromper (on ne peut pas
conclure avec 100 % de certitude)
Conclure
Principe du test d’hypothèse
SIGNIFICATIVITÉ STATISTIQUE
Le test d’hypothèse
Il est possible de conclure à l’existence de la différence car le risque d’erreur encouru est petit (<5%).
« En faisant cette conclusion, je commets peut-être une erreur, mais je connais parfaitement le risque que j’encoure = 5% »
Différence observée non nulle 7% versus 12%
Calcul de la probabilité p que cette différence soit due uniquement au hasard
P< 5% ?
Il n’est pas possible de conclure car le risque de faire une conclusion erronée est trop important (>5%).
Dans cette situation, le risque d’erreur encouru en concluant à l’existence d’une différence est déraisonnable
oui non
!
SIGNIFICATIVITÉ STATISTIQUE
Le p : mauvaises interprétations
p > 0,05 (5 %)
« L’effet du traitement est similaire entre les groupes »
« Le traitement n’a pas d’effet sur la survenue de l’évt »
p < 0,05 (5 %)
« Le traitement a fait la preuve de son efficacité »
« Le traitement doit être utilisé en pratique clinique car
son effet est pertinent »
SIGNIFICATIVITE STATISTIQUE
Un essai, incluant 4 250 patients, a comparé le fond d’œil par un
ophtalmologue (avec dilatation) à la rétinographie non mydriatique
(nouvelle technique sans dilatation) dans le dépistage des
rétinopathie diabétiques.
La fréquence des cécité a été respectivement de 10,4% et 19,1%,
p=0,56.
L'absence de différence significative permet de conclure que ces
deux tests de dépistage ont une efficacité qui n’est pas différente
(similaire).
La conclusion proposée est-elle justifiée ? OUI NON
LES CRITERES DE JUGEMENT
Typologie
Primaire
Unique pour contrôler le risque de conclure à tort, et pouvoir conclure
Cliniquement pertinent
critère sur lequel porte la démonstration de la preuve de
l’efficacité : analyse confirmatoire
Secondaire
Documente un bénéfice secondaire (effet sur la mortalité, autres
effets sur AVC ou IDM)
Documente le mécanisme d’action (effet sur la mortalité totale, effet
sur la mortalité spécifique)
Critère correspondant à des effets délétères
Clinique, Intermédiaire (TA, taux de LDL Cholestérol, etc.)
Analyse exploratoire
LES CRITERES DE JUGEMENT
Critères cliniques (1)
L’objectif est la guérison de la maladie
Maladie bénigne spontanément résolutive
– Guérison à 100%
– Critère = Durée de la maladie
Maladie grave non résolutive
– Pas de guérison spontanée (appendicite aigue nécessite chirurgie)
– Critère = Taux de guérison
L’objectif est la prévention
Primaire
– Sujets sains mais à risque (hypertendu à risque d’IDM ou d’AVC)
– Critère = Fréquence des événements que l’on cherche à prévenir ou Fréquence
des décès (si la maladie est mortelle)
Secondaire
– Sujets ayant déjà fait un événement et à risque
– Critère = Fréquence des événements que l’on cherche à prévenir ou Fréquence
des décès (si la maladie est mortelle)
LES CRITERES DE JUGEMENT
Critères cliniques (2)
L’objectif est la symptomatologie
Maladie spontanément résolutive ou stade avancé
Exemple : douleur, gène fonctionnelle (dysurie dans adénome bénin
de la prostate)
Critère = Diminuer intensité (score, échelle visuelle analogique) du
symptôme, Faire disparaître le symptôme
L’objectif est la qualité de vie
Maladie incurable
Subjectif
Score
Auto-évaluation ou évaluateur externe
Paradoxe : amélioration de la qualité de vie avec une augmentation de
la mortalité
CRITERE DE JUGEMENT
Un antagonistes direct de l'angiotensine 2 (famille des sartans) a été
comparé à un IEC dans le traitement de patients insuffisants cardiaques.
L'essai est randomisé, en double aveugle, correctement conçu et
réalisé.
L'objectif de cet essai est d'évaluer le retentissement de ce traitement
sur la fonction rénale. La mortalité est aussi enregistrée pour exclure un
éventuel effet délétère de ce traitement. Le critère de jugement principal
est la clairance de la créatinine.
Au terme de l'essai, une réduction statistiquement significative (p<0,001)
de 40% de du risque de décès est observée.
Ce résultat permet de conclure que ce sartan apporte un bénéfice
supplémentaire par rapport aux IECs en terme de réduction de la
mortalité.
La conclusion proposée est-elle justifiée ? OUI NON
LES CRITERES DE JUGEMENT
Critères composites : définition
Critère prenant en compte simultanément
plusieurs événements
Ex : décès ou survenue d’un AVC ou survenue
d’un IDM
Le patient présente le critère composite s’il a fait
l’un des 3 événements
Si un patient fait un AVC puis décède : seul l’AVC
sera compté dans le critère composite
LES CRITERES DE JUGEMENT
Critères composites : exemple
Patients aux antécédents d’IDM
Aspirine (A) vs Placebo (P)
Aspirine N= 1230
Placebo N1228
AVC 13 34
IDM 23 45
Décès 36 80
Critère composite 72 159
Aspirine N= 1230
Placebo N1228
AVC 24 41
IDM 23 45
Décès 54 95
En comptant tous les
événements survenus
dans l’essai
Critère composite =
Somme des événements
LES CRITERES DE JUGEMENT
Critères composites : intérêts
Regrouper des équivalents du même phénomène clinique
Augmenter la puissance pour la mise en évidence d’un effet
Mesurer la balance bénéfice risque
Fibrinolyse dans IDM
Critère = Décès (bénéfice) ou AVC invalidant (risque de la
fibrinolyse)
LES CRITERES DE JUGEMENT
Critères composites : interprétation (1)
T+
N=500
T-
N=500
RR
[IC 95%] p
Décès 20 50 1
[0,54 – 1,84] 1,00
Evénements
non mortels 72 100
0,72
[0,55 – 0,95] 0,02
Critère composite 92 120 0,77
[0,60 – 0,98] 0,03
Peut-on conclure à une réduction
de la morbi-mortalité ?
LES CRITERES DE JUGEMENT
Critères composites : interprétation (2)
T+
N=500
T-
N=500
RR
[IC 95%] p
Décès 57 80 0,71
[0,52 – 0,97] 0,03
Evénements
non mortels 97 100
0,97
[0,76 – 1,25] 0,81
Critère composite 154 180 0,86
[0,72 – 1,03] 0,09
Peut-on conclure à une
réduction de morbi-mortalité ?
LES CRITERES DE JUGEMENT
Critères composites : interprétation (3)
T+
N=500
T-
N=500
RR
[IC 95%] p
Décès 41 50 0,82
[0,55 – 1,22] 0,32
Evénements
non mortels 79 100
0,79
[0,60 – 1,03] 0,08
Critère composite 120 150 0,80
[0,65 – 0,98] 0,03
Peut-on conclure à une réduction
de la morbi-mortalité ?
CRITERE COMPOSITE
Un essai a comparé un stratégie de dosage du LDL Cholestérol à
l’absence de dosage de LDL Cholestérol chez 5 000 patients dans le
cadre du dépistage de patients à risque cardio-vasculaire.
Le critère de jugement principal est un critère composite regroupant le
décès, la survenue d’un infarctus et la survenue d’un AVC.
Cet essai montre que la mise en place d'un dépistage par dosage du
LDL Cholestérol permet de réduire la morbi-mortalité.
La conclusion proposée est-elle justifiée ? OUI NON
Dépistage n=2485
Pas de dépistage n=2515
Décès 4 4
Infarctus 8 7
AVC 40 70
Critère composite 52 (2,1%) 81 (3,2%) p=0,014
COMPARAISON DES CARACTERISTIQUES
Le problème
La randomisation permet à coup sûr de créer des groupes comparable au début de l’essai ?
NON : risque de 5% d’avoir un déséquilibre entre les groupes
Un déséquilibre entre les groupes, sur une variable fortement
corrélée (liée, modifiant) au (le) critère de jugement peut
introduire un BIAIS
La différence observée entre les groupes est-elle due
au traitement étudié ou au déséquilibre entre les
groupes sur cette variable ?
COMPARAISON DES CARACTERISTIQUES
Description
Types de variables pouvant être corrélées au critère de jugement
Facteurs pronostiques
Facteurs de gravité de la maladie (stade, localisation)
Antécédents ou comorbidités
Ancienneté de la maladie
Traitement (autre que celui étudié) en cours à l’inclusion
Contexte de soins (essais dans plusieurs pays)
Mesure
Variable binaire : N et proportion
Variable continue : moyenne ou médiane (écart-type, différence
interquartiles)
COMPARAISON DES CARACTERISTIQUES
Nécessité de tests statistiques ?
La question posée est :
Existe-t-il un déséquilibre entre les groupes sur une
variable fortement corrélée au critère de jugement ?
Ce qui est analysé c’est le risque de biais, pas la
réalité statistique de ce déséquilibre
Le résultat du test indique :
Significatif : sur variable non corrélée = PAS DE BIAIS
Non significatif : même si due au hasard (p>0,05) une
différence entre les groupes sur une variable corrélée = BIAIS
COMPARAISON DES CARACTERISTIQUES
Analyse
L’analyse repose donc sur :
Importance de la variable (intensité de la corrélation avec le
critère de jugement)
Importance (numérique) du déséquilibre entre les groupes
Prévention du déséquilibre
Stratification de la randomisation sur les variables corrélées au
critère de jugement
En cas de déséquilibre
Ajustement : Mantel-Haenszel, analyse multivariée
COMPARAISON DES CARACTERISTIQUES
Exemple
Maladie : cancer du sein
Intervention : dépistage par mammographie vs pas de dépistage
Critère principal : mortalité par cancer du sein
T+ N=1400
T- N=1400
Age : moyenne (écart-type) 55,4 (2,5) 56,5 (2,9)
Antécédents familiaux de KC du sein : n (%) 112 (8,0%) 120 (8,6%)
Puberté < 12 ans : n (%) 173 (12,4%) 167 (11,9%)
Pas d’enfant : n (%) 57 (4,1%) 63 (4,5%)
Premier enfant > 30 ans : n (%) 124 (8,9%) 120 (8,6%)
Pas d’allaitement : n (%) 234 (16,7%) 240 (17,1%)
Ménopause > 50 ans : n (%) 150 (10,7%) 145 (10,4%)
Antécédents d’ulcère gastro-duodénale : n (%) 90 (6,4%) 40 (2,9%)
THS : n (%) 450 (32,1%) 765 (54,6%)
COMPARAISON DES CARACTERISTIQUES
Exemple
Maladie : X
Intervention : Nouveau traitement vs Placebo
Critère principal : Mortalité totale
T+ N=1400
T- N=1400
Age : moyenne (écart-type) 55,4 (2,5) 75,5 (3,1)
Antécédents familiaux de X : n (%) 112 (8,0%) 120 (8,6%)
Antécédents personnels de Y : n (%) 173 (12,4%) 169 (12,1%)
Traitement Y : n (%) 450 (32,1%) 451 (32,1%)
Résultat : Réduction significative de 40% de la mortalité totale
Conclusion : Efficacité du nouveau traitement vs Placebo ?
BIAIS DE SELECTION ET DE SUIVI
Afin d'évaluer l'efficacité d'un traitement antihypertenseur sur la
prévention des maladies coronariennes, un essai randomisé, en ouvert,
contre traitement de référence a inclus 12 598 patients. La
randomisation a été effectuée par enveloppe. La durée de suivi a été de
5 ans. Les caractéristiques de bases des patients sont les suivantes :
A la fin de l'essai, une réduction de 12% de la mortalité coronarienne est
observée dans le groupe du nouveau traitement. Il est ainsi possible de
conclure que ce traitement apporte un bénéfice clinique certain.
La conclusion proposée est-elle justifiée ? OUI NON
Nouveau traitement
n=6298 Traitement conventionnel
n=6300
Age 60 68
Femmes 22% 12%
Pression artérielle systolique 143 150
Pression artérielle diastolique 91 98
Antécédents d'infarctus 23% 28%
Fumeurs 33% 45%
ANALYSE EN SOUS-GROUPE
Définition
Subdiviser la population de l’essai en sous population
dans lesquelles étudier l’effet du traitement
Problème : analyses multiples
Nb de tests (k)
Risque alpha global
5
10
20
30
0,23
0,40
0,64
0,78
1 1k
global
Traitement sans effet
5 comparaisons
Risque de 23 % de faire
une conclusion à tort
ANALYSE EN SOUS-GROUPE
Objectifs
Rechercher une différence d’effet dans une sous
population (sexe, âges, etc.)
Analyse de nature exploratoire : ne remet pas en
cause le résultat global de l’essai
Explorer l’extrapolabilité à différentes sous
populations pour documenter l’effet principal
S’assurer de l’absence d’effet délétère dans une
sous population
ANALYSE EN SOUS-GROUPE
Exemple : ISIS 2 (graphique)
Maladie : Phase aigue de l’infarctus du myocarde
Intervention : Aspirine vs Placebo
Critère principal : Mortalité à 30 jours
Sous-groupe : Gémeaux/Capricorne vs Autres signes
ANALYSE EN SOUS-GROUPE
Cas d’un essai non concluant : SU.VI.MAX (1)
Hercberg S, Arch Int Med 2004 – SU.VI.MAX Study
ANALYSE EN SOUS-GROUPE
Cas d’un essai non concluant : SU.VI.MAX (2)
Protocole publié :
1. Pas de critère de jugement principal définit
2. Pas de stratification sur le sexe à l’inclusion
3. Calcul de N ne prévoit pas un effet différent en fonction du sexe
4. Résultat : au moins 9 tests réalisés
Conclusions: After 7.5 years, low-dose antioxidant supplementation lowered
total cancer incidence and all cause mortality in men but not in women.
Supplementation may be effective in men only because of their lower
baseline status of certain antioxidants, especially of beta-carotene.
LA CONCLUSION DEPASSE LES DONNEES
ANALYSE EXPLORATOIRE !
ANALYSE EN SOUS-GROUPE
Cas d’un essai concluant
ANALYSE EXPLORATOIRE
Nouvelle hypothèse à tester
dans un nouvel essai
Mauvaise interprétation =
conclusion à tort à l’absence
d’effet (comme le tt est
efficace = perte de chance)
ANALYSE EN SOUS-GROUPE
Planification d’une analyse en sous-groupe
Nb restreint de sous-groupes
Sous-groupes définis a priori dans le protocole
Randomisation stratifiée sur sous-groupe
Calcul de N pour mettre en évidence effet dans chaque strate
Seuil corrigé pour analyses multiples (/k, k=nombre d’analyses ou sous-groupes)
Niveau de preuve d’analyse en sous-groupe < niveau de preuve du résultat global
Générer une nouvelle hypothèse = nouvel essai
SOUS-GROUPE
Un essai a évalué l'effet d'un nouveau traitement hypoglycémiant sur
la fréquence des complications cardiovasculaires dans le DNID par
une comparaison au placebo.
Aucune différence significative n'a été observée entre les deux
groupes au terme du suivi de 4 ans.
Cependant, une diminution significative de la fréquence de ces
complication est obtenue dans le sous groupes des diabétiques
hypertendus.
Le résultat permet de conclure à la démonstration de l'intérêt de ce
traitement chez les patients diabétiques et hypertendus et doit donc
conduire à sa recommandations.
La conclusion proposée est-elle justifiée ? OUI NON
ANALYSE EN INTENTION DE TRAITER
Le problème : les écarts au protocole
Arrêt de prise du traitement (nouveau ou placebo)
Absence de prise du traitement (nouveau ou placebo)
Mauvaise observance
Prise du traitement de l’autre groupe (cross-over)
Prise de traitement interdit
Inclusion de patients n’ayant pas les critères d’inclusion
Perdus de vue (non présentation à la visite de suivi, critère
non mesuré, etc.) = données manquantes
ANALYSE EN INTENTION DE TRAITER
Conséquences
Perte de patient est liée au traitement ou à
l’évolution de la maladie
Sortie des mauvaises tolérances au traitement
Sortie des patients les plus graves
Perte (attrition) de patient = BIAIS
Continuer à suivre les patients sortis
Enregistrer les événements
Les inclure dans les analyses
ANALYSE EN INTENTION DE TRAITER
Définition
Tout patient randomisé est analysé et dans
le groupe dans lequel il a été randomisé
Permet de prendre en compte les facteurs
susceptibles de faire échouer le traitement
Essai pragmatique Essai explicatif
ANALYSE EN INTENTION DE TRAITER
L’exemple du Centoxin (1)
Maladie : Septicémie à Gram –
Traitement : Centoxin vs Placebo
Critère principal : Mortalité à 28 jours
Pour être efficace le Centoxin doit être donné
très précocement, bien avant la confirmation
bactériologique par les hémocultures
Centoxin Placebo
N Randomisés car suspicion de
septicémie à Gram – 262 281 543
N Exclus car pas de confirmation
bactériologique 157 189
346
(63,7%)
N Analysés 105 92 197
Décès parmi les analysés 32
(31%)
45
(49%)
RR=0,62
p=0,014
Décès parmi tous les patients 102
(39%)
121
(43%)
RR=0,91
p=0,24
Ziegler EJ, NEJM 1991
Résultat fut
accepté
Coût : 3 500 €
ANALYSE EN INTENTION DE TRAITER
L’exemple du Centoxin (2)
La sélection a entraîné un déséquilibre des groupes
Centoxin Placebo
CIVD 18 % 21 %
Détresse respiratoire de l’adulte 9 % 13 %
Défaillance hépatique aigue 19 % 26 %
Insuffisance rénale aigue 35 % 46 %
En pratique la vraie question est :
chez des patients avec suspicion
de septicémie à Gram –, le
Centoxin apporte-t-il un bénéfice ?
Effet non confirmé par essai CHESS (n=2 199)
McCloskey RV, Ann Intern Med 1994
BIAIS D’ATTRITION
L'efficacité d'un traitement hypertenseur a été évalué dans un essai
randomisé contre placebo réalisé en double insu.
1250 ont été randomisés dans le groupe traité et 1254 dans le groupe
contrôle. En moyenne, les patients ont été suivi 5,1 ans. Au terme de
l'essai, 15% des patients avaient arrêté de prendre le traitement de
l'étude. Étant donné que ces patients ne pouvaient bénéficier de l'effet du
traitement, il n'ont pas été pris en considération dans l'analyse. Ainsi 159
décès / 1062 patients ont été observés dans le groupe traité et 213 / 1254
dans le groupe contrôle conduisant à un risque relatif de 0.88 (p<0.05).
Ce résultat démontre que ce traitement permet de réduire la mortalité des
patients hypertendus.
La conclusion proposée est-elle justifiée ? OUI NON
PERTINENCE CLINIQUE
Objectif de l’essai (1)
Pour être définit, l’objectif doit préciser :
Le traitement testé
Le comparateur (placebo ou traitement actif)
Le critère de jugement principal (et le moment de sa mesure)
Les patients concernés (maladie et caractéristiques particulières)
Composantes de l’estimation de la pertinence clinique
Estimation de la taille de l’effet doit être précise : éliminer un effet sans
intérêt en pratique clinique
Comparateur adapté : placebo ou traitement de référence validé
Patients inclus doivent être représentatifs des patients vus en pratique
clinique
PERTINENCE CLINIQUE
Objectif de l’essai (2)
Pertinence de la question thérapeutique ou
préventive
Pertinence du critère de jugement principal
Pertinence du traitement testé et de sa durée
Pertinence du comparateur
PERTINENCE CLINIQUE
Comparateur adapté
Si comparateur est un placebo : il n’existe pas de
traitement de référence ayant démontré son efficacité
Si comparateur est un traitement de référence :
efficacité établie aux doses et schéma utilisés dans
l’essai
Le nouveau traitement est étudié en présence des
traitements concomitants utilisés en pratique clinique
dans la pathologie considérée
PERTINENCE CLINIQUE
Praticabilité du traitement
La mise en œuvre du traitement est réalisable
en pratique clinique
Schéma thérapeutique
Surveillance, etc.
Traitement est arrêté en cas de mauvais
tolérance de façon similaire à ce qui se passe
en pratique
Pas d’arrêt non justifié
PERTINENCE CLINIQUE
Critère de jugement
Critère clinique
Correspond à un objectif pertinent pour le
patient
Si critère composite, chaque composante
à la même pertinence
Le moment de mesure est pertinent
PERTINENCE CLINIQUE
Représentativité des patients inclus
Le risque de survenue d’événement dans le groupe
contrôle est proche de celui rencontré chez ses
patients
Les critères de sélection font appels à des
techniques et des méthodes disponibles en routine
Pas de limite d’âge supérieure si non justifiée
Définition opérationnelle de la maladie
correspondant à ce que l’on rencontre en pratique
PERTINENCE CLINIQUE
Dans la pathologie considérée il est admis qu'un traitement
entraînant une réduction relative du risque inférieure à 10% ne
présente pas d'intérêt en pratique.
Dans un essai évaluant un nouveau traitement, la réduction relative
du risque est de 6% avec un intervalle de confiance à 95% de
[10%;1%].
Ce résultat permet de conclure que ce traitement apporte un
bénéfice cliniquement pertinent ?
La conclusion proposée est-elle justifiée ? OUI NON