144
Lecture critique d’article Rappels Rappels Bio statistiques Dr MARC CUGGIA MCU-PH Laboratoire d’informatique médicale EA-3888

RENNES20080904020233cuggiaLCA Rappels Stat

Embed Size (px)

Citation preview

Page 1: RENNES20080904020233cuggiaLCA Rappels Stat

Lecture critique d’article

RappelsRappels

Bio statistiques

Dr MARC CUGGIA

MCU-PH

Laboratoire d’informatique médicale

EA-3888

Page 2: RENNES20080904020233cuggiaLCA Rappels Stat
Page 3: RENNES20080904020233cuggiaLCA Rappels Stat

Plan du cours

• Rappels fondamentaux

• Statistiques descriptives

• Notions de tests statistiques

• Algorithme de décision• Algorithme de décision

• Quelques tests

– Test T de student

– χ2– Corrélation – régressions linéaire et Logistique

• Survie : Kaplan Meier et Log Rankhttp://www.med.univ-rennes1.fr

Page 4: RENNES20080904020233cuggiaLCA Rappels Stat

Introduction

• La méthode statistique a pour but de:

– dégager certaines propriétés d'un ensemble demesures (ou d'observations)mesures (ou d'observations)

– ou de décrire cet ensemble (appelé population).

http://www.med.univ-rennes1.fr

Page 5: RENNES20080904020233cuggiaLCA Rappels Stat

http://www.med.univ-rennes1.fr

Page 6: RENNES20080904020233cuggiaLCA Rappels Stat

Introduction

http://www.med.univ-rennes1.fr

Page 7: RENNES20080904020233cuggiaLCA Rappels Stat

Introduction

http://www.med.univ-rennes1.fr

Page 8: RENNES20080904020233cuggiaLCA Rappels Stat

http://www.med.univ-rennes1.fr

Page 9: RENNES20080904020233cuggiaLCA Rappels Stat

Introduction

http://www.med.univ-rennes1.fr

Page 10: RENNES20080904020233cuggiaLCA Rappels Stat

Introduction

http://www.med.univ-rennes1.fr

Page 11: RENNES20080904020233cuggiaLCA Rappels Stat

http://www.med.univ-rennes1.fr

Page 12: RENNES20080904020233cuggiaLCA Rappels Stat

L ’échantillon

• Un bon échantillon = image réduite de la population.

• L’échantillon doit être « représentatif » de la population étudiée

• Dans le cas contraire, on dit que l'échantillon est biaisé.

• Le choix de l'échantillon, le recueil des données nécessaires à l'étude � la partie fondamentale, la plus longue, de l'étude.

http://www.med.univ-rennes1.fr

Page 13: RENNES20080904020233cuggiaLCA Rappels Stat

Statistiques descriptives

http://www.med.univ-rennes1.fr

Page 14: RENNES20080904020233cuggiaLCA Rappels Stat

Statistiques descriptives

• Le but : décrire un ensemble d'observations à l'aide de quelques éléments caractéristiques.

• Entraine généralement une perte d’informationd’information

• Méthode statistiques descriptives dépendent de la nature des variables

http://www.med.univ-rennes1.fr

Page 15: RENNES20080904020233cuggiaLCA Rappels Stat

Variables

• Caractéristique ou facteur susceptible de prendre une valeur différente selon les individus étudiés

• Différents types de variables

– Quantitatives

– Qualitatives

http://www.med.univ-rennes1.fr

Page 16: RENNES20080904020233cuggiaLCA Rappels Stat

Variables qualitatives

• Non mesurables

• Revient à définir des catégories ou classes exclusives correspondant aux différentes modalités du caractère observé, puis à déterminer à quelle classe appartient chaque individu.

• On dénombre les effectifs appartenant à chacune des classes

• Exemples: le sexe, la couleur des yeux, l'efficacité ou la non efficacité d'un

traitement, la nature des cellules d'un tissu, le groupe sanguin,....

• 3 types

– Variables qualitatives ordinales

– Variables qualitatives nominales

– Variables qualitatives binaires

http://www.med.univ-rennes1.fr

Page 17: RENNES20080904020233cuggiaLCA Rappels Stat

Variables quantitatives

• Caractérisées par des valeurs numériques

– Exploitable arithmétiquement

• Variables quantitatives continues

– Prennent n’importe quelles valeurs numériques dans l’intervalle d’observationd’observation

– Appartient à l’ensemble des réels : toutes les valeurs sont possibles

• Poids 56,3 kg

• Taille 1,72 m

• Cholestérol 2,22 g/l

– Attention au nombre de décimale

– Très utilisées en médecine

– La précision est limitée par l’instrument de mesure

http://www.med.univ-rennes1.fr

Page 18: RENNES20080904020233cuggiaLCA Rappels Stat

• Variables quantitatives discrètes

– Variables numériques discontinues.

– En général valeurs entières

– Souvent � à un dénombrement

• Rechute d’une maladie 3 rechute par an

• Rappel de vaccin 4 injections

• Dentition 32 dents

• Variables temporelles

– Variables quantitatives particulières utilisant les unités de temps

– Analyse de survie

http://www.med.univ-rennes1.fr

Page 19: RENNES20080904020233cuggiaLCA Rappels Stat

http://www.med.univ-rennes1.fr

Page 20: RENNES20080904020233cuggiaLCA Rappels Stat

Caractérisation des données qualitatives et ordinales

unidimensionnelles

• Fréquence absolue et tableau des effectifs

• Fréquences relatives

• Fréquences cumulées (relatives et absolues) • Fréquences cumulées (relatives et absolues)

• Diagramme "camembert"

• Diagramme en bâtons et mode

http://www.med.univ-rennes1.fr

Page 21: RENNES20080904020233cuggiaLCA Rappels Stat

Fréquence absolue et tableau des

effectifs

• La fréquence absolue est le nombre d'individus par classe.

• Ce dénombrement donne lieu à une représentation des données sous forme de représentation des données sous forme de tableau.

http://www.med.univ-rennes1.fr

Page 22: RENNES20080904020233cuggiaLCA Rappels Stat

• Sur les classes ainsi formées, seules les opérations suivantes sont permises:

– réaliser des classes disjointes à partir d'une seule classe,

– regrouper certaines classes.

• La seule relation qui puisse être utilisée sur ces données est la relation d'appartenance à une même classe.

http://www.med.univ-rennes1.fr

Page 23: RENNES20080904020233cuggiaLCA Rappels Stat

Fréquences relatives

• Les fréquences relatives sont, pour chaque classe, le rapport de son effectif au nombre total d'individus de la série des mesures.

• La somme des fréquences relatives est égale à 1.

N

nf

ii =

• La somme des fréquences relatives est égale à 1.

– Parfois, les résultats sont exprimés en pourcentage, chacune des fréquences relatives étant multipliée par 100 et arrondies à l'unité

http://www.med.univ-rennes1.fr

Page 24: RENNES20080904020233cuggiaLCA Rappels Stat

• On peut représenter les effectifs absolus ou relatifs des classes par dessecteurs de cercle dont la surface est proportionnelle à l'effectif.

• Le diagramme "camembert" est bien adapté à la représentation desdonnées qualitatives "pures".

Yeux Marron Vert Bleu Noir

http://www.med.univ-rennes1.fr

Effectif 50 10 28 12

Page 25: RENNES20080904020233cuggiaLCA Rappels Stat

Diagramme en bâtons

• Pour les données ordinales on peut également représenter les fréquences absolues, relatives ou cumulées par un diagramme en bâtons.

• Exemple: échantillon de 500 cancéreux dont on a noté le stade.

http://www.med.univ-rennes1.fr

Page 26: RENNES20080904020233cuggiaLCA Rappels Stat

Caractérisation des données qualitatives à deux dimensions

• Les modalités de deux variables qualitatives permettent de constituer des classes exclusives auxquelles sont affectées chaque observation.

• Les classes exclusives sont représentées sous la forme d'un tableau appelé tableau de contingence.

http://www.med.univ-rennes1.fr

Page 27: RENNES20080904020233cuggiaLCA Rappels Stat

Caractérisation des données quantitatives à une dimension

• Rappel: les variables quantitatives peuvent être de deux types: variables discontinues (ou discrètes) et variables continues.

• Dans le cas des variables discontinues, il est possible de représenter les données par un diagramme en bâtons, comme dans le cas de données ordinales. ordinales.

• Dans tous les cas, on peut diviser l'intervalle de variation de la variable en un certain nombre de classe et l'on dénombre toutes les mesures à l'intérieur de chaque classe.

http://www.med.univ-rennes1.fr

Page 28: RENNES20080904020233cuggiaLCA Rappels Stat

Histogramme

• Construction:

– on porte sur l'axe des abscisses les extrémités de chaque classe

– pour chacune d'elles on construit un rectangle dont la base est le segment limité aux extrémités de la classe et la surface est proportionnelle à l'effectif de la classe.

effectif

http://www.med.univ-rennes1.fr

effectif

an

Page 29: RENNES20080904020233cuggiaLCA Rappels Stat

Histogramme

• Pour les variables quantitatives– Il faut le plus souvent regrouper en classe

Intervalle : 5 ansIntervalle : 1 ans

http://www.med.univ-rennes1.fr

Intervalle : 10 ans

Page 30: RENNES20080904020233cuggiaLCA Rappels Stat

Les graphiques

• Les tableau représentent les données exactes

• Les graphique font ressortir une vision synthétique

• Recommandation dans un articles :

– Figures numérotées en chiffre arabe

– Numérotation correspond à l’ordre d’appel dans le texte

– Toute figure est appelée dans le texte

– Pas de 3 d ni de camembert

– Éviter les superpositions de graphe

– Pas de colorisation abusive

– Simple

– Légendé (titre, axes, unités)

– Honnête

http://www.med.univ-rennes1.fr

Page 31: RENNES20080904020233cuggiaLCA Rappels Stat

Mesures en statistiques

http://www.med.univ-rennes1.fr

Page 32: RENNES20080904020233cuggiaLCA Rappels Stat

Paramètres– 2 types :

• Paramètres de POSITION

– Médiane

– Quartiles, déciles, percentiles

– Mode

– Moyenne

– Fréquences relatives

Fré

quen

ce

DISPERSION

– Fréquences relatives

• Paramètres de Dispersion

– Extrêmes (Minimum, Maximum)

– Entendue (Range)

– Intervalle interquartile

– Variance

– Écart type

– Coefficient de variation

http://www.med.univ-rennes1.fr

POSITION

Page 33: RENNES20080904020233cuggiaLCA Rappels Stat

Moyenne

• Moyenne

• La moyenne s'exprime dans les mêmes unités que les valeurs observées.

• Indicateur de tendance centrale servant à résumer une série de F

réqu

ence

servant à résumer une série de données d’une variable quantitative

http://www.med.univ-rennes1.fr

X

Fré

quen

ce

M x

Page 34: RENNES20080904020233cuggiaLCA Rappels Stat

Médiane

• Est la valeur qui partage la série des individus en 2 groupes d’effectifs égaux.

• La médiane est moins influencée que la • La médiane est moins influencée que la moyenne arithmétique par les valeurs extrêmes de la variable.

• La moitié des sujets présentent une valeur inférieure à la médiane. L’autre moitié une valeur supérieure à la médiane.

http://www.med.univ-rennes1.fr

Page 35: RENNES20080904020233cuggiaLCA Rappels Stat

• Quartiles

– Sont les 3 valeurs qui partagent la distribution en 4

25% 25% 25%

http://www.med.univ-rennes1.fr

25%

25%

25% 25%

Page 36: RENNES20080904020233cuggiaLCA Rappels Stat

– 1er quartile : sépare 25% des valeurs les plus faibles et 75% des valeurs les plus élevés

25% 75%

http://www.med.univ-rennes1.fr

25% 75%

Page 37: RENNES20080904020233cuggiaLCA Rappels Stat

– 3 ème quartile : sépare 75% des valeurs les plus faibles et 25% des valeurs les plus élevés

75% 25%

http://www.med.univ-rennes1.fr

75% 25%

Page 38: RENNES20080904020233cuggiaLCA Rappels Stat

• Le deuxième quartile sépare 50 % des valeurs les plus faible de 50% des valeurs les plus élevées

• 2ème quartile � Médiane !

50 % 50 %

http://www.med.univ-rennes1.fr

50 % 50 %

Page 39: RENNES20080904020233cuggiaLCA Rappels Stat

Dispersion

http://www.med.univ-rennes1.fr

Page 40: RENNES20080904020233cuggiaLCA Rappels Stat

Dispersion

• Min Max :

– Très sensible aux valeurs extrêmes

– Permet de détecter les erreurs

• Étendue : Valeur Max – Valeur min

• Espace interquartiles

– Qi = Q3 – Q1

– contient 50% des valeurs de la série

http://www.med.univ-rennes1.fr

Page 41: RENNES20080904020233cuggiaLCA Rappels Stat

• Écart type :

– D’une population

– D’un échantillon – D’un échantillon

– Écart type = même grandeur que la moyenne.

m±s

http://www.med.univ-rennes1.fr

Page 42: RENNES20080904020233cuggiaLCA Rappels Stat

http://www.med.univ-rennes1.fr

Page 43: RENNES20080904020233cuggiaLCA Rappels Stat

frel^

0.4

0.8

0.6

C

Des changements pour les valeurs de la moyenne et la variance entraînent des changements dans la forme et la position de la

http://www.med.univ-rennes1.fr

0 2 4 6 8 10 12

0.2

0.4

Y

A

B

forme et la position de la distribution normale.A. µ µ µ µ = 4, σ σ σ σ = 1B. µ µ µ µ = 8, σ σ σ σ = 1C. µ µ µ µ = 8, σ σ σ σ = 0.5

Page 44: RENNES20080904020233cuggiaLCA Rappels Stat

• σσ POINT D’INFLEXION DE LA COURBE

http://www.med.univ-rennes1.fr

σ

Page 45: RENNES20080904020233cuggiaLCA Rappels Stat

Box Plot

http://www.med.univ-rennes1.fr

x

Page 46: RENNES20080904020233cuggiaLCA Rappels Stat

• Un distribution peut donc être résumé par :

• Un paramètre de position

• Un paramètre de dispersion

http://www.med.univ-rennes1.fr

Page 47: RENNES20080904020233cuggiaLCA Rappels Stat

• les résultats d'une étude, réalisée sur un échantillon représentatif de nourrissons masculins, ont donné une estimation de la taille moyenne de 60,2 cm avec un intervalle taille moyenne de 60,2 cm avec un intervalle de confiance à 95 % de [59,2 - 61,2].

• Il y aurait donc 95 chances sur cent pour que la taille moyenne des nourrissons masculins Français de 3 mois soit comprise entre 59,2 et 61,2 cm.

http://www.med.univ-rennes1.fr

Page 48: RENNES20080904020233cuggiaLCA Rappels Stat

Principes des tests statistiques

Page 49: RENNES20080904020233cuggiaLCA Rappels Stat

Introduction (1)

• Le test statistique est l’outil de la comparaison

• Lorsqu’on effectue une comparaison entre deux ou plusieurs séries de données, on observe toujours une différence, plus ou moins grande entre les paramètres mesurés

• Le but du test : si la différence observée est simplement due au hasard (fluctuations d’échantillonnage) ou si au contraire la différence observée est bien réelle

Page 50: RENNES20080904020233cuggiaLCA Rappels Stat

Condition d’utilisation d’un test (1)

• Il doit être réalisé dans le cadre d’une réflexion scientifique

• C’est une démarche dans laquelle des hypothèses sont bâties à partir de faits antérieurs observés

• Ensuite ces hypothèses sont testées

• A partir des résultats des tests, les hypothèses sont soit rejetées soit acceptées

• Puis de nouvelles hypothèses sont bâties

• Les résultats d’un test n’ont de valeur que si ils sont inscrits dans cette démarche

Page 51: RENNES20080904020233cuggiaLCA Rappels Stat

Condition d’utilisation d’un test (2)

• Ex : On veut comparer la taille des individus qui passent le samedi après midi sur les trottoirs droites et gauches de la rue de la liberté à Rennes

• On pourrait effectivement trouver une différence, même significativesignificative

• Mais elle n’aurait aucun sens

• La démarche qui consisterait à rechercher à POSTERIORI une explication à ce phénomène serait absurde

Page 52: RENNES20080904020233cuggiaLCA Rappels Stat

Conditions d’applications (4)

• Parallèlement, il existe 2 familles de tests :

– Les tests paramétriques qui comparent les paramètres entres eux, nécessitant certaines conditions sur la distribution de la variabledistribution de la variable

– Les tests non paramétriques ou de rang, qui comparent des distributions, sans hypothèse particulière sur la distribution de la variable étudiée

Page 53: RENNES20080904020233cuggiaLCA Rappels Stat

Conditions d’applications (5)

• Il existe également deux types de test :

– Les comparaisons entre des séries d’individus

– Les tests de liaisons entre 2 variables

Page 54: RENNES20080904020233cuggiaLCA Rappels Stat

Principe du test de comparaison (1)

• On a deux situation :

1. Comparer un échantillon observé à une population de référence :• On se demande si la distribution de la population dont est issu

l’échantillon est identique à la distribution théorique, ou bien si l’échantillon est identique à la distribution théorique, ou bien si elle est différente

Population inconnue

échantillon

Populationde référence

Page 55: RENNES20080904020233cuggiaLCA Rappels Stat

Principe du test de comparaison (2)

2. Comparer deux ou plusieurs échantillons entres eux :• On se demande si les distributions des populations dont sont issus les

échantillons sont identiques ou différentes.

Population 1

Échantillon 1

Population 2

Échantillon 2

Page 56: RENNES20080904020233cuggiaLCA Rappels Stat

Principe du test de comparaison (3)

• Dans les deux situations, l’objet du test est de comparer les 2 populations

• Le principe du test est de regarder :• Le principe du test est de regarder :

– si la différences observées est due au hasard ou au contraire, cette différence est telle qu’il est peu probable de l’observer par hasard

Page 57: RENNES20080904020233cuggiaLCA Rappels Stat

Étapes d’un test de comparaison

1. Établir l’hypothèse nulle

2. Proposer une hypothèse alternative

3. Choisir le test et vérifier ses conditions d’application

4. Calcul du test

5. Les risques d’erreur

6. Interprétation finale d’un test de comparaison

Page 58: RENNES20080904020233cuggiaLCA Rappels Stat

Établir l’hypothèse nulle (H0)

• l’hypothèse a priori : les paramètres ou les distributions des populations dont sont issus les échantillons sont identiques.

Page 59: RENNES20080904020233cuggiaLCA Rappels Stat

Hypothèse alternative H1 (1)

• l’hypothèse H1 sera retenue au cas où les résultats du tests aboutiraient à rejeter H0

Page 60: RENNES20080904020233cuggiaLCA Rappels Stat

Hypothèse alternative H1 (2)

• Selon le type du problème posé, on propose une H1

alternative bilatérale ou unilatérale.

• H1 bilatérale : lorsqu’on ne cherche pas à connaître le sens de la différence. On se contente de postuler que les 2 paramètres ou les deux distributions sont différents.paramètres ou les deux distributions sont différents.

ParamètrePopulation 1

ParamètrePopulation 2

Page 61: RENNES20080904020233cuggiaLCA Rappels Stat

Hypothèse alternative H1 (3)

• H1 unilatérale : si l’on s’intéresse à un sens particulier de l’inégalité de 2 paramètres tel que

paramètre 1> paramètre 2 paramètre 1< paramètre 2paramètre 1> paramètre 2 paramètre 1< paramètre 2

ParamètrePopulation 1

ParamètrePopulation 2

ParamètrePopulation 1

ParamètrePopulation 2

Page 62: RENNES20080904020233cuggiaLCA Rappels Stat

Exercice (1)

• On veut comparer la fréquence du palu dans deux régions d’Afrique. P1 et P2 les fréquences des individus infectés dans ces deux régions :

– Poser l’hypothèse nulle H0

– Poser l’hypothèse alternative H1

Page 63: RENNES20080904020233cuggiaLCA Rappels Stat

Exercice (2)

• H0 : P1 = P2 : les deux fréquences sont identiques

• H1 : P1 ≠ P2 : les deux fréquences sont différentes

• Il s’agit d’une hypothèse alternative bilatérale car on ignore a priori dans quelle région la fréquence du palu est la plus élevée.

Page 64: RENNES20080904020233cuggiaLCA Rappels Stat

Exercice (3)

• On désire tester un vaccin contre le palu en comparant la survenue de palu entre un groupe vacciné et un groupe témoin non vacciné.

• P1 et P2 le pourcentage des individus infectés dans chacune des deux populations représentés par les deux groupes.

1 2

des deux populations représentés par les deux groupes.

• Poser H0 et H1

Page 65: RENNES20080904020233cuggiaLCA Rappels Stat

Exercice (4)

• H0 : P1 = P2 : Le vaccin n’a aucune efficacité

• H1 : P1 < P2 : La fréquence des individus infectés dans le groupe vacciné est inférieure à la fréquence dans le groupe non vacciné.non vacciné.

• H1 unilatérale car on s’intéresse dans ce cas exclusivement aux effets bénéfiques attendus du vaccin.

Page 66: RENNES20080904020233cuggiaLCA Rappels Stat

Calcul du test de comparaison (1)

• Un fois les hypothèses clairement posées, on applique le test.

• Les tests consistent à :

– Calculer une quantité mathématique u qui exprime l’écart – Calculer une quantité mathématique uo qui exprime l’écart entre les paramètres ou les distributions.

– À confronter uo à un modèle de distribution théorique U.

– A regarder si uo est une valeur probable ou improbable de de U (que l’on borne en fonction du risque α)

Page 67: RENNES20080904020233cuggiaLCA Rappels Stat

Résultats d’un test de comparaison (2)

u1 u2

α1 α2α = α1 +α2

test

On ne rejette pas Ho

Page 68: RENNES20080904020233cuggiaLCA Rappels Stat

Résultats d’un test de comparaison (3)

u1 u2

α1 α2α = α1 +α2 α1 α2

On ne rejette pas Ho

Page 69: RENNES20080904020233cuggiaLCA Rappels Stat

Résultats d’un test de comparaison (4)

u1 u2

α1 α2α = α1 +α2

On ne rejette pas Ho

Page 70: RENNES20080904020233cuggiaLCA Rappels Stat

Résultats d’un test de comparaison (5)

2. u0 est extérieure à l’intervalle des valeurs limite [u1-u2] :

– Il est encore possible que ce résultat soit lié à une simple fluctuation d’échantillonnage (il reste α chances que ce soit vrai)

– On décide de ne pas tenir compte de cette faible probabilité– On décide de ne pas tenir compte de cette faible probabilité

– On rejette H0 et on accepte H1 d’une différence réelle entre les paramètres et les distributions étudiés

– On dit que cette différence est significative

Page 71: RENNES20080904020233cuggiaLCA Rappels Stat

Résultats d’un test de comparaison (6)

u1 u2

α1 α2α = α1 +α2 α1 α2

On rejette Ho

Page 72: RENNES20080904020233cuggiaLCA Rappels Stat

Choix des risques d’erreur (1)

1. Risque α :

• En rejetant H0 on prend un risque :

– la probabilité α d’observer des valeurs rares de la variable U, si H0 est vrai

– ���� Risque de se tromper en rejetant H0, si par malheur H0 était vraie.0 0

• C’est le risque d’affirmer une différence alors qu’elle n’ existe pas.

• Risque α ou risque de première espèce

• α = probabilité de rejeter H0, si H0 est vraie.

• α est fixé a priori. Sa valeur est universellement admise à 5%

Page 73: RENNES20080904020233cuggiaLCA Rappels Stat

Choix des risques d’erreur (2)

2. Risque β

• Risque de ne pas rejeter H0 alors que H1 était vrai.

– Ceci arrive lorsqu’il existe bel et bien uen différence entre paramètres étudiés mais la valeur observée u se situe néanmoins dans l’intervalle 95% des valeurs probables de U.

• Risque β : risque de deuxième espèce

• β = probabilité de ne pas rejeter H0, si H1 est vraie

• β est appelé manque de puissance.

• 1- β est appelé puissance d’un test = la capacité de rejeter H0 si celle-ci est effectivement fausse

• La puissance d’un test est liée à l’effectif des échantillon. Plus la taille augmente, plus la puissance augmente et le risque β diminue.

Page 74: RENNES20080904020233cuggiaLCA Rappels Stat

Interprétation finale du test de comparaison (1)

• Hypothèse nulle n’est pas rejetée :

– Rien ne permet d’affirmer que les paramètres ou les distributions comparés sont différents.

• On n’affirme jamais qu’une hypothèse nulle est vraie car :vraie car :

– Elle aurait peut-être pu être rejetée si la puissance du test était élevée

– Il existe de nombreuses raisons pour que les distributions mesurées soient identiques bien que les populations soient complètement distinctes (biais).

Page 75: RENNES20080904020233cuggiaLCA Rappels Stat

Interprétation finale du test de comparaison (2)

• On rejette H0 :

– On accepte donc H1 :

– H1 bilatérale : les distribution ou paramètres sont différents.

– H unilatérale : l’un des paramètres est inférieur (ou – H1 unilatérale : l’un des paramètres est inférieur (ou

supérieur) à l’autre.

• On s’intéresse au sens de la différence. Et donc qu’à une extrémité de la distribution U.

• Le risque de se tromper est α divisé par 2 (et donc deux fois moindre que la hypothèse bilatérale.)

Page 76: RENNES20080904020233cuggiaLCA Rappels Stat

Interprétation finale du test de comparaison (3)

• Degré de signification :

– Le risque α est fixé a priori (et le plus souvent à 5%)

– Lorsque le calcul de u0 montre que le seuil Uα a été franchi, on rejette H0avec un risque égal à α.

– On peut aller plus loin et préciser le risque pris ou la force de notre conviction à rejeter H0conviction à rejeter H0

– C’est le degré de signification p, a posteriori.

– On dit que la différence observée est significative au risque p

Page 77: RENNES20080904020233cuggiaLCA Rappels Stat

Interprétation finale du test de comparaison (4)

Page 78: RENNES20080904020233cuggiaLCA Rappels Stat

Principes des tests de liaison (1)• On teste l’existence d’une liaison entre deux variables X et Y

d’un échantillon :– Vérifier qu’il existe une relation d’ordre statistique entre ces variables

• 2 variables sont liées : – variation de l’une entraîne la variation de l’autre

• Variabilité biologique : – fluctuations dans les mesures des variables :

– pour une valeur de X, on peut observer plusieurs valeurs de Y et inversement

– Difficile d’utiliser un tableau ou un graphique pour étudier cette liaison

Page 79: RENNES20080904020233cuggiaLCA Rappels Stat

Principes des tests de liaison (2)

• On suppose que la liaison étudiée suit un modèle mathématique théorique:

– Test : vérifier si la relation observée se rapproche suffisamment du modèle théorique

• H0 : il n’existe pas d’adéquation avec le modèle proposé

• H : adéquation avec le modèle proposé • H1 : adéquation avec le modèle proposé

• Si on rejette H0 � on accepte H1 � il existe une relation statistique significative entre les 2 variables

• Une relation statistique, en aucun cas une relation de causalité

Page 80: RENNES20080904020233cuggiaLCA Rappels Stat

Exercice 1

• Posez H0 et H1 dans les situations suivantes:

– Comparaison de 2 traitement nouveaux A et B

– Comparaison de 4 traitements A, B, C et D– Comparaison de 4 traitements A, B, C et D

– Comparaison d’un traitement A versus placebo

– Variation de la hauteur des arbres en fonction de leur altitude

Page 81: RENNES20080904020233cuggiaLCA Rappels Stat

Réponses• Comparaison de 2 traitement nouveaux A et B

H0 : les deux traitements sont équivalentsH1 bilatérale : les deux traitement ont une efficacité différente

• Comparaison de 4 traitements ABC et DH0 : les 4 traitement sont équivalents.H1 bilatérale : au moins l’un des traitements a une efficacité différente des

autres.autres.

• Comparaison d’un traitement A versus placeboH0 : le traitement A et le placebo sont équivalentH1 unilatérale: Le traitement A a une activité supérieure au placebo

• Variation de la hauteur des arbres en fonction de leur altitudeH0 : il n’existe aucune liaison entre la hauteur des arbre et l’altitudeH1 unilatérale : il existe une liaison négative entre la hauteur des arbres et leur

altitude.

Page 82: RENNES20080904020233cuggiaLCA Rappels Stat

Exercice 2

• Vous participez à la mise au point d’un traitement supposé efficace sur une maladie mortelle, mais dangereux en cas d’utilisation erronée. L’efficacité du produit est testée sur des groupes d’animaux malades et sains.et sains.

• Vous choisissez α de : 10, 5 ou 1% ?

Page 83: RENNES20080904020233cuggiaLCA Rappels Stat

Réponse

• 1% : il faut avoir le moindre risque de conclure à tort à une efficacité qui n’existerait pas.

Page 84: RENNES20080904020233cuggiaLCA Rappels Stat

Exercice 3

• Vous participez à la mise au point d’un vaccin potentiellement efficace dans la prévention d’une maladie grave, et par ailleurs n’ayant pas d’effet secondaires.

• L’efficacité est testée en comparant un échantillon de sujets vaccinés par le nouveau vaccin et un échantillon vacciné par un vaccin placebo.

• Vous choisissez de diminuer prioritairement ?

– α

– β

– puissance

– taille des échantillons

Page 85: RENNES20080904020233cuggiaLCA Rappels Stat

Réponses

– β est le risque à diminuer en priorité. Il ne faudrait pas passer à côté d’une efficacité réelle du vaccin. On choisira un risque β faible.

– Un tel choix entraîne automatiquement une augmentation – Un tel choix entraîne automatiquement une augmentation de la puissance (1-β ) et donc de la taille des échantillons

Page 86: RENNES20080904020233cuggiaLCA Rappels Stat

Comment choisir un test ???

http://www.med.univ-rennes1.fr

Page 87: RENNES20080904020233cuggiaLCA Rappels Stat

Critère de

jugement

Qualitatif

Série appariées χ2 de Mc Nemar

Séries

indépendants

2 groupes

Effectif theo>5χ2 de Pearsonχ2 de Yates

Test de Fisher

Séries

indépendants

k groupes

Effectif theo>5χ2 de Pearsonχ2 de Yates

Test de Fisher

Hypothèses

vérifiées

1 groupe de sujet –

2 mesures répétées

n>30Ecart réduit

apparié

10<n<30Test de Student

apparié

2 groupes

n1 et n2>30 Test Ecart réduit

http://www.med.univ-rennes1.fr

Quantitatif

Hypothèses

Normalité, égalité

des variances

10<n1 et n2 <30 Test de Student

k groupes ANOVA

Hypothèses

non vérifiées

1 groupe 2 mesures

répétéesPetits effectifs Test de Wilcoxon

2 groupes Petits effectifsTest de Mann et

Whitney

k groupes Petits effectifsTest de Kruskall et

Wallis

Page 88: RENNES20080904020233cuggiaLCA Rappels Stat

Vérifiée1 échantillon

n couples (x,y)

Comparaison à 0 de la

pente de la droite de

régression liant Y à X

Coefficient de

http://www.med.univ-rennes1.fr

Liaison entre 2

caractères quantitatifs

Hypothèses vérifiées

normalité

égalité des variances

Coefficient de

corrélation Pearson et

son test

Non vérifiés1 échantillon

n couples (x,y)Petits effectifs

Coefficient de

corrélation de

Spearman et son test

Page 89: RENNES20080904020233cuggiaLCA Rappels Stat

Test du χ2

Page 90: RENNES20080904020233cuggiaLCA Rappels Stat

Test du χ2

• Formulation équivalente :– Test du chi-deux, du chi-carré, du χ2 Pearson

• Ils servent à étudier la relation entre 2 variables qualitatives :– Liens entre survenue d’une maladie (M+,M-) et – Liens entre survenue d’une maladie (M+,M-) et

sexe (M,F)– Catégorie socioprofessionnelles et département

bretons– % des prématurés en France versus Angleterre

Page 91: RENNES20080904020233cuggiaLCA Rappels Stat

Tableau de contingence • χ ² s’applique à des effectifs regroupés sur un tableau de contingence

• Un tableau comportant des effectifs observés (Oij) dans ces cases et les totaux de chaque ligne et de chaque colonne dans ses marges

Classes de la B B … B TotalClasses de la variable A

B1 B2 … Bj Total

A1 O11 O12 t1

A2 O21 t2

Ai Oij ti

Total n1 n2 nj N

Page 92: RENNES20080904020233cuggiaLCA Rappels Stat

Comparaison de 2 pourcentages (5)

Page 93: RENNES20080904020233cuggiaLCA Rappels Stat

Interprétation du test de χ2 (α = 5%)• Condition d’application :

– Les effectifs théoriques doivent être supérieurs ou égaux à 5

• H1 bilatérale : – Si χ2

o est inférieur à χ25% on ne rejette pas H0. : pas de lien entre les 2

variables, ou pas de différence entre les %

– Si χ2o est supérieur à χ2

5% on rejette H0 : il existe un lien significatif – Si χ o est supérieur à χ 5% on rejette H0 : il existe un lien significatif entre les 2 variables, ou différence significative entre les %. On cherche alors p.

Page 94: RENNES20080904020233cuggiaLCA Rappels Stat

Exercice

Page 95: RENNES20080904020233cuggiaLCA Rappels Stat
Page 96: RENNES20080904020233cuggiaLCA Rappels Stat
Page 97: RENNES20080904020233cuggiaLCA Rappels Stat

Comparaison de 2 pourcentages (1)

• Exemple de problème :

– Des patients atteints de la même maladie ont été traités par deux traitements différents.

– Parmi les 70 qui ont reçu le traitement A, 22 (31,4%) ont guéri.guéri.

– Parmi les 50 qui ont reçu le traitement B, 25 (soit 50%) ont guéri.

– Le taux de guérison est il différent entre les deux traitement ?

Page 98: RENNES20080904020233cuggiaLCA Rappels Stat

Test de T

Page 99: RENNES20080904020233cuggiaLCA Rappels Stat

Exercice : 1 échantillon / population

• Dans un échantillon de 18 sujets suspects d’être atteints de trypanosomiase, on mesure la quantité de protéines dans le liquide céphalorachidien.

• On trouve dans ce groupe une protéinorachie moyenne de 460 mg/l avec un écart type de 280 mg/l.

• Dans la population générale, la protéinorachie est en moyenne de 300 mg/l.

• On se demande si ce groupe de sujet présente une protéinorachiedifférente de normale ?

– Formulez les hypothèses H0 et H1

– Quel test utilisez-vous ? Justifiez la réponse

– Que concluez vous ?

Page 100: RENNES20080904020233cuggiaLCA Rappels Stat

Réponse

• H0: la protéinorachie des sujets atteints de drépanocytose ne diffère pas de celle de la population générale

• H1: la protéinorachie des sujets atteints de drépanocytose est différente de celle de la population

• n < 30 : Test de T

• Condition d’application : on suppose que la protéinorachie est distribuée normalement chez les sujets atteints de drépanocytosenormalement chez les sujets atteints de drépanocytose

• to>t5%: on rejette H0

• la protéinorachie des sujets atteints de drépanocytose est significativement différente de celle de la population p < 0,03

Page 101: RENNES20080904020233cuggiaLCA Rappels Stat

Exercice 2 : comparaison de 2 échantillons independants

• On a mesuré un marqueur biologique chez 2 séries de sujets, l’une composée de sujets sains, l’autre de sujets atteints d’hépatite alcoolique. L’étude a trouvé les résultats suivants:

Effectif (n) Moyenne du marqueur (g/l)

Ecart type

Sujets sains 15 1,6 0,19

• On veut comparer les 2 populations.

– Formuler les hypothèses

– Quel test choisissez vous ?

– Quelles en sont les conditions d’application ?

– Que concluez vous ?

Sujets alcooliques 12 1,4 0,21

Page 102: RENNES20080904020233cuggiaLCA Rappels Stat

Exercice (2)• H0: la valeur moyenne du marqueur est identique dans les 2 populations

• H1: la valeur moyenne du marqueur est différente chez les sujets atteints d’hépatite alcoolique

• n < 30 : test de T

• Condition d’application : on suppose que :– le marqueur se distribue normalement dans les 2 populations

– Les variances des 2 populations sont égales– Les variances des 2 populations sont égales

• Calcul du test = on rejette H0

• Les malades atteints d’hépatite alcoolique présentent une valeur du marqueur significativement différente de celle des sujets sains p < 0,02

Page 103: RENNES20080904020233cuggiaLCA Rappels Stat

Exercice (1)

• On désire étudier l’effet d’une nouvelle stratégie de traitement du diabète sur la glycémie. On dose la glycémie chez 15 sujets avant le début du nouveau protocole (série A) et 3 mois après (série B) :

• Le nouveau protocole est-il efficace ?

A 2,47 3,09 2,14 2,47 3,06 2,72 2,29 1,90 2,34 2,75 2,67 2,80 2,51 2,23 2,20

B 2,30 2,96 2,23 2,34 2,84 2,59 2,15 1,88 2,32 2,65 2,68 2,58 2,43 2,02 2,17

• Le nouveau protocole est-il efficace ?

– Formuler les hypothèses

– Quel test choisissez vous ?

– Quelles en sont les conditions d’application ?

– Que concluez vous ?

Page 104: RENNES20080904020233cuggiaLCA Rappels Stat

Réponse

• Comparaison de moyennes sur séries appariées :

H0 : les glycémies sont identiques avant et après le nouveau protocoleH1 : la glycémie est abaissée grâce au nouveau protocole

• n < 30 : test de T

• Condition d’application : la différence de glycémie avant et après le traitement est distribuée de façon normaletraitement est distribuée de façon normale

• Calculs : on rejette H0

• La glycémie est abaissée significativement après administration de la nouvelle stratégie p < 0,0005

Page 105: RENNES20080904020233cuggiaLCA Rappels Stat

Corrélation et Régression linéaireRégression linéaire

Page 106: RENNES20080904020233cuggiaLCA Rappels Stat

Représentation graphique

• Etudier le lien entre 2 variables quantitatives : scatter ou nuage de points

• Représenter les couples de valeurs (x,y)

1 individu : Mr Dupont 1,85 m et 74 kg

Page 107: RENNES20080904020233cuggiaLCA Rappels Stat

Correlation et régression

• La régression permet d’étudier l’association entre deux variables quantitatives, en étudiant les variations de l’une en fonction des valeurs de l’autre.

• Le coefficient de corrélation est une mesure d’association • Le coefficient de corrélation est une mesure d’association entre deux variables quantitatives faisant jouer des rôles symétriques aux valeurs.

• On cherche à savoir simplement s’il existe une liaison entre ces deux variables et à quantifier l’intensité de la liaison

Page 108: RENNES20080904020233cuggiaLCA Rappels Stat

Interprétation de ρ

ρ>0 ρ<0

ρ=0

Page 109: RENNES20080904020233cuggiaLCA Rappels Stat

Propriété de ρ

• ρ est toujours compris entre -1 et 1

– ρ permet de mesurer la FORCE DE L’ASSOCIATION entre X et Y. Plus ρ est proche de +1 ou de -1, plus l’association est forte

Page 110: RENNES20080904020233cuggiaLCA Rappels Stat

• Si X et Y sont indépendantes alors ρ=0

– L’inverse n’est pas vrai :

– Si ρ~0, les variables peuvent soient être indépendantes mais aussi être liées (mais non linéairement)

– On peut seulement affirmer que les variables X et Y ne sont pas liées linéairementlinéairement

Page 111: RENNES20080904020233cuggiaLCA Rappels Stat

Test du r

• Rappel : r concerne les variables d’un échantillon

• Le calcul de r peut être sujet à fluctuation.

• Tester r, c’est tenter d’affirmer ou pas que sa valeur est statistiquement significative et ce avec un risque maîtrisé (p<0,05)

• Même mécanisme que pour les autres test : hypothèses sur la population

• Ho = Hypothèse nulle : ρ=0

• H1 = Hypothèse alternative :

– ρ=0 (test bilateral)

Page 112: RENNES20080904020233cuggiaLCA Rappels Stat

• Les observation pour chaque variable doivent être indépendantes les unes des autres.

– Ex : comparaison des données Y en fonction du temps X

– Les données de la veille ne sont pas indépendantes des données du lendemain.indépendantes des données du lendemain.

– Il ya auto-correlation � nécessite d’autres techniques d’analyse.

• Attention au facteur tiers : biais de confusion

http://www.ea3888.univ-rennes1.fr

Page 113: RENNES20080904020233cuggiaLCA Rappels Stat

Régression linéaire

Page 114: RENNES20080904020233cuggiaLCA Rappels Stat

Exemple• Termes de naissances (X) et les poids de

naissance (Y) d’une POPULATION de nouveau né

Terme (semaine)

Poids moyen de naissance (grammes)

27 1146,92

28 1292,73

29 1694,52

30 1892,00

31 1986,11

32 2000,34

33 2119,4633 2119,46

34 2290,85

35 2569,11

36 2800,77

37 3019,50

38 3210,61

39 3364,59

40 3475,05

41 3553,32

42 3582,63

43 3604,81

Page 115: RENNES20080904020233cuggiaLCA Rappels Stat

Exemple• Le poids moyen varie en

fonction du terme

• � il y a une liaison entre le terme et le poids de naissance

• La courbe de régression est celle qui joint les points successifssuccessifs

• La FONCTION de REGRESSION est la fonction qui permet de décrire mathématiquement cette courbe

Page 116: RENNES20080904020233cuggiaLCA Rappels Stat

Cas de la régression linéaire

xxYExf βα +== )/()(

En pratique, on ne recherche pas la forme exacte de la courbe.

On se contente le plus souvent d’une droite.

La fonction f est alors linéaire et d’équation :

xy βα +=ˆ

Page 117: RENNES20080904020233cuggiaLCA Rappels Stat

• La droite de régression permettant de mieux représenter les points est :

• ŷ= α + βx

• Sans être strictement linéaire, la liaison entre le terme et le poidspeut être représentée par unepeut être représentée par unedroite.

• On estime α et β

• On teste si β est significativement different de 0

Page 118: RENNES20080904020233cuggiaLCA Rappels Stat

Comment interpréter β et α• ŷ= - 3115,6 + 162,30 x

• Estimation de β= 162,30 (p=0,003) �augmentation moyenne du poids de naissance quand le terme augmente d’une semaine

– Augmentation MOYENNE

• Les poids de 2 bébés nés à 1 semaine • Les poids de 2 bébés nés à 1 semaine d’intervalle diffèrent EN MOYENNE de 162,30 g

• Elle n’est à considérer que sur la période considérée

• α n’a pas d’interprétation concrète.

• � au poids moyens des nouveau nés ayant un terme = 0 semaine

Page 119: RENNES20080904020233cuggiaLCA Rappels Stat

Régression linéaire multiple

Y=β1X1 + β2X2 +…+ βnXn + αY = variables dépendantes

Xn covariables ou variables explicatives

• Taille définitive (cm) = 0,881xT – 0,198xP – 1,597xAO + 0,403xTP + 3,958

• T : taille actuelle, P: actuel, AO= âge osseux, TP= moy taille parents

• Montre que la taille définitive dépend de différents facteurs

• Montre le poids relatif des facteurs

– Taille actuelle >5 cm � taille définitive = 0,881x5cm = 4,4cm

• Chaque coefficient β est testé (par rapport à 0)

– Exprimé soit avec le p

– soit avec intervalle de confiance : IC AO [-1,3;3]

• Si l’IC inclut 0 alors pas significatif

Page 120: RENNES20080904020233cuggiaLCA Rappels Stat

Régression logistique

• Idem régression linéaire

• Variable dépendante : qualitative binaire

– Ex : survenue ou pas d’une HTA

Logit probaHTA =0,068xtabac + 0,7xOb+0,9xRonf Logit probaHTA =0,068xtabac + 0,7xOb+0,9xRonf

– Les Co-variables sont qualitatives ou quantitatives

• Les exp β� odd ratio. : OR Ronf = exp(0,9) = 2,5• les β sont testés (p ou IC) : pas de significatif si contient 1

Page 121: RENNES20080904020233cuggiaLCA Rappels Stat

Introduction à l’analyse de survie

Page 122: RENNES20080904020233cuggiaLCA Rappels Stat

Etude de survie

• Principe :– S’intéresser à la survenue d’un événement décès au cours du

temps– Prendre en compte les données incomplètes ou censurées.

• Champs d’application– Description de la survie d’un groupe de sujet– Description de la survie d’un groupe de sujet– Comparaison de la survie de 2 ou plusieurs groupes dans un but

• Pronostique• Ou d’intervention (traitement, programme sanitaire, etc…)• …

• L’évènement peut être toute variable d’état de nature binaire

Page 123: RENNES20080904020233cuggiaLCA Rappels Stat

Exemple d’origines et d’évènements

Page 124: RENNES20080904020233cuggiaLCA Rappels Stat

En pratique clinique

• La description des évènements est rarement exhaustive.

– Il est rare de comptabiliser tous les décès

Observations complètes Observations incomplètesObservations complètes Observations incomplètes

Page 125: RENNES20080904020233cuggiaLCA Rappels Stat

Définitions pour l’analyse de survie

• Date d’origine– Date de début de prise en compte du suivi des

observations• Essai thérapeutique : par ex date du tirage au sort• Etude pronostique : date du diagnostic

• Date des dernières nouvelles• Date des dernières nouvelles– Date à laquelle les derniers renseignements

concernant l’état du sujet ont été colligés

• Etat aux dernières nouvelles– État caractérisé par une variable binaire : par ex :

vivant ou décédé.

Page 126: RENNES20080904020233cuggiaLCA Rappels Stat

Définitions pour l’analyse de survie

• Date de point :

– Choix d’une date au-delà de laquelle on ne tiendra pas compte de l’état

• Recul : • Recul :

– Délai écoulé entre la date d’origine et la date de point

• Temps de participation

– Calculé à partir de la date d’origine et de la date des dernières nouvelles ou de la date de point

Page 127: RENNES20080904020233cuggiaLCA Rappels Stat

Date d’origine Date des

dernières

nouvellesDate de point

Temps de participation

Recul

temps

Page 128: RENNES20080904020233cuggiaLCA Rappels Stat

Définitions pour l’analyse de survie

• Perdu de vue :

– Sujet dont on ne connaît pas l’état à la date de point

• Exclu vivant : • Exclu vivant :

– Sujet vivant à la date de point

Page 129: RENNES20080904020233cuggiaLCA Rappels Stat

Définitions pour l’analyse de survie

• Les dates permettent de calculer la durée du suivi pour chaque sujet ou le temps de participation à l'étude.

• On distingue deux situations :– le décès est survenu au cours du suivi, c'est-à-dire avant la

date de point (ou date de fin de suivi).date de point (ou date de fin de suivi).• � La durée de suivi est calculée entre la date d'origine

et la date du décès.

– le décès n'est pas observé au cours du suivi • �sa durée est alors censurée.• Deux cas se présentent alors

Page 130: RENNES20080904020233cuggiaLCA Rappels Stat

Exclus-vivants

• soit le sujet n'est pas décédé à la date de point. – Il est dit exclu-vivant.

– Sa durée de suivi est égale à la différence entre la date de point et la date d'origine. Mais, cela ne signifie pas qu'il est exclu de l'étude. Au contraire, on enrichit l'analyse

Date d’origineDate de point

Temps de participation

temps

Page 131: RENNES20080904020233cuggiaLCA Rappels Stat

Perdus de vue

• soit le sujet est perdu de vue. – Il ne vient plus aux visites de surveillance. – Sa durée de suivi est égale à la différence entre la date des dernières

nouvelles et la date d'origine. – Les perdus de vue requièrent une analyse attentive car il faut s'assurer

que le mécanisme par lequel ils sont perdus de vue est indépendantdu phénomène étudié, sinon un biais est introduit dans l'analyse.

Date d’origine

Temps de participation

?

Date des dernières

nouvellesDate de point

Page 132: RENNES20080904020233cuggiaLCA Rappels Stat

Estimation non paramétrique de Kaplan Meier

• Principe de l’estimation

– Être encore en vie après un instant t, c’est :

• Être en vie juste avant t

• Et ne pas mourir au temps t• Et ne pas mourir au temps t

Page 133: RENNES20080904020233cuggiaLCA Rappels Stat

Représentation graphique : courbe de survie

Sujet n°1

DCD

S(3)=0,9

Page 134: RENNES20080904020233cuggiaLCA Rappels Stat

Intervalle de confiance de l’estimateur de kaplan Meier

• Représentation graphique des intervalles de confiance

Page 135: RENNES20080904020233cuggiaLCA Rappels Stat

Médiane de survie

• Définie comme le temps auquel la fonction de survie estimée vaut 0,5.

Page 136: RENNES20080904020233cuggiaLCA Rappels Stat
Page 137: RENNES20080904020233cuggiaLCA Rappels Stat
Page 138: RENNES20080904020233cuggiaLCA Rappels Stat
Page 139: RENNES20080904020233cuggiaLCA Rappels Stat

Comparaison des courbes de survie

• Données du problèmes :

– Étude de population présentant le syndrome d’Alport.

– Événement étudié : survenue d’une insuffisance – Événement étudié : survenue d’une insuffisance rénale terminale

• Ex : Comparer les courbes de non survenue de l'insuffisance rénale terminale chez les

hommes par rapport aux femmes issus de familles différentes.

Page 140: RENNES20080904020233cuggiaLCA Rappels Stat

Comparaison des courbes de survie

Page 141: RENNES20080904020233cuggiaLCA Rappels Stat

Le test du Log Rank

• Comment vérifier si cette différence entre les 2 groupes est significative au seuil de 5 % ?– La méthode statistique la plus employée est le test

du logrank– consiste à comparer le nombre d'événements – consiste à comparer le nombre d'événements

observés, ici l'insuffisance rénale terminale, au nombre d'événements attendus,

• Si le test est significatif, les 2 courbes sont significativement différentes

Page 142: RENNES20080904020233cuggiaLCA Rappels Stat

Limites de l’interprétation

• Courbes qui se croisent– Dans ce cas, les risques s'inversent pour

chaque groupe à un moment donné. – Le test du logrank n'est plus approprié.

• Par exemple si, – dans un groupe, la mortalité

Chirurgie

Chimiothérapie

– dans un groupe, la mortalité postopératoires est précoce après la chirurgie d'un cancer mais qu'elle se stabilise ultérieurement

– et si la mortalité initiale est modérée après chimiothérapie mais qu'elle est importante ultérieurement,

– la décision médicale peut en être modifiée.

• Un nouveau protocole peut permettre de préciser ces profils de mortalité différentielle.

Page 143: RENNES20080904020233cuggiaLCA Rappels Stat

Limites de l’interprétationdes courbes de survie

• Des interprétations erronées liées à la lecture de la partie droite d'une courbe de survie.

• Il est habituel qu'une courbe s'aplanisse après un certain délai lorsque la survenue des événements est moins fréquente. moins fréquente. – Il n'est pas judicieux d'interpréter cet aplanissement

comme porteur de sens sauf si le nombre de sujets encore à risque reste encore important.

– A l'inverse, si la dernière donnée est un décès, la courbe de survie plonge vers l'axe des abscisses. Ceci ne signifie pas qu'aucun sujet ne survivrait au delà de ce temps de suivi.

Page 144: RENNES20080904020233cuggiaLCA Rappels Stat

Méthode actuarielle

• Même principe que KM

• Utile lorsque les effectifs sont importants

• Les taux sont évalués à intervalle régulier fixés a priori (par exemple tous les mois, ou tous les a priori (par exemple tous les mois, ou tous les ans )

ACTUARIELLE KAPLAN MEIER