41
Les sondages aléatoires simples Mahamadou HARO Ingénieur Statisticien Économiste Séminaire de sondage Mahamadou HARO (Ingénieur Statisticien Économiste) Les sondages aléatoires simples 11 Avril 2012 1 / 21

Chapitre2: Sondage aléatoire simple

Embed Size (px)

Citation preview

Page 1: Chapitre2: Sondage aléatoire simple

Les sondages aléatoires simples

Mahamadou HARO

Ingénieur Statisticien Économiste

Séminaire de sondage

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 1 / 21

Page 2: Chapitre2: Sondage aléatoire simple

Plan de la présentation

1 Principe

2 Estimation d’une moyenne

3 Estimation d’un total

4 Estimation d’une proportion

5 Estimation d’un ratio

6 Méthodes de tirage

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 2 / 21

Page 3: Chapitre2: Sondage aléatoire simple

Principe

Plan

1 Principe

2 Estimation d’une moyenne

3 Estimation d’un total

4 Estimation d’une proportion

5 Estimation d’un ratio

6 Méthodes de tirage

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 3 / 21

Page 4: Chapitre2: Sondage aléatoire simple

Principe

Introduction

De l’univers on extrait un échantillon de taille n, en accordant à chaqueunité statistique la même probabilité d’être tirée. L’échantillon peut êtretiré :

avec remise : une unité ayant été sélectionnée à un des tiragesest "remise dans l’urne de tirage" et participe aux tiragessuivants ; elle peut donc être tirée deux fois, ou plus ;sans remise : une fois une unité tirée, elle n’est plus prise encompte pour les tirages suivants (c’est le mode de tirage quisemble le plus "naturel").

Le sondage aléatoire simple est la base de la méthode des sondages,à partir de laquelle sont développées les autres méthodes présentéesdans ce manuel.

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 4 / 21

Page 5: Chapitre2: Sondage aléatoire simple

Principe

Introduction

De l’univers on extrait un échantillon de taille n, en accordant à chaqueunité statistique la même probabilité d’être tirée. L’échantillon peut êtretiré :

avec remise : une unité ayant été sélectionnée à un des tiragesest "remise dans l’urne de tirage" et participe aux tiragessuivants ; elle peut donc être tirée deux fois, ou plus ;sans remise : une fois une unité tirée, elle n’est plus prise encompte pour les tirages suivants (c’est le mode de tirage quisemble le plus "naturel").

Le sondage aléatoire simple est la base de la méthode des sondages,à partir de laquelle sont développées les autres méthodes présentéesdans ce manuel.

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 4 / 21

Page 6: Chapitre2: Sondage aléatoire simple

Estimation d’une moyenne

Plan

1 Principe

2 Estimation d’une moyenne

3 Estimation d’un total

4 Estimation d’une proportion

5 Estimation d’un ratio

6 Méthodes de tirage

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 5 / 21

Page 7: Chapitre2: Sondage aléatoire simple

Estimation d’une moyenne

Estimation d’une moyenne

Pour estimer la moyenne Y d’une variable Y sur l’univers (Y est biensûr inconnue) il semble naturel d’utiliser l’estimateur :

y =1n

n∑i=1

yi (1)

moyenne calculée sur les unités de l’échantillon. y est un estimateursans biais la moyenne de l’universY . Cette propriété peut s’écrire :

E(y) = Y

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 6 / 21

Page 8: Chapitre2: Sondage aléatoire simple

Estimation d’une moyenne

Variance de y

Dans le cas avec remise :

V (y) =V (Y )

n(2)

Dans le cas sans remise :

V (y) = (N − nN − 1

)V (Y )

n(3)

Ceci veut dire que la variance de l’estimateur sera d’autant plusfaible que :a)V(Y) sera faible ;b)la taille de l’échantillon sera importante.

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 7 / 21

Page 9: Chapitre2: Sondage aléatoire simple

Estimation d’une moyenne

Variance de y

Dans le cas avec remise :

V (y) =V (Y )

n(2)

Dans le cas sans remise :

V (y) = (N − nN − 1

)V (Y )

n(3)

Ceci veut dire que la variance de l’estimateur sera d’autant plusfaible que :a)V(Y) sera faible ;b)la taille de l’échantillon sera importante.

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 7 / 21

Page 10: Chapitre2: Sondage aléatoire simple

Estimation d’une moyenne

Pour un échantillon suffisamment grand, y suit une loinormale

À partir d’une certaine taille d’échantillon (disons au moins 30), ladistribution de la variable aléatoire y (c’est-à-dire l’ensemble desestimations fournies par tous les échantillons obtenus avec letirage équiprobable de taille n) s’ajuste sur une loi normale(courbe "en cloche" de Gauss) dont les caractéristiques sont liéesaux valeurs E(y) et V (y) étudiées ci-dessus.On sait que la distribution d’une loi normale de moyenne m etd’écart-type σ comprend 95% des valeurs dans l’intervalle[m − 1,96σ; m + 1,96σ].

Ici on peut dire que 95% des valeurs de y sont situées dansl’intervalle de [Y − 1,96

√V (y); Y + 1,96

√V (y)], où V (y) est

donnée par les formules (2) ou (3) ci-dessus.

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 8 / 21

Page 11: Chapitre2: Sondage aléatoire simple

Estimation d’une moyenne

Pour un échantillon suffisamment grand, y suit une loinormale

À partir d’une certaine taille d’échantillon (disons au moins 30), ladistribution de la variable aléatoire y (c’est-à-dire l’ensemble desestimations fournies par tous les échantillons obtenus avec letirage équiprobable de taille n) s’ajuste sur une loi normale(courbe "en cloche" de Gauss) dont les caractéristiques sont liéesaux valeurs E(y) et V (y) étudiées ci-dessus.On sait que la distribution d’une loi normale de moyenne m etd’écart-type σ comprend 95% des valeurs dans l’intervalle[m − 1,96σ; m + 1,96σ].Ici on peut dire que 95% des valeurs de y sont situées dansl’intervalle de [Y − 1,96

√V (y); Y + 1,96

√V (y)], où V (y) est

donnée par les formules (2) ou (3) ci-dessus.

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 8 / 21

Page 12: Chapitre2: Sondage aléatoire simple

Estimation d’une moyenne

Pour un échantillon suffisamment grand, y suit une loinormale

À partir d’une certaine taille d’échantillon (disons au moins 30), ladistribution de la variable aléatoire y (c’est-à-dire l’ensemble desestimations fournies par tous les échantillons obtenus avec letirage équiprobable de taille n) s’ajuste sur une loi normale(courbe "en cloche" de Gauss) dont les caractéristiques sont liéesaux valeurs E(y) et V (y) étudiées ci-dessus.On sait que la distribution d’une loi normale de moyenne m etd’écart-type σ comprend 95% des valeurs dans l’intervalle[m − 1,96σ; m + 1,96σ].Ici on peut dire que 95% des valeurs de y sont situées dansl’intervalle de [Y − 1,96

√V (y); Y + 1,96

√V (y)], où V (y) est

donnée par les formules (2) ou (3) ci-dessus.

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 8 / 21

Page 13: Chapitre2: Sondage aléatoire simple

Estimation d’une moyenne

La variance V (y) peut être estimée à partir del’échantillon

Dans les formules (2) et (3) ci-dessus, la quantité V(Y) estinconnue. Celle-ci va être estimée à partir des donnéesobservées sur l’échantillon. Si l’on note s2 la grandeur calculéesur l’échantillon :

s2 =1

n − 1

n∑i=1

(yi − y)2

Alors on a le résultat suivant :dans le cas sans remise, s2 est un estimateur sans biais de

NN−1V (Y )

dans le cas avec remise, s2 est un estimateur sans biais de V(Y).

Donc V (y) est estimée sans biais par :V (y) = s2

n dans le cas de tirage avec remise ;V (y) = (1 − n

N )s2

n dans le cas du tirage sans remise.Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 9 / 21

Page 14: Chapitre2: Sondage aléatoire simple

Estimation d’une moyenne

La variance V (y) peut être estimée à partir del’échantillon

Dans les formules (2) et (3) ci-dessus, la quantité V(Y) estinconnue. Celle-ci va être estimée à partir des donnéesobservées sur l’échantillon. Si l’on note s2 la grandeur calculéesur l’échantillon :

s2 =1

n − 1

n∑i=1

(yi − y)2

Alors on a le résultat suivant :dans le cas sans remise, s2 est un estimateur sans biais de

NN−1V (Y )

dans le cas avec remise, s2 est un estimateur sans biais de V(Y).

Donc V (y) est estimée sans biais par :V (y) = s2

n dans le cas de tirage avec remise ;V (y) = (1 − n

N )s2

n dans le cas du tirage sans remise.Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 9 / 21

Page 15: Chapitre2: Sondage aléatoire simple

Estimation d’une moyenne

La variance V (y) peut être estimée à partir del’échantillon

Dans les formules (2) et (3) ci-dessus, la quantité V(Y) estinconnue. Celle-ci va être estimée à partir des donnéesobservées sur l’échantillon. Si l’on note s2 la grandeur calculéesur l’échantillon :

s2 =1

n − 1

n∑i=1

(yi − y)2

Alors on a le résultat suivant :dans le cas sans remise, s2 est un estimateur sans biais de

NN−1V (Y )

dans le cas avec remise, s2 est un estimateur sans biais de V(Y).

Donc V (y) est estimée sans biais par :V (y) = s2

n dans le cas de tirage avec remise ;V (y) = (1 − n

N )s2

n dans le cas du tirage sans remise.Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 9 / 21

Page 16: Chapitre2: Sondage aléatoire simple

Estimation d’une moyenne

Dans la pratique on n’a tiré qu’un échantillon

Ce qui vient d’être dit aux paragraphes précédents doit êtrereplacé dans cette perspective. Les résultats ci-dessus présententla manière dont l’ensemble des valeurs calculées sur tous leséchantillons possibles se répartissent par rapport à la grandeurrecherchée Y .En pratique, le seul résultat dont on dispose est la moyenne ycalculée sur un échantillon, et Y est inconnue.On tient un raisonnement analogue au précédent, mais à partir dey , pour fournir un "intervalle de confiance" pour Y .on dispose de la valeur y ;on estime V (y) à partir de l’échantillon, on obtient donc uneestimation de σ(y) (racine carrée de la variance estimée V (y) ;

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 10 / 21

Page 17: Chapitre2: Sondage aléatoire simple

Estimation d’une moyenne

Dans la pratique on n’a tiré qu’un échantillon

Ce qui vient d’être dit aux paragraphes précédents doit êtrereplacé dans cette perspective. Les résultats ci-dessus présententla manière dont l’ensemble des valeurs calculées sur tous leséchantillons possibles se répartissent par rapport à la grandeurrecherchée Y .En pratique, le seul résultat dont on dispose est la moyenne ycalculée sur un échantillon, et Y est inconnue.On tient un raisonnement analogue au précédent, mais à partir dey , pour fournir un "intervalle de confiance" pour Y .on dispose de la valeur y ;on estime V (y) à partir de l’échantillon, on obtient donc uneestimation de σ(y) (racine carrée de la variance estimée V (y) ;

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 10 / 21

Page 18: Chapitre2: Sondage aléatoire simple

Estimation d’une moyenne

Remarques

La précision, en termes de variance de y est essentiellement liéeau nombre d’unités enquêtées n, et relativement peu au taux desondage n

N (pas du tout dans le cas avec remise).

La variance est proportionnelle à 1n ; l’écart-type, qui permet

d’établir l’intervalle de confiance, est proportionnel à 1√n .Ceci veut

dire que pour réduire de moitié l’intervalle de confiance, il fautquatre fois plus de questionnaires.

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 11 / 21

Page 19: Chapitre2: Sondage aléatoire simple

Estimation d’une moyenne

Remarques

La précision, en termes de variance de y est essentiellement liéeau nombre d’unités enquêtées n, et relativement peu au taux desondage n

N (pas du tout dans le cas avec remise).

La variance est proportionnelle à 1n ; l’écart-type, qui permet

d’établir l’intervalle de confiance, est proportionnel à 1√n .Ceci veut

dire que pour réduire de moitié l’intervalle de confiance, il fautquatre fois plus de questionnaires.

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 11 / 21

Page 20: Chapitre2: Sondage aléatoire simple

Estimation d’une moyenne

Combien d’unités enquêter dans l’échantillon ?

On voit que la réponse à cette question se trouve dans lesformules (2) et (3) : si l’on fixe un niveau de précision (largeur del’intervalle de confiance, ou coefficient de variation, ce qui signifieune valeur "maxi"" de la variance), on en déduit le nombred’unités minimum nécessaire.Le problème est que la quantité V(Y) est inconnue avantl’enquête, dans les formules (2) et (3) ; la seule solution est del’estimer, soit de manière intuitive, soit à partir de donnéesobservées sur le passé

ici on se place dans une phase de réflexion en amont de laréalisation sur le terrain).

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 12 / 21

Page 21: Chapitre2: Sondage aléatoire simple

Estimation d’une moyenne

Combien d’unités enquêter dans l’échantillon ?

On voit que la réponse à cette question se trouve dans lesformules (2) et (3) : si l’on fixe un niveau de précision (largeur del’intervalle de confiance, ou coefficient de variation, ce qui signifieune valeur "maxi"" de la variance), on en déduit le nombred’unités minimum nécessaire.Le problème est que la quantité V(Y) est inconnue avantl’enquête, dans les formules (2) et (3) ; la seule solution est del’estimer, soit de manière intuitive, soit à partir de donnéesobservées sur le passéici on se place dans une phase de réflexion en amont de laréalisation sur le terrain).

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 12 / 21

Page 22: Chapitre2: Sondage aléatoire simple

Estimation d’une moyenne

Combien d’unités enquêter dans l’échantillon ?

On voit que la réponse à cette question se trouve dans lesformules (2) et (3) : si l’on fixe un niveau de précision (largeur del’intervalle de confiance, ou coefficient de variation, ce qui signifieune valeur "maxi"" de la variance), on en déduit le nombred’unités minimum nécessaire.Le problème est que la quantité V(Y) est inconnue avantl’enquête, dans les formules (2) et (3) ; la seule solution est del’estimer, soit de manière intuitive, soit à partir de donnéesobservées sur le passéici on se place dans une phase de réflexion en amont de laréalisation sur le terrain).

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 12 / 21

Page 23: Chapitre2: Sondage aléatoire simple

Estimation d’un total

Plan

1 Principe

2 Estimation d’une moyenne

3 Estimation d’un total

4 Estimation d’une proportion

5 Estimation d’un ratio

6 Méthodes de tirage

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 13 / 21

Page 24: Chapitre2: Sondage aléatoire simple

Estimation d’un total

Estimation d’un total

Les estimations de totaux sont en général des estimationsd’inventaire (effectifs de migrants, de classes d’âges, ...). Le totald’une variable Y est estimé, à partir de l’échantillon, par l’estimateur de sa moyenne multiplié par l’effectif de l’univers :

T (Y ) = Ny (4)

En remplaçant y par son expression, on peut faire apparaître lecoefficient d’extrapolation ou la pondération N

n de chaque unité del’échantillon.

La variance de l’estimateur du total se déduit aisément de celle yen appliquant les propriétés de la variance.

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 14 / 21

Page 25: Chapitre2: Sondage aléatoire simple

Estimation d’un total

Estimation d’un total

Les estimations de totaux sont en général des estimationsd’inventaire (effectifs de migrants, de classes d’âges, ...). Le totald’une variable Y est estimé, à partir de l’échantillon, par l’estimateur de sa moyenne multiplié par l’effectif de l’univers :

T (Y ) = Ny (4)

En remplaçant y par son expression, on peut faire apparaître lecoefficient d’extrapolation ou la pondération N

n de chaque unité del’échantillon.La variance de l’estimateur du total se déduit aisément de celle yen appliquant les propriétés de la variance.

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 14 / 21

Page 26: Chapitre2: Sondage aléatoire simple

Estimation d’un total

Estimation d’un total

Les estimations de totaux sont en général des estimationsd’inventaire (effectifs de migrants, de classes d’âges, ...). Le totald’une variable Y est estimé, à partir de l’échantillon, par l’estimateur de sa moyenne multiplié par l’effectif de l’univers :

T (Y ) = Ny (4)

En remplaçant y par son expression, on peut faire apparaître lecoefficient d’extrapolation ou la pondération N

n de chaque unité del’échantillon.La variance de l’estimateur du total se déduit aisément de celle yen appliquant les propriétés de la variance.

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 14 / 21

Page 27: Chapitre2: Sondage aléatoire simple

Estimation d’une proportion

Plan

1 Principe

2 Estimation d’une moyenne

3 Estimation d’un total

4 Estimation d’une proportion

5 Estimation d’un ratio

6 Méthodes de tirage

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 15 / 21

Page 28: Chapitre2: Sondage aléatoire simple

Estimation d’une proportion

Principe

Une proportion sur l’univers (par exemple le pourcentage defemmes) est moyenne d’une variable indicatrice.L’estimation dune proportion est donc l’estimation de la moyennede cette variable.

Une des caractéristiques d’une telle variable est que sa variances’écrit de manière simple :V (Y ) = P(1 − P)

Dans ce cas, si l’on a une idée de l’ordre de grandeur de P (maissa véritable valeur est inconnue et c’est l’enquête par sondage quicherche à l’estimer de manière précise), on pourra anticiper laprécision en fonction du nombre de questionnaires puisqu’on auraapriori un ordre de grandeur de la variance de Y.

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 16 / 21

Page 29: Chapitre2: Sondage aléatoire simple

Estimation d’une proportion

Principe

Une proportion sur l’univers (par exemple le pourcentage defemmes) est moyenne d’une variable indicatrice.L’estimation dune proportion est donc l’estimation de la moyennede cette variable.Une des caractéristiques d’une telle variable est que sa variances’écrit de manière simple :V (Y ) = P(1 − P)

Dans ce cas, si l’on a une idée de l’ordre de grandeur de P (maissa véritable valeur est inconnue et c’est l’enquête par sondage quicherche à l’estimer de manière précise), on pourra anticiper laprécision en fonction du nombre de questionnaires puisqu’on auraapriori un ordre de grandeur de la variance de Y.

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 16 / 21

Page 30: Chapitre2: Sondage aléatoire simple

Estimation d’une proportion

Principe

Une proportion sur l’univers (par exemple le pourcentage defemmes) est moyenne d’une variable indicatrice.L’estimation dune proportion est donc l’estimation de la moyennede cette variable.Une des caractéristiques d’une telle variable est que sa variances’écrit de manière simple :V (Y ) = P(1 − P)

Dans ce cas, si l’on a une idée de l’ordre de grandeur de P (maissa véritable valeur est inconnue et c’est l’enquête par sondage quicherche à l’estimer de manière précise), on pourra anticiper laprécision en fonction du nombre de questionnaires puisqu’on auraapriori un ordre de grandeur de la variance de Y.

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 16 / 21

Page 31: Chapitre2: Sondage aléatoire simple

Estimation d’une proportion

Principe

Une proportion sur l’univers (par exemple le pourcentage defemmes) est moyenne d’une variable indicatrice.L’estimation dune proportion est donc l’estimation de la moyennede cette variable.Une des caractéristiques d’une telle variable est que sa variances’écrit de manière simple :V (Y ) = P(1 − P)

Dans ce cas, si l’on a une idée de l’ordre de grandeur de P (maissa véritable valeur est inconnue et c’est l’enquête par sondage quicherche à l’estimer de manière précise), on pourra anticiper laprécision en fonction du nombre de questionnaires puisqu’on auraapriori un ordre de grandeur de la variance de Y.

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 16 / 21

Page 32: Chapitre2: Sondage aléatoire simple

Estimation d’un ratio

Plan

1 Principe

2 Estimation d’une moyenne

3 Estimation d’un total

4 Estimation d’une proportion

5 Estimation d’un ratio

6 Méthodes de tirage

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 17 / 21

Page 33: Chapitre2: Sondage aléatoire simple

Estimation d’un ratio

Estimation d’un ratio

L’estimation d’un ratio peut être délicate, et révéler des pièges.Prenons un exemple : supposons que l’univers soit un univers deménages (la base de sondage est une liste de ménages), et quecertaines caractéristiques comme le nombre d’enfants de moins decinq ans ne soient pas connues.Comment estimer le poids corporel moyen des enfants de moins decinq ans à partir d’un échantillon de ménages tiré de façon aléatoiresimple ? Remarquons que l’unité statistique utilisée pour le sondageest le ménage et non l’individu. On procède ainsi :

on estime le nombre total d’enfants de moins de cinq ans ;on estime ensuite le poids corporel total des enfants de moins decinq ans

le ratio (ou quotient) de ces deux masses est l’estimation du poidsmoyen de l’univers ; des enfants de moins de cinq ans.

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 18 / 21

Page 34: Chapitre2: Sondage aléatoire simple

Estimation d’un ratio

Estimation d’un ratio

L’estimation d’un ratio peut être délicate, et révéler des pièges.Prenons un exemple : supposons que l’univers soit un univers deménages (la base de sondage est une liste de ménages), et quecertaines caractéristiques comme le nombre d’enfants de moins decinq ans ne soient pas connues.Comment estimer le poids corporel moyen des enfants de moins decinq ans à partir d’un échantillon de ménages tiré de façon aléatoiresimple ? Remarquons que l’unité statistique utilisée pour le sondageest le ménage et non l’individu. On procède ainsi :

on estime le nombre total d’enfants de moins de cinq ans ;on estime ensuite le poids corporel total des enfants de moins decinq ansle ratio (ou quotient) de ces deux masses est l’estimation du poidsmoyen de l’univers ; des enfants de moins de cinq ans.

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 18 / 21

Page 35: Chapitre2: Sondage aléatoire simple

Estimation d’un ratio

Estimation d’un ratio

L’estimation d’un ratio peut être délicate, et révéler des pièges.Prenons un exemple : supposons que l’univers soit un univers deménages (la base de sondage est une liste de ménages), et quecertaines caractéristiques comme le nombre d’enfants de moins decinq ans ne soient pas connues.Comment estimer le poids corporel moyen des enfants de moins decinq ans à partir d’un échantillon de ménages tiré de façon aléatoiresimple ? Remarquons que l’unité statistique utilisée pour le sondageest le ménage et non l’individu. On procède ainsi :

on estime le nombre total d’enfants de moins de cinq ans ;on estime ensuite le poids corporel total des enfants de moins decinq ansle ratio (ou quotient) de ces deux masses est l’estimation du poidsmoyen de l’univers ; des enfants de moins de cinq ans.

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 18 / 21

Page 36: Chapitre2: Sondage aléatoire simple

Méthodes de tirage

Plan

1 Principe

2 Estimation d’une moyenne

3 Estimation d’un total

4 Estimation d’une proportion

5 Estimation d’un ratio

6 Méthodes de tirage

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 19 / 21

Page 37: Chapitre2: Sondage aléatoire simple

Méthodes de tirage

Méthode simple

L’idée est de numéroter les unités statistiques, et de procéder à untirage au hasard de numéros entre 1 et N. Pour ce faire, on peututiliser :

une table de nombre au hasard,qu’on parcourt dans le sens biendéfini au départ, par exemple ligne par ligne ;Un algorithme informatique de tirage, par exemple par générationau hasard d’un nombre réel entre 1 et N

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 20 / 21

Page 38: Chapitre2: Sondage aléatoire simple

Méthodes de tirage

Méthode simple

L’idée est de numéroter les unités statistiques, et de procéder à untirage au hasard de numéros entre 1 et N. Pour ce faire, on peututiliser :

une table de nombre au hasard,qu’on parcourt dans le sens biendéfini au départ, par exemple ligne par ligne ;Un algorithme informatique de tirage, par exemple par générationau hasard d’un nombre réel entre 1 et N

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 20 / 21

Page 39: Chapitre2: Sondage aléatoire simple

Méthodes de tirage

Tirage systématique

Une autre méthode est celle du tirage systématique : on procèdepar "sauts" dans la liste des unités statistiques.Cette méthode équivaut à la méthode élémentaire si les unités dela base de sondage sont réparties absolument au hasard ; elle estplus avantageuse que la méthode élémentaire si les unités ont étéclassées suivant un critère (variable auxiliaire) en corrélation avecles caractères à estimer et si l’on suppose qu’il existe un "effet"dans l’ordre de classement qui va donner plus de"représentativité" à l’échantillon tiré.

Par exemple, si on a classé des ménages selon leur taille, on seraassuré par ce mode de tirage d’avoir à la fois des ménages defaible taille et des ménages de taille importante dans l’échantillon.

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 21 / 21

Page 40: Chapitre2: Sondage aléatoire simple

Méthodes de tirage

Tirage systématique

Une autre méthode est celle du tirage systématique : on procèdepar "sauts" dans la liste des unités statistiques.Cette méthode équivaut à la méthode élémentaire si les unités dela base de sondage sont réparties absolument au hasard ; elle estplus avantageuse que la méthode élémentaire si les unités ont étéclassées suivant un critère (variable auxiliaire) en corrélation avecles caractères à estimer et si l’on suppose qu’il existe un "effet"dans l’ordre de classement qui va donner plus de"représentativité" à l’échantillon tiré.Par exemple, si on a classé des ménages selon leur taille, on seraassuré par ce mode de tirage d’avoir à la fois des ménages defaible taille et des ménages de taille importante dans l’échantillon.

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 21 / 21

Page 41: Chapitre2: Sondage aléatoire simple

Méthodes de tirage

Tirage systématique

Une autre méthode est celle du tirage systématique : on procèdepar "sauts" dans la liste des unités statistiques.Cette méthode équivaut à la méthode élémentaire si les unités dela base de sondage sont réparties absolument au hasard ; elle estplus avantageuse que la méthode élémentaire si les unités ont étéclassées suivant un critère (variable auxiliaire) en corrélation avecles caractères à estimer et si l’on suppose qu’il existe un "effet"dans l’ordre de classement qui va donner plus de"représentativité" à l’échantillon tiré.Par exemple, si on a classé des ménages selon leur taille, on seraassuré par ce mode de tirage d’avoir à la fois des ménages defaible taille et des ménages de taille importante dans l’échantillon.

Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 21 / 21