38
1 Séquence 4 – MA11 Séquence 4 Statistiques Sommaire Pré-requis Médiane, quartiles, diagramme en boîte Moyenne, écart-type Synthèse Exercices d’approfondissement © Cned - Académie en ligne

Al7ma11tepa0012 Sequence 04

  • Upload
    ameg15

  • View
    12

  • Download
    1

Embed Size (px)

DESCRIPTION

doc

Citation preview

  • 1Squence 4 MA11

    Squence 4

    Statistiques

    Sommaire

    Pr-requis Mdiane, quartiles, diagramme en bote Moyenne, cart-type Synthse Exercices dapprofondissement

    Cned - Acadmie en ligne

  • Introduction

    3Squence 4 MA11

    Etude mthodique des faits sociaux par des procds numriques (classements, dnombrements, inventaires chiffrs, recensements) destine renseigner les gouvernements : ceci est la dnition du mot statistique dans le diction-naire Petit Robert.

    Ds lAntiquit ( Sumer, en Msopotamie, en Egypte), des gouvernements ont effectivement utilis des sries statistiques pour tre mieux renseigns sur leurs Etats et les grer en consquence.

    Peu aprs 1750, on commence faire des reprsentations graphiques, la moyenne et la mdiane sont de plus en plus utilises pour rsumer et dcrire une srie statistique.

    Les physiciens, et depuis longtemps les astronomes, doivent tenir compte de s-ries de mesures pour un mme phnomne, ces variations tant en partie ala-toires. A partir des observations statistiques, les conomistes tentent de faire des prvisions en essayant de matriser lincertitude.

    Un chapitre des mathmatiques va rpondre ces besoins car les mathma-ticiens ont commenc (1650) crer des outils pour tudier les phnomnes alatoires : les probabilits.

    Dans notre environnement quotidien (mto, sondages), professionnel (cabi-nets dassurance, de gestion, laboratoires danalyses mdicales, contrles qualit dans lindustrie), universitaire (physique, chimie, biologie, psychologie, conomie, archologie), dans tous ces domaines, les statistiques et les probabilits inter-viennent.

    Il est indispensable au citoyen daujourdhui de comprendre ce que sont les sta-tistiques pour savoir ce que veulent rellement dire les informations quil reoit.

    Et il est souhaitable quun lve de la srie ES connaisse et sache utiliser les notions de base des statistiques et de calcul des probabilits.

    Dans cette squence, il sagit de statistiques descriptives. On va sattacher rsumer des sries statistiques par des nombres signicatifs pour permettre lutilisation et la comparaison de ces sries.

    On prcisera et on compltera les notions tudies les annes prcdentes, en particulier ce qui concerne la dispersion dune srie statistique.

    Pour les explications, les exemples qui ont t choisis comportent peu de don-nes. Dans la ralit du travail des statisticiens, il sagit dtudier des sries sta-tistiques pour lesquelles les donnes sont beaucoup plus nombreuses et les outils informatiques permettent de le faire.

    Cned - Acadmie en ligne

  • 4 Squence 4 MA11

    1 Pr-requis VocabulaireUne srie statistique porte sur un caractre (taille, poids, sport pratiqu)

    Nous tudierons ici uniquement des sries statistiques caractre quantita-tif, par exemple la taille des lves dune classe (mais pas le sport pratiqu qui est un caractre qualitatif).

    On dit quune srie statistique est caractre quantitatif discret quand les valeurs prises par le caractre sont des valeurs numriques prcises (par exemple le nombre de frres et surs).

    Et on dit quune srie statistique est caractre quantitatif continu quand on connat seulement les effectifs des termes de la srie appartenant des inter-valles (par exemple la taille des lves dune classe).

    Effectifs, frquences, frquences cumules croissantes

    Deux exemples vont rappeler ces notions.

    Pour une classe de 30 lves, on connat le nombre de frres et surs de chaque lve.

    Il sagit dune srie statistique caractre discret.

    On obtient le tableau suivant :

    Nombre de frres et surs xi 0 1 2 3 4 5

    Effectif ni 4 12 8 3 2 1

    Effectif cumul croissant 4 16 24 27 29 30

    Frquence fi (valeur approche) 0,13 0,40 0,27 0,10 0,07 0,03

    Frquence cumule croissante (valeur approche)

    0,13 0,53 0,80 0,90 0,97 1

    Par exemple, leffectif cumul 24 obtenu pour xi = 2 signie que 24 lves ont 2 frres et surs au maximum. Ce nombre 24 est obtenu en ajoutant les deux nombres crit en bleu dans le tableau : 16 leffectif cumul prcdent et 8 leffec-tif correspondant xi = 2 .Toutes les frquences sont obtenues en divisant les effectifs par leffectif total qui est gal 30 ; on obtient toujours un nombre compris entre 0 et 1.

    Exemple 1

    Cned - Acadmie en ligne

  • 5Squence 4 MA11

    Les frquences peuvent aussi tre exprimes en pourcentage : par exemple 13% correspond 0,13. Dans les activits et les exercices nous utiliserons les deux formes.

    Ces frquences sont souvent des valeurs approches, sans que cela soit prcis.

    Le logiciel sinequanon (libre et gratuit) permet de travailler aisment sur les s-ries statistiques et notamment den faire des reprsentations graphiques.

    Nous vous conseillons de raliser les graphiques qui suivent avec ce logiciel.

    Il suft de cliquer sur dnir , srie statistique simple , valeurs isoles et de rentrer les donnes dans le tableau propos.

    Cette srie caractre discret peut tre reprsent par un diagramme en btons .Enn, dnir et repre permettent ensuite dajuster le graphique dans une fentre convenable.

    10

    1

    2

    3

    2 3 4 5 6 7 8

    4

    5

    6

    7

    8

    9

    10

    11

    12

    13effectif

    nb de frres et surs

    Nombre de frres et surs

    On a relev dans une entreprise de 125 employs le temps, en minutes, consacr la pratique dun sport par semaine.

    Il sagit dune srie statistique caractre continu.

    On obtient le tableau suivant :

    Temps en minutes xi [0 ; 20[ [20 ; 40[ [40 ; 60[ [60 ; 100[ [100 ; 140[ [140 ; 200]

    Effectif ni 35 41 30 12 5 2

    Effectif cumul croissant 35 76 106 118 123 125

    Frquence 0,28 0,32 0,24 0,10 0,04 0,02

    Frquence cumule croissante

    0,28 0,60 0,84 0,94 0,98 1

    Exemple 2

    Cned - Acadmie en ligne

  • 6 Squence 4 MA11

    Le troisime effectif cumul est 106 ; cela signie que 106 employs de lentre-prise consacrent moins dune heure par semaine la pratique dun sport.Pour reprsenter cette srie, utilisons encore le logiciel sinequanon.Il suft de cliquer sur dnir , srie statistique simple , valeurs regroupes en classe et de rentrer les donnes dans le tableau propos.Cette srie caractre continu peut tre reprsent par un histogramme .Choisissons 1 petit carreau pour reprsenter un effectif de 2.Dnissons ensuite le repre en choisissant en abscisse 1 cm pour 20 minutes et en ordonne 1 cm pour 1 par exemple.Nous obtenons alors lhistogramme suivant :

    20 40 60 80 100 120 140 160 180 200

    = 2

    0temps en mn

    Temps consacr au sport

    Lorsque les classes ont mme amplitude, les rectangles de lhistogramme ont tous la mme largeur. Leurs aires tant proportionnelles aux effectifs, leurs hauteurs le sont aussi. On peut alors lire les effectifs sur un axe virtuel .Mais lorsque les classes sont damplitude diffrentes, et cest le cas pour notre exemple, les rectangles ont des largeurs diffrentes. Les aires des rectangles sont toujours proportionnelles aux effectifs, mais les hauteurs, elles, ne le sont plus.

    Remarque

    Courbe des frquences cumules croissantesPour expliquer cette construction, utilisons lexemple 2.Dans ces graphiques, on indique en abscisse les valeurs du caractre : ici de 0 200. Et on indique les frquences cumules en ordonne.On place les points de coordonnes (20 ; 0,28), (40 ; 0,60), (60 ; 0,84) (200 ; 1) qui correspondent aux informations suivantes : 28% des employs de lentreprise consacre moins de 20 minutes par semaine au sport, 60% des employs moins de 40 minutes, etc.On complte ces points par un premier point dabscisse 0 (la plus petite valeur du caractre) et dordonne 0 (0% des employs passent strictement moins de 0% de leur temps la pratique dun sport).

    Cned - Acadmie en ligne

  • 7Squence 4 MA11

    On joint alors les points par des segments de droite. La courbe obtenue est appe-le courbe des frquences cumules croissantes.On obtient toujours en utilisant le logiciel sinequanon le graphique ci-dessous.

    Pour dnir le repre, on peut prendre par exemple, 1 cm pour 20 minutes en abscisses, et 1cm pour 10% en ordonnes.

    20 4060 80 100 120 140 160 180 200

    Classemdiane

    10

    0

    20

    30

    40

    50

    60

    70

    80

    90

    100

    temps en mn

    frquence en %

    Ce choix (de relier les points par des segments de droite) revient consid-rer que les valeurs du caractre sont rgulirement distribues lintrieur de chaque classe, ce qui nest pas forcment rel.Cest pourquoi ces graphiques devront tre utiliss avec prcaution.

    Remarque

    Cned - Acadmie en ligne

  • 8 Squence 4 MA11

    Paramtres numriquesVous avez dj utilis quelques nombres qui permettent de rsumer une srie statistique.

    a) Mdiane dune srie statistique

    Les valeurs du caractre dune srie statistique tant ranges par ordre croissant, on dfinit la mdiane. Cest un nombre tel quil y a autant de valeurs de la srie qui lui sont infrieures que de valeurs qui lui sont suprieures. Plusieurs dfini-tions plus prcises sont possibles.Celle qui sera utilise dans ce cours, conformment au programme, est la suivante :

    Dfinition

    si leffectif N de la srie est un nombre impair, N n= +2 1, la mdiane de la srie est la valeur centrale du caractre, celle qui est numrote n +1.

    si leffectif N de la srie est un nombre pair, N n= 2 , la mdiane est le nombre gal la demi somme des deux valeurs centrales, celles qui sont numrotes

    n et n +1.

    Dans lexemple des frres et surs des lves, leffectif total est gal 30 ; la m-diane est donc la demi somme des 15me et 16me valeurs, elle est donc gale 1.

    Dans le cas o leffectif de la srie statistique est un nombre pair, la mdiane nest pas toujours une valeur de la srie statistique.

    Remarque

    Pour une srie caractre continu, on pourra seulement dnir la classe mdiane.Dans lexemple 2, leffectif total est gal 125 ; la mdiane est donc la valeur du caractre du 63me terme ; les effectifs cumuls croissants nous montrent que ce terme est dans la classe [20 ; 40[ : cest la classe mdiane de la srie statistique.

    b) Moyenne dune srie statistique

    Supposons donne une srie statistique caractre quantitatif discret.

    On note N leffectif total, xi les valeurs du caractre, ni les effectifs et fi les frquences correspondantes.

    DfinitionLa moyenne de la srie, est le nombre x dni par :

    xn x n x n x

    Nf x f x f xp p p p=

    + + += + + +

    1 1 2 21 1 2 2

    ......

    Dans lexemple des frres et surs des lves, on a :

    x = + + + = = 1

    304 0 12 1 1 5

    5030

    53

    1 7( ... ) ,

    Cned - Acadmie en ligne

  • 9Squence 4 MA11

    On trouve que la moyenne vaut 53

    , donc environ 1,7. En moyenne, un lve de la

    classe a donc 1,7 frres et surs. Il ne faut pas stonner de ce rsultat bizarre ;

    en effet, la moyenne nest pas ncessairement une valeur du caractre de la srie

    statistique (ici 0, 1, 2).

    Dans lexemple 2, qui est celui dune srie continue, on fait des calculs analogues en utilisant les centres des classes et on trouve que la moyenne vaut 39,84 min.

    c) Le symbole

    Les calculs effectus en statistiques ncessitent dajouter de nombreux termes. Le symbole permet dviter dcrire la liste de ces termes.Par exemple, si x x x x1 2 3 12, , ,..., dsignent 12 nombres rels, leur somme

    x x x x1 2 3 12+ + + +... sera note xii

    i

    =

    =

    1

    12.

    Si on considre les 2 listes de nombre :

    x x x x x1 2 3 4 53 5 8 4 6= = = = =; ; ; ; ;

    et y y y x y1 2 3 4 521 20 18 22 21= = = = =; ; ; ; , on a alors :

    x yii

    i

    ii

    i

    =

    =

    =

    =

    = + + + + = =1

    5

    1

    53 5 8 4 6 26 102 ; ;

    x yi ii

    i

    =

    =

    = + + + =1

    53 21 5 20 6 21 521... .

    Retour la moyenne

    La moyenne dune srie statistique peut tre crite laide du symbole .

    On a : xn x n x n x

    Nf x f x f xp p p p=

    + + += + + +

    1 1 2 21 1 2 2

    ...... =

    n x

    Nf x

    i ii

    i p

    i ii

    i p=

    =

    =

    =

    =11

    .

    Exemple

    Cned - Acadmie en ligne

  • 10 Squence 4 MA11

    2 Mdiane, quartiles, diagramme en boteActivits

    Mdiane, quartiles, dciles dune srie caractre discret.

    On a demand 50 personnes prenant lautobus, le nombre de fois o chacune de ces personnes a utilis ce type de transport pendant la semaine coule.

    Voici les rsultats :

    Nombre de voyages en autobus : xi 1 2 3 4 5 6 7 8 9 10

    Effectif 3 3 5 7 6 9 5 4 5 3

    Effectif cumul croissant : ni

    Frquence en %

    Frquence cumule croissante en %

    Complter les lignes du tableau.

    Dterminer la mdiane.

    Quelle est la plus petite valeur q du caractre pour laquelle au moins 25% ont une valeur infrieure q ? Mme question avec 75%.

    Mmes questions avec 10% et 90%.

    Avec deux sries caractre continu.On reprend lentreprise de lexemple 2 du chapitre 1, on lappelle lentreprise A.

    On rappelle les donnes :

    Temps en minutes xi [0 ; 20[ [20 ; 40[ [40 ; 60[ [60 ; 100[ [100 ; 140[ [140 ; 200]

    Effectif ni 35 41 30 12 5 2

    Effectif cumul croissant 35 76 106 118 123 125

    Frquence 0,28 0,32 0,24 0,10 0,04 0,02

    Frquence cumule croissante 0,28 0,60 0,84 0,94 0,98 1

    On a vu que la classe mdiane est la classe [20 ; 40].

    On considre une deuxime entreprise, lentreprise B, o on a relev aussi le temps consacr au sport par semaine par ses 160 employs.

    AActivit 1

    Activit 2

    Cned - Acadmie en ligne

  • 11Squence 4 MA11

    Complter le tableau suivant pour lentreprise B.

    Temps en minutes xi [0 ; 20[ [20 ; 40[ [40 ; 60[ [60 ; 100[ [100 ; 140[ [140 ; 200]

    Effectif ni 29 43 47 12 5 2

    Effectif cumul croissant

    Frquence

    Frquence cumule croissante

    Quelle est la classe mdiane pour lentreprise B ?

    Construire, sur un mme graphique, les deux courbes des frquences cumules croissantes.

    En utilisant les points des deux courbes dordonne 0,5, dordonne 0,25, et dordonne 0,75, comparer les deux sries statistiques.

    Cours

    Quartiles, cart interquartileOn cherche ici dterminer des nombres qui partagent la srie statistique (dont les valeurs sont ranges par ordre croissant) en quatre groupes de mme effectif environ.

    On utilise la mdiane et deux nombres appels le premier et le troisime quartile.

    Pour ne pas avoir distinguer encore plus de cas que pour la mdiane, on choisit les deux dnitions suivantes.

    Elles semblent dabord un peu dsagrables, mais la pratique permet de se fami-liariser avec leur utilisation. Dailleurs lessentiel est de retenir lide de base et de savoir dterminer ces quartiles avec une calculatrice ou un tableur.

    Dfinitions

    Premier quartile Q1 : cest la plus petite valeur de la srie telle quau moins 25% des donnes soient infrieures Q1.

    Troisime quartile Q3 : cest la plus petite des valeurs de la srie telle quau moins 75% des donnes soient infrieures Q3.

    (Rappel : infrieur correspond f)Dans certains cas, on peut trouver facilement ces deux valeurs.Et un moyen toujours efcace de les trouver est dutiliser les frquences cumu-les croissantes.

    On verra plus loin comment utiliser une calculatrice ou un tableur.

    B

    Cned - Acadmie en ligne

  • 12 Squence 4 MA11

    Dans lactivit 1 sur le nombre des trajets en autobus, on a obtenu :

    Nombre de voyages en autobus

    1 2 3 4 5 6 7 8 9 10

    Effectif cumul croissant 3 6 11 18 24 33 38 42 47 50

    Frquence cumule croissante en %

    6% 12% 22% 36% 48% 66% 76% 84% 94% 100%

    La mdiane est gale la demi somme des vingt-cinquime et vingt-sixime terme, ces termes sont gaux 6, la mdiane est donc gale 6.

    La ligne des frquences cumules croissantes nous montre que le premier quar-tile est gal 4 et le troisime quartile est gal 7.

    Et le deuxime quartile ? Une dfinition analogue avec 50% donne le deu-xime quartile.On retrouve la mdiane si leffectif N de la srie est impair.Mais on ne retrouve ncessairement pas la mdiane si leffectif N de la srie est pair. En effet, si N n= 2 , daprs la dfinition qui est choisie ici pour la mdiane, la mdiane est la demi-somme des termes de la srie de rang n et de rang n +1. Si ces termes ont des valeurs diffrentes, le rsul-tat nest pas une valeur de la srie contrairement au deuxime quartile.Au lyce le choix a t fait dutiliser la mdiane, dfinie comme cela a t rappel dans les prrequis, et de ne pas utiliser le deuxime quartile.Les premier et troisime quartiles permettent de mieux savoir comment est rpartie la srie statistique autour de la mdiane.On dfinit alors un nouveau nombre pour caractriser la srie.

    Remarque

    Dfinition

    Lintervalle [Q1 ; Q3] est appel lintervalle interquartile de la srie statistique.

    Le nombre Q3 Q1 est appel lcart interquartile de la srie statistique.

    Dans lactivit 1, lintervalle interquartile est lintervalle [4 ; 7], lcart interquar-tile est gale 3.

    La moiti au moins des personnes interroges ont donc fait un nombre de voyages compris entre 4 et 7.

    La mdiane est au centre de la srie, les valeurs sont rparties de part et dautre de la mdiane.

    La moiti de ces valeurs se trouve dans lintervalle interquartile : lamplitude de cet intervalle (cest--dire lcart interquartile) indique la dispersion plus ou moins grande des valeurs autour de la mdiane.

    La mdiane est un indicateur de position, lcart interquartile est un indicateur de dispersion.

    Exemple

    Exemple

    Cned - Acadmie en ligne

  • 13Squence 4 MA11

    Rsum dune srie statistique

    On peut alors ainsi rsumer une srie statistique par le couple (mdiane ; cart interquartile).

    Dans lactivit 1, on rsume la srie statistique en donnant sa mdiane qui vaut 6 et lcart interquartile qui vaut 3.

    Quand on rsume une srie statistique par le couple (mdiane ; cart interquar-tile), la mdiane et les quartiles ne dpendent pas des valeurs des termes ex-trmes. En effet, les valeurs des termes extrmes peuvent changer un peu sans modier la mdiane et les quartiles.

    Pour exprimer cela on dit que la mdiane est un indicateur robuste .Pour tudier lvolution des salaires, on peut choisir de regarder comment pro-gresse le salaire mdian et le salaire correspondant au premier quartile, car ces renseignements ne sont pas dpendants des cas particuliers extrmes.

    De mme, dans une classe, on peut observer lvolution des rsultats des lves en regardant la progression de la mdiane et du premier quartile des sries sta-tistiques formes par les notes. On utilise ainsi des indicateurs qui ne sont pas inuencs par les valeurs des notes les meilleures et les plus basses.

    Dciles, cart interdcile dune srie statistique

    De faon analogue ce qui prcde, on peut chercher dterminer des nombres qui partagent la srie statistique (dont les valeurs sont ranges par ordre crois-sant) en dix groupes de mme effectif environ.

    Ces nombres sont appels les dciles de la srie statistique.

    Nous utiliserons seulement le premier et le dernier.

    Dfinition

    Premier dcile D1 : cest le plus petit lment des valeurs de la srie tel qu au moins 10% des donnes soient infrieures D1.

    Neuvime dcile D9: cest le plus petit lment des valeurs de la srie tel quau moins 90% des donnes soient infrieures D9.

    Lintervalle [D1 ; D9] est appel lintervalle inter-dcile de la srie statistique.

    Le nombre D9 D1 est appel lcart inter dcile de la srie statistique.

    Dans lactivit 1, la ligne des frquences cumules croissantes nous permet de lire les dciles.

    Nombre de voyages en autobus

    1 2 3 4 5 6 7 8 9 10

    Frquence cumule croissante en %

    6% 12% 22% 36% 48% 66% 76% 84% 94% 100%

    Exemple

    Commentaire

    Exemple

    Cned - Acadmie en ligne

  • 14 Squence 4 MA11

    Le premier dcile est gal 2, le neuvime dcile est gal 9, lintervalle inter-dcile est lintervalle [2 ; 9] et lcart interdcile est gal 9 2, cest--dire 7.

    Diagrammes en boteIl est trs utile de reprsenter graphiquement une srie statistique.

    Un seul coup dil permet de recueillir beaucoup dinformations, ce qui est en particulier trs commode quand on compare des sries statistiques.

    On a dit plus haut que lon peut rsumer une srie statistique par le couple (m-diane ; cart interquartile).

    On visualise cela par un diagramme en bote, appel parfois bote moustaches ou bote pattes .

    Les diagrammes suivants illustrent les constructions les plus frquentes pour ce type de graphique.

    Ils correspondent lexemple des trajets dautobus de lactivit 1.

    On utilise un axe gradu (ici, il est horizontal, il peut tre vertical).

    On dessine un rectangle (la bote) limit par les quartiles, on indique la mdiane.

    A partir du rectangle, vers lextrieur, on construit deux segments (les mous-taches, les pattes) dont les autres extrmits correspondent aux valeurs extrmes de la srie.

    41 6 7 10

    Q1

    cart interquartile

    Xmin Med Q3 Xmax

    On peut aussi indiquer le premier et le neuvime dcile :

    41 6 7 109

    Q1

    cart interquartile

    Xmin

    2

    D1 Med Q3 XmaxD9

    cart interdcile

    Cned - Acadmie en ligne

  • 15Squence 4 MA11

    Sur ce deuxime graphique, on peut lire beaucoup dinformations : 7 para-mtres de la srie statistique sont lisibles ainsi que lcart interquartile et lcart interdcile.Le logiciel sinequanon construit directement le diagramme en botes ou le dia-gramme en botes avec dciles.

    Remarque

    0Q1 Med Q3

    1 2 3 4 5 6 7 8 9 10 0Q1D1 D9Med Q3

    1 2 3 4 5 6 7 8 9 10

    La hauteur de la bote na pas de signification et peut tre choisie selon son bon vouloir.

    Remarque

    Cas des sries caractre continuPour ce type de srie statistique il est dlicat dutiliser les notions de mdiane et de quartiles car on na pas dinformation sur la rpartition des valeurs lint-rieur de chaque classe.

    a) En utilisant les frquences cumules croissantes

    Les frquences cumules croissantes permettent de reprer dans quelle classe se situe la mdiane, cest--dire dans quelle classe on franchit la frquence cumule gale 50%.

    Dfinition

    La premire classe pour laquelle la frquence cumule croissante dpasse 50% sappelle la classe mdiane.

    Dans lentreprise A, on a vu que la mdiane appartient lintervalle [20 ; 40], cet intervalle forme donc la classe mdiane.

    b) En utilisant la courbe des frquences cumules

    Dans les cas o peut supposer que la rpartition dans la classe mdiane est rgulire, homogne, on peut trouver graphiquement un nombre qui pourra tre considr comme une valeur approche de la mdiane.

    Dans la courbe des frquences cumules, les frquences cumules sont lues sur laxe des ordonnes.

    On considre donc lordonne 50%.

    Exemple

    Cned - Acadmie en ligne

  • 16 Squence 4 MA11

    Puis on lit labscisse du point correspondant de la courbe, cest cette abscisse qui fournit une valeur approche de la mdiane.

    On peut procder de manire analogue pour les quartiles Q1 et Q3 en consid-rant les abscisses des points de la courbe dordonne 25% et 75%, et pour les

    dciles D1 et D9 en considrant les abscisses des points de la courbe dordon-ne 10% et 90%.

    Dans le cas de lentreprise A, on obtient ainsi

    20D1 Q1 Med Q3 D9

    4060 80 100 120 140 160 180 200

    Classemdiane

    10

    0

    20

    30

    40

    50

    60

    70

    80

    90

    100

    temps en mn

    frquence en %

    On lit donc que la mdiane vaut peu prs 33 min, le premier quartile 18 min, le troisime 52 min, le premier dcile 7min et le neuvime 82 min.

    Avec une calculatrice ou un tableurLes calculs faits dans le cours sont dvelopps pour vous permettre de com-prendre les notions.

    Mais dans la pratique, y compris dans les exercices et les devoirs (sauf avis contraire), vous effectuerez ces calculs laide de votre calculatrice ou dun or-dinateur.

    Exemple

    Cned - Acadmie en ligne

  • 17Squence 4 MA11

    On sintresse ici la dtermination de la mdiane et des quartiles dune srie statistique.

    Les crans suivants correspondent la srie statistique de lactivit 1 :

    Nombre de voyages en autobus

    1 2 3 4 5 6 7 8 9 10

    Frquence cumule crois-sante en %

    6% 12% 22% 36% 48% 66% 76% 84% 94% 100%

    a) Avec une calculatrice Casio 25+

    Les procdures sont identiques ou trs voisines pour les autres modles de Casio

    On saisit les donnes.

    Dans le menu gnral, on slectionne licne STAT (ou LIST ). Sur lcran apparat alors lditeur de listes.

    On saisit les valeurs xi du caractre dans une liste, List 1 par exemple, et les effectifs correspondants dans une autre liste, List 2 par exemple.

    En bas de lditeur de listes se trouve un menu droulant horizontal.

    On active le sous-menu CALC puis SET

    Sur la ligne 1Var Xlist on indique List 1 , et sur la ligne 1Var Freq on indique List 2 , pour indiquer les valeurs puis les effectifs.

    On tape alors EXIT . Slectionner enn le menu 1 VAR.

    Des paramtres de la srie statistique apparaissent lcran ; parmi eux, en utili-sant la touche r , on trouve la mdiane Med, et les quartiles Q1 et Q3.

    On peut aussi faire apparatre un diagramme en bote.

    Dans lditeur de listes on active le sous-menu GRPH, puis le menu SET et PH1 .

    On indique alors sur la ligne G-Type le type de graphique qui est souhait, en va-lidant loption MedBox du menu horizontal du bas de lcran, puis on complte la ligne XList avec List 1 , pour indiquer la liste des valeurs, et la ligne Frequency avec List 2 , pour indiquer la liste des effectifs.

    On valide lcran.

    On afche alors le graphique en validant GRPH, puis GPH1 .

    Saisie

    Calcul

    Graphique

    Cned - Acadmie en ligne

  • 18 Squence 4 MA11

    Pour visualiser laxe horizontal et ses graduations il faut ventuellement adapter la fentre.

    On peut afficher deux diagrammes en bote simultanment.Par exemple ici, on a rentr en List 3 les mmes valeurs xi quen List 1 , puis on a mis partout leffectif ni = 1 en List 4 .Sur lcran dont limage est donne ci-des-sus, on active GPH2, on choisit successive-ment MedBox List 3 , et List 4 .Aprs EXIT on choisit SEL qui permet de choisir les deux graphiques en slectionnant ON pour GPH1 et pour GPH2 .Et enfin DRAW permet dobtenir lcran ci-dessus.

    Remarque

    b) Avec une TI 82Stats.fr

    Les procdures sont identiques ou trs voisines pour les autres modles TI.

    Il faut dabord saisir les donnes

    Appuyer sur la touche STATS , puis choisir le menu EDIT , suivi de entrer.

    On tape chaque valeur du caractre xi dans une liste, par exemple L1 , et chaque effectif ou frquence ni dans une autre liste, par exemple L2 , et on termine par entrer.

    Appuyer de nouveau sur la touche STATS , puis choisir le menu CALC , suivi de entrer.

    Sur lcran apparat alors lindication Stats 1-Var.

    Taper alors L1 , L2 pour indiquer, dans lordre, la liste des valeurs et celle des

    effectifs (attention : pour obtenir L1 , il faut taper sur les touches 2nde puis 1, et

    aprs la virgule on fait de mme pour L2 ).

    Appuyer sur entrer.

    Des paramtres de la srie statistique apparaissent lcran, parmi eux, en utili-sant la touche r , on trouve la mdiane Med et les quartiles Q1 et Q3.

    Saisie

    Calculs

    Cned - Acadmie en ligne

  • 19Squence 4 MA11

    On peut reprsenter une srie statistique par un diagramme en bote aprs avoir saisi les donnes.

    Appuyer sur la touche graph stats (touche 2nde de la touche f (x ) ), puis sur entrer (ce qui slectionne le dessin n1 : Graph1).

    On place le curseur sur ON ou (Aff) que lon valide par entrer, puis sur le type de

    graphique ( ou ) que lon valide par entrer (remarque il y a ici deux types de diagramme en bote, on choisira plutt le mme que sur lcran ci-dessus, au milieu de la deuxime ligne).

    On renseigne alors la ligne ListeX avec L1 (touche 2nde puis 1 ), pour indi-

    quer la liste des valeurs, et la ligne Effectifs avec L2 , pour indiquer la liste des effectifs.

    On afche alors le graphique en appuyant sur la touche graphe. Pour visualiser laxe horizontal et ses graduations il faut ventuellement adapter la fentre.

    Graphiques

    Il est possible dafficher simultanment deux diagrammes en bote en utilisant aussi Graph2 : on procde de la mme manire que pour Graph1 en choisissant On (ou Aff) et en prcisant les listes concernes.Par exemple ici, on a rentr List 3 les mmes valeurs xi quen List 1 , puis on a mis partout leffectif ni = 1 en List 4 .

    Remarque

    Cned - Acadmie en ligne

  • 20 Squence 4 MA11

    c) Avec un tableur

    Pour dterminer la mdiane et les quartiles, on utilise les fonctions statistiques pr-sentes dans la plupart des tableurs lorsque la srie est donne par une seule colonne, cest--dire que tous les effec-tifs sont gaux 1.

    Si tous les effectifs ne sont pas gaux 1, il nest pas possible dutili-ser les fonctionnalits dun tableur pour dterminer la mdiane et les quartiles.Voici lexemple dune srie statistique o tous les effectifs sont gaux 1.On slectionne la plage de cellule concerne.Pour les quartiles, on doit prciser 1 ou 3 en respectant la syntaxe du logiciel.Pour le premier quartile de cette srie statistique de 10 termes, on devrait trouver le troisime terme, cest--dire 16.Ici Q1 = 16,25. Il sagit dOpenOfce et on observe que ce quartile nest pas une valeur de la srie statistique, ce logiciel nutilise pas la mme dnition que le cours.On rappelle que cest peu gnant dans la pratique relle des statistiques o les effectifs sont importants.

    Exercices dapprentissage

    Pour ces exercices, il est vivement conseill dutiliser une calculatrice ou un ta-bleur ou le logiciel sinequanon.

    Une pharmacie de garde a enregistr le nombre dappels reus pendant 1000 nuits entre 20h et 6h du matin. Les rsultats sont les suivants :

    Nombre dappels xi 0 1 2 3 4 5 6 7 8 9 10 11

    Nombre de nuits ni 14 70 155 185 205 150 115 65 30 5 1 5

    Dterminer la mdiane et les quartiles de cette srie, puis faire un diagramme en bote.

    Deux sauteurs la perche ont relev leurs performances lors de leurs 25 derniers sauts.

    1er sauteur

    Hauteur 4,70 4,80 4,85 4,90 4,95 5,00 5,05 5,10 5,20

    Nombre de sauts

    1 1 1 3 12 4 1 1 1

    C

    Exercice 1

    Exercice 2

    Cned - Acadmie en ligne

  • 21Squence 4 MA11

    2e sauteur

    Hauteur 4,60 4,70 4,75 4,80 4,85 4,90 4,95 5,00 5,05 5,10 5,15 5,20

    Nombre de sauts 3 2 2 3 2 2 1 3 2 1 1 3

    Dterminer la mdiane et les quartiles de chacune de ces deux sries.

    Construire les deux diagrammes en bote et comparer lensemble des perfor-mances des deux sportifs.

    Dans le numro 97-98 de la revue Economie Lorraine on trouve le graphique ci-dessous, construit partir de donnes Eurostat de le Communaut europenne pour lanne 2004.

    Ce graphique concerne le PIB (Produit Intrieur Brut) par habitant en SPA (stan-dards de pouvoir dachat, cest--dire une monnaie commune qui limine les diffrences de prix entre les pays, permettant des comparaisons signicatives).

    Pour chaque pays on a reprsent un diagramme en bote construit partir des rgions (par exemple le diagramme de la France est construit partir des PIB moyens des 26 rgions).

    AT

    10 000

    0

    AT : AutricheBE : BelgiqueCZ : TchquieDe : Allemagne

    ES : EspagneFL : FinlandeFR : FranceGR : Grce

    HU : HongrieIT : ItalieNL : Pays-basPL : Pologne

    PT : PortugalSE : SudeSK : SlovaquieUK : Royaume-Uni

    BE CZ DE

    Source : Eurostat, base Regio, NUTS2, SEC95

    ES

    Moyenne de lUE25

    FI FR GR HU IT NL PL PT SE SK UK

    20 000

    30 000

    40 000

    50 000

    60 000

    70 000 Maximum

    Minimum

    Mdiane3e quartile

    1er quartile

    Dans quel pays se trouve la rgion ayant le PIB par habitant le plus lev ? le moins lev ?

    Exercice 3

    Cned - Acadmie en ligne

  • 22 Squence 4 MA11

    Dans quel pays lcart interquartile est-il le plus grand ? le plus petit ?

    Donner deux proprits particulires au diagramme de la France.

    Quelles est la proprit commune des diagrammes de la Belgique, de lAlle-magne, de lItalie et de la Sude ?

    Daprs lINSEE, les revenus annuels (en milliers deuros) des salaris en 2007 se rpar-tissent suivant le tableau ci-dessous qui donne les valeurs des dciles des deux sries :

    Dciles D1 D2 D3 D4 D5 D6 D7 D8 D9

    Femmes 1,8 5 8,7 12 14,5 16,6 19,1 22,6 28,9

    Hommes 2,8 8,2 13,2 15,6 17,7 20 23,1 27,8 37,2

    Les dciles permettent de dterminer des classes. Pour les femmes, donner le tableau indiquant ces classes et les frquences correspondantes.

    Reprsenter dans un mme repre les courbes des frquences cumules crois-santes (on prendra, pour les deux sries, 1 pour valeur minimale et 45 pour valeur maximale).Quelle courbe est gauche de lautre , au dessus de lautre ? Quelle signication cela a-t-il ?

    Dterminer graphiquement des valeurs approches des quartiles des deux sries, et construire les diagramme en bote des deux sries.

    Les donnes extrmes dune srie qui se diffrencient trop des autres (beaucoup trop grandes ou beaucoup trop petites) sont appeles valeurs aberrantes .Le statisticien amricain John W.Tukey (1915-2000) a propos un critre pour isoler les valeurs aberrantes : on appellera valeur aberrante toute valeur qui se situera plus de 1,5 fois lcart interquartile Q3 Q1 avant Q1 ou aprs Q3 .Le taux de chmage pour le deuxime trimestre 2009 pour les 22 rgions fran-aises en % est fournie par lINSEE par le tableau suivant :

    AlsaceAqui-taine

    AuvergneBour-gogne

    Bretagne CentreCham-pagne

    ArdennesCorse

    FrancheComt

    Ile de France

    Languedoc roussillon

    8,3 8,9 8,4 8,4 7,8 8,3 10,0 8,4 9,6 7,8 12,5

    Limousin LorraineMidi

    Pyrnes

    Nord Pas de calais

    Basse Norman-

    die

    Haute Normandie

    Pays de Loire

    PicardiePoitou Cha-

    rentes

    Pro-venceAlpes

    Cte d Azur

    RhneAlpes

    7,8 10,0 9,0 12,7 9,0 10,2 8,2 10,9 9,0 10,5 8,6

    Pour la France mtropolitaine, ce taux est de 9,1%. Montrer que la valeur 12,7 (qui correspond la rgion Nord-Pas-de-Calais) peut-

    tre qualie daberrante avec la dnition donne dans linformation ci-dessus. Pouvez vous expliquer conomiquement le rsultat de la rgion Nord-Pas-de-Calais ? Construire sans tenir compte de cette valeur le diagramme en bote de la srie

    ci-dessus.

    Exercice 4

    Exercice 5

    Cned - Acadmie en ligne

  • 23Squence 4 MA11

    3 Moyenne, cart-typeActivits

    Pendant la semaine du 13 au 17 septembre 2010, on a relev les tempratures mini-males et les tempratures maximales Brest (daprs les donnes de Mto-France).

    Date lundi mardi mercredi jeudi vendredi samedi dimanche

    Temprature minimale en C 8,8 12,2 13,5 12,7 8,5 7,7 5,2

    Temprature maximale en C 19,5 19,9 18,6 17,8 18 17,3 18,1

    Les tempratures maximales semblent plus rgulires que les tempratures minimales.

    Le but de cette activit est dintroduire une nouvelle caractristique dune srie statistique pour mesurer sa dispersion autour de la moyenne. On pourra alors comparer la rgularit de deux sries.

    Dans les quatre premires questions, on considre seulement les tempratures minimales.

    Calculer la temprature minimale moyenne x .

    Dans le tableau suivant on indique les diffrences avec la moyenne (on dit aussi lcart la moyenne ).

    Temprature minimale en C : xi 8,8 12,2 13,5 12,7 8,5 7,7 5,2

    cart : x xi

    Quobserve-t-on quand on calcule la moyenne de ces diffrences ?

    Ce qui prcde amne ne considrer que des quantits positives.

    Pour cela, on peut utiliser les valeurs absolues ou les carrs. Les carrs, moins naturels, ont cependant taient choisis car les proprits mathmatiques sont ensuite beaucoup plus intressantes.

    Temprature minimale en C : xi 8,8 12,2 13,5 12,7 8,5 7,7 5,2

    cart : x xi

    Carr de lcart la moyenne : x xi ( )2

    A Activit 3

    Cned - Acadmie en ligne

  • 24 Squence 4 MA11

    Complter ce tableau, puis calculer la moyenne des carrs des carts la moyenne x .

    Le nombre obtenu sappelle la variance de la srie statistique, on le note V.

    Pour compenser lutilisation des carrs et se ramener une quantit reprsen-tant une grandeur de mme nature que les termes de la srie statistique, on calcule maintenant la racine carre de la variance V.

    Ce nouveau nombre sappelle lcart-type de la srie statistique, on le note s.

    Calculer lcart-type s de la srie statistique des tempratures minimales.

    Calculer la variance V et lcart-type s de la srie statistique des tempra-tures maximales.

    Comparer les deux carts-types s et s.

    On reprend lexemple du nombre des voyages en autobus.

    Nombre de voyages en autobus : xi

    1 2 3 4 5 6 7 8 9 10

    Effectif : ni 3 3 5 7 6 9 5 4 5 3

    Carr de lcart la

    moyenne x xi ( )2

    Dterminer la moyenne x , puis complter la dernire ligne du tableau.

    Calculer ensuite lcart-type, attention : ici, les effectifs ne sont pas tous gaux 1 comme dans lactivit prcdente.

    Avec une srie caractre continu : on reprend lexemple du temps consacr au sport dans lentreprise A.

    Montant des achats (en ) [0 ; 20[ [20 ; 40[ [40 ; 60[ [60 ; 100[ [100 ; 140[ [140 ; 200]

    Effectif ni 35 41 30 12 5 2

    Carr de lcart la moyenne

    En utilisant les centres des classes, dterminer la moyenne puis complter le tableau.

    Dterminer ensuite lcart-type de cette srie statistique.

    Activit 4

    Activit 5

    Cned - Acadmie en ligne

  • 25Squence 4 MA11

    Cours

    La moyenne et ses proprits

    a) Rappel de la dfinitionSupposons donne une srie statistique caractre quantitatif discret.

    On note N leffectif total, xi les valeurs du caractre et ni les effectifs correspondants.

    Si on considre une srie statistique caractre quantitatif continu, on appli-quera alors tout ce qui est dni pour une srie discrte en utilisant le centre de chaque classe et leffectif correspondant.

    Dfinition

    La moyenne x de la srie est le nombre dni par :

    xn x n x n x

    Np p

    =

    + + +1 1 2 2 ... .

    On peut aussi crire xn x

    Nf xi i

    i

    i p

    i ii

    i p= =

    =

    =

    =

    =

    1 1

    .

    La somme n x n x n xp p1 1 2 2+ + +... est gale la somme de toutes les valeurs de la srie (puisque x1 est compt n1 fois, etc.).Et, en multipliant par N , on obtient une galit qui est trs importante dans le paragraphe suivant.

    Remarque

    Nx n x n x n xp p= + + +1 1 2 2 ... Cette galit signifie que la moyenne multiplie par leffectif est gale la somme des valeurs de la srie.

    A savoir

    b) Calcul de la moyenne dune srie partir des moyennes de deux sous-groupes

    La remarque prcdente permet de dmontrer le thorme suivant :

    Thorme

    Si une population deffectif total N est partage en deux sous-groupes, lun def-

    fectif P pour lequel la moyenne est x' , et lautre deffectif Q pour lequel la

    moyenne est x"

    B

    Cned - Acadmie en ligne

  • 26 Squence 4 MA11

    la moyenne x de la population entire est donne par lgalit:

    xP x Qx

    P Q=

    ' ".

    +

    +

    Dmonstration

    La moyenne x de la srie est gale au quotient

    somme de toutes les valeurs de la srieeffectif total

    .

    Pour le premier sous-groupe la somme des valeurs vaut P x' , pour le second elle

    vaut Qx" , donc pour la srie entire la somme de toutes les valeurs est gale

    P x Qx' ".+

    Et leffectif total est gal bien sr P Q+ , on obtient ainsi le rsultat annonc.

    On peut exprimer cette galit en utilisant les frquences : x = f' x' +f"x".

    En effet, N tant leffectif total, on a P Q N+ = , la frquence du premier

    groupe est fP

    P Q' =

    + et la frquence du second groupe est f

    QP Q

    " .=+

    On a donc : x =P x' +Qx"

    P +QP

    P +Qx' +

    QP +Q

    x" = f' x' +f"x".=

    Remarque

    Une entreprise est installe sur deux sites.

    Sur le premier site, la moyenne des salaires est gale 1600 et 35 personnes y travaillent.

    Sur le second site, la moyenne des salaires est gale 1900 et 21 personnes y travaillent.

    Le thorme prcdent permet de calculer la moyenne des salaires sur lensemble des deux sites.

    Les donnes sont donc : P x Q x= = = =35 1600 21 1900, ' , , " .

    La moyenne x de la srie est donne par :

    x =35 1600 21 1900

    35 211712 5

    +

    += , .

    La moyenne des salaires dans cette entreprise est donc gale 1712,5 .

    Exemple

    Cned - Acadmie en ligne

  • 27Squence 4 MA11

    c) Effet de structure

    On appelle A lentreprise de lexemple prcdent.

    Supposons quune seconde entreprise B soit aussi sur deux sites.

    Dans le premier, la moyenne des salaires est 1650 et, dans le deuxime, la moyenne est 1950 .

    On est tent de penser que la moyenne y des salaires dans lentreprise B est suprieure la moyenne des salaires dans lentreprise A.

    Pour le vrier, il est ncessaire de complter les donnes concernant lentreprise B : le salaire moyen est 1650 pour un effectif de 50 personnes, et le salaire moyen est 1950 pour un effectif de 10 personnes.

    On a alors :

    y = +

    +=

    50 1650 10 195050 10

    1700.

    Le salaire moyen est donc 1700 dans lentreprise B, il est infrieur celui de lentreprise A !

    Ce paradoxe sexplique par la comparaison des effectifs : dans lentreprise B, les effectifs des groupes sont 50 et 10 (le premier groupe est donc cinq fois plus nombreux que le second), alors que dans lentreprise A les effectifs des groupes sont 35 et 21 (leffectif du premier groupe est infrieur au double du second).

    Les effectifs ne sont pas rpartis de la mme faon dans les deux entreprises.

    On lobserve encore mieux avec les frquences.

    Dans lentreprise A, le premier groupe correspond 62,5% de leffectif total, le second groupe 37,5%.

    Dans lentreprise B, le premier groupe correspond environ 83,3% de leffec-tif total, le second groupe environ 16,7%. Dans cette entreprise B, le salaire moyen est tellement tir vers 1650 , le salaire du premier groupe, que le salaire moyen dans lentreprise B est infrieur celui de lentreprise A.

    Dfinition

    Dans lexpression xP x Qx

    P Qf x f x=

    ' "' ' " "

    +

    += + , il est possible que x diminue

    alors que x' et x" augmentent car la valeur du quotient dpend aussi des

    changements des valeurs des effectifs P et Q (et donc des frquences) : ce rsultat

    paradoxal sappelle un effet de structure.

    Ecart-typeOn donne ici un indicateur numrique mesurant la dispersion dune srie statis-tique autour de sa moyenne. On gnralise ce qui a t fait dans les activits.

    Exemple

    Cned - Acadmie en ligne

  • 28 Squence 4 MA11

    Dfinition

    La variance de la srie statistique est dnie par :

    V = + + +

    + + +

    n x x n x x n x x

    n n np p

    p

    1 12

    2 22 2

    1 2

    ( ) ( ) ( )...

    ...==

    =

    =

    =

    ( )n x xNi iii p 2

    1

    =

    =

    =

    f x xi ii

    i p( )2

    1.

    Lcart type s de la srie est dni par :

    s = V .

    La variance est gale : la moyenne des carrs des carts la moyenne de la srie.

    Lcart-type est donc gal :la racine carrede la moyennedes carrsdes carts la moyenne de la srie.

    Proprits

    La variance et lcart type sont ncessairement des nombres positifs.

    On a utilis des carrs, puis pour compenser on a pris la racine carre du rsultat. On obtient lcart-type qui est un donc un paramtre repr-sentant bien une mme grandeur (euros, centimtres) que les valeurs du caractre.Sil donne une bonne indication sur la dispersion de la srie, il nest mal-heureusement pas interprtable ou reprsentable aussi facilement que les quartiles et lcart interquartile.Dans la suite du cours de statistiques-probabilit vous constaterez que lcart-type est un indicateur trs utilis car il possde de trs nombreuses proprits mathmatiques au del des statistiques descriptives.(Les quartiles et lcart interquartile sont eux plus faciles comprendre mais on ne les utilisera quen statistique descriptive.)

    Remarque

    Rsum dune srie statistique

    On peut alors ainsi rsumer une srie statistique par le couple (moyenne ; cart-type).

    Dans lexemple de lactivit 1, la srie des tempratures minimales Brest a pour moyenne 9,8C et pour cart-type environ 2,8C.

    Commentaire

    Exemple

    Cned - Acadmie en ligne

  • 29Squence 4 MA11

    Par sa dfinition, lcart-type nest pas simple calculer.Dans la pratique, vous utiliserez une calculatrice ou un tableur ou le logiciel sinequanon (des explications sont donnes plus loin).On dispose, dune formule plus simple que celle de la dfinition, mais dans laquelle on ne voit plus la signification de la variance.Elle est donne ci-dessous : on remarque que la moyenne x napparat plus quune seule fois ce qui diminue les approximations.

    Remarque

    Thorme

    VN

    n x xii

    i p

    i=

    =

    =

    11

    2 2

    et s V== .

    Nous admettrons cette proprit.

    Dtermination de la moyenne et de lcart-type dune srie avec une calculatrice ou un tableur

    a) Calculer la moyenne et lcart-type dune srie statistique laide dune calculatrice Casio GRAPH 25 ou dune TI-82 Stats.fr.

    La liste des paramtres de la srie statistique est obtenue comme on la vu dans le chapitre sur la mdiane et lcart interquartile.

    La moyenne x est facile lire.Il faut faire plus attention pour bien lire lcart-type.

    En effet, les mmes tableaux sont utiliss ailleurs en statistique et un autre pa-ramtre (que nous nutiliserons pas) apparat et il risque dtre confondu avec lcart-type qui nous intresse ici.

    Il y a deux valeurs trs proches qui sont nommes x n et x n 1 ou encorex et Sx (ou sx sur dautres modles de calculatrice).

    Lcart-type est la plus petite de ces deux valeurs, x n pour la calculatrice Casio utilise ici, x pour la calculatrice TI.Casio : TI :

    Cette galit permet de dire que :la variance est gale la moyenne des carrs moins le carr de la moyenne.

    Remarque

    Cned - Acadmie en ligne

  • 30 Squence 4 MA11

    b) Calculer la moyenne et lcart-type dune srie statistique laide dun tableur.

    Premier casLorsque toutes les valeurs de la srie sont numres dans une colonne, cest--dire lorsque tous les effectifs sont gaux 1, on utilise les fonctions statistiques prsentes dans la plupart des tableurs.Comme pour les calculatrices, il faut faire attention : lcart-type dont nous avons besoins est celui dune population (et non pas dun chantillon).Ici, avec OpenOfce, on choisira ECARTTYPEP.

    Deuxime casLes effectifs ne sont pas tous gaux 1, les valeurs sont prsentes avec leur effectif (ou frquence) dans deux colonnes, il faut faire les calculs interm-diaires avec le tableur.

    Moyenne

    On calcule dans la colonne C les produits des valeurs (colonne A) par leur effectif (colonne B) en crivant dans la cellule C2 : =A2*B2, et en tirant la formule vers le bas jusqu la dernire valeur.

    Dans deux cellules libres (par exemple B13 et C13) on calcule les sommes des colonnes B et C (effectif total et somme de toutes les valeurs) en crivant : =SOMME(B2:B11) et =SOMME(C2:C11).

    La moyenne sobtient alors en divisant la somme des valeurs par leffectif total, en crivant dans une cellule libre (par exemple C15) : =C13/B13.

    Ecart-type

    On calcule les produits ni (xi x )2 dans la co-

    lonne D en crivant dans la cellule D2 : =(A2-$C$13)^2, et en tirant la formule vers le bas jusqu la dernire valeur. Le symbole $ sert ger la valeur 15 car la cellule $C$15 est celle qui contient la moyenne.

    Dans une cellule libre (par exemple D13) on calcule la somme de la colonne D en crivant : =SOMME(D2:D11).

    Dans une cellule libre (par exemple D15) la variance sobtient alors en crivant =D13/B13. Lcart type sobtient alors en crivant dans une cellule libre (D17) : =RACINE(D15).

    Deuxime mthode : pour limiter le nombre dap-proximations dues la moyenne, on peut utiliser

    lgalit VN

    n x xii

    i p

    i= =

    =

    11

    2 2 (cellule G15).

    Cned - Acadmie en ligne

  • 31Squence 4 MA11

    c) Avec le logiciel Sinequanon

    Les paramtres se lisent directement aprs avoir introduit les donnes.

    Cned - Acadmie en ligne

  • 32 Squence 4 MA11

    Exercices dapprentissage

    Un lve a 12 de moyenne aux quatre premiers devoirs de lanne.

    Si le cinquime devoir est not 15, quelle sera sa nouvelle moyenne ?

    Quelle est la note minimale du cinquime devoir pour que la moyenne aux cinq devoirs soit au minimum gale 13 ?

    Dans une chane de magasins de vtements, 60 % de ses magasins sont destins aux hommes et 40 % sont destins aux femmes.

    Le chiffre daffaire moyen des magasins pour hommes est de 1,1 million deuros, celui des magasins pour femmes de 1,4 million deuros.

    Calculer le chiffre daffaire moyen par magasin dans cette chane.

    Le chiffre daffaire de chaque magasin augmente de 5 %.Quel est le nouveau chiffre daffaire moyen par magasin de cette chane ?

    Le chiffre daffaire de chaque magasin pour homme augmente de 5 % et celui de chaque magasin pour femme de 7 %.

    a) Sans faire de calcul, dire si le chiffre daffaire moyen augmente de 6 %, plus de 6 % ou moins de 6 %.

    b) Calculer le nouveau chiffre daffaire moyen par magasin de cette chane. Quel est le pourcentage daugmentation de ce chiffre daffaire moyen ?

    Une salle de spectacle a vendu pour une soire 150 places 12 et 100 places 10 , quel est le prix moyen dune place ?

    Donner un exemple montrant un effet de structure. Pour cela on suppose que, pour une autre soire, les deux prix augmentent de 1 : les places seront donc vendues 13 et 11 . Chercher deux nombres entiers a et b non nuls tels que, si a places 13 ont t vendues ainsi que b places 11 , alors le prix moyen dune place pour le second spectacle est infrieur au prix moyen dune place pour le premier spectacle.

    On reprend la situation de lexercice 2 du chapitre 3.

    Deux sauteurs la perche ont relev leurs performance au cours des derniers mois.

    1er sauteur

    Hauteur 4,70 4,80 4,85 4,90 4,95 5,00 5,05 5,10 5,20

    Nombre de sauts

    1 1 1 3 12 4 1 1 1

    CExercice 6

    Exercice 7

    Exercice 8

    Exercice 9

    Cned - Acadmie en ligne

  • 33Squence 4 MA11

    2e sauteur

    Hauteur 4,60 4,70 4,75 4,80 4,85 4,90 4,95 5,00 5,05 5,10 5,15 5,20

    Nombre de sauts 3 2 2 3 2 2 1 3 2 1 1 3

    Dterminer maintenant la moyenne et lcart-type de chaque srie.

    Comparer lensemble des performances des deux sportifs en utilisant ces deux indicateurs.

    On reprend les donnes de lexercice 1 du chapitre 2.

    Une pharmacie de garde a enregistr le nombre dappels reus pendant 1000 nuits entre 20h et 6h du matin. Les rsultats sont les suivants :

    Nombre dappels xi 0 1 2 3 4 5 6 7 8 9 10 11

    Nombre de nuits ni 14 70 155 185 205 150 115 65 30 5 1 5

    Dterminer la moyenne et lcart-type de cette srie statistique.

    Dterminer le nombre de nuits pour lesquelles le nombre dappels appartient

    lintervalle [ ; ]x s x s + ; quelle est la frquence correspondante ?

    Mme question avec lintervalle [ ; ].x s x s +2 2

    Exercice 10

    Cned - Acadmie en ligne

  • 34 Squence 4 MA11

    4 SynthseOn peut rsumer une srie statistique en dterminant une mesure de ten-dance centrale et la caractristique de dispersion associe.

    Deux possibilits ont t tudies : la mdiane avec lcart interquartile et la moyenne avec lcart-type.

    La mdiane et les quartiles partagent la srie statistique en quatre groupes de mme effectif environ.

    Ces paramtres sont assez simples expliquer des non-statisticiens.

    Ils ne changent pas si les valeurs extrmes sont un peu modies, on dit quils sont robustes .

    La mdiane, les quartiles, lcart interquartile permettent ainsi de dcrire assez simplement une srie statistique.

    La reprsentation graphique par un diagramme en bote donne immdiatement sur une image 5 (ou 7) paramtres, ce qui favorise les comparaisons.

    41 6 7 10

    Q1

    cart interquartile

    Xmin Med Q3 Xmax

    On peut aussi rsumer une srie statistique par sa moyenne et son cart-type.

    Pour une srie statistique, la moyenne x est dnie par lgalit

    xn x n x n x

    Np p

    =

    + + +1 1 2 2 ... , et lcart-type s est dni par

    s V= avec Vn x x n x x n x x

    Np p

    =

    + + + 1 12

    2 22 2( ) ( ) ( )...

    ,

    ou encore VN

    n x xii

    i p

    i=

    =

    =

    11

    2 2

    Ces deux paramtres sont moins simples que les prcdents, mais ils sont trs utiles.

    Cned - Acadmie en ligne

  • 35Squence 4 MA11

    Si on connat les effectifs P et Q et les moyennes partielles de deux sous-groupes de la srie, on peut en dduire la moyenne de la srie entire car

    xP x Qx

    P Q=

    ' ".

    +

    +

    La relation prcdente permet dexpliquer les tonnants effets de structure.

    La moyenne et lcart-type ont des proprits mathmatiques trs riches, ce qui les rend indispensables dans ltude ultrieure des statistiques.

    Dans la pratique, il est indispensable de savoir dterminer la m-diane, les quartiles, la moyenne et lcart-type dune srie statis-tique avec une calculatrice ou avec un tableur ou avec le logiciel sinequanon.

    Cned - Acadmie en ligne

  • 36 Squence 4 MA11

    5 Exercices dapprofondissementPour ces exercices, il est vivement conseill dutiliser une calculatrice ou un ta-bleur ou le logiciel sinequanon.

    Voici la liste des notes obtenues par une classe au premier trimestre.

    10 15 18 5 11 6 9 12 12 17 4 7 10 8 9 14 16 7 11 15 11 10.

    Dterminer la mdiane, les quartiles, puis la moyenne et lcart-type.

    Mme question pour le second trimestre pour lequel les notes sont :

    11 14 15 5 11 9 10 13 12 15 5 8 10 8 9 13 14 8 13 13 10 11.

    En utilisant les paramtres de position et les paramtres de dispersion qui ont t dtermins, comparer les deux sries statistiques

    Le tableau ci-dessous donne, pour lanne 2008, le nombre de mdecins gnralistes et le nombre de mdecins spcialistes pour 100 000 habitants (donnes de lINSEE).

    Rgion

    Nombre de mdecins gn-

    ralistes pour 100 000 hab.

    Nombre de mdecins sp-cialistes pour 100 000 hab.

    Nombre de mdecins gn-

    ralistes pour 100 000 hab.

    Nombre de mdecins sp-cialistes pour 100 000 hab.

    Alsace 169 184 Midi-Pyrnes 173 179

    Aquitaine 171 178Nord-Pas-de-

    Calais165 138

    Auvergne 159 138 Basse-Normandie 143 138Bourgogne 152 134 Haute-Normandie 141 132Bretagne 157 179 Pays de la Loire 142 136Centre 135 131 Picardie 140 116

    Champagne-Ardenne

    152 131 Poitou-Charentes 159 133

    Corse 165 153Provence-Alpes-

    Cte dAzur188 218

    Franche-Comt 158 137 Rhne-Alpes 161 172Ile-de France 175 230 Guadeloupe 139 114Languedoc- Roussillon

    176 185 Guyane 99 71

    Limousin 177 159 Martinique 138 121Lorraine 154 151 La Runion 149 123

    Comparer ces deux sries en dterminant pour chacune la moyenne et lcart-type, puis en faisant les deux diagrammes en bote.

    Exercice I

    Exercice II

    Cned - Acadmie en ligne

  • 37Squence 4 MA11

    Voici un tableau obtenu partir des donnes de lINSEE.

    Faire de mme qu lexercice prcdent avec la srie des donnes de 1995 et avec celle de 2009.

    Pourcentage de femmes lues au Parlement dans quelques pays du monde

    Pays 1995 2009 1995 2009 1995 2009

    Afrique du Sud 25 45 Espagne 16 36 Pays-Bas 31 41

    Algrie 7 8 tats-Unis 11 17 Pologne 13 20

    Allemagne 26 33 Finlande 34 42 Portugal 9 28

    Argentine 22 42 France 6 18 Rpublique tchque 10 16

    Australie 10 27 Grce 6 17 Royaume-Uni 10 20

    Autriche 24 28 Hongrie 11 11 Russie 13 14

    Belgique 12 35 Inde 8 11 Rwanda 4 56

    Brsil 7 9 Irlande 13 13 Sngal 12 22

    Cameroun 12 14 Italie 15 21 Sude 40 47

    Canada 18 22 Japon 3 11 Suisse 18 29

    Chine 21 21 Lituanie 7 18 Tunisie 7 28

    Core du Sud 2 14 Luxembourg 20 20 Turquie 2 9

    Cuba 23 43 Malte 2 9 Vit Nam 19 26

    Danemark 33 38 Mexique 14 28

    Monde 12 19

    Dans un lyce, on a rendu les copies dun contrle commun aux lves des trois classes de Premire ES.

    Pour chacune des classes on a dtermin les paramtres suivants (m dsigne la mdiane) :

    1ESA : leffectif est N = 30 et

    x Q m Q x x smin max, , , , , , , .= = = = = = =2 8 11 13 18 11 5 3 51 3 et

    1ESB : leffectif est N = 28 et

    x Q m Q x xmin'

    max', ' , , ' , ' , , ' ,= = = = = =5 9 5 12 13 15 12 31 3 et ss' , .= 2 7

    1ESC : leffectif est N = 33 et

    x Q m Q x x smin"

    max", " , " , " , , " "= = = = = = =4 7 10 15 17 12 41 3 et ,, .1

    On veut faire un bilan gnral pour lensemble des lves de ces trois classes.

    Quel(s) indicateur(s) numrique(s) peut-on dduire des donnes prcdentes ?

    Exercice III

    Exercice IV

    Cned - Acadmie en ligne

  • 38 Squence 4 MA11

    Le tableau suivant donne le montant (en tonnes) des ventes dune ferme dle-vage de saumons sur une priode de 15 ans.

    anne 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009

    Montant xi en tonnes

    51 60 68 75 67 80 85 88 81 93 92 91 100 105 107

    Construire le graphique reprsentant lvolution de ces ventes ;

    On remplace chacune des valeurs de la srie ( partir de la 2ime) par la moyenne de cette valeur avec les deux qui lentourent.

    Par exemple, y251 60 68

    3=

    + + soit y2 59 7= , .

    Calculer de mme y y3 14,..., et construire lvolution de ces moyennes.

    Quelle tendance peut-on mettre ainsi en vidence ?

    Moyennes mobilesOn appelle moyenne mobile centre dordre k, pour k impair, la srie obtenue en remplaant la valeur xi de rang i de la srie par la moyenne arithmtique de xi et des k 1 valeurs qui lentourent :

    Ordre 3 : yx x x

    ii i i

    =

    + + +1 1

    3

    Ordre 5 : yx x x x x

    ii i i i i

    =

    + + + + + +2 1 1 2

    5, etc.

    La srie de moyennes mobiles permet de lisser la srie chronologique initiale en gommant les irrgularits comme on a pu le constater sur lexercice prcdent o lon a calcul des moyennes mobiles centres dordre 3.

    Le tableau ci-dessous donne lindice des prix dune matire, anne par anne, de 2000 2011.

    Anne 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011

    Indice 100 80 110 135 95 105 140 160 120 110 80 105

    A laide dun tableur, calculer les moyennes mobiles dordre 3 et 5 de cette srie.

    Insrer un diagramme montrant les trois courbes ; celle de la srie initiale, celles des moyenne mobiles dordre 3 et celles des moyennes mobiles dordre 5. Que pouvez vous constater concernant ces courbes ?

    Exercice V

    Exercice VI

    Cned - Acadmie en ligne

  • 39Squence 4 MA11

    Courbes de Lorenz

    Les fonctions f et g sont dnies sur [0 ;1] par f x x x( ) , ,= +0 2 0 82 et

    g x x x( ) , ,= +0 8 0 22

    a) Etudier les variations de f et g sur [0 ;1] et construire leurs courbes repr-sentatives dans un repre orthonorm dunit 10 cm.

    b) Construire sur le mme graphique la droite dquation y x= restreinte [0 ;1].

    Les courbes reprsentatives des fonctions f et g sont des courbes de Lorenz de deux pays F et G.

    Elles illustrent la rpartition du patrimoine des mnages dans chacun des pays.

    En abscisse, x reprsente le pourcentage des personne les plus pauvres par rapport la population totale, et en ordonne, y reprsente le pourcentage du patrimoine total quils possdent.

    Exemple de lecture : f ( , ) ,0 2 0 168= signie que 20% des personnes les plus pauvres possdent 16,8% du patrimoine total.

    a) Sachant que, pour chacun de ces pays, le patrimoine total des mnages est denviron 165000 , dterminer pour chacun des pays la mdiane, les premiers et troisime quartiles, les premiers et neuvime dciles de la srie des patrimoine des mnages.

    b) Construire les diagrammes en bote correspondant chacun des pays, les mous-taches des botes sarrtant au premier et au neuvime dcile. Commentez.

    Commenter le graphique ci-dessous.

    1962

    1960

    3000

    8000

    Source : Insee, Dads.

    Diffrence Mdiane 1er dcile

    Diffrence 9e dcile Mdiane

    Diffrence 9e dcile 1er dcile

    13000

    18000

    23000

    1964

    1966

    1968

    1970

    1972

    1974

    1976

    1978

    1980

    1982

    1984

    1986

    1988

    1990

    1992

    1994

    1996

    1998

    2000

    2002

    2004

    Exercice VII

    Exercice VIII

    chelle absolue des salaires en France : diffrences absolues de salaires annuels rels (en 2005)

    Cned - Acadmie en ligne