69
Module 5 – Statistique descriptive MQT 1001 Mathématiques appliquées à la gestion Houda Affes

MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

  • Upload
    others

  • View
    10

  • Download
    0

Embed Size (px)

Citation preview

Page 1: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

Module 5 – Statistique descriptive

MQT 1001 Mathématiques appliquées

à la gestion

Houda Affes

Page 2: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

Table des matières

Section 1 : les statistiques et la statistique ................................................................................................................. 4 La différence est dans le « s » ................................................................................................................................. 4 Des données qui ont du caractère ....................................................................................................................... 5

Section 2 : les tableaux statistiques et autres tableaux ........................................................................................... 7 Les tableaux à un seul caractère .......................................................................................................................... 7

Le tableau d’un caractère qualitatif nominal ................................................................................................ 8 Le tableau d’un caractère qualitatif ordinal .................................................................................................. 9 Le tableau d’un caractère quantitatif discret .............................................................................................. 10 Le tableau d’un caractère quantitatif continu ............................................................................................ 11

Les tableaux à deux caractères .......................................................................................................................... 14 Le tableau statistique à deux caractères qualitatifs .................................................................................... 14 Le tableau statistique à deux caractères quantitatifs ................................................................................. 16 Le tableau statistique à caractères mixtes .................................................................................................... 17 Les autres tableaux ........................................................................................................................................... 18

Cas particulier : les tableaux de séries chronologiques .................................................................................... 20

Section 3 : les graphiques ......................................................................................................................................... 22 Les graphiques à un seul caractère .................................................................................................................... 22

Les graphiques d’un caractère qualitatif ...................................................................................................... 22 Les graphiques d’un caractère quantitatif continu ..................................................................................... 28

Les graphiques à deux caractères ...................................................................................................................... 31 Les graphiques de deux caractères qualitatifs ............................................................................................. 31 Les graphiques de deux caractères quantitatifs .......................................................................................... 34 Les graphiques de deux caractères mixtes ................................................................................................... 36

Cas particulier : les graphiques de séries chronologiques ................................................................................ 38 Les graphiques à échelle logarithmique ............................................................................................................ 39

Section 4 : les sommaires numériques .................................................................................................................... 44 Les mesures de tendance centrale ..................................................................................................................... 44

La moyenne ...................................................................................................................................................... 45 La moyenne pondérée .................................................................................................................................... 47 La médiane ....................................................................................................................................................... 48 Le mode ............................................................................................................................................................. 49

Quelle mesure de tendance centrale devrait-on privilégier? ......................................................................... 50 Les mesures de dispersion ................................................................................................................................ 52 L’étendue .......................................................................................................................................................... 52 Les quartiles ....................................................................................................................................................... 53

La variance et l’écart type ................................................................................................................................... 56 La variance ........................................................................................................................................................ 57 L’écart type ....................................................................................................................................................... 59

mbernier
Note
Cancelled définie par mbernier
Page 3: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

Quelle mesure de dispersion devrait-on utiliser? ................................................................................................ 60 Trois mesures de comparaison ........................................................................................................................ 60

Les sommaires numériques : quelques applications financières ..................................................................... 65

Résumé ....................................................................................................................................................................... 68

Références ................................................................................................................................................................. 69

Page 4: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

4

Section 1 : les statistiques et la statistique

Après une présentation des concepts des statistiques et de la statistique (vous avez bien lu, il n’y a pas

de répétition), vous apprendrez à distinguer les différents types de données propres à la statistique

descriptive. Mais ne vous méprenez pas sur la brièveté de cette section. Bien qu’elle soit succincte,

elle sert d’assise à l’ensemble de la matière couverte par le module 5. Prenez donc tout votre temps

pour bien maîtriser ces concepts.

La différence est dans le « s »

Les statistiques sont des données, des informations regroupées. Les journaux et les revues spécialisées

foisonnent de statistiques : statistiques démographiques, de morbidité ou de mortalité, pourcentage

des intentions de vote, taux de chômage mensuel, moyenne au bâton des joueurs de baseball,

pourcentage de victoires d’une équipe de hockey, statistiques sur la pauvreté. La statistique, pour sa

part, est un champ d’étude qui se divise en deux catégories distinctes, mais complémentaires : la

statistique descriptive, objet de ce module, et la statistique inférentielle. D’abord développée dans les

affaires publiques, ce qui explique son nom — le mot vient du latin statisticus qui signifie « relatif à

l’État » —, la statistique s’est étendue à l’ensemble des domaines de l’action humaine.

La statistique descriptive est le champ d’étude qui vise à rassembler des données, des informations,

au moyen de questionnaires, sondages ou autres méthodes d’inventaire, à les présenter sous forme

de tableaux, de graphiques ou de sommaires numériques (moyenne, médiane, écart type, etc.) et à

tenter de les interpréter. La statistique descriptive est presque aussi vieille que l’écriture. Au temps des

pharaons, les Égyptiens recueillaient déjà des données sur l’état de leurs récoltes et comparaient le

rendement de leurs lopins de terre. Produire des statistiques fait donc partie du besoin humain de

« mettre un peu d’ordre » dans la quantité d’informations qui lui parvient. Ce besoin est encore plus

criant aujourd’hui, submergés que nous sommes d’informations. La statistique descriptive contribue à

ordonner ces informations en mettant au point et en appliquant des méthodes et des outils de

cueillette, de classement, de représentation graphique et numérique des données. Ces méthodes et

ces outils – sondages, questionnaires, tableaux, diagrammes, moyennes des résultats, corrélations

– font partie depuis des décennies du quotidien des gestionnaires.

La statistique inférentielle, une branche plus récente de la statistique, vise à tirer des conclusions sur

une population sur la base des observations obtenues à partir d’un échantillon. Son application la plus

Page 5: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

5

connue est le sondage d’opinion pendant les périodes électorales, alors que les maisons de sondage,

à partir d’une infime partie de la population, tentent de prédire avec justesse les résultats des élections.

Les sondeurs réussissent, avec une marge d’erreur plus ou moins grande, à inférer à l’ensemble de la

population des résultats obtenus auprès de quelques centaines de personnes seulement. La statistique

inférentielle (aussi appelée inférence statistique, statistique inductive ou statistique mathématique)

développe et applique des méthodes et des outils qui permettent d’analyser les informations dans le

but d’en tirer des généralisations. Le modèle probabiliste et l’échantillonnage, objets du module 6,

sont ses outils essentiels.

Dans les définitions précédentes, nous avons mentionné les mots population et échantillon. En

statistique, le terme population fait référence à l’ensemble de toutes les unités (individus ou objets) sur

lesquelles portera l’étude statistique : l’ensemble des personnes ayant le droit de vote, l’ensemble des

habitants d’un pays, l’ensemble des pièces produites quotidiennement par une entreprise. Mais

comme il est souvent peu pratique et coûteux de recueillir des données sur toutes les unités de la

population, le statisticien sélectionne un échantillon, un sous-ensemble de la population à étudier.

L’identification de la population à étudier, tout comme la technique d’échantillonnage1, sont des

étapes importantes de toute étude statistique : elles influencent l’analyse et la fiabilité des résultats

ainsi que la prise de décision.

Des données qui ont du caractère

La présentation des caractères statistiques2 s’appuie sur des données cumulées par sondage ou par

des informations non classées ou brutes. Ces données sont, selon Champlain et al. (1996), les « résultats

d’observations ou d’expériences qui servent de point de départ à une étude statistique ». Les

caractères peuvent être numériques (1, 2, 3, 4, etc.) ou alphanumériques (homme, femme). On en

distingue deux types : les caractères qualitatifs et les caractères quantitatifs.

Selon Giard (1995), « on est en présence d’un caractère qualitatif lorsque chaque élément observé

fait explicitement l’objet d’un rattachement unique à une modalité choisie dans un ensemble de

modalités exclusives permettant de classer tous les éléments de modalités exclusives, selon un certain

point de vue ». Par exemple, dans une étude sur la consommation de produits naturels par la

population québécoise, le sexe et le niveau de scolarité peuvent être considérés comme des

caractères qualitatifs. Les modalités ou qualités exclusives du caractère « sexe » sont les genres homme

1. Le module 6 présente quelques méthodes d’échantillonnage. 2. Terme que nous désignerons dorénavant, pour faciliter la lecture, par « caractères ».

Page 6: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

6

et femme; celles définissant le caractère « niveau de scolarité » pourraient être, selon les besoins de

l’étude, les modalités études primaires, études secondaires, études collégiales, études universitaires et

autres études. Contrairement aux caractères quantitatifs, les modalités des caractères qualitatifs ne

sont pas mesurables; ce sont des données non numériques. Ces données peuvent toutefois être

numérisées pour une saisie rapide : on pourrait, par exemple, désigner la modalité homme par le

nombre 1 et la modalité femme par le nombre 2.

Lorsqu’il n’existe aucun ordre ou gradation dans les modalités, le caractère qualitatif est dit nominal.

C’est le cas pour le caractère qualitatif « sexe », mais aussi pour des caractères tels le lieu de naissance

d’un individu, son statut civil, son moyen de transport, son parti politique, la couleur de ses yeux, le fait

qu’il porte ou non un manteau de pluie, qu’il déjeune ou non, le type d’automobile qu’il utilise.

Lorsqu’un ordre semble exister, le caractère qualitatif est dit ordinal. Ainsi, les différents niveaux de

scolarité, les classes sociales — moyenne, supérieure, inférieure —, les sortes de céréales — enrichie ou

non enrichie — sont des caractères qualitatifs ordinaux.

Les caractères quantitatifs, ou variables quantitatives, sont ceux auxquels on peut faire correspondre

des nombres. D’après Giard (1995), « on est en présence d’un caractère quantitatif lorsque chaque

élément observé fait explicitement l’objet d’une même mesure ». Les résultats scolaires bruts, le revenu,

le poids et la taille d’un individu, le montant d’un chèque, sont des caractères quantitatifs.

Lorsque la variable ne peut prendre qu’un nombre limité de valeurs, le caractère quantitatif est dit

discret. Par exemple, dans une étude statistique portant sur le nombre d’enfants d’un ménage, le

nombre d’enfants est un caractère discret, car il peut prendre un nombre limité de valeurs (0, 1, 2, 3,

4, etc., mais non 2,5 ou 3,842). Le nombre de voyages effectués par un vendeur dans une année et le

nombre de pois dans une boîte de conserves d’un format donné sont des caractères quantitatifs

discrets. Lorsque le caractère peut prendre toutes les valeurs contenues dans un intervalle donné, fini

ou infini, le caractère quantitatif est dit continu. La taille et le poids d’un individu sont des caractères

quantitatifs continus.

On peut aussi construire un caractère qualitatif à partir d’un caractère quantitatif. On pourrait par

exemple regrouper chaque montant des salaires d’une entreprise en catégories de revenus ou répartir

les âges des employés en catégories d’âge. L’inverse n’est toutefois pas possible.

NOTE : Faites les exercices de la section 1 dans le Recueil des activités pratiques avant de continuer la

lecture.

Page 7: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

7

Section 2 : les tableaux statistiques et autres tableaux

Tout gestionnaire, peu importe son champ d’action, est confronté un jour ou l’autre à la consultation

ou à l’analyse de sondages ou d’études de marché, à la comparaison mensuelle ou annuelle des

ventes, des achats ou des salaires, à l’étude des variations des taux de chômage ou de l’emploi. La

présentation de données sous forme de tableau constitue une première manière de synthétiser les

données, les deux autres étant, nous le verrons plus loin, la synthèse graphique et les sommaires

numériques. Quand elle est faite d’une manière claire et ordonnée, la disposition de ces données en

lignes et en colonnes, sous forme de tableaux, facilite la consultation.

En statistique, les tableaux sont de deux types : les tableaux à un seul caractère et les tableaux à deux

caractères. Mais tous les tableaux que vous verrez durant vos études ou dans vos lectures – et ces

tableaux sont nombreux – ne sont pas des tableaux statistiques. Nous en présentons quelques-uns sous

la rubrique « Les autres tableaux ». La section se termine par la présentation d’un type particulier de

tableau, celui des séries chronologiques.

Les tableaux à un seul caractère

La présentation des tableaux à un seul caractère diffère en fonction du type de caractère. Voici, pour

chacun des caractères étudiés précédemment, une présentation type de tableau, les éléments qu’il

contient et l’interprétation qu’on peut en faire.

Page 8: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

8

Le tableau d’un caractère qualitatif nominal

Lors d’une enquête menée sur l’informatisation de la clientèle de la Télé-université, il y a plusieurs

années, les auteurs de l’étude ont posé la question suivante à un échantillon représentatif de la

clientèle étudiante : « Disposez-vous d’un micro-ordinateur à votre domicile? ». Deux cents personnes

ont répondu oui à la question, 92 ont répondu non. Le tableau partiel de données brutes fournit les

informations suivantes :

Tableau 5.1 « Disposez-vous d’un micro-ordinateur à votre domicile? » (données partielles)

Numéro de l’étudiant Réponse

1 Non

2 Oui

... ...

291 Oui

292 Oui

Comment disposer ces données? La présentation des données d’un caractère qualitatif nominal

comporte habituellement les éléments suivants : les modalités (ici, oui et non); la fréquence absolue

(ou, plus couramment, la fréquence) de chaque modalité, symbolisée par la lettre , soit le nombre

de personnes qui ont répondu oui ou non à la question; et la fréquence relative3, symbolisée par la

lettre , soit le rapport de la fréquence d’une modalité ( ) sur le nombre total des données ( ),

selon la formule :

La fréquence relative est souvent représentée en pourcentage. On multiplie le résultat par 100 pour

obtenir le pourcentage, selon la formule .

Le tableau 5.3 synthétise les données brutes de la question à l’étude, montre la fréquence et la

fréquence relative de chaque modalité ainsi que la fréquence totale et la fréquence relative totale.

La fréquence relative est traduite en pourcentage.

3. Il arrive souvent que les auteurs ne présentent que les fréquences ou que les fréquences relatives. On parlera alors soit

de tableau de fréquences (ou d’effectifs), soit de tableau de fréquences relatives.

xi

fi xi n

fi =xin

p% = fi ×100 =xin×100

Page 9: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

9

Tableau 5.2 « Disposez-vous d’un micro-ordinateur à votre domicile? »

Modalités Fréquences Fréquences relatives

Oui 200 68,5 %

Non 92 31,5 %

Total 292 100,0 %

Source : L’informatisation de la clientèle et l’accès au campus virtuel, Télé-université, août 1997.

Déterminer la fréquence relative de la modalité « oui » revient donc à calculer la formule suivante :

Pour interpréter le tableau d’un caractère qualitatif nominal, il suffit de rendre compte des proportions

données par les fréquences relatives, deux expressions d’une même réalité. À partir du tableau 5.3, on

pourra soutenir que les deux tiers des personnes interrogées disposent d’un micro-ordinateur à domicile

alors que seulement le tiers des répondants n’en possèdent pas.

Le tableau d’un caractère qualitatif ordinal

Voici une autre situation où l’on mesure l’épaisseur de la neige au sol à Whistler, en Colombie-Britannique,

durant 25 jours consécutifs. Les résultats sont regroupés en classes.

Tableau 5.3 Épaisseur de la neige à Whistler Mountain en Colombie-Britannique pendant une période de 25 jours

Modalité : Épaisseur de la neige

Fréquence absolue

Fréquence relative

Fréquence cumulée

Fréquence relative cumulée

210 et moins 1 4 % 1 4 %

210 à 220 2 8 % 3 12 %

220 à 230 3 12 % 6 24 %

230 à 240 5 20 % 11 44 %

240 à 250 7 28 % 18 72 %

250 à 260 5 20 % 23 92 %

260 et plus 2 8 % 25 100 %

Source : Site Web de Statistique Canada : https://www150.statcan.gc.ca/n1/edu/power-pouvoir/ch10/5214862-fra.htm (consulté le 22 mai 2019).

foui =xouin

= 200292

= 0,685⇒ 68,5%

Page 10: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

10

Vous aurez remarqué qu’aux notions déjà connues de modalité, de fréquence et de fréquence

relative s’ajoute celle de fréquence relative cumulée. Cette fréquence relative cumulée, , ou

cumul de chaque fréquence relative, se formule ainsi :

où est la fréquence relative de et , le nombre de modalités.

Selon cette formule, la fréquence relative cumulée des deux premières modalités (210 cm et moins et

210 à 220) peut se traduire ainsi :

En d’autres termes, c’est la somme des fréquences de modalités qui sont inférieures ou égales à la

modalité nommée.

On voit bien ce que cette notion ajoute à l’interprétation des données du tableau : en plus de

présenter la proportion de chaque modalité au moyen de sa fréquence relative, la fréquence relative

cumulée permet en effet de connaître la proportion des modalités regroupées pour fins d’analyse. On

peut par exemple noter, si cela s’avère important pour l’interprétation, que pour près de la moitié des

journées (44 %), il y avait moins de 240 cm de neige au sol ou que pour près des deux tiers des journées,

(72 %), il y en avait moins de 250 cm.

Le tableau d’un caractère quantitatif discret

Le directeur des finances de l’entreprise fictive LAMBDA s’est intéressé à l’étude du nombre de plaintes

traitées quotidiennement par son service de recouvrement. Au cours des 25 jours d’observation, il a

compilé les données suivantes (les fréquences relatives et les fréquences relatives cumulées sont

notées en nombres décimaux) :

F( xk )

F( xk ) = fii=1

k

∑ fi xi k

F( x2 ) = fii=1

2

∑ = f1 + f2 = 4 % +8 % = 12 %

Page 11: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

11

Tableau 5.4 Répartition du nombre de plaintes traitées quotidiennement par le service à la clientèle sur une période de 25 jours

Nombre de plaintes par jour

Nombre de jours où c’est arrivé

Fréquences relatives Fréquences relatives cumulées

0 5 0,20 0,20

1 8 0,32 0,52

2 6 0,24 0,76

3 3 0,12 0,88

4 2 0,08 0,96

5 1 0,04 1,00

Total 25 1,00

Le tableau d’un caractère quantitatif discret s’apparente à celui d’un caractère qualitatif ordinal : les

mêmes formules s’appliquent à la présentation des fréquences relatives et des fréquences relatives

cumulées de ces deux types de caractère. L’interprétation des données de ce tableau suit donc la

même logique. Le préposé aux plaintes pourra ainsi constater qu’aucune plainte n’a été traitée par

son service 5 jours sur 25 (20 %); que, pour plus de la moitié de cette période (52 %), le nombre de

plaintes traitées quotidiennement est peu élevé (0 ou 1); et que la réception du plus grand nombre

de plaintes (4 ou 5) se limite à 3 jours sur une période de 25 jours (12 %).

Le tableau d’un caractère quantitatif continu

La présentation d’un tableau statistique d’un caractère continu représente un cas particulier.

Supposons en effet que l’on veuille regrouper les données concernant les montants des 500 chèques

émis par l’entreprise fictive BETA au cours du mois de septembre. Il serait fastidieux d’énumérer le

montant de chacun des 500 chèques. La solution est donc de procéder à des regroupements en

classes de chacune des variables (501 $, 502 $, ..., 4 503 $, etc.) de manière à faciliter la com-

préhension du phénomène étudié.

Page 12: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

12

La technique qui permet de distribuer les données par classes comporte quatre étapes :

1. Identifier, parmi les données, la plus petite valeur (le minimum) et la plus grande valeur (le maximum).

2. Déterminer le nombre de classes que vous utiliserez. On doit porter une attention particulière au nombre de classes : un trop grand nombre rend la compréhension du phénomène difficile; un nombre trop faible conduit à une perte d’information. Giard (1995) propose « une règle empirique utilisée par de nombreux praticiens [qui] consiste à retenir un nombre de classes égal à l’entier le plus faible tel que . L’application de cette règle empirique conduit au tableau suivant qui montre, par exemple, que l’on a intérêt à créer un tableau de distribution comportant 5 classes pour analyser les tableaux de données ponctuelles comportant entre et observations4. »

Tableau 5.5 Nombre de classes correspondant au nombre d’observations

Nombre d’observations de 9 à16

de 17 à 32

de 33 à 64

de 65 à 128

de 129 à 256

de 257 à 512

de 513 à 1024

Nombre de classes correspondantes

4 5 6 7 8 9 10

3. Délimiter les bornes inférieure et supérieure de chaque classe, en prenant bien soin de ne pas faire de recoupement.

4. Placer chaque valeur dans sa classe correspondante.

4. Cette règle empirique n’est cependant pas universelle : votre jugement sur le nombre de classes permettant une

bonne compréhension du phénomène devrait être un critère plus important. Notez que les logiciels actuels (chiffriers, applications statistiques) effectuent ce regroupement par classes.

k

2k ≥ n

n = 17 n = 32

n

k

Page 13: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

13

Tableau 5.6 Répartition du montant des chèques émis par l’entreprise BETA au cours du mois de septembre

Montant des chèques Nombre de chèques Fréquences relatives Fréquences relatives cumulées

500-1499,99 80 16 % 16 %

1500-2499,99 130 26 % 42 %

2500-3499,99 140 28 % 70 %

3500-4499,99 60 12 % 82 %

4500-5499,99 70 14 % 96 %

5500-6499,99 20 4 % 100 %

Total 500 100 %

Le calcul des fréquences relatives et des fréquences relatives cumulées s’effectue à partir des classes.

Ainsi, la fréquence relative de la classe se calcule d’après la formule suivante :

, où est la fréquence de la classe et est la fréquence totale de la distribution.

Dans l’exemple ci-dessus, la fréquence relative de la quatrième classe (3 500-4 499,99) est :

Pour calculer la fréquence relative cumulée d’une classe donnée, on utilisera la formule suivante :

où est la fréquence relative de la classe , étant la borne supérieure de la

classe .

Dans l’exemple, la fréquence relative cumulée de la classe , soit 4 500-5 499,99, est :

L’interprétation d’un tableau d’un caractère quantitatif continu suit la même logique que celle des

tableaux d’un caractère quantitatif discret. Par les fréquences relatives, on pourra entre autres noter

que, parmi les 500 chèques émis par l’entreprise BETA au cours du mois de septembre, 28 % étaient

d’un montant variant entre 2 500 $ et 3 499 $, 26 % entre 1 500 $ et 2 499 $, alors que seulement 4 %

des chèques émis comportaient une valeur de plus de 5 500 $. La colonne des fréquences relatives

f Ci

fCi =xin

xi Ci n

fC4 =60500

= 0,12 = 12%

F(ak ) = fii=1

k

∑ fi Ci ak

Ck

C5

F(a5 ) = fii=1

5

∑ = f1 + f2 + f3 + f4 + f5 = 16 % + 26 % + 28 % +12 % +14 % = 96 %

Page 14: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

14

cumulées nous renseignera aussi sur les proportions de « petits » chèques (par exemple, moins de

3 500 $) et de « gros » chèques (de 3 500 $ ou plus) émis, soit 70 % par rapport à 30 %.

Les tableaux à deux caractères

Il existe trois types de tableaux comparant deux caractères : ceux à deux caractères qualitatifs, ceux

à deux caractères quantitatifs et ceux à caractères mixtes (comportant un caractère qualitatif et

l’autre quantitatif). Vous verrez aussi une multitude de tableaux à deux caractères qui ne répondent

pas aux conditions permettant de les classer dans l’un ou l’autre de ces trois types. Quelques-uns de

ces tableaux vous sont présentés et expliqués.

Le tableau statistique à deux caractères qualitatifs

Lors d’une enquête menée sur l’informatisation de la population, des agents du gouvernement se sont

intéressés au lien existant entre le fait de disposer ou non d’un micro-ordinateur et les groupes d’âge,

deux variables qualitatives. Les données brutes recueillies étaient les suivantes :

Tableau 5.7 Les répondants à l’enquête, selon la possession d’un ordinateur à domicile et l’âge (données partielles)

Numéro du répondant Ordinateur à domicile Groupes d’âge

1 Non 35-44

2 Oui 65 et plus

... ...

239 Oui 34 et moins

240 Oui 35-44

Page 15: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

15

En apparence complexe, la présentation des données des tableaux à deux caractères est pourtant

fort simple. Il suffit en effet de trouver les combinaisons possibles entre les deux variables puis de classer

les répondants selon l’une ou l’autre des combinaisons « ordinateur à domicile/groupes d’âge ». Dans

l’exemple ci-dessus, les combinaisons sont au nombre de 8 : oui/34 et moins, oui/35-44, oui/45-64,

oui/65 et plus, non/34 et moins, non/35-44, non/45-64, non/65 et plus. Lorsque chacun des répondants

est classé par rapport à sa combinaison, on obtient les fréquences suivantes :

Tableau 5.8 La possession d’un ordinateur à domicile selon le groupe d’âge

Ordinateur à domicile Groupe d’âge5 Total

34 et moins 35-44 45-64 65 et plus

Oui 76 58 66 18 218

Non 11 2 6 11 22

Total 77 62 72 29 240

Vous noterez l’abondance et la richesse de l’information que l’on peut extraire de ce type de tableau.

La dernière ligne, appelée marge horizontale, et la dernière colonne (la marge verticale) renseignent,

tout comme le ferait un tableau à un seul caractère, sur les fréquences de chaque groupe d’âge et

sur le nombre de répondants qui disposent d’un ordinateur à domicile. Un regard sur chaque colonne

permet de déterminer le nombre des répondants de tel groupe d’âge qui ont accès ou non à un

ordinateur à domicile. Chaque catégorie d’âge est mise en relation avec le fait de posséder ou non

un ordinateur à domicile; chaque colonne pourrait être comparée avec l’ensemble des répondants.

Un coup d’œil sur chaque ligne et ce sont cette fois les groupes d’âge qui sont mis en relation avec le

fait de disposer ou non d’un micro-ordinateur à domicile. Ici, ce sont les possesseurs (ou non) d’un

ordinateur à domicile qui sont mis en relation avec la variable âge.

Pour rendre ces informations plus claires, il est souhaitable de calculer les fréquences relatives par

lignes et par colonnes. La lecture est certes plus complexe, mais la richesse de l’information est

grandement augmentée.

5. Le groupe d’âge est un exemple d’un caractère qualitatif construit à partir d’un caractère quantitatif.

Page 16: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

16

Tableau 5.9 La possession d’un ordinateur à domicile selon les groupes d’âge

Ordinateur à domicile Groupes d’âge Total

34 et moins 35-44 45-64 65 et plus

Oui Fréquences relatives par ligne Fréquences relatives par colonne

76 34,9 % 98,7 %

58 26,6 % 93,5 %

66 30,3 % 91,7 %

18 8,3 % 62,1 %

218 (90,8 %)

Non Fréquences relatives par ligne Fréquences relatives par colonne

1 4,5 % 1,3 %

4 18,2 % 6,5 %

6 27,3 % 8,3 %

11 50 % 9,2 %

22 (9,2 %)

Total 77 35,3 %

62 28,4 %

72 33,0 %

29 13,3 %

240 100,0 %

À partir du tableau précédent, on pourra ainsi établir, en se servant des fréquences relatives par

colonne, que 98,7 % des répondants de 34 ans et moins disposent d’un ordinateur à domicile, alors

que ce chiffre descend à 62,1 % chez les répondants de plus de 65 ans. De même, l’analyse des

fréquences relatives par ligne permettra, par exemple, d’identifier, dans le sous-ensemble de ceux qui

disposent d’un ordinateur à domicile, la répartition des répondants par strates d’âge. Par exemple, la

première ligne de fréquences montre que 34,9 % de ceux qui possèdent un ordinateur à domicile sont

âgés de 34 ans et moins.

Le tableau statistique à deux caractères quantitatifs

Les règles menant à la construction d’un tableau à deux caractères quantitatifs suivent la même

logique que celles de l’exemple précédent. La seule différence notable est que les valeurs des

caractères sont présentées par classes ou par centres de classes. Voici un exemple de ce type de

tableau. Il montre les salaires annuels par âge des salariés d’une filiale de la société fictive LAMBDA.

Page 17: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

17

Tableau 5.10 Répartition des salaires annuels par âge

Âge des salariés Salaires annuels Total

0 à 24 999 $ 25 000 à 69 999 $

70 000 à 499 999 $

500 000 $ et +$

0 à 24 ans 582 126 4 1 713

25 à 39 ans 463 784 415 1 1 663

40 à 54 ans 451 730 416 6 1 603

55 et plus 1 163 1 086 329 7 2 585

Total 2 659 2 726 1 164 15 3 564

Dans le but de faciliter la lecture du tableau, l’auteur utilise des classes pour marquer les salaires selon

l’âge des contribuables. Ce tableau, comme tous les tableaux à deux caractères, s’interprète en

analysant les marges horizontale et verticale et en comparant les fréquences relatives par colonne ou

par rangée. On remarquera aussi que la majorité des salariés ayant un salaire annuel supérieur à

500 000 $ sont âgés de 55 ans et plus et qu’il y a peu de hauts salariés dans la catégorie de 0 à 24 ans.

Le tableau statistique à caractères mixtes

Voici un exemple, que nous avons reconstitué d’après les résultats d’une étude de l’Institut national

de santé publique du Québec : le Portrait de la consommation d’alcool au Québec de 2002 à 2015.

On a imaginé un sondage auprès de 1 200 personnes dont 230 ont déclaré ne pas boire d’alcool.

Voici un tableau comportant des caractères mixtes. L’étude porte sur la consommation d’alcool. Plus

précisément, elle s’intéresse au type de consommation des buveurs en fonction du revenu déclaré.

Les types de consommation sont des modalités d’un caractère qualitatif nominal (défini selon les

réponses au sondage) alors que le revenu, un caractère quantitatif continu, est divisé en trois classes.

Dans le prochain tableau, FRC signifie « fréquence relative par rapport à la colonne » et FRR,

« fréquence relative par rapport à la rangée ».

Page 18: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

18

Tableau 5.11 Répartition des consommateurs d’alcool selon leurs types de consommation et leurs revenus

Type de consommation Revenu

0-39 999 40 000-79 999 80 000 et plus Total

Consommation à faible risque Fréquence relative par colonne Fréquence relative par ligne

150 56 % 33 %

173 51 % 38 %

132 37 % 29 %

455

Consommation à haut risque Fréquence relative par colonne Fréquence relative par ligne

63 22 % 23 %

92 27 % 33 %

120 33 % 44 %

275

Consommation excessive Fréquence relative par colonne Fréquence relative par ligne

57 21 % 24 %

75 22 % 31 %

108 30 % 45 %

240

Total 270 340 360 970

Source : Données calculées d’après les résultats d’une étude de l’Institut national de santé publique du Québec : Le Portrait de la consommation d’alcool au Québec de 2002 à 2015.

Que nous révèle ce tableau? L’étude des fréquences relatives par colonne (FRC) montre que les

répondants à faible revenu sont des consommateurs à faible risque dans une proportion de 56 %, et

qu'ils ont une consommation excessive dans une proportion de 21 %. Les FRC montrent aussi que les

personnes à « revenu moyen » ont une consommation à haut risque dans 22 % des cas. L’examen des

fréquences relatives par ligne (FRL) nous permet de penser que ceux qui ont une consommation à

faible risque se retrouvent surtout chez les gens à revenu moyen alors que la consommation excessive

est plus fréquente chez les gens à revenu élevé (45 %).

Les autres tableaux

Tous les tableaux à un ou deux caractères que vous verrez au cours de vos études ou que vous aurez

à analyser dans le cadre de votre travail ne sont pas des tableaux issus d’études statistiques. Ces

tableaux sont très nombreux. La richesse de leurs informations ne doit pas faire oublier qu’ils doivent

être interprétés avec la plus grande prudence.

Souvent, on veut comparer des populations différentes et, de cette façon, comparer le comporte-

ment général des individus. Prenons un exemple fictif d’une comparaison dans le comportement des

consommateurs, l’une faite aux États-Unis, l’autre faite au Québec. Il s’agit de deux études sur le

comportement de prise de décision des consommateurs. Les deux études ont analysé deux produits

Page 19: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

19

différents : l’achat de détersifs chez les Américains et l’achat d’analgésiques chez les Québécois. On

ne peut interpréter ce tableau comme un tableau statistique à deux caractères qualitatifs. Vous

remarquerez en effet que ni l’un ni l’autre des caractères en cause ne sont des ensembles de

modalités exclusives et que, de ce fait, la marge horizontale ne peut être additionnée. Il en est de

même pour la marge verticale (la dernière ligne) puisqu’on y compare deux produits différents. Il

faudra tenir compte de ces contraintes dans l’interprétation du tableau.

Tableau 5.12 L’achat de détersifs chez les Américains et l’achat d’analgésiques chez les Québécois

Étude

américaine (détersif)

Étude québécoise

(analgésique)

Nombre moyen d’emballages pris en main 1,73 1,21

Nombre moyen de comparaisons entre marques 0,35 0,31

Nombre moyen de comparaisons entre formats 0,12 0,26

Durée moyenne de l’épisode d’achat (secondes) 15,16 49,20

Pourcentage de justifications par le « prix » 25,50 12,12

Pourcentage de justifications par la « performance » 31,33 45,71

Pourcentage de justifications par l’« appréciation » 25,00 30,57

Pourcentage de justifications par l’« influence des autres » 18,47 11,6

Source : Tableau adapté du livre : D’Astous, A. et J. P. Sallenave (2000). Le marketing : de l’idée à l’action, 3e édition, Éditions Marie-France, p. 147.

Un autre exemple fictif met en relief les différences dans les attitudes adoptées par les gens selon les

cultures. Le tableau 5.13 rend compte du degré de fierté nationale des citoyens de sept pays.

Page 20: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

20

Tableau 5.13 Niveau de fierté nationale de sept pays (en pourcentage de la population)

Question : « Êtes-vous fier d’être un Américain/Anglais/Allemand/etc.? »

États-Unis Angleterre Espagne Italie France Japon Canada

Très fier 68 54 61 42 30 28 70

Plutôt fier 26 38 35 48 58 44 27

Pas très fier 5 7 4 8 10 26 3

Pas fier du tout 1 1 2 2 2 2 0

100 100 100 100 100 100 100

Source : Adaptation de l’outil pédagogique Perspective monde, École de politique appliquée de l’Université de Sherbrooke : http://perspective.usherbrooke.ca/bilan/servlet/ROpinion?codePays=ARM&codeQuestion=G006 (consultée le 22 mai 2019).

Il s’agit bien d’un tableau à deux caractères qualitatifs. La marge verticale de chacune des modalités

peut être additionnée et totalise 100. Mais essayez d’obtenir le même total pour les modalités de la

marge horizontale. L’interprétation de ce tableau se résumera donc à comparer, colonne par

colonne, le sentiment de fierté entre citoyens de nationalités différentes. On pourra ainsi arguer que

les Canadiens ont un sentiment de fierté plus prononcé que celui des six autres nations, sans présumer

toutefois de ce que ce sentiment de fierté peut signifier entre les nations.

Cas particulier : les tableaux de séries chronologiques

L’étude des phénomènes économiques ne peut être dissociée de l’activité du gestionnaire moderne.

Taux de chômage, taux d’emploi, variation des indices boursiers ou des ventes de l’entreprise sont

autant de phénomènes que les gestionnaires auront à prendre en compte dans leurs décisions

d’affaires. Ces phénomènes se prêtent bien à des comparaisons sur un horizon temporel.

Les économistes utilisent abondamment les séries chronologiques. Une série chronologique est

constituée par l’observation d’un caractère statistique sur une certaine période de temps. La synthèse

de ces données se fait sous forme de tableau (comme le démontre l’exemple suivant), ou plus

communément sous forme graphique (comme nous le verrons à la prochaine section).

Page 21: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

21

Tableau 5.14 Évolution de la population du Canada (en pourcentage) par groupes d’âge

2014 2016 2018

Moins de 20 ans 22,2 % 22,0 % 21,8 %

20-34 ans 20,6 20,3 20,4

35-49 ans 20,4 199 19,7

50-64 ans 21,2 21,4 21,0

65 ans et plus 15,6 16,4 17,1

Source : Inspiré du Site Web de Statistique Canada, Estimations de la population au 1er juillet : https://www150.statcan.gc.ca/t1/tbl1/fr/tv.action?pid=1710000501 (consulté le 15 août 2019).

L’addition de la marge verticale démontre bien que les catégories d’âge forment un ensemble, ce

qui n’est pas le cas de la marge horizontale. L’intérêt de ce tableau réside, rappelons-le, dans sa

capacité de comparer un caractère selon une durée de temps déterminée, par jour, par mois ou,

comme c’est le cas ici, par année. L’interprétation de ces séries chronologiques s’effectue donc dans

le sens horizontal seulement, soit la comparaison d’une variable pour une série temporelle donnée.

Ainsi, on pourra d’abord noter, entre 2014 et 2018, une diminution de la population « jeune » (34 ans et

moins), de 0,2 % chez les « moins de 20 ans » et de 0,2 % chez les « 20 à 34 ans », et une augmentation

de la population « vieillissante » (65 ans et plus), de 1,5 %. Une projection pour 2028 permet aussi de

prédire la poursuite de ces deux tendances.

NOTE : Faites les exercices de la section 2 dans le Recueil des activités pratiques avant de continuer la

lecture.

Page 22: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

22

Section 3 : les graphiques

Un tableau de chiffres n’est pas toujours directement interprétable par l’utilisateur. Il devient lourd s’il

contient trop de données. Rappelez-vous le tableau 5.10. Difficile d’y retrouver les valeurs les plus

élevées et les plus basses. Les représentations graphiques visent à alléger la présentation des données

et à en faciliter l’interprétation.

Cette traduction par l’image d’informations chiffrées peut revêtir de nombreuses formes. Nous avons

regroupé dans cette section les graphiques les plus couramment utilisés par les statisticiens. Nous

débutons par les graphiques à un seul caractère, puis ceux à deux caractères et, finalement, les

graphiques des séries chronologiques. Cette démarche suit le découpage de la section précédente

et utilise abondamment les tableaux de cette section.

Les graphiques sont constitués, à une exception près (le diagramme circulaire à secteurs), de deux

axes : l’abscisse (aussi appelé l’axe des abscisses, l’axe des x ou l’axe horizontal) et l’ordonnée (l’axe

des ordonnées, l’axe des y ou l’axe vertical). Sur l’abscisse, on représente habituellement le ou les

caractères étudiés, leurs modalités ou leurs valeurs6, l’axe des ordonnées étant réservé à la mesure de

chaque modalité ou chaque valeur, mesure proportionnelle à leur fréquence, leur fréquence relative

ou leur fréquence relative cumulée. En plus de bien identifier les quantités placées sur les axes, il faut

donner un titre au graphique, souvent pour préciser la situation étudiée. Ce titre peut être placé en

haut du graphique (au centre) ou encore dans le bas complètement, soit à droite, soit au centre.

Les graphiques à un seul caractère

Les graphiques à un seul caractère permettent la comparaison des données d’un même caractère,

qu’il soit qualitatif (nominal ou ordinal), quantitatif discret ou quantitatif continu.

Les graphiques d’un caractère qualitatif

Le diagramme à bandes est la représentation graphique la plus utilisée dans le cas d’un caractère

qualitatif, qu’il soit nominal ou ordinal. Dans ce diagramme, chacune des modalités du caractère

qualitatif est représentée par une bande de longueur proportionnelle à la grandeur associée à cette

modalité. Cette bande, ou rectangle, est de longueur équivalente aux fréquences. La plupart du

temps, dans le but de faciliter l’interprétation des données, l’axe des ordonnées reproduit les résultats

6. Quelques diagrammes présentent les caractères ou les modalités sur l’axe vertical.

Page 23: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

23

selon les fréquences relatives ou pourcentages. Voici deux exemples de diagramme à bandes, l’un

vertical, l’autre horizontal.

Figure 5.1 Répartition de l’épaisseur de la neige pendant 25 jours

Source : Tableau 5.3.

Figure 5.2 Répartition du nombre de plaintes par jour

Source : Tableau 5.4.

012345678

200 etmoins

210à220

220 à230

230 à240

240 à250

250 à260

260 etplus

Épaisseur de la neige à WhistlerNombre de jours

Épaisseur de la neige (en cm)

0 2 4 6 8 10

Nombre de plaintes par jour

5

5

3

2

1

0

Nombre d'occurences

Nombrede plaintes

Page 24: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

24

Le diagramme à bandes fait nettement ressortir, mieux que les chiffres d’un tableau, les modalités

élevées ou basses. La disposition horizontale de la figure 5.2 est la plus populaire. Elle permet au lecteur

de se faire une idée des différentes proportions en parcourant le diagramme de haut en bas plutôt

que de gauche à droite. On notera ainsi que les modalités « 240 à 250 cm » et « 1 plainte par jour »,

sont les plus élevées, alors que les modalités extrêmes, « 200 cm et moins » et « 6 plaintes par jour », sont

les plus basses.

Lorsqu’une ou plusieurs des modalités comprennent des valeurs négatives, un diagramme à bandes

peut être représenté par une ordonnée située au centre, comme le montre l’exemple de la figure 5.3

montrant la croissance du PIB dans les provinces et territoires canadiens entre 2014 et 2018.

Figure 5.3 La croissance du PIB par province et territoire canadiens

Source : Site Web de Statistique Canada : https://www150.statcan.gc.ca/t1/tbl1/fr/tv.action?pid=3610040202 (consulté le 22 mai 2019).

On peut également représenter la distribution de données d’un caractère qualitatif à l’aide d’un

diagramme rectangulaire à secteurs. Ce dernier utilise cette fois l’aire du rectangle, fractionné dans

le sens de la longueur, pour représenter autant de modalités que contient le caractère. Chaque

portion de rectangle, comme chaque bande du diagramme à bandes, est proportionnelle à la

fréquence relative de la modalité. Les secteurs peuvent être représentés verticalement ou horizon-

talement. L’ajout de la légende est ici essentiel, car elle permet d’identifier chaque modalité. Ce type

-5 0 5 10 15 20 25 30

T.N. et LabradorAlberta

SaskatchewanN.-Brunswick

YukonN.-ÉcosseManitoba

QuébecT. N.-O.

I. P. EOntario

C.-B.Nunavut

Variation du PIB (en pourcentage)

Prov

ince

s et t

errit

oire

s

Page 25: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

25

de diagramme permet de visualiser les fréquences relatives de même que les fréquences relatives

cumulées. On peut, par exemple, rapidement voir, en regardant la figure 5.4, que la fréquence de

l’épaisseur de la neige entre 230 et 240 cm est la même que celle entre 250 et 260 cm.

Figure 5.4 Répartition de l’épaisseur de la neige à Whistler Mountain

Source : Tableau 5.3.

Certains auteurs remplacent, dans les diagrammes à bandes ou les diagrammes rectangulaires, les

modalités par des pictogrammes ou des icônes, une représentation figurée du caractère étudié. Ainsi,

une représentation graphique de la structure du prix d’une bouteille d’eau gazeuse pourrait prendre

la forme d’une bouteille sur laquelle chaque modalité (coût de la bouteille, frais de marketing, main-

d’œuvre, marge du détaillant, etc.) serait représentée de manière proportionnelle. Une étude sur la

vente d’automobiles pourrait mettre en relief, à l’aide d’icônes en forme d’automobile, la quantité

d’automobiles vendues par région.

210 et moins210 à 220

220 à 230

230 à 240

240 à 250

250 à 260

260 et plus

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

Épaisseur de la neige (en cm)

260 et plus

250 à 260

240 à 250

230 à 240

220 à 230

210 à 220

210 et moins

Répartition de l'épaisseur de la neige à Whistler

Fréq

uenc

e (e

n %

)

Page 26: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

26

Le diagramme circulaire à secteurs est également un type de graphique très prisé dans la repré-

sentation d’un caractère qualitatif. Il est particulièrement bien adapté pour représenter, d’un seul

coup d’œil, toutes les modalités d’un caractère qualitatif. Il utilise le cercle au lieu du rectangle, mais

au fond le principe est le même : chaque pointe représente une des modalités de la variable, une

surface proportionnelle à sa fréquence ou, le plus souvent, à sa fréquence relative, fréquence relative

qui doit d’ailleurs être indiquée à côté de la pointe.

Figure 5.5 Répartition de l’épaisseur de la neige à Whistler Mountain

Source : Tableau 5.3.

La représentation graphique peut être soit verticale, comme illustrée à la figure 5.6, soit horizontale.

Elle facilite grandement l’identification des valeurs élevées ou basses du caractère discret. Même si le

diagramme à bâtons s’apparente à un diagramme à bandes, le diagramme à bandes devrait être

utilisé pour une distribution d’un caractère qualitatif alors que le diagramme à bâtons devrait être

réservé à une distribution d’un caractère quantitatif discret.

4%8%

12%

20%

28%

20%

8%

Épaisseur de la neige à Whistler

210 et moins

210 à 220

220 à 230

230 à 240

240 à 250

250 à 260

260 et plus

Page 27: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

27

Figure 5.6 Répartition du nombre de plaintes traitées quotidiennement par le service à la clientèle sur une période de 25 jours

Source : Tableau 5.4.

On peut aussi représenter un caractère discret par un diagramme à ligne brisée. Ce diagramme

comporte un axe horizontal divisé en unités et un axe vertical présentant les valeurs du caractère

étudié; ces valeurs sont représentées par des points que l’on relie entre eux par des segments de droite,

pour ainsi former une ligne brisée. Remarquez la ressemblance du diagramme à ligne brisée de la

figure 5.7 avec le diagramme de la figure 5.6 : le diagramme à ligne brisée est en effet associé à un

diagramme à bâtons verticaux en ce sens qu’il relie les sommets des bâtons.

Figure 5.7 Répartition du nombre de plaintes traitées quotidiennement par le service à la clientèle sur une période de 25 jours

Source : Tableau 5.4.

0%

5%

10%

15%

20%

25%

30%

35%

1 2 3 4 5 6

Fréquence du nombre de plaintes traitéesTraitement quotidien

Nombre de plaintes par jour

0%

5%

10%

15%

20%

25%

30%

35%

1 2 3 4 5 6

Traitement des plaintes

Nombre de plaintes par jour

Fréquence (%)

Page 28: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

28

L’interprétation des trois figures précédentes se limite à la comparaison des valeurs élevées et basses.

Pour représenter, et interpréter, les fréquences relatives cumulées d’un caractère quantitatif discret,

on construit une courbe (ou diagramme) en escalier, appelée aussi courbe cumulative. Cette courbe

cumulative est construite en portant en pointillé au-dessus de chaque valeur du caractère des bâtons

dont la longueur correspond aux fréquences relatives cumulées. On construit ensuite en traits pleins les

« marches d’escalier » en tirant vers la droite un trait horizontal, de l’extrémité d’un bâton au bord du

bâton suivant. C’est la courbe en trait plein qui correspond à la courbe cumulative (les lignes pointillées

doivent être effacées).

Figure 5.8 Répartition cumulative du nombre de plaintes traitées quotidiennement par le service à la clientèle sur une période de 25 jours

Fréquence cumulative du nombre de plaintes traitées quotidiennement

Source : Tableau 5.4.

L’utilisation de ce procédé graphique est intéressante pour qui veut représenter le cumul des valeurs.

La lecture de la figure 5.8 permet par exemple de constater que, pour plus de la moitié de la période

de traitement, le nombre de plaintes traitées quotidiennement est peu élevé (0 ou 1).

Les graphiques d’un caractère quantitatif continu

L’histogramme est le mode de représentation classique des séries continues. Une classe de valeurs est

représentée par un rectangle et la hauteur du rectangle est proportionnelle à la fréquence de la

Page 29: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

29

classe. C’est une juxtaposition de rectangles dont les bases sont les amplitudes des différentes classes

repérées sur l’axe horizontal et dont les surfaces sont proportionnelles aux fréquences. L’aire totale de

l’histogramme est toujours égale à 100 %, si l’ordonnée est en pourcentage, ou au total des fréquences

de la variable mesurée.

Dans le graphique d’un caractère continu, l’amplitude de classes est habituellement égale, comme

c’est le cas à la figure 5.9, ou plus rarement inégale, comme le démontre la figure 5.10. L’ordonnée

de la figure 5.9 est représentée en pourcentages (fréquences relatives) alors que celle de la figure 5.10

est montrée en fréquences.

Figure 5.9 Répartition du montant des chèques émis par l’entreprise BETA en septembre

Source : Tableau 5.6.

Figure 5.10 Répartition du montant des chèques émis par l’entreprise BETA en septembre

Source : Tableau 5.6.

0%

5%

10%

15%

20%

25%

30%

500-1499,99 1500-2499,99 2500-3499,99 3500-4499,99 4500-5499,99 5500-6499,99

Chè

ques

(en

%)

Montant des chèques

Montant des chèques

0

20

40

60

80

100

120

140

160

500-1499 1500-2499 2500-3499 3500-4499 4500-6499

Page 30: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

30

La distribution des fréquences relatives d’un caractère continu peut aussi être représentée par un

diagramme à ligne brisée. Ce graphique est obtenu en portant, au-dessus de la borne supérieure de

chaque classe, un point dont l’ordonnée est égale à la fréquence relative. On relie ensuite tous ces

points pour obtenir la ligne brisée qui correspond à la courbe de fréquences relatives. Remarquez la

ressemblance de la figure 5.11 avec l’histogramme de la figure 5.9 : chacun des points est en effet

l’image du centre des rectangles (le centre des classes). L’interprétation des figures 5.9, 5.10 et 5.11

suit la même logique que celles de tous les diagrammes portant en ordonnées les fréquences relatives :

elle permet de visualiser les valeurs élevées ou basses de la distribution statistique du caractère étudié.

Figure 5.11 Répartition du montant des chèques émis par l’entreprise BETA en septembre

Source : Tableau 5.6.

Lorsque le diagramme à ligne brisée retrace la fonction cumulative des données, on parle alors de

polygones de fréquences relatives cumulées ou courbe de fréquences relatives cumulées. Ce type

de graphique nous renseignera alors, tout comme le ferait la colonne des fréquences relatives

cumulées du tableau de données, sur la proportion de chèques émis selon divers montants.

0%

5%

10%

15%

20%

25%

30%

500-1499,99 1500-2499,99 2500-3499,99 3500-4499,99 4500-5499,99 5500-6499,99

Chèq

ues (

en %

)

Montant des chèques

Page 31: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

31

Figure 5.12 Montant cumulé des chèques émis par l’entreprise BETA en septembre

Source : Tableau 5.6.

Les graphiques à deux caractères

Au cours de l’étude de phénomènes économiques ou financiers, il arrive fréquemment que l’on veuille

comparer deux séries de données. Les graphiques à deux caractères s’avèrent alors un outil de

synthèse très puissant. Ils permettent d’illustrer comment deux caractères sont reliés entre eux. Pour

cette raison, ce type de représentation graphique est très souvent utilisé.

Les graphiques de deux caractères qualitatifs

Le diagramme à bandes est le graphique le plus utilisé dans le cas de la comparaison de deux

caractères qualitatifs. Dans ce diagramme, le total de chacune des combinaisons des caractères

qualitatifs est représenté par une bande de longueur proportionnelle à la grandeur associée à ce

total. Chaque bande est d’une longueur équivalente aux fréquences. On place habituellement la

variable indépendante en abscisse. Si vous ignorez quelle est, parmi les deux caractères, la variable

indépendante, demandez-vous : laquelle vient en premier? Laquelle vient avant l’autre? L’âge

précède le fait d’avoir un ordinateur tout comme les ventes d’une entreprise précèdent ses profits.

Voici deux diagrammes à bandes qui mettent en relation les répondants à une enquête sur

l’informatisation de la clientèle de l’Université TÉLUQ selon les groupes d’âge et le fait de disposer ou

non d’un ordinateur à domicile.

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

500-1499,99 1500-2499,99 2500-3499,99 3500-4499,99 4500-5499,99 5500-6499,99

Chèq

ues (

en %

)

Montant des chèques

Page 32: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

32

Figure 5.13 La possession d’un ordinateur à domicile selon les groupes d’âge

Source : Tableau 5.9.

Figure 5.14 La possession d’un ordinateur à domicile selon les groupes d’âge

Source : Tableau 5.9.

On découvre ainsi que c’est dans le groupe des répondants âgés de 34 ans et moins que l’on

rencontre le plus de possesseurs d’ordinateurs à domicile.

0

10

20

30

40

50

60

70

80

34 et moins 35-44 45-64 65 et Plus

oui

non

Possession d'un ordinateur à domicile selon l'âge

effectifs

0 20 40 60 80

34 et moins

35-44

45-64

65 et Plus

non

oui

Groupes d'âges

Possession d'un ordinateur à domicile selon l'âge

Page 33: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

33

On peut aussi représenter la distribution de données cumulées de deux caractères qualitatifs à l’aide

d’un diagramme rectangulaire à secteurs. Les figures 5.15 et 5.16 sont de ce type. Elles permettent de

comparer, en fonction de l’âge, les répondants qui affirment disposer d’un ordinateur à domicile avec

ceux qui n’en ont pas.

Figure 5.15 La possession d’un ordinateur à domicile selon les groupes d’âge

Source : Tableau 5.9.

Figure 5.16 La possession d’un ordinateur à domicile selon les groupes d’âge

Source : Tableau 5.9.

0%10%20%30%40%50%60%70%80%90%

100%

34 et moins 35-44 45-64 65 et plusGroupes d'âges

Possession d'un ordinateur par groupe d'âges

non

oui

0% 20% 40% 60% 80% 100%

34 et moins

35-44

45-64

65 et plus

Grou

pes d

'âge

s

Possession d'un ordinateur par groupe d'âges

oui

non

Page 34: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

34

Les graphiques de deux caractères quantitatifs

Voici un tableau représentant les ventes annuelles et les profits de dix entreprises (extrait du recueil des

activités d’application, Module 5, de l’exercice numéro 3).

Tableau 5.15 Les ventes annuelles et les profits des dix premières entreprises de l’exercice d’application 3

Entreprise Ventes annuelles ($) Profits ($)

A 855 100,00 31 000,00

B 5 453 500,00 859 800,00

C 2 153 700,00 153 000,00

D 6 747 000,00 1 102 200,00

E 5 284 000,00 454 000,00

F 9 422 000,00 747 000,00

G 2 876 100,00 333 300,00

H 709 300,00 41 400,00

I 2 952 100,00 80 400,00

J 784 700,00 89 000,00

Pour représenter ces deux caractères quantitatifs, on utilise le diagramme de dispersion ou nuage de

points. Dans ce diagramme, chaque individu (ici chaque entreprise) peut être représenté par un point

dans le plan. Le nuage de points est formé de la représentation des couples de valeurs (ventes

annuelles et profits) portés dans un système de repérage cartésien. Chaque point représente ainsi,

pour une entreprise donnée, l’intersection des valeurs des « ventes annuelles » et des « profits ». L’allure

générale du nuage renseigne sur la relation entre les caractères étudiés. S’il existe une dépendance

entre ces caractères, le nuage prend la forme d’une ellipse d’autant plus aplatie que la relation est

forte. Si le nuage de points épouse la forme d’un cercle, la dépendance des deux caractères n’est

pas très forte.

Page 35: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

35

Figure 5.17 Présentation des ventes annuelles et des profits des dix premières entreprises de l’exercice d’application 3

Source : Tableau 5.15.

Les données de la figure 5.17 montrent qu’il existe une certaine dépendance entre les caractères, car

le nuage de points a la forme d’une ellipse. On remarque ainsi que, de façon générale, plus les ventes

annuelles sont élevées, plus les profits sont élevés; à l’inverse, plus les ventes annuelles sont faibles, plus

les profits sont bas. On parlera alors de corrélation positive forte7.

Il arrive fréquemment que les caractères quantitatifs soient, pour des raisons pratiques, divisés en caté-

gories. Pour représenter ces caractères, on utilise le diagramme à bandes. Les bandes d’un dia-

gramme à bandes peuvent être disposées verticalement ou horizontalement, quoique la disposition

verticale soit la plus fréquente. La figure 5.18 montre la relation entre l’âge et les salaires annuels : en

général, moins l’âge est élevé, moins le salaire annuel est élevé et vice versa.

7. Il est possible de mesurer par une valeur numérique l’intensité du lien entre deux caractères quantitatifs continus. Nous

aborderons cet aspect à la section 4.

0

200000

400000

600000

800000

1000000

1200000

0 2000000 4000000 6000000 8000000 10000000

Prof

its (e

n $)

Ventes annuelles (en $)

A

B

C

D

E

F

G

HI

J

Page 36: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

36

Figure 5.18 Répartition des salaires annuels selon l’âge

Source : Tableau 5.10.

Les graphiques de deux caractères mixtes

Le diagramme à bandes est également le graphique le plus utilisé dans le cas de la comparaison de

deux caractères mixtes. Dans ce diagramme, comme dans celui représentant la comparaison de

deux caractères qualitatifs, le total de chacune des combinaisons des caractères est représenté par

une bande de longueur proportionnelle à la grandeur associée à ce total. Voici une représentation

visuelle de la relation entre le revenu des consommateurs et les marques de bière préférées.

0

200

400

600

800

1000

1200

1400

0 à 24K 24 à 69K 70 à 500K 500K et +

Nom

bre

de sa

larié

s

salaires

Les salaires selon l'âge

0 à 24 ans 25 à 39 ans 40 à 54 ans 55 ans et +

Page 37: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

37

Figure 5.19 Répartition des consommateurs d’alcool selon leurs types de consommation et leurs revenus

Source : Tableau 5.11.

Que nous révèle ce diagramme? Le graphique montre que, quel que soit le salaire, les consommateurs

à faible risque sont les plus nombreux. De plus, les consommateurs à haut revenu sont ceux que l’on

trouve en plus grand nombre dans les catégories « à haut risque » et « excessive ». Les répondants à

salaires intermédiaires sont les plus nombreux dans la catégorie « à faible risque ».

La comparaison de deux caractères mixtes peut aussi être représentée par un diagramme à ligne

brisée. L’interprétation de la figure 5.20 suit la même logique que celle de la figure 5.19.

0

20

40

60

80

100

120

140

160

180

200

0 à 39K 40 à 79K 80K et +

Nom

bre

de c

onso

mm

ateu

rs

Revenu en milliers de $ (K)

Faible risque

Haut risque

Excessive

Le type de consommation d'alcool selon le revenu des consommateurs

Page 38: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

38

Figure 5.20 Variation du type de la consommation d’alcool en fonction du revenu des consommateurs

Source : Tableau 5.11.

Cas particulier : les graphiques de séries chronologiques

Les économistes utilisent en abondance les séries chronologiques (ou séries temporelles) pour

représenter dans le temps les valeurs prises par un ou plusieurs caractères ou modalités. La synthèse

graphique de ces données porte le nom de chronogramme. Il a habituellement l’aspect d’un dia-

gramme à ligne brisée sur lequel sont portées en abscisse les valeurs temporelles (jour, semaine, mois

ou année) et, en ordonnée, la proportion de chaque quantité du ou des caractères étudiés, en

fréquences.

De manière générale, un chronogramme rend compte de trois aspects du caractère étudié :

1. son niveau : plus la courbe s’écarte de l’axe horizontal, plus le caractère est à un niveau élevé; plus la courbe s’en rapproche, plus le caractère est à un niveau bas;

2. le sens de la variation du caractère : si la courbe monte, le caractère est en hausse; si elle descend, il est en baisse;

3. la vitesse de changement, rapide ou lente, de ce caractère.

0%

5%

10%

15%

20%

25%

30%

35%

40%

45%

50%

0 à 39K 40 à 79K 80K et +

Fréq

uenc

e re

lativ

e

Revenu en milliers de $ (K)

Faible risque

Haut risque

Excessive

Le type de consommation d'alcool selon le revenu des consommateurs

Page 39: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

39

La courbe temporelle permet également, si le caractère est étudié sur une longue période, de prévoir

la tendance future de ce caractère. L’exemple de chronogramme qui vous est présenté dans la

figure 5.21 met en relief l’évolution de la population canadienne des moins de 20 ans.

Figure 5.21 Évolution de la population du Canada sur la période 2014-2018

Source : Tableau 5.14.

On remarque que peu importe l’âge, le niveau de population ne varie pas beaucoup. Seules les

personnes âgées de plus de 65 ans deviennent plus nombreuses. Le pourcentage des moins de 20 ans

baisse légèrement.

Les graphiques à échelle logarithmique

La réalisation de graphiques pose parfois des problèmes de « mise en page ». Voyons le tableau

suivant montrant les profits après impôt d’une compagnie ABC lors de ses six premières années

d’exploitation.

0

5

10

15

20

25

2014 2016 2018

Pour

cent

age

de la

pop

ulat

ion

année

Évolution de l'âge de la population canadienne

Moins de 20 ans 20-34 ans 35-49 ans 50-64 ans 65 ans et plus

Page 40: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

40

Tableau 5.16 Évolution des profits après impôt de la compagnie ABC lors de ses six premières années d’exploitation

Années Profits (P)

2015 12 $

2016 110 $

2017 1 230 $

2018 10 200 $

2019 100 600 $

2020 1 000 000 $

Choisir une échelle convenable pour représenter ce tableau à l’aide d’un diagramme à ligne brisée

n’est pas une mince affaire. Voyons ce qui se passe si l’on veut que la donnée de 2020 soit dans le

graphique.

Figure 5.22 Évolution des profits après impôt de la compagnie ABC lors de ses six premières années d’exploitation

On ne peut pas vraiment voir ce qui se passe, puisque les quatre premiers points semblent avoir la

même ordonnée sur le graphique. Si l’on voulait faire un graphique qui montre bien la différence entre

les premiers points, il faudrait réaliser un graphique beaucoup trop élevé. Par exemple, si 1 000 $ était

placé à une hauteur de 1 millimètre, il faudrait un graphique de 1 mètre de haut et, encore là, il n’y

aurait à peu près pas de différence entre les deux ou trois premiers points.

-

200 000

400 000

600 000

800 000

1 000 000

1 200 000

2014 2016 2018 2020 2022

Profits (P)Profits (P)

Années

Page 41: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

41

Pour pallier cet inconvénient, on a imaginé une échelle différente pour l’axe vertical. Les nombres

placés en ordonnée, plutôt que de représenter le montant des profits de la compagnie, vont

correspondre à l’exposant que l’on doit donner à 10 pour obtenir ce montant. Si vous vous rappelez

la définition des logarithmes vue au module 2, vous constatez qu’on placera donc en ordonnée le

logarithme dans la base 10 du montant des profits.

Tableau 5.17 Évolution des profits et des logs (profits) après impôt de la compagnie ABC lors de ses six premières années d’exploitation

Années Profits (P) Log (Profits)

2015 12 $ 1,08

2016 110 $ 2,05

2017 1 230 $ 3,09

2018 10 200 $ 4,01

2019 100 600 $ 5,00

2020 1 000 000 $ 6,00

Le graphique devient alors :

Figure 5.23 Évolution des logs (profits) après impôt de la compagnie ABC lors de ses six premières années d’exploitation

0

1

2

3

4

5

6

7

2014 2015 2016 2017 2018 2019 2020 2021

log du profitlog du profit

Années

Page 42: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

42

Ce graphique est plus facile à lire. Il faut bien comprendre que la quantité en ordonnée est l’exposant

que l’on doit donner à 10 pour connaître les profits de l’année en question. Si l’ordonnée d’un point

est 3, c’est que le montant des profits est 103 $, c’est-à-dire 1 000 $. Cela entraîne une autre

particularité de ces graphiques : l’échelle verticale n’est pas linéaire et donc la moitié de la distance

ne représente pas la moitié du montant. Ainsi, un point dont l’ordonnée serait 1,5 ne représenterait pas

un montant à mi-chemin entre 101 et 102, soit 55 $, mais un montant correspondant à 101,5, c’est-à-dire

31,62 $. Pour retrouver les montants, il faut donc utiliser 10l’ordonnée du point. Souvent dans ces graphiques,

les échelles entre les entiers sont indiquées et l’on voit bien cette particularité. On retrouve sur le

marché du papier millimétrique préparé à cet effet.

Mais pour faciliter la lecture et la compréhension de ces graphiques, au lieu d’écrire les exposants

de 10 dans la colonne des ordonnées, on écrit les montants auxquels ils correspondent, mais en laissant

le graphique inchangé. On obtient alors un graphique comme celui-ci.

Figure 5.24 Évolution des profits après impôt de la compagnie ABC lors de ses six premières années d’exploitation, selon une échelle logarithmique

C’est la façon dont l’échelle verticale est construite qui indique qu’il s’agit d’une échelle logarithmique.

Il existe aussi des graphiques où la base du logarithme utilisé est e au lieu de 10. Mais on les utilise surtout

en physique et peu en administration.

1

10

100

1 000

10 000

100 000

1 000 000

2014 2015 2016 2017 2018 2019 2020 2021

ProfitsProfits

Page 43: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

43

D’autres graphiques ont deux échelles logarithmiques : sur l’axe des abscisses, on place alors

l’exposant qu’il faut donner à 10 pour obtenir l’abscisse. Ce type de graphiques est peu utilisé en

administration. On le nomme parfois log-log et celui que nous avons montré se nomme semi-log.

Une autre des caractéristiques intéressantes des graphiques à échelle logarithmique est qu’ils

« redressent » les fonctions exponentielles pour en faire des droites. C’est ce qui s’est produit dans

l’exemple que nous avons montré. Le premier graphique était une courbe exponentielle, mais en

utilisant le graphique à échelle logarithmique, on a obtenu une droite.

NOTE : Faites les exercices de la section 3 dans le Recueil des activités pratiques avant de continuer la

lecture.

Page 44: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

44

Section 4 : les sommaires numériques

Les tableaux et les graphiques sont des aides précieuses pour regrouper un ensemble de données ou

pour comparer ces données. Les premiers facilitent la consultation des informations; les seconds en

allègent la présentation et permettent, d’un coup d’œil, de se faire une bonne idée des informations

qui ont été rassemblées.

Pour dégager les caractéristiques d’une variable statistique, pour mettre en valeur les caractéristiques

des données, pour résumer l’information, on fait appel à des sommaires numériques : les mesures de

tendance centrale et les mesures de dispersion. Dans la première catégorie, on retrouve la moyenne,

la médiane et le mode; dans la seconde, on a l’étendue, les quartiles, la variance et l’écart type.

Alors que les tableaux et les graphiques permettaient de mettre en valeur les caractéristiques des

différents types de caractères, autant qualitatifs que quantitatifs, les sommaires numériques sont

réservés aux caractères quantitatifs, à une exception près, le mode, souvent utilisé pour faire ressortir

un caractère qualitatif nominal ou ordinal. Ces sommaires, on les verra sous le nom d’indices

statistiques lorsqu’on parlera d’échantillon, et sous le vocable paramètres lorsqu’il s’agira de

population.

Les sommaires numériques ne sont pas seulement utiles pour résumer l’information des valeurs d’un

caractère. Certains sommaires permettent de comparer deux ou plusieurs caractères entre eux (divers

taux de rendement, les salaires de diverses entreprises, le taux de chômage comparé au taux

d’employabilité, etc.). Cette section présente aussi trois de ces mesures de comparaison de groupes :

le coefficient de variation, la covariance et le coefficient de corrélation.

Les mesures de tendance centrale

Caractériser un ensemble d’informations par une valeur unique, voilà un acte qui nous facilite

grandement la vie : « j’ai obtenu la note moyenne de 85 % dans mon programme », « depuis cinq ans,

mon salaire moyen se situe autour de 40 000 $ », « la taille moyenne de la population québécoise est

de 170 centimètres ». Une mesure de tendance centrale est un nombre qui représente et résume des

caractères tels la note, le salaire ou la taille. C’est une valeur autour de laquelle se concentrent les

données. La moyenne est sûrement la plus connue, et la plus utilisée, des mesures de tendance

centrale. Mais il en existe deux autres qui ont aussi leur utilité : ce sont la médiane et le mode.

Page 45: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

45

La moyenne

Le terme moyenne peut techniquement renvoyer à une variété d’idées mathématiques. Mais la

majorité du temps, la moyenne est la moyenne arithmétique. La moyenne arithmétique s’obtient en

divisant la somme des valeurs par le nombre de valeurs dans l’ensemble. Le symbole usuel de la

moyenne est (prononcez « x barre »). La formule utilisée pour calculer la moyenne est la suivante :

(le sigma grec) est un raccourci pour « additionner le tout » ou « faire la somme de ». La barre

horizontale au-dessus du indique la moyenne de toutes les valeurs de . Lorsqu’il s’agira de noter

la moyenne d’une population, on utilisera plutôt la lettre grecque « », qui se lit « mu ». La formule de

la moyenne d’une population est :

Notez le changement au dénominateur : pour un échantillon, la formule utilise la lettre minuscule « »,

soit le nombre de valeurs de l’échantillon alors que, pour la population, c’est la lettre majuscule qui

est utilisée pour représenter le nombre de valeurs.

La procédure de calcul de la moyenne est simple. Il suffit de déterminer la somme des valeurs des

données, puis de diviser cette somme par le nombre de données.

E X E M P L E :

Trouvez la moyenne des nombres 9, 6, 5 et 12.

S O L U T I O N

a) Il y a 4 valeurs (le nombre de valeurs).

b)

E X E M P L E :

Soit la distribution d’une variable statistique : 5, 7, 7, 8, 8, 8, 9, 9, 9, 10, 10, 10, 10, 10, 11, 12, 12, 12, 13, 13, 14, 14, 14, 15, 15, 17, 18, 20. Calculez la moyenne de .

x

x =xi

i=1

n

∑n

=x∑n

Σ

x x

µ

µ =xi

i=1

N

∑N

=x∑N

n

N

x =x∑n

= 9+ 6+5+124

= 324

= 8

xx

Page 46: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

46

S O L U T I O N

a) Il y a 28 valeurs.

b)

NOTE : Lorsque les données sont regroupées en classes et qu’on ne connaît pas les données indivi-

duelles, on peut quand même calculer la moyenne en utilisant ce centre des classes et en considérant

que toutes les données de la classe ont cette valeur.

E X E M P L E :

L’entreprise SIGMA a 80 employés. Les salaires se répartissent de 0 à 100 000 $ comme le démontre le tableau 5.18.

Tableau 5.18 Répartition des salaires des employés de l’entreprise SIGMA

Salaire annuel par employé en $

Salaires Effectifs

[0, 20 000[ 8

[20 000, 40 000[ 15

[40 000, 60 000[ 40

[60 000, 80 000[ 15

[80 000, 100 000[ 2

Total 80

Les milieux des classes sont : 10 000, 30 000, 50 000, 70 000 et 90 000.

La somme totale des salaires estimés est de :

10 000(8) + 30 000(15) + 50 000(40) + 70 000(15) + 90 000(2) = 3 760 000.

Le nombre total de salaires observés est 80.

La moyenne est donc : $

NOTE : On fera la même chose pour les autres mesures de tendance centrale, sauf pour l’étendue.

x =x∑n

= 32028

= 11,43

3 760 00080

= 47 000

Page 47: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

47

La moyenne pondérée

Quand certains chiffres se répètent ou que les valeurs sont accompagnées de pondérations

différentes, on doit leur donner le poids approprié. On parle alors de moyenne pondérée ou, dans les

disciplines de la finance et de l’économie, d’espérance, d’espérance mathématique, de rendement

espéré ou de valeur espérée. La moyenne pondérée s’obtient en faisant la somme des différents

résultats possibles multipliés chacun par leur probabilité d’occurrence ou par un poids associé à une

caractéristique particulière.

Le symbole utilisé pour représenter la moyenne pondérée est le même que celui de la moyenne. En

finance et en économie, on rencontre le plus souvent le symbole ( pour espérance). La formule

utilisée pour calculer la moyenne pondérée est la suivante :

Mais comment estimer la « probabilité d’occurrence » des différents résultats possibles? Trois méthodes

différentes sont utilisées, le choix dépendant du degré de précision désirée. La première, la méthode

classique, s’appuie sur les lois du hasard (le module 6 aborde cette notion de hasard), ce qui garantit

une plus grande objectivité et une plus grande précision des résultats. La deuxième, dite subjective,

se base sur le jugement personnel d’un ou de plusieurs individus. La troisième, la méthode de la

fréquence relative, mesure la probabilité d’occurrence en utilisant les fréquences relatives des valeurs

(rappelez-vous la formule ). Retenez toutefois que, peu importe la méthode que vous utilisez, la

somme des probabilités doit égaler 1, soit .

E X E M P L E :

Calculez le taux de rendement espéré des actions suivantes :

Tableau 5.19 Taux de rendement des actions et leur probabilité d’occurrence

Taux de rendement Probabilité

- 0,15 0,08

- 0,10 0,12

0,00 0,25

0,12 0,20

0,17 0,20

0,20 0,15

E x( ) E

E x( ) = xi × Pi =i=1

n

∑ x × P∑

fi =xin

P = 1∑

Page 48: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

48

S O L U T I O N

La moyenne, facile à calculer, possède en général une bonne stabilité, stabilité qui croît avec la

fréquence totale. Cette stabilité, plus le fait qu’elle utilise tous les éléments d’un ensemble, en fait une

mesure de grande signification statistique; d’où son utilisation dans de multiples études. Toutefois, en

raison de sa sensibilité aux valeurs extrêmes, son emploi n’est pas toujours approprié. On lui préférera

alors la médiane.

La médiane

La médiane correspond au nombre qui se trouve au point milieu d’une série ordonnée de mesures.

C’est le point milieu d’une distribution de données, celui qui est à mi-chemin entre la première et la

dernière donnée. Le symbole de la médiane est, dans le cas d’un échantillon, « md » et, dans le cas

d’une population, « Md ». La formule de calcul est :

Le calcul de la médiane exige d’abord la mise en ordre des données, du plus petit chiffre au plus

grand, puis le positionnement de chacune des données. La suite du calcul dépend du nombre de

valeurs de la distribution :

– Si le nombre de valeurs est impair, la médiane est la valeur centrale de la liste.

E X E M P L E :

Soit les valeurs 4, 6, 3, 3, 10, 11, 9, 9 et 7. Calculez la médiane.

S O L U T I O N

a) Ordonnez les valeurs : 3, 3, 4, 6, 7, 9, 9, 10, 11.

b) Identifiez la position de chaque valeur :

3, 3, 4, 6, 7, 9, 9, 10, 11

­ ­ ­ ­ ­ ­ ­ ­ ­

1 2 3 4 5 6 7 8 9

c) ; la médiane est la valeur centrale 7,

car sa position est 5.

– Si le nombre de valeurs est pair, la médiane est la moyenne des deux valeurs du centre de la liste.

E x( ) = x × P∑ = −0,15$× 0,08( )+ −0,10 $× 0,12( )+ 0,00 $× 0,25( )+ 0,12$× 0,20( )+ 0,17$× 0,20( )+ 0,20$× 0,15( ) = −0,012+ −0,012( )+ 0,00+ 0,024+ 0,034+ 0,030= 0,064 ou 6,4%

positionde lamd = 1+ positionde ladernièredonnée2

positionde lamd = 1+ 92

= 5⇒ 7

Page 49: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

49

E X E M P L E

Soit les valeurs 4, 3, 3, 9, 8 et 7. Calculez la médiane.

S O L U T I O N

a) Ordonnez les valeurs : 3, 3, 4, 7, 8, 9.

b) Identifiez la position de chaque valeur :

3, 3, 4, 7, 8, 9

­ ­ ­ ­ ­ ­

1 2 3 4 5 6

c) La médiane est la moyenne des deux valeurs du centre, soit entre la 3e et la 4e donnée, 4

et 7 ( ), soit 5,5.

La médiane, contrairement à la moyenne, n’est pas affectée par les valeurs extrêmes d’une

distribution de données. Relativement simple à calculer, la médiane offre toutefois un moins grand

intérêt statistique que la moyenne, car elle ne prend en compte que deux valeurs alors que la

moyenne tient compte de l’ensemble des valeurs.

Le mode

Le mode est la valeur la plus fréquente, celle qui revient le plus grand nombre de fois dans un ensemble

de données. Le symbole du mode est, dans le cas d’un échantillon, « mo » et, dans le cas d’une

population, « Mo ». Une distribution de données peut avoir plus d’un mode.

E X E M P L E :

Calculez le mode de la distribution suivante : 1, 3, 6, 4, 3 et 5.

S O L U T I O N

Le mode est 3; mo = 3.

E X E M P L E :

Calculez le mode de la distribution suivante : 1, 2, 3, 3, 3, 5, 7, 10, 10, 10, 20.

S O L U T I O N

Les modes sont 3 et 10; mo = 3 et 10.

4+ 72

Page 50: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

50

E X E M P L E :

Soit la distribution d’une variable statistique : 5, 7, 7, 8, 8, 8, 9, 9, 9, 10, 10, 10, 10, 10, 11, 12, 12, 12, 13, 13, 14, 14, 14, 15, 15, 17, 18, 20. Calculez le mode.

S O L U T I O N

Le mode est 10; mo = 10.

Si aucune valeur n’est répétée, on dit qu’il n’y a pas de mode. Le mode est très peu utilisé comme

mesure de tendance centrale, sauf pour celui qui rechercherait la région d’une distribution où se

concentrent les valeurs ou les modalités.

Si les données sont regroupées en classe, on parlera plutôt de classe modale pour la classe qui a la

plus grande fréquence.

Quelle mesure de tendance centrale devrait-on privilégier?

La moyenne, nous l’avons noté au début de cette section, est la mesure de tendance centrale la plus

connue et la plus utilisée. Contrairement à la médiane et au mode, elle utilise tous les éléments de

l’ensemble; la moyenne présente de ce fait de bonnes probabilités d’échantillonnage. Mais la

moyenne est sensible à la grandeur des nombres qui composent l’ensemble; elle peut donc se révéler

trompeuse lorsque l’échantillon comporte des valeurs extrêmes.

Un exemple vous aidera à mieux comprendre. Supposons que l’on s’intéresse à l’étude de la

distribution des salaires journaliers de trois firmes de consultants A, B et C.

x

Page 51: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

51

Tableau 5.20 Distribution des salaires journaliers des firmes de consultants A, B et C

Firme A Firme B Firme C

199 101 101

199 101 131

199 101 151

200 200 200

200 200 200

200 200 200

200 200 200

201 299 249

201 299 269

201 299 299

Moyenne 200 200 200

Médiane 200 200 200

Mode 200 200 200

Valeur minimum 199 101 101

Valeur maximum 201 299 299

Le calcul des mesures de tendance centrale donne les mêmes valeurs pour la moyenne, la médiane

et le mode dans les trois firmes. Toutefois, l’observation de l’étendue des valeurs (valeur maximum et

valeur minimum) fait ressortir une différence importante entre les trois firmes : la répartition des salaires

dans les firmes B et C est moins concentrée autour du salaire moyen. Autrement dit, on peut percevoir

dans les firmes B et C une plus grande inégalité dans la répartition des salaires. Dans le cas où

l’échantillon comporte des valeurs extrêmes, il est préférable d’utiliser la médiane plutôt que la

moyenne. La médiane n’est en effet pas affectée par la présence de ces valeurs.

Quant au mode, il peut, malgré son intérêt limité, être fort utile à certains décideurs. Prenez par

exemple le cas du directeur d’un magasin de chaussures. Il serait mal avisé de baser ses achats sur la

Page 52: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

52

moyenne ou la médiane des pointures de souliers vendus. Il s’intéressera plutôt aux pointures les plus

fréquemment demandées. C’est le mode qui répondra alors le mieux à ses préoccupations.

En résumé, lorsque la distribution des données comporte des valeurs extrêmes, il vaut mieux utiliser la

médiane ou le mode; autrement, on préférera la moyenne, car elle offre, nous le verrons plus loin, de

plus grandes possibilités de calcul.

Les mesures de dispersion

« Un homme ne sachant pas nager se prépare à traverser une rivière. Une pancarte indique que la

profondeur moyenne de la rivière est de quatre pieds. Confiant (il mesure six pieds), il s’avance dans

le cours d’eau. Après quelques pas, il a de l’eau jusqu’aux genoux. Au tiers de la traversée, l’eau lui

monte jusqu’aux épaules. Il n’est pas encore arrivé à mi-parcours qu’il a de l’eau jusqu’à la bouche. »

Vous pouvez imaginer la suite de l’histoire.

Cette histoire circule dans le cercle des statisticiens depuis des décennies. Elle suggère :

– qu’on ne peut se fier à une seule donnée pour résumer une information;

– qu’on n’est jamais trop prudent face à l’élément liquide!

Les mesures de tendance centrale seules – les données du tableau 5.32 en constitue un bon exemple

– sont insuffisantes pour expliquer la distribution des données. Tout comme les diverses profondeurs

d’une rivière, les valeurs d’un ensemble d’informations sont étalées. Les statisticiens ont essayé de

définir des indicateurs qui permettent de mesurer cette dispersion, cet écart entre les valeurs. Une

mesure de dispersion est donc un nombre qui permet de représenter l’étalement ou le degré de

dispersion d’un ensemble de données. Les principales mesures de dispersion sont l’étendue, les

quartiles8, la variance et l’écart type, cette dernière mesure étant celle qui est la plus utilisée.

L’étendue

L’étendue, mesure simple de dispersion, est un nombre qui permet de représenter l’étalement total

d’un ensemble de données. Ce nombre s’obtient en soustrayant la valeur la plus faible (minimum) de

la valeur la plus élevée (maximum). Il représente l’écart entre la valeur minimum et la valeur maximum.

L’étendue est symbolisée par la lettre . Si les données sont regroupées en classe, on considère

8. Il existe d’autres mesures de dispersion du même genre que les quartiles (déciles, centiles, etc.), mais elles ne font pas

partie du contenu de ce cours.

E

Page 53: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

53

l’étendue comme étant la borne supérieure de la plus haute classe – la borne inférieure de la plus

basse classe, même si ces bornes ne sont pas incluses dans les classes.

E X E M P L E :

Dans un test, les notes s’échelonnent de 35 à 98. Quelle est l’étendue de la distribution des notes?

S O L U T I O N

Le maximum est 98, le minimum, 35. .

E X E M P L E :

Soit la distribution d’une variable statistique : 5, 7, 7, 8, 8, 8, 9, 9, 9, 10, 10, 10, 10, 10, 11, 12, 12, 12, 13, 13, 14, 14, 14, 15, 15, 17, 18, 20. Calculez l’étendue.

S O L U T I O N

Le maximum est 20, le minimum, 5. .

L’étendue n’est pas très significative; elle a pour seul avantage de marquer la grandeur de l’ensemble

des données. Il existe une façon plus utile de mesurer la dispersion; elle se base sur l’utilisation de la

mesure de tendance centrale comme point de référence (la profondeur moyenne de la rivière par

exemple) et sur le calcul de l’étalement d’une distribution par rapport à ce point de référence. Ces

mesures de dispersion qui utilisent une mesure de tendance centrale sont les quartiles ainsi que la

variance et l’écart type.

Les quartiles

Lorsque c’est la médiane qui doit être préférée à la moyenne (dans le cas, par exemple, d’une

distribution qui comporte des valeurs extrêmes), on mesure l’écart par rapport à la médiane au moyen

des quartiles. Les quartiles permettent de diviser l’étendue des données d’une distribution en quatre

intervalles qui contiennent le même nombre ou le même pourcentage de données.

Ces quartiles, au nombre de trois, partagent un ensemble préalablement classé par valeurs croissantes

en quatre sous-ensembles de fréquences identiques. Le premier quartile, , correspondant à 25 %

des données, est la valeur qui se situe à mi-chemin entre la première donnée et la médiane. On

calcule la position du premier quartile à l’aide de la formule suivante :

E = 98− 35= 63

x

E = 20−5= 15

Q1

positiondeQ1 =1+ positionde lamédiane

2

Page 54: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

54

Le deuxième quartile, , correspond, vous l’aurez deviné, à la médiane (md). Le troisième quartile,

, correspondant à 75 % des données, est la valeur qui se situe à mi-chemin entre la médiane et la

dernière donnée. On calcule sa position avec la formule suivante :

E X E M P L E :

Soit la distribution suivante : 10, 7, 9, 4, 6, 3, 9, 3, 2, 11. Calculez les quartiles.

S O L U T I O N

a) Ordonnez les valeurs : 2, 3, 3, 4, 6, 7, 9, 9, 10, 11.

b) Identifiez la position de chaque valeur :

2, 3, 3, 5, 6, 7, 9, 9, 10, 11 ­ ­ ­ ­ ­ ­ ­ ­ ­ ­ 1 2 3 4 5 6 7 8 9 10

c) ; la médiane est 6,5. Vous pouvez également voir que le

nombre des valeurs est pair (10) et la médiane est donc égale à la moyenne des deux valeurs centrales, soit (6 + 7)/2 = 6,5.

NOTE : Lorsque que la position calculée d’un quartile se termine par la décimale 0,25, comme dans ce

dernier problème, le quartile est calculé de la façon suivante : on additionne la donnée précédente

au quart de la différence entre la donnée suivante et la donnée précédente. Pour Q1 ci-dessus, on a

additionné la donnée précédente (3 qui est la troisième) avec la différence entre la 4e donnée (5) et

la 3e (3), donc ¼ de 2 = 0,5, donc 3 + 0,5 = 3,5.

De même avec 0,75 comme partie décimale, on additionne à la précédente les ¾ de la différence

entre la suivante et la précédente. Pour Q3 dans le problème précédent, la différence entre la

7e donnée (9) et la 10e (9) est 0; ¾ de 0 = 0, c’est pourquoi, le quartile est égal à la donnée qui précède

l’intervalle soit 9.

E X E M P L E :

Soit la distribution suivante : 10, 3, 9, 11, 6, 7, 9, 3, 2, 4, 12. Calculez les quartiles.

S O L U T I O N

a) Ordonnez les valeurs : 2, 3, 3, 4, 6, 7, 9, 9, 10, 11, 12.

Q2Q3

positiondeQ3 =positionde lamédiane + positionde ladernièredonnée

2

positiondeQ2 =1+102

= 5,5⇒Q2 = 6,5

positiondeQ1 =1+5,52

= 3,25⇒Q1 = 3,5

positiondeQ3 =5,5+102

= 7,75⇒Q3 = 9

Page 55: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

55

b) Identifiez la position de chaque valeur :

2, 3, 3, 4, 6, 7, 9, 9, 10, 11 12 ­ ­ ­ ­ ­ ­ ­ ­ ­ ­ ­ 1 2 3 4 5 6 7 8 9 10 11

c) ; la médiane est 7.

Les quartiles sont souvent utilisés pour les données relatives aux ventes et aux enquêtes afin de diviser

les populations en groupes. Par exemple, on peut utiliser le premier quartile pour déterminer les 25 %

de revenus les moins élevés d’une population; ou, comme dans l’exemple montrant la distribution des

salaires journaliers des firmes de consultants A, B et C (tableau 5.20), faire ressortir, à l’aide du troisième

quartile, que c’est la firme B qui a les 25 % de salaires journaliers les plus élevés (274,25 $), suivie de la

firme C (236,75 $) puis de la firme A (200,75 $).

Mais le quartile est avant tout l’outil numérique qui permet de mesurer l’écart ou l’étalement des

données par rapport au point de référence qu’est la médiane. Nous avons en effet, entre le premier

et le troisième quartile, 50 % des données d’un ensemble. Cette valeur est appelée l’écart interquartile

ou l’intervalle interquartile ( ). Il est un indicateur de l’étalement de la distribution au regard de

la médiane. Il permet d’affirmer que 50 % des données de la distribution se situent entre telle et telle

valeur de la distribution autour de la médiane.

E X E M P L E :

Soit la distribution des 28 valeurs suivantes : 5, 7, 7, 8, 8, 8, 9, 9, 9, 10, 10, 10, 10, 10, 11, 12, 12, 12, 13, 13, 14, 14, 14, 15, 15, 17, 18, 20. Calculez les quartiles et l’écart interquartile.

S O L U T I O N

a) Ordonnez les valeurs (déjà fait).

b) Identifiez la position de chaque valeur :

c) ; la médiane est 10,5.

positiondeQ2 =1+112

= 6⇒Q2 = 7

positiondeQ1 =1+ 62

= 3,5⇒Q1 = 3,5

positiondeQ3 =6+112

= 8,5⇒Q3 = 9,5

Q3 −Q1

positiondeQ2 =1+ 282

= 14,5⇒Q2 = 10,5

positiondeQ1 =1+14,52

= 7,75⇒Q1 = 9

Page 56: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

56

L’écart interquartile est : .

La distribution comporte 50 % des valeurs autour de la médiane entre 9 et 14.

La variance et l’écart type

La variance et l’écart type sont à la moyenne ce que l’écart interquartile est à la médiane : des

indicateurs qui permettent de mesurer la dispersion d’un ensemble de données par rapport à la

moyenne. Alors que l’écart interquartile est une mesure d’écart par rapport à la médiane, la variance

et l’écart type sont des mesures d’écart relatives à la moyenne. L’avantage de la variance et de

l’écart type est que, contrairement à l’étendue et à l’écart interquartile, ils tiennent compte de toutes

les mesures à l’intérieur d’un ensemble.

L’écart à la moyenne9, une distance de chaque mesure par rapport à la moyenne, est l’élément de

base pour calculer la variance et l’écart type. L’écart à la moyenne se définit comme la valeur

absolue de la différence entre un nombre et la moyenne arithmétique. La formule pour calculer l’écart

à la moyenne est où est la moyenne arithmétique des nombres. Dans le cas de population,

cette formule devient : .

E X E M P L E :

Les écarts des nombres 8, 3, 4, 11 et 9 à la moyenne 7 sont :

9. À différencier de l’écart moyen, une mesure de variabilité très rarement utilisée, qui est la moyenne des écarts par

rapport à la moyenne et dont la formule pour un échantillon est : .

positiondeQ3 =14,5+ 28

2= 21,25⇒Q3 = 14

Q3 −Q1 = 14− 9 = 5

xi − x x

xi − µ

8− 7 = 1 = 1

3− 7 = −4 = 4

4− 7 = −3 = 3

11− 7 = 4 = 4

9− 7 = 2 = 2

xi − x∑n

Page 57: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

57

La variance

La variance autour de la moyenne est égale à la moyenne de tous les écarts mis au carré. Dans le cas

d’un échantillon, cet indice statistique est symbolisé par (parfois ) et la formule est :

L’image suivante vous montre un exemple de calcul de la variance à l’aide d’un logiciel tableur (ici

Excel) :

Figure 5.25 Image extraite d’un tableur (Excel) montrant un exemple de calcul de la variance

La variance se définit ainsi comme la somme des écarts à la moyenne portés au carré et divisée par

le nombre de valeurs moins 1. La mise au carré des écarts à la moyenne permet d’éviter que la somme

des écarts positifs et négatifs soit égale à 0, ce qui donnerait un quotient égal à 0. On met les écarts

au carré, ce qui a pour effet d’éliminer les signes négatifs, puis on calcule la moyenne de ces carrés.

Voici une autre formule pour calculer la variance pour un échantillon. C’est celle utilisée par les

calculatrices. Elle est moins difficile à compter, mais vous pouvez utiliser celle que vous préférez :

s 2 S2

s2 =xi − x( )2

i=1

n

∑n−1

=xi − x( )2∑n−1

s2 =x2∑ −

x∑( )2n

n−1

Page 58: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

58

Voici comment procéder au calcul de la variance à l’aide de la formule précédente :

– porter au carré chaque valeur de la distribution et en faire la somme, c’est-à-dire ;

– additionner les valeurs de la distribution, porter le total au carré et diviser le résultat par le nombre

de valeurs, c’est-à-dire ;

– soustraire le dernier résultat de la somme des carrés, c’est-à-dire ;

– finalement, diviser le résultat par le nombre de valeurs moins 1.

E X E M P L E :

Soit la distribution des cinq valeurs suivantes : 1, 2, 3, 4, 5. Calculez la variance.

S O L U T I O N

La variance de la population est , qui se lit « sigma au carré » et est définie par la formule :

ou, mieux, celle pour calculatrice :

On voit que la variance est calculée selon un processus de mise au carré. Son utilisation pose de sérieux

problèmes de réalisme puisque, dans certaines situations, la variance donne des résultats en dollars

carrés ou en minutes carrées. Pour cette raison, elle n’est que rarement utilisée et est remplacée par

l’écart type, qui n’est, nous le verrons maintenant, qu’un dérivé de la variance.

x2∑

x∑( )2n

x2∑ −x∑( )2n

x2∑ = 12 + 22 + 32 + 42 +52 = 1+ 4+ 9+16+ 25= 55

x∑( )2n

=1+ 2+ 3+ 4+5( )2

5= 2255

= 45

x2∑ −x∑( )2n

= 55− 45= 10

s2 =x2∑ −

x∑( )2n

n−1= 55− 45

4= 104= 2,5

σ 2

σ 2 =xi − µ( )2

i=1

N

∑N

=xi − µ( )2∑N

( )

NN

xx

22

2åå -

=s

Page 59: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

59

L’écart type

L’écart type est la racine carrée de la variance d’une distribution. Dans le cas d’un échantillon, il est

symbolisé par (parfois S). La formule pour calculer l’écart type d’un échantillon est celle de la racine

carrée de la variance, soit :

ou, encore, si vous utilisez une calculatrice :

Pour procéder au calcul de l’écart type, il suffit donc de calculer la variance puis d’extraire la racine

carrée.

E X E M P L E

Soit la distribution des cinq valeurs suivantes : 1, 2, 3, 4, 5. Calculez l’écart type.

S O L U T I O N

La variance, calculée précédemment, est 2,5.

Dans le cas d’une population, l’écart type est qui se lit « sigma ». Ce paramètre se traduit par l’une

ou l’autre des formules suivantes :

ou

L’écart type étant une distance, puisqu’elle est une moyenne d’écarts, il s’ensuit que plus un écart

type est élevé, plus les données sont éloignées de la moyenne et, par le fait même, plus la distribution

des données est dispersée. À l’inverse, plus un écart type est faible, plus les valeurs sont rapprochées

de la moyenne et moins la distribution de données est dispersée10. Si l’écart type était égal à zéro, cela

indiquerait que toutes les données ont la même valeur.

10. En finance, l’écart type est une des mesures associées à la notion de risque.

s

s = s2 =xi − x( )2

i=1

n

∑n−1

=xi − x( )2∑n−1

s =x2∑ −

x∑( )2n

n−1

s = 2,5 = 1,58

s

σ = σ 2 =xi − µ( )2

i=1

N

∑N

=xi − µ( )2∑N

σ =x2∑ −

x∑( )2N

N

Page 60: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

60

Reprenons l’exemple montrant la distribution des salaires journaliers des firmes de consultants A, B et C

(tableau 5.32). Le calcul des écarts types donne les résultats suivants : pour la firme A, 0,82; pour la

firme B, 80,83; et pour la firme C, 61,4. Il ressort nettement que les salaires journaliers de la firme A se

rapprochent de la moyenne, contrairement à ceux des firmes B et C. Le calcul de l’écart interquartile

aboutit à la même conclusion.

Quelle mesure de dispersion devrait-on utiliser?

La règle est simple : les quartiles accompagnent la médiane tandis que l’écart type est le complément

de la moyenne. Alors, lorsque la distribution des données comporte des valeurs extrêmes, il vaut mieux

utiliser la médiane et, conséquemment, les quartiles; dans tous les autres cas, on préférera la moyenne

et l’écart type.

Trois mesures de comparaison

Nous avons vu jusqu’à maintenant comment caractériser un ensemble d’informations par une valeur

unique et comment représenter l’étalement ou le degré de dispersion de cet ensemble de données.

Ces sommaires numériques résument les données d’un caractère unique. Mais quelle mesure utiliser

lorsqu’il s’agit de comparer plusieurs ensembles d’informations entre eux? Comment évaluer

quantitativement plusieurs projets? Existe-t-il un lien entre deux ensembles de caractères quantitatifs?

Nous vous présentons trois des mesures de comparaison les plus couramment utilisées en gestion et en

finance : le coefficient de variation, qui permet de comparer plusieurs groupes de données, puis la

covariance et le coefficient de corrélation, qui permettent de mesurer l’intensité de la relation entre

deux ensembles de données.

Le coefficient de variation

Le coefficient de variation11 permet la comparaison des distributions de nature similaire, mais

correspondant à des observations faites en des lieux ou à des dates différentes. C’est un rapport entre

l’écart type et la moyenne. Le coefficient de variation se calcule en divisant l’écart type par la

moyenne :

, ou, pour la population,

11. Le coefficient de variation doit être distingué de la notion de variation. La variation est la différence entre deux

quantités, une valeur initiale et une nouvelle valeur. La lettre grecque D, qui se lit delta, symbolise la variation.

V = sx

V = σµ

Page 61: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

61

Le coefficient de variation est souvent utilisé en finance pour comparer des projets ayant des rende-

ments espérés (moyennes pondérées) dont l’ordre de grandeur est très différent. Il s’interprète comme

l’écart type : un coefficient de variation élevé dénote une dispersion plus forte par rapport à la

moyenne; un coefficient de variation faible indique un rapprochement de la moyenne. Le projet

ayant le coefficient de variation le plus faible est celui qui comporte le moins de risque, selon le critère

du coefficient de variation.

E X E M P L E :

La moyenne de rendement de quatre franchises d’une chaîne de restauration rapide au cours de cinq dernières années est la suivante : 50 000 $, 50 000 $, 160 000 $ et 160 000 $. L’écart type pour chaque série de rendements est le suivant : 1 000, 5 000, 12 000 et 30 000. Comparez les rendements des quatre franchises d’après le critère du coefficient de variation.

S O L U T I O N

Les deux premières franchises ont le même rendement moyen (50 000 $) depuis cinq ans, mais les rendements de la première franchise sont plus près de la moyenne que ceux de la deuxième franchise. Les deux autres franchises suivent le même modèle, avec toutefois un rendement moyen plus élevé (160 000 $). Le coefficient de variation permet de tenir compte de l’écart entre ces moyennes.

Selon le critère du coefficient de variation, la première franchise serait celle qui comporterait le moins de risque. Son rendement moyen est inférieur aux deux dernières franchises, mais ce rendement est sensiblement le même au cours des cinq dernières années.

La covariance

En finance, la covariance est, tout comme l’écart type, une mesure du risque d’un investissement.

Dans le champ de la finance, on parle de « bêta », ou « b », qui mesure la covariance entre les

rendements des titres et le rendement du marché. En fait, le bêta mesure si les rendements des titres

varient, en moyenne, dans le même sens que le rendement du marché et mesure en même temps

l’amplitude de cette variation.

V1 =1 00050 000 $

= 0,02 = 2 % V2 =5 00050 000 $

= 0,1= 10,0 %

V3 =12 000160 000 $

= 0,075= 7,5 % V4 =30 000160 000 $

= 0,188 = 18,8 %

Page 62: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

62

Cette autre façon de déterminer la relation entre deux caractères quantitatifs continus et

consiste à calculer la covariance. La formule de la covariance d’un échantillon est la suivante :

La covariance, moyenne des produits des écarts, est un indicateur du sens de la variation simultanée

de x et de y. En effet, si en général x et y croissent simultanément, les produits seront

positifs; tandis que si y décroît lorsque x croît, ces mêmes produits seront négatifs.

Un exemple vous aidera à mieux saisir les relations entre deux variables, et , lorsqu’elles sont

mesurées par la covariance. Voici un tableau représentant deux séries de données : dans la première

série, vous remarquerez que et croissent simultanément, alors que dans la seconde, décroît

alors que croît.

Tableau 5.21 Distribution des valeurs A, B, C et D

A B C D

10 20 10 50

15 25 15 45

20 30 20 40

25 35 25 35

30 40 30 30

35 45 35 25

40 50 40 20

45 55 45 15

50 60 50 10

Qu’arrive-t-il si on calcule les covariances de ces deux séries? Faites vous-même l’exercice. La

moyenne du produit des écarts entre et , en croissance simultanée, est positive (187,5), alors que

le croisement des séries et , l’une croissante, l’autre décroissante, résulte en une covariance

négative (-187,5).

x y

COVxy =x − x( ) y − y( )∑n−1

=xy −

x∑( ) y∑( )n∑

n−1

xi − x( ) yi − y( )

x y

A B D

C

A B

C D

Page 63: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

63

Le coefficient de corrélation

Reprenons le nuage de points de la figure 5.17 qui montre la relation entre les ventes annuelles et les

profits des dix premières entreprises de l’exercice d’application numéro 3 (voir tableau 5.15). Nous le

reproduisons ci-dessous :

Rappel de la figure 5.17 Présentation des profits en fonction des ventes annuelles des dix premières entreprises de l’exercice d’application 3

Source : Tableau 5.15.

La forme du nuage de points aide à se faire une idée de la relation entre les deux caractères. Mais

cette façon de faire manque de précision. Une façon relativement simple de mesurer l’intensité du

lien entre deux caractères quantitatifs continus consiste à déterminer leur coefficient de corrélation,

symbolisé par la lettre (parfois aussi par la lettre grecque , qui se lit « rô »). Il existe plusieurs formules

de calcul de la corrélation, certaines faisant appel aux notions de moyenne, d’écart à la moyenne et

d’écart type. Pour estimer le coefficient de corrélation de l’exemple précédent, utilisons la formule de

calcul suivante12 :

12. Voici, à titre informatif, trois autres formules utilisées pour le calcul du coefficient de corrélation :

0

200000

400000

600000

800000

1000000

1200000

0 2000000 4000000 6000000 8000000 10000000

Prof

its (e

n $)

Ventes annuelles (en $)

A

B

C

D

E

F

G

HI

J

r ρ

r =x − x( ) y − y( )∑

x − x( )2 × y − y( )2∑∑=

xy −x∑( ) y∑( )n∑

n−1( ) sxsy=COVxysxsy

Page 64: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

64

Les données du tableau 5.15 (section 3) permettent d’obtenir les valeurs suivantes :

Reportons ces valeurs dans la formule de calcul de la corrélation :

La valeur du coefficient de corrélation est 0,8552. Les valeurs d’un coefficient de corrélation se situent

entre –1 et 1. Une valeur de –1 démontre une corrélation parfaite, mais négative; une valeur de 1

montre une corrélation positive parfaite. Une corrélation de 0 indique une absence de relation. Dans

l’exemple précédent, la valeur de se rapproche de 1. Il s’agit donc d’une corrélation positive forte.

La relation est donc très forte entre le niveau des ventes annuelles et le niveau des profits, les deux

variant dans le même sens.

r =n xy − x × y∑∑∑

n x2∑ − x∑( )2 × n y2∑ − y∑( )2

x = 37 237 500∑ x2∑ = 215 432 737150 000

y∑ = 3 891100 y2∑ = 2 869 783890 000

xz =∑ 23213813190 000

r =n xy − x × y∑∑∑

n x2∑ − x∑( )2 × n y2∑ − y∑( )2

r = (10× 23213813190000)− (37237500× 3891100)

(10× 215432737150000)− (37237500)2 × (10× 2869783890000)− (3891000)2

= 232138131900000−144894836250000

2154327371500000−1386631406250000× 28697838900000−15140659210000

= 8724329565000027707327 × 3682008

= 87243295650000102018587268116

= 0,8552

r

Page 65: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

65

Les sommaires numériques : quelques applications financières

– Supposons deux projets à comparer. Les flux monétaires (la différence entre les entrées et les sorties de fonds) et leur probabilité d’occurrence ont été évalués comme suit :

Tableau 5.22 Les flux monétaires et les probabilités d’occurrence des projets A et B

Projet A Projet B

Flux monétaire Probabilité Flux monétaire Probabilité

1 500 $ 0,25 0 $ 0,25

2 000 $ 0,50 2 000 $ 0,50

2 500 $ 0,25 4 000 $ 0,25

Calculez l’espérance mathématique de chaque projet.

Soit la formule , alors :

– Après avoir gagné à la loterie une somme de 1 000 000 $, vous consultez les pages boursières afin de déceler de bons placements. Un tableau récapitulatif d’un conseiller financier bien connu dresse les rendements annuels de trois des meilleurs titres pour les trois dernières années :

Tableau 5.23 Rendements annuels de titres A, B et C

Année Titre A Titre B Titre C

2018 7 % 8,5 % 12 %

2019 9 % 7 % 11 %

2020 10 % 9,5 % 10 %

E x( ) = x × P∑

E x( )A = x × P∑ = 1500 $× 0,25( )+ 2 000 $× 0,50( )+ 2 500 $× 0,25( ) = 2 000 $E x( )B = x × P∑ = 0 $× 0,25( )+ 2 000 $× 0,50( )+ 4 000 $× 0,25( ) = 2 000 $

Page 66: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

66

Le titre vous semble à première vue le plus avantageux et le moins risqué. Pour vous conforter

dans votre décision, vous faites le calcul de la moyenne et de l’écart type de chacun des titres à

l’aide des formules suivantes :

et

Le rendement espéré du titre , au vu de la moyenne, semble en effet avantageux. De plus,

l’écart type de ce titre est petit, ce qui signifie que les rendements annuels varient peu par rapport

à la moyenne. Vous pouvez donc espérer un rendement moyen du titre qui se rapprochera de

cette moyenne. Le titre est donc le plus avantageux et le moins risqué.

– À partir des données du tableau précédent, déterminez les deux titres ayant le plus fort coefficient de corrélation positif à l’aide de la formule pour calculatrice.

Soit , alors :

Les données du tableau 5.36 permettent d’obtenir les valeurs suivantes :

C

x =xi∑n

s =xi − x( )n−1

xA =0,07 + 0,09+ 0,10

3= 0,0867 = 8,67 %

xB =0,085+ 0,07 + 0,095

3= 0,0833= 8,33%

xC =0,12+ 0,11+ 0,10

3= 0,11= 11%

sA =0,07 − 0,0867( )2 + 0,09− 0,0867( )2 + 0,10− 0,0867( )2

3−1= 0,0153= 1,53%

sB =0,085− 0,0833( )2 + 0,07 − 0,0833( )2 + 0,095− 0,0833( )2

3−1= 0,0126 = 1,26 %

sC =0,12− 0,11( )2 + 0,11− 0,11( )2 + 0,10− 0,11( )2

3−1= 0,01= 1%

C

C

C

r =n xy − x × y∑∑∑

n x2∑ − x∑( )2 × n y2∑ − y∑( )2

A = 0,26∑ B = 0,25∑ C = 0,33∑A2∑ = 0,023 B2∑ = 0,0212 C 2∑ = 0,0365

AB = 0,0218∑ AC = 0,0283∑ BC = 0,0274∑

Page 67: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

67

Reportons ces valeurs dans la formule de calcul de la corrélation :

Les deux titres ayant le plus grand coefficient de corrélation positif sont les titres et . La

corrélation entre les titres et est intéressante : elle montre que les rendements varient en sens

inverse et que cette relation est très forte.

Votre directeur des finances vous demande votre avis sur la faisabilité de cinq projets. Il vous

précise que, selon lui, c’est le projet qui semble le plus prometteur. Prudent, vous décidez

d’arrêter votre choix sur le critère du coefficient de variation. Vous dressez d’abord le tableau des

rendements espérés et des écarts types :

Tableau 5.24 Rendements espérés et écarts type des projets de développement

Projet A Projet B Projet C Projet D Projet E

Rendement 8 514 10 228 14 754 18 111 19 664

Écart type 5 212 7 441 12 021 16 718 17 200

Puis, afin de comparer les projets, vous calculez les coefficients de variation en vous aidant de la

formule :

Sachant que plus le coefficient de variation est élevé, plus le projet est risqué, vous proposez de

retenir le projet A. Ce choix est fait en fonction d’une aversion pour le risque malgré le faible

rendement de A.

NOTE : Faites les exercices de la section 4 dans le Recueil des activités pratiques.

rAB =3× 0,0218( )− 0,26× 0,25( )

3× 0,023( )− 0,26( )2 × 3× 0,0212( )− 0,25( )2= 0,22

rAC =3× 0,0283( )− 0,26× 0,3( )

3× 0,023( )− 0,26( )2 × 3× 0,0365( )− 0,33( )2= −0,98

rBC =3× 0,0274( )− 0,25× 0,33( )

3× 0,0212( )− 0,25( )2 × 3× 0,0365( )− 0,33( )2= −0,40

A B

A C

C

V = sx

VA =5 2128514

= 0,61= 61% VB =7 44110 228

= 0,73= 73% VC =12 02114 754

= 0,81= 81%

VD =16 71818111

= 0,92 = 92 % VE =17 20019 664

= 0,87 = 87 %

Page 68: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

68

Résumé

La statistique est le champ d’étude qui vise à rassembler des données, des informations, au moyen de

questionnaires, sondages ou autres inventaires, à présenter ces informations sous forme de tableaux,

de graphiques ou de sommaires numériques et, finalement, à analyser ces informations pour tenter

d’en tirer des généralisations. La statistique descriptive développe et applique des méthodes et des

outils de collecte, de classement, de représentation graphique et numérique des données, alors que

la statistique inférentielle tente de généraliser à une population les résultats obtenus à partir d’un

échantillon.

On distingue deux types de données statistiques : les caractères qualitatifs et les caractères

quantitatifs. Un caractère est le critère sur lequel repose une étude statistique. Le caractère est

qualitatif lorsque chaque élément observé fait explicitement l’objet d’un rattachement unique à une

modalité (qualité exclusive ou attribut d’un caractère qualitatif) choisie dans un ensemble de

modalités exclusives permettant de classer tous les éléments de modalités exclusives. Le caractère

qualitatif peut être nominal ou ordinal. Les caractères quantitatifs, ou variables statistiques, sont ceux

auxquels on peut faire correspondre des nombres. Le caractère quantitatif est discret ou continu.

Le tableau est la disposition claire et ordonnée des données en lignes et en colonnes. En statistique,

les tableaux sont de deux types : les tableaux à un seul caractère et les tableaux à deux caractères.

La disposition des tableaux et l’information qu’ils contiennent changent selon le type de caractère.

Mais dans la plupart des tableaux on retrouvera au minimum des informations sur les modalités ou les

valeurs et des nombres représentant les fréquences et les fréquences relatives. S’ajoutera la notion de

fréquences relatives cumulées dans le cas des tableaux à un caractère, qualitatif ordinal ou

quantitatif. Le tableau de séries chronologiques est un cas particulier : il sert à représenter les valeurs

prises par un caractère qui évolue dans le temps.

La représentation graphique vise à alléger la présentation des données et à en faciliter l’interprétation.

Il existe des graphiques spécifiques pour les caractères qualitatifs (le diagramme à bandes, le

diagramme rectangulaire à secteurs, le diagramme circulaire à secteurs) et pour les caractères

quantitatifs (le diagramme à bâtons, à ligne brisée, en escalier, l’histogramme, le polygone de

fréquences relatives cumulées, le nuage de points). Dans le cas des séries chronologiques, la synthèse

graphique se présentera sous forme de diagramme à ligne brisée ou chronogramme. Chaque

graphique possède ses caractéristiques propres.

Utilisés pour dégager les caractéristiques essentielles d’un ensemble d’informations et réservés aux

caractères quantitatifs, les sommaires numériques se subdivisent en trois catégories : les mesures de

Page 69: MQT 1001 Mathématiques appliquées à la gestion · MQT 1001 – Mathématiques appliquées à la gestion . Module 5 – Lecture 7 . Section 2 : les tableaux statistiques et autres

MQT 1001 – Mathématiques appliquées à la gestion

Module 5 – Lecture

69

tendance centrale (moyenne, médiane et mode), valeurs autour desquelles se concentrent les

données; les mesures de dispersion (étendue, écart interquartile, variance et écart type), nombres

permettant de représenter l’étalement ou le degré de dispersion d’un ensemble de données; et les

mesures de comparaison (coefficient de variation, covariance et coefficient de corrélation), qui

permettent de comparer deux ou plusieurs caractères entre eux. Parmi ces mesures, la moyenne,

l’écart type et le coefficient de corrélation sont les indices les plus utilisés.

Références Champlain, D., Mathieu, P., Patenaude, P., H. Tessier (1996). Lexique mathématique (2e éd.), Beauport : Les éditions du triangle d’or.

Giard, Vincent (1995). Statistique descriptive pour les gestionnaires, Paris : Economica.