21
© Benoit Duguay, 2013 Plan la séance 11 Analyse des données Ressources Web Analyse de fréquences Mesures de position centrale Mesures de dispersion Mesures de forme Utilisation du logiciel SPSS Atelier Démonstration du logiciel SPSS Traitement des données recueillies avec SPSS Rencontre de chacune des équipes avec le professeur

© Benoit Duguay, 2013 Plan la séance 11 Analyse des données Ressources Web Analyse de fréquences Mesures de position centrale Mesures de dispersion Mesures

Embed Size (px)

Citation preview

Page 1: © Benoit Duguay, 2013 Plan la séance 11 Analyse des données Ressources Web Analyse de fréquences Mesures de position centrale Mesures de dispersion Mesures

© Benoit Duguay, 2013

Plan la séance 11Analyse des données

Ressources Web Analyse de fréquences Mesures de position centrale Mesures de dispersion Mesures de forme Utilisation du logiciel SPSS Atelier

Démonstration du logiciel SPSS Traitement des données recueillies avec SPSS Rencontre de chacune des équipes avec le

professeur

Page 2: © Benoit Duguay, 2013 Plan la séance 11 Analyse des données Ressources Web Analyse de fréquences Mesures de position centrale Mesures de dispersion Mesures

© Benoit Duguay, 2013

Analyse statistiqueRessource Web

http://www.statcan.gc.ca/edu/power-pouvoir/toc-tdm/5214718-fra.htm

Page 3: © Benoit Duguay, 2013 Plan la séance 11 Analyse des données Ressources Web Analyse de fréquences Mesures de position centrale Mesures de dispersion Mesures

© Benoit Duguay, 2013

Analyse de fréquences (1 de 2)

Fondement de l’analyse statistique

Analyse de la distribution des réponses une variable à la fois : Selon le nombre de

réponses (effectif) Selon le pourcentage de

réponses

Présentation : Tableau Graphique

Source : http://www.mineful.com/analytics/frequency-distribution-analysis.html

Page 4: © Benoit Duguay, 2013 Plan la séance 11 Analyse des données Ressources Web Analyse de fréquences Mesures de position centrale Mesures de dispersion Mesures

© Benoit Duguay, 2013

Analyse de fréquences (2 de 2)

Permet d’évaluer l’importance des réponses manquantes : Pourcentage valide exclue

les réponses manquantes

Permet d’évaluer la présence de données hors norme (anormales) : P. ex., la valeur 6 pour une

variable codifiée de 1 à 5Source : http://www.mineful.com/analytics/frequency-distribution-analysis.html

Page 5: © Benoit Duguay, 2013 Plan la séance 11 Analyse des données Ressources Web Analyse de fréquences Mesures de position centrale Mesures de dispersion Mesures

© Benoit Duguay, 2013

Tableau de fréquencesVariable Consommation

Consommation

30 17,1 17,4 17,4

110 62,9 64,0 81,4

32 18,3 18,6 100,0

172 98,3 100,0

3 1,7

175 100,0

Plus

Comparable

Moins

Total

Valid

9Missing

Total

Frequency Percent Valid PercentCumulative

Percent

Page 6: © Benoit Duguay, 2013 Plan la séance 11 Analyse des données Ressources Web Analyse de fréquences Mesures de position centrale Mesures de dispersion Mesures

© Benoit Duguay, 2013

Graphique de fréquencesVariable Consommation

Page 7: © Benoit Duguay, 2013 Plan la séance 11 Analyse des données Ressources Web Analyse de fréquences Mesures de position centrale Mesures de dispersion Mesures

© Benoit Duguay, 2013

Mesures de position centrale

Mode : Valeur la plus fréquente Certaines données peuvent

être bimodales

Médiane : Valeur centrale d’un

ensemble ordonné de réponses

Moyenne : Somme des réponses divisée

par le nombre de réponses

Pour une courbe normale, les trois valeurs sont identiques et centrées sur la courbe

ModeMédianeMoyenne

Page 8: © Benoit Duguay, 2013 Plan la séance 11 Analyse des données Ressources Web Analyse de fréquences Mesures de position centrale Mesures de dispersion Mesures

© Benoit Duguay, 2013

Mesures de position centrale en fonction du type d’échelle utilisé

ÉchelleMesure de tendance centrale

Nominale Mode

Ordinale Médiane, mode

D’intervallesMoyenne, médiane

De proportions (rapport, ratio)

Moyenne, médiane

Tiré et adapté de : Malhotra, N., traduit par Décaudin, J.M. et A. Bouguerra (2011), Études Marketing avec SPSS,  6e éd.,  Paris: Pearson Éducation France.

Page 9: © Benoit Duguay, 2013 Plan la séance 11 Analyse des données Ressources Web Analyse de fréquences Mesures de position centrale Mesures de dispersion Mesures

© Benoit Duguay, 2013

Problèmes avec la moyenne

Statistique très affectée par les valeurs extrêmes

Moyenne unique seulement hypothétique pour les courbes bicéphales (voir ci-contre)

Souvent peu de réponses , voire aucune, près de la moyenne (grands écarts types)

Ne pas exagérer la précision : (5000+3000+2000)/3 =

3333 3300 suffisant

0

5

10

15

20

25

30

35

40

45

Tiré et adapté de: McGown (1979), Marketing Research: Text and Cases, Cambridge : Winthrop Publishers

Page 10: © Benoit Duguay, 2013 Plan la séance 11 Analyse des données Ressources Web Analyse de fréquences Mesures de position centrale Mesures de dispersion Mesures

© Benoit Duguay, 2013

Mesures de dispersion

Écart type (S) : Mesure de dispersion

autour de la moyenne La plus utilisée Variance = Moyenne des

carrés des écarts à la moyenne

Écart type = Racine carrée de la variance

Écart (ou étendue) : Différence entre les

valeurs maximale et minimale

Source : http://www.socialresearchmethods.net/kb/statdesc.php

Page 11: © Benoit Duguay, 2013 Plan la séance 11 Analyse des données Ressources Web Analyse de fréquences Mesures de position centrale Mesures de dispersion Mesures

© Benoit Duguay, 2013

Présentation de la moyenne et de l’écart type pour plusieurs aspects d’une même

question

Nourriture

0

24

6

810

12

1416

18

écart-type - moyenne écart-type +

Gracieuseté des étudiants suivants du EUT4108 H2009: Marie-Ève Aubry, Alexandre Champagne, Alexandra Fauteux, Mathieu Lavoie, Micheline Petit

Page 12: © Benoit Duguay, 2013 Plan la séance 11 Analyse des données Ressources Web Analyse de fréquences Mesures de position centrale Mesures de dispersion Mesures

© Benoit Duguay, 2013

Relation entre l’écart type et la courbe normale

Écart type =-1

Écart type =+1

-2-3 +2 +3

68%95%

99% 68%95%

99%

ModeMédianeMoyenne

Page 13: © Benoit Duguay, 2013 Plan la séance 11 Analyse des données Ressources Web Analyse de fréquences Mesures de position centrale Mesures de dispersion Mesures

© Benoit Duguay, 2013

Mesures de formes

Symétrie (skewness) : mesure indiquant que les

déviations par rapport à la moyenne sont plus importantes dans une direction, à gauche (si valeur positive), ou à droite (si valeur négative)

Symétrie d’une distribution normale = 0

Aplatissement (kurtosis) : Mesure indiquant que la

courbe de la distribution de fréquence est plus plate (si valeur négative), ou moins plate (si valeur positive), par rapport à une courbe normale

Aplatissement d’une distribution normale = 0

Tiré et adapté de : Malhotra, N., traduit par Décaudin, J.M. et A. Bouguerra (2011), Études Marketing avec SPSS,  6e éd.,  Paris: Pearson Éducation France.

Page 14: © Benoit Duguay, 2013 Plan la séance 11 Analyse des données Ressources Web Analyse de fréquences Mesures de position centrale Mesures de dispersion Mesures

© Benoit Duguay, 2013

Symétrie de la distribution

Distribution symétriqueSkewness = 0

Distribution asymétriqueSkewness = négatif

Source : http://experimentaltheology.blogspot.ca/2012/03/central-tendency-in-skewed.html

Distribution asymétriqueSkewness = positif

Page 15: © Benoit Duguay, 2013 Plan la séance 11 Analyse des données Ressources Web Analyse de fréquences Mesures de position centrale Mesures de dispersion Mesures

© Benoit Duguay, 2013

Aplatissement de la distribution

Source : http://mvpprograms.com/help/mvpstats/distributions/SkewnessKurtosis

Page 16: © Benoit Duguay, 2013 Plan la séance 11 Analyse des données Ressources Web Analyse de fréquences Mesures de position centrale Mesures de dispersion Mesures

© Benoit Duguay, 2013

La courbe de la variable Consommation est-elle normale?

Page 17: © Benoit Duguay, 2013 Plan la séance 11 Analyse des données Ressources Web Analyse de fréquences Mesures de position centrale Mesures de dispersion Mesures

© Benoit Duguay, 2013

Statistiques de la variable Consommation

Statistics

Consommation172

3

2,01

2,00

2

,602

-,004

,185

-,197

,368

2

Valid

Missing

N

Mean

Median

Mode

Std. Deviation

Skewness

Std. Error of Skewness

Kurtosis

Std. Error of Kurtosis

Range

MoyenneMédianeMode

Écart typeSymétrie

Aplatissement

Étendue

Page 18: © Benoit Duguay, 2013 Plan la séance 11 Analyse des données Ressources Web Analyse de fréquences Mesures de position centrale Mesures de dispersion Mesures

© Benoit Duguay, 2013

La courbe de la variable Âge est-elle normale?

Page 19: © Benoit Duguay, 2013 Plan la séance 11 Analyse des données Ressources Web Analyse de fréquences Mesures de position centrale Mesures de dispersion Mesures

© Benoit Duguay, 2013

Statistiques de lavariable Âge

Statistics

Âge173

2

31,69

31,00

21

8,653

,709

,185

,298

,367

42

Valid

Missing

N

Mean

Median

Mode

Std. Deviation

Skewness

Std. Error of Skewness

Kurtosis

Std. Error of Kurtosis

Range

Moyenne

Médiane

Mode

Écart type

Symétrie

Aplatissement

Étendue

Page 20: © Benoit Duguay, 2013 Plan la séance 11 Analyse des données Ressources Web Analyse de fréquences Mesures de position centrale Mesures de dispersion Mesures

© Benoit Duguay, 2013

Utilisation du logiciel SPSS

Importer des données du fichier Excel à SPSS Ajouter de nouvelles données une fois le fichier Excel

importé dans SPSS Identifier les variables et leurs valeurs, et la ou les

valeurs pour les données manquantes : Guide interactif « Comment identifier les variables et leurs valeurs

»

Créer une nouvelle variable avec des catégories : Guide interactif « Comment créer une variable avec des catégories

»

Réaliser les analyses de fréquences : Guide interactif « Comment réaliser une analyse des fréquences »

Ressource Web : Site SPSS de l'Université de Sherbrooke

Page 21: © Benoit Duguay, 2013 Plan la séance 11 Analyse des données Ressources Web Analyse de fréquences Mesures de position centrale Mesures de dispersion Mesures

© Benoit Duguay, 2013

Atelier

Démonstration du logiciel SPSS

Traitement des données recueillies avec SPSS

Rencontre de chacune des équipes avec le professeur