View
0
Download
0
Category
Preview:
Citation preview
Me
SS
201
5M
odu
leI
R1L’approche empirique
Démarche, concepts essentiels, vocabulaire
• Niveau théorique/conceptuel
- Cadre théorique
- Conceptualisation (formulation théorique): Définition conceptuelle
- Hypothèses: Postule des relations entre concepts
• Niveau empirique
- Des concepts aux indicateurs (mesure): Définition opérationnelle
- Types de données- Sondage, données agrégatives, données expérimentales
- Qualité de la mesure: Validité, fiabilité
- Construction/production des données
- Structures des données: Matrice de données
- Niveaux de mesure
- Vérification empirique
• Interprétation et généralisation
Me
SS
201
5M
odu
leI
R2
Préférencepartisane
Attitudeface à l’EuropeHypothèse
Mesu
re
Mesu
re
Con
cepts
Ind
icateurs
Relation observée
La démarche empirique
Th
éo
rieE
mp
irie
Défin
ition(con
ceptuelle)
Défin
ition
(op
ération
nelle
)
Va
lidi
téF
iab
ilit
é(d
esm
esu
res)
Réponse à la question:
Pour quel parti politique
avez-vous voté lors des
dernières élections fédérales
Réponse à la question:Si la CH votait dimanche pro-chain sur l’adhésion à l’UE, vousvoteriez certainement pour, prob.pour, prob. contre, certainementcontre?
Var. dépendante(à expliquer)
Var. indépendante(explicative)
exte
rne
(gén
éral
sbil
ité)
inte
rne
(oér
ence
)V
alid
ité
de
lam
esu
re
Me
SS
201
5M
odu
leI
R3
Classification
Ordre
Distances
Point zéro
Nominal Ordinal Intervalles (Rapports) (Absolu)
Les échelles de mesure et leurs propriétés
Unité fixe
Choix de l’outil ↔ Niveau de mesure
Qualitatif Quantitatif
Discret Continu
Catégoriel Métrique
Ordinal métrique: Intervalles constants entre modalités (hypothèse!)
Me
SS
201
5M
odu
leI
R4Les enquêtes par sondage
• Echantillons et inférence statistique
- Échantillonnage
- Bases théoriques: Loi des grands nombres, distribution normale- Echantillons: Précision et représentativité; choix aléatoire, par quotas,…- Inférence statistique: Tests statistiques, décision statistique
• Outils d’analyse (pour données nominales ou ordinales)
- Diagnostic et description univariés
- Etude de relations bivariées
- Etude de tableaux croisés
- Diagnostic des variables et de la relation (N, données manquantes etc)
- Lecture des % (prob. conditionnelles et conjointes)
- Le test du chi-deux
- Les coefficients d’association: Niveaux de mesure, familles de coefficients
- Etude de relations plurivariées- Tableau croisés avec variables de contrôle- Coefficients d’association partiels
Me
SS
201
5M
odu
leI
R5
Echantillons
• Choix aléatoire/loi des grands nombres → Représentativité
• Taille de l’échantillon → Précision
• Modèle idéal: Echantillon aléatoire
- Modèle des données
- Distribution théorique (a priori): distribution normale
• Notions importantes
- Intervalle de confiance (“fourchette”); marge d’erreurs
- Seuil de signification (risque): Décidé/spécifié a priori
Me
SS
201
5M
odu
leI
R6
MIS-Trend Avril 2000a
a. Echantillon représentatif des électeurs alémaniques et romands;marge d’erreur ±3.2%
BilatéralesSuisse
RomandeSuisse
alémaniqueTotal
Oui 65.2 55.1 57.6
Plutôt oui 8.9 6.9 7.4
Plutôt non 7.3 15.9 13.8
Non 6.3 15.9 9.5
NSP/Refus 12.3 11.5 11.7
N 242 754 996
Votation sur les BilatéralesEnquête par sondage représentatif des électeurs suisses (méthode des quotas)
Représentativité: Choix aléatoire
Précision: Marge d’erreur, intervalle de confiance
Me
SS
201
5M
odu
leI
R7Inférence statistique
Echantillon Population mère
Modèle théorique (a priori) des donnéesDistribution théorique
Récolte des données
(Echantillons)
Modèleconceptuel
Modèlestatistique
Modèleempirique
Me
SS
201
5M
odu
leI
R8Décision statistique
• Hypothèses Ho / H1
• Fixer un seuil de signification (choisi a priori)
• Choix et calcul d’un test→ Distribution théorique appropriée aux données
• Décision statistique:
Probabilité (erreur de type I/α)
Seuil de signification
Confrontation DécisionGarder ou rejeter H0
• Signification/significativité
- Signification statistique [“significant”]
- Signification “substantielle” (recherche) [“meaningful”]
• Test statistique
Établir la signification statistique d’une statistique : Confrontation durésultat empirique au modèle théorique des données.
Me
SS
201
5M
odu
leI
R9
Variable indépendanteV
aria
ble
dépe
nda
nte
Nominal Ordinal Intervalles
Nominal
Ordinal
Intervalles
Tableaux croisés
Coeff. d’association
Outils pour l’analyse de variables catégorielles
Tableaux de moyennes
Test du χ2
Test de F, η, η2
Me
SS
201
5M
odu
leI
R10
Présentation
Nominal Ordinal Intervalles
Outil de base Tableau de fréquence Liste, dotplot
Graphiques Diagrammes à barres Histogrammes, boxplots
Résumés numériques (statistiques univariées)
Attention: La moyenne n’est pas résistante.
Nominal Ordinal Intervalles
Tendance centrale (Mode) (Médiane) Moyenne, médiane
Dispersion (-) (Distance interquar-tile)
Ecart-type,dist. interquartile
Diagnostiquer, décrire, résumer une variable• Diagnostic général
- Effectifs, contexte
- Données manquantes
- Particularités
• Diagnostic statistique en fonction du niveau de mesure- Tendance centrale et dispersion (variabilité)
- Forme de la distribution (symétrie!)
- Valeurs extraordinaires, discontinuités etc.
Méfiez vous despièges des résumés
... en vue de son rôledans votre analyse
Me
SS
201
5M
odu
leI
R11
Q49 Identification partisane
151 12.5 13.4
193 15.9 17.1
85 7.0 7.5
84 6.9 7.4
49 4.0 4.3
22 1.8 2.0
8 .7 .7
24 1.9 2.1
17 1.4 1.5
23 1.9 2.0
19 1.6 1.7
8 .7 .7
21 1.7 1.8
424 35.0 37.6
1127 92.9 100.0
30 2.5
56 4.6
86 7.1
1213 100.0
1 PRD Parti radical-démocratique
2 PSS Parti socialiste suisse
3 PDC Parti démocrate chrétien
4 UDC Union démocratique du centre
5 PES Parti écologiste suisse
6 PA Parti des automobilistes
7 DS Démocrates suisses
8 PLS Parti libéral suisse
9 AdI Alliance des indépendants
10 PEP Parti évangélique et populaire
11 PST/POP Parti suisse travail
12 PCS Parti chrétien-social suisse
13 Autre (FraP)
80 Aucun parti
Total
Valid
98 NSP
99 NR
Total
Missing
Total
Frequency PercentValid
Percent
• Lecture politologique
- Partis
- Préférence ou pas de préf.
- …
• Diagnostic
- Modalités à faible effectif
- Concentrations
- Données manquantes
• Résumés statistiques?
- Tendance centrale?
- Mode (catégorie modale)
• Représentation graphique
- Diagramme à barres
- (Camembert)
Tableaux de fréquences: Diagnostic et description [Univarié]
Me
SS
201
5M
odu
leI
R12Etude des relations entre variables catégorielles
• Tableau croisé
- Outil de base pour analyser des variables catégorielles- Diagnostic
- Données manquantes?
- Lignes/colonnes/cases à effectifs trop faibles?
- Allure/forme de la relation entre les variables
- Réponse à des questions- Lecture des % (prob. conditionnelles et conjointes)
- Etude de la relation ↔ Hypothèses
- Présentation des résultats- Conseils pratiques
- Aiguisez vos compétences en lecture des tableaux croisés- Apprenez à produire les tableaux qui correspondent à vos questions
• Résumé de la relation
- Significativité statistique (test du chi-2)
- Coefficients d’association
MeSS2015ModuleI
R13
Vital pour l'economie suisse * Region linguistique Crosstabulation
Vital pour l’économie suisse Region linguistique Total
Suissealemanique
Suisseromande
Tessin
Entierementd'accord
Count 182 113 12 307
% within Vital pour l'eco-nomie suisse
59.3% 36.8% 3.9% 100.0%
% within Rég.linguistique 26.9% 60.4% 25.0% 33.7%
% of Total 20.0% 12.4% 1.3% 33.7%
Plutotd'accord
Count 164 51 11 226
% within Vital pour l'eco-nomie suisse
72.6% 22.6% 4.9% 100.0%
% within Rég. linguistique 24.3% 27.3% 22.9% 24.8%
% of Total 18.0% 5.6% 1.2% 24.8%
Plutot pasd'accord
Count 197 12 13 222
% within Vital pour l'eco-nomie suisse
88.7% 5.4% 5.9% 100.0%
% within Rég. linguistique 29.1% 6.4% 27.1% 24.4%
% of Total 21.6% 1.3% 1.4% 24.4%
absolumentpas d'accord
Count 133 11 12 156
% within Vital pour l'eco-nomie suisse
85.3% 7.1% 7.7% 100.0%
% within Rég. linguistique 19.7% 5.9% 25.0% 17.1%
% of Total 14.6% 1.2% 1.3% 17.1%
Total Count 676 187 48 911
% within Vital pour l'eco-nomie suisse
74.2% 20.5% 5.3% 100.0%
% within Rég. linguistique 100.0% 100.0% 100.0% 100.0%
% of Total 74.2% 20.5% 5.3% 100.0%
Entierementd'accord
Count
% within Vital pourl'economie suisse
% within Region
linguistique
% of Total
Tableau croisé (tri croisé, tableau de contingence)(crosstabulation, contingency table)
N : Nombre de personnes :
Pourcentage en ligne
Pourcentage en colonne
Pourcentage total (probabilité conjointe)
probabilités
conditionnelles
Nom
bre
dedo
nnée
sm
anqu
ante
s76
Me
SS
201
5M
odu
leI
R14
Vital pour l'économie suisse * Région linguistique Crosstabulation
182 113 12 307
26.9% 60.4% 25.0% 33.7%
164 51 11 226
24.3% 27.3% 22.9% 24.8%
197 12 13 222
29.1% 6.4% 27.1% 24.4%
133 11 12 156
19.7% 5.9% 25.0% 17.1%
676 187 48 911
100.0% 100.0% 100.0% 100.0%
Count
% within Région
Count
% within Région
Count
% within Région
Count
% within Région
Count
% within Région
Entièrement d'accord
Plutôt d'accord
Plutôt pas d'accord
absolument pas d'accord
Vital pour
l'économie
suisse
Total
Suisse
alémanique Suisse romande Tessin
Région linguistique
Total
Case Processing Summary
911 92.5% 74 7.5% 985 100.0%Vital pour l'économie* Région
N Percent N Percent N Percent
Valid Missing Total
Cases
Me
SS
201
5M
odu
leI
R15
Chi-Square Tests
99.844a 6 .000
107.399 6 .000
28.238 1 .000
.b
911
Pearson Chi-Square
Likelihood Ratio
Linear-by-LinearAssociation
McNemar Test
N of Valid Cases
Value df
Asymp.Sig.
(2-sided)Exact Sig.(2-sided)
0 cells (.0%) have expected count less than 5. The minimum expectedcount is 8.22.
a.
Computed only for a PxP table, where P must be greater than 1.b.
Sig.Valeur p (p-value)Probabilité d’une erreur de type I (α)
Me
SS
201
5M
odu
leI
R16
Directional Measures
.019 .024 .796 .426
.026 .033 .796 .426
.000 .000 .c .c
.041 .007 .000d
.081 .015 .000d
.057 .010 5.633 .000e
.043 .008 5.633 .000e
.084 .015 5.633 .000e
-.207 .028 -7.394 .000
-.291 .039 -7.394 .000
-.160 .022 -7.394 .000
.312
.196
Symmetric
Vital pr. l'économieDependent
Région Dependent
Vital pr. l'économieDependent
Région Dependent
Symmetric
Vital pr. l'économieDependent
Région Dependent
Symmetric
Vital pr. l'économieDependent
Région Dependent
Vital pr. l'économieDependent
Région Dependent
Lambda
Goodman andKruskal tau
UncertaintyCoefficient
Nominal byNominal
Somers' dOrdinal byOrdinal
EtaNominal byInterval
Value
Asymp.Std. Error
aApprox. T
bApprox.
Sig.
Not assuming the null hypothesis.a.
Using the asymptotic standard error assuming the null hypothesis.b.
Cannot be computed because the asymptotic standard error equals zero.c.
Based on chi-square approximationd.
Likelihood ratio chi-square probability.e.
Choix du coefficient en fonction des niveaux de mesure
Me
SS
201
5M
odu
leI
R17
Symmetric Measures
.331 .000
.234 .000
.314 .000
-.216 .029 -7.394 .000
-.177 .024 -7.394 .000
-.392 .052 -7.394 .000
-.240 .032 -7.452 .000c
-.176 .034 -5.395 .000c
.d
911
Phi
Cramer's V
Contingency Coefficient
Nominal by Nominal
Kendall's tau-b
Kendall's tau-c
Gamma
Spearman Correlation
Ordinal by Ordinal
Pearson's RInterval by Interval
KappaMeasure of Agreement
N of Valid Cases
ValueAsymp.
Std. Errora
Approx.T
bApprox.
Sig.
Not assuming the null hypothesis.a.
Using the asymptotic standard error assuming the null hypothesis.b.
Based on normal approximation.c.
Kappa statistics cannot be computed.They require a symmetric 2-way table in which thevalues of the first variable match the values of the second variable.
d.
Me
SS
201
5M
odu
leI
R18
Nominal Ordinal Intervalles
Nominal
Ordinal
Intervalles
Coefficients d’association (Regard symétrique ou aysmétrique)
(phi)
Coeff. de contingence C
V de Cramer
x y xy
de Goodman et Kruskal
Coefficients ordinaux
Q de Yule(Gamma)
b(tau b)
c(tau c)
D de Somer
r (de Pearson)
(Variable indépendante)(V
aria
ble
dépe
nda
nte
)
(Eta)
Examinez les tableaux croisées soigneusement avant de résumer la relation à l’aide d’un coefficient.
(si vous souhaitez utiliser un coefficient!)
... et dans le doute retournez aux tableaux croisés....
Me
SS
201
5M
odu
leI
R19S
ou
rce
:E
nq
uê
teé
lec
tora
le(S
ele
cts
)d
e1
99
5(K
rie
si)
Armée Pour/contre l’arméeEducation Niveau d’éducation
Inférieur Supérieur
pour
contre
Education
Armée
66% 53%
34% 47%
100% 100%(1006) (591)
( = 0,13)
Sig. 2 = 0.000
Homme Femme
Pour
Contre
Sexe
Armée
65% 57
35 43
100% 100%(752) (845)
( = 0,08)
Sig. 2 = 0.001
Me
SS
201
5M
odu
leI
R20
Homme Femme
Pour
Contre
Armée
68% 64
32 36
100% 100%(422) (584)
( = 0,04)
Education: Niveau inférieur
Sig. 2 = 0.21
( = 0,20)
Sig 2 = 0.000
Homme Femme
Pour
Contre
Armée
61% 41
39 59
100% 100%(330) (261)
Education: niveau supérieur
Variable de contrôle: Niveau d’éducation
Effet educationéliminé(constant)
Me
SS
201
5M
odu
leI
R21Tableaux de moyennes
• Var. dépendante continue, var. indép.catégorielle
• Comparaison des catégories de lavariable indépendante- Tableaux de moyennes/écart-types;diagnostic de la relation
- Boxplot (boîte à pattes)
• Décomposition de la varianceV
total= V
inter-groupes+ V
intra-groupes
Var(y) = Var(x) + Var(reste)attribuable à X attribuable à “autre chose”
- QualitéVariance expliquée)
- Relation (force)
• Signification statistique
- Relation → Test de F
Me
SS
201
5M
odu
leI
R22
Aucune formscol/prof
Ecoleobligatoire
Appr prof ouécole prof
Ecole dematurité
Form sup techet prof
Ecole tech sup Université,EPF
Dernière école achevée
0
3
6
9
12
15
Potact1
Cases weighted by Pondération sur regling, données OFS grisons=além
Comparaison de groupes: Boîte à pattes (Boxplot)
Echelle “potact” et niveau d’éducation
Attention: Comparaison de médianes/distances interquartiles
Médiane
Distanceintequartile
Recommended