23
INITIATION Ä EXCEL POUR DÅPOUILLEMENT D'ENQUÇTE C. RAVELET Janvier 2009

INITIATION Ä EXCEL POUR DÅPOUILLEMENT D'ENQUÇTEclaude.ravelet.pagesperso-orange.fr/excel.pdf · Excel est un tableur, c•est-†-dire une grille : Dans la grille, chaque rectangle

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: INITIATION Ä EXCEL POUR DÅPOUILLEMENT D'ENQUÇTEclaude.ravelet.pagesperso-orange.fr/excel.pdf · Excel est un tableur, c•est-†-dire une grille : Dans la grille, chaque rectangle

INITIATION Ä EXCELPOUR DÅPOUILLEMENT D'ENQUÇTE

C. RAVELETJanvier 2009

Page 2: INITIATION Ä EXCEL POUR DÅPOUILLEMENT D'ENQUÇTEclaude.ravelet.pagesperso-orange.fr/excel.pdf · Excel est un tableur, c•est-†-dire une grille : Dans la grille, chaque rectangle

PR�SENTATION D�EXCEL

Excel est un tableur, c�est-�-dire une grille :

Dans la grille, chaque rectangle est une "cellule" d�finie par un n� de ligne et un n� de colonne. Par exemple ici la cellule A1. On peut entrer dans les cellules des lettres, des chif-fres, des images ou des op�rations. On peut faire des calculs dans une cellule par rapport � une autre, on appelle cela les r�f�rences relatives.

Exemple : dans la cellule A1, il y a la valeur 12. On veut que dans B1, il y ait 5 de plus que dans A1 : on entre donc dans B1 "=A1+5" (le signe = signifie qu�on va entrer une op�ration et non pas une lettre ou un chiffre), ce qui donne le r�sultat 17 :

Page 3: INITIATION Ä EXCEL POUR DÅPOUILLEMENT D'ENQUÇTEclaude.ravelet.pagesperso-orange.fr/excel.pdf · Excel est un tableur, c•est-†-dire une grille : Dans la grille, chaque rectangle

- 2 -

Exercice : (fichier "notes")Soit une classe de 30 �l�ves qui ont obtenu une note au 1er semestre (Note A) et une note

au 2�me semestre (Note B). On veut mettre 3 point de plus � tous les �l�ves pour la note B :

Ci-dessus la grille des notes ; puis on entre dans la cellule D2 :"=C2+3" ; le r�sultat est 14.

Page 4: INITIATION Ä EXCEL POUR DÅPOUILLEMENT D'ENQUÇTEclaude.ravelet.pagesperso-orange.fr/excel.pdf · Excel est un tableur, c•est-†-dire une grille : Dans la grille, chaque rectangle

- 3 -

Pour faire la m�me op�ration pour les 30 �l�ves, s�lectionnez la colonne D en "inversion vid�o" puis cliquez sur "Edition"/"Remplissage"/"En bas", le r�sultat est imm�diat.

Nous voulons maintenant calculer la moyenne annuelle des 30 �l�ves sur les 2 notes A et B.

En D2, la syntaxe est "=MOYENNE(B2:C2)", c�est-�-dire "calculer la moyenne de la zone comprise entre B2 et C2"

Page 5: INITIATION Ä EXCEL POUR DÅPOUILLEMENT D'ENQUÇTEclaude.ravelet.pagesperso-orange.fr/excel.pdf · Excel est un tableur, c•est-†-dire une grille : Dans la grille, chaque rectangle

- 4 -

Exercice :Calculer la moyenne de la classe aux notes A et B :

On se place en B32 et on entre "=MOYENNE(B2:B31)", puis pour la note B on clique "Edition/Remplissage/� droite".

Pour arrondir � 2 chiffres derri�re la virgule, on clique "Format/cellule/Nombre/2", ce qui donne le r�sultat ci-dessus.

Page 6: INITIATION Ä EXCEL POUR DÅPOUILLEMENT D'ENQUÇTEclaude.ravelet.pagesperso-orange.fr/excel.pdf · Excel est un tableur, c•est-†-dire une grille : Dans la grille, chaque rectangle

- 5 -

Calcul de l��cart-type. Si on ne conna�t pas la syntaxe, on cherche dans l�ic�ne � :

Choisissez "Autres fonctions" puis "Statistiques" et dans la liste trouvez "ECARTYPE" ;

Dans Nombre1 entrez la zone B2:B31, faites OK. La syntaxe est :"=ECARTYPE(B2:B31)". Recopiez � droite pour les notes B, arrondissez � 2 chiffres derri�re la virgule :

Page 7: INITIATION Ä EXCEL POUR DÅPOUILLEMENT D'ENQUÇTEclaude.ravelet.pagesperso-orange.fr/excel.pdf · Excel est un tableur, c•est-†-dire une grille : Dans la grille, chaque rectangle

- 6 -

Exercice :Calculez le coefficient de corr�lation entre les notes A et B.

M�me proc�dure : � puis COEFFICIENT CORRELATION puis les 2 zones (puisqu�on �value une corr�lation entre 2 s�ries) B2:B31 et C2:C31. Arrondi, le r�sultat est le suivant :

Page 8: INITIATION Ä EXCEL POUR DÅPOUILLEMENT D'ENQUÇTEclaude.ravelet.pagesperso-orange.fr/excel.pdf · Excel est un tableur, c•est-†-dire une grille : Dans la grille, chaque rectangle

- 7 -

Travaillons maintenant sur une grille de donn�es d�mographiques (fichier"EXERCICE_d�mo") :

En A sont indiqu�es les ann�es, en B la population totale en milliers, en C le nombre de mariages, en D le nombre de naissances de gar�ons, en E celui de filles, en F le total des nais-sances (D+E).

Calculons le taux de natalit� en � : Nb de naissances X 1000/Total de la population : indi-quons en G2 "=F2*1000/B2" mais attention la population est en milliers, il faut donc diviser par 1000, la formule devient donc "=F2/B2"

Page 9: INITIATION Ä EXCEL POUR DÅPOUILLEMENT D'ENQUÇTEclaude.ravelet.pagesperso-orange.fr/excel.pdf · Excel est un tableur, c•est-†-dire une grille : Dans la grille, chaque rectangle

- 8 -

On recopie vers le bas, puis on va r�aliser un graphique : cliquer sur l�ic�ne repr�sentant un histogramme et choisir "Courbes".

En maintenant la souris sur "Maintenir appuy� pour visionner" on peut voir ce que sera le graphique. Choisir "Suivant", le graphique appara�t, encore "Suivant", puis entrer le titre du graphique et le mettre dans la m�me page.

Le graphique appara�t dans la page, le d�placer en maintenant la souris appuy�e pour qu�il ne cache pas la grille. Il ne reste plus qu�� am�liorer l�aspect du graphique en mettant de la couleur avec l�ic�ne "bec verseur" en haut � droite.

Page 10: INITIATION Ä EXCEL POUR DÅPOUILLEMENT D'ENQUÇTEclaude.ravelet.pagesperso-orange.fr/excel.pdf · Excel est un tableur, c•est-†-dire une grille : Dans la grille, chaque rectangle

- 9 -

Exercice : Calculer le taux de nuptialit� et faire un graphique.

Il n�y a pas de donn�es concernant les mariages entre 1923 et 1945, donc la courbe s��croule entre ces 2 dates.

Voici le r�sultat.

Page 11: INITIATION Ä EXCEL POUR DÅPOUILLEMENT D'ENQUÇTEclaude.ravelet.pagesperso-orange.fr/excel.pdf · Excel est un tableur, c•est-†-dire une grille : Dans la grille, chaque rectangle

UTILISATION D�EXCEL POUR LE D�POUILLEMENT DES ENQU�TES

Ouvrir le fichier "EXERCICE_grille". Cette grille reproduit les r�sultats d�une enqu�te par questionnaires faite en Normandie il y a quelques ann�es. Les colonnes correspondent aux questions et les lignes aux num�ros de questionnaires (attention c�est la colonne A qui indique les num�ros des questionnaires) :

Int�ressons-nous � la colonne B (variable SEXE). On veut faire le tri � plat de cette ques-tion : quelle est la r�partition entre les hommes (code M) et les femmes (code F).

S�lectionner la colonne B puis Donn�es/Rapport de tableau crois� dynamique.

Page 12: INITIATION Ä EXCEL POUR DÅPOUILLEMENT D'ENQUÇTEclaude.ravelet.pagesperso-orange.fr/excel.pdf · Excel est un tableur, c•est-†-dire une grille : Dans la grille, chaque rectangle

- 11 -

Cette premi�re fen�tre appara�t, cliquez sur Suivant, cette 2�me fen�tre appara�t, faites aussi Suivant, il n�y a rien � modifier.

Ins�rez le tri sur une nouvelle feuille afin de ne pas cacher la grille, la fen�tre ci-dessus appara�t. Maintenez la souris appuy�e sur SEXE et d�placez l�ic�ne dans la colonne de gau-che.

En rel�chant la souris, les diff�rentes valeurs apparaissent (ici F et M), ensuite faites glisser � nouveau l�ic�ne SEXE mais dans la partie centrale du tableau cette fois (o� il est indiqu� "D�poser Donn�es Ici"), le tri des F et des M se fait automatiquement. En cliquant sur la fl�-che du tableau, vous �liminez les cellules vides. Faites maintenant un pourcentage en entrant dans C5 "=B5*100/502".

Page 13: INITIATION Ä EXCEL POUR DÅPOUILLEMENT D'ENQUÇTEclaude.ravelet.pagesperso-orange.fr/excel.pdf · Excel est un tableur, c•est-†-dire une grille : Dans la grille, chaque rectangle

- 12 -

Faites Remplissage/En bas pour le pourcentage des M et arrondissez � 2 chiffres derri�re la virgule avec la commande Format/Cellule/Nombre.

Le r�sultat est celui-ci. Pour faire un graphique, s�lectionnez en inversion vid�o les 2 pour-centages, cliquez sur l�ic�ne histogramme, choisissez un secteur ; � chaque fois cliquez sur Suivant.

Entrez le nom du graphique, choisissez d�ins�rer le graphique dans la m�me feuille et arrangez l�image.

Page 14: INITIATION Ä EXCEL POUR DÅPOUILLEMENT D'ENQUÇTEclaude.ravelet.pagesperso-orange.fr/excel.pdf · Excel est un tableur, c•est-†-dire une grille : Dans la grille, chaque rectangle

- 13 -

Exercice : de la m�me mani�re, faites le tri � plat de la variable "Cadre de vie" (rural/urbain, colonne D).

Voici le r�sultat.

Nous voulons maintenant faire le tri � plat de la CSP. En proc�dant de la m�me mani�re, on obtient le r�sultat suivant :

On voit qu�il y a trop de valeurs (tableau de droite), le tri est trop �tendu et le tri crois� futur ne permettra pas de test de signification, un �� n��tant pas permis avec des valeurs trop faibles. Il faut donc r�duire les valeurs des CSP aux 8 cat�gories principales en ne prenant que le chiffre de gauche du code INSEE de la CSP.

Page 15: INITIATION Ä EXCEL POUR DÅPOUILLEMENT D'ENQUÇTEclaude.ravelet.pagesperso-orange.fr/excel.pdf · Excel est un tableur, c•est-†-dire une grille : Dans la grille, chaque rectangle

- 14 -

Commencez par ins�rer une nouvelle colonne en s�lectionnant la colonne suivante J et en faisant la commande Insertion/Colonnes :

Donnez un nouveau titre � la nouvelle colonne (indispensable) : CSP_bis. Dans la cellule J2 entrez la formule "=GAUCHE(I2;1)", c�est-�-dire "prendre un chiffre de gauche de la cel-lule I2". Excel indique donc 3 (� gauche de 31). Recopiez vers le bas. Les cellules vides reste-ront vides, les Non R�ponses "NR" deviendront "N". Faites maintenant un tri � plat de CSP_bis comme pr�c�demment.

On obtient le r�sultat ci-dessus apr�s pourcentages et l�histogramme arrang� (pour obtenir les valeurs en abscisses : s�lectionnez A5:B13 avant de lancer le graphique).

Page 16: INITIATION Ä EXCEL POUR DÅPOUILLEMENT D'ENQUÇTEclaude.ravelet.pagesperso-orange.fr/excel.pdf · Excel est un tableur, c•est-†-dire une grille : Dans la grille, chaque rectangle

- 15 -

Nous allons maintenant faire le tri � plat de l��ge. Nous allons rencontrer les m�mes probl�mes que pour la CSP : il y a trop de valeurs, il faut r�duire. Donc ins�rez une nouvelle colonne :

En D ins�rez une nouvelle colonne et appelez-la "AGE_bis". Nous allons classer les personnes en 2 cat�gories : les "jeunes" (moins de 21 ans) et les "ag�s" (les autres). Pour cela nous allons employer la syntaxe "SI" (conditionnelle). Entrons en D2 :"=SI(C2<21;"jeune";"ag�")", c�est-�-dire � si C2 est plus petit que 21 ans, entrer "jeune", sinon entrer "ag�" �. En recopiant vers le bas on voit que la commande fonctionne bien. Par contre en cas de cellule vide, l�op�ration nous renvoie "jeune" puisque le vide (0) est plus petit que 21. Il faut donc am�liorer notre formule.

Il faut donc avant toute chose r�gler le cas des cellules vides. Pour cela ins�rons en premier dans la formule "SI(C2="";"";etc.", c�est-�-dire � si C2 est du vide [repr�sent� par un double guillemets : ""] mettre du vide �. En recopiant en bas on voit que cela fonctionne.

Page 17: INITIATION Ä EXCEL POUR DÅPOUILLEMENT D'ENQUÇTEclaude.ravelet.pagesperso-orange.fr/excel.pdf · Excel est un tableur, c•est-†-dire une grille : Dans la grille, chaque rectangle

- 16 -

Classons maintenant les enqu�t�s en 4 classes d��ge : "A" les moins de 21 ans, "B" ceux entre 21 et 40 ans, "C" ceux entre 41 et 60 ans et "D" les plus de 60 ans. La syntaxe est :� SI(C2<21;"A";SI(C2<41;"B";SI(C2<61;"C";"D"))) �. On peut en effet ins�rer des SI � l�int�rieur d�autres SI. Excel lit de gauche � droite ; d�s que la condition est remplie, il entre ce qui est juste apr�s le ";" et s�arr�te. Cela fonctionne, il ne reste plus qu�� faire le tri � plat comme pr�c�demment et le graphique (ci-dessous) :

Faisons le tri � plat de la Situation familiale (colonne F : "4.1"). Nous allons faire le compte des personnes qui vivent seules (codes C [c�libataire], D [divorc�(e)], V [veuf./veu-ve]) et celles qui vivent en couple (codes M [mari�(e)] et U [union libre]). A d�signe les autres situations (Pacs ?). Faisons d�abord le tri sans regroupement :

S�lection de la colonne puis tri � plat ci-dessus. Maintenant regroupons. Ins�rons en G une nouvelle colonne puis entrons la formule qui permet le regroupement :

Page 18: INITIATION Ä EXCEL POUR DÅPOUILLEMENT D'ENQUÇTEclaude.ravelet.pagesperso-orange.fr/excel.pdf · Excel est un tableur, c•est-†-dire une grille : Dans la grille, chaque rectangle

- 17 -

� SI(F2="M";"en couple";SI(F2="U";"en couple";"seul")) �, c�est-�-dire � si on trouve dans F2 "M" ou "U", la personne vit en couple, sinon elle vit seule. Voyons ce que cela donne :

On voit que cela ne marche pas puisque les Non r�ponses (NR) ne sont consid�r�s ni comme M ni comme U, donc vivant seuls. Il en est de m�me pour les A. Il faut donc revoir la formule et �liminer d�embl�e les NR et les A (par exemple consid�rer les A comme des NR).

Entrons donc avant la formule pr�c�dente :� SI(F2="";"";SI(F2="NR";"NR";SI(F2="A";"NR" � afin d��liminer les vides, les NR et les A. On voit que cela marche : les NR et les A seront comptabilis�s comme NR. Notons qu�avec SI il doit y avoir autant de parenth�ses ouvertes que ferm�es. Il reste � faire le tri � plat et le graphique.

Ci-dessus le tri � plat. S�lectionnez A5:B6. En cliquant sur l�ic�ne Histogramme on obtient cela. Cliquez avec la droite de la souris sur le bouton du bas "SITUATION" et choisissez "Masquer les boutons". Le graphique est d�barrass� de tout bouton ou cadre superflu.

Page 19: INITIATION Ä EXCEL POUR DÅPOUILLEMENT D'ENQUÇTEclaude.ravelet.pagesperso-orange.fr/excel.pdf · Excel est un tableur, c•est-†-dire une grille : Dans la grille, chaque rectangle

- 18 -

Ensuite cliquez � nouveau sur l�ic�ne Histogramme pour choisir plut�t un secteur, plus ad�quat lorsqu�il n�y a que 2 valeurs, et donnez-lui un titre.

Placez le graphique dans la m�me feuille que le tri � plat et donnez-lui de la couleur.

Page 20: INITIATION Ä EXCEL POUR DÅPOUILLEMENT D'ENQUÇTEclaude.ravelet.pagesperso-orange.fr/excel.pdf · Excel est un tableur, c•est-†-dire une grille : Dans la grille, chaque rectangle

- 19 -

TRIS CROISÄS

Reprenons la grille en son �tat. Nous allons croiser le sexe et le cadre de vie (colonnes B et E) selon l�hypoth�se que les femmes rechignent � habiter la campagne. Situons le curseur � l�int�rieur de la grille et cliquons sur Donn�es/Rapport de tableau crois� dynamique :

Le processus est le m�me que pour le tri � plat jusqu�� ce tableau. Avec le bouton gauche de la souris rest� appuy� d�placer le bouton SEXE dans la colonne de gauche et rel�cher. Le bouton CADRE doit �tre plac� dans la ligne du haut puis SEXE ou CADRE plac� dans la partie centrale "D�poser Donn�es Ici". Le croisement est effectu�.

S�lectionnez la partie centrale du tableau (en jaune) et faites Edition/Copier puis ouvrez le fichier "KHI2", s�il n�est pas d�j� copi� dans une feuille de la grille, et dans la premi�re cel-lule (B7) de cette grille de �� faites Edition/Coller. Le �� est imm�diatement calcul� ainsi que le seuil de probabilit� d�erreur.

On remarque que le �� est de 0,026 et le risque d�erreur est de 0,87 soit 87%, ce qui est tr�s fort. Cela signifie que si on affirme qu�il y a un lien entre les 2 variables, on a un risque de se tromper de 87%, autant dire qu�il n�y a pas de lien entre le sexe et le cadre de vie rural/urbain. L�hypoth�se �tait donc fausse.

Page 21: INITIATION Ä EXCEL POUR DÅPOUILLEMENT D'ENQUÇTEclaude.ravelet.pagesperso-orange.fr/excel.pdf · Excel est un tableur, c•est-†-dire une grille : Dans la grille, chaque rectangle

- 20 -

Exercice : Croisez Sexe et Niveau d��tudes (colonnes B et J). Les femmes sont-elles plus dipl�m�es que les hommes ?

On proc�de de la m�me mani�re pour obtenir le tableau ci-dessus. Le �� est de 6,54 avec un risque d�erreur de 0,16 (16%). Il n�y a pas de lien entre les 2 variables. Pour qu�il y ait un lien, il faut que le seuil d�erreur soit inf�rieur � 10%.

Croisons maintenant Age et Revenus. M�me cheminement :

Attention, il faut utiliser ici la grille KHI2_yates car il y a des 4 et des 5 dans le tableau. Le �� est de 156,53 avec un risque d�erreur de 3,89E-29 c�est-�-dire 29 z�ros avant la virgule, soit en pourcentage 0,00000000000000000000000000389%, autant dire nul. On peut donc dire avec certitude qu�il y a un lien entre l��ge et le revenu. Quand il y a un lien, on doit se r�f�rer � la table des signes (sinon on l�ignore) pour voir le sens du lien. On rep�re les + dans la table: les jeunes ont moins de revenus et c�est dans la cat�gorie 41-60 ans qu�on gagne le plus.

Page 22: INITIATION Ä EXCEL POUR DÅPOUILLEMENT D'ENQUÇTEclaude.ravelet.pagesperso-orange.fr/excel.pdf · Excel est un tableur, c•est-†-dire une grille : Dans la grille, chaque rectangle

- 21 -

Croisons pour terminer la CSP avec le revenu pour v�rifier l�hypoth�se �vidente qu�on gagne diff�remment selon les m�tiers. On effectue donc un tableau crois� entre CSP_bis et REVENU :

On voit qu�il y a des cellules vides (donc = 0). Or il n�est pas possible de calculer un �� avec des cellules vides (en effet diviser par 0 donne l�infini, donc on aurai ��=�, ce qui n�a aucun sens). Il faut donc r�duire le tableau en regroupant les CSP. D�signons par "agro,artisan,patron" les cat�gories 1, 2 & 3 ; "prof. inter." la 4 ; "employ�,ouvrier" les 5 & 6 ; "retrait�" la 7 et "inactif" la 8. Ins�rons une nouvelle colonne CSP_ter o� nous ferons un regroupement en ces 5 cat�gories (en effet la grille KHI2 ne comporte que 5 lignes et 5 colon-nes). Nous entrons la formule :=SI(L2="";"";SI(L2="NR";"NR";SI(L2<4;"agro,artisan,patron";SI(L2<5;"prof. inter.";SI(L2<7;"employ�,ouvrier";SI(L2<8;"retrait�";"inactif)))))) selon les m�mes principes qu�expliqu� plus haut.

On voit que cela ne marche pas, tout le monde est "inactif". Il y a dons une erreur quelque part. En effet, dans la colonne L il y a, non pas des nombres, mais des formules (GAUCHE) qui prennent le caract�re de gauche. Ce sont des caract�res et non des nombres. Il faut donc remplacer L2<4 par L2<"4" (c�est le caract�re "4" et non le nombre) et ainsi de suite dans la formule.=SI(L2="";"";SI(L2="NR";"NR";SI(L2<"4";"agro,artisan,patron";SI(L2<"5";"prof.inter.";SI(L2<"7";"employ�,ouvrier";SI(L2<"8";"retrait�";"inactif)))))) ; dans la table ASCII les nombres comme les lettres sont class�s dans leur ordre naturel, on peut donc dire que "1"<"2" et que "a"<"b".

Page 23: INITIATION Ä EXCEL POUR DÅPOUILLEMENT D'ENQUÇTEclaude.ravelet.pagesperso-orange.fr/excel.pdf · Excel est un tableur, c•est-†-dire une grille : Dans la grille, chaque rectangle

- 22 -

L�, cela fonctionne. Reste � faire le tri crois� (ci-dessus). Un nouveau probl�me se pose : il y a des 1 et 2 dans le tableau, ce qui interdit un ��. Il faut donc regrouper aussi les revenus. Ici, ci-dessus, un regroupement manuel, mais on aurait aussi pu ins�rer une nouvelle colonne REVENU_bis et classer en 2 cat�gories : "moins de 1500 �" (1 + 2) et "plus de 1500 �" (3 + 4). Ici le regroupement manuel est plus rapide.

Reste � Copier/Coller dans la grille KHI2. La probabilit� d�erreur est de 8,44E-16 soit :0,0000000000000844% quasi nulle. Il y a donc un lien tr�s fort entre la profession et le reve-nu. La table des signes nous indique que les cat�gories 1, 2, 3, 4, 5 & 6 gagnent en comparai-son mieux que les 7 & 8.