Upload
others
View
9
Download
0
Embed Size (px)
Citation preview
Chapitre 2LES TABLEAUX CROISESSIMPLES ET AVANCES
PROC FREQ – PROC TABULATE
M. WILTHIEN - Applications SAS - 2021 Semestre 1 - Master 2 TIDE Université Paris 1 Panthéon Sorbonne
1
Sommaire
2M. WILTHIEN - Applications SAS – 2021 Semestre 1 - Master 2 TIDE
Université Paris 1 Panthéon Sorbonne
3M. WILTHIEN - Applications SAS - 2021 Semestre 1 - Master 2 TIDE
Université Paris 1 Panthéon Sorbonne
I – Les tableaux croisés simples- La PROC FREQ
Sommaire
I – Les tableaux croisés simples- La PROC FREQ
➢ 1- La syntaxe
PROC FREQ < options > ;
BY variables ;
TABLES définition des tables à construire
< / options > < OUT=SAS-data-SET > ;
WEIGHT variable ;
RUN;
4M. WILTHIEN - Applications SAS - 2021 Semestre 1 - Master 2 TIDE
Université Paris 1 Panthéon Sorbonne
I – Les tableaux croisés simples- La PROC FREQ
➢ 2- Les options
DATA= Spécifie la table SAS à utiliser.
COMPRESS Force SAS à mettre ces différents tableaux sur une seule page.
FORMCHAR= Spécifie les caractères à utiliser pour définir les cases des tableaux.
NOPRINT Demande à ce qu’il n’y ait pas d’impression dans la fenêtre SORTIE.
ORDER= Spécifie l’ordre dans lequel doivent apparaître les modalités :
ORDER=DATA Demande à SAS de produire des tableaux dans lesquels les modalités apparaîtront dans l’ordre dans lequel elles apparaissent dans la table.
ORDER=FORMATTED Ordonne les données en fonction des FORMAT.
ORDER=FREQ Ordonne les modalités en ordre décroissant de leur fréquence.
ORDER=INTERNAL Valeur par défaut : les modalités des variables numériques sont présentées dans un ordre croissant (ordre alphabétique pour les variables alphanumériques).
PAGE Produit un tableau par page.
5M. WILTHIEN - Applications SAS - 2021 Semestre 1 - Master 2 TIDE
Université Paris 1 Panthéon Sorbonne
I – Les tableaux croisés simples- La PROC FREQ
• Exemples : Les tableaux de fréquences simples ou complexes
- Exemple 3.0 : Importer le fichier cinema.csv
- Exemple 3.1 : Sans option ni instruction (hormis l’option data)
- Exemple 3.2 : Sur une seule variable (sexe)
- Exemple 3.3 : Sur un seul croisement (sexe et type)
Ajouter des formats suivants sur les variables Age, cinema et sexe
- Exemple 3.4 : Tableau de fréquences pour les variables age, cinema et sexe.
- Exemple 3.5 : Fréquences des croisements suivants : age et sexe, age et cinema, age et type (trois tableaux différents) Pour cela utiliser les signes : () et/ou *
6M. WILTHIEN - Applications SAS - 2021 Semestre 1 - Master 2 TIDE
Université Paris 1 Panthéon Sorbonne
I – Les tableaux croisés simples- La PROC FREQ
• Exemples : Les options tableaux de fréquences
- Exemple 3.6 : A l’aide des options correspondantes, retirer les pourcentages colonnes, les pourcentages lignes et les pourcentages indiquant la part dans la population totale, et afficher les fréquences du croisement age et sexe.
A quoi sert l’option NOFREQ ? A quoi sert l’option NOCUM ?
- Exemple 3.7 : A l’aide d’une instruction spécifique, calculer les fréquences du croisement age et cinema, pour les différentes sous-populations de la variable sexe (2 tableaux différents).
- Exemple 3.8 : Sans trier la table au préalable, obtenez le même résultat.
Que remarquez vous ?
- Exemple 3.9 : Creér une table temporaire contenant des valeurs manquantes, que remarquez vous si vous analyser le croisement age*cinema ? Utiliser l’option MISSING dans l’instruction TABLES pour traiter les valeurs manquantes comme des modalités.
7M. WILTHIEN - Applications SAS - 2021 Semestre 1 - Master 2 TIDE
Université Paris 1 Panthéon Sorbonne
I – Les tableaux croisés simples- La PROC FREQ
• Exemples : Les sorties SAS des tableaux de fréquences et les filtres sur les données
- Exemple 3.10 : A l’aide de l’option OUT= dans l’instruction TABLES, envoyer dans une table SAS le résultat du croisement des variables age et cinema.
Résultat attendu :
- Exemple 3.11 : Dans une même procédure, générer 2 tables de sorties, une pour le croisement type et sexe, et une pour le croisement type et age.
- Exemple 3.12 : A l’aide d’une instruction spécifique, analyser le croisement type*cinema uniquement pour les femmes de moins de 50 ans.
8M. WILTHIEN - Applications SAS - 2021 Semestre 1 - Master 2 TIDE
Université Paris 1 Panthéon Sorbonne
I – Les tableaux croisés simples- La PROC FREQ• Exemples : Les graphiques
- Exemple 3.13 : Créer un graphique pour l’age et un graphique pour le cinéma dans une seule procédure, représentant les fréquence d’apparition des modalités
- Exemple 3.14 : Créer un graphique pour le croisement age*cinema
9M. WILTHIEN - Applications SAS - 2021 Semestre 1 - Master 2 TIDE
Université Paris 1 Panthéon Sorbonne
10M. WILTHIEN - Applications SAS - 2021 Semestre 1 - Master 2 TIDE
Université Paris 1 Panthéon Sorbonne
II – Les tableaux croisés avancés - PROC TABULATE
Sommaire
II – Les tableaux croisés avancés - PROC TABULATE
11M. WILTHIEN - Applications SAS - 2021 Semestre 1 - Master 2 TIDE
Université Paris 1 Panthéon Sorbonne
➢ 1- La syntaxe
PROC TABULATE < liste-option > ;
CLASS liste des variables de classification ;
VAR liste des variables analysées ;
TABLE <<expression-page, > expression-ligne, > expression-colonne < /
liste-option-table >;
BY variables ;
FREQ variable ;
KEYLABEL mot-clé-1='description-1' < ...mot-clé-n='description-n' > ;
WEIGHT variable;
RUN ;
II – Les tableaux croisés avancés - PROC TABULATE
12M. WILTHIEN - Applications SAS - 2021 Semestre 1 - Master 2 TIDE
Université Paris 1 Panthéon Sorbonne
• Les options
DATA=table-SAS Spécifie la table utilisée. Si DATA= est omis, SAS utilise la dernière table créée.
FORMAT=w.d Spécifie la largeur des cellules et le nombre de décimales. Si FORMAT= est omis, FORMAT=BEST12.2
MISSING Cette option permet de maintenir dans le tableau l’observation dont la modalité d’une variable de classification est manquante. Une ligne ou une colonne MISSING sera ajoutée.
ORDER=ordre Spécifie l’ordre d’affichage des en-têtes lignes ou colonnes pour les modalités des variables de CLASS.
ORDER=DATA Ordre d’apparition dans les données
ORDER=FORMATTED Ordre selon les FORMAT
ORDER=FREQ Ordre par fréquences décroissantes
ORDER=INTERNAL Ordre selon les valeurs internes (défaut)
II – Les tableaux croisés avancés - PROC TABULATE
13M. WILTHIEN - Applications SAS - 2021 Semestre 1 - Master 2 TIDE
Université Paris 1 Panthéon Sorbonne
• Les statistiques générées
CSS
CV
MAX
MEAN
MIN
N
NMISS
PCTN
PCTSUMPRT RANGE STD STDERR SUM SUMWGT USST VAR Variance
II – Les tableaux croisés avancés - PROC TABULATE
14M. WILTHIEN - Applications SAS - 2021 Semestre 1 - Master 2 TIDE
Université Paris 1 Panthéon Sorbonne
➢ 3- Les structures lignes-colonnes des tableaux(travail sur la table VENTES, à la quelle on va ajouter des formats avant toute manipulation)
- Exemple 4.1.0 : Importer la table VENTES et créer les 4 formats suivants :
- Exemple 4.1.1 : Tableau simple pour la variable region (instructions CLASS et TABLE obligatoires)
- Exemple 4.1.2 : Tableau simple pour la variable region et la variable produit (plusieurs variables en colonnes)
- Exemple 4.1.3 : Tableau croisé pour région et produit (instruction TABLE à modifier)
- Exemple 4.1.4 : Ajouter le croisement taille et produit à la sortie précédente (nouvelles lignes sous les régions)
- Exemple 4.1.5 : Ajouter les croisement des variable région et produit avec la variable client (nouvelles colonnes à côté des produits)
- Exemple 4.1.6 : Pour chaque modalité de la variable REGION, nous souhaitons avoir les différentes modalités de TAILLE, le tout croisé avec le Produit.
II – Les tableaux croisés avancés - PROC TABULATE
15M. WILTHIEN - Applications SAS - 2021 Semestre 1 - Master 2 TIDE
Université Paris 1 Panthéon Sorbonne
➢ 4- Les variables d’analyse
- Exemple 4.2.1 : Utiliser l’instruction VAR pour définir l’analyse sur les ventes (nombre d’unités de biens vendus) et le chiffre d’affaires, avec une classification par produit.
- Exemple 4.2.2 : Enrichir ce tableau avec une seconde variable de classification CLIENT
- Exemple 4.2.3 : Imbriquer les variables de sorte à obtenir le tableau suivant :
II – Les tableaux croisés avancés - PROC TABULATE
16M. WILTHIEN - Applications SAS - 2021 Semestre 1 - Master 2 TIDE
Université Paris 1 Panthéon Sorbonne
- Exemple 4.2.4 : Créer un tableau dans lequel : les produits sont présentés en lignes
et les clients sont présentés en colonnes.
À l’intérieur du tableau, la somme des ventes est indiquée.
- Exemple 4.2.5 : Créer le tableau suivant :
- Exemple 4.2.6 : Créer le tableau final suivant ----------------------> :
II – Les tableaux croisés avancés - PROC TABULATE
17M. WILTHIEN - Applications SAS - 2021 Semestre 1 - Master 2 TIDE
Université Paris 1 Panthéon Sorbonne
➢ 5- Choix de la statistique éditée dans le tableau
- Exemple 4.3.1 : Editer statistiques MIN, MEAN et MAX pour la variable VENTES pour le croisement de la région par client.
- Exemple 4.3.2 : Sur le même modèle, éditer les statistiques SUM et MEAN pour les ventes. Comment faire apparaitre le résultat avec 2 décimales pour la somme et la moyenne
- Exemple 4.3.3 : Comment obtenir le tableau suivant :
II – Les tableaux croisés avancés - PROC TABULATE
18M. WILTHIEN - Applications SAS - 2021 Semestre 1 - Master 2 TIDE
Université Paris 1 Panthéon Sorbonne
➢ 6- L’introduction de récapitulatif dans le tableau
Partons de ce tableau :
PROC TABULATE DATA=ventes F=7.;
CLASS region taille produit;
VAR vente ca;
TABLE region*taille, produit*(ca vente);
RUN;
A l’aide du mot ALL :
- Exemple 4.4.1 : Ajouter le total global en bas du tableau.
- Exemple 4.4.2 : Ajouter les sous totaux pour les modalités de région et taille
II – Les tableaux croisés avancés - PROC TABULATE
19M. WILTHIEN - Applications SAS - 2021 Semestre 1 - Master 2 TIDE
Université Paris 1 Panthéon Sorbonne
➢ 7- L’introduction de pourcentage dans les tableaux
Options : PCTSUM, REPPCTSUM (pourcentage cellule), COLPCTSUM (pourcentage colonne), ROWPCTSUM (pourcentage ligne)
- Exemple 4.5.1 : A partir du tableau simple suivant, ajouter le pourcentage que représentent les ventes par région et toutes régions confondues.
II – Les tableaux croisés avancés - PROC TABULATE
20M. WILTHIEN - Applications SAS - 2021 Semestre 1 - Master 2 TIDE
Université Paris 1 Panthéon Sorbonne
A partir du tableau simple suivant :
- Exemple 4.5.2 : Ajouter les pourcentages lignes (somme en lignes égale à 100)
- Exemple 4.5.3 : Ajouter les pourcentages calculés sur le tableau (pourcentage cellule)
- Autres options : REPPCTN, COLPCTN, ROWPCTN et PAGEPCTN
21M. WILTHIEN - Applications SAS - 2021 Semestre 1 - Master 2 TIDE
Université Paris 1 Panthéon Sorbonne
III - EXERCICES
V – Les exercices
22
• EXERCICE 1 : Tableaux croisés simples
A l’aide d’une seule procédure, créer les 3 sorties suivantes pour la table COLOR
2 sorties HTML : 1 table SAS :
V – Les exercices
23
• EXERCICE 2 : Graphiques dans les tableaux croisés simples
En plus de l’exercice précédent, ajouter les graphiques suivants à votre procédure.
V – Les exercices
24M. WILTHIEN - Applications SAS - 2021 Semestre 1 - Master 2 TIDE
Université Paris 1 Panthéon Sorbonne
• EXERCICE 3 : Tableaux croisés avancés
A l’aide de la PROC TABULATE, générer le tableau suivant à partir de la table ENERGY :
V – Les exercices
25M. WILTHIEN - Applications SAS - 2021 Semestre 1 - Master 2 TIDE
Université Paris 1 Panthéon Sorbonne
• EXERCICE 4 : Tableaux croisés avancés
Générer le tableau suivant :
Bonus: Renommer les colonnes pour avoir le tableau suivant :