26
CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / [email protected] http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/ CREPUQ - Sous-groupe de travail sur les fichiers de données numériques Les données numériques: Atelier d’information et de démystification EXTRACTION & UTILISATION DES DONNÉES Anastassia Khouri Service de données & resources électroniques Université McGill http://www.library. mcgill .ca/ edrs /

CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / [email protected]

Embed Size (px)

Citation preview

Page 1: CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / khouri@lib1.lan.mcgill.ca

CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / [email protected] http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/1

CREPUQ - Sous-groupe de travail sur les fichiers de données numériques

Les données numériques: Atelier d’information et de démystification

EXTRACTION & UTILISATION DES DONNÉES

Anastassia KhouriService de données & resources électroniques

Université McGill

http://www.library.mcgill.ca/edrs/

Page 2: CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / khouri@lib1.lan.mcgill.ca

CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / [email protected] http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/2

EXTRACTION & UTILISATION DES DONNÉES

1. Introduction

2. Processus d’extraction et utilisation

3. Rôle de la documentation

4. Pré-extraction et Extraction

5. Utilisation

6. Conclusion

Page 3: CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / khouri@lib1.lan.mcgill.ca

CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / [email protected] http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/3

PROCESSUS D’EXTRACTION &

UTILISATION DES DONNÉES

IDENTIFICATION

ACCÈS

CONSULTATION

EXTRACTION TESTING

ANALYSE

ARCHIVAGE RAPPORT

Page 4: CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / khouri@lib1.lan.mcgill.ca

CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / [email protected] http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/4

IDENTIFICATION PROCESSUS D’EXTRACTION & UTILISATION DES DONNÉES

Identification des besoins

Identification des données

& Documentaion

Données brutes à organiser

Données Pré - organisées

Information& documentation

connexe

Guide d’utilisation(Code book)

Page 5: CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / khouri@lib1.lan.mcgill.ca

CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / [email protected] http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/5

ROLE DE LA DOCUMENTATIONIMPRIMÉE - ÉLECTRONIQUE (Suite) Complémentarité

Similarité et duplication

Exhaustivité

Disponibilité

Accessibilité

Page 6: CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / khouri@lib1.lan.mcgill.ca

CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / [email protected] http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/6

ROLE DE LA DOCUMENTATIONIMPRIMÉE vs ÉLECTRONIQUE (Suite)

Format unique

Format double Politique d’accès Politique de disponibilité / prêt

Page 7: CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / khouri@lib1.lan.mcgill.ca

CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / [email protected] http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/7

ROLE DE LA DOCUMENTATIONCONNEXE ET PÉRIPHÉRIQUE (Suite)

Facilite la recherche en général Piste de recherche préliminaire Source d’information spécifique sur:

Localisation Type Source Discipline, etc

Page 8: CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / khouri@lib1.lan.mcgill.ca

CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / [email protected] http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/8

ROLE DE LA DOCUMENTATION SPÉCIFIQUE - GUIDE “Code Book”

(Suite)

Clef de lecture, de compréhension et d’utilisation d’un fichier de données

Description des éléments et du contenu du fichier

Source d’information exclusive et exhaustive sur le fichier

Source d’information générale, spécifique et complémentaire

Page 9: CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / khouri@lib1.lan.mcgill.ca

CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / [email protected] http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/9

PRÉ - EXTRACTION (Données brutes)

Source d’information à extraire du guide ( Code book)

1. Structure des données

2. Variables indentifiées & choisies

3. Information supplémentaire

4. Etiquette d’identification

5. Eléments marginaux de base pour les tests

Page 10: CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / khouri@lib1.lan.mcgill.ca

CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / [email protected] http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/10

PRÉ - EXTRACTION (Données brutes)

Source d’information à extraire du guide ( Code book)(Suite)

1. Structures des données Structure rectangulaire (cliché d’enregistrement logique) Structure “Card image” (cliché d’enregistrement multiple) Structure hiérarchique Structure relationelle

Page 11: CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / khouri@lib1.lan.mcgill.ca

CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / [email protected] http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/11

2. Variables identifiées & choisies Localisation (colonne) Type (alpha / numérique) Formatage (decimal / vide “blank”)

3. Information supplémentaire Identification spécifique Poids

PRÉ - EXTRACTION (Données brutes) Source d’information à extraire du guide ( Code book)

(Suite)

Page 12: CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / khouri@lib1.lan.mcgill.ca

CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / [email protected] http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/12

4. Etiquettes d’identification

Etiquette de chaque variable Valeur individuelle d’extraction

5. Eléments marginaux de base pour les tests

PRÉ - EXTRACTION (Données brutes)Source d’information à extraire du guide ( Code book)

(Suite)

Page 13: CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / khouri@lib1.lan.mcgill.ca

CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / [email protected] http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/13

1. Choix de l’outil en fonction du type d’analyse à effectuer

Extraction seulement Extraction et analyse Extraction, analyse et rapport

PRÉ - EXTRACTION (Données brutes)

Outils d’extraction & éléments de transfert

Page 14: CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / khouri@lib1.lan.mcgill.ca

CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / [email protected] http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/14

2. Stratégies de transfert des données Commande d’archivage de chaque

“record” Commande de lecture Commande de sauvegarge Commande d’intégration des

différents niveaux de données Commande de compression, etc

PRÉ - EXTRACTION (Données brutes) Outils d’extraction & éléments de transfert

(Suite)

Page 15: CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / khouri@lib1.lan.mcgill.ca

CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / [email protected] http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/15

Exemple: Programme d’extraction SAS

Page 16: CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / khouri@lib1.lan.mcgill.ca

CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / [email protected] http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/16

Exemple: Programme d’extraction SAS (Suite)

Page 17: CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / khouri@lib1.lan.mcgill.ca

CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / [email protected] http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/17

Exemple: Programme d’extraction SAS (Suite)

Page 18: CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / khouri@lib1.lan.mcgill.ca

CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / [email protected] http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/18

Exemple: Programme d’extraction SAS (Suite)

Page 19: CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / khouri@lib1.lan.mcgill.ca

CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / [email protected] http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/19

OUTILS D’ANALYSE

Les “plateformes” Gros ordinateur (Mainframe) PC / réseaux Macintosh Unix

Logiciels SAS SPSS STATA, etc

Tableurs électroniques Lotus Excel, etc.

Page 20: CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / khouri@lib1.lan.mcgill.ca

CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / [email protected] http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/20

PROGRAMMATION, TEST & EXTRACTIONPARTENAIRES

Programmeur

Assistant de recherche Etudiant / Professeur / Chercheur Autre

Page 21: CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / khouri@lib1.lan.mcgill.ca

CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / [email protected] http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/21

UTILISATION

Utilisation multiple Utilisation diversifiée Utilisation illimitée

Page 22: CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / khouri@lib1.lan.mcgill.ca

CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / [email protected] http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/22

DONNÉES PRÉ-ORGANISÉES PROCESSUS D’EXTRACTION & UTILISATION DES DONNÉES

Données Pré-organisées

Imprimés

•Internet•CD•Disk

Copier Données•qq variables•Tableau

Papier

Analyse Utilisation

•Rapport imprimés•V. éléctronique•Archivage

Tableur éléctronique

Accès Extraction

•Tableaux•Graphiques

Rapport imprimé

Page 23: CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / khouri@lib1.lan.mcgill.ca

CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / [email protected] http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/23

DONNÉES PRÉ-ORGANISÉESPROCESSUS D’EXTRACTION & UTILISATION DES DONNÉES

Données Pré-organisées

Accès

•Internet•CD•Disk

Extraction

Différents formats

Différentes méthodes

Analyse Utilisation

•Rapport imprimés•V. éléctronique•Archivage

Tableur éléctronique

Page 24: CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / khouri@lib1.lan.mcgill.ca

CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / [email protected] http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/24

DONNEÉS BRUTES PROCESSUS D’EXTRACTION & UTILISATION DES DONNÉES

Données brutes à organiser

Methodologie d’extraction

Logiciels d’extraction Programmation

Extraction

Transfert des donnéesArchivage

Analyse des données

Rapport

Page 25: CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / khouri@lib1.lan.mcgill.ca

CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / [email protected] http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/25

UTILISATIONExemples

Ferret - Census USA http://ferret.bls.census.gov/egi-bin/ferret/

Cansim - Université de Toronto http://datacentre.chass.utoronto.ca:5680/cansim/cansim.html UNESCO - Stathttp://unescostat.unesco.org/

FAO - Stat http://apps.fao.org/

Page 26: CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / khouri@lib1.lan.mcgill.ca

CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / [email protected] http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/26

CONCLUSION

La compréhension du processus de recherche, de

programmation, d’extraction, d’analyse et d’utilisation sont les éléments préliminaires de base d’un Service de données