Click here to load reader
View
212
Download
0
Embed Size (px)
Bernard ESPINASSE - Rappels sur les fichiers 1
Rappels sur les fichiers
Bernard ESPINASSE Professeur Aix-Marseille Universit (AMU)
Ecole Polytechnique Universitaire de Marseille
Janvier 2018
1. Gnralits sur les mmoires
2. Gnralits sur les fichiers
3. Types dorganisations de fichiers
4. Exemple dorganisations indexes
Bernard ESPINASSE - Rappels sur les fichiers 2
Plan 1. Gnralits sur les mmoires
Performance est cot des mmoires Stockage sur Disque Dur
2. Gnralits sur les fichiers : Notion de fichier, oprations sur les fichiers, utilisation et activit d'un
fichier Mthodes d'accs : squentielles et slectives
3. Types dorganisations de fichiers : Organisations et mthode daccs Organisations relative, alatoire et indexe
4. Exemple dorganisations indexes : I3 ISAM VSAM
Bernard ESPINASSE - Rappels sur les fichiers 3
1. Gnralits sur les mmoires Performance est cot des mmoires Stockage sur Disque Dur Stockage sur Disque Dur versus sur RAM Fonctionnement dun Disque Dur
Bernard ESPINASSE - Rappels sur les fichiers 4
Performance et cot des mmoires
La Mmoire cache plus rapide et plus onreuse que
La RAM est plus rapide et plus onreuse que...
Le Disque Dur est plus rapide et plus onreux que...
Le CD (ou DVD) est plus rapide et plus onreux que...
La Bande magntique est plus rapide et plus onreuse que ...
Le Papier est plus rapide et plus onreuse que ...
=> Tenir compte de ce qui est disponible et ncessaire en fonction de son usage
Bernard ESPINASSE - Rappels sur les fichiers 5
Stockage sur disque dur
En gnral, les SGBD sauvegardent les donnes sur les Disques Durs (DD)
Les DD imposent certaines caractristiques la conception des SGBD :
Lecture : transfert les donnes depuis le DD vers la mmoire principale (RAM)
Ecriture : transfert les donnes de la RAM vers le DD
Ces oprations ont un cot important
=> ncessitent une planification attentive
Bernard ESPINASSE - Rappels sur les fichiers 6
Stockage sur Disque Dur versus sur RAM
Le cot du stockage sur RAM reste en gnral trs lev :
En 2003, pour 1000$, DELL vend 3Go RAM ou un DD de 800 Go,
En 2010, pour 150$, DELL vend 8Go de RAM ou bien un DD de 1,5To !
La RAM est volatile : problme de persistance
Hirarchie typique des solutions de stockage :
1. RAM pour les donnes exploites l'instant t
2. DD pour le stockage des BD
3. DD voire Bandes pour l'archivage
Bernard ESPINASSE - Rappels sur les fichiers 7
Disques Durs (1)
Mmoire non adressable directement par instructions du processeur central
Adressage par des instructions d'entre-sortie (ES) spcialise
Avantage principal sur les Bandes (offline : intervention humaine): accs alatoire au lieu dun accs squentiel
Les donnes sont stockes et rcupres dans une unit de bloc disque : contient plusieurs disques magntiques fixs un axe rotatif
1956 : premier DD (IBM): 1200 tours/minute
2013 : vitesse maximale : 15000 tours/minute
Bernard ESPINASSE - Rappels sur les fichiers 8
Disques Durs (2) Les disques sont diviss en pistes (tracks) concentriques,
chacune dune capacit de quelques dizaines K octets, dfinissant des cylindres
Une piste est divise en secteurs Les donnes sont lues/crites par les ttes par bloc ou page, lue en
une entre-sortie (ES) Le temps de rcupration de donnes sur un bloc disque dpend
de la localisation sur le disque (contrairement la RAM)
Exemple :
capacit disque : 100 Tera octets ; piste (concentrique, ex. : n piste, n = 512) temps d'accs : 10 milli-secondes, soit 20.000 fois temps accs RAM
Bernard ESPINASSE - Rappels sur les fichiers 9
Disques Durs (3)
!"#$#%&'(&)*!"#$%&'$()*+,-*./!"+,W
;((A.$B$7/,$D*+,$-2.67,$>[email protected]
Bernard ESPINASSE - Rappels sur les fichiers 10
Disques Durs (4) Accs un bloc (page ou ES) : Temps pour slectionner le bon cylindre par un mouvement de
translation du bras : Seek time qq milli dizaine de milli sec. Temps de rotation du disque pour le bon secteur (rotation de 4200
15000 tours/minute) : Rotation time (temps de latence) qq milli sec. Transfert des donnes : Transfert time En gnral :
Seek time > Rotation time > Transfert time le temps que prend un accs un secteur d'un disque, la CPU peut
effectuer des centaines de milliers d'instructions pour Facteur pour diminuer les cots d'ES : rduire les temps de recherche
(fichiers sur un mme cylindre, )
Bernard ESPINASSE - Rappels sur les fichiers 11
Exemple de DD Description Cheetah X15 36LP Cheetah 10K.6
Model Number
Form Factor (width)
Height
Width
Weight
ST336732L
C 3.5 inch
25.4 mm
101.6 mm
0.68 Kg
ST3146807L
C 3.5 inch
25.4 mm
101.6 mm
0.73 Kg
Capacity/Interface Formatted Capacity
Interface Type
36.7 Gbytes
80-pin
146.8 Gbytes
80-pin
Configuration Number of disks (physical)
Number of heads (physical) Number of Cylinders Bytes per Sector
Areal Density Track Density Recording Density
4
8 18,479 512
N/A N/A N/A
4
8
49,854
512
36,000 Mbits/sq.inch
64,000 Tracks/inch
570,000 bits/inch
Bernard ESPINASSE - Rappels sur les fichiers 12
Exemple de DD (suite)
Description Cheetah X15 36LP Cheetah 10K.6
Performance Transfer Rates Internal Transfer Rate (min) Internal Transfer Rate (max) Formatted Int. Transfer Rate (min)
Formatted Int. Transfer Rate (max) External I/O Transfer Rate (max)
522 Mbits/sec 709 Mbits/sec 51 MBytes/sec
69 MBytes/sec 320 MBytes/sec
475 Mbits/sec 840 Mbits/sec 43 MBytes/sec
78 MBytes/sec 320 MBytes/sec
Seek Times Avg. Seek Time (Read) Avg. Seek Time (Write)
Track-to-track Seek, Read Track-to-track Seek, Write Average Latency
3.6 msec (typical) 4.2 msec (typical)
0.5 msec (typical) 0.8 msec (typical) 2 msec
4.7 msec (typical) 5.2 msec (typical)
0.3 msec (typical) 0.5 msec (typical) 2.99 msec
Other Default Buffer (cache) size Spindle Speed
8,192 Kbytes
15K rpm
8,000 Kbytes
10K rpm
Bernard ESPINASSE - Rappels sur les fichiers 13
2. Gnralits sur les fichiers Mmoire secondaire, indpendance programme - mmoire secondaire Notion de fichier, oprations sur les fichiers, utilisation et activit d'un fichier Exploitation dun fichier : fonction de base et fonctions dexploitation Mthodes d'accs : squentielles et slectives
Bernard ESPINASSE - Rappels sur les fichiers 14
Indpendance Programme/Mmoire secondaire Les mmoires secondaires doivent tre utilises par plusieurs programmes
d'applications Pouvoir partager l'espace mmoire secondaire entre les donnes des
diffrents programmes Les programmes indpendants de l'emplacement des donnes sur disque Possibilit de changer les donnes de mmoires secondaires sans
changer les programmes. => Les programmes d'application ne peuvent assurer la gestion de cet
espace et adresses associes
Pour raliser cette indpendance, on introduit un objet intermdiaire :
Le Fichier Programme / Fichier / Mmoire secondaire
Bernard ESPINASSE - Rappels sur les fichiers 15
Dfinitions Fichiers : rcipient d'informations constituant une mmoire secondaire idale,
caractrise par un nom. Article/record/enregistrement :
- lment composant un fichier, est compos d'un ensemble de donnes. - unit de traitement pour les programmes : un programme traite, lit, crit des portions
successives de fichier (ex : un client, un compte,...), Organisation de fichier : ensemble des liaisons entre articles pour composer un
fichier. Mthodes d'accs : mthode d'exploitation du fichier utilise par les programmes
pour slectionner des articles. Cl d'article (primaire, secondaire) : donne identificatrice d'un article,
permet de slectionner un article unique dans un fichier. Langage hte : langage de programmation accueillant les verbes de manipulations
de fichier et la dfinition des donnes des fichiers. Ex : Pascal, Open, Reset, Close, Write, ...
Bernard ESPINASSE - Rappels sur les fichiers 16
Fichier
article
fichier
compose de
programme mmoire secondaire
unit detraitement
compos de
donnes cls
ETUDIANT (N, nom, prnom, adresse , rsultats,...)
fichier
cl primaire
article
donnes
indpendance
Bernard ESPINASSE - Rappels sur les fichiers 17
Oprations sur les fichiers Sur tous les articles : - cration, - destruction, - tri (selon un ou plusieurs critres) - runion :
F1 F2 F3
R
- clatement :
F1 F2 F3
F
Sur 1 ou quelques articles : - consultation d'un article, - ajout d'un article, - suppression d'un article, - mise jour d'un article.
Bernard ESPINASSE - Rappels sur les fichiers 18
Oprations lmentaires sur un fichier OPEN : Prpare le fichier des oprations de lecture ou criture, fixe un
pointeur sur le dbut du fichier, allocation de mmoires tampons pour stocker les pages
FIND : Cherche le premier enregistrement qui satisfait la condition de recherche FINDNEXT : Cherche