Click here to load reader

Rappels sur les fichiers - · PDF fileBernard ESPINASSE - Rappels sur les fichiers 5 Stockage sur disque dur • En général, les SGBD sauvegardent les données sur les Disques

  • View
    212

  • Download
    0

Embed Size (px)

Text of Rappels sur les fichiers - · PDF fileBernard ESPINASSE - Rappels sur les fichiers 5 Stockage...

  • Bernard ESPINASSE - Rappels sur les fichiers 1

    Rappels sur les fichiers

    Bernard ESPINASSE Professeur Aix-Marseille Universit (AMU)

    Ecole Polytechnique Universitaire de Marseille

    Janvier 2018

    1. Gnralits sur les mmoires

    2. Gnralits sur les fichiers

    3. Types dorganisations de fichiers

    4. Exemple dorganisations indexes

    Bernard ESPINASSE - Rappels sur les fichiers 2

    Plan 1. Gnralits sur les mmoires

    Performance est cot des mmoires Stockage sur Disque Dur

    2. Gnralits sur les fichiers : Notion de fichier, oprations sur les fichiers, utilisation et activit d'un

    fichier Mthodes d'accs : squentielles et slectives

    3. Types dorganisations de fichiers : Organisations et mthode daccs Organisations relative, alatoire et indexe

    4. Exemple dorganisations indexes : I3 ISAM VSAM

    Bernard ESPINASSE - Rappels sur les fichiers 3

    1. Gnralits sur les mmoires Performance est cot des mmoires Stockage sur Disque Dur Stockage sur Disque Dur versus sur RAM Fonctionnement dun Disque Dur

    Bernard ESPINASSE - Rappels sur les fichiers 4

    Performance et cot des mmoires

    La Mmoire cache plus rapide et plus onreuse que

    La RAM est plus rapide et plus onreuse que...

    Le Disque Dur est plus rapide et plus onreux que...

    Le CD (ou DVD) est plus rapide et plus onreux que...

    La Bande magntique est plus rapide et plus onreuse que ...

    Le Papier est plus rapide et plus onreuse que ...

    => Tenir compte de ce qui est disponible et ncessaire en fonction de son usage

  • Bernard ESPINASSE - Rappels sur les fichiers 5

    Stockage sur disque dur

    En gnral, les SGBD sauvegardent les donnes sur les Disques Durs (DD)

    Les DD imposent certaines caractristiques la conception des SGBD :

    Lecture : transfert les donnes depuis le DD vers la mmoire principale (RAM)

    Ecriture : transfert les donnes de la RAM vers le DD

    Ces oprations ont un cot important

    => ncessitent une planification attentive

    Bernard ESPINASSE - Rappels sur les fichiers 6

    Stockage sur Disque Dur versus sur RAM

    Le cot du stockage sur RAM reste en gnral trs lev :

    En 2003, pour 1000$, DELL vend 3Go RAM ou un DD de 800 Go,

    En 2010, pour 150$, DELL vend 8Go de RAM ou bien un DD de 1,5To !

    La RAM est volatile : problme de persistance

    Hirarchie typique des solutions de stockage :

    1. RAM pour les donnes exploites l'instant t

    2. DD pour le stockage des BD

    3. DD voire Bandes pour l'archivage

    Bernard ESPINASSE - Rappels sur les fichiers 7

    Disques Durs (1)

    Mmoire non adressable directement par instructions du processeur central

    Adressage par des instructions d'entre-sortie (ES) spcialise

    Avantage principal sur les Bandes (offline : intervention humaine): accs alatoire au lieu dun accs squentiel

    Les donnes sont stockes et rcupres dans une unit de bloc disque : contient plusieurs disques magntiques fixs un axe rotatif

    1956 : premier DD (IBM): 1200 tours/minute

    2013 : vitesse maximale : 15000 tours/minute

    Bernard ESPINASSE - Rappels sur les fichiers 8

    Disques Durs (2) Les disques sont diviss en pistes (tracks) concentriques,

    chacune dune capacit de quelques dizaines K octets, dfinissant des cylindres

    Une piste est divise en secteurs Les donnes sont lues/crites par les ttes par bloc ou page, lue en

    une entre-sortie (ES) Le temps de rcupration de donnes sur un bloc disque dpend

    de la localisation sur le disque (contrairement la RAM)

    Exemple :

    capacit disque : 100 Tera octets ; piste (concentrique, ex. : n piste, n = 512) temps d'accs : 10 milli-secondes, soit 20.000 fois temps accs RAM

  • Bernard ESPINASSE - Rappels sur les fichiers 9

    Disques Durs (3)

    !"#$#%&'(&)*!"#$%&'$()*+,-*./!"+,W

    ;((A.$B$7/,$D*+,$-2.67,$>[email protected]

    Bernard ESPINASSE - Rappels sur les fichiers 10

    Disques Durs (4) Accs un bloc (page ou ES) : Temps pour slectionner le bon cylindre par un mouvement de

    translation du bras : Seek time qq milli dizaine de milli sec. Temps de rotation du disque pour le bon secteur (rotation de 4200

    15000 tours/minute) : Rotation time (temps de latence) qq milli sec. Transfert des donnes : Transfert time En gnral :

    Seek time > Rotation time > Transfert time le temps que prend un accs un secteur d'un disque, la CPU peut

    effectuer des centaines de milliers d'instructions pour Facteur pour diminuer les cots d'ES : rduire les temps de recherche

    (fichiers sur un mme cylindre, )

    Bernard ESPINASSE - Rappels sur les fichiers 11

    Exemple de DD Description Cheetah X15 36LP Cheetah 10K.6

    Model Number

    Form Factor (width)

    Height

    Width

    Weight

    ST336732L

    C 3.5 inch

    25.4 mm

    101.6 mm

    0.68 Kg

    ST3146807L

    C 3.5 inch

    25.4 mm

    101.6 mm

    0.73 Kg

    Capacity/Interface Formatted Capacity

    Interface Type

    36.7 Gbytes

    80-pin

    146.8 Gbytes

    80-pin

    Configuration Number of disks (physical)

    Number of heads (physical) Number of Cylinders Bytes per Sector

    Areal Density Track Density Recording Density

    4

    8 18,479 512

    N/A N/A N/A

    4

    8

    49,854

    512

    36,000 Mbits/sq.inch

    64,000 Tracks/inch

    570,000 bits/inch

    Bernard ESPINASSE - Rappels sur les fichiers 12

    Exemple de DD (suite)

    Description Cheetah X15 36LP Cheetah 10K.6

    Performance Transfer Rates Internal Transfer Rate (min) Internal Transfer Rate (max) Formatted Int. Transfer Rate (min)

    Formatted Int. Transfer Rate (max) External I/O Transfer Rate (max)

    522 Mbits/sec 709 Mbits/sec 51 MBytes/sec

    69 MBytes/sec 320 MBytes/sec

    475 Mbits/sec 840 Mbits/sec 43 MBytes/sec

    78 MBytes/sec 320 MBytes/sec

    Seek Times Avg. Seek Time (Read) Avg. Seek Time (Write)

    Track-to-track Seek, Read Track-to-track Seek, Write Average Latency

    3.6 msec (typical) 4.2 msec (typical)

    0.5 msec (typical) 0.8 msec (typical) 2 msec

    4.7 msec (typical) 5.2 msec (typical)

    0.3 msec (typical) 0.5 msec (typical) 2.99 msec

    Other Default Buffer (cache) size Spindle Speed

    8,192 Kbytes

    15K rpm

    8,000 Kbytes

    10K rpm

  • Bernard ESPINASSE - Rappels sur les fichiers 13

    2. Gnralits sur les fichiers Mmoire secondaire, indpendance programme - mmoire secondaire Notion de fichier, oprations sur les fichiers, utilisation et activit d'un fichier Exploitation dun fichier : fonction de base et fonctions dexploitation Mthodes d'accs : squentielles et slectives

    Bernard ESPINASSE - Rappels sur les fichiers 14

    Indpendance Programme/Mmoire secondaire Les mmoires secondaires doivent tre utilises par plusieurs programmes

    d'applications Pouvoir partager l'espace mmoire secondaire entre les donnes des

    diffrents programmes Les programmes indpendants de l'emplacement des donnes sur disque Possibilit de changer les donnes de mmoires secondaires sans

    changer les programmes. => Les programmes d'application ne peuvent assurer la gestion de cet

    espace et adresses associes

    Pour raliser cette indpendance, on introduit un objet intermdiaire :

    Le Fichier Programme / Fichier / Mmoire secondaire

    Bernard ESPINASSE - Rappels sur les fichiers 15

    Dfinitions Fichiers : rcipient d'informations constituant une mmoire secondaire idale,

    caractrise par un nom. Article/record/enregistrement :

    - lment composant un fichier, est compos d'un ensemble de donnes. - unit de traitement pour les programmes : un programme traite, lit, crit des portions

    successives de fichier (ex : un client, un compte,...), Organisation de fichier : ensemble des liaisons entre articles pour composer un

    fichier. Mthodes d'accs : mthode d'exploitation du fichier utilise par les programmes

    pour slectionner des articles. Cl d'article (primaire, secondaire) : donne identificatrice d'un article,

    permet de slectionner un article unique dans un fichier. Langage hte : langage de programmation accueillant les verbes de manipulations

    de fichier et la dfinition des donnes des fichiers. Ex : Pascal, Open, Reset, Close, Write, ...

    Bernard ESPINASSE - Rappels sur les fichiers 16

    Fichier

    article

    fichier

    compose de

    programme mmoire secondaire

    unit detraitement

    compos de

    donnes cls

    ETUDIANT (N, nom, prnom, adresse , rsultats,...)

    fichier

    cl primaire

    article

    donnes

    indpendance

  • Bernard ESPINASSE - Rappels sur les fichiers 17

    Oprations sur les fichiers Sur tous les articles : - cration, - destruction, - tri (selon un ou plusieurs critres) - runion :

    F1 F2 F3

    R

    - clatement :

    F1 F2 F3

    F

    Sur 1 ou quelques articles : - consultation d'un article, - ajout d'un article, - suppression d'un article, - mise jour d'un article.

    Bernard ESPINASSE - Rappels sur les fichiers 18

    Oprations lmentaires sur un fichier OPEN : Prpare le fichier des oprations de lecture ou criture, fixe un

    pointeur sur le dbut du fichier, allocation de mmoires tampons pour stocker les pages

    FIND : Cherche le premier enregistrement qui satisfait la condition de recherche FINDNEXT : Cherche

Search related