Upload
hahuong
View
212
Download
0
Embed Size (px)
Citation preview
Lescloudsoffrentdesservicesdestockagededonnéesàlademande.
Lesfournisseursdeservicesdestockagedanslecloudfacturentnonseulementlecoûtdel’espacedestockagedanslecloudmaiségalementletransfertdesdonnéesentrel’entrepriseetleclouddanslesdeuxsens,ceciparcequelestransfertsdedonnéesmonopolisentdesressourceschezlefournisseur.Plusieurstypesdeservicesdestockagepeuventêtrefournis.
AuniveauSaaS,desapplicationsdédiéesaustockagesontfournies.Enparticulier,desapplicationscommedropboxquipermettentauxutilisateursfinauxdesynchroniserdesrépertoiresdedonnéesaccédésdepuisplusieursmachines.Parexemple,l’utilisateurpeutaccéderàcesdonnéesdepuissonordinateurpersonnelousonsmartphone.OnaégalementdesapplicationsdesauvegardedeBackupdedonnéesdanslecloud.IlyaégalementdesapplicationscommeGoogleDocsquipermettentdepartagerdesdonnéesentreplusieurspersonnesdanslecadred’untravailcollaboratif.Cesapplicationspermettentalorsuneéditioncoopératived’unmêmedocumentavecdesmodificationsdechacunvisiblesentempsréelpartouslesautresmembresdugroupe.Enfinilyaégalementdesapplicationsquipermettentderendrevisiblesdesdonnéescommeparexempledesapplicationsdepartagedephotos.Lesdéveloppeursd’applicationspeuventutiliserlesapplicationsdestockagequejeviensdementionner.Eneffet,toutescesapplicationsoffrentuneinterfacedeprogrammation.
Doncdenombreuxproduitsexistent,commeentémoignentleslogosquiillustrentcetransparent.Lesservicessedifférencientpar:
- latailledel’espacedestockagegratuitfourniauxutilisateurs,- lecoûtmensueldustockageadditionnel,- lalimitemaximalesurlatailledesfichiersquipeuventêtrestockés,- lessystèmesd’exploitationsupportéssurlesPC,- lefaitquecesservicessupportentoupaslessmartphonesetletypedesupportoffertsurles
smartphones.
Lasécuritéestbienentendueunepréoccupationimportantepourlespropriétairesdesdonnées.Certainsservicesdestockageoffrentuneprotectiondesfichiersparmotdepasse,et/ouunchiffrementdesdonnées.
VoyonsmaintenantlesservicesdestockagededonnéesoffertsparlescloudsIaaSinfrastructure.Auniveauinfrastructure,deuxtypesdedonnéessontàconsidérer:
- d’unepartlesimagesdemachinevirtuelle,- d’autrepart,lesdonnéesdesutilisateursquisontmanipuléesparlesmachinesvirtuelles.
Dupointdevuedel’espacedestockage,chaqueserveurdecalculdansleDataCenterdisposed’undisquelocal.Lestockagesurlesdisqueslocauxdesserveursestunstockageéphémèreparnature.Ilestdisponibleletempsdel’exécutiondelamachinevirtuelle.Enoutre,lefournisseurdecloudd’infrastructuresgèredesserveursquisontdédiésaustockagedesdonnéespourcettefois-cidustockagedelonguedurée.Lesdisquesvirtuelsdesmachinesvirtuellespeuventêtrestockéssoitsurlesdisqueslocauxdesserveursdecalcul,soitdansl’espacedestockagepartagé.
Plusieurstypesdestockagededonnéespersistantesexistent,lessystèmesdestockaged’objetsetlespériphériquesdestockagedeblocsdedonnées.Lessystèmesdestockaged’objetssontparexempleleserviceS3offertparAmazon.Cetypedesystèmesdestockageestutilisépourstockerlesimagesdemachinevirtuelleetlesfichiersdesmachinesvirtuelles.Unpériphériquedetypeblocsdedonnéespeutêtreutiliséparlesmachinesvirtuellescommeundisquesurlequelellespeuventinstallerlesystèmedefichiersdeleurchoix.LesystèmeEBSd’Amazonestunexempledecetype-là.Engénéral,lesmachinesvirtuellesutilisentcesystèmedestockagepourrangerlesfichiersoudesbasesdedonnées.UnpetitfocusdoncsurlesdeuxservicesdestockagepersistantsoffertsparAmazon,àsavoirS3etEBS.
DoncEBSestunpériphériquedisqueextensible.Lesdonnéessontrépliquéessurplusieurspériphériquesdemanièreoptionnellepourgarantirdelafiabilité.EtEPSpeututiliserdifférentssupports,soitdesdisquesmagnétiques,soitsurSSD.LeserviceS3quantàluipermetdestockerdesobjets,iloffredelapersistanceetdelahautedisponibilité.AmazonstockelesdonnéesdeS3dansplusieurszonesditesdedisponibilité,c’estàdiredansplusieursDataCentergéographiquementdistants.CeserviceestaccessibleàtraversuneinterfaceWeb.
Dansunclustervirtuel,ilestpossiblededéployerdifférentstypesdesystèmesdefichiersselonlesbesoinsdesapplications.Celapeutêtreunsystèmedefichierslocalcommeext3surLinuxouLFSquiseraaccessibledanslaVMoùilestinstallé.CelapeutêtreaussiunsystèmedefichierdistribuécommeNFS,HDFS,GFSquivapermettredepartagerdesfichiersentreplusieursmachinesvirtuelles.OucelapeutêtreaussiunsystèmedefichiersparallèlescommeCeph,GPFS,pourpermettredesentréessortiesefficaces.Dansuncloudd’infrastructures,lesoptionspourlestockagedesdonnéesdesapplicationsquis’exécutentdanslesmachinesvirtuellessontdoncmultiples.Donclechoixetlaconfigurationdustockageestunetâchearduepourlesutilisateursdeclustersvirtuels.
Unsystèmedefichierdistribué,communémentdéployédanslecloud,estlesystèmeHDFS,ilestnotammentutilisépourl’exécutiond’applicationMAPreduce,commeonleverradanslaséquencesuivante.LaparticularitédusystèmedefichiersHDFSestd’exploiterlesdisqueslocauxprésentssurlesdifférentsnœudsdecalculpoureffectueruntraitementenparallèlesurdegrosvolumesdedonnées.Cesystèmedefichiersgèreautomatiquementlaréplicationdesdonnéessurplusieursdisques.
Àl’heuredubigData,desvolumesdedonnéescroissantssontproduits,lesdonnéessontextrêmementvariéesetlerythmedeproductionpeutêtretrèsrapide.Ilpeuts’agirdedonnéessemiounonstructuréesetbiensouventlesdonnéessontliéesentreelles.
Donccesévolutionsontdonnénaissanceàdenouveauxtypesdebasededonnéesquenousallonsaborderdansladeuxièmepartiedecetteséquence.Lesbasesdedonnéestraditionnellessontfondéessurdesschémasdedonnéesquisontfixesetdéfinisdèslaconceptiondecesbasesdedonnées.CessystèmesdebasededonnéestraditionnelsgarantissentlespropriétésACID(AtomicityConsistencyIsolationDurability):
- Atomicitédesmisesàjourtoutourien,- Cohérencedesdonnéesenprésenced’écrituresconcurrentes,- IntégritéetPersistancedesdonnéesendépitdedéfaillancesoud’attaque.
IlfautsavoirquelamiseenœuvredespropriétésACIDentraînedessurcoûtsimportantsdufaitdesbesoinsdesynchronisation,cequilesrendinadaptéespourbonnombred’applicationsnouvelles.
Danslesannées2000desbasesdedonnéesdenouvellegénérationontvulejour,lesbasesdedonnéesnonstructuréesounotonlySQL: structureévoluantdynamiquement(nonrelationnel).Danscenouveautypedebasededonnées,leschémadesdonnéespeutévolueraufildutemps,parajoutdenouveauxattributs.LesdifférentesbasesdedonnéesetnoSQLfontdiverscompromisentrelestroispropriétésmentionnées.Biensouvent,ellesaffaiblissentlacohérenceauprofitdesdeuxautrespropriétés.
Cesontlesplussimples,ellesgèrentdesindexclés/valeuravecseulementtroistypesd’opérations:larecherchedansl’index,l’ajoutoulasuppressiond’élémentsdansl’index.Ellessontutiliséesparexemplepourlagestiondeprofilsutilisateursoudepréférencesdanslesapplications.
Ellessontunpeuplussophistiquéesquelesprécédentes.Onappelledocumenttouttyped’objetsanspointeur.Cesbasesdedonnéesgèrentdesdocumentsimbriquésdeslistesdesindexsecondaires.Leslignesd’unenregistrementsontdetaillevariableetilestpossibled’ajouterdesattributsdynamiquement.Cetypedebasededonnéesestutilisépourdesapplicationsdanslesquellesplusieurstypesdedonnéessontgérésetpourlesquelleslesdonnéesn’ontpasbesoind’êtremisesàjourdemanièreimmédiate.Celapeutêtrelecasd’applicationsd’analysededonnéeswebentempsréelquicalculentparexemplelenombredepagesvues,lenombredevisiteursdoncilmanipulelesnotionsdepagesetdevisiteurs.
Ellesontlemêmetyped’usagequelesbasesdedonnéesorientéesdocuments.Cependant,ellessontconçuespourdesdébitsdedonnéesplusimportantsetdesgarantiesdecohérenceplusfortes.Ellessontutiliséesparexemplepourlesdonnéesdesitesdecommerceélectronique.Ellesgèrentdegrosvolumesdedonnéesscalairesetsontstructuréesenfamilledecolonnes.Doncilestpossibled’ajouterdescolonnesdynamiquement.Lesdonnéesdecetypedebasededonnéessontautomatiquementpartitionnéeshorizontalementpargroupesdelignesstockéessurdifférentssitesetégalementverticalementparfamilledecolonnesàdesfinsdepassageàl’échelleetd’efficacité.Lepartitionnementpermetd’équilibrerlachargesurplusieurssitesetdemettreenplaceefficacementdelaréplicationdedonnées.
Ellessontutiliséesdansdesapplicationsdetyperéseauxsociaux,desservicesdegéolocalisationetdesmoteursderecommandation.Danscetypedebasededonnées,troisnotionssontgérées:lesnœuds,lesrelationsentrelesnœudsetlespropriétésquivonts’appliquerauxnœudsetauxliensentrelesnœuds.Surl’exemple,legraphereprésentedesacteursdesfilmsetdesréalisateurs,lesacteurssontcaractériséspardespropriétéscommeleurnom,leurdatedenaissance.Lesarcssontégalementétiquetésavecdesmentionstellesque“ajouédans”ou“adirigé”.
Quecesoitlesbasesdedonnéesoulessystèmesdefichiers,ilexistedesoutilsquipermettentdelesdéployerfacilementdanslecloudquecesoitauniveauIaaSouauniveauplateforme.DanslecasdescloudsdetypeIaaS,lessystèmesdefichiersoulesbasesdedonnéessontinstallésetpréconfigurésdansdesimagesdemachinevirtuellequisontmisesàdispositiondesutilisateursdanslesplacesdemarché.Certainsservicesdeplateformepermettentdedéployeretgérerl’élasticitédessystèmesdefichiersetdesbasesdedonnées.Pourreprendrel’exempledelaséquenceprécédentedeConPaas,cetteplateformepermetdedéployerunsystèmedefichiersdistribuésélastiquesXtreemFSetpermetégalementdedéployerlabasededonnéesrelationnelleMySQL,ainsiqu’unebasededonnéesnoSQLorientéeclésvaleursScalarix.Touslessystèmesdestockagequenousvenonsd’évoquertrouventdesapplicationsdanslesvillesintelligentesquigénèrentdesvolumesdedonnéesconsidérablesquisontexploitéesparunemultituded’applicationsauservicedescitoyens.