43
Mastère ASIG / Projet Bibliographique 2008 1 P7 : Projet Bibliographique Dans le cadre du Mastère ASIG Le Géodécisionnel Les SIG au service du géodécisionnel Thierry Lallemant 15 Mai 2008

Les SIG au service du géodécisionnel - MASIG Accueilmasig.ensg.eu/PDF/geodecisionnel.pdf · d'analyse spatiale en ligne ... des entrepôts de données et utilisent des outils clients

Embed Size (px)

Citation preview

Mastère ASIG / Projet Bibliographique 2008

1

P7 : Projet Bibliographique

Dans le cadre du Mastère ASIG

Le Géodécisionnel

Les SIG au service du géodécisionnel

Thierry Lallemant

15 Mai 2008

Mastère ASIG / Projet Bibliographique 2008

2

TABLE DES MATIERES

1 INTRODUCTION 7

1.1 CONTEXTE 7

1.2 SIG + DECISIONNELLE = MARIAGE DIFFICILE 7

1.3 OBJECTIF RAPPORT 9

2 LES BESOINS SPECIFIQUES DU GEODECISIONNEL 10

2.1 COMPOSANTE SPATIALE INDISPENSABLE 10

2.2 SIG : 1ER CANDIDAT POTENTIEL 12

3 TECHNOLOGIE OU APPLICATION SOLAP 14

3.1 EXEMPLES D’APPLICATION SOLAP AVEC DIFFERENTES TECHNOLOGIES 15 3.1.1 Les applications réalisées par l’équipe de l’Université de l’Aval [Yvan Bédard] 15

3.2 VOCABULAIRE DU MONDE SOLAP 20 3.2.1 Dimensions spatiales 20 3.2.2 Mesures spatiales 21 3.2.3 Opérateurs spatiaux de navigation 22 3.2.4 Synchronisation de navigation 24 3.2.5 La symbologie SOLAP 26 3.2.6 Données spatiales contextuelles 27 3.2.7 Légende interactive 28

4 APPROCHES POUR LE DEVELOPPEMENT D’APPLICATION SOLAP 29

4.1 OLAP DOMINANT 30 4.1.1 Avantages 30 4.1.2 Inconvénients 30

4.2 SIG DOMINANT 30 4.2.1 Avantages 31 4.2.2 Inconvénients 31

4.3 SOLAP INTÉGRÉ 31 4.3.1 Avantages 31 4.3.2 Inconvénients 31

5 NOTIONS ET ARCHITECTURES DES BASES DE DONNEES OLAP/SOLAP 32

5.1 INTRODUCTION OLAP 32

5.2 VOCABULAIRE OLAP 32 5.2.1 Dimensions ou axes 32 5.2.2 Mesures 33 5.2.3 Faits 33 5.2.4 Cubes 33

5.3 EXEMPLES CONCRETS DE CUBE MULTIDIMENSIONNEL 34 5.3.1 EXEMPLE 1: 34 5.3.2 EXEMPLE 2: 34

Mastère ASIG / Projet Bibliographique 2008

3

5.4 ARCHITECTURE OLAP 35

5.5 MOLAP (OLAP MULTIDIMENSIONNEL) 36

5.6 ROLAP (OLAP RELATIONNEL) 36

5.7 HOLAP (OLAP HYBRIDE) 37

5.8 BILAN MOLAP/ROLAP/HOLAP 38

5.9 STRUCTURE MULTIDIMENSIONNELLE 38 5.9.1 Modèle en étoile 38 5.9.2 Modèle en flocon 39 5.9.3 Modèle Mixte 40 5.9.4 Modèle en constellation 40

5.10 LA CAS JMAP SPATIAL OLAP 41

CONCLUSION 42

Mastère ASIG / Projet Bibliographique 2008

4

TABLE DES ILLUSTRATIONS

Figure 1 : OLTP & OLAP___________________________________________________________________ 8

Figure 2 : La visualisation spatiale améliore la compréhension d’un phénomène_______________________ 11

Figure 3 : SOLAP = combinaison de différents outils ____________________________________________ 13

Figure 4 : Une application de gestion du réseau routier (ProClarity et GeoMedia WebMap) : Visualisation de

l’état de la chaussée au niveau des segments de route. ___________________________________________ 16

Figure 5 : Une application sur les accidents sur le réseau routier (JMap Spatial OLAP Extension et Oracle

10g) : Visualisation de la fréquence des accidents par découpage territorial (en haut) et selon les types

d’accidents (en bas). ______________________________________________________________________ 16

Figure 6 : une application en santé environnementale. Visualisation des cas de décès de maladies respiratoire.

Interface1 avec Visual Basic et librairie SoftMap (à gauche) et interface 2 avec ProClarity et KMapx (à droite).

______________________________________________________________________________________ 17

Figure 7 : Une application sur la cohorte d’étudiants (JMap Spatial OLAP Extension) : Visualisation des

étudiants par provenance géographique. ______________________________________________________ 18

Figure 8 : Une application sur les performances des athlètes de patinage de vitesse (JMap Spatial OLAP

Extension) : Visualisation de la vitesse moyenne des patineurs sur la piste (gauche) et par segments de parcours

(droite). ________________________________________________________________________________ 18 Figure 9 : Une application tridimensionnelle en archéologie (ESRI ArcGIS et ProClarity) : Visualisation des

lots fouillés sous la forme de volume. _________________________________________________________ 19

Figure 10 : Une application tridimensionnelle pour la gestion des forêts (ESRI ArcGIS et ProClarity) :

Visualisation des chablis sur le modèle 3D. ____________________________________________________ 19

Figure 11 : Les trois types de dimensions spatiales supportées par le SOLAP _________________________ 20

Figure 12 : 2 types de mesures : descriptive numérique et spatiale __________________________________ 21

Figure 13 : Opérateur DRILL-DOWN ________________________________________________________ 22 Figure 14 : Opérateur DRILL-UP ___________________________________________________________ 23 Figure 15 : Opérateur DRILL-ACROSS _______________________________________________________ 23 Figure 16 : Opérateur PIVOT_______________________________________________________________ 24 Figure 17 : Gestion de différents types d’affichage : Carte multi-temporelle ou statistique _______________ 25 Figure 18 : Synchronisation de la collection suite à une opération de forage spatial ____________________ 26 Figure 19 : Synchronisation de la symbologie __________________________________________________ 27 Figure 20 : La carte source d’informations contextuelles _________________________________________ 28 Figure 21 : Modélisation UML d’un exemple de cube ____________________________________________ 33 Figure 22 : Architecture MOLAP ____________________________________________________________ 36 Figure 23 : Architecture ROLAP ____________________________________________________________ 37 Figure 24 : Architecture HOLAP ____________________________________________________________ 37 Figure 25 : Modèle en étoile________________________________________________________________ 39 Figure 26 : Modèle en flocon _______________________________________________________________ 39 Figure 27 : Modèle Mixte __________________________________________________________________ 40 Figure 28 : Modèle en constellation __________________________________________________________ 40 Figure 29 : architecture JMap Spatial ________________________________________________________ 41

Mastère ASIG / Projet Bibliographique 2008

5

GLOSSAIRE

SIG = Un système d'information géographique est un outil informatique permettant

d'organiser et présenter des données alphanumériques spatialement référencées, ainsi que

de produire des plans et cartes.

Datawarehouse = entrepôt de données

Datamart = petit entrepôt de données à l'échelle d'un département ou succursale d'une

grande société. Généralement un datamart déverse ses données chez sa mère qui est le

datawarehouse.

OLTP = OnLine Transactonal Processing. Il s'agit des traitements transactionnels. Par

exemple, les logiciels des caisses enregistreuses des chaines de magasins font du OLTP.

OLAP = OnLine Analytical Processing. Opposé à l'OLTP, faire de l'OLAP signifie faire de

l'analyse de données. Analyser les ventes, détecter les fraudes, prospecter des clients font

partie du processus OLAP.

Base de données multidimensionnelle = une base de données multidimensionnelle par

opposition à une base de donnée relationnelle est une base dénormalisée ou il existe une

table centrale (table de fait) liée à toutes les autres tables (tables de dimension).

Table de fait = comme son nom l'indique, une table de fait est une table contenant tous

les faits du SI et dont dépendent toutes les autres tables. Cette table ne contient que des

clés étrangères venant des tables de dimension et des valeurs numériques appelées

mesure. Exemple de table de fait : table des Ventes

Tables de dimension = les tables de dimension sont des tables servant d'axes d'analyse. On

peut par exemple analyser les ventes (table de fait) suivant l'axe des temps (table de

dimension) pour indiquer par exemple pendant quel trimestre de l'année les ventes ont

explosé.

Mesure = une mesure est une quantité présente dans la table de fait qui permet de

mesurer les faits. Par exemple, nombre de vente ou prix unitaire sont des exemples de

mesures.

Mastère ASIG / Projet Bibliographique 2008

6

Cube = un cube de données est une structure dimensionnelle comme une table est une

structure relationnelle. Un cube est constitué d'un ou plusieurs tables de faits avec leurs

tables de dimension. On peut par exemple considérer un cube vente contenant sa table de

fait " vente " et ses tables de dimensions " clients ", " région " et " temps ".

Niveau de hiérarchie = un niveau de hiérarchie se définit au niveau des tables de

dimensions. Cela permet d'agréger les données. Par exemple, supposons qu'on ait la

dimension région contenant la liste des villes, on pourrait faire un niveau de hiérarchie

(niveau 1) classant les villes en région, ensuite un niveau plus bas qui les classerait en

département (niveau 2).

Drill-down = faire un drill-down, c'est avoir un niveau de détails sur les données. Par

exemple Supposons qu'on veuille voir le détail des ventes pour le premier trimestre de

l'année 1997.On dit qu'on fait un drill-down sur l'axe (ou dimension) temps. C'est à dire

qu'on ne veut pas voir seulement les données de l'année 1997 mais descendre à un niveau

de détail plus bas.

Roll-up (Drill-up)= rollup est le contraire de drill-down. C'est donc faire de l'agrégation (ou

résumé) des données.

Mastère ASIG / Projet Bibliographique 2008

7

1 INTRODUCTION

1.1 CONTEXTE

Partout dans le monde, de nombreuses organisations dépensent des sommes colossales en

acquisition de données localisées sur le territoire.

La production cartographique, l'établissement de relations avec les bases de données

internes à l’organisation et l'analyse spatiale de ces données relèvent du domaine de la

géomatique qui représente un marché annuel de plusieurs dizaines de milliards d'euros.

Cependant, les données ainsi produites sont surtout de nature opérationnelle et difficile à

exploiter à des fins décisionnelles, fins qui demandent des informations multisources,

agrégées, des comparaisons dans l'espace et le temps, des synthèses, des mesures de

tendances, des réponses rapides à des requêtes imprévues, etc.

1.2 SIG + DECISIONNELLE = MARIAGE DIFFICILE

D'importants efforts sont déployés depuis une quinzaine d'années pour mettre en place des

systèmes d'aide à la décision géospatiale, mais ces systèmes reposent sur les systèmes

d'information géographique (SIG) et les approches transactionnelles habituelles (OLTP*)

pour produire l'information géodécisionnelle, souvent avec des délais inacceptables, voire

des coûts prohibitifs au point d'en laisser tomber la production. Cette situation nuit à la

prise de décision tactique/stratégique (ex. déploiement des ressources, de nouvelles

infrastructures) et devient particulièrement problématique en situation d'urgence où tout

retard peut avoir des impacts majeurs.

Cette difficulté de produire l'information géospatiale décisionnelle provient de cinq

problèmes:

(1) des méthodes inadéquates de conception de bases de données géospatiales à fins

décisionnelles,

(2) la difficulté d'agréger et synthétiser des données cartographiques hétérogènes,

(3) la difficulté d'évaluer la qualité de l'information géospatiale agrégée,

(4) une sous-exploitation des technologies de l'information et des communications, et

(5) un manque de technologies décisionnelles géospatiales efficaces.

Le présent rapport traite de ce dernier point, particulièrement des nouvelles tendances

d'analyse spatiale en ligne (Spatial OLAP* ou SOLAP).

Mastère ASIG / Projet Bibliographique 2008

8

Il est déjà reconnu que pour soutenir leurs processus décisionnels, les organismes déploient

des entrepôts de données et utilisent des outils clients spécifiques afin d'accéder,

visualiser et analyser leurs données intégrées. Puisqu'une grande partie de ces données

peut avoir une composante spatiale (ex. adresse civique), de nouveaux outils sont

nécessaires pour profiter pleinement de la position et la forme des phénomènes analysés.

Il a été démontré [Caron 1998] que les technologies OLAP sans visualisation et navigation

cartographiques présentent d'importantes limitations pour l'analyse de phénomènes

géographiques et spatio-temporels comme on en rencontre en environnement, foresterie,

agriculture, urbanisme, sécurité, transport, etc. Par conséquent, la géodécisionnelle

pourra pallier à ces limitations et pour y parvenir différentes possibilités existent

aujourd’hui, plus ou moins bien efficace.

Figure 1 : OLTP & OLAP

Mastère ASIG / Projet Bibliographique 2008

9

1.3 OBJECTIF RAPPORT L'objectif de ce rapport est de présenter ces différentes possibilités tout en mettant

l'accent sur la solution la plus évoluée: la "technologie SOLAP*". Ainsi, la prochaine partie

résume les besoins spécifiques au monde géodécisionnel et présente les opportunités qui

ont conduit depuis 1997, au développement d’applications SOLAP avec différentes

solutions (ex. combinaisons SIG + OLAP, technologie SOLAP). La deuxième section définit

la technologie SOLAP et présente certains concepts spécifiques aux données spatiales

accompagnés d'exemples d’applications. La troisième partie présente les différentes

méthodes de développement d’applications SOLAP, incluant l'utilisation de la technologie

SOLAP. Et en conclusion, une approche des avenues innovatrices pour le développement

d’applications SOLAP.

Mastère ASIG / Projet Bibliographique 2008 10

2 LES BESOINS SPECIFIQUES DU GEODECISIONNEL

2.1 COMPOSANTE SPATIALE INDISPENSABLE

Les données emmagasinées dans les entrepôts de données* forment la base des analyses

et guident l’organisation dans sa prise de décision. Cependant, les données ne sont pas

toujours exploitées selon leur plein potentiel et une partie de leur richesse, c'est-à-dire,

leur composante spatiale, est souvent inutilisée. " Cacher dans la plupart des données, se

trouve une composante spatiale lié à une localisation: une adresse, un code postal, une

localisation GPS, une Région ou un pays " [ESRI 2000].

En effet, il est estimé qu’environ 80% des données stockées dans les bases de données

corporatives possèdent une référence spatiale [Franklin 1992], laquelle référence peut

inclure, en plus de la position, une forme, une orientation et une taille. La simple

visualisation de cette composante spatiale permet de répondre à un premier besoin, soit

de mieux comprendre le phénomène en question en voyant sa position dans un cadre de

référence géographique, en voyant son étendue sur le territoire, en voyant sa distribution

sur le territoire (concentrée, dispersée, par groupes, aléatoire, régulière, etc.). Une telle

visualisation permet de découvrir des informations non disponibles dans les outils OLAP

traditionnels, soit des modes de distribution géographique du phénomène ne suivant pas

les découpages territoriaux prédéfinis comme membres d'une dimension (ex. nom du pays,

nom de la région, nom de la ville).

Mastère ASIG / Projet Bibliographique 2008 11

Figure 2 : La visualisation spatiale améliore la compréhension d’un phénomène

L'utilisation de la composante spatiale permet également de répondre à un deuxième

besoin, soit de découvrir des relations spatiales entre différents phénomènes

géographiques (ex. corrélation spatiale entre une fréquence d’une maladie X et un taux

d'émission d'un polluant Y).

Cette découverte peut se faire par visualisation même si une corrélation ne suit pas la

hiérarchie de la dimension territoriale telle que définie dans le cube de données* (i.e.

dont la délimitation géographique est uniquement identifiée par un nom de lieu, comme

pays – province - région administrative).

Cette découverte peut également se faire par l'ajout de plusieurs découpages territoriaux

ou l'ajout de dimensions d'analyse spatiale.

Souvent, l’affichage cartographique révèle des informations (ex. proximité entre deux

phénomènes isolés, étendu d’un phénomène, forme d’un phénomène longeant une rive,

orientation des phénomènes selon un flanc de montagne) qui n’auraient pas été

soupçonnées en faisant appel à d’autres méthodes de représentation telles que les

tableaux et les graphiques.

Un troisième besoin majeur dans un contexte d'analyse spatiale en ligne est celui de

pouvoir naviguer dans une carte aussi librement que ce que permet un outil OLAP dans les

tableaux et graphiques statistiques. Ainsi, l'utilisateur a besoin de pouvoir regarder les

détails d'une région d'intérêt grâce à un forage spatial (Drill down*), comparer ces détails

avec ceux d'une autre région qui n'est pas adjacente (Drill across*), découvrir s'il y a des

caractéristiques communes entre les distributions spatiales du phénomène dans ces deux

Mastère ASIG / Projet Bibliographique 2008 12

régions, remonter à une vision plus globale pour comparer un phénomène local avec un

phénomène national (Roll up*), voir l'évolution du phénomène sur le territoire sans être

restreint au découpage géographique de la dimensions spatiale utilisée, obtenir des valeurs

statistiques spatiales et temporelles sur l'évolution de ce phénomène, etc. Beaucoup de

connaissances géographiques peuvent être obtenues par l'utilisation appropriée de la

visualisation et de la navigation cartographique à la OLAP, et ceci même pour des

références spatiales non prévues dans le cube de données.

L'utilisation de la carte comme médium d'exploration de données permet d'avoir un modèle

informatisé se rapprochant davantage de la réalité de l'utilisateur et conséquemment lui

demandant un moins grand effort d'abstraction, ce qui accroît son efficacité. Les cartes se

prêtent mieux que les tableaux et graphiques statistiques à l'ajout de codes, symboles et

couleurs significatifs permettant de mieux supporter l'exploration interactive des données.

La possibilité de naviguer dans la carte permet de chercher des associations, favorisant la

découverte de relations spatiales insoupçonnées et potentiellement la construction d'un

nouveau cube de données avec un découpage différent du territoire.

Une application SOLAP, comparativement à une application OLAP, réveille davantage notre

capacité de visualisation exceptionnelle car la capacité de perception et de réflexion du

cerveau humain, tout comme sa mémoire, relèvent du domaine de l'image.

Plusieurs études ont démontré que les images sont souvent plus évocatrices que les mots,

plus précises et plus aptes à déclencher un vaste éventail d'associations. Ainsi, l'effet

stimulant que procurent les cartes incite à une meilleure exploration des données par

notre cerveau.

2.2 SIG : 1ER CANDIDAT POTENTIEL

Pour obtenir une telle efficacité avec les données géospatiales, plusieurs défis doivent être

surmontés. De toute évidence, les outils client actuellement utilisés pour exploiter les

entrepôts ne sont pas adaptés aux entrepôts de données géospatiales, car ils n’exploitent

pas la structure géométrique des données [Han et Kamber 2001]. Certes, ils peuvent être

utilisés, mais sans la capacité de manipuler la composante cartographique, ils ne peuvent

pas supporter d’analyses ni d'explorations avancées.

De nouveaux outils client sont requis pour exploiter le plein potentiel de cette composante

cartographique. Les systèmes d’information géographique (SIG) qui permettent

d'assembler, stocker, manipuler et afficher l'information à référence spatiale représentent

Mastère ASIG / Projet Bibliographique 2008 13

un premier candidat potentiel. Par contre, malgré ses capacités d’analyse spatiale

poussées, il est reconnu que le SIG seul, avec son architecture OLTP limitée, souffre d'un

interface de requête complexe et de temps de réponse lents aux requêtes agrégatives, en

plus de ne pas offrir les fonctions temporelles et navigationnelles nécessaires pour soutenir

l’aide à la décision.

Figure 3 : SOLAP = combinaison de différents outils

Des solutions alternatives doivent être développées [Bédard 2001].

• Dans un premier temps, l'utilisateur doit pouvoir se concentrer sur l'information

recherchée (le "quoi") et non pas sur les opérations nécessaires pour y parvenir (le

"comment").

• Dans un deuxième temps, pour être efficace, le processus de prise décision doit suivre le

flux de pensée de l’utilisateur. Il ne doit pas être interrompu par des manipulations

complexes et des temps de réponse trop longs. Les requêtes spatiales, la navigation,

l'affichage des cartes avec niveau de détail et la sémiologie graphique appropriée, ainsi

que la synchronisation entre les vues cartographiques, tabulaires et graphiques doivent

s'effectuer à l'intérieur de 10 secondes, soit à l'intérieur de la bande cognitive identifiée

par [Newell 1990]. Enfin, le tout représente en soi un défi majeur pour les SIG lorsqu’ils

sont utilisés seuls.

Ainsi, parmi les solutions potentielles, le couplage des technologies spatiales et non-

spatiales, comme SIG et OLAP, semble être une bonne option et a été expérimenté par

l’équipe de Laval de M. Yvan Bédard.

Mastère ASIG / Projet Bibliographique 2008 14

3 TECHNOLOGIE OU APPLICATION SOLAP

La technologie SOLAP peut être définie comme "un type de logiciel qui permet la

navigation rapide et facile dans les bases de données spatiales et qui offre plusieurs

niveaux de granularité d'information, plusieurs thèmes, plusieurs époques et plusieurs

modes d'affichage synchronisés ou non : cartes, tableaux et diagrammes " [Bédard 2004].

La technologie SOLAP supporte la structure multidimensionnelle telle qu'utilisée en

informatique décisionnelle, ce qui lui confère un immense avantage sur les logiciels de

déploiement d’application cartographique sur le Web (ex : ArcIMS, GeoMedia WebMap),

même lorsque ceux-ci offrent des opérations appelées forage, car ces derniers sont basés

sur une structure transactionnelle. La technologie SOLAP offre aussi de nouvelles fonctions

d’aide à la décision non disponibles dans les SIG traditionnels ni dans les outils OLAP.

Une technologie SOLAP permet la visualisation cartographique des données, la navigation

cartographique dans la carte elle-même ou dans les symboles affichés sur cette carte et

ceci selon différents types de forage. Dans une technologie SOLAP la création des cartes

résultantes des analyses est dynamique, contrairement à certains logiciels de visualisation

OLAP (ex. Visualizer de Cognos) où chacune des opérations de navigation spatiales (ex.

forage) doit être prédéfinie dans l’application et associée à une carte. Cette limitation

complexifie la mise à jour des données géométriques en répartissant l’information sur

plusieurs cartes. De plus, un tel outil SOLAP gère adéquatement les règles de

représentation cartographique des résultats des analyses sur les cartes.

Par conséquent, l’utilisation d’un tel outil ne nécessite pas le support d’un expert en

cartographie même s'il permet à l'utilisateur de créer des centaines de milliers de cartes

différentes par quelques cliques de souris. Dans la présentation des résultats, la

technologie SOLAP utilise les mêmes règles sémiologiques (ex. couleur, trame, contour)

pour l'ensemble des affichages, i.e. tableaux, graphiques et cartes. Cela permet d’avoir

une synchronisation visuelle entre les différents modes de présentation de l’information et

d'avoir un panorama homogène. La sémiologie graphique utilisée pour les différents types

d’affichage (i.e. tableaux, graphiques et cartes) demeure synchronisée lors d’un forage ou

lors d’autres opérations, conservant ainsi une continuité perceptuelle nécessaire à la

découverte de corrélations.

Mastère ASIG / Projet Bibliographique 2008 15

Enfin, il faut distinguer les applications SOLAP des technologies SOLAP. Une technologie

SOLAP est une technologie générique construite spécialement pour offrir des fonctions

SOLAP de base ou plus avancées sans nécessiter d’efforts de programmation. Le premier

produit commercial SOLAP est le résultat des travaux de M. Yvan Bédard et son équipe et

est commercialisé sous le nom de JMap Spatial OLAP Extension [KHEOPS 2005].

Une application SOLAP est une application métier qui fournit à l'utilisateur un certain

nombre de fonctionnalités de type SOLAP et qui peut être construite soit avec la

technologie SOLAP, soit avec des combinaisons de technologies non-SOLAP (ex. SIG et

OLAP) et du code de programmation maison, ou soit avec d'autres technologies (ex.

librairies en Java).

Exemple : solution de nombreuses sociétés comme Galigeo, Décision Geobs,…

3.1 EXEMPLES D’APPLICATION SOLAP AVEC DIFFERENTES TECHNOLOGIES

Les outils SOLAP peuvent être utilisés pour déployer une multitude d’applications dans de

nombreux domaines.

La première technologie consiste à faire appel à deux produits fonctionnant en parallèle

sans interface commune.

3.1.1 Les applications réalisées par l’équipe de l’Université de l’Aval [Yvan Bédard]

Exemple 1 (sans la technologie SOLAP):

Une application fut développée pour aider les gestionnaires à distribuer les budgets de

maintenance du réseau routier en se basant sur les périodes budgétaires, les conditions

routières, la classification des routes, le flux de circulation, etc. En plus de croiser,

visualiser et explorer les informations requises, le cube permet de simuler la dégradation

de la chaussée et de calculer les coûts de différents types de maintenance. La figure 1

présente cette application qui fut développée avec l’outil OLAP ProClarity, SQL-Server

Analysis Services de Microsoft et l’API de GeoMedia WebMap avec une interface commune

développée en Visual Basic.

Mastère ASIG / Projet Bibliographique 2008 16

Figure 4 : Une application de gestion du réseau routier (ProClarity et GeoMedia

WebMap) : Visualisation de l’état de la chaussée au niveau des segments de route.

Exemple 2 (avec la technologie SOLAP):

Une autre application en transport permet d'analyser les données relatives aux différents

types d'accidents en fonction de leur position sur le réseau routier et des caractéristiques

de celui-ci, le tout en fonction de différentes périodes. La figure 2 illustre cette

application cette fois-ci déployée avec une technologie SOLAP, soit JMap Spatial OLAP

Extension et Oracle 10g. Contrairement aux autres solutions, celle-ci ne nécessitait pas de

développement d'interface à l'usager supplémentaire puisque cette technologie SOLAP

inclut l'interface. Les détails des différentes méthodes utilisées pour ces applications

SOLAP sont donnés plus loin dans le rapport cf...

Figure 5 : Une application sur les accidents sur le réseau routier (JMap Spatial OLAP

Extension et Oracle 10g) : Visualisation de la fréquence des accidents par découpage

territorial (en haut) et selon les types d’accidents (en bas).

Mastère ASIG / Projet Bibliographique 2008 17

Exemple 3 (sans la technologie SOLAP):

Une application en santé environnementale permet d’explorer les relations entre les états

de santé et les phénomènes environnementaux, comme l’incidence des maladies

respiratoires en fonction de la qualité de l’air pour rapidement valider ou invalider une

hypothèse. L’interface 1 présente cette application développée par programmation en

Visual Basic, MS Access et la librairie du logiciel de visualisation cartographique SoftMap et

la même application pour l’interface 2 développée avec ProClarity, SQL-Server Analysis

Services de Microsoft et KMapX et une interface commune développée en VBScript.

Figure 6 : une application en santé environnementale. Visualisation des cas de décès

de maladies respiratoire. Interface1 avec Visual Basic et librairie SoftMap (à gauche)

et interface 2 avec ProClarity et KMapx (à droite).

Exemple 4 (avec la technologie SOLAP):

Une application sur la cohorte d’étudiants inscrits ces 15 dernières années à l'Université de

Laval permet une analyse par programmes d’étude, provenances géographiques,

institutions de provenance, etc. afin de mieux planifier les prochains efforts de

recrutement.

Une application relative aux sports de haut niveau permet d'analyser les performances

(vitesse, vitesse maximale, durée, constance) atteintes par des athlètes de patinage de

vitesse sur différentes sections de la piste et selon différents facteurs techniques (ex. type

de départ), mécaniques (ex. type de patin) et météorologiques (ex. vitesse et direction du

vent), le tout à partir de mesures prises par système de positionnement satellitaire GPS.

Les figures 4 et 5 illustrent ces deux applications déployées avec la technologie JMAP

Spatial OLAP Extension et Oracle 10g.

Mastère ASIG / Projet Bibliographique 2008 18

Figure 7 : Une application sur la cohorte d’étudiants (JMap Spatial OLAP Extension) :

Visualisation des étudiants par provenance géographique.

Figure 8 : Une application sur les performances des athlètes de patinage de vitesse

(JMap Spatial OLAP Extension) : Visualisation de la vitesse moyenne des patineurs sur

la piste (gauche) et par segments de parcours (droite).

Plusieurs autres domaines d’applications peuvent être étudiés, telle la sécurité publique et

le transport maritime.

Récemment, des applications en SOLAP 3D sur la gestion des forêts et les fouilles

archéologiques mettent à profit l’aspect tridimensionnel de l’espace, c’est-à-dire les

volumes. Dans l’application en archéologie, il est possible de naviguer dans les différentes

unités stratigraphiques fouillées afin de comparer les lots de fouille entre eux en fonction

Mastère ASIG / Projet Bibliographique 2008 19

de leur couleur, de leur granulométrie, de leur consistance, de leur position géographique

et stratigraphique et du type d’artéfacts (ex. céramique) trouvés dans le lot.

• La figure 6 illustre l’application d’archéologie où les lots sont représentés comme des

volumes (i.e. en trois dimensions).

• La figure 7 présente une application sur la gestion des forêts qui permet de visualiser sur

un modèle tridimensionnel, les volumes de bois, les perturbations naturelles, les essences

végétales, etc.

Ces deux projets ont utilisé une interface développée en Visual Basic utilisant le SIG ESRI

ArcGIS, le client OLAP ProClarity et le serveur OLAP SQL-Server Analysis Services de

Microsoft.

Figure 9 : Une application tridimensionnelle en archéologie (ESRI ArcGIS et

ProClarity) : Visualisation des lots fouillés sous la forme de volume.

Figure 10 : Une application tridimensionnelle pour la gestion des forêts (ESRI ArcGIS

et ProClarity) : Visualisation des chablis sur le modèle 3D.

Mastère ASIG / Projet Bibliographique 2008 20

3.2 VOCABULAIRE DU MONDE SOLAP

Comme c'est le cas pour toute technologie et norme géospatiale moderne, les concepts

apportés ici reposent sur les concepts informatiques standards et apportent les extensions

nécessaires pour effectuer de nouvelles fonctions ou pour améliorer l'exécution des

fonctions existantes. Ainsi, en comparaison au modèle multidimensionnel conventionnel, le

modèle multidimensionnel spatial comprend aussi des faits et des dimensions non-

spatiales. Par contre, comme nous le décrivons ci-après, il existe aussi des dimensions

spatiales de différents types, des mesures spatiales et des opérations spatiales.

3.2.1 Dimensions spatiales

Le SOLAP possède des capacités de manipulation de données spatiales qui lui permettent

de supporter des dimensions spatiales non-géométriques, géométriques et mixtes en plus

des dimensions non-spatiales. La dimension spatiale non-géométrique utilise la référence

spatiale nominale seulement (ex. les noms des lieux) et aucune représentation

cartographique n’est associée aux membres de la dimension. Ce type de dimension spatiale

est couramment utilisé dans les outils OLAP conventionnels. Les deux autres types de

dimension spatiale incluent des formes géométriques référencées spatialement sur une

carte qui permettent aux membres de la dimension d’être visualisés et interrogés

cartographiquement. Ces géométries existent pour tous les niveaux de la dimension

spatiale géométrique ou pour seulement certains niveaux dans le cas d’une dimension

spatiale mixte. La figure 9 présente les trois types de dimensions spatiales.

Figure 11 : Les trois types de dimensions spatiales supportées par le SOLAP

Mastère ASIG / Projet Bibliographique 2008 21

3.2.2 Mesures spatiales

Dans un contexte multidimensionnel spatial, il n’y a pas que les dimensions qui possèdent

une composante géométrique, mais aussi les mesures. Par conséquent, en plus des mesures

conventionnelles supportées dans les systèmes OLAP, il existe les mesures spatiales.

Le pointeur spatial est le type de mesure spatiale le plus connu. C’est la méthode utilisée

par les technologies SIG pour gérer la composante géométrique des objets spatiaux. Il

s’agit d’un ensemble de pointeurs (stockés dans le cube de données) vers la géométrie

d’un objet spatial stockée dans une autre structure que la structure multidimensionnelle.

Le second type de mesure spatiale est la transposition au monde spatial de la mesure

conventionnelle du OLAP. Elle permet de dériver des valeurs à l’aide d’un opérateur

métrique ou topologique d'analyse spatiale dont le résultat sera ensuite stocké dans le

cube de données (ex. surface d’un objet, distance minimale avec l'objet le plus proche,

cumul de longueurs sur un réseau).

Finalement, la dernière mesure spatiale consiste à générer des données géométriques sous

la forme d’un ou plusieurs objets spatiaux obtenus par la combinaison de dimensions

spatiales géométriques (ou mixtes en utilisant les niveaux où les membres possèdent une

géométrie). Il s’agit d’un ensemble de coordonnées obtenu à partir des opérateurs

d’analyses spatiaux d’un SIG, par exemple les coordonnées d'un point, ligne ou polygone

résultant de l’intersection spatiale des membres de plusieurs dimensions. Ainsi en est-il

des polygones résultant de l’intersection des polygones délimitant les membres des

dimensions spatiales frontières politiques et bassins versants.

Figure 12 : 2 types de mesures : descriptive numérique et spatiale

Mastère ASIG / Projet Bibliographique 2008 22

3.2.3 Opérateurs spatiaux de navigation

Les outils SOLAP possèdent des opérateurs de navigation pour explorer via la carte

l'ensemble des données spatiales. Dans une interface de client SOLAP, les variantes des

opérateurs OLAP sont utilisées pour profiter de la structure de données

multidimensionnelle spatiale et des différents niveaux de détail des données spatiales. Les

opérateurs sont: DRILL-DOWN, ROLL-UP (ou drill-up), DRILL-ACROSS, SWAP (or pivot), SLICE

and DICE

Pour manipuler les données contenues dans le géométrique ou mélanger les dimensions

spatiales, les trois opérateurs de forage peuvent être appelés : le forage spatial

descendant (roll-down), le forage spatial de remontage (roll-up) et le forage spatial latéral

(drill accros). Ils sont exécutés directement en cliquant sur les éléments (des membres de

dimension) montrés sur les cartes ou sur une sélection de groupe d'éléments (sur le même

ou à des niveaux différents de détail d'une dimension)

• L’opérateur de forage spatial (DRILL-DOWN) permet à l’usager de naviguer d’un niveau

général à un niveau plus détaillé à l’intérieur d’une dimension spatiale géométrique (ex.

cartographier les régions sous-jacentes composant un pays).

Figure 13 : Opérateur DRILL-DOWN

Mastère ASIG / Projet Bibliographique 2008 23

• L’opération de remontage (DRILL-UP) permet la navigation inverse, c'est-à-dire de

remonter d’un niveau détaillé des données vers un niveau le plus général (ex.

cartographier les données nationales sus-jacentes à une région).

Figure 14 : Opérateur DRILL-UP

• L’opérateur de forage latéral permet de visualiser les différents membres du même

niveau de détail d’une dimension spatiale (ex. cartographier pour mieux comparer les

mesures de la région sud par rapport à celles de la région nord). Ces opérateurs sont

utilisés directement sur la carte.

Figure 15 : Opérateur DRILL-ACROSS

Mastère ASIG / Projet Bibliographique 2008 24

• Le pivot : Une opération utile sur des données multidimensionnelles est le pivot.

Appliqué sur une carte, le pivot peut permettre de changer l'orientation des dimensions

montrées pour produire un type différent de carte. Cependant, des règles précises sont

nécessaires pour produire le pivot de la carte qui correspond aux dimensions active de

sélections. Par exemple, une multicarte temporelle basée sur trois ans d'intérêt peut être

pivoté comme une carte avec des diagrammes basés sur des années.

Figure 16 : Opérateur PIVOT

Les opérateurs spatiaux de navigation peuvent s’appliquer sur un objet individuel (ex.

visualiser les régions composant l’objet Canada) ou s’appliquer à l’ensemble des objets

d’un niveau de détail (ex. visualiser l’ensemble des régions composant le niveau Pays).

Différentes variantes des opérateurs spatiaux existent également mais leur explication

déborde le cadre de ce rapport.

3.2.4 Synchronisation de navigation

L'outil SOLAP doit tenir compte de la synchronisation d'opérations d'un affichage à un

autre. Il est important qu'une sélection dans un type d'affichage doit être efficace pour

tous les autres types. Par exemple, la visualisation d'analyse temporelle rend facile la

comparaison de données sur des cartes multi-temporelles ou sur la carte statistique.

Mastère ASIG / Projet Bibliographique 2008 25

Figure 17 : Gestion de différents types d’affichage : Carte multi-temporelle ou

statistique

Cette synchronisation permet à l'utilisateur de visualiser la même information, mais d'une

perspective différente : une table pour une vue détaillée d'un phénomène, un diagramme

pour des comparaisons rapides et une carte pour visualisation efficacement des tendances

spatiales ou corrélations. Des comparaisons temporelles sont d'habitude analysées par les

diagrammes, mais l'outil SOLAP offre aussi la possibilité de montrer plusieurs cartes

(appelé des multicartes), des diagrammes et des tables pour différentes époques, ou pour

les différentes membres des autres dimensions et même une analyse rapide par

configuration de simulations dynamiques. Une opération SOLAP exécutée sur un affichage

peut être, si ce type de synchronisation est activé par l'utilisateur, être reflété

immédiatement et automatiquement dans toutes les autres visualisations de la même

collection (une collection étant un jeu d’affichages liées qui sont synchronisées

ensemble).

Mastère ASIG / Projet Bibliographique 2008 26

Figure 18 : Synchronisation de la collection suite à une opération de forage spatial

3.2.5 La symbologie SOLAP

La symbologie qui est utilisée pour représenter les mesures différentes dans les types

divers de vues peut être définie par l'administrateur du système. Un outil SOLAP doit offrir

à l’administrateur de la symbologie une flexibilité graphique qui tient compte de la

définition des différents types de catégories de données, de cartes thématiques, ainsi que

l'utilisation de variables visuelles diverses. Les utilisateurs peuvent aussi créer leur propre

symbologie afin d’être appliqué à leur propre collection d’analyse.

Cependant, cela peut mener à des collisions potentielles de règles de symbologie

graphique puisque les mêmes règles ne s'appliquent pas toujours aux cartes, aux

camemberts, aux graphiques en barres, aux tables, etc. Il est alors nécessaire de garder

une homogénéité visuelle permettant une bonne relation d'une exposition à une autre et

d'une opération de navigation à l'autre.

De plus, La nature des différents types de vues (cartes, diagrammes et tables) affecte sans

aucun doute la quantité ou la qualité des informations qui peuvent être représentées par

chacun. Ainsi, sur une carte par exemple, il est important de limiter le nombre de thèmes

pouvant être représenté et visualisé dans la limite du visible. A cause de conflits possibles

Mastère ASIG / Projet Bibliographique 2008 27

entre les vues, il devient alors nécessaire de définir des priorités dans l'utilisation de

variables visuelles. Un manager de règles graphique doit être mis en œuvre dans un outil

SOLAP pour réduire au minimum les collisions potentielles et facilement créer des

multicartes, des cartes thématiques complexes et des cartes supportées par diagramme.

Enfin, La synchronisation de la symbologie graphique d'une vue à une autre facilite

cognitivement l'identification et l'interprétation des données. En utilisant même

symbologie dans toutes les expositions, il devient plus facile de découvrir et mettre en

évidence des informations appropriées.

Figure 19 : Synchronisation de la symbologie

3.2.6 Données spatiales contextuelles

Un des avantages d'utiliser des cartes consiste dans l’utilisation d’informations

contextuelles afin d’aider les utilisateurs à se localiser. Ces informations contextuelles

sont essentielles pour l'analyse dans beaucoup de situations. Les types différents

d'informations sur le secteur délimitant le phénomène étudié sont souvent aussi importants

dans la construction de la connaissance que le phénomène lui-même.

Dans une vue de carte, il est possible d'ajouter les différents types de données à l'arrière-

plan de la carte pour réaliser ce but (réseaux, hydrographie, limites administratives,

photographies aériennes). Un outil SOLAP doit ainsi permettre de montrer des données

contextuelles en plus des données spatiales étant utilisées pour la représentation

thématique.

Mastère ASIG / Projet Bibliographique 2008 28

Figure 20 : La carte source d’informations contextuelles

3.2.7 Légende interactive

Dernièrement, de la même façon, la légende répond à cette interactivité SOLAP et tient

compte dynamiquement des opérations spatiales de forage. Ainsi, on peut voir la légende

interactive comme une vue graphique spécifique à la sémantique des données analysées.

Mastère ASIG / Projet Bibliographique 2008 29

4 APPROCHES POUR LE DEVELOPPEMENT D’APPLICATION SOLAP

Il existe trois familles de solutions technologiques pour le développement et l’implantation

d’une application SOLAP, basées sur les technologies utilisées et les fonctionnalités

disponibles. Les fonctions du volet descriptif peuvent évidemment être supportées par un

serveur OLAP conventionnel ou par un SGDB relationnel ou objet-relationnel avec

structure en étoile, en flocon ou en constellation*. Les avantages d'un serveur OLAP pour

le volet descriptif incluent les fonctionnalités d’agrégation de données et les capacités

optimisées d’accès aux données, ce qui augmente la rapidité d’analyse pour les grands

volumes de données. Les fonctions du volet cartographique peuvent, quant à elles, être

supportées par un logiciel de visualisation cartographique, un logiciel de cartographie

assistée par ordinateur (CAO) ou un SIG.

Les trois familles de solutions basées sur les technologies et fonctionnalités disponibles

sont : (1) les solutions OLAP dominant, (2) les solutions SIG dominant, et (3) les

solutions intégrées ou hybrides qui font appel autant aux fonctions OLAP que SIG.

Au sein de cette classification, c'est l’outil dominant qui offre ou qui fait appel à certaines

fonctionnalités minimales de l’autre outil. Parfois, l'outil dominant fournit l’unique

interface graphique de l’application SOLAP, parfois l'interface unique peut être

développée avec un langage de programmation (ex. Java, VB, C++). Pour les deux

premières familles, un groupe de fonctionnalités domine largement l'autre groupe et

l'application est développée autour de l'outil dominant. Inversement, dans le cas de la

solution intégrée, les fonctionnalités tant OLAP que SIG sont offertes à un niveau

supérieur, l'interface graphique principale est unique et construite au-dessus des

technologies sous-jacentes (i.e. OLAP et SIG) et l'application SOLAP est développée pour

tirer profit de l'intégration des fonctions OLAP et SIG. Dans ce dernier cas, lorsque ces

fonctionnalités et l'interface principale forment un produit logiciel autonome (ex. JMap

Spatial OLAP Extension [KHEOPS 2005]), nous parlons d'une technologie SOLAP. Les trois

familles de solutions répondent à des besoins différents. Dans le premier cas, le volet

cartographique n'est qu'accessoire. Dans le deuxième cas, c'est le volet OLAP qui est

accessoire. Dans le dernier cas, les deux volets sont jugés importants et leur coordination

ou synchronisation est une particularité clé de cette technologie.

Mastère ASIG / Projet Bibliographique 2008 30

4.1 OLAP DOMINANT

Application développée autour d’un serveur OLAP.

Les fonctions OLAP sont dominantes et les fonctions SIG sont minimales.

Ex. zoom, déplacement, sélection, gestion des couches actives.

Parfois, forage spatial minimal.

4.1.1 Avantages

• Supporte l’exploration et la visualisation OLAP.

• Utilise les capacités d’un serveur OLAP.

• Adéquat pour des besoins d’exploration et de visualisation cartographiques simples.

4.1.2 Inconvénients

• Nécessite des analyses complexes pour fournir une interface, à l’usager, élégante et

efficace.

• Requiert des mois de programmation (Les alliances récentes entre les fournisseurs OLAP

et SIG simplifient grandement ces développements).

• Nombre limité de dimensions spatiales et d’analyses.

• Interactions limitées.

• S’intègre mal au processus complexe de mise à jour des données spatiales.

L’application de santé environnementale (cf. figures 5) développée avec ProClarity et le

plugiciel KMapX, ainsi que l’application sur la gestion du réseau routier (cf. figure 3)

développée avec ProClarity et GeoMedia WebMap d’Intergraph font partie de la catégorie

des OLAP dominant. Quoiqu’intéressantes, ces applications auraient nécessité beaucoup

plus de programmation pour atteindre les niveaux de fonctionnalité et de flexibilité offerts

par les solutions intégrées.

4.2 SIG DOMINANT

Applications développées autour d’un SIG et d’un SGBD.

Fonctions SIG prédominantes et fonctions OLAP minimales.

Ex. Forage et remontage sur un tableau

Mastère ASIG / Projet Bibliographique 2008 31

4.2.1 Avantages

• Supporte la cartographie thématique propre aux SIG.

• Utilise des capacités d’analyses spatiales.

• Adéquat lorsque les cartes ont une importance principale et que les tableaux et

graphiques restent simples.

4.2.2 Inconvénients

• Nécessite des analyses complexes pour fournir une interface, à l’usager, élégante et

efficace.

• Requiert des mois de programmation (Les alliances récentes entre les fournisseurs OLAP

et SIG simplifient grandement ces développements).

• Interactions limitées.

L’application de santé environnementale (cf. figures 5) développées par programmation

Visual Basic à partir du SGBD MS Access et du logiciel de visualisation cartographique

SoftMap fait partie de la famille des SIG dominant. Cette application va exigée davantage

d’efforts de programmation que les solutions OLAP dominant précédentes étant donné

l’absence de serveur OLAP pour la gestion des données multidimensionnelles.

4.3 SOLAP INTÉGRÉ

Haut niveau de fonctionnalités pour les vues et données spatiales et non-spatiales.

Intégration sophistiquée et synchronisée des fonctions OLAP et SIG.

4.3.1 Avantages

• Interface à l’usager plus efficace.

• Fonctions plus riches (Ex. exploration synchronisée des cartes, tableaux et graphiques).

• S’intègre bien au processus complexes de mises à jour des données spatiales.

• Requiert ou non des SIG ou OLAP (peut exploiter directement les données).

4.3.2 Inconvénients

• Nécessite des analyses complexes pour fournir une interface à l’usager efficace.

• Requiert passablement de développement

Les applications des figures 4, 6, 7 et 9 ont nécessité très peu d’effort de développement,

puisqu’elles ont été déployées dans une solution SOLAP intégrée toute prête(JMap Spatial).

Mastère ASIG / Projet Bibliographique 2008 32

5 NOTIONS ET ARCHITECTURES DES BASES DE DONNEES OLAP/SOLAP

5.1 INTRODUCTION OLAP OLAP (Online Analytical Processing)

Il s’agit d’une catégorie de logiciels axés sur l’exploration et l’analyse rapide des données

selon une approche multidimensionnelle à plusieurs niveaux d’agrégation.

Il existe plusieurs déclinaisons sur le marché qui permettent d’adapter le stockage des

données sur différents types de base de données pour implémenter le concept OLAP :

• R-OLAP (Relational OLAP)

• D-OLAP (Dynamic ou Desktop OLAP)

• M-OLAP (Multidimensionnel OLAP)

• H-OLAP (Hybrid OLAP = ROLAP + MOLAP)

• S-OLAP (Spatial OLAP)

OLAP est très simple car l’usager n’a pas à maitriser des langages d’interrogation de bases

comme le SQL et des interfaces complexes. De plus OLAP est très rapide car il exploite une

dénormalisation maximale des données, sous la forme d’une pré-agrégation stockée.

L’usager devient donc opérationnel en très peu de temps.

OLAP est structuré avec une approche multidimensionnelle, basé sur des thèmes d’analyse

(dimensions*), beaucoup plus intuitive.

De plus, les données peuvent être groupées à différents niveaux de granularité* (les

regroupements sont pré-calculés, par exemple, le total des ventes pour le mois dernier

calculé à partir de la somme de toutes les ventes du mois).

5.2 VOCABULAIRE OLAP

5.2.1 Dimensions ou axes Une dimension peut être définie comme un thème, ou un axe (attributs), selon lequel les

données seront analysées (en fonction de…)

Ex : Temps, Découpage Administratif, Produits

Une dimension contient des membres organisés en hiérarchie, chacun des membres

appartenant à un niveau hiérarchique (ou niveau de granularité) particulier.

Mastère ASIG / Projet Bibliographique 2008 33

Ex : Pour la dimension Temps : les années, les mois et les jours peuvent être des exemples

de niveau hiérarchiques. 1998 est un exemple de membre du niveau Année.

5.2.2 Mesures Une mesure est un élément de données sur lequel portent les analyses, en fonction des

différentes dimensions.

Ex : coût des travaux, nombre d’accidents, ventes, dépenses.

5.2.3 Faits Un fait représente la valeur d’une mesure, mesurée ou calculée, selon un membre de

chacune des dimensions (ce qui est recueilli par les systèmes transactionnels).

Ex : « le coût des travaux en 1995 pour la région 02 est de 250000€ » est un fait qui

exprime la valeur de la mesure « coût des travaux » pour le membre « 1995 » du niveau

« année » de la dimension « temps » et le membre « 02 » du niveau « région » de la

dimension « découpage administratif ».

5.2.4 Cubes Un ensemble de mesures organisées selon un ensemble de dimensions (aussi hypercube).

Ex : Un cube de ventes qui comprend :

• Les dimensions Temps, Produit, Magasin

• La mesure Ventes en €

Figure 21 : Modélisation UML d’un exemple de cube

Mastère ASIG / Projet Bibliographique 2008 34

5.3 EXEMPLES CONCRETS DE CUBE MULTIDIMENSIONNEL

5.3.1 EXEMPLE 1: Le cube multidimensionnel suivant présente les profits d’entreprises agricoles par

‘propriété’, par ‘exploitation’ et par ‘année’.

• CAS 1 : visualisation des profits des propriétés >= 0.05 km² pour toutes les exploitations

durant les 4 années.

• CAS 2 : visualisation des profits des propriétés >= 1.5 km² pour l’exploitation de légumes

pour l’année 1993.

5.3.2 EXEMPLE 2:

Au départ nous avons une table ‘vente’ constituée de colonnes comme présenté dans des

bases de données relationnelles (figure suivante).

L’analyse s’avère complexe car une feuille de papier ne possède que deux dimensions. Si

l’on veut faire une sélection sur celui-ci. Mais si on s’intéresse ensuite à ce qui s’est passé

en février sur tous les magasins, il faut repartir des données de départ et faire une autre

sélection.

Mastère ASIG / Projet Bibliographique 2008 35

Chaque case du cube représente une valeur. Les dimensions sont indiquées sur les arêtes

du cube. Un plan du cube correspond à toutes les valeurs pour une seule position d’une des

trois dimensions. Par exemple, la face avant est celle du magasin ‘Paris Bastille’. Enfin, le

cube complet représente une mesure, parfois appelé population d’analyse, concernant ici

le nombre de chaussures vendues.

En ajoutant la mesure ‘Total HT’, on obtient un nouvel objet à 4 dimensions : Mois,

Modèle, Magasin, plus une dimension Indicateur, dont les positions correspondent aux

mesures existantes. Ce nouvel objet est appelé Hypercube*.

5.4 ARCHITECTURE OLAP

L’architecture OLAP consiste en trois services :

Base de données :

• Doit supporter les données agrégées ou résumées

• Peut provenir d’un entrepôt ou d’un marché de données*

• Doit posséder une structure multidimensionnelle (SGDB multidimensionnel ou relationnel)

Serveur OLAP :

• Gère la structure multidimensionnelle dans le SGBD

• Gère l’accès aux données de la part des usagers

Module client :

• Permet aux usagers de manipuler et d’explorer les données

Mastère ASIG / Projet Bibliographique 2008 36

• Affiche les données sous forme de graphiques statistiques et de tableaux

• Selon le type de base de données accédé, plusieurs configurations sont possibles :

multidimensionnelle, relationnelle ou hybride.

5.5 MOLAP (OLAP MULTIDIMENSIONNEL) • Les données détaillées de base ainsi que les données agrégées de l’entrepôt sont

stockées dans une base de données multidimensionnelle (souvent appelée cube ou

hypercube).

• Une base de données multidimensionnelle utilise une structure propriétaire au logiciel

utilisé (≈ matrice)

• Le serveur MOLAP extrait les données de l’hypercube et les présente directement au

module client

Base de données multidimensionnelle (hypercube)

Serveur MOLAP Client OLAP

Figure 22 : Architecture MOLAP

5.6 ROLAP (OLAP RELATIONNEL)

• Les données détaillées de base ainsi que les données agrégées de l’entrepôt sont

stockées sous forme de tables dans une base de données relationnelle

• La base de données relationnelle doit être structurée selon un modèle particulier (étoile,

flocon, …)

• Le serveur extrait les données par des requêtes SQL et interprète les données selon une

vue multidimensionnelle avant de les présenter au module client

Mastère ASIG / Projet Bibliographique 2008 37

Base de données relationnelle (étoile ou flocon)

Serveur ROLAP

Vue multidimensionnelle

Client OLAP

Figure 23 : Architecture ROLAP

5.7 HOLAP (OLAP HYBRIDE)

• Architecture qui consiste en un croisement des architectures MOLAP et ROLAP

• Les données détaillées de base de l’entrepôt sont stockées dans une base de données

relationnelle et les données agrégées sont stockées dans une base de données

multidimensionnelle

• Le serveur HOLAP accède deux bases de données et les présente au module client, selon

une vue multidimensionnelle dans le cas des données de la BD relationnelle

Figure 24 : Architecture HOLAP

Mastère ASIG / Projet Bibliographique 2008 38

5.8 BILAN MOLAP/ROLAP/HOLAP

5.9 STRUCTURE MULTIDIMENSIONNELLE

Pour une configuration ROLAP ou HOLAP, il est nécessaire de simuler une structure

multidimensionnelle dans un SGBD relationnel à l’aide de modèles particuliers qui

permettent de mieux répondre aux besoins multidimensionnels :

• Modèle en étoile (Star Schema)

• Modèle en flocon (Snowflake Schema)

• Modèle mixte (Mixed Schema)

• Modèle en constellation (Fact Constellation Schema)

5.9.1 Modèle en étoile Le schéma en étoile tire son nom de sa configuration:

• Objet central, nommé table des faits

• Connecté à un certain nombre d’objets de manière radiale, les tables de dimension

La table des faits, comme son nom l’indique, contient les faits

Les tables de dimensions contiennent les attributs définissant chacun des membres des

dimensions. Elles sont dénormalisées.

Mastère ASIG / Projet Bibliographique 2008 39

Figure 25 : Modèle en étoile

5.9.2 Modèle en flocon

• Le schéma en flocon est dérivé du schéma en étoile où les tables de dimension sont

normalisées (la table des faits reste inchangée)

• Avec ce schéma, chacune des dimensions est décomposée selon sa ou ses hiérarchie(s)

Figure 26 : Modèle en flocon

Mastère ASIG / Projet Bibliographique 2008 40

5.9.3 Modèle Mixte Il s’agit d’une structure qui résulte de la meilleure combinaison des deux types de modèles

précédents

Seules quelques dimensions seront normalisées, souvent il s’agit des plus grandes tables et

celles contenant le plus de redondance

Figure 27 : Modèle Mixte

5.9.4 Modèle en constellation Le schéma en constellation est en fait composé de plusieurs schémas en étoile qui

partagent des tables de dimension.

Figure 28 : Modèle en constellation

Mastère ASIG / Projet Bibliographique 2008 41

Plusieurs architectures possibles (SGBDM, SGBDR, SIG, serveur OLAP, client OLAP, logiciel

de visualisation, DAO, logiciel statistique, …)

Exemples :

• ICEMSE = Access + SoftMap + VB

• MSSS = SQL Server + JMap + Java

• MTQ routier = SQL Server (Analysis Services) + ProClarity + Geomedia + VB

5.10 LA CAS JMAP SPATIAL OLAP La solution logicielle JMap Spatial OLAP (SOLAP) est basée sur une architecture ROLAP, ne

présentant pas encore de serveur multidimensionnel. Les données sont stockées dans une

base de données relationnelle, structurée selon un schéma multidimensionnel (schéma en

étoile, flocon ou constellation).

Les agrégations doivent être calculées et stockées dans la base de données

Figure 29 : architecture JMap Spatial

Mastère ASIG / Projet Bibliographique 2008 42

CONCLUSION

Le SIG est devenu un support important dans l’information décisionnelle et dans le

domaine de la business intelligence. C’est devenu un réel besoin et un réel apport dans

l’ajout d’une composante spatiale dans une interface BI.

Actuellement, les outils traditionnels utilisés pour exploiter les entrepôts de données

spatiaux ne peuvent facilement exploiter le plein potentiel de la composante spatiale.

Leur couplage avec un outil SIG est courant lorsque la visualisation cartographique des

données est requise. Mais malgré ses capacités d’analyse spatiale poussées, le SIG n'est pas

bien adapté, dans sa forme actuelle, pour soutenir l’aide à la décision car il s’agit d’un

système de type transactionnel.

OLAP est l’outil premier en matière de solution décisionnelle. Et cependant, grâce aux

recherches de M. Yvan Bédard, OLAP et SIG ont pu se combiner et ont enrichi

considérablement le domaine de la BI. Ils ont ainsi créé une nouvelle déclinaison SOLAP.

Cette technologie SOLAP permet de supporter efficacement la prise de décision

stratégique de manière facile et rapide, à différents niveaux de hiérarchie, à différentes

époques, selon différentes vues (tabulaires, graphiques et cartographiques).

Le développement d’applications SOLAP a permis l'enrichissement des méthodes de

conception, l'optimisation et la mise à jour des bases de données géospatiales

décisionnelles, l’intégration et l’agrégation de données multidimensionnelles géospatiales,

le contrôle de leur qualité ainsi que l'amélioration des technologies existantes.

L'usager peut manipuler et naviguer dans ses données plus facilement que dans le SIG. Pour

toutes ces raisons, une partie de l'avenir du domaine de l'aide à la décision géospatiale

repose sur l'approche multidimensionnelle et celle-ci s'impose dorénavant pour le

développement d'applications spatio-temporelles.

Mastère ASIG / Projet Bibliographique 2008 43

BIBLIOGRAPHIE

http://decigeo.over-blog.com/

Décigéo ; c’est le blog discutant des dernières nouveautés ou manifestations des systèmes

d’information Géographique et de la Business Intelligence. Il a pour but de regrouper

toutes les informations sur la convergence entre la Business Intelligence et la cartographie

automatisée.

http://www.scg.ulaval.ca/

Site du département des sciences géomatiques de l’université de Laval

http://sirs.scg.ulaval.ca/YvanBedard/enewindex.asp

Site personnel du professeur Yvan Bédard exposant toutes ses publications concernant la

recherche de données géospatiales décisionnelles. (Technologie SOLAP : combinaison

SIG/OLAP)

http://www.spatialbi.com/

Portail sur le décisionnel spatial SOLAP, combinant SIG et OLAP.

http://www.kheops-tech.com/

Site de l’éditeur du logiciel JMap SOLAP

http://www.esrifrance.fr/sig2005/pageLibre00010340.htm

Page contenant les Comptes rendus de présentations de la conférence Francophone ESRI

concernant le décisionnel et le géomarketing.

http://fr.wikipedia.org/wiki/Accueil

-L’informatique décisionnelle (Business Intelligence)

- OLAP

- Business Object