Les données ouvertes du SEAO : un cas dans le réseau de l’éducation
François BelleauDirection de la gouvernance et de la gestion des ressources
informationnelles dans les réseaux2015-11-17
Rôle de la DGGRIR
● La DGGRIR est notamment responsable ○ de l’application de la loi 133 dans les réseaux de l’éducation ○ la transposition de la stratégie gouvernementale en RI○ de la sécurité de l’information
● Pour les 3 réseaux :○ Commissions scolaires, cégeps, Universités : 140 organismes
● L’équipe fait une veille des contrats attribués sur le SEAO.● En 2015, le portefeuille de projets des réseaux de l’éducation compte 1700
projets d’une valeur totale de 500 M$.● Parmi eux, 600 projets de plus de 100 k$ font l’objet d’une reddition de
compte détaillée.● La DGGRIR doit faire le lien entre les contrats SEAO et les projets TI.
SEAO : Système électronique d’appel d’offres du gouvernement du Québechttps://www.seao.ca/
4 projets exploitant les données ouvertes du SEAO
Pourquoi en développer un autre ?
● Quels sont les projets d’implantation d’un réseau sans-fil dans les institutions du réseau de l’éducation ?○ Qui sont les principaux fournisseurs ?○ Combien ça coûte ?○ Est-ce une tendance ?
Pour y répondre, un moteur de recherche analytique capable d'agréger les données est nécessaire.
Tableau de bord SEAO de la DGGRIR
Elasticsearch est un moteur de recherche analytique basé sur Lucene qui fonctionne sur une grappe de serveurs.
Qui utilise Elasticsearch ?
● Le tableau de bord de la DGGRIR est réalisé avec les logiciels libres :○ Talend○ Elasticsearch○ Kibana
● Les données ouvertes du SEAO y sont importées.
Voici comment on s’y prend...
5 étapes
1. Trouver les données ouvertes2. Télécharger les données ouvertes3. Transformer les données (ETL Talend Open
Studio)4. Charger les données dans un moteur de
recherche analytique (grappe Elasticsearch)5. Exploiter les données (Kibana)
Trouvez les données
Télécharger les données ouvertes, 500 Mo de XML
Transformer les données XML en JSON avec Talend
Charger les données dans Elasticsearch
Grappe Elasticsearch de 4 serveurs
Explorer les données dans Kibana
Chercher dans les données
Visualiser les données
Assembler un tableau de bord
Et voilà !
● Trois logiciels libres à retenir pour exploiter des données ouvertes :
○ Grappe de données avec Elasticsearch■ https://www.elastic.co/products/elasticsearch
○ ETL avec Talend Open Studio for Data Integration■ http://www.talend.com/products/data-integration
○ Tableau de bord avec Kibana■ https://www.elastic.co/products/kibana
Publication de données ouvertes avec Elasticsearch
Remerciements
Mes collègues de la DGGRIR
Les programmeurs
Sébastien Harvey@SAAQ
Omer Roland Quenum@ulaval
Depuis 2013, la vision du W3C: DATA ACTIVITY
web sémantiqueeGouvernement
web des données