Upload
xavier-raffin
View
780
Download
0
Embed Size (px)
Citation preview
L’Open Data à Tisséo
La Cantine
6 > 8 Open Data
Tisséo
10/11/2015
Open Data : définition
Donnée publique ou privée, diffusée selon une licence libre, laquelle
garantit son libre accès et sa réutilisation par tous sans restriction
technique, juridique ou financière.
Ce mouvement considère l’information publique comme un bien commun
dont la diffusion est d’intérêt public et général.
2
Contexte : l’open data en France
L’Open Data en France
• 2002 : prémices
• Lobbyings citoyens (LiberTIC, Regards Citoyens, Wikimédias
France, Openstreetmap France,…)
• 2010 : Paris et Rennes
• 2011 : Etalab, Toulouse, Bordeaux, Nantes,…
• SNCF, RATP, BNF, Météo France, …
3
Contexte : carte des ouvertures de données
4
Présentation de Tisséo
Tisséo est un établissement public, régie des transports urbains couvrant
101 communes (965 000 habitants en 2014).
• 173 000 000 de validations en 2014
• 2 lignes de métro
• 116 rames, 37 stations
• 5h à 00h (3h le weekend)
• Fréquence mini : 1’05
• 2 lignes de tram
• 28 rames 27 stations
• 4h50 à 0h30 (1h30 le weekend)
• Fréquence mini : 7’30
• 90 lignes de bus + 9 lignes de TAD + 24 lignes scolaires
• 600 bus, 3600 arrêts
• 5h à 00h (1h le weekend)
5
L’open Data chez Tisséo
Tisséo libère des données à destination de l’information voyageurs :
• les horaires
• les positions et noms d’arrêts
• les tracés et nom de lignes
• les passages en temps réel
1 API, 2 fichiers horaires statiques (GTFS, Neptune/Trident), 3 fichiers
cartographiques (stations de métro, stations de tram, arrêts de bus).
L’équipe Tisséo s’appuie sur différents profils (développeur, architecte
logiciel, spécialiste données, référent numérique) qui ne travaillent pas à
temps plein sur l’Open Data.
L’open data entraine des contraintes de :
• qualité et fiabilité de données
• organisation des services et logiciels
• changement des mentalités
6
Détails des utilisations de l’API Tisséo
Nombre de clés d’API 212 clés demandées (à noter que certaines clés sont utilisées par des promotions
complètes d’étudiants pour des TP, généralement une quarantaine d’élèves d’écoles
d’ingénieur, de master ou d’IUP informatique)
Documentation API téléchargée 2543 fois
Nombre de requêtes OpenData15 millions par mois, en croissance très importante (dont 6,5 millions pour les
applications officielles Tisséo)
Composition des requêtes64% de prochains passages en temps réel
20% de recherche de lieux, arrêts, adresse (« autocompletion et géocodage »)
6% de messages d’information réseau
5% calcul d’itinéraire
7
Croissance de l’usage de l’API
8
OpenData Transport : données + audience
9
Utilisateurs du temps réel
Les utilisateurs de l’API
Startup internationales : The transit App (550 000/Mois), Moovit (400 000/Mois)
Applis locales : Bus31 (2.7 M/mois) , Toulouse Bus (450 000/Mois), Go Toulouse (150 000/Mois)
Ecrans Hall d’accueil : Une startup Toulousaine CityMéo (628000/Mois), et des particuliers (390000)
Universitaires : ifstar (11M sur le mois de Juin !), IRIT, UPS, IUT informatiques, …
Quelques exemplesBus 31 Moovit The Transit App UrbanPulse Mapgnificent
10
Fichiers statiques
L’offre au format GTFS, déposée de façon hebdomadaire
Le format est documenté et illustré : https://developers.google.com/transit/gtfs/Le site contient la documentation complète des fichiers et des champs attendus ainsi que quelques exemples de réseaux et d’outil de validation de données.
Il s’agit d’une archive ZIP contenant 8 fichiers texte décrivant les arrêts, les lignes, les horaires, les dates d’application et le tracé des lignes.
11
La licence : ODBL
Licence développée par l' Open Knowledge Foundation
Vous êtes libres :
• de partager : copier, distribuer et utiliser la base de données.
• de créer : produire des créations à partir de cette base de données.
• d'adapter : modifier, transformer et construire à partir de cette base de données.
Aussi longtemps que :
• Vous mentionnez la paternité : Vous devez mentionner la source de la base de
données pour toute utilisation publique de la base de données, ou pour toute création
produite à partir de la base de données, de la manière indiquée dans l'ODbL. Pour toute
utilisation ou redistribution de la base de données, ou création produite à partir de cette
base de données, vous devez clairement mentionner aux tiers la licence de la base de
données et garder intacte toute mention légale sur la base de données originaire.
• Vous partagez aux conditions identiques : si vous utilisez publiquement une version
adaptée de cette base de données, ou que vous produisiez une création à partir d'une
base de données adaptée, vous devez aussi offrir cette base de données adaptée selon
les termes de la licence ODbL.
• Gardez ouvert : si vous redistribuez la base de données, ou une version modifiée de
celle-ci, alors vous ne pouvez utiliser de mesure technique restreignant la création que
si vous distribuez aussi une version sans ces restrictions.
12
Open data transport
Plusieurs calculateurs Open Source :
Le temps-réel bas niveau :
• GTFS-RT
• …
OpenService et API:
https://api.sncf.com (+ portail https://data.sncf.com )
https://api.navitia.io (+portail https://navitia.opendatasoft.com)
Groupe de réflexion Open Transport
13
Données transport : les lignes
Les lignes sont identifiées par un nom et un numéro.
Ligne 66 : St Cyprien République / Aéroport Toulouse Blagnac
Elles ont comme propriétés :
la couleur
la couleur du texte
les noms des directions principales
un mode de transport
Fichier GTFS correspondant : routes.txt
Point d’entrée API correspondant : lines
Elles sont composées d’itinéraires.
15
Données transport : les itinéraires
Un itinéraire est une suite ordonnée d’arrêts desservis.
Une ligne est composée d’un ou de plusieurs itinéraires, généralement 2
(Aller et Retour).
La ligne Noctambus n’a qu’un seul itinéraire. La ligne 61 a 21 itinéraires
(c’est une ligne à 3 fourches et des variantes les jours de marchés).
Un itinéraire possède une géométrie, un tracé cartographique.
16
Données transport : les services
Un service est une suite d’horaires appliqués à un itinéraire selon un
calendrier.
Le service départ 8h30 de l’itinéraire Aller de la ligne 66 circule du lundi au
vendredi sauf pendant les vacances scolaires.
Fichier GTFS correspondant :
• service : trips.txt
• Calendrier : calendar.txt et calendar_dates.txt
17
Données transport : les horaires
Un horaire est le lien entre un service et un arrêt physique
Le service départ 8h30 de l’itinéraire Aller de la ligne 66 circule du lundi au
vendredi sauf pendant les vacances scolaires et dessert l’arrêt Purpan à
8h42.
Fichier GTFS correspondant : stop_times.txt
Point d’entrée API correspondant : stops_schedules
18
Données transport : les arrêts physiques
Un arrêt physique est un poteau d’arrêt pour une ligne de bus, un quai pour
une ligne de tram ou de métro.
Les arrêts physiques ont :
• Un nom
• Une position géographique précise, exprimée dans un référentiel
cartographique (WGS84 pour le fichier GTFS)
• Une accessibilité PMR
Fichier GTFS correspondant : stops.txt
Point d’entrée API correspondant : stop_points
19
Données transport : les zones d’arrêts
Une zone d’arrêt est un regroupement d’un ou plusieurs arrêts physiques.
C’est généralement à cet objet que fait référence un usager lorsqu’il dit « Je
pars d’Esquirol ». Je vais à « Compans – Caffarelli ».
La position d’une zone d’arrêt est le barycentre des arrêts physiques la
composant sauf surcharge.
Le nom d’une zone d’arrêt peut différer des noms des arrêts physiques le
composant.
Fichier GTFS correspondant : stops.txt
Point d’entrée API correspondant : stop_areas
20