63
Présentation 8 juin 2012 ADN – Alexander’s Drifts Net Préparé et présenté par Alexandre SERVIGNE – Responsable des Prévisions de trafic et Raphaël BOUDRA – Support Statistiques et Méthodes

Prévisions trafic aérien

  • Upload
    cornec

  • View
    2.830

  • Download
    1

Embed Size (px)

DESCRIPTION

Alexandre Servigne (ADP

Citation preview

Page 1: Prévisions trafic aérien

Présentation 8 juin 2012

ADN – Alexander’s Drifts Net

Préparé et présentépar Alexandre SERVIGNE – Responsable des Prévisions de traficet Raphaël BOUDRA – Support Statistiques et Méthodes

Page 2: Prévisions trafic aérien

Orly, Décembre 2010

Plan

1 PRESENTATION D’  ADN » 1.1 Eléments de contexte

Principales variables prévuesDifférentes segmentations

2 PRESENTATION DU MOTEUR « ADN »2.1 Architecture2.2 Modèles intégrés

NPSARIMASARIMAXDECOMPOSITION TENDANCE CYCLEMODELES ECONOMETRIQUES

2.3 Agrégation des prédicteurs

3 Piste: optimisation quadratique sous contrainte linéaire

Page 3: Prévisions trafic aérien

Orly, Décembre 2010

PRESENTATION D’ »ADN »

Page 4: Prévisions trafic aérien

Orly, Décembre 2010

Production des prévisions de trafic à court, moyen et long termes, indispensables à l'entreprise :

1/ pour sa gestion courante;

2/ pour élaborer son programme d'investissement;

3/ pour alimenter sa réflexion stratégique;

4/ pour permettre d'élaborer certains document contractuels ou légaux ;

5/ pour alimenter ses études d'opportunité sur les opérations d'acquisition d'aéroports tiers.

Eléments de contexte

Page 5: Prévisions trafic aérien

Orly, Décembre 2010

Principales variables prévues

1.2 Principales variables prévues…

Page 6: Prévisions trafic aérien

Orly, Décembre 2010

1.2 Principales variables prévues…

Nombre de passagers : 88 Millions en 2011

Passagers en Origine/Destination

Passagers en Correspondance

Page 7: Prévisions trafic aérien

Orly, Décembre 2010

1.2 Principales variables prévues…

Nombre de Mouvements : 735 400 en 2011

Mouvements mixtes

Mouvements cargos

Page 8: Prévisions trafic aérien

Orly, Décembre 2010

1.2 Principales variables prévues…

Emport ( nombre moyen de passagers par avion ) : 130

Page 9: Prévisions trafic aérien

Orly, Décembre 2010

1.2 Principales variables prévues…

Masse Maximale au Décollage par catégorie avion : 36 Millions tonnes/an

Page 10: Prévisions trafic aérien

Orly, Décembre 2010

Une segmentation du trafic à géométrie variable selon la demande :

Page 11: Prévisions trafic aérien

Orly, Décembre 2010

• géographique : 12 régions, 200 pays, 2000 destinations

1.3 segmentation du trafic à géométrie variable selon la demande

Page 12: Prévisions trafic aérien

Orly, Décembre 2010

• physique : 2 plateformes, 13 aérogares

1.3 segmentation du trafic à géométrie variable selon la demande

Page 13: Prévisions trafic aérien

Orly, Décembre 2010

• stratégique : 200 compagnies aériennes, alliances et code-share.

1.3 segmentation du trafic à géométrie variable selon la demande

Page 14: Prévisions trafic aérien

Orly, Décembre 2010

• comptable : 5 faisceaux de facturation

1.3 segmentation du trafic à géométrie variable selon la demande

Page 15: Prévisions trafic aérien

Orly, Décembre 2010

Compte tenu :

• la multiplicité des facteurs à prendre en compte

• de leurs intéractions

• la multiplicité des flux et de leurs configurations

• l’homogénéité à préserver

Motivation de »ADN »

Page 16: Prévisions trafic aérien

Orly, Décembre 2010

l’outil nécessite :

• de la flexibilité

• de la traçabilité

• de la modularité

• une exécution rapide

Motivation de »ADN »

Page 17: Prévisions trafic aérien

Orly, Décembre 2010

En résumé il doit permettre de se faciliter la vie à modéliser et dégager du temps pour aborder le transport aérien sous d’autres aspects:

Économique et géopolitiques : revenu des ménages, prix du pétrole, tensions géopolitiques, echanges commerciaux,…

Sociologique et démographique : population,…

Techniques : évolutions des types avions, consommation, ..

stratégiques : concurrence des autres modes de transport, degré de concentration ( alliance, fusion,..),

structure des réseaux, low-cost,..

Financiéres : taxes , redevances , prix du billet,..

Réglementaires : sureté, sécurité, développement durable,..

Capacitive : sureté, sécurité, développement durable,..

Motivation de »ADN »

Page 18: Prévisions trafic aérien

Orly, Décembre 2010

1.2 caractéristiques

« ADN » est un moteur de calcul intégré dans une architecture dont les données sont organisées en arborescence.

Il intègre des prédicteurs paramétriques et non paramétriques

et fournit une prévision en agrégeant ces prédicteurs.

Page 19: Prévisions trafic aérien

Orly, Décembre 2010

1.2 caractéristiques

Un outil de simulation et d’aide à la décision qui doit prendre en compte :

1. les prévisions du modèle Kenza 2. l’expertise métier 3. les points cibles décidés par le comité exécutif

Page 20: Prévisions trafic aérien

Orly, Décembre 2010

1.4 Quelle architecture ?

Quelle architecture ?

Page 21: Prévisions trafic aérien

Orly, Décembre 2010

Régions

Pays

Villes

Terrains

Opérateurs

Une architecture dont les données sont organisées en arborescence :

ADP

1.4 Quelle architecture ?

Page 22: Prévisions trafic aérien

Orly, Décembre 2010

…. Et les arborescences peuvent être corrélées entre elles

PAX

MVT

EMPORT MMD

1.4 Quelle architecture ?

Page 23: Prévisions trafic aérien

Orly, Décembre 2010

Orly CDG

ADP

Régions

Pays

Villes

Terrains

Opérateurs

Une architecture approchée à différents niveaux par différentes méthodologies :

PAX

KENZA

ADN

Point Cible

Expertise métier

Page 24: Prévisions trafic aérien

Orly, Décembre 2010

Orly CDG

ADP

Régions

Pays

Villes

Terrains

Opérateurs

Une architecture approchée à différents niveaux par différentes méthodologies :

KENZA

PAX

Page 25: Prévisions trafic aérien

Orly, Décembre 2010

Orly CDG

ADP

Régions

Pays

Villes

Terrains

Opérateurs

Une architecture approchée à différents niveaux par différentes méthodologies :

PAX

Expertise métier

Page 26: Prévisions trafic aérien

Orly, Décembre 2010

Orly CDG

ADP

Régions

Pays

Villes

Terrains

Opérateurs

Une architecture approchée à différents niveaux par différentes méthodologies :

Point Cible

PAX

Page 27: Prévisions trafic aérien

Orly, Décembre 2010

Orly CDG

ADP

Régions

Pays

Villes

Terrains

Opérateurs

Une architecture approchée à différents niveaux par différentes méthodologies :

ADN

PAX

Page 28: Prévisions trafic aérien

Orly, Décembre 2010

Exemple de segmentation

Page 29: Prévisions trafic aérien

Orly, Décembre 2010

1.5 Une architecture à créer en fonction de la demande :

NA

TIO

NA

L

SC

HE

NG

EN

AU

TR

E U

E

DO

M-T

OM

RE

ST

E D

U M

ON

DE

ADP

Les faisceaux ne sont pas homogènes en terme de comportement des consommateurs. Il n’est donc pas pertinent de modéliser ce niveau de détail.

Segmentation souhaité : faisceaux de facturation

Page 30: Prévisions trafic aérien

Orly, Décembre 2010

1. Une architecture à créer en fonction de la modélisation

Segmentation pertinente pour la modélisation : la région

EU

RO

PE

DE

L’E

ST

A

ME

RIQ

UE

LA

TIN

E

AU

TR

E A

SIE

DO

M-T

OM

AF

RIQ

UE

NA

TIO

NA

L

AM

ER

IQU

E D

U N

OR

D

EU

RO

PE

DU

SU

D

EU

RO

PE

DU

NO

RD

PO

UR

TO

UR

ME

DIT

ER

RA

NE

E

AS

IE D

EV

EL

OP

PE

RE

ST

E D

U M

ON

DE

Les régions regroupent les pays qui évoluent dans un contexte économique et démographique comparables.

ADP

Page 31: Prévisions trafic aérien

Orly, Décembre 2010

1.4 Cohérence des segmentations

Les segmentations sont-elles cohérentes entre-elles?

Page 32: Prévisions trafic aérien

Orly, Décembre 2010

1. Cohérence entre segmentation souhaitée et modélisée

AMERIQUE LATINE

SCHENGEN AUTRE UE DOM-TOMRESTE DU MONDE NATIONAL

EUROPE DE L’ESTFRANCE

EUROPE DU SUD

EUROPE DU NORD

DOM-TOM

AMERIQUE DU NORD

ASIE DEVELOPPE

AFRIQUE

AUTRE ASIE

MEDITERANNEE

Faisceaux

Régions

Page 33: Prévisions trafic aérien

Orly, Décembre 2010

1. Cohérence entre segmentation souhaitée et modélisée

A quel faisceau faut-il rattacher la région Europe de l’est ? 3 faisceaux lui sont associés .

AMERIQUE LATINE

SCHENGEN AUTRE UE DOM-TOMRESTE DU MONDE NATIONAL

EUROPE DE L’ESTFRANCE

EUROPE DU SUD

EUROPE DU NORD

DOM-TOM

AMERIQUE DU NORD

ASIE DEVELOPPE

AFRIQUE

AUTRE ASIE

MEDITERANNEE

Faisceaux

Régions

Page 34: Prévisions trafic aérien

Orly, Décembre 2010

1. Cohérence entre le découpage souhaité et celui modélisé

A quel niveau de détail faut-il descendre pour ne pas avoir ce chevauchement ?

Page 35: Prévisions trafic aérien

Orly, Décembre 2010

ADP

EU

RO

PE

DE

L’E

ST

A

ME

RIQ

UE

LA

TIN

E

AU

TR

E A

SIE

DO

M-T

OM

AF

RIQ

UE

AM

ER

IQU

E D

U N

OR

D

EU

RO

PE

DU

SU

D

EU

RO

PE

DU

NO

RD

PO

UR

TO

UR

ME

DIT

ER

RA

NE

E

AS

IE D

EV

EL

OP

PE

RE

ST

E D

U M

ON

DE

NA

TIO

NA

L

Rep

. Tch

èqu

e

Ro

um

anie

Regroupement de pays : Albanie, Arménie

L’arborescence intégrera les pays afin d’associer les régions aux faisceaux

1. Cohérence entre le découpage souhaité et celui modélisé

Page 36: Prévisions trafic aérien

Orly, Décembre 2010

ADP

L’arborescence intégrera les pays afin d’associer les régions aux faisceaux

ADP

1. Cohérence entre le découpage souhaité et celui modélisé

Page 37: Prévisions trafic aérien

Orly, Décembre 2010

ADP

L’arborescence intégrera les pays afin d’associer les régions aux faisceaux

ADP

1. Cohérence entre le découpage souhaité et celui modélisé

Page 38: Prévisions trafic aérien

Orly, Décembre 2010

• Dans la littérature on entend parler de :

« Blue Chip Average Forecast », « Consensus Forecast ».

=> Il s'agit de moyennes de prévisions issues de divers organismes.

« ADN »: SYSTÈME AUTOMATIQUE DE PREVISIONS

PROPOSANT UNE ALTERNATIVE A LA SELECTION DE

MODELE ...

• « ADN » permet d'obtenir des prévisions par combinaisons

de prédicteurs paramétriques et non paramétriques.

Présentation d’ »ADN »

Page 39: Prévisions trafic aérien

Orly, Décembre 2010

1.Notation/Définition

On observe au cours du temps

2.Objectif

On cherche à prévoir ty

dt Ry )(

Formalisation du problème

Page 40: Prévisions trafic aérien

Orly, Décembre 2010

•L’ »ADN » est un système permettant de modéliser le « détail » tout en respectant les prévisions issues du modèle KENZA.

•On suppose que est une série temporelle.

• La prévision est définie par son espérance conditionnelle:

dt RY )(

)(:ˆ ttt IYEy

Formalisation du problème

Page 41: Prévisions trafic aérien

Orly, Décembre 2010

Méthodes intégrées dans « ADN »

Page 42: Prévisions trafic aérien

Orly, Décembre 2010

1.1.2 EXEMPLE:

Modélisation statistique non paramétrique

BLOC 1 DERNIER BLOC  = BLOC TEMOIN

SERIE MENSUELLE DE TRAFIC FAISCEAU « INTERNATIONAL » DU 1er JANVIER 2003 AU 01APR2012

BLOC 10 BLOC 20

r

r r

r

Page 43: Prévisions trafic aérien

Orly, Décembre 2010

Modélisation statistique non paramétrique

EXPRESSION DES POIDS:

- La mise en œuvre de cette prévision requiert de choisir:

1- Le noyau K ( pas très influent ): on choisit le noyau gaussien

2- la taille des blocs r = taille d’une saison.

3- La fenêtre h(n) déterminée par validation croisée.

n

iTi

TiTi

K

KW

1,

,,

)(

),...,(),...,( 11, nh

YYYYKK riirnn

Ti,avec:

Page 44: Prévisions trafic aérien

Orly, Décembre 2010

Modélisation statistique non paramétrique

COEFFICIENTS DE SIMILARITES : Wi,T ( r=12 ; h(n)=1,385) SERIE TRAFIC INTERNATIONAL

Page 45: Prévisions trafic aérien

Orly, Décembre 2010

Modélisation statistique non paramétrique

hn

rjjnn

j

jhjhn Wms

s

mYY ).).(^

Yj centré réduit (provenant du passé)

•Réajustement de Yj aux valeurs présentes

Où:

• : moyenne du bloc j.

• : écart-type du bloc j.

• : poids quantifiant la proximité entre le dernier bloc centré réduit et le bloc j centré réduit.

jm

js

jw

FORMULE POUR LA PREVISION:

Page 46: Prévisions trafic aérien

Orly, Décembre 2010

Modélisation statistique non paramétrique

•CALCUL D’UN INTERVALLE DE CONFIANCE DE LA PREVISION:

Loi conditionnelle de sachant hnY 1,..., rnn YY

• On estime cette loi conditionnelle par la loi discrète sur associée aux poids Wi,T:

hrnn YYY ,...,, 1

Ti

hn

ixY WxF

hi ,1

^

.1)(

On utilise les quantiles de cette loi pour déterminer un intervalle de

confiance de prévision conditionnelle à hnY

^

Page 47: Prévisions trafic aérien

Orly, Décembre 2010

Modélisation statistique SARIMA

SQDPqdpSARIMA ),,)(,,(

où: est un bb de variance . S : période, (P,D,Q): ordres de la partie saisonnière. (p,d,q): ordres de la partie ARIMA classique.

Nombre de jeux de paramètres et donc de prédicteurs potentiels élevé!!!

Introduction de procédures de tests afin de réduire les temps de calcul.

nS

nDssd BQBQYBBPBBP )()(.)1)(()1)(( qQPp

)( n2

FORMULE:

Page 48: Prévisions trafic aérien

Orly, Décembre 2010

Modélisation statistique SARIMAX

nnn BP

QX

BD

BNaY ).(.

)(

)(,1

1

1

FORMULE :

Dynamique de X1 Dynamique propre à Yn

En pratique: - On identifie la structure ARMA de Yn.

- On étudie le lien entre Yn et X1 via les corrélations croisées.- On en déduit des ordres possibles pour N1 et D1.

=> Nombre de jeux de paramètres et donc de prédicteurs potentiels élevé!!!

Introduction de procédures de tests afin de réduire les temps de calcul.

Page 49: Prévisions trafic aérien

Orly, Décembre 2010

Modélisation statistique DECOMPOSITION TENDANCE+ CYCLE (4/4)

MODELE: tttt STY

En pratique:

On choisit une (ou plusieurs) forme pour la tendance

(linéaire, quadratique,…).

On régresse la composante saisonnière sur des harmoniques ie:

).sin(.).cos(.^

tbtaTY tt

Page 50: Prévisions trafic aérien

Orly, Décembre 2010

Modélisation statistique MODELISATION ECONOMETRIQUE (4/4)

Catalogue de modèles:

« ADN » intègre un catalogue de modèles économétriques…:

Modèle linéaire Yt=a.Xt+b;Modèle Log-linéaire Yt=a.log(Xt)+b;Modèle exponentiel Yt=a.e(aXt+b);…

permettant de modéliser simplement la dépendance entre plusieurs variables

Page 51: Prévisions trafic aérien

Orly, Décembre 2010

• A ce stade, on dispose de plusieurs prédicteurs j

fournissant chacun des prévisions: pour h=1,…,N.

=> AGREGATION

j

hty

^

Modélisation statistique : agrégation prédicteurs

Page 52: Prévisions trafic aérien

Orly, Décembre 2010

Prévision par pondération uniforme => Poids exponentiels

Modélisation statistique : agrégation prédicteurs

Page 53: Prévisions trafic aérien

Orly, Décembre 2010

On dispose de la série de trafic aérien du faisceau « International ».

Afin de juger de l’apport de la stratégie de pondération exponentielle

dans le système « ADN », nous modélisons cette série sur la période

s’étalant du 1er janvier 2003 au 1er mars 2011.

Nous disposons donc de 99 valeurs.

Nous comparons les performances en prévision sur les 12 données

suivantes de chacune des stratégies (« meilleur modèle »,

pondération uniforme, pondération exponentielle).

Application

Page 54: Prévisions trafic aérien

Orly, Décembre 2010

Application

SERIE MENSUELLE DE TRAFIC FAISCEAU « INTERNATIONAL » DU 1er JANVIER 2003 AU 01APR2012

TEST VALIDATION

Page 55: Prévisions trafic aérien

Orly, Décembre 2010

1.1.2 EXEMPLE:

Modélisation statistique DECOMPOSITION TENDANCE+ CYCLE (4/4)

PERFORMANCES DE DIFFERENTES STRATEGIES (RMSE) sur les 12 derniers mois en prévision

Uniform weights Exponential

weights

115235

31230

Tt

ititiT yyT

RMSE 2,,, )ˆ(

1:

Page 56: Prévisions trafic aérien

Orly, Décembre 2010

• Rappel: si l’on désigne par la perte

cumulée du jème prédicteur sur les T premières échéances, alors la

stratégie d’agrégation par des poids exponentiels nous assure

en théorie de meilleures performances que celle du meilleur

prédicteur.

Fonction de perte : perte quadratique

)ln(2

.)(min)(sup,...,1

^

NT

MLELNj

jTnT

Modélisation statistique : agrégation prédicteurs

MOTIVATION

T

k

jkk

jT yylyL

1

)ˆ,(:)ˆ(

l

Page 57: Prévisions trafic aérien

Orly, Décembre 2010

Modélisation statistique : agrégation prédicteurs probabilistes

p

j

jt

jtt fpf

11

ˆ:ˆ

Avec :

• le j-ème prédicteur à la date t

• et ,

jty

j

jt

jtj

tfL

fLp

))ˆ(exp(

))ˆ(exp(: ))(ˆlog(:)ˆ,( kj

jk yffyL

Page 58: Prévisions trafic aérien

Orly, Décembre 2010

Résumé partiel

•Nous avons obtenus des prévisions pour différentes variables d’intérêt à différents niveaux de détail

A ce stade,

• SOMME DES PREVISIONS != SOMME DES PREVISIONS DES PARTIES

Page 59: Prévisions trafic aérien

Orly, Décembre 2010

Résumé partiel

DEVELOPPEMENTS FUTURS...

Page 60: Prévisions trafic aérien

Orly, Décembre 2010

2.5 Piste de résolution

Résoudre la problématique (respect des contraintes de cohérence + prévisions agrégées) comme un problème d’optimisation quadratique sous contraintes linéaires :

2ˆminarg:ˆ zyz

dCz

Rz d

Prévisions respectant

Contraintes cohérence

ContraintesCohérence

Prévisions statistiques

Page 61: Prévisions trafic aérien

Orly, Décembre 2010

Fonction de perte adaptée à la prévision

)ˆ()ˆ(:ˆ '2zyzyzy

Avec

)ˆ(/10

0)ˆ(/1

:

11

NNt

t

yL

yL

Les prévisions sont d’autant plus changées qu’elles ont été mauvaises dans le passé/ On cherche à changer le moins possibles les prévisions qui ont été précises dans le passé

Page 62: Prévisions trafic aérien

Orly, Décembre 2010

Les contraintes

ccc

KKKdzCdzC

dCz

Contraintes de cohérence

Contraintes KENZA

Page 63: Prévisions trafic aérien

Orly, Décembre 2010

Bibliographie

Journal de la société française de statistiques, Gilles Stoltz