Les étapes nécessaires pour utiliser un modèle unifactoriel 1)La spécification du modèle 2)Lestimation des paramètres 3)Lanalyse économétrique des paramètres

Les étapes nécessaires pour utiliser un modèle unifactoriel

1) La spécification du modèle2) L’estimation des paramètres3) L’analyse économétrique des

paramètres4) La vérification des hypothèses5) L’analyse de la qualité du modèle6) La prévision

1) La spécification du modèle

La spécification du modèle consiste en:

-la spécification des variables factorielles(cause)-Xi et la variable endogène (effet) –Y

-la spécification de la forme linéaire ou non-linéaire du modèle

1) La spécification du modèle-exemplesLa spécification du modèle consiste en:Si on doit étudier la consommation et le revenu => Du

point de vue économique le revenu influence la consommation alors la variable factorielle (X) sera le revenu et la variable effet (Y) sera la consommationLe modèle sera C=f(V) +ε ou ε =les facteurs aléatoires

Si on doit étudier le salaire et les facteurs qui peuvent influencer la performance => Du point de vue économique le salaire doit être corrélé avec la performance . La performance est déterminée par les suivants facteurs : le niveau d’ éducation, l’ expérience, la santé

La spécification de la forme selon la représentation graphique

No.Distanc

eLe cout du transport

1 20 1499,272 21 1503,173 22 1509,354 23 1514,835 24 1519,006 25 1523,627 28 1531,048 31 1543,169 38 1564,40

10 45 1579,58

y=a+b*ln(x) + ε


No. DistanceLe cout du transport

1 20 1499,272 21 1503,173 22 1509,354 23 1514,835 24 1519,006 25 1523,627 28 1531,048 31 1543,169 38 1564,40

10 45 1579,58

y=a+b*x + ε

No.L'Intérêt

(%)

Investissements

(mille lei)1 4,5 14992 3,8 15033 3,1 15094 2,8 15155 2,5 15196 3 15247 2,3 15318 2,2 15439 1,9 1564

10 2 1580


y=a+b*x+c*x2 + ε

2) L’estimation des paramètres pour le modèle

Pour exemplifier l’estimation des paramètres on va utiliser les données suivantes

No.Distanc

eLe cout du transport

ln (distance)

1 20 1499,27 2,99573232 21 1503,17 3,04452243 22 1509,35 3,09104254 23 1514,83 3,13549425 24 1519,00 3,17805386 25 1523,62 3,21887587 28 1531,04 3,33220458 31 1543,16 3,43398729 38 1564,40 3,6375862

10 45 1579,58 3,8066625

CoefficientsStandard Error t Stat P-value

Lower 95%

Upper 95%

Intercept 1202,92 5,41 222,20 0,00 1190,43 1215,40

ln (distance) 99,11 1,64 60,36 0,00 95,33 102,90

y=a+b*ln(x) + ε

3) L’analyse économétrique des paramètres


Lower 95%

Upper 95%

Intercept 1202,92 5,41 222,20 0,00 1190,43 1215,40

ln (distance) 99,11 1,64 60,36 0,00 95,33 102,90

y= a+ b*ln(x) + ε

t Stat= la valeur du paramètre / écart type du paramètre

Les paramètres sont significatifs différents de “0” ?

Oui parce que la valeur du t Stat (… ) est supérieure a 2*, ouOui parce que la valeur de la « P-value » est inférieure a 0,05 ouOui parce que l’intervalle de confiance ne contient pas la valeur « 0 »

3) L’analyse économique des paramètresy=coût du transport (lei), x=distance(km)

y= a+ b*ln(x) + ε y= 1202,2+ 99,11*ln(x)

Alors:La signification du terme libre:Si ln(x)=0 équivalent avec la distance=1 km => la valeur du coût du transport est égale avec 1202,2 lei.La signification du coefficient du ln(x) Si Δln(distance) se modifie avec une unité => la valeur du coût du transport se modifie avec 99,11 lei.Parce que la liaison est directe, alors si la distance augmente=> le coût va augmenter.Aussi, si la distance baisse=> le coût va être diminué.Les deux paramètres ont des significations économiques

4) La verification des hypothesesL’énonce des hypotheses Les tests utilisés Est-ce que je dois tester cette

hypothèse a l’examen?

0.Les valeurs (des données) sont enregistrées sans erreurs de mesure

la règle du trois sigma

OUI

1 Le modèle spécifié est linéaire NON

2 E(ε)=0; NON

3 Var(ε)= constante=> homoscedasticité

Goldfeld Quandt, White

NON

4) La variable ε suit une loi normale

Jarque-Berra NON

5) Les erreurs sont independents

Durbin-Watson, Breusch-Godfrey

OUI, seulement DW

6) Les variables X et ε ne sont pas corrélées

Cov(X, ε)=0 NON

7) L’ hypothese de la multicoliniarite

Klein, Belsley etc. NON , peut-être vous doives vérifier la règle du déterminant

5. La qualité du modèle -l’exemple est fait pour

ANOVA

df SS MS F Significance F

Regression 1 6268,307 6268,307 3643,667 6,304E-12

Residual 8 13,76264 1,72033

Total 9 6282,07

Regression StatisticsMultiple R=coefficient de correlation 0,999R Square=rapport de determination 0,998Adjusted R Square 0,998Standard Error 1,312Observations 10

Le test F est passé, parce que Signifiance F a une valeur inférieure a 0,05Aussi, Le modèle explique 99,8% de la variation totale (voir le rapport du détermination)

Alors le modèle est valide et il est aussi performant. Il peut être utilisé pour les prévisions

y= a+ b*ln(x) + ε

6. La prévision utilisant le modèle y= a+ b*ln(x) + ε

On peut considerer avec une probabilité 1-α que

La valeur prévisionnée sera entre y- Δ y et y+Δy ou Δy=tα/2 sy

Ou P(y- Δ y < y* < y+Δy) = 1-α

L’erreur de la prevision sy=sε

La prévision utilisant le modèle

No. DistanceLe cout du transport

1 20 1499,272 21 1503,173 22 1509,354 23 1514,835 24 1519,006 25 1523,627 28 1531,048 31 1543,169 38 1564,40

10 45 1579,58

Soit xp=40L’erreur de la prevision sy=sε

E(x)= (20+21+22+23+……+45)/10=27,7n=10La somme =n*var(X)=10*66,23=662,3y*=1567,805 (la valeur prévisionnée pour x=40)

Sy=1,312* 1,15=1,51

Avec une probabilité P=0,95 on peut considérer que la distance sera égale avec 40 km alors la valeur du coût de transport est comprise entre 1567,805-2*1,51 et 1567,805 +2*1,51=> y*Є[1564;1570] lei

Test du Durbin Watson

Observation

Predicted Le cot du transport et et-1 (et-et-1)2 et2

1 1499,833 -0,560 0,3142 1504,669 -1,494 -0,560 0,873 2,2323 1509,279 0,069 -1,494 2,444 0,0054 1513,685 1,141 0,069 1,148 1,3015 1517,903 1,100 1,141 0,002 1,2116 1521,949 1,671 1,100 0,326 2,7937 1533,182 -2,145 1,671 14,563 4,6008 1543,270 -0,105 -2,145 4,160 0,0119 1563,449 0,950 -0,105 1,113 0,902

10 1580,207 -0,627 0,950 2,486 0,393Somme 27,115 13,763 DW 1,970

La valeur du DW est proche de 2 alors on peut accepter que les erreurs sont indépendantes.

-il est utilisé pour vérifier l’hypothèse d’autocorrection des erreurs

Les formules pour les écartes-type des estimateurs


Lower 95%

Upper 95%

Intercept 1202,92 5,41 222,20 0,00 1190,43 1215,40

ln (distance) 99,11 1,64 60,36 0,00 95,33 102,90

y= a+ b*ln(x) + ε

ou zi=lnxi

FIN

Documents

Les étapes nécessaires pour utiliser un modèle unifactoriel 1)La spécification du modèle 2)Lestimation des paramètres 3)Lanalyse économétrique des paramètres