Upload
eugene-maurel
View
103
Download
0
Embed Size (px)
Citation preview
Les étapes nécessaires pour utiliser un modèle unifactoriel
1) La spécification du modèle2) L’estimation des paramètres3) L’analyse économétrique des
paramètres4) La vérification des hypothèses5) L’analyse de la qualité du modèle6) La prévision
1) La spécification du modèle
La spécification du modèle consiste en:
-la spécification des variables factorielles(cause)-Xi et la variable endogène (effet) –Y
-la spécification de la forme linéaire ou non-linéaire du modèle
1) La spécification du modèle-exemplesLa spécification du modèle consiste en:Si on doit étudier la consommation et le revenu => Du
point de vue économique le revenu influence la consommation alors la variable factorielle (X) sera le revenu et la variable effet (Y) sera la consommationLe modèle sera C=f(V) +ε ou ε =les facteurs aléatoires
Si on doit étudier le salaire et les facteurs qui peuvent influencer la performance => Du point de vue économique le salaire doit être corrélé avec la performance . La performance est déterminée par les suivants facteurs : le niveau d’ éducation, l’ expérience, la santé
La spécification de la forme selon la représentation graphique
No.Distanc
eLe cout du transport
1 20 1499,272 21 1503,173 22 1509,354 23 1514,835 24 1519,006 25 1523,627 28 1531,048 31 1543,169 38 1564,40
10 45 1579,58
y=a+b*ln(x) + ε
La spécification de la forme selon la représentation graphique
No. DistanceLe cout du transport
1 20 1499,272 21 1503,173 22 1509,354 23 1514,835 24 1519,006 25 1523,627 28 1531,048 31 1543,169 38 1564,40
10 45 1579,58
y=a+b*x + ε
No.L'Intérêt
(%)
Investissements
(mille lei)1 4,5 14992 3,8 15033 3,1 15094 2,8 15155 2,5 15196 3 15247 2,3 15318 2,2 15439 1,9 1564
10 2 1580
La spécification de la forme selon la représentation graphique
y=a+b*x+c*x2 + ε
2) L’estimation des paramètres pour le modèle
Pour exemplifier l’estimation des paramètres on va utiliser les données suivantes
No.Distanc
eLe cout du transport
ln (distance)
1 20 1499,27 2,99573232 21 1503,17 3,04452243 22 1509,35 3,09104254 23 1514,83 3,13549425 24 1519,00 3,17805386 25 1523,62 3,21887587 28 1531,04 3,33220458 31 1543,16 3,43398729 38 1564,40 3,6375862
10 45 1579,58 3,8066625
CoefficientsStandard Error t Stat P-value
Lower 95%
Upper 95%
Intercept 1202,92 5,41 222,20 0,00 1190,43 1215,40
ln (distance) 99,11 1,64 60,36 0,00 95,33 102,90
y=a+b*ln(x) + ε
3) L’analyse économétrique des paramètres
CoefficientsStandard Error t Stat P-value
Lower 95%
Upper 95%
Intercept 1202,92 5,41 222,20 0,00 1190,43 1215,40
ln (distance) 99,11 1,64 60,36 0,00 95,33 102,90
y= a+ b*ln(x) + ε
t Stat= la valeur du paramètre / écart type du paramètre
Les paramètres sont significatifs différents de “0” ?
Oui parce que la valeur du t Stat (… ) est supérieure a 2*, ouOui parce que la valeur de la « P-value » est inférieure a 0,05 ouOui parce que l’intervalle de confiance ne contient pas la valeur « 0 »
3) L’analyse économique des paramètresy=coût du transport (lei), x=distance(km)
y= a+ b*ln(x) + ε y= 1202,2+ 99,11*ln(x)
Alors:La signification du terme libre:Si ln(x)=0 équivalent avec la distance=1 km => la valeur du coût du transport est égale avec 1202,2 lei.La signification du coefficient du ln(x) Si Δln(distance) se modifie avec une unité => la valeur du coût du transport se modifie avec 99,11 lei.Parce que la liaison est directe, alors si la distance augmente=> le coût va augmenter.Aussi, si la distance baisse=> le coût va être diminué.Les deux paramètres ont des significations économiques
4) La verification des hypothesesL’énonce des hypotheses Les tests utilisés Est-ce que je dois tester cette
hypothèse a l’examen?
0.Les valeurs (des données) sont enregistrées sans erreurs de mesure
la règle du trois sigma
OUI
1 Le modèle spécifié est linéaire NON
2 E(ε)=0; NON
3 Var(ε)= constante=> homoscedasticité
Goldfeld Quandt, White
NON
4) La variable ε suit une loi normale
Jarque-Berra NON
5) Les erreurs sont independents
Durbin-Watson, Breusch-Godfrey
OUI, seulement DW
6) Les variables X et ε ne sont pas corrélées
Cov(X, ε)=0 NON
7) L’ hypothese de la multicoliniarite
Klein, Belsley etc. NON , peut-être vous doives vérifier la règle du déterminant
5. La qualité du modèle -l’exemple est fait pour
ANOVA
df SS MS F Significance F
Regression 1 6268,307 6268,307 3643,667 6,304E-12
Residual 8 13,76264 1,72033
Total 9 6282,07
Regression StatisticsMultiple R=coefficient de correlation 0,999R Square=rapport de determination 0,998Adjusted R Square 0,998Standard Error 1,312Observations 10
Le test F est passé, parce que Signifiance F a une valeur inférieure a 0,05Aussi, Le modèle explique 99,8% de la variation totale (voir le rapport du détermination)
Alors le modèle est valide et il est aussi performant. Il peut être utilisé pour les prévisions
y= a+ b*ln(x) + ε
6. La prévision utilisant le modèle y= a+ b*ln(x) + ε
On peut considerer avec une probabilité 1-α que
La valeur prévisionnée sera entre y- Δ y et y+Δy ou Δy=tα/2 sy
Ou P(y- Δ y < y* < y+Δy) = 1-α
L’erreur de la prevision sy=sε
La prévision utilisant le modèle
No. DistanceLe cout du transport
1 20 1499,272 21 1503,173 22 1509,354 23 1514,835 24 1519,006 25 1523,627 28 1531,048 31 1543,169 38 1564,40
10 45 1579,58
Soit xp=40L’erreur de la prevision sy=sε
E(x)= (20+21+22+23+……+45)/10=27,7n=10La somme =n*var(X)=10*66,23=662,3y*=1567,805 (la valeur prévisionnée pour x=40)
Sy=1,312* 1,15=1,51
Avec une probabilité P=0,95 on peut considérer que la distance sera égale avec 40 km alors la valeur du coût de transport est comprise entre 1567,805-2*1,51 et 1567,805 +2*1,51=> y*Є[1564;1570] lei
Test du Durbin Watson
Observation
Predicted Le cot du transport et et-1 (et-et-1)2 et2
1 1499,833 -0,560 0,3142 1504,669 -1,494 -0,560 0,873 2,2323 1509,279 0,069 -1,494 2,444 0,0054 1513,685 1,141 0,069 1,148 1,3015 1517,903 1,100 1,141 0,002 1,2116 1521,949 1,671 1,100 0,326 2,7937 1533,182 -2,145 1,671 14,563 4,6008 1543,270 -0,105 -2,145 4,160 0,0119 1563,449 0,950 -0,105 1,113 0,902
10 1580,207 -0,627 0,950 2,486 0,393Somme 27,115 13,763 DW 1,970
La valeur du DW est proche de 2 alors on peut accepter que les erreurs sont indépendantes.
-il est utilisé pour vérifier l’hypothèse d’autocorrection des erreurs
Les formules pour les écartes-type des estimateurs
CoefficientsStandard Error t Stat P-value
Lower 95%
Upper 95%
Intercept 1202,92 5,41 222,20 0,00 1190,43 1215,40
ln (distance) 99,11 1,64 60,36 0,00 95,33 102,90
y= a+ b*ln(x) + ε
ou zi=lnxi
FIN