De Tai Kinh Te Luong Du Bao Gia Vang

Chương trình Giảng dạy Kinh tế Fulbright

Học kỳ thu 200704/9/2007 – 23/12/2007

Các phương pháp phân tích Đề cương Đề án Môn học

Ngày Nộp: Thứ tư, ngày 07 tháng 11, 2007Hồ Bá TìnhLê Bảo Toàn

BÁO CÁO SƠ BỘ ĐỀ CƯƠNG MÔN HỌCĐề tài

ỨNG DỤNG MÔ HÌNH ARIMA TRONG DỰ BÁO GIÁ VÀNG

1

I. Bối cảnh và sự cần thiết của đề tài

Mong muốn biết trước những điều trong tương lai luôn là mục tiêu và là mơ ước của con người. Ngày nay con người đã tìm râ rất nhiều cách để dự báo để biết trước những điều có thể xẩy ra trong tương lai. Mô hình ARIMA là một trong những mô hình về dự báo dự đoán giá trị của biến số (hoặc một dãy biến số) tại một số điểm trong tương lai căn cứ vào những dữ liệu trong quá khứ. Một trong những điều quan tâm của tất cả mọi người đó là dự báo giá vàng, nhằm phục vụ cho công việc kinh doanh có nhân, tổ chức hay hoạch định chiến lược của một quốc gia. Như vậy tìm ra được mô hình để dự báo những biến động của giá vàng trên thế giới và trong nước có một ý nghĩa vô cùng quan trọng. Trong giới hạn của đề tài này chúng tôi đề xuất mô hình ARIMA để dự báo giá vàng.

Sơ lược về các vấn đề của dự báo và phương pháp

Một cách phân loại vấn đề dự báo là quan tâm đến thang thời gian liên quan đến dự báo, có nghĩa là dự báo đến thời gian nào trong tương lai. Ngắn, trung và dài hạn là loại thông thường, những dự báo này mang tính chất xu hướng và chiến lược.Phương pháp dự báo có thể được chia thành vài cách khác nhau:

Phương pháp định tính – khi không có một công thức toán học chính thức nào, thường do dữ liệu sẵn có không được xem như là đại diện cho tương lai (dự báo dài hạn)

Phương pháp hồi quy – là sự mở rộng của hồi quy tuyến tính khi mà một biến cố được xem là liên quan tuyến tính đến số lượng các biến cố không phụ thuộc khác.

Các phương pháp giải thông qua hệ phương trình – khi số biến cố phụ thuộc tương tác với nhau thông qua một loại phương trình (như trong mô hình kinh tế)

Phương pháp theo chuỗi thời gian, khi chúng ta có một biến số thay đổi theo thời gian và giá trị tương lai của nó có liên quan đến giá trị trong quá khứ.

II. Số liệu

- Nguồn số cập nhật giao dịch giá vàng ở Ngân hàng EXIMBANK

- Số liệu giá vàng bán tại tại Sàn giao dịch số I . TP Hồ Chí Minh từ ngày 02/01/2007 đến ngày 09/01/2007

III. Cơ sở lý thuyết

1. Phương pháp phân tích theo chuỗi thời gian mô hình ARIMA

Năm 1976 George Box và Gwilym Jenkins nghiên cứu mô hình ARIMA (Autoregressive Integrated Moving Average - Tự hồi qui tích hợp Trung bình trượt), và tên của họ thường được dùng để gọi tên các quá trình ARIMA tổng quát, áp dụng vào việc phân tích và dự báo các chuỗi thời gian. Phương pháp Box-Jenkins với bốn bước lặp:

- Nhận dạng mô hình thử nghiệm- Ước lượng- Kiểm định bằng chẩn đoán- Dự báo.

2

3.1.1 Cơ sở lý thuyếtCác phương pháp này liên quan tới biến số thay đổi theo thời gian và có thể nói là

chỉ phụ thuộc vào thời gian hiện tại và giá trị trước đây nó có (có nghĩa là, nó không phụ thuộc vào bất kỳ biến số nào hoặc yếu tố bên ngoài nào). Nếu Yt là giá trị của biến số tại thời điểm t, sau đó phương trình cho Yt làYt = f(Yt-1, Yt-2, ..., Y0, t) Có nghĩa là, giá trị của biến số tại thời điểm t đơn thuần là phương trình giá trị trước đó và thời gian, không có biến số nào/yếu tố nào là liên quan đến biến số này. Mục đích của phương pháp phân tích theo chuỗi thời gian là tìm ra bản chất của phương trình f, và vì vậy cho chúng ta dự báo giá trị cho Yt

Phương pháp chuỗi thời gian đặc biệt tốt cho dự báo ngắn hạn, khi hành vi trong quá khứ của một biến số cụ thể là một chỉ tiêu tốt cho hành vi trong tương lai của nó, ít nhất trong ngắn hạn. Mục đích của phân tích là để thấy rõ một số mối quan hệ giữa giá trị Yt được quan sát đến nay để cho phép chúng ta dự báo giá trị Yt trong tương lai.2.1.2 Nhận dạng mô hình

Xét tính dừng của chuổi số liệuĐiều trước tiên cần phải lưu ý là hầu hết các chuỗi thời gian đều không dừng, và

các thành phần AR và MA của mô hình ARIMA chỉ liên quan đến các chuỗi thời gian dừng. Quý trình ngẫu nhiên của Yt được xem là dừng nếu trung bình và phương sai của quá trình không thay đổi theo thời gian và giá đồng phương sai giữa hai thời đoạn chỉ phụ thuộc vào khoảng cách độ trễ về thời gian giữa các thời đoạn này chứ không phụ thuộc vào thời điểm thực tế mà đồng phương sai được tính.

- Trung bình E(Yt) = μ = const- Phương sai Var(Yt) = σ2 = const- Đồng phương sai: Covar(Yt, Yt-k) = gk

Tính dừng của một chuổi thời gian có thể được nhận biết dựa trên đồ thị của chuổi thời gian, đồ thị của hàm tự tương quan mẫu hay kiểm định Dickey – Fuller

- Dựa trên đồ thị Yt = f(t) một cách trực quan chuổi Yt có tính dừng nếu đồ thị hàm số cho trung bình và phương sai của giá trị Yt không thay đổi theo thời gian.

- Dựa vào hàm tự tương quan mẫu (SAC)

=

Nếu SAC=f(t) của chuổi thời gian giảm mạnh và tắt dần về 0 thì chuổi có tính dừng.Kiểm định Dickey-Fuller (kiểm định nghiệm đơn vị) nhằm xác định xem chuỗi thời gian

có phải là Bước Ngẫu Nhiên (Random Walk; nghĩa là Yt = 1*Yt-1 + et) hay không. Nếuchuỗi là Bước Ngẫu Nhiên thì không có tính dừng. Tuy nhiên, Nếu chuỗi không có tínhdừng thì chưa chắc là Bước Ngẫu Nhiên.Để biến đổi chuỗi không dừng thành chuỗi dừng, thông thường nếu lấy sai phân một lầnhoặc hai lần thì sẽ được một chuỗi kết quả có tính dừng.• Chuỗi gốc: Yt

• Chuỗi sai phân bậc 1: Wt = Yt – Yt-1

• Chuỗi sai phân bậc 2: Vt = Wt – Wt-1

3

Mô hình ARIMATheo Box- Jenkin mọi quá trình ngẫu nhiên có tính dừng đều có thể biểu diễn bằng môhình Tự Hồi Qui Kết Hợp Trung Bình Trượt ARIMA.

- Mô Hình Tự Hồi Qui Bậc p - AR(p)Trong mô hình tự hồi qui quá trình phụ thuộc vào tổng có trọng số của các giá trị quá khứvà số hạng nhiều ngẫu nhiên

Yt = φ1Yt-1 + φ2Yt-2 + ...+φpYt-p +δ +εt

- Mô Hình Trung Bình Trượt Bậc q – MA(q)Trong mô hình trung bình trượt, quá trình được mô tả hoàn toàn bằng tổng có trọng số củacác ngẫu nhiên hiện hành có độ trễYt = μ +εt −θ1εt-1 −θ2εt-2 −...−θqεt-q

- Mô Hình Hồi Quy Kết Hợp Trung Bình Trượt - ARIMA(p,d,q)Phương trình tổng quát của mô hình ARIMA là:

Yt = φ1Yt-1 + φ2Yt-2 + ...+φpYt-p +δ +εt − θ1εt-1 −θ2εt-2 −...−θqεt-q

Nhận dạng mô hìnhNhận dạng mô hình ARIMA(p,d,q) là tìm các giá trị thích hợp của p, d, q. Với d là

bậc sai phân của chuỗi thời gian được khảo sát, p là bậc tự hồi qui và q là bậc trung bình trượt. Việc xác định p và q sẽ phụ thuộc vào các đồ thị SPAC = f(t) và SAC = f(t). Với SAC đã được giới thiệu ở trên và SPAC là Tự Tương Quan Riêng Phần Mẫu (Sample Partial Auto-Correlation); nghĩa là tương quan giữa Yt và Yt-p sau khi đã loại bỏ tác động của các Ytrung gian.

- Chọn mô hình AR(p) nếu đồ thị SPAC có giá trị cao tại độ trễ 1, 2, ..., p và giảm nhiều sau p và dạng hàm SAC giảm dần.

- Chọn mô hình MA(q) nếu đồ thị SAC có giá trị cao tại độ trễ 1, 2, ..., q và giảm nhiều sau q và dạng hàm SPAC giảm dần

Ước lượng các thông số của mô hình ARIMA(p, d, q)Các thông số fi và qj của mô hình ARIMA sẽ được xác định theo phương pháp bình phương tối thiểu (OLS-Ordinary Least Square) sao cho:Kiểm tra chẩn đoán mô hìnhSau khi xác định p, d, q và các fi , qj; nghĩa là đã xác định được phương trình cho mô hìnhARIMA, điều cần phải làm là tiến hành kiểm định xem số hạng et của mô hình có phải làmột nhiễu trắng (white noise, nhiễu ngẫu nhiên thuần túy) hay không. Đây là yêu cầu củamột mô hình tốt.Về mặt lý thuyết, et được tạo ra bởi quá trình nhiều trắng nếu:

- εt tuân theo phân phối chuẩn- Cov(εt , εt-k) = 0

Việc kiểm định tính nhiễu trắng sẽ dựa trên đồ thị SAC của chuỗi et.

Dự báoDựa trên phương trình của mô hình ARIMA, tiến hành xác định giá trị dự báo điểm vàkhoảng tin cậy của dự báo.• Dự báo điểm: • Khoảng tin cậy: ˆ ( ) ˆ ( )

− kσ < Y < + kσ Với độ tin cậy 95%, k =2.

4

IV. Mô hình và phương pháp nghiên cứu

Đồ thị biểu diễn giá vàng

1100

1200

1300

1400

1500

1600

1700

50 100 150 200 250

PG

Thống kê mô tả dữ liệu

Số quan sát 278Trung bình 1334.486Độ lệch chuẩn 104.4295Giá trị lớn nhất 1640Giá trị nhỏ nhất 1190Khoảng 439Trung vị 1298Max (Yt – Yt-1) 60

Như vậy sự biến động giá vàng trong toàn bộ giá trị quan sát diễn ra khá mạnh, Khoảng giao động giữa 2 ngày liên tiếp lớn nhất là 60 nghìn đồng

2. Nhận dạng mô hình ARIMA(p, d, q)

5

Sử dụng kiểm định Dickey-Fuller ta thấy, chuổi dữ liệu giá vàng dừng ơ d = 0, có hy vọng rằng chuổi giá vàng là một chuổi ngẫu nhiên.

6

Hệ số tương quan SAC chọn đầu tiên 0.975 là rất mạnh ngay cả ở mức ý nghĩa 1%. Hệ số tương quan cho những giai đoạn đầu tiên tắt dần xuống 0, vì vậy ta có thể kết luận dãy này là tịnh. Vì vậy ta sử dụng mô hình AR(1).

Hệ số tương quan mẫu SPAC số đầu tiên là 0.985 giảm xuống dưới mức 5% ở số thứ 2 và giảm dần. Vì vậy ta có thêm mô hình MA(1)

Mô hình ARIMA kiến nghị là (1,0,1). ngoài ra ta cũng có thể tham khảo thêm các mô hình (1,1,1) và (1,2,1).

7

2.2. Ước lượng các tham sốCơ bản có hai cách để ước lượng những tham số , :1. Sử dụng Eview chạy hồi quy các dạng mô hình ARIMA.Xem xét nhiều giá trị

khác nhau và chọn giá trị (hay tập giá trị, nếu ước lượng nhiều hơn một tham số) sao cho tổng của những bình phương phần dư đạt giá trị nhỏ nhất.

Bảng 2.1. Kết quả các tham số của các mô hình được ước lượng1

Mô hình 1 Mô hình 2 Mô hình 3DS12.inf Coef. z DS12.inf Coef. z DS12.inf Coef. z

inf inf R2 _cons _cons _cons

ARMA ARMA ARMAMa ar arL1. L1. L1.

ARMA12 ARMA12 maMa ar L1.L1. L1. ARMA12

ar L1. ma L1.

2.3. Kiểm định mô hình

Sau khi ước lượng các tham số của một mô hình ARIMA được nhận dạng thử, chúng ta cần phải kiểm định để kiểm nghiệm rằng mô hình là thích hợp. Có hai cách thức cơ bản để thực hiện điều này:

1. Xem xét những phần dư - để xem nó theo dạng nào chưa được biết không.2. Xem xét những thống kê lấy mẫu của giải pháp tối ưu hiện tại (sai số chuẩn, ma

trận tương quan...)-kiểm tra xem có thể đơn giản hoá mô hình không.

Bảng 2.2. Kết quả các thông số kiểm định

Model Obs Chi-Square ll(model) df AIC BICMô hình 1Mô hình 2Mô hình 3

Dựa vào Bảng 2.1 và Bảng 2.2 với các tiêu chuẩn kiểm định được lựa chọn là z, Chi-Square ( ), AIC (Akaike Information Criterion) và BIC (Bayesian Information Criterion), mô hình phù hợp nhất và được lựa chọn là Mô hình .

2.4. Dự báo bằng mô hình ARIMA

1 Sử dụng phần mềm Stata

8

Mô hình ARIMA (1,0,1)Tuy nhiên, để sử dụng một mô hình được nhận dạng cho dự báo, cần phải mở

rộng mô hình (2.8) trở thành:Yt = φ1Yt + δ +εt − θ1εt

Khi sử dụng phương trình này để dự báo một thời đoạn tiếp theo - nghĩa là, Yt+1 - chúng ta tăng những chỉ số lên một, từ đầu đến cuối, như trong phương trình (2.9).

Yt+1 = φ1Yt-1 + δ +εt+1 − θ1εt-1 (2.10)Số hạng εt+1 sẽ không biết được vì giá trị kỳ vọng của những sai số ngẫu nhiên

tương lai bằng 0, nhưng từ mô hình đã thích hợp, chúng ta có thể thay thế những giá trị εt

Đối với những giá trị Y ban đầu của quá trình dự báo, chúng ta sẽ biết những giá trị Yt,. Tuy nhiên, sau một lúc, những giá trị Y trong phương trình (2.10) sẽ là những giá trị được dự báo chứ không phải là những giá trị quá khứ. Vì vậy các giá trị thực tế cần phải được cập nhật liên tục để cải thiện độ tin cậy của các giá trị dự báo.

V. Tài liệu tham khảo

1. Webside: www. eximbank.com.vn (Ngân hàng EXIMBANK)

2. “Hệ thống dự báo điều khiển kế hoạch ra quyết định” Loan Lê. Nhà xuất bản thống kê năm 2000.

3. “Kinh tế lượng ứng dụng” tác giả Nguyễn Thống. Nhà xuất bản Đại Học Quốc Gia. TP-HCM năm 2000.

4. “Nhập môn kinh tế lượng với các ứng dụng” Ramu Ramanathan, Người dịch Thục Đoan/Cao Hào Thi

Dependent Variable: PGMethod: Least SquaresDate: 12/07/07 Time: 02:38Sample(adjusted): 2 278Included observations: 277 after adjusting endpointsConvergence achieved after 52 iterationsBackcast: 1

Variable Coefficient Std. Error t-Statistic Prob. C 3591.058 27228.14 0.131888 0.8952

AR(1) 0.999489 0.006161 162.2197 0.0000MA(1) 0.003581 0.061090 0.058627 0.9533

R-squared 0.989968 Mean dependent var 1334.856Adjusted R-squared 0.989895 S.D. dependent var 104.4359S.E. of regression 10.49816 Akaike info criterion 7.551048Sum squared resid 30197.91 Schwarz criterion 7.590297Log likelihood -1042.820 F-statistic 13519.90Durbin-Watson stat 1.993379 Prob(F-statistic) 0.000000Inverted AR Roots 1.00Inverted MA Roots -.00

9

http://www.eximbank.com.vn/

1100

1200

1300

1400

1500

1600

1700

50 100 150 200 250

PGF

Forecast: PGFActual: PGForecast sample: 1 278Adjusted sample: 2 278Included observations: 277

Root Mean Squared Error 10.44116Mean Absolute Error 7.056627Mean Abs. Percent Error 0.514847Theil Inequality Coefficient 0.003899 Bias Proportion 0.000001 Variance Proportion 0.004560 Covariance Proportion 0.995439

10

11

0

10

20

30

40

50

60

-25 0 25 50

Series: ResidualsSample 2 278Observations 277

Mean 0.008285Median -0.163867Maximum 58.87175Minimum -34.09930Std. Dev. 10.46005Skewness 0.271251Kurtosis 7.442693

Jarque-Bera 231.2007Probability 0.000000

12

Documents

De Tai Kinh Te Luong Du Bao Gia Vang