Phân tích hồi quy - Nghiên cứu mối liên hệ phụ thuộc giữa giá trị của một biến Y-gọi là biến phụ thuộc hay này gọi là các biến độc lập hay biến giải thích... + Kiểm định giả thiết về sự
Trang 1Phần 1: Lý thuyết
1 Dự báo bằng phương pháp phân tích hồi quy
a Phân tích hồi quy
- Nghiên cứu mối liên hệ phụ thuộc giữa giá trị của một biến Y-gọi là biến phụ thuộc hay
này gọi là các biến độc lập hay biến giải thích
Trang 2- Ta thường giả thiết:
Biến phụ thuộc Y là biến ngẫu nhiên, có quy luật phân phối xác suất xác định
- Phân tích hồi quy giúp chúng ta:
Trang 3+ Kiểm định giả thiết về sự phụ thuộc
+ Dự báo giá trị trung bình hoặc cá biệt của biến phụ thuộc khi đã biết giá trị của (các) biến độc lập
b Mô hình hồi quy tổng thể và mô hình hồi quy mẫu
- Mô hình hồi quy tổng thể (PRF) là hàm có dạng tổng quát:
E(Y/Xji) = f(Xji)
Trang 4Nếu mô hình biểu diễn mối quan hệ giữa biến phụ thuộc Y và một biến giải thích X thì được gọi là mô hình hồi quy đơn hay mô hình hồi quy 2 biến.
Nếu số biến giải thích nhiều hơn 1 thì được gọi là mô hình hồi quy bội (hồi quy nhiều biến)
- Mô hình hồi quy mẫu (SRF) có thể được biểu diễn như sau:
^Yi = ^f(Xji)
Trang 5Trong đó:
^Yi là ước lượng của E(Y/Xji)
^f là ước lượng của f
Mô hình hồi quy nhiều biến:
Yi=β1+ β2X2i+ β3X3i +…+ βkXki+ Ui
Trong đó:
Trang 6Yi: giá trị của biến phụ thuộc Y(i=1,n)
β1: hệ số chặn ( hệ số tự do)
βj: hệ số góc(hệ số hồi quy riêng) của biến giải thích Xj(j=2,k)
Ui: sai số ngẫu nhiên
c Phân tích hồi quy và dự báo
Dự báo giá trị trung bình:
Trang 7Ước lượng điểm của E(Y/X0) là:
^Y0=X T0.^β=^β1+^β2X20+^β3X30 +… +^βkXk0
T= ^Y 0−E( Y X 0)
se(^Y 0) T(n-k)
Trang 8Ta tìm ra giá trị phân vị tα/2(n-k) sao cho:
Trang 9Trong đó:^Y0
Var(^Y0)=X0T.cov(^β).X0=σ2.X0T.(XTX)-1X0
Se(^Y0)=√Var(^Y 0)=σ√X0T (X T X)¿(−1) X0
Dự báo giá trị cá biệt
Trang 10Ước lượng điểm của Y0 vẫn là:
^Y0=X0T.^β=^β1+^β2X20+^β3X30+…+^βkXk0
Hoàn toàn tương tự ta xây dựng thống kê:T= se(Y 0−^Y 0) Y 0−^Y 0 T(n-k)
Trang 11Bằng phép biến đổi tương tương ta cũng tìm ra được khoảng tin cậy của Y0 là:(^Y0-tα/2(n-k)se(Y0-^Y0);^Y0+tα/2(n-k)se(Y0-^Y0)
Trong đó:
Var(Y0-^Y0)=Var(^Y0)+σ2
Se(Y0-^Y0)=√Var¿¿ 0)
Trang 122 Dự báo bằng các mô hình xu thế:
Xu thế là sự vận động tăng hay giảm của dữ liệu trong một thời gian dài Sự vận động này có thể được mô tả bằng một đường thẳng hay đường cong toán học
Có thể mô hình hóa xu thế bằng cách thực hiện một hàm hồi quy thích hợp giữa biến cần
dự báo Y và thời gian T
* Một số dạng hàm xu thế điển hình:
Trang 14* Dự báo điểm với hàm xu thế:(mũ)
^Yt=^β1+^β2T
^Yt=^β1+^β2T+^β3T2
^Yt=^β1+^β2T+^β3T2+^β4T3
^Yt=^β1+^β2ln(T) ^Yt = e ^β 1+^β2T+(σ2/2)=eln (^Y t)+σ 2/ 2
Trang 15^Yt=^β1+^β2 ( 1
T) ln(^Yt)=^β1+^β2T
3 Dự báo bằng phương pháp san mũ
Là ứng dụng mở rộng của phương pháp trung bình trượt Trung bình trượt dựa vào k quan sát gần nhất Dựa vào giá trị trung bình trượt với trọng số giảm dần cho tất cả các quan sát trong quá khứ
a San mũ đơn giản
Trang 16^Yt+1=αYt + (1-α)^Yt
Trong đó:
^Yt+1 : giá trị dự đoán ở thời điểm t+1
^Yt : giá trị dự đoán ở thời điểm t
Yt : giá trị quan sát ở thời điểm tα: hệ số san mũ
Trang 17Phương pháp san mũ đơn giản cho rằng giá trị dự báo mới là một giá trị trung bình có trọng số giữa giá trị thực tế và giá trị dự báo ở thời điểm t.
Yếu tố quan trọng nhất trong phương pháp san mũ là việc xác định hệ số san mũ α
Nếu dãy số có nhiều biến đổi bất thường ta nên chọn α gần 0 và ngược lại nên chọn α gần
1 nếu muốn kết quả dự báo kết hợp với những thay đổi gần nhất trong số liệu
b San mũ Holt
Trang 18Hầu hết các chuỗi dữ liệu kinh tế hiếm khi theo một xu thế cố định.
Khi chuỗi thời gian có yếu tố xu thế (cục bộ) thì ta cần phải dự báo cả giá trị trung bình (giá trị san mũ) và độ dốc (xu thế) hiện tại để làm cơ sở cho dự báo tương lai
Ý tưởng cơ bản của phương pháp Holt là sử dụng các hệ số san mũ α, β khác nhau để ướclượng giá trị trung bình và độ dốc của chuỗi thời gian (theo mô hình san mũ đơn giản)
* Ước lượng giá trị trung bình hiện tại
Trang 19Lt=αYt + (1-α)(Lt-1+Tt-1)
Lt: giá trị san mũ (mới) ở thời điểm t
Yt: giá trị quan sát ở tời điểm t
α: hệ số san mũ của giá trị trung bình(0<α<1)
Tt: giá trị ước lượng xu thế
Trang 20* Ướclượng xu thế (độ dốc)
Tt= β(Lt-Lt-1)+(1-β)Tt-1
Trong đó:
Tt: giá trị ước lượng xu thế
Lt: giá trị san mũ mới
Trang 21β: hệ số san mũ cửa giá trị xu thế(0<α<1)
* Dự báo p giai đoạn trong tương lai
^Yt+p=Lt+pTt
Trong đó:
^Yt+p: giá trị dự đoán ở thời điểm t+p
Trang 22Tt: giá trị ước lượng xu thế
Lt: giá trị san mũ mới
c San mũ Holt-Winter
Là dạng mở rộng của san mũ Holt đối với các dữ liệu có chứa yếu tố mùa Yếu tố mùa trong chuỗi thời gian có thể thuộc dạng cộng tính hoặc nhân tính
Trang 23- Dạng cộng tính: có nghĩa là yếu tố mùa ở các năm khác nhau được lặp đi lặp lại một cách đều đặn.
- Dạng nhân tính: có nghĩa là yếu tố mùa ở năm sau được lặp đi lặp lại nhưng với với mộtcường độ cao hơn hoặc thấp hơn so với từng mùa trong năm trước
Mô hình san mũ Holt-Winter tổng quát nhất là mô hình dạng nhân tính
* Ước lượng giá trị trung bình hiện tại
Trang 24Lt=α(St−s Y t )+(1-α)(Lt-1+Tt-1)
Lt: giá trị san mũ mới ở thời điểm t
Yt: giá trị quan sát ở thời điểm t
α: hệ số san mũ của giá trị trung bình(0<α<1)
Tt: giá trị ước lượng xu thế
Trang 25St-s: giá trị ước lượng của chỉ số mùa với độ dài s
Trang 26Lt: giá trị san mũ mới
β: hệ số san mũ của giá trị xu thế(0<β<1)
* Ước lượng giá trị chỉ số mùa
St= γ(Y t L t)+(1-γ)St-s
Trong đó:
Trang 27St: giá trị ước lượng của chỉ số mùa
Lt: giá trị san mũ mới
Yt: giá trị quan sát tại thời điểm tγ: hệ số san mũ chỉ số mùa
* Dự báo p giai đoạn trong tương lai
Trang 28^Yt+p = (Lt+pTt)St-s+p
Trong đó:
^Yt+p: giá trị dự đoán ở thời điểm t+p
Tt: giá trị ước lượng xu thế
Lt: giá trị san mũ mới
Trang 29St: giá trị ước lượng của chỉ số mùa
Phần 2: Thực hành trên excel
1 Lượng tăng (giảm) tuyệt đốiLượng tăng (giảm) tuyệt đối liên hoàn
Trang 30δ=Y i −Y i−1 (i=2,n)
Lượng tăng (giảm) tuyệt đối định gốc
Trang 33^Yn+L = yn + δL
Với ^Yn+L là giá trị dự báo ở thời điểm n + L
Yn là giá trị thực tế ở thời điểm n
L là tầm xa của dự báo
Trang 345 Dự báo bằng tốc độ phát triển trung bình
^yn+L = Yn(t¿¿L
Với ^yn+L là giá trị dự báo ở thời điểm n + L
Yn là giá trị thực tế ở thời điểm n
t là tốc độ phát triển trung bình
L là tầm xa dự báo
Trang 356 Dự báo bằng phương pháp trung bình trượt
^yn+1 = Yn+Yn−1+…+Y (n−k+1) k
Với ^yn+1 là giá trị dự báo ở thời điểm n + 1
Yn là giá trị thực tế ở thời điểm n
Trang 36K là khoảng trượt
Vận dụng:
Nghiên cứu số lượng điều hòa tiêu thụ mỗi năm(đơn vị ngàn cái) từ năm 1991 đến năm 2010
Trang 38Năm Yt Yt^ Et | et | et2 | et/yt | δ=Y i −Y i−1 ∆ i =Y i −Y1
Trang 49X: Đầu tư trực tiếp nước ngoài-FDI(USD)
Z: Dân số-POP(triệu người)
Nguồn: Dữ liệu Ngân Hàng Thế Giới
Trang 532006 198630 5061 67
Trang 55Sau đó nhập them dự liệu của cột X Z của năm 2008 đến 2015 để tiến hành dự báo ta được bảng
Trang 57Tiếp tục chọn Quick Empty Group ( Edit Series) hiện ra bảng nhập số liệu vào bảng,
sau
Trang 59Mô hình hồi quy: Ŷ= -225706,6 + 4,240659X + 5579,899Z
Ý nghĩa của các hệ số hồi quy:
tổng sản phẩm quốc dân tăng lên 4,240659USD
người thì tổng sản phẩm quốc dân tăng lên 5579,899USD
Trang 61Từ bảng hồi quy forecast xuất hiện bảng tại ô forecast name ta gõ tên bảng mà ta
Ta được bảng dự báo:
Trang 63Theil Inequality Coefficient = 0,118659< 0,5=> Mô hình hiệu quả.
Trang 65Ví dụ:
Trang 66Nghiên cứu số lượng điều hòa tiêu thụ mỗi năm từ năm 1991 đến năm 2010
Trang 70Cứ sổ workfile structure type hiện ra chúng ta có thể điều chỉnh loại, tần số dữ liệu Khởi đầu và kết thúc các quan sát.
Tạo biến xu thế t:
Genr t=@trend(1990)
Trên cửa sổ workfle xuất hiện biến xu thế t
Gõ vào cửa sổ chính là eview
Trang 72Dự báo biến phụ thuộc Y
Hàm bậc 1 :Y= β
1+ β2T+ U¿ t ¿¿¿
Vào Quick chọn Equation Estimation -> xuất hiện bảng -> ta nhập y c t -> ok
Trang 74Dự báo
Từ bảng hồi quy vừa tìm được ta chọn Forecast ->bảng dự báo:
Trang 76Hàm bậc 2: Y= β1+ β2T+ β3T2
+U¿ t ¿¿¿
Tương tự trong ô Equation Spectification gõ: y c t t^2 ta được:
Trang 78Tương tự dự báo ta được:
Trang 80Hàm bậc 3: Y= β1+ β2T+ β3T2
+β4T3+U¿ t ¿¿¿
Tương tự trong ô Equation Spectification gõ: y c t t^2 t^3 ta được
Trang 82Dự báo
Trang 84Hàm Ln : Y= β1+ β2ln(T) + U¿ t ¿¿¿
Tương tự trong ô Equation Spectification gõ: y c LOG(t) ta được
Trang 86Dự báo ta được:
Trang 90Dự báo ta được:
Trang 92Hàm Ln: Ln(Yt )=β1+ β2T+ U¿ t ¿¿¿
Tương tự trong ô Equation Spectification gõ: LOG(y) c t ta được
Trang 94Dự báo
Trang 97So sánh các hàm số để xác định hàm phù hợp nhất
Xét giá trị R-squared: chọn mô hình có R-squared lớn nhất
Giá trị theil Inequality Coeficient : chọn mô hình có theil Inequality Coeficient nhỏ nhất.Hàm bậc 1 có R-squared 0,93605 là và theil Inequality Coeficient là 0,060623
Hàm bậc 2 có R-squared là 0,979955 và theil Inequality Coeficient là 0,033855
Hàm bậc 3 có R-squared 0,983388 là và theil Inequality Coeficient là 0,030814
Trang 101Phương pháp san mũ San mũ giản đơn:
Trang 102Từ bảng Series Y →chon proc→chọn Exponential Smoothing→ở ô smoothing method
Trang 103Từ bảng workfile click đúp chuột vào ysm (tên biến mà ta đặt ta được ô smoothed series
ở bảng Exponential Smoothing) ta được bảng
Trang 105San mũ không mùa vụ
Trang 107Từ bảng workfile click đúp chuột vào yno (tên biến mà ta đặt ta được ô smoothed series
ở bảng Exponential Smoothing) ta được bảng
Trang 109San mũ cộng tính:
Trang 111Từ bảng workfile click đúp chuột vào ycong (tên biến mà ta đặt ta được ô smoothed series ở bảng Exponential Smoothing) ta được bảng
Trang 113San mũ nhân tính
Trang 115Từ bảng workfile click đúp chuột vào ynhan(tên biến mà ta đặt ta được ô smoothed series ở bảng Exponential Smoothing) ta được bảng
Trang 117Tiến hành so sánh giữa các mô hình ta đượcXét giá trị mean có giá trị lớn nhất:
san mũ giản đơn có mean=322,3886
Trang 118san mũ không mùa vụ có mean=332,4
san mũ theo mô hình cộng tính có mean=322,68
san mũ theo mô hình nhân tính có mean= 333,7117
Phương pháp san mũ theo mô hình nhân tính có mean là lớn nhất nên do đó phương phápsan mũ theo mô hình nhân tính là phù hợp nhất