Hồi quy bội là một quy trình thống kê trong Hồi quy bội là một quy trình thống kê trong đđó biến phụ ó biến phụ thuộc Y thuộc Y đưđược mô hình hoá nhợc mô hình hoá nhưư một hàm số của nh
Trang 1CH
DỰ BÁO VỚI PH
HỒI QUY BỘI
Trang 2Hồi quy bội là một quy trình thống kê trong
Hồi quy bội là một quy trình thống kê trong đđó biến phụ ó biến phụ
thuộc (Y)
thuộc (Y) đưđược mô hình hoá nhợc mô hình hoá nhưư một hàm số của nhiều hmột hàm số của nhiều hơơn n một biến
một biến đđộc lập (Xộc lập (X1, X2, …Xn)
Mô hình tổng thể có thể viết nh
Mô hình tổng thể có thể viết nhưư sau:sau:
Y
Y = = f(X1, X2, …Xn))
= 0 + + 1X1 + + 2X2 + + 3X3 +…+ +…+ kXk++
Trong
Trong đđó ó 0 là tung là tung đđộ ộ đđiểm (Intercept) và các iểm (Intercept) và các ii là các hệ số góc t
góc tươương ứng với các biến ng ứng với các biến đđộc lập Và, ộc lập Và, là sai số tổng thể, là là sai số tổng thể, là chênh lệch giữa giá trị thực Y và giá trị dự báo của mô hình
MÔ HÌNH HỒI QUY BỘI
Trang 3Khi biến phụ thuộc
Khi biến phụ thuộc đđã ã đưđược xác ợc xác đđịnh, các biến ịnh, các biến đđộc lập ộc lập đưđược ợc tiến hành chọn lựa
Liệt kê tất cả các yếu tố có thể tác
Liệt kê tất cả các yếu tố có thể tác đđộng ộng đđến sự biến ến sự biến đđổi của ổi của biến phụ thuộc
Chọn các biến có mối liên hệ rõ ràng nhất với biến phụ thuộc, hoặc thông qua các nghiên cứu tr
hoặc thông qua các nghiên cứu trưước ớc
Ví dụ: Doanh số bán lẻ và thu nhập khả dụng Nh
Ví dụ: Doanh số bán lẻ và thu nhập khả dụng Nhưưng ngoài ng ngoài thu nhập khả dụng ra, có thể còn sự tác
thu nhập khả dụng ra, có thể còn sự tác đđộng của: GDP, Dân ộng của: GDP, Dân
số, lãi suất v.v.v
Tránh tr
Tránh trưường hợp các biến ờng hợp các biến đđộc lập có mối quan hệ với nhau ộc lập có mối quan hệ với nhau
Vì tác
Vì tác đđộng của nó làm dự báo và kiểm ộng của nó làm dự báo và kiểm đđịnh thiếu chính xác ịnh thiếu chính xác
CHỌN BIẾN ĐỘC LẬP
Trang 4Ví dụ:
Thu nhập khả dụng quốc dân (DPI) và GDP hay DPI và dân
số có mối quan hệ rất lớn (Lỗi này
số có mối quan hệ rất lớn (Lỗi này đưđược gọi là Đa công tuyến ợc gọi là Đa công tuyến Multicollinearity)
Ngoài ra, phải l
Ngoài ra, phải lưưu ý u ý đđến những biến ến những biến đđo lo lưường ờng đưđược ợc
(measurable variables), phải phân biệt khái niệm và biến số Một số tr
Một số trưường hợp không ờng hợp không đđo bằng các công cụ, có thể sử o bằng các công cụ, có thể sử
dụng bằng biến giả
Ví dụ: Giới tính (Nam=1, Nữ =0)
(Hồi quy bằng với biến giả sẽ
(Hồi quy bằng với biến giả sẽ đưđược trình bày trong phần sau)ợc trình bày trong phần sau)
CHỌN BIẾN ĐỘC LẬP
Trang 5VÍ DỤ MINH HỌA DỰ BÁO VỚI
MƠ HÌNH HỒI QUI BỘI
Thời gian D oanh thu ( ) RS
Lãi suất
Thu nhập khả dụng
- M ar - 90 418436 10 1202 18035
- un J - 90 464944 10 3372 18063
-ep S - 90 464490 10 1033 18031
- ec D - 90 496741 9 9547 17856
…
- M ar - 98 613448 7 0547 19632
- un J - 98 695875 7 0938 19719
-ep S - 98 686297 6 8657 19905
- ec D - 98 749973 6 7633 20194
Bài tập c5t1
Trang 6VÍ DỤ MINH HỌA DỰ BÁO VỚI
MÔ HÌNH HỒI QUI BỘI (tt)
Tiến hành hồi quy Doanh thu RS theo Lãi suất (MR) và Thu nhập khả dụng (DPI)
Theo
Theo đđó, mô hình ó, mô hình đưđược viết dợc viết dưưới dạng:ới dạng:
RS = b0 + b1(MR) + b2(DPI) Tiến hành hồi quy cho ra kết quả:
RS 2 = = 1,422,517.59 +((MR)* 1,422,517.59 +((MR)* 9,945.15)+((DPI)*110.77 ) (*) 9,945.15)+((DPI)*110.77 ) (*)
Từ ph
Từ phươương trình (*), ng trình (*), đđể dự báo ta chỉ việc thế giá trị các biến ể dự báo ta chỉ việc thế giá trị các biến
số MR và DPI theo từng quý vào
số MR và DPI theo từng quý vào đđể tính.ể tính
Nếu các giá trị này không có sẵn ta tiến hành dự báo sau
Nếu các giá trị này không có sẵn ta tiến hành dự báo sau đđó ó thế giá trị dự báo vào
thế giá trị dự báo vào đđể tìm doanh thu.ể tìm doanh thu
Trang 7CÁC KIỂM ĐỊNH THỐNG KÊ
1 BA CÁCH KIỂM TRA NHANH
a Dấu hệ số góc
Kiểm tra dấu của hệ số góc có
Kiểm tra dấu của hệ số góc có đ đúng nh úng như ư kỳ vọng không? kỳ vọng không?
b Mức ý nghĩa
Kiểm tra mức ý nghĩa bằng P
Kiểm tra mức ý nghĩa bằng P values values đ để chấp nhận biến ể chấp nhận biến
c R
c R quared quared
Trong mô hình hồi qui bội, chúng ta có khái niệm
Trong mô hình hồi qui bội, chúng ta có khái niệm adjusted R adjusted
R squared (gọi là
squared (gọi là RR squared squared đ điều chỉnh) Tiêu chí này nhằm hạn chế iều chỉnh) Tiêu chí này nhằm hạn chế việc R
việc R squred t squred tăăng không ý nghĩa (khi t ng không ý nghĩa (khi tăăng thêm biến ng thêm biến đ độc lập R ộc lập R square t
square tăăng dù biến ng dù biến đ đó không có ý nghĩa thống kê) ó không có ý nghĩa thống kê)
R
R squared squared đ điều chỉnh iều chỉnh đ đánh giá mức ánh giá mức đ độ giải thích của các biến giải ộ giải thích của các biến giải thích
thích đ đối với biến phụ thuộc trong hồi quy bội ối với biến phụ thuộc trong hồi quy bội.
Trang 8CÁC KIỂM ĐỊNH THỐNG KÊ
2 ĐA CÔNG TUYẾN
Là hiện t
Là hiện tươ ương hai hay nhiều biến ng hai hay nhiều biến đ độc lập có mối quan hệ tuyến tính ộc lập có mối quan hệ tuyến tính với nhau
Hiện t
Hiện tư ượng này gây mô hình có nhiều biến không ợng này gây mô hình có nhiều biến không đ đạt kiểm ạt kiểm đ định t ịnh t test hoặc dấu của các biến không hợp lý mặc dù R
test hoặc dấu của các biến không hợp lý mặc dù R squared có giá trị squared có giá trị cao
Tuy nhiên,
Tuy nhiên, đ đa cộng tuyến hầu nh a cộng tuyến hầu như ư có trong mọi mô hình vấn có trong mọi mô hình vấn đ đề là ề là mức
mức đ độ nặng hay nhẹ Chúng ta có thể biết mức ộ nặng hay nhẹ Chúng ta có thể biết mức đ độ cộng tuyến giữa ộ cộng tuyến giữa các biến bằng cách nhìn vào ma trận t
các biến bằng cách nhìn vào ma trận tươ ương quan của các biến ng quan của các biến đ độc ộc lập (Xem h
lập (Xem hư ướng dẫn thực hành) ớng dẫn thực hành)
Trang 9CÁC KIỂM ĐỊNH THỐNG KÊ
3 TỰ T
3 TỰ TƯƠ ƯƠNG QUAN VÀ HIỆN T NG QUAN VÀ HIỆN TƯ ƯỢNG THIẾU BIẾN ỢNG THIẾU BIẾN
GIẢI THÍCH
Tự t
Tự tươương quan: là hiện tng quan: là hiện tưượng các giá trị (quan sát) theo thứ tự ợng các giá trị (quan sát) theo thứ tự của một biến có mối t
của một biến có mối tươương quan với nhau ng quan với nhau
Nguyên nhân chính của hiện t
Nguyên nhân chính của hiện tưượng này là khi xây dựng mô hình ợng này là khi xây dựng mô hình đ
đã bỏ qua biến giải thích quan trọng ã bỏ qua biến giải thích quan trọng
Vì thế một trong cách chữa hiện t
Vì thế một trong cách chữa hiện tưượng này là thêm biến vào mô ợng này là thêm biến vào mô hình
Xét ví
Xét ví dụ sau: dụ sau:
Tr
Trưường hợp 1: chỉ dùng giá (price) giải thích cho doanh thu ờng hợp 1: chỉ dùng giá (price) giải thích cho doanh thu
(sales); Tr
(sales); Trưường hợp 2ờng hợp 2: thêm biến thu nhập (income) vào giải : thêm biến thu nhập (income) vào giải
thích
Trang 10CÁC KIỂM ĐỊNH THỐNG KÊ
Thời gian SALES PRICE INCOME
….
Trang 11CÁC KIỂM ĐỊNH THỐNG KÊ
Nếu chỉ sử dụng giá (price) giải thích cho doanh thu (sales),
kết quả hồi quy cho ra:
Audit Trail Coefficient Table (Multiple Regression Selected)
Descritpion in Model Coefficient T-test F-test Elasticity F-test
Audit Trail - Statistics
Trang 12CÁC KIỂM ĐỊNH THỐNG KÊ
Kết quả trên cho ta nhiều bất ổn trong mô hình:
1 R
1 R squared khá thấp (39.07%)squared khá thấp (39.07%)
2 Dấu của của biến giải thích là dấu d
2 Dấu của của biến giải thích là dấu dươương Điều này có ng Điều này có
ý nghĩa rằng: khi t
ý nghĩa rằng: khi tăăng giá thì doanh số cũng tng giá thì doanh số cũng tăăng (ng (đđiều iều
này không
này không đđúng với lý thuyết kinh tê') úng với lý thuyết kinh tê')
3 Hệ số DW chỉ 0.34 cho thấy mô hình bị tự t
3 Hệ số DW chỉ 0.34 cho thấy mô hình bị tự tươương quan ng quan khá nặng
Kết luận: mô hình mô hình đđã có thể bỏ ra qua một biến giải thích ã có thể bỏ ra qua một biến giải thích quan trọng
Trang 13CÁC KIỂM ĐỊNH THỐNG KÊ
HỒI QUI BỘI (tt)
Nếu sử dụng thêm thu nhập (income) giải thích cho doanh
thu, kết quả hồi quy cho ra:
Audit Trail Coefficient Table (Multiple
Regression Selected)
Descritpio
Coefficie
Elasticit
SALES
Depende
Audit Trail - Statistics
Trang 14CÁC KIỂM ĐỊNH THỐNG KÊ
Với kết quả trên, ta thấy có nhiều cải thiện
Với kết quả trên, ta thấy có nhiều cải thiện đđáng kể trong mô áng kể trong mô
hình
+ R
+ R squared squared đđã tã tăăng lên: 95.97%ng lên: 95.97%
+ Dấu của biến cũng
+ Dấu của biến cũng đđã nhã nhưư kỳ vọng (âm), kỳ vọng (âm), đđiều này có nghĩa iều này có nghĩa
là khi giá t
là khi giá tăăng thì doanh số sẽ giảm ng thì doanh số sẽ giảm
+ Hệ số DW cũng
+ Hệ số DW cũng đđã tã tăăng lên 1.67 (nằm trong ngng lên 1.67 (nằm trong ngưưỡng an toàn ỡng an toàn
từ 1.5
từ 1.5 2.5).2.5)
Vậy chứng tỏ thiếu biến giải thích quan trọng sẽ làm mô hình
phạm nhiều lỗi và vì thế dự báo không còn chính xác.
Trang 15CÁC KIỂM ĐỊNH THỐNG KÊ
Trong bảng kết quả hồi quy chúng ta th
Trong bảng kết quả hồi quy chúng ta thưường thấy thống kê Fờng thấy thống kê
F statistic
Kiểm
Kiểm đđịnh này dùng ịnh này dùng đđể kiểm ể kiểm đđịnh giả thuyết:ịnh giả thuyết:
Ho : : 1 = 1 = 2 = = 3 = … = = … = k = 0
H1: : tất cả các hệ số không tất cả các hệ số không đ đồng thời bằng zero ồng thời bằng zero.
So sánh giá trị F tính toán (Fcalc) và giá trị F tra bảng (FT) với
bậc tự do tử số là K và bậc tự do mẫu là n
bậc tự do tử số là K và bậc tự do mẫu là n (k+1); Với n là (k+1); Với n là
số quan sát, K là số l
số quan sát, K là số lưượng biến giải thích ợng biến giải thích
Nếu Fcalc > FT: loại bỏ giả thuyết H0 (Chấp nhận mô hình)
Trang 16THỰC HÀNH
Lập ma trận t
Lập ma trận tươ ương quan giữa các biến ng quan giữa các biến đ độc lập Trong Excel ộc lập Trong Excel
(Có thể thực hiện
(Có thể thực hiện đư được trong ForecastX) ợc trong ForecastX)
1 Khởi
1 Khởi đđộng Excel nhập dữ liệu.ộng Excel nhập dữ liệu
2 Chọn
2 Chọn Tools Tools trên thanh công cụ, chọn tiếp trên thanh công cụ, chọn tiếp Data Analysis Data Analysis
trong hộp thoại hiện ra chọn tiếp
trong hộp thoại hiện ra chọn tiếp Corelation Corelation và chọn và chọn OK OK.
3 Trong hộp thoại
3 Trong hộp thoại Input range Input range chọn biểu tchọn biểu tưượng ở cuối dòng ợng ở cuối dòng
và quét khối phần dữ liệu cần lập ma trận t
và quét khối phần dữ liệu cần lập ma trận tươương quan (gồm ng quan (gồm
cả hàng tên biến), Sau
cả hàng tên biến), Sau đđó click lại biểu tó click lại biểu tưượng nhỏ ở cuối ợng nhỏ ở cuối dòng trong hộp thoại Và chọn tiếp
dòng trong hộp thoại Và chọn tiếp Labels in first row Labels in first row Và Và cuối cùng chọn OK