bản chất của phần dư trong hàm hồi quy -Chúng ta có thế xây dựng được mô hình hồi quy bội dù chúng ta có đưa vào baonhiêu biến đi chăng nữa thì yếu tố phần dư vẫn tồn tại vì yếu tố hiễ
Trang 1MỤC LỤC
CHƯƠNG 1 KHÁI NIỆM CƠ SỞ PHÂN TÍCH PHẦN DƯ HÀM HỒI QUI 1.1 Khái niệm ,cơ sở phân tích hàm hồi qui 3 1.2 bản chất của phần dư trong hàm hồi quy 4 1.3 sự cần yhieets phải phân tích phần dư trong hàm hồi quy
4 1.4 Ý nghĩa của việc phân tích phần dư tỏng hàm hôi quy 4
CHƯƠNG 2 : NỘI DUNG PHÂN TÍCH PHẦN DƯ TRONG
HÀM HỒI QUY
2.1 Mô hình hồi qui đơn biến ( Hai biến )
52.1.1 Khái niệm về hồi quy 5 2.1.2.Nội dung phân tích phần dư ei theo phương pháp bình phương nhỏ
nhất OLS 6-7 2.1.3.Nội dung phân tích phần dư theo phương pháp bình phương nhỏ nhất
tổng quát 8-9 2.1.4 phân tích phần dư trong hệ số đo sự phù hợp của hàm hồi quy mẫu 10-112.1.5 Một số dạng hàm thường được sử dụng 12-15 2.2 Mô hình hồi quy tuyến tính bộ
16 2.2 1 Xây dựng mô hình 16 2 2.2 Mô hình hồi quy 3 biến 16-17 2.2 3 Mô hình hồi quy K biến 18
CHƯƠNG 3 ỨNG DỤNG CỦA PHẦN DƯ TRONG PHÂN TÍCH HÀM HỒI QUY
3.1 Phát hiện phương sai của sai số thay đổi 19
Trang 23.1.1 Xem xét đồ thị 20 3.1.2 Kiểm đinh Glejser 20
3.1.3 Kiểm đinh While 20-21
3.1.4 Kiểm định Breusch-Paga 21-22 3.2 Phát hiện có sự tương quan 22 3.2.1 Phương pháp đồ thị 22-23 3.2.2 Phương phá kiểm định số lượng 24 3.3 Phân tích phần dư để kiểm tra các giả định trong 24-26
phân tích hồi qui tuyến tính
Trang 3CHƯƠNG 1 KHÁI NIỆM CƠ SỞ PHÂN TÍCH PHẦN DƯ HÀM HỒI QUI
1.1 Khái niệm ,cơ sở phân tích hàm hồi qui
Gỉa sử chúng ta có mô hình hồi qui tổng thể PRF : E(Y/X=Xi) = ˆ 2 + ˆ 2X nếu như E tuyến tính với Xi thì
và ˆ 2 là ước lượng của β1và β2
ei :được gọi là phần dư hay chính là ước lượng của Ui
Giá trị ước lượng của Yi
Trang 4Hình biểu diễn phần dư ei vậy phần dư hàm hồi quy là ước lượng của Ui hay là giá trị chênh lệch giữa biến phụ thuộc (Yi) với biến tiêu thức phụ thuộc (Yˆ i )
ei = Yi - Yˆ i
phần dư hàm hồi quy có thể âm có thể dương
1.2 bản chất của phần dư trong hàm hồi quy
-Chúng ta có thế xây dựng được mô hình hồi quy bội dù chúng ta có đưa vào baonhiêu biến đi chăng nữa thì yếu tố phần dư vẫn tồn tại vì yếu tố hiễn nhiên củachúng ,ngaycả khi các biến bị loại bỏ khỏi mô hình
- ei được sử dụng như một yếu tố đại diienj cho tất cả các biến không có trong môhình ngay cả khi các biến bị loại bỏ khỏi mô hình là biến nào đi chăng nữa khi đóquá trình chuyển đổi mô hình hồi quy tổng thể PRF sang mô hình hồi quy mẫu SRFluôn luôn tồn tại phần dư ei như một yếu tố ngẫu nhiên
- Ngoài các biến giải thích đã có trong mô hình còn có một số biến khác nhưngảnh hưởng của chúng đến Y rất nhỏ Trong trường hợp này chúng ta có thể sử dụngyếu tố ngẫu nhiên Ui để đại diện cho chúng Tức phàn dư ei đại diện cho quá trìnhchuyển đổi mô hình PRF sang SRF , với ei là ước lượng của Ui
1.3 sự cần yhieets phải phân tích phần dư trong hàm hồi quy
e i là ước lượng của Ui hay là giá trị chênh lệch giữa biến phụ thuộc Y i với ướclượng của biến tiêu thức phụ thuộc Yˆ i vì vậy quá trình phân tích phần dư e i
trong hàm hồi quy chúng ta xác định được các tham số ˆ 1 và ˆ 2 của mô hình hồiquy cũng như các yếu tố khác có trong mô hình hồi quy
1.4 Ý nghĩa của việc phân tích phần dư tỏng hàm hôi quy
Việc phân tích phần dư trong hàm hồi quy là cơ sở là tiền đề trong tất cả cácphân tích của hàm hồi quy với cỏ sở ban đầu là tổng phần dư nhỏ nhất theo OLS
ta xác đinh được các biến có trong mô hình
2
1 1
i
Trang 5
CHƯƠNG 2 : NỘI DUNG PHÂN TÍCH PHẦN DƯ TRONG
HÀM HỒI QUY
2.1 Mô hình hồi qui đơn biến ( Hai biến )
2.1.1 Khái niệm về hồi quy
Phân tích hồi quy là tìm quan hệ phụ thuộc của một biến, được gọi là biến phụthuộc vào một hoặc nhiều biến khác, được gọi là biến độc lập nhằm mục đích ướclượng hoặc tiên đoán giá trị kỳ vọng của biến phụ thuộc khi biết trước giá trị củabiến độc lập.1
Một số tên gọi khác của biến phụ thuộc và biến độc lập như sau:
-Biến phụ thuộc: biến được giải thích, biến được dự báo, biến được hồi quy,
biến phản ứng, biến nội sinh
-Biến độc lập: biến giải thích, biến dự báo, biến hồi quy, biến tác nhân hay biến
kiểm soát, biến ngoại sinh
-Hàm hồi quy tổng thể và hồi quy mẫu
giả sử chúng ta có n cặp quan sát của Y và X khi đó xây dựng được mô hình hồi quy
PRF : E(Y/X=Xi) = ˆ 2 + ˆ 2X
SRF Yˆi ˆ1 ˆ2X i
Yi = Yi = ˆ 1 + ˆ 2Xi + ei
Trang 6cặp quan sát thứ i có giá trị tương ứng ( Xi , Yi ) ; i= 1,n Ta phải tìm Y sao cho
nó càng gần giá trị (Yi) có thể được tức phần dư
Hàm hồi quy tổng thể Y= Xi
Trang 7 2
1
2 1 1
i i
n 1
i i 1 2 i1
n 1 i
2 i
n 1
i i 1 2 i2
n 1 i
2 i
n
1
i
i i
2
XX
XXY
n
1
i
i i
2
x
xy
a Các tính chất của phần dư e i
(1) Giá trị trung bình của phần dư bằng 0:E ei 0
Trang 8(2) Các phần dư ei và Yi không tương quan với nhau:
n 1 i i
iY 0e
(3) Các phần dư ei và Xi không tương quan với nhau:
n 1 i i
iX 0e
(4) Phần dư ei là yếu tố quan trọng ,trong quá trình đo sự phù hợp của hàm hồi quy
Từ RSS ( Residual sum of Squarses ) tổng bình phương của tất cả các sai lệch giữa các giá trị quan sát Y và giá trị nhận được từ hàm hồi quy
2 i
e
1
)ˆ(
b Phương sai của phần dư có thể được ước tính như sau
2.1.3.Nội dung phân tích phần dư theo phương pháp bình phương nhỏ nhất
tổng quát
Để giải đáp cho câu hỏi khi phương sai của sai số thay đổi ,thì phương pháp bình
phương nhỏ nhất tổng quát là cần thiết Trước khi đi vào nội dung cụ thể chúng ta trình bày phương pháp bình phương nhỏ nhất có trọng số
Trang 9 2
1
2 1 1
n
i
để thu được ước lượng
Còn phương pháp bình phương nhỏ nhất có trọng số cực tiểu tổng bình phương các phần dư có trọng số
1
2 1 1
i 2 i
1 i
i
w w
X w
1 w
* 1 1
*
i i i
Trang 10 2
1
2 1 1
n
i
Lưu ý Trong quá trình phân tích phần dư đối với giá trị biến độc lập X hoặc giá
trị dự đoán Y sẽ cho ta biết liệu phương sai của sai số có thay đổi hay
không Phương sai của phần dư được chỉ da bằng đọ rộng của biểu đồ phân giải của phần dư khi giảm hoặc tăng Nếu độ rộng của biểu đồ rãi của phần dư tăng hoặc giảm Khi X tăng thì giá trị giả thiết về phương sai hắng số có thể không thõa mãn
2.1.4 phân tích phần dư trong hệ số đo sự phù hợp của hàm hồi quy mẫu
Làm thế nào chúng ta đo lường mức độ phù hợp của hàm hồi quy tìm được cho
dữ liệu mẫu Thước đo độ phù hợp của mô hình đối với dữ liệu là R2 Để có cái nhìntrực quan về R2, chúng ta xem xét đồ thị sau
Hình 3.5 Phân tích độ thích hợp của hồi quy
SRF
Trang 11i i
1 i
2 i n
1 i
2 i n
2 i n
1 i
2 i n
2 i
yTSS ,
n 1 i
2 i
yˆESS và
n 1 i
2 i
eRSS
TSS(Total Sum of Squares): Tổng bình phương biến thiên của Y
ESS(Explained Sum of Squares): Tổng bình phương phần biến thiên giải thích được bằng hàm hồi quy của Y
RSS(Residual Sum of Squares) : Tổng bình phương phần biến thiên không giải thích được bằng hàm hồi quy của Y hay tổng bình phương phần dư.Ta có:
TSS = ESS + RSS
Đặt
TSS
RSS1TSS
Trang 122 y
2 x 2 2 n
1 i
2 i
n 1 i
2 i
2 2 n
1 i
2 i
n 1 i
2 i 2 2 n
1 n x
ˆ y
x ˆ y
2 i
n 1 i i i 2
x
xy
2 Y , X n
1 i
2 i n
1
i
2 i
2 n
1
i
i i
yx
yx
a.Tuyến tính trong tham số
Trong mục 3.2.1 chúng ta đã đặt yêu cầu là để ước lượng theo phương pháp bình phương tối thiểu thì mô hình hồi quy phải tuyến tính Sử dụng tính chất hàm tuyến tính của các phân phối chuẩn cũng là phân phối chuẩn, dựa vào các giả định chặt chẽ và phương pháp bình phương tối thiểu, người ta rút ra các hàm ước lượng tham
số hiệu quả và các trị thống kê kiểm định
Hồi quy tuyến tính chỉ yêu cầu tuyến tính trong các tham số, không yêu cầu tuyến tính trong biến số
Mô hình
X 1
Trang 13là mô hình tuyến tính trong các tham số nhưng phi tuyến theo biến số.
là mô hình phi tuyến trong các tham số nhưng tuyến tính trong biến số
Theo phương pháp tổng phần dư nhỏ nhất theo OLS ta xác đinh được các biến có trong mô hình chúng ta xác định được các tham số ˆ 1 và ˆ 2 của mô hình hồi quycũng như các yếu tố khác có trong mô hình hồi quy
2
1 1
2
1 1
i
Trang 14Chúng ta sẽ chứng minh đặc tính đáng lưu ý của mô hình này là độ co dãn cầu
theo giá không đổi Định nghĩa độ co dãn:
Y
X X
Y X
Tổng quát, đối với mô hình logarit kép, hệ số ứng với ln của một biến số độc lập
là độ co dãn của biến phụ thuộc vào biến độc lập đó
-Mô hình Logarit-tuyến tính hay mô hình tăng trưởng
Gọi g là tốc độ tăng trưởng, t chỉ thời kỳ Mô hình tăng trưởng như sau
)g1ln(
0 X 0 ln(X)
Y Y = 1X2 ln(Y) ln(Y)
= ln(1) + 2ln(X)
Trang 15 2
1 1
Hình Chuyển dạng Lin-log
Theo phương pháp tổng phần dư nhỏ nhất theo OLS ta xác đinh được các biến có trong mô hình chúng ta xác định được các tham số ˆ 1 và ˆ 2 của mô hình hồi quycũng như các yếu tố khác có trong mô hình hồi quy
2
1 1
Trang 16Hình Dạng hàm nghịch đảo
Theo phương pháp tổng phần dư nhỏ nhất theo OLS ta xác đinh được các biến có trong mô hình chúng ta xác định được các tham số ˆ 1 và ˆ 2 của mô hình hồi quycũng như các yếu tố khác có trong mô hình hồi quy
2
1 1
Với X2,i, X3,i,…,Xk,i là giá trị các biến độc lập ứng với quan sát i
Hàm hồi quy mẫu
i i, k k i,
3 3 i, 2 2 1
i ˆ ˆ X ˆ X ˆ X e
i k k i
3 3 i 2 2 1 i i
3 3 i 2 2 1 i n
Y Y Y
Trang 17đạt cực tiểu.
2 2.2 Mô hình hồi quy 3 biến
Hàm hồi quy tổng thể
i i 3 3 i 2 2 1
i X X
Hàm hồi quy mẫu
i i, 3 3 i, 2 2 1
i ˆ ˆ X ˆ X e
(1) Kỳ vọng của sai số hồi quy bằng 0: Eei X2i, X3i 0
(2) Không tự tương quan: covei, ej 0, i≠j
i
evar
(4) Không có tương quan giữa sai số và từng Xm: covei,X2i,covei,X3i,0
(5) Không có sự đa cộng tuyến hoàn hảo giữa X2 và X3
(6) Dạng hàm của mô hình được xác định một cách đúng đắn
Để thu được các tham số của mô hình ta thực hiên phương pháp bình phương benhất OLS
1
, 3 3 , 2 2 1 1
i n
1 Y ˆ X ˆ X
ˆ
2 n
1 i
i, 3 i, 2 n
1 i 2 n
1 i 2
n 1 i
i, 3 i, 2 n
1 i
i, 3 i n
1 i 2 n
1
i
i, 2 i 2
xxx
x
xxx
yx
xy
ˆ
i, 3 i,
2
i, 3
1 i
i, 3 i, 2 n
1 i 2 n
1 i
2
n 1 i
i, 3 i, 2 n
1 i
i, 2 i n
1 i 2 n
1
i
i, 3
i
3
xxx
x
xxx
yx
x
y
ˆ
i, 3 i,
2
i, 2
Trang 18(4)
n i i
e
1
0ˆ
2.2 3 Mô hình hồi quy K biến
Từ mô hình hồi quy mẫu SRF : Yˆi ˆ1ˆ2X2,i ˆ3X3,i ˆk X k,i
Ta có mô hình hôi quy : Yi ˆ1ˆ2X2 i, ˆ3X3 i, ˆkXk i,ei Nói cụ thể hơn Y1 = 1 + 2x21 + …+ kxk1 + 1
.
2 1
= Y - X các ước lượng OLS ta tìm được
1
, 3 3 , 2 2 1 1
i i
Trang 20CHƯƠNG 3 ỨNG DỤNG CỦA PHẦN DƯ TRONG PHÂN TÍCH HÀM HỒI QUY
3.1 Phát hiện phương sai của sai số thay đổi
Như chúng ta đã biết việc phát hiện da phương sai của sai số thay đổi rất khó Do vậy để làm được điều này việc phân tích phần dư có ý nghĩa cực kỳ quan trọng trong quá trình phát hiện phương sai của sai số thay đổi
Đồ thị phân tán phần dư ei theo Xi
Theo các đồ thị trên thì khi giá trị dự báo Y tăng (hoặc khi X tăng) thì phần dư có
xu hướng tăng, hay mô hình có phương sai của sai số thay đổi
Lưu ý : Người ta có thể vẽ đồ thị phần dư bình phương đối với X hoặc Y
Trang 21ei 2 thu được từ hồi quy gốc
ei 2 thu được từ hồi quy gốc Tức từ hồi quy gốc ta thu được các phần dư ei
sau đó bình phương chúng được ei 2 rồi lấy lnei 2
Như vậy ta thực hiện kiểm định Park theo các bước sau
(1) Ươcs lượng hồi quy gốc ,cho dù có hoặc không tồn tại hiện tượng phương sai của sai số thay đổi
(2) Từ hồi quy gốc thu được các phần dư ei sau đó bình phương được
ei 2 rồi đến lấy lnei
(3) Tiến hành kiểm định nêu ở mục [4- 136 ] Bài giảng kinh tế lượng PGS.TS NGYỄN QUANG ĐÔNG
3.1.3 Kiểm đinh Glejser
Kiểm đinh Glejser cũng tương tự như kiểm đinh Park Sau khi thu được phần
dư ei từ hồi quy theo phương pháp bình phương nhỏ nhất Kiểm đinh Glejser đề nghị hồi quy giá trị tuyệt đối cua ei , ei đối với biến Xi nào đó mà có thể kết hợp chặt chaex với 2
i
Trong thực tế Glejser sử dụng các hàm sau
Trang 223.1.4 Kiểm đinh While
Mô hình hồi quy
Các dạng hồi quy phụ thường sử dụng là
i pi p i
2 2 1
2
e
i pi p i
2 2 1
Trang 232 2 1
2 2 1
ˆ ˆ
3.2 Phát hiện có sự tương quan
trong các công cụ phát hiên sự tương quan trong mô hình hồi quy ,việc phân tíchphần dư ei có ý nghĩa cực kỳ quan trọng trong quán trình phát hiện sự tương quan
3.2.1.Phương pháp đồ thị
Sự tương quan trong các mô hình cổ điển gắn liền với các nhiễu tổng thể Uikhông quan sát được cái mà chúng ta quan sát được là phần dư ei thu được từphương pháp bình phương nhỏ nhất thong thường
Dù ei không hoàn toàn giống Ui nhưng sự xem xét trực tiếp thường gọi cho
ta manh mối nào đó về sự tương quan U Trên thực tế sự xem xét trực quan về eihoặc ei2 có thể cho thong tin hữu ích về tự tương quan và tính không đồngphương sai , sự không phù hợp của mô hình
Có những cách khác nhau để xem xét phần dư Chúng ta có thể đơn thuần vẽ
Trang 24Đồ thị phần dư theo thời gian
Đồ thị phần dư theo thời gian ở trên không biểu thị một kiểu mẫu nào khithời gian tăng lên những phần dư như vậy hình như phân bố ít nhiều ngẫu nhiênxung quanh trung bình của chúng
3.2.1 Phương phá kiểm định số lượng
a.Phương pháp kiểm định các đoạn mạch
Từ việc phân tích phần dư ei ta thu được một chuỗi các phần dư và đânhs đáu theop tiêu thức phần dư am ,phần dư dương
n1 Số ký hiệu dương ( số phần dư dương )
n2 Số ký hiệu âm ( số phần dư âm )
Vậy từ đó tax ac định được yêu cầu bài toán
Trang 25b.Kiểm định 2với tính độc lập của các phần dư
Để kiểm định 2 với tính độc lập của phần dư ,ta sử dụng bảng tiếpliên Bảng tiếp liê-n mà chúng ta sử dụng tại đây gồm một số dòng và một số cột.Cụ thể là bảng tiếp liên gồm 2 dòng , 2cootj Các dòng tương ứng với các phần
dư dương tại( t )các cột tương ứng với các phần dư âm tại (t-1 ) Trong mỗi ô tatính A ijvà E ij
Trrong đó
A ij : Tần số thực tế ở ô (ij)
ij
E : Tần số lý thuyết ở ô (ịj)
Từ bảng trên ta thiết lập được các phần dư e i
3.2.2 Phát hiện sự tồn tại của đa cộng tuyến
Từ việc phân tích phần dư e i ta xây dụng được
TSS
RSS1TSS
2 i
e
1
)ˆ(
n i
i
Y
Do vậy nếu R2> 0.8 thì dâu s hiệu của đa cộng tuyến
3.3 Phân tích phần dư để kiểm tra các giả định trong
phân tích hồi qui tuyến tính.
Giả định của phân tích hồi qui tuyến tín:dựa vào một số giả định quan trọng sau
(a) x là một biến số cố định hay fixed, (“cố định” ở đây có nghĩa là không có
sai sót ngẫu nhiên trong đo lường);
(b) i phân phối theo luật phân phối chuẩn;
(c) i có giá trị trung bình (mean) là 0;
Trang 26(e) các giá trị liên tục của i không có liên hệ tương quan với nhau (nói cách khác, 1 và 2 không có liên hệ với nhau)
Nếu các giả định này không được đáp ứng thì mô hình mà chúng ta ước tính cóvấn đề hợp lí (validity) Do đó, trước khi trình bày và diễn dịch mô hình trên, chúng tacần phải kiểm tra xem các giả định trên có đáp ứng được hay không Trong trườnghợp này, giả định (a) không phải là vấn đề, vì độ tuổi không phải là một biến số ngẫunhiên, và không có sai số khi tính độ tuổi của một cá nhân
Đối với các giả định (b) đến (e), cách kiểm tra đơn giản nhưng hữu hiệu nhất là bằng cách xem xét mối liên hệ giữa Yˆ i , X ivà phần dư e i
ei = Yi - Yˆ i bằng những đồ thị tán xạ
Để kiểm tra các giả định trên, chúng ta có thể vẽ một loạt 4 đồ thị treân như sau:
(a) Đồ thị bên trái dòng 1 vẽ phần dư e i và giá trị tiên đoán cholestero Yˆ i Đồthị này cho thấy các giá trị phần dư tập chung quanh đường y = 0, cho nên giả định(c), hay e i có giá trị trung bình 0, là có thể chấp nhận được