Các giả thiết cổ điển của mô hình hồi qui tuyến tính Khái niệm Phân tích hồi quy là nghiên cứu sự phụ thuộc của một biến (biến phụ thuộc) vào một hay nhiều biến khác (biến độc lập), nhằm mục đích ước[.]
Trang 1Khái niệm
Phân tích hồi quy là nghiên cứu sự phụ thuộc của một biến (biến phụ thuộc) vào một hay nhiều biến khác (biến độc lập), nhằm mục đích ước lượng (hay dự đoán) giá trị trung bình của biến phụ thuộc trên cơ sở các giá trị biết trước của các biến độc lập.
Phân tích tương quan là đo mức độ quan hệ
tuyến tính giữa hai biến; không có sự phân biệt
giữa các biến; các biến có tính chất đối xứng.
CHƯƠNG 5: HỒI QUY TUYẾN TÍNH
(ĐƠN BIẾN)
Trang 21 Mô hình hồi quy
Mô hình hồi quy tổng thể (PRF)
Yi = 1 + 2Xi + Ui
• 1 : là hệ số chặn – tung độ gốc
• 2 : hệ số góc - hệ số đo độ dốc đường hồi quy
• Ui:sai số ngẫu nhiên của tổng thể ứng với quan sát
thứ i
Với một mẫu n quan sát (Yi, Xi) Cần ước lượng (PRF).
Trang 3Mô hình hồi quy mẫu (SRF)
Mô hình hồi quy mẫu:
Trong đó
: ước lượng cho 1 : Ước lượng cho 2 : Ước lượng cho E(Y/Xi) = Yi
Mô hình hồi quy mẫu ngẫu nhiên
ˆ
iYˆ
i i
Y ˆ1 ˆ2
Trang 4Theo phương pháp OLS, để
2 i 2 1
i
n
1 i
2 i
2 i
0 )
X )(
X ˆ ˆ
Y (
2 ˆ
e
0 )
1 )(
X ˆ ˆ
Y (
2 ˆ
e
β
β β
β β
β
Trang 5X ˆ Y
ˆ )
X ( n X
Y X n Y
X ˆ
2 1
n
1 i
2
2 i
n
1 i
i i
Ví dụ : có số liệu về thời gian quảng cáo
trên truyền hình và luợng sản phẩm tiêu thụ ở một công ty sản xuất đồ chơi trẻ em như sau:
Thờ i gian quả ng cá o
trong tuầ n (phú t)
28 37 44 36 47 35 26 29 33 32 31 28
Lượng tiê u thụ
trong tuầ n (1000 sp)
41 32 49 42 38 33 27 24 35 30 34 25
Trang 62 Các giả thiết cổ điển của mô hình
hồi qui tuyến tính
• Giả thiết 1 : Biến độc lập Xi là phi
ngẫu nhiên, các giá trị của chúng phải được xác định trước
• Giả thiết 2 : Kỳ vọng có điều kiện của
sai số ngẫu nhiên bằng 0 :
E (Ui / Xi) = 0 i
Trang 7• Giả thiết 3 : (Phương sai thuần nhất )
Các sai số ngẫu nhiên có phương sai
bằng nhau :
Var (Ui / Xi) = 2 i
• Giả thiết 4 : Không có hiện tượng tương
quan giữa các sai số ngẫu nhiên :
Cov (Ui , Uj ) = 0 i j
• Giả thiết 5 : Không có hiện tượng tương
quan giữa biến độc lập Xi và sai số ngẫu nhiên Ui : Cov (Xi , Ui ) = 0 i
Trang 8• Định lý Gauss – Markov : Với các giả
thiết từ 1 đến 5 của mô hình hồi qui
tuyến tính cổ điển, các ước lượng OLS
là các ước lượng tuyến tính, không
chệch và có phương sai bé nhất trong
lớp các ước lượng tuyến tính, không
chệch
Trang 93 Phương sai và sai số chuẩn của các
Trang 104 Hệ số xác định và hệ số tương quan
a Hệ số xác định
Mô hình hồi qui tuyến tính được xây
dựng nhằm để giải thích sự biến thiên của biến phụ thuộc Y vào biến độc lập X nhưng liệu mô hình này đã thể hiện một cách tốt nhất mối liên hệ giữa X và Y chưa?
Bao nhiêu phần trăm biến thiên của Y
có thể giải thích bởi sự phụ thuộc tuyến tính của Y vào X?
Hệ số xác định R2 sẽ giúp trả lời
điều này
Trang 11Hệ số xác định
TSS
RSS 1
i 1 n
2 i
i 1 n
Trang 14b Hệ số tương quan (Pearson): Là số đo
mức độ chặt chẽ của quan hệ tuyến tính giữa X và Y
Và dấu của r trùng với dấu của hệ số của
X trong hàm hồi qui ( )
Chứng minh được :
Trang 15r > 0,8 : tương quan mạnh
r = 0,4 - 0,8 : tương quan trung bình
r < 0,4 : tương quan yếu
r càng lớn thì tương quan giữa X và Y càng chặt
0 < r 1 gọi là tương quan tuyến tính thuận (X,
Trang 16Tính chất của hệ số tương quan :
1 Miền giá trị của r : -1 r 1
| r| 1 : quan hệ tuyến tính giữa X và
Trang 17Hệ số tương quan hạng Spearman
• Được tính dựa trên hạng của dữ liệu
chứ không dựa vào giá trị thực của quan sát
• Trước tiên, ta xếp hạng RX , RY các giá
trị quan sát xi , yi theo thứ tự tăng dần từ 1 trở đi, (nếu có các giá trị quan sát bằng nhau, thì được xếp đồng hạng và hạng sẽ là hạng trung bình).
• Hệ số tương quan hạng Spearman rs chính
là hệ số tương quan r giữa các hạng của xi và yi, tức là vẫn dùng công thức tính r để tính rs, trong đó, thay xi, yi
bằng các hạng của chúng.
Trang 18lưu ý : nếu không xảy ra trường hợp các
giá trị xi hay yi bằng nhau, tức là không xảy ra trường hợp đồng hạng, rs
có thể được tính bằng công thức đơn giản hơn:
n
2 i
Trang 195 Phân phối xác suất của các ước lượng
Giả thiết 6 : Ui có phân phối N (0, 2),
Với giả thiết 6, các ước lượng có thêm các tính chất sau :
1 Khi số quan sát đủ lớn thì các ước
lượng xấp xỉ với giá trị thực của phân phối :
2
n 2
Trang 20) 1 , 0 ( N
~
ˆ Z
) ,
( N
~ ˆ
) 1 , 0 ( N
~
ˆ Z
) ,
( N
1 1
ˆ
2 2
2 ˆ 2
2
ˆ
1 1
2 ˆ 1
1
β β
β β
σ
β
β σ
β β
σ
β
β σ
β β
(
~
ˆ ) 2 n
(
Trang 216 Khoảng tin cậy của các hệ số hồi qui
Ta có khoảng tin cậy của 2 :
• Sử dụng phân phối của thống kê t :
Ta có khoảng tin cậy của 1 :
Trang 227 Kiểm định giả thiết về các hệ số hồi qui
• Giá trị kiểm định t :
2
2 ˆ
Trang 238 Kiểm định sự phù hợp của hàm hồi qui Phân tích hồi qui và phân tích
/(
)R1
(
1/
Trang 25b Dự báo giá trị cá biệt :
Trang 26X
dải tin cậy của giá trị trung bình
dải tin cậy của giá trị cá biệt
X
* Đặc điểm của dự báo khoảng
Trang 2710 Trình bày kết quả hồi qui
0
ˆ t
)
ˆ ( eˆ s
0
ˆ t
2
2 2
1
1 1
β
β β
i
Yˆ
Trang 2811 Đánh giá kết quả của phân tích hồi
qui
• Dấu của các hệ số hồi qui ước lượng
được phù hợp với lý thuyết hay tiên