Bài giảng Kinh tế lượng - Chương 2: Mô hình hồi quy bội cung cấp cho người học các kiến thức: Sự cần thiết của mô hình hồi quy bội, mô hình hồi quy bội và phương pháp ước lượng OLS, tính vững của ước lượng OLS 4 khoảng tin cậy cho hệ số hồi quy,... Mời các bạn cùng tham khảo nội dung chi tiết.
Trang 1Ngày 18 tháng 9 năm 2015
Trang 2NỘI DUNG
1 Sự cần thiết của mô hình hồi quy bội
Mô hình và phương pháp OLS
Mô hình hồi quy sử dụng ngôn ngữ ma trận
Các giả thiết
Độ phù hợp của hàm hồi quy
Tính tốt nhất của ước lượng OLS
4 Khoảng tin cậy cho hệ số hồi quy
Quy luật phân phối xác suất của một số thống kê mẫuKhoảng tin cậy cho một hệ số hồi quy
Khoảng tin cậy cho biểu thức của hai hệ số hồi quyKhoảng tin cậy cho phương sai sai số ngẫu nhiên
5 Kiểm định giả thuyết về hệ số hồi quy
Kiểm định giả thuyết về một hệ số hồi quy
Kiểm định về một ràng buộc giữa các hệ số hồi quyKiểm định về nhiều ràng buộc -kiểm định F
Kiểm định sự phù hợp của hàm hồi quy
6 Dự báo giá trị của biến phụ thuộc 2
Trang 3ä Một biến phụ thuộc Y thường chịu tác động của nhiều yếu tố.
ä Mô hình hồi quy bội thường có chất lượng dự báo tốt hơn
ä Mô hình hồi quy bội cho phép sử dụng dạng hàm phong phú hơn
ä Mô hình hồi quy bội thực hiện các phân tích phong phú hơn
Ví dụ: Ngoài thu nhập, thì có nhiều yếu tố khác cũng tác động lên tiêu dùng,chẳng hạn như độ tuổi, giới tính, nghề nghiệp, địa bàn sinh sống, vật giá, thóiquen chi tiêu,
Trang 4Hàm hồi quy tổng thể-PRF: E(Y|X) =β1+β2X2+ · · · +βkXk.
Mô hình hồi quy tổng thể-PRM: Yi =β1+β2X2i+ · · · +βkXki+ ui, i = 1; N;
β1: hệ số chặn/hệ số tự do (intercept)
βj, j = 2, k : hệ số góc hay hệ số hồi quy riêng
u : sai số ngẫu nhiên
Câu hỏi: Ý nghĩa của các hệ sốβ1, β2, , βk
∆E(Y|X) =β2∆X2+ · · · +βk∆Xk
Ví dụ 2.1
Mô hình hồi quy tổng thể về lạm phát:
LP = 0, 02 + 0, 3m − 0, 15gdp + utrong đó LP, m và gdp lần lượt là tỷ lệ lạm phát, mức tăng trưởng cung tiền
và mức tăng trưởng GDP (đơn vị %) Hãy giải thích ý nghĩa của các hệ số
Trang 5Hàm hồi quy mẫu-SRF: Y = ˆˆ β1+ ˆβ2X2+ · · · + ˆβkXk.
Mô hình hồi quy mẫu-SRM: Yi = ˆβ1+ ˆβ2X2i+ · · · + ˆβkXki+ ei, i = 1; n;
trong đó ˆY là ước lượng cho E(Y|X); ˆβ1, ˆβ2, , βk tương ứng là ước lượng cho
β1, β2, , ˆβk; ei là phần dư, ước lượng cho ui
Trang 6Xét mô hình k biến: Yi=β1+β2X2i+ + βkXki+ ui, i = 1, 2, , n.Đặt
Khi đó mô hình hồi quy tổng thể dưới dạng ma trận như sau:
Ta có hàm hồi quy mẫu
ˆ
Y = X ˆβ
Véc tơ phần dư e = Y − ˆY = Y − X ˆβ
Trang 7Phương pháp OLS đi tìm ˆβ sao cho eTe → min Áp dụng phương pháp nàytìm được kết quả:
Trang 8Ví dụ 2.3
Sử dụng tập số liệu ch2vd5.wf1 Hãy ước lượng hàm hồi quy tuyến tính của CTtheo TN và TS, trong đó CT là chi tiêu (triệu đồng/năm), TN là thu nhập từlao động (triệu đồng/năm) và TS là giá trị tài sản (tỷ đồng) của hộ gia đình
(a)Kết quả hồi quy (b)Ma trận hiệp phương sai
Trang 9ä bβ1= 18, 8601 −→ với các hộ không có thu nhập và tài sản thì mức chitiêu trung bình của họ vào khoảng 18,8601 triệu đồng/năm.
ä bβ2= 0, 7912 −→khi thu nhập hộ gia đình tăng 1 triệu đồng/năm và giá trịtài sản không thay đổi thì mức chi tiêu trung bình tăng khoảng 0,7912triệu đồng/năm
ä bβ3= 0, 0158 −→khi giá trị tài sản tăng 1 tỷ đồng và thu nhập hộ gia đìnhkhông thay đổi thì mức chi tiêu trung bình tăng khoảng 0,0158 triệuđồng/năm
Trang 10Các giả thiết của mô hình
3 Giả thiết 1: Mô hình được ước lượng trên cơ sở mẫu ngẫu nhiên kíchthước n : {(Xi, Yi), i = 1, 2, , n}
3 Giả thiết 2: Kỳ vọng của sai số ngẫu nhiên tại mỗi giá trị (X2i, , Xki)bằng 0, tức là
Trang 11TSS = P n
i=1 (Y i − Y) 2 , ESS = P n
i=1 ( ˆ Y i − Y) 2 , RSS = P n
i=1 e2iNếu hàm hồi quy tuyến tính có chứa hệ số chặn thì:
TSS = ESS + RSS.
Hệ số xác định của mô hình hồi quy (tương ứng với mẫu):
R 2 = ESSTSS = 1 −
RSS TSS
Ý nghĩa:
R 2 cho biết phần trăm sự thay đổi của biến phụ thuộc được giải thích bởi các biến độc lập trong mô hình.
R2 thể hiện tương quan tuyến tính giữa biến phụ thuộc với các biến độc lập.
Khi thêm biến mới vào mô hình sẽ làm gia tăng R 2 , nhưng có thể làm chất lượng của các ước lượng giảm −→ để xét xem có nên thêm biến mới vào mô hình không người ta dùng R2hiệu chỉnh (adjusted r-square), kí hiệu là R2:
R2= 1 − (1 − R 2 )n − 1
n − k
Trang 12Định lý 2.1 (Định lý Gauss - Markov)
Khi các giả thiết 1-4 thỏa mãn thì các ước lượng thu được từ phương phápOLS là các ước lượng tuyến tính,không chệch và có phương sai nhỏ nhất(BLUE)
Độ chính xác của ước lượng
var(bβj) = σ2
(1 − R2
j)P x2 ji
=
sRSS/(n − k)(1 − R2
j)P x2 ji
Trang 14Giả thiết 5: Các sai số ngẫu nhiên có phân phối chuẩn:
Trang 15Xét mô hình hồi quy
Y =β1+β2X2+ + βkXk+ u
Khoảng tin cậy củaβj
Khoảng tin cậy đối xứng
ˆβj− tα/2(n − k)se( ˆβj); ˆβj+ tα/2(n − k)se( ˆβj);Khoảng tin cậy bên phải (dùng để ước lượng tối thiểu choβj)
ˆβj− tα(n − k)se( ˆβj); +∞;Khoảng tin cậy bên trái (dùng để ước lượng tối đa choβj)
−∞; ˆβj+ tα(n − k)se( ˆβj);trong đó tα(n) là giá trị tới hạn Student bậc n mứcα
Ý nghĩa: Khoảng tin cậy (1 −α) ∗ 100% cho hệ số góc βj (j = 1, 2, , k) chobiết khi biến Xjtăng 1 đơn vị và các biến khác trong mô hình không đổi thìgiá trị trung bình của biến phụ thuộc thay đổi trong khoảng nào
Trang 16Ví dụ 4.1
Tiếp tục ví dụ 2.3 - Sử dụng tập số liệu ch2vd5.wf1 Ước lượng hàm hồi quytuyến tính của CT (chi tiêu, triệu đồng/năm) theo TN (thu nhập từ lao động,triệu đồng/năm) và TS (giá trị tài sản, tỷ đồng), ta được:
Hãy ước lượng khoảng tin cậy 95% củaβ2vàβ3
Trang 17Xét mô hình hồi quy: Y =β1+β2X2+ + βkXk+ u.
Khoảng tin cậy cho biểu thức của hai hệ số hồi quy: đánh giá tác động của haibiến độc lập cùng thay đổi
Với a và b là các giá trị bất kỳ (có thể dương hoặc âm), thì khoảng tin cậy củacho mức gia tăng trung bình của biến Y khi X2 tăng a đơn vị và X3 tăng bđơn vị được tính bởi công thức
(a ˆβ2+ b ˆβ3) − tα/2(n − k)se(a ˆβ2+ b ˆβ3); a ˆβ2+ b ˆβ3+ tα/2(n − k)se(a ˆβ2+ b ˆβ3);trong đó sai số chuẩn
Trang 18Ví dụ 4.3
Để đánh giá hiệu quả của đầu tư từ các khu vực kinh tế lên tổng sản phẩmquốc nội, người ta sử dụng mô hình hồi quy sau:
GDP =β1+β2FDI +β3PI + utrong đó GDP, FDI và DI lần lượt là tổng sản phẩm quốc nội, đầu tư trực tiếpnước ngoài và đầu tư nội địa (đv; tỷ $) Sử dụng 30 quan sát thu được kết quảước lượng sau:
GDP = 80 + 0, 4FDI + 0, 35DI + e
se (2, 5) (0, 05) (0, 04)cov(ˆβ2, ˆβ3) = 0, 001
Trong khủng hoảng tài chính, nếu FDI giảm đi 1 tỷ $ và chính sách kích thíchcủa chính phủ giúp đầu tư nội địa tăng 1 tỷ $ thì liệu GDP thay đổi trongkhoảng nào?
Trang 19Khoảng tin cậy cho phương sai của sai số ngẫu nhiên
(n − k)ˆσ2
χ2 α/2(n − k)
≤σ2≤ (n − k)ˆσ2
χ2 1− α/2(n − k)
trong đó ˆσ2 là sai số chuẩn của hồi quy -S.E of regression
Ví dụ 4.4
Tiếp tục ví dụ 2.3 - Sử dụng tập số liệu ch2vd5.wf1 Hãy ước lượngσ2 với độtin cậy 95%
Trang 20Kiểm định cặp giả thuyết H0:βj= 0 và H1:βj, 0 với mức ý nghĩa α.Cách 1: Dùng khoảng tin cậy đối xứng củaβjvới độ tin cậy (1 −α) :
Bước 1: Tính KTC của ˆ β j − se(ˆ β j )tα/2(n − k); ˆ β j + se(ˆ β j )tα/2(n − k); Bước 2:
Bước 3:
- Nếu p − value ≥ α thì chấp nhận H 0
- Nếu p − value < α thì không chấp nhận H 0
Trang 21Bài toán: Kiểm định giả thuyết H0:βj=β∗
j với mức ý nghĩaα
t =ˆ
βj−β∗
se( ˆβj)
Hai phía βj=β∗ βj, β∗ |t|> tα/2(n − k) P (|T| ≥ |t|)Bên trái βj≥β∗ βj< β∗
t< −tα(n − k) P (T< t)Bên phải βj≤β∗ βj> β∗ t> tα(n − k) P (T> t)
Ví dụ 5.1
Tiếp tục ví dụ 2.3 - Sử dụng tập số liệu ch2vd5.wf1 Hãy kiểm định giả thuyết
“ khi thu nhập tăng thêm 1 triệu đồng/năm thì chi tiêu trung bình tăng lên0,8 triệu đồng/năm” với mức ý nghĩa 5%
Trang 22Bài toán: Kiểm định giả thuyết H0: aβj+ bβs= a∗ với mức ý nghĩaα, trong
đó a, b, a∗ là những hằng số cho trước
Bước 1: Tính t = (a ˆβj+ b ˆβs) − a∗
se(a ˆβj+ b ˆβs) ;Bước 2: Tra bảng giá trị tới hạn Student tα/2(n − k) hoặc tα(n − k) tùy
thuộc giả thuyết đối H1
Bước 3: Kết luận dựa vào bảng sau
Hai phía aβj+ bβs= a∗ aβj+ bβs, a∗ |t|> tα/2(n − k) P (|T| ≥ |t|)Bên trái aβj+ bβs≥ a∗
aβj+ bβs< a∗
t< −tα(n − k) P (T< t)Bên phải aβj+ bβs≤ a∗
aβj+ bβs> a∗
t> tα(n − k) P (T> t)
Trang 23Ví dụ 5.2
Để xem xét mối quan hệ giữa các yếu tố đầu vào với sản xuất trong các nhàmáy dệt kim, người ta chạy mô hình hồi quy với số liệu từ 30 nhà máy và thuđược kết quả:
Q = 150 + 0, 5K + 0, 7L + e
se (1, 2) (0, 1) (0, 2)cov(ˆβ2, ˆβ3) = 0, 017trong đó Q (đv:100 chiếc) là số áo sản xuất được, K (máy) là số máy dệt, L(đv:10 người) là số lao động Giả sử rằng chi phí để thuê 10 lao động cũngbằng chi phí thuê 1 máy dệt Với mức ý nghĩa 5%, có thể cho rằng tiền chi cholao động hiệu quả hơn tiền chi cho máy dệt hay không?
Trang 24Xét mô hình hồi quy: Y =β1+β2X2+β3X3+ + βkXk+ u.
Thí dụ: Kiểm định cặp giả thuyết
(R2
U− R2
R)/m(1 − R2
U)/(n − kU)trong đó m là số ràng buộc trong giả thuyết H0, kUlà số hệ số hồi quytrong mô hình không ràng buộc U
Bước 4:
- Nếu F> fα(m, n − k) thì bác bỏ H0
- Nếu F< fα(m, n − k) thì chưa có cơ sở để bác bỏ H0
Trang 25Ví dụ 5.3
Xét mô hình hồi quy về tiền lương như sau:
wage =β1+β2Edu +β3Medu +β4Ssibs + utrong đó Wage, Edu, Meduc và Ssibs lần lượt là tiền lương, trình độ học vấn,trình độ học vấn của người mẹ và số anh chị em trong gia đình của người laođộng
Với bộ số liệu file ch3vd9.wf1 ta có kết quả hồi quy như sau:
wage = 2404 + 86, 12Edu − 14, 88Medu − 30, 25Ssibs + e
RSS = 3649563; n = 32
Hãy kiểm định giả thuyết: các yếu tố “học vấn người mẹ” và “số anh chị emđồng thời trong gia đình” đồng thời không ảnh hưởng đến tiền lương củangười lao động
Trang 26Biết rằng ước lượng mô hình tuyến tính CT theo TN, ta được:
CT = 42, 733 + 0, 853TN + e,
R2= 0, 999306; n = 33
Trang 27Bài toán: Kiểm định sự phù hợp của hàm hồi quy với mức ý nghĩaα.Kiểm định cặp giả thuyết
H0: R2= 0 (Hàm hồi quy không phù hợp)
H1: R2, 0 (Hàm hồi quy phù hợp)Tiêu chuẩn thống kê
Fqs= ESS/(k − 1)RSS/(n − k) =
R2/(k − 1)(1 − R2)/(n − k).Nếu Fqs> fα(k − 1; n − k) thì bác bỏ H0, kết luận hàm hồi quy là phù hợp
Ví dụ 5.5
Tiếp tục ví dụ 5.3 Hãy kiểm định sự phù hợp của mô hình với mức ý nghĩa5%
Trang 28Khoảng tin cậy (1 −α) cho giá trị trung bình của biến phụ thuộc Y khi
X = X0 là:
ˆY0− t(n − k)
α/2se( ˆY0); ˆY0+ t(n − k)α/2se( ˆY0);trong đó
ˆ
Y0= XT0βˆ là ước lượng điểm cho Y0;se(Y0− ˆY0) = ˆσq1 + XT
0(XTX)−1X0