Chương 1 MÔ HÌNH HỒI QUY TUYẾN TÍNH HAI BIẾN Chương 1 MÔ HÌNH HỒI QUY TUYẾN TÍNH HAI BIẾN Nguyễn Phương Bộ môn Toán kinh tế Đại học Ngân hàng TPHCM Email nguyenphuong0122@gmail com Ngày 9 tháng 12 năm[.]
Trang 1Ngày 9 tháng 12 năm 2022
Trang 2NỘI DUNG
1 Mô hình và một số khái niệm
Mô hình hồi quy
Hàm hồi quy tổng thể
Hàm hồi quy mẫu
Tư tưởng của phương pháp OLS
Công thức ước lượng hệ số chặn, hệ số góc
Trình bày kết quả phân tích hồi quy
3 Tính không chệch và độ chính xác của ước lượng OLSCác giả thiết của phương pháp OLS
Độ chính xác của ước lượng OLS
4 Độ phù hợp của hàm hồi quy - hệ số xác định R2
5 Khoảng tin cậy choβ1,β2 vàσ2
Phân phối xác suất của các ước lượng
Khoảng tin cậy choβ1,β2
Khoảng tin cậy cho phương sai sai số ngẫu nhiên
6 Kiểm định giả thuyết
Kiểm định giả thuyết về hệ số hồi quy
Kiểm định giả thuyết vềσ2
Kiểm định sự phù hợp của hàm hồi quy
7 Dự báo giá trị của biến phụ thuộc
8 Một số vấn đề bổ sung
Đơn vị đo lường trong phân tích hồi quy
Hệ số chặn và mô hình hồi quy
2
Trang 3Bài toán quan trọng trong phân tích kinh tế: đánh giá tác động của của mộtbiến số lên một số biến số khác.
Thí dụ: muốn đánh giá tác động của thu nhập lên chi tiêu tiêu dùng
Suy luận thông thường: khi thu nhập tăng thì mức chi tiêu tiêu dùng sẽ giatăng
−→ có thể biểu diễn mối quan hệ phụ thuộc hàm số giữa các biến này như sau:
TD = f(TN) ?
Mô hình hồi quy tuyến tính
Mô hình hồi quy tuyến tính hai biến thể hiện mối quan hệ phụ thuộc giữabiến Y và biến X có dạng như sau:
Trang 4Biến phụ thuộc Biến độc lập
- là biến số mà ta đang quan tâm đến
giá trị của nó, thường kí hiệu là Y và
nằm ở vế trái của phương trình
- là biến số được cho là có tác độngđến biến phụ thuộc, thường kí hiệu
là X và nằm ở vế phải của phươngtrình
- còn được gọi là biến được giải thích - còn được gọi là biến giải thích.
Sai số ngẫu nhiên: là yếu tố đại diện cho các yếu tố có tác động đến biến Yngoài X
Hồi quy nghiên cứu sự phụ thuộc của một đại lượng kinh tế này (biến phụthuộc, biến được giải thích) vào một hay nhiều đại lượng kinh tế khác (biếnđộc lập, biến giải thích) dựa trên ý tưởng là ước lượng giá trị trung bình củabiến phụ thuộc trên cơ sở các giá trị biết trước của các biến độc lập
➤ Biến độc lập có giá trị xác định trước
➤ Biến phụ thuộc là đại lượng ngẫu nhiên tuân theo các quy luật phân bốxác suất
Trang 5Hàm hồi quy tổng thể là hồi quy được thực hiện trên số liệu của tổng thể vàphản ánh chính xác mối quan hệ giữa biến độc lập và biến phụ thuộc.
Hàm hồi quy tổng thể − PRF: E(Y|X) =β1+β2X
Mô hình hồi quy tổng thể − PRM: Yi=β1+β2Xi+ ui, i = 1, N;
trong đó E(Y|X) là kỳ vọng của biến Y khi biết giá trị của X, hay còn gọi là
kỳ vọng của Y với điều kiện X
Thí dụ Hồi quy TD (tiêu dùng) theo TN (thu nhập)
Mô hình hồi quy tuyến tính như sau: TD =β1+β2TN + u
Các hệ số hồi quy
➤ β được gọi là hệ số chặn, nó chính bằng giá trị trung bình của biến phụ
Trang 6Hàm hồi quy mẫu là hồi quy được thực hiện trên số liệu của mẫu dùng để ướclượng hàm hồi quy tổng thể.
Hàm hồi quy mẫu − SRF: Y = ˆˆ β1+ ˆβ2X
Mô hình hồi quy mẫu − SRM: Yi= ˆβ1+ ˆβ2Xi+ ei, i = 1, n;
trong đó ˆY là ước lượng cho E(Y|Xi); ˆβ1, ˆβ2 là ước lượng choβ1, β2; ei là phần
dư, ước lượng cho ui
Trang 7Xét mô hình hồi quy tổng thể: Y =β1+β2X + u
Mô hình hồi quy mẫu tại mỗi quan sát: Yi=β1+β2Xi+ ui
Với bβ1, bβ2là các ước lượng củaβ1, β2, ta có thể viết hàm hồi quy mẫu như sau:
b
Yi= bβ1+ bβ2XiSai lệch giữa giá trị thực tế Yi và giá trị ước lượng tương ứng từ hàm hồi quymẫu bYi là phần dư
ei= Yi−Ybi
Trang 8β1, bβ2 được xác định dựa trên tiêu chuẩn cực tiểu tổng bình phương các phần
dư, được gọi là phương pháp bình phương bé nhất
β1= Y − bβ2Xb
P
i=1
x2 i
với xi= Xi− X, yi = Yi− Y và X, Y là trung bình mẫu của X, Y
Trang 11(a) Đồ thị phân tán (b) Mô hình hồi quy
Trang 12Ví dụ 2.2
Trong tệp số liệu ch1vd1.wf1 có 135 quan sát cho các biến số: số năm làm việcsau khi tốt nghiệp ngành ngân hàng (KN, năm) và mức lương hàng năm (TN,triệu đồng) Hãy ước lượng hàm hồi quy tuyến tính của TN theo KN
Trang 13Trình bày kết quả phân tích hồi quy:
Trang 14Giả thiết 1: Với mỗi giá trị của X, giá trị của Y là
Yi=β1+β2Xi+ ui
Giả thiết 2: Kỳ vọng của sai số ngẫu nhiên khi biết giá trị của X
E(ui) = E(u|Xi) = 0, ∀iKhi giả thiết 2 thỏa mãn thì
E(ui) = 0Cov(Xi, ui) = 0
Từ đó, ta được:
E(Y|Xi) =β1+β2Xi
Giả thiết 3: Phương sai của các sai số ui không đổi
Var(ui) = Var(u|Xi) =σ2, ∀i
Trang 15Giả thiết 4: Không có sự tương quan giữa các ui:cov[ui, uj] = 0, ∀i , j.
−→ ui là ngẫu nhiên, sai số ở quan sát này không ảnh hưởng đến sai số ở cácquan sát khác
Giả thiết 5: ui có phân phối chuẩn, ui ∼ N(0, σ2)
Trang 16i=1
x2 i
Trang 17Ước lượng của phương sai sai số ngẫu nhiênσ2
ˆ
σ2
Sai số chuẩn (standard error) của hệ số ước lượng
v
Trang 18Giữa các giá trị mẫu của biến phụ thuộc Yi và các ước lượng của nó bYi có sựsai lệch.
−→ Nếu sai lệch là nhỏ thì hàm hồi quy mẫu khá phù hợp với số liệu mẫu
−→ Khi sai lệch lớn thì hàm hồi quy mẫu là phù hợp thấp với số liệu mẫu
Để đánh giá một cách định lượng sự phù hợp của hàm hồi quy mẫu đối với sốliệu mẫu −→ đưa ra khái niệm hệ số xác định, kí hiệu là R2
Trang 20Tính chất 4.1
TSS = ESS + RSS
Sự biến đổi của Y là tổng của hai thành phần: của sự biến đổi của phần dư(thể hiện cho các yếu tố không đưa vào mô hình) và sự biến đổi được thể hiệnbởi mô hình
Trang 21Tỷ số ESS
TSS thể hiện phần trăm sự biến đổi của biến Y trong mẫu được giảithích bởi mô hình, còn được gọi là hệ số xác định của hàm hồi quy và được kýhiệu là R2
R2= ESS
RSSTSS
0 ≤ R2≤ 1
R2= 1: biến X giải thích được 100% sự thay đổi của biến Y
R2= 0: biến X hoàn toàn không giải thích được sự thay đổi của biến Y
−→ mô hình không phù hợp −→ có thể cho rằng mô hình hồi quy tổngthể không phù hợp
Trang 22✓ R2= r2X,Y
✓ R2= 0 khi và chỉ khi ˆβ2= 0
ii) Trong mô hình hồi quy hai biến không chứa hệ số chặn thì các phát biểu
về R2 đều có thể không đúng nữa vì R2 có thể nhận giá trị âm
Trang 24β1,β2 và σ2 β1,β2
Xét mô hình hồi quy
Y =β1+β2X + u
Khoảng tin cậy củaβj
Khoảng tin cậy đối xứng
ˆβj− tα/2(n − 2)se( ˆβj); ˆβj+ tα/2(n − 2)se( ˆβj);Khoảng tin cậy bên phải (dùng để ước lượng tối thiểu choβj)
ˆβj− tα(n − 2)se( ˆβj); +∞;Khoảng tin cậy bên trái (dùng để ước lượng tối đa choβj)
−∞; ˆβj+ tα(n − 2)se( ˆβj);trong đó tα(n) là giá trị tới hạn mứcα của phân phối Student với n bậc
tự do
Ý nghĩa: Khoảng tin cậy (1 −α) ∗ 100% cho hệ số góc βj (j = 1, 2, , k) chobiết khi biến Xjtăng 1 đơn vị và các biến khác trong mô hình không đổi thìgiá trị trung bình của biến phụ thuộc thay đổi trong khoảng nào
Trang 26β1,β2 và σ2
Khoảng tin cậy cho phương sai của sai số ngẫu nhiên
(n − 2)ˆσ2
χ2 α/2(n − 2)
≤σ2≤ (n − 2)ˆσ2
χ2 1− α/2(n − 2)
trong đó ˆσ2 là sai số chuẩn của hồi quy − S.E of regression
Trang 27Các bước khi kiểm định giả thuyết thống kê:
➤ Bước 1: Xác định cặp giả thuyết thống kê H0 và H1
➤ Bước 2: Tính giá trị quan sát của thống kê kiểm định
➤ Bước 3: So sánh thống kê quan sát với giá trị tới hạn
−→ kết luận chấp nhận H0hay bác bỏ H0
➤ Bước 4: Kết luận
Trang 28Kiểm định cặp giả thuyết H0:βj= 0 và H1:βj, 0 với mức ý nghĩa α.Cách 1: Dùng khoảng tin cậy đối xứng củaβj với độ tin cậy (1 −α) :
Bước 1: Tính KTC của ˆ β j − se(ˆ β j )tα/2(n − 2); ˆ β j + se(ˆ β j )tα/2(n − 2); Bước 2:
Bước 3:
- Nếu p − value ≥ α thì chấp nhận H 0
- Nếu p − value < α thì không chấp nhận H 0
Trang 29Bài toán: Kiểm định giả thuyết H0:βj=β∗
j với mức ý nghĩaα
t =ˆ
βj−β∗ j
Trang 30Bài toán: Kiểm định giả thuyết H0:σ2=σ2
0với mức ý nghĩaα
χ2=(n − 2)ˆσ2
σ2 0
Trang 31Bài toán: Kiểm định sự phù hợp của hàm hồi quy với mức ý nghĩaα.
Kiểm định cặp giả thuyết
H0: R2= 0 (Hàm hồi quy không phù hợp)
H1: R2, 0 (Hàm hồi quy phù hợp)Tiêu chuẩn thống kê
RSS/(n − 2) =
R2/1(1 − R2)/(n − 2) =
R2(n − 2)(1 − R2) Nếu Fqs> fα(1; n − 2) thì bác bỏ H0, kết luận hàm hồi quy là phù hợp
Ví dụ 6.4
Từ số liệu đã cho của Ví dụ 2.1 về chi tiêu và thu nhập Hãy kiểm định sự phùhợp của mô hình với mức ý nghĩa 5%
Trang 32Khoảng tin cậy (1 −α) cho giá trị trung bình của biến phụ thuộc Y khi
X = X0 là:
ˆY0− tα/2(n − 2)se( ˆY0); ˆY0+ tα/2(n − 2)se( ˆY0)
;trong đó
ˆ
Y0= ˆβ1+ ˆβ2X0 là ước lượng điểm cho E(Y|X0);
se( ˆY0) = ˆσ
s1
(X0− X)2
Pn i=1x2 i
Trang 33
Ví dụ 7.1
Từ số liệu đã cho của Ví dụ 2.1 về chi tiêu và thu nhập Hãy dự báo giá trịtrung bình và giá trị riêng biệt của chi tiêu khi thu nhập ở mức 60 triệuđồng/năm với hệ số tin cậy 95%
Trang 34Trong hàm hồi quy hai biến , nếu đơn vị tính của X và Y thay đổi thì takhông cần hồi quy lại mà chỉ cần áp dụng công thức đổi đơn vị tính.
Hàm hồi quy theo đơn vị tính cũ: bYi= bβ1+ bβ2Xi
Hàm hồi quy theo đơn vị tính mới: bYi∗= ˆβ∗
Ví dụ: Cho hàm hồi quy giữa lượng tiêu thụ cà phê (Y – ly/ngày) với giá bán
cà phê ( X – ngàn đồng/kg) như sau: bYi = 110 − 0, 2Xi
Viết lại hàm hồi quy nếu đơn vị tính của Y là ly/tuần
Trang 36Thí dụ: Giả sử có hàm hồi quy tổng thể sau về mối quan hệ giữa số năm kinhnghiệm KN (năm) và mức thu nhập của người lao động TN (triệu
đồng/tháng) trong ngành dệt may
TN = 3, 6 + 0, 6KN + u
−→ khi số năm kinh nghiệm bằng 0 - nghĩa là người vừa mới bắt đầu làm việc
- thì mức thu nhập trung bình của người lao động là 3,6 triệu/tháng
Thí dụ: Xét hàm hồi quy tổng thể về mối quan hệ giữa giá và nhu cầu về vàng:
Q = 25 − 0, 1P + u