Định nghĩa Phân tích hồi qui là phân tích mối liên hệ phụ thuộc giữa một biến gọi là biến phụ thuộc biến được giải thích, biến nội sinh phụ thuộc vào một hoặc một số biến khác gọi là các
Trang 1KINH TẾ LƯỢNG - ECONOMETRICS
Tham khảo và nâng cao
[3] Nguyễn Cao Văn, Trần Thái Ninh, (1998), Lý thuyết Xác suất và Thống kê toán, NXB GD.
( Tái bản các năm 2002, 2005)
[4] Nguyễn Quang Dong, (2002), Kinh tế lượng - Chương trình nâng cao, NXB KHKT.
[5] Nguyễn Quang Dong, (2002), Bài tập Kinh tế lượng với sự trợ giúp của phần mềm Eviews,
NXB KHKT
[6] Nguyễn Khắc Minh, (2002), Các phương pháp Phân tích & Dự báo trong Kinh tế, NXB
KHKT
[7] Graham Smith, (1996), Econometric Analysis and Applications, London University.
[8] D Gujarati Basic Econometrics Third Edition McGraw-Hill,Inc 1996.
[9] Maddala Introduction to Econometrics New york 1992
BÀI MỞ ĐẦU
1 Khái niệm về Kinh tế lượng (Econometrics)
- Nhiều định nghĩa, tùy theo quan niệm của mỗi tác giả
- Econo + Metric
Khái niệm: KTL nghiên cứu những mối quan hệ Kinh tế Xã hội; thông qua việc xây dựng, phân
tích, đánh giá các mô hình để cho ra lời giải bằng số, hỗ trợ việc ra quyết đinh
Econometrics – Pragmatic Economics
- KTL sử dụng kết quả của :
+ Lý thuyết kinh tế
+ Mô hình toán kinh tế
+ Thống kê, xác suất
2 Phương pháp luận (các bước tiến hành)
2.1 Đặt luận thuyết về vấn đề nghiên cứu
- Xác định phạm vi, bản chất, tính chất của các đối tượng và mối quan hệ giữa chúng
- Xác định mô hình lý thuyết kinh tế hợp lý
2.2 Xây dựng mô hình kinh tế toán:
+ Mỗi đối tượng đại diện bởi một hoặc một số biến số
+ Mỗi mối quan hệ: Phương trình, hàm số, bất phương trình…
+ Giá trị các tham số : cho biết bản chất mối quan hệ
2.3 Xây dựng mô hình kinh tế lượng tương ứng
Mô hình kinh tế toán: phụ thuộc hàm số
Mô hình kinhtế lượng: phụ thuộc tương quan và hồi quy
Trang 22.4 Thu thập số liệu
- Số liệu được dùng : từ thống kê
2.5 Uớc lượng các tham số của mô hình
mô hình
Với bộ số liệu xác định và phương pháp cụ thể, kết quả ước lượng là những con số cụ thể
2.6 Kiểm định của mô hình.
mô hình
- Bằng phương pháp kiểm định thống kê: kiểm định giá trị các tham số, bản chất mối quan hệ
- Kiểm định tính chính xác của mô hình
- Nếu không phù hợp : quay lại các bước trên
Biến đổi, xây dựng mô hình mới để có kết quả tốt nhất
2.7 Dự báo
- Dựa trên kết quả được cho là tốt : dự báo về mối quan hệ, về các đối tượng trong những điều kiện xác định
2.8.Kiểm soát và Đề xuất chính sách
Dựa vào kết quả phân tích của mô hình mà đề xuất chính sách kinh tế
Ví dụ: Nghiên cứu tính quy luật của tiêu dùng.
Xây dựng một luận thuyết kinh tế về tiêu dùng
Trong tác phẩm: Lý thuyết về việc làm, lãi suất và tiền tệ, Keynes viết:” Luật tâm lý cơ bản là một người sẽ tăng tiêu dùng khi thu nhập của người đó tăng lên, song không thể tăng nhiều bằng mức tăng của thu nhập”
Xây dựng mô hình kinh tế toán tương ứng
Mô hình kinh tế lượng tương ứng có dạng:
Y i = β1 + β2 X i + u i
Trong đó ui là sai số ngẫu nhiên
Thu thập số liệu thống kê
Có số liệu sau về tổng mức tiêu dùng cá nhân ( Y ) và tổng thu nhập gộp GDP ( X ) của Mỹ giai
đoạn 1980 – 1991 ( đơn vị: tỷ USD ) tính theo giá cố định năm 1987:
Trang 3Nguồn: Báo cáo kinh tế của tổng thống Mỹ, 1993.
Ước lượng mô hình
Dùng phương pháp bình phương nhỏ nhất, tìm được các uoc lượng sau:
Từ đó có thể xây dưng tiếp các dự báo bằng khoảng tin cậy
Kiểm soát hoặc đề xuất chính sách
Chẳng hạn chính phủ Mỹ tin rằng nếu có được tổng mức tiêu dùng cá nhân là 4000 tỷ USD thì sẽ duy trì được tỷ lệ thất nghiệp ở mức 6,5% Từ đó để duy trì được tỷ lệ thất nghiệp nói trên cần phải có được GDP là:
GDP ≈ ( 4000 + 231,8 )/ 0,7194 ≈ 5882 tỷ USD
3 Số liệu dùng trong KTL
3.1 Phân loại
- Số liệu theo thời gian
- Số liệu theo không gian
Chú ý: Đặc điểm chung của các số liệu kinh tế xã hội là kém tin cậy
Chương 1 CÁC KHÁI NIỆM CƠ BẢN
1 Phân tích hồi qui – Regression Analysis
1.1 Định nghĩa
Phân tích hồi qui là phân tích mối liên hệ phụ thuộc giữa một biến gọi là biến phụ thuộc (biến được giải thích, biến nội sinh) phụ thuộc vào một hoặc một số biến khác gọi là (các) biến giải thích (biến độc lập, biến ngoại sinh, biến hồi qui).
1.2 Ví dụ Tiêu dùng và Thu nhập
- Biến phụ thuộc (dependent variable) ký hiệu là Y
- Biến giải thích / hồi qui (regressor(s)) ký hiệu là X, hoặc X 2 , X 3…
Trang 4- Biến giải thích nhận những giá trị xác định, trong điều kiện đó biến phụ thuộc là một biến ngẫu nhiên
Phân tích hồi qui nghiên cứu mối liên hệ phụ thuộc giữa biến phụ thuộc Y mà thực chất là một biến ngẫu nhiên, phụ thuộc vào các giá trị xác định của (các) biến giải thích như thế nào
X = X i→ (Y/X i)
1.3 Mục đích hồi qui
- Ước lượng trung bình biến phụ thuộc trong những điều kiện xác định của biến giải thích
- Ước lượng các tham số
- Kiểm định về mối quan hệ
- Dự báo giá trị biến phụ thuộc khi biến giải thích thay đổi
(*)Hồi qui : qui về trung bình
1.4 So sánh với các quan hệ toán khác
- Quan hệ hàm số : x ↔ y
- Quan hệ tương quan ρxy
- Quan hệ nhân quả X → Y→ X
2 Mô hình hồi qui Tổng thể
- Tổng thể : toàn bộ những cá thể mang dấu hiệu nghiên cứu
- Phân tích hồi qui dựa trên toàn bộ tổng thể
Giả sử biến phụ thuộc Y chỉ phụ thuộc một biến giải thích X
2.1 Hàm hồi qui tổng thể (PRF : Population Regression Function).
Xét quan hệ hồi qui:
X = X i→ (Y/X i) Biến ngẫu nhiên Y trong điều kiện X
β1 và β2 được gọi là các hệ số hồi quy ( regression coefficient)
Trong đó: β1 = E(Y/X i = 0): hệ số chặn (INPT : intercep term)
β2 =
i
i X
X Y E
Hàm hồi qui tổng thể được gọi là tuyến tính nếu nó tuyến tính với tham số
2.3 Sai sè ngẫu nhiên
- Xét giá trị cụ thể Y i∈ (Y/X i ), thông thường Y i ≠ E(Y/X i)
Trang 5- Đặt u i = Y i – E(Y/X i ) : là sai số ngẫu nhiên (nhiễu, yếu tố ngẫu nhiên: random errors)
- Tính chất của SSNN : + Nhận những giá trị dương và âm
+ Kì vọng bằng 0: E(u i) = 0 ∀ i
Bản chất của SSNN : đại diện cho tất cả những yếu tố không phải biến giải thích nhưng cũng tác
động tới biến phụ thuộc:
+ Những yếu tố không biết
+ Những yếu tố không có số liệu
+ Những yếu tố không ảnh hưởng nhiều đến biến phụ thuộc
+ Sai số của số liệu thống kê
+ Sai lệch do chọn dạng hàm số
+ Những yếu tố mà tác động của nó quá nhỏ không mang tính hệ thống
2.4 Mô hình hồi quy tổng thể – ( PRM: Population regression model )
Y i = β1 + β2 X i + u i i= 1;N
3 Mô hình hồi qui mẫu
- Không biết toàn bộ Tổng thể, nên dạng của PRF có thể biết nhưng giá trị βj thì không biết
- Mẫu : một bộ phận mang thông tin của tổng thể
- W = {(X i , Y i ), i = 1÷ n} được gọi là một mẫu kích thước n, có n quan sát (observation).
3.1 Hàm hồi qui mẫu (SRF : Sample Regression Function)
- Trong mẫu W, tồn tại một hàm số mô tả xu thế biến động của biến phụ thuộc theo biến giải thích
về mặt trung bình, Yˆ= f ˆ X( ) gọi là hàm hồi qui mẫu (SRF)
- Hàm hồi qui mẫu có dạng giống hàm hồi qui tổng thể
Nếu PRF có dạng E(Y/X i ) = β1 + β2X i
Thì SRF có dạng Yˆ i = βˆ1+ βˆ2X i
- Vì có vô số mẫu ngẫu nhiên, nên có vô số giá trị của βˆ1và βˆ2→ βˆjlà biến ngẫu nhiên
- Với một mẫu cụ thể w kích thước n, β ˆjsẽ là con số cụ thể
3.2 Phần dư
- Thông thường Y i ≠ Yˆ i , đặt e i = Y i – Yˆ i và gọi là phần dư (residual).
- Bản chất của phần dư e i giống sai số ngẫu nhiên u i
i
Yˆ, βˆ1,βˆ2, e i là ước lượng điểm tương ứng của E(Y/X i ), β1, β2, u i
3.3 Mô hình hồi quy mầu – ( SRM: Sample regression model )
Yˆi = β ˆ1 + β ˆ2 X i + e i
Chương 2 ƯỚC LƯỢNG VÀ KIỂM ĐỊNH MÔ HÌNH HỒI QUI ĐƠN
1 Mô hình
- Mô hình hồi qui đơn ( Simple regression ) là mô hình một phương trình gồm một biến phụ thuộc
(Y) và một biến giải thích (X).
- Mô hình có dạng: PRF E(Y/X i )= β1 + β2 X i
PRM Y i = β1 + β2 X i + u i
- Với mẫu W = {(X i , Y i ), i = 1÷ n}, tìm βˆ1,βˆ2 sao cho SRF: Yˆ i = βˆ1+ βˆ2X i phản ánh xu thế biến
động về mặt trung bình của mẫu
2 Phương pháp bình phương nhỏ nhất( Ordinary least squares -OLS)
Y
1
2 1
2 ) ˆ
Lấy đạo hàm riêng của Q theo βˆ1 và βˆ2 và cho bằng 0:
Trang 62.2.Phương pháp OLS có các tính chất sau:
SRF đi qua điểm trung bình mẫu ( X , Y )
Trung bình của các giá trị ước lượng bằng trung bình mẫu Yˆ =Y
=
n i i Y ei
1
ˆ = 0
3 Các giả thiết cơ bản của OLS
Một ước lượng sẽ dùng được khi nó là tốt nhất Để ước lượng OLS là tốt nhất thì tổng thể phải thỏa mãn một số giả thiết sau:
Giả thiết 1: Mô hình hồi quy có dạng tuyến tính đối với tham số.
Giả thiết 2: Biến giải thích là phi ngẫu nhiên
Giả thiết 3: Trung bình của các sai số ngẫu nhiên bằng 0 E(ui ) = 0 ∀ i
Giả thiết 4: Phương sai sai số ngẫu nhiên bằng nhau Var(ui ) = σ2 ∀ i
Giả thiết 5: Các sai số ngẫu nhiên không tuơng quan Cov(u i , u j ) = 0 ∀ i ≠ j
Giả thiết 6: SSNN và biến giải thích không tương quan Cov(ui , X i ) = 0 ∀ i
Giả thiết 7: Các giá trị của biến giải thích phải khác nhau càng nhiều càng tốt Var(X) > 0
Giả thiết 8: Kích thước mẫu phải lớn hơn số tham số cần ước lượng của mô hình.
Giả thiết 9: Mô hình được chỉ định đúng.
Giả thiết 10: Không có đa cộng tuyến giữa các biến giải thích của mô hình hồi quy bội.
Định lý: Nếu tổng thể thỏa mãn các giả thiết trên thì ước lượng OLS sẽ là ước lượng tuyến tính,
không chệch, tốt nhất (trong số các ước lượng không chệch) của các tham số.
4 Các tham số của ước lượng OLS
Các ước lượng β ˆj là biến ngẫu nhiên tùy thuộc mẫu, nên có các tham số đặc trưng
Kì vọng : E(βˆ1) = β1 E(βˆ2) = β2
Trang 7Phương sai : Var(βˆ1) = 2
1 2 1
2 σ
n
x n
X
Var(βˆ2) =
2 1 2
i với 2 là số tham số cần phải ước lượng của mô hình.
σ ˆ= σ ˆ 2 là độ lệch chuẩn của đường hồi qui : (Se of Regression)
n i i
x n X
1 2 1
2 ˆ
σ
Se(βˆ2) = ∑
=
n i i x
1 2
ˆ σ
Cov(β ˆ1, β ˆ2) = - X Var(β ˆ2)
Hiệp phương sai phản ánh mối quan hệ giữa β ˆ1 và β ˆ2
5 Sự phù hợp của hàm hồi qui- Hệ số xác định R 2
e
Y Y
y
Y Y
n
e y
y
1
2 1
2 1
2 ˆ
TSS = ESS + RSS
TSS (Total Sum of Squares) : đo tổng biến động của biến phụ thuộc
ESS (Explained Sum of Squares): tổng biển động của biến phụ thuộc được giải thích bởi MH – biến
giải thích
RSS (Residual Sum of Squares) : tổng biến động của biến phụ thuộc được giải thích bởi các yếu tố
nằm ngoài mô hình – Sai số ngẫu nhiên
Đặt R2 =
TSS
RSS TSS
ESS = 1 − gọi là hệ số xác định, 0 ≤ R2≤ 1
Ý nghĩa: Hệ số xác định R 2 là tỉ lệ (hoặc tỉ lệ %) sự biến động của biến phụ thuộc được giải thích bởi biến giải thích (theo mô hình, trong mẫu).
6 Hệ số tương quan R :
Là căn bậc hai của hệ số xác định và đo mức độ tương quan tuyến tính giữa Y và X
7 Phân phối xác suất của sai số ngẫu nhiên
Muốn tiến hành các suy diễn thống kê, thì phải biết phân phối xác suất của các ước lượng, phân phối đó tùy thuộc phân phối xác suất của SSNN
Giả thiết 11: Các SSNN ui có phân phối chuẩn
Cơ sở của giả thiết này là:
+ Do ui thường là sự tổng hợp của một số lớn các nhân tố ngấu nhiên độc lập và ảnh hưởng bế đều như nhau nên theo hệ quả của định lý giới hạn trung tâm thì có thể xem là ui phân phối chuẩn
+ Phân phối chuẩn chỉ có hai tham số là µ và σ2 nên dễ sử dụng
Trang 8+ Phân phối chuẩn có tính chất là nếu ui phân phối chuẩn thì mọi hàm tuyến tính của nó cũng phân phối chuẩn.
+ Phân phối chuẩn có tính chất là tính độc lập và không tương quan là đồng nhất
Kết hợp các giả thiết 3,4,5 và 11 ta có giả thiết chung là: ui∼n.i.d (0,σ2 ) Mô hình thoả mãn các giả
thiết trên gọi là mô hình hồi quy tuyến tính cổ điển ( CLRM ).
8 Các tính chất của các ước lượng OLS.
Các ước lượng của CLRM là các ước lượng không chệch.
Các ước lượng của CLRM là các ước lượng vững
Các ước lương của CLRM là các ước lượng hiệu quả nhất.
9 Suy diễn thống kê.
9.1 Ước lượng khoảng
Với độ tin cậy 1 - α cho trước, khoảng tin cậy của các hệ số hồi quy:
) 2 ( ˆ 2 2 /
) 2 ( ˆ 2 2 / 1
2( 2)
2 ( 2 ) ˆ
9.2 Kiểm định giả thuyết
Với mức ý nghĩa α cho trước, kiểm định mối quan hệ thứ tự của hệ số với các số thực cho trước
* 0
: H
: H
j j
j j
β β
β β
j = 1;2
Tiêu chuẩn kiểm định : Tqs =
) ˆ (
j
j j
Se β
β
β −
Nếu T qs> tα/2 (n – 2) thì bác bỏ H0, ngược lại : chưa có cơ sở bác bỏ H0
ii Cặp giả thuyết
* 0
: H
: H
j j
j j
β β
β β
* 0
: H
: H
j j
j j
β β
β β
H
0 :
H 1
ˆ
j
j
Se β β
Trang 910 Kiểm định về sự thích hợp của mô hình.
H
0 :
H
2 1
2 0
H
0 :
H 2 1
2 0 β β
Kiểm định F: F qs =
) 2 /(
1
1 / )
2 /(
1 /
RSS ESS
- Nếu F qs > Fα( 1; n - 2) thì bác bỏ H0 : biến giải thích giải thích được cho sự biến động của biến phụ thuộc, hàm hồi qui được gọi là phù hợp
- Ngược lại, Y không phụ thuộc vào biến giải thích, hàm hồi qui không phù hợp.
Vì hai cặp giả thiết tương đương, kiểm định F tương đương kiểm định T, F qs = (T qs)2
1 ˆ
i x
X X
− + σ
11.2 Dự báo giá trị cá biệt
0
ˆ
Y – Se( Yˆ0 - Y0)tα/2 (n – 2) < Y0 < Yˆ 0 + Se( Yˆ0 - Y0) tα/2 (n – 2)
Với Se( Yˆ 0 - Y 0) = 1 ( 0 2 )2
1 ˆ
i x
X X
− + + σ
Chương 3 MÔ HÌNH HỒI QUI BỘI (Multiple regression)
1 Mô hình hồi qui 3 biến.
2 ) ˆ
Trang 102 3
2 2
3 2 3 2
2 2
2 3
2 3
2 2
) (
2
i i i
i
i i i
i
x x x
x
x x X X x X x X
σ2
Var(β ˆ2) =
3 2
2 3
2 2
2 3
) ( i i
i i
i x x x
2 3
2 2
2 2
) ( i i
i i
i x x x
Cov(β ˆ 2 β ˆ 3) = 2
3
2 2
2 23
2 23 ) 1 ( r x i x i
ˆ
i
i i i
i y
y x y
i i
i i y x
y x
2 13
i i
i i y x y x
Trang 112 23
r =
3
2 2
2 3
2 ) (
i i
i i x x
x x
Hệ số tương quan riêng phần r ij , k : Đo mức độ tương quan tuyến tính giữa biến i và biến j của mô hình với điều kiện biến k không đổi
r 12,3 =
) 1 )(
1
23
2 13
23 13 12
r r
r r r
23
2 12
23 12 13
r r
r r r
1
13
2 12
13 12 23
r r
r r r
−
−
−
Ví dụ: Bảng sau đây cho Tỷ lệ lạm phát Y(%), Tỷ lệ thất nghiệp X2(%) và Tỷ lệ lạm phát kỳ vọng
X3(%) của Mỹ giai đoạn 1970- 1982:
Hồi quy Y với X 2 và cho nhận xét
Hồi quy Y với X 2 và X 3 và so sánh với kết quả thu được ở phần a
2 Mô hình hồi quy tổng quát k biến - Dạng ma trận của mô hình
Trang 12kn n
k k
n
n
u u
u u
X X
X X
X X
X X
Y Y
Y Y
1
2 1 2
1
2
1 1
2
2 22
1 21
1
2 1
Y Y
ˆ ˆ
ˆ ˆ
1
2 1
ˆ
ˆ
ˆ 2
Nếu tồn tại (X’X)-1 thì βˆ = (X’X)-1X’Y
Khi đó βˆ = (X’X)-1X’Y là ước lượng tuyến tính không chệch tốt nhất của β
2.4 Các tham số của ước lượng
) ˆ , ˆ ( )
ˆ , ˆ (
) ˆ ( )
ˆ , ˆ (
) ˆ , ˆ (
) ˆ , ˆ ( )
ˆ (
2 1
2 2
1 2
1 2
1 1
k k
k
k k
Var Cov
Cov
Cov Var
Cov
Cov Cov
Var
β β
β β
β
β β β
β β
β β β
β β
2.5 Sự phù hợp của hàm hồi qui
Trang 13
Cho biết tỉ lệ sự biến động của biến phụ thuộc được giải thích bởi tất cả các biến giải thích có trong mô hình.
R2 có các tính chất sau:
+ 0 ≤ R 2≤ 1
Tính chất này dùng để đánh giá mức độ thích hợp của hàm hồi quy
+ Giá trị của R 2 đồng biến với số biến giải thích của mô hình Tuy nhiên không thể lấy điều đó để xem xét việc đưa thêm biến giải thích vào mô hình
2.6 Hệ số xác định bội hiệu chỉnh.
R 2 = 1 – (1 – R 2)
k n
Hệ số tương quan bội R.
Hệ số tương quan cặp r ij (i,j = 1 ,k)
Hệ số tương quan riêng phần r 12,34 k r k-1k,12 k-2
Các hệ số tương quan cặp được gọi là hệ số tương quan riêng phần bậc 0
3 Suy diễn thống kê.
3.1 Ước lượng khoảng
i Khoảng tin cậy cho từng hệ số
j
β ˆ – Se(β ˆj )tα 2(n – k) < βj < β ˆj + Se(β ˆj )tα1 (n – k) (j = 1 ,k )
→ Khoảng tin cậy đối xứng, bên phải, bên trái
ii Khoảng tin cậy cho hai hệ số
(β ˆi± β ˆj ) – Se(β ˆi ± β ˆj )tα2(n – k) < βi ±βj <(β ˆi± β ˆj ) + Se(β ˆi± β ˆj )tα1 (n – k)
Với Se(β ˆi± β ˆj) = Var( β ±ˆi βˆj)= Var( βˆi) ± 2Cov( βˆi, βˆj) +Var( βˆj)
iii Khoảng tin cậy cho sai số ngẫu nhiên
2 ( ) ˆ
k n k n
Khoảng tin cậy hai phía, bên phải, bên trái
3.2 Kiểm định giả thuyết
Cặp giả thuyết Tiêu chuẩn kiểm
* 0
: H
: H
j j
j j
β β
β
2 /
k n
tα−
Trang 14* 0
: H
: H
j j
j j
β β
β β
T qs =
) ˆ (
j
j j
* 0
: H
: H
j j
j j
β β
j i
β β
β β : H
: H 1
0
T qs =
) ˆ ˆ (
ˆ ˆ
j i
j i Se
a
β β
β β
±
−
2 /
k n
0 : H 2 1
2 0
H
0
: H
1
2 0
j j
k
β
β β
Tất cả các biến giải thích không giải thích cho Y
Ít nhất một biến giải thích có giải thích cho Y
F qs =
) /(
1
) 1 /(
) /(
) 1 /(
2
2
k n R
k R k
n RSS
k ESS
: 0 :
H
0
: H 1
2 1
0
k m k j j
k m
k m k
β
β β
β Tất cả m biến giải thích không giải thích cho Y
Ít nhất một biến giải thích có giải thích cho Y
E(Y/X2, ,X k - m , ,X k ) = β1 + β2X2 + … + βk X k (UR)
E(Y/X2,…, X k - m ) = β1 + β2X2 + … + βk X k - m (R)
F qs = (RSSr RSSur−RSSur/(n−k))/m =
) /(
) 1 (
/ ) (
2
2 2
k n R
m R R ur
ñ ur
−
−
−
F qs > Fα(m, n – k) bác bỏ H0
- Trường hợp m = 1: F qs = (T qs)2 với T qs ứng với hệ số duy nhất cần kiểm định
- Trường hợp m = k – 1 : F qs trong kiểm định thu hẹp chính là F qs trong kiểm định sự phù hợp
Kiểm định thu hẹp hồi qui còn dùng cho những trường hợp khác
5.2 Các dạng thu hẹp hồi qui
Trang 15- C là chi tiêu cho tiêu dùng : β1 > 0; 1 > β2 > 0
- C là chi tiêu cho hàng hóa thông thường
- C là chi tiêu cho hàng hóa cao cấp
- C là chi tiêu cho hàng hóa thứ cấp
7.2 Hàm cầu
Q i : cầu về hàng hóa
P i : giá cả hàng hóa
PT i : giá hàng hóa thay thế
PB i : giá hàng hóa bổ sung
Trang 16β2 = εE(Y)/X2 : Khi X 2 thay đổi 1%, yếu tố khác không đổi, thì E(Y) thay đổi β2 %
Chương 4 MÔ HÌNH VỚI BIẾN GIẢ
1 Biến định tính – Biến giả
Miêu tả biến định tính bằng biến giả
1.2 Mô hình có một biến giải thích là định tính
a Biến định tính có hai phạm trù
Lúc đó dùng một biến giả để thay thế cho nó.
VD: Thu nhập có phụ thuộc giới tính ?
Nếu quan sát là Nam
Nếu quan sát là Nữ
Mô hình : Y i = β1 + β2D i + u i
Thu nhập trung bình của nam E(Y/D i = 1) = β1 + β2
Thu nhập trung bình của nữ E(Y/D i = 0) = β1
Nếu β2 ≠ 0 thì TN trung bình có phụ thuộc giới tính
Biến D đặt như trên là biến giả.
→ Qui tắc đặt biến giả
- Biến giả chỉ nhận giá trị 0 và 1
- Cá thể nào cũng phải có giá trị của biến giả
- Biến giả phân chia tổng thể thành những phần riêng biệt
Biến định tính có k phạm trù.
Lúc đó dùng k-1 biến giả để thay thế cho chúng
Ví dụ: Chi phí cho văn hoá phẩm có phụ thuộc vào trình độ học vấn?
Trang 17Y i : Chi phí cho văn hoá phẩm.
1.3 Mô hình có hai biến định tính
VD : Thu nhập trung bình có khác nhau giữa lao động thành thị và nông thôn, nam và nữ?
Nếu lao động thuộc khu vực thành thịNếu lao động thuộc khu vực nông thôn
E(Y/D 2i , D 3i) = β1 + β2D 2i + β3D 3i + u i
Các chú ý:
Nếu mô hình có k biến giải thích là định tính với số phạm trù tương ứng là n1, n2, nk thì phải dùng tổng cộng n1 + n2 + + nk – k biến giả
Biến nhận mọi giá trị bằng 0 gọi là phạm trù cơ sở dùnh để so sánh với các phạm trù khác
Các hệ số góc riêng phần được gọi là các hệ số chênh lệch
Việc đưa thêm các biến giải thích là định lượng vào mô hình được làm như thông lệ
Sự tương tác giữa các biến giả
Khi sử dụng cùng một lúc nhiều biến giả có thể xảy ra sự tương tác giữa chúng Để tính đến điều
đó ta thêm vào mô hình biến tương tác
Ví dụ: Chi tiêu cho quần áo có phụ thuộc vào giới tính và tính chất công việc?
Mô hình: Y i = β1 + β2 D 2i + β3 D 3i + β4 D 2i *D 3i + β5 X i + u i
Kiểm định H0: β4 = 0 (không có tương tác)
H1: β4≠ 0 (có tương tác)
Lúc đó mức độ tương tác bằng β4
3 Đánh giá sự tác động dối với biến định lượng
Xét mô hình tuyến tính Y phụ thuộc vào X có hệ số chặn có dạng:
1 A sát quan 0
A sát quan 1
Trang 184 Kiểm định sự thay đổi cấu trúc của mô hình.
≠ +
=
=
0 :
H
0 :
H
2 4
2 3 1
4 3 0
β β
: H 1
0 [α1 = γ1 = β1] và [α2 = γ2
= β2 ] [α1 ≠ γ1] hoặc [α2 ≠
γ2]
Hàm hồi qui đồng nhất Hàm hồi qui không đồng nhất
Lấy mẫu W1 kích thước n1 trong A1, hồi qui MH thu được RSS1
Lấy mẫu W2 kích thước n2 trong A2, hồi qui MH thu được RSS2
Với mẫu W = W1 ∪ W2 kích thước n1 + n2, hồi qui thu được RSS
Đặt RSS = RSS1 + RSS2.
F qs =
k
k n n RSS
RSS RSS− × 1 + 2 − 2
Nếu Fqs > Fα(k ; n1 + n2 – 2k) : bác bỏ H0
4.2 Dùng biến giả để kiểm định sự thay đổi cấu trúc.
Với mẫu W = W1 ∪ W2 kích thước n1 + n2 hồi quy mô hình:
Y i = β1 + β2 D i + β3 X i + β4 D i X i + u i
Và kiểm định thu hẹp hàm hồi quy giả thuyết H 0 : β2 = β4 = 0.
Ví dụ: Cho số liệu trong bảng dưới đây về tiết kiệm S và thu nhập Y (đầu người) ở Vương quốc Anh trong giai đoạn 1946 - 1963 (triệu pao) Người ta cho rằng, thời kỳ khôi phục kinh tế sau thế chiến thứ hai
1946 - 1954 và thời kỳ sau đó, hành vi tiết kiệm từ thu nhập khác nhau Hãy kiểm tra ý kiến này với mức ý nghĩa 5% bằng kiểm định Chow và bằng thủ tục biến giả
N ăm
Tiế
t kiệm
Thu nhập
N ăm
959
Trang 191 951
Trang 20Vẽ đồ thị của lợi nhuận và doanh số theo thời gian và cho nhận xét.
Từ đó hãy tìm cách hoàn thiện mô hình
6 Hồi qui tuyến tính từng khúc
Hàm hồi qui tuyến tính gấp khúc tại điểm X = X t0
0 :
X X
E(Y/X t , D t) = β1 + β2X t + β3( X t – X t0 )D t
Chương 5 ĐA CỘNG TUYẾN
1 Bản chất của đa cộng tuyến ( Multicolinearity)
1.1 Hiện tượng :
Xét MH: Y i = β1 + β2 X 2i + β3X 3i + … + βk X ki + u i
Gt 10: Các biến giải thích không có quan hệ cộng tuyến.
Nếu giả thiết bị vi phạm → hiện tượng đa cộng tuyến
Có hai dạng đa cộng tuyến:
i Đa cộng tuyến hoàn hảo( Perfect Multicolinearity) :
∃λj ≠ 0 (j ≠ 1) sao cho:
λ2 X 2i + … + λk X ki = 0 ∀ i
→ Ma trận X là suy biến, không có lời giải duy nhất
ii Đa cộng tuyến không hoàn hảo ( Imperfect Multicolinearity) :
∃λj ≠ 0 (j ≠ 1) sao cho:
λ2 X 2i + … + λk X ki + v i = 0
với v i là SSNN có phương sai dương → vẫn có lời giải
1.2 Nguyên nhân
Đa cộng tuyến hoàn hảo gần như không bao giờ xảy ra
Đa cộng tuyến không hoàn hảo thường xuyên xảy ra, do các nguyên nhân:
- Bản chất các biến giải thích có quan hệ tương quan với nhau
- Do số liệu mẫu không ngẫu nhiên
- Do kích thước mẫu không đủ
Do quá trình làm trơn số liệu
2.2 Đa cộng tuyến không hoàn hảo:
Các ước lượng có phương sai lớn, là ước lượng không hiệu quả.
Khoảng tin cậy rộng không còn ý nghĩa
Các kiểm định T có thể sai
Các kiểm định T và kiểm định F có thể cho kết luận mâu thuẫn nhau
Các ước lượng có thể sai về dấu
Mô hình trở nên nhậy cảm với mỗi sự thay đổi của số biến giải thích và của tệp số liệu
3 Phát hiện đa cộng tuyến.
3.1 Sự mâu thuẫn giữa kiểm định T và F
Trang 21Có mâu thuẫn: Kiểm định F có ý nghĩa, tất cả các kiểm định T về các hệ số góc không có ý nghĩa.
có đa cộng tuyến
Điều ngược lại chưa chắc đúng
3.2 Kiểm định Klein.
Bước 1 Hồi quy mô hình đã cho để tìm hệ số xác định R 2
Bước 2 Tìm các hệ số tương quan cặp rij
Nếu R 2< 2
ij
r ∀i,j thì đó có thể là dấu hiệu của đa cộng tuyến
3.3 Kiểm định Farrar – Glauber.
Bước 1 Tìm D = det( r) trong đó r là ma trận hệ số tương quan cặp
Bước 2 Tính giá trị của tiêu chuẩn kiểm định sau:
0 : H 2
* 1
2
* 0
R
; Fqs > Fα(k * – 1, n – k *) thì bác bỏ H0
3.5 Độ đo Theil
Dùng để so sánh mức độ đa cộng tuyến không hoàn hảo giữa các mô hình
Bước 1: Hồi quy mụ hỡnh ban đầu tỡm được R 2
Bước 2: Bỏ biến X j ra khỏi mô hình, hồi qui thu được R2
Lúc đó việc lựa chọn biến bị loại khỏi mô hình có thể căn cứ vào kết quả của hồi quy phụ
4.3.Tăng kích thước mẫu hoặc lấy mẫu mới nếu có thể.
Trang 22Đổi dạng của mô hình.
Ví dụ thay vì hồi quy mô hình Y i = β1 + β2 X 2i + β3 X 3i + u i
Người ta hồi quy mô hình lnY i = β1 + β2 lnX 2i + β3 lnX 3i + u i
4.6 Giảm cộng tuyến trong hồi quy đa thức.
Có thể giảm cộng tuyến trong hồi quy đa thức bằng cách lấy sai phân của các biến trong mô hình so với giá trị trung bình của chúng
Chương 6 PHƯƠNG SAI CỦA SAI SỐ THAY ĐỔI
1 Bản chất của hiện tượng phương sai của sai số thay đổi
MH ban đầu: Y i = β1 + β2 X i + u i
1.1 Hiện tượng
Gt 4: Phương sai các sai số ngẫu nhiên là đồng nhất Var(ui) ≡σ2 không đổi
Nếu gt được thỏa mãn → PSSS đồng đều (homoscedasticity).
Gt không thỏa mãn : Var(u i) = σi 2 không đồng nhất → PSSS thay đổi (heteroscedasticity).
1.2 Nguyên nhân
- Bản chất hiện tượng Kinh tế xã hội
- Số liệu không đúng bản chất hiện tượng
Quá trình xử lý số liệu
2 Hậu quả
- Các ước lượng là không chệch, nhưng không hiệu quả → không phải là tốt nhất
- Các kiểm định T, F có thể sai, khoảng tin cậy rộng
→ MH hồi qui phụ lne i 2 = α1 + α2lnX i + v i (*)
Bước 1 Hồi quy mô hình ban đầu tìm được e i
Bước 2 Hồi quy mô hình (*)
Bước 3 Kiểm định cặp giả thuyết H0: α2 = 0; H1: α2≠ 0
Trang 233.3 Kiểm định Glejer
Tùy vào giả thiết mà thực hiện hồi qui phụ để kiểm định
Gt : σi 2 = σ2 X i , do đó hồi qui mô hình hồi qui phụ
0 : 0 : H
2
* 2
1
2
* 2
0
R
R
α
Mô hình đầu có PSSS thay đổi
Dùng kiểm định T hoặc F để kiểm định
H
0 :
B1: Hồi qui mô hình gốc thu được phần dư e i và giá trị ước lượng Yˆ i
B2 : Hồi qui mô hình hồi qui phụ e i 2 = α1 + α2
2 ˆ
i
Y + v i (*)Kiểm định:
0 : H 0 : H
0 : H
2
* 1
2
* 0 2
1
2 0
R
R
α α
Dựa trên giả thiết về sự thay đổi của PSSS thay đổi mà khắc phục
3.1 Nếu biếtσi2 – Dùng WLS- Phương pháp bình phương nhỏ nhất có trọng số.
Chia hai vế mô hình cho σi
i
i i
i i
i
Y
σ σ
β σ
β
σ = 1 + 2 +
1
⇔ Y i ’ = β1 X 0i + β2 X i ’ + u i ’ Var(u i ’) = 1 không đổi
3.2 Nếu chưa biết σ i2 – Dùng GLS – Phương pháp bình phương nhỏ nhất tổng quát.
Tuỳ thuộc vào tính chất của σi2 mà biến đổi mô hình gốc sao cho phương sai của sai số ngẫu nhiên trở nên đồng đều
Gt 1 : σi 2 = σ2 X i
Lúc đó chia hai vế cho X i
Trang 24i i i
i
i
X
u X X
Lúc đó chia hai vế cho Yˆ i
Chú ý: Có thể thay đổi dạng hàm để khắc phục phương sai của sai số thay đổi.
lnY i = β1 + β2 lnX i + u i
lnY i = β1 + β2 X i + u i
Y i = β1 + β2 lnX i + u i
Trang 25Chương 7 TỰ TƯƠNG QUAN
1 Hiện tượng tự tương quan ( Autocorrelation or Serial correlation)
1.1 Hiện tượng
MH ban đầu: Y t = β1 + β2 X t + u t
Gt 5: Các sai số ngẫu nhiên không tương quan
Cov(u i , u j ) = 0 (i ≠ j) hoặc Cov(u t , u t - p ) = 0 (p ≠ 0)
Nếu gt bị vi phạm : hiện tượng tự tương quan bậc p
Xét trường hợp p = 1
u t và u t-1 có cùng trung bình và phương sai
→ u t = ρ u t - 1 + εt ( - 1 ≤ρ ≤ 1, εt thỏa mãn các giả thiết của OLS)
• ρ = - 1 tự tương quan âm hoàn hảo
• - 1 < ρ < 0 tự tương quan âm
• ρ = 0 không có tự tương quan
• 0 < ρ < 1 tự tương quan dương
• ρ = 1 tự tương quan dương hoàn hảo
⇒ Lược đồ AR(1)
Tổng quát : tự tương quan bậc p : u t = ρ1 u t - 1 + ρ2 u t - 2 + … + ρp u t - p +εt với ρp ≠ 0
⇒ Lược đồ AR(p) : Autoregresseve Procedure order p.
1.2 Nguyên nhân
- Bản chất, tính quán tính trong hiện tượng kinh tế xã hội
- Hiện tượng mạng nhện trong kinh tế
- Quá trình xử lý, nội suy số liệu
Mô hình thiếu biến hoặc dạng hàm sai
2 Hậu quả
Các ước lượng là không chệch nhưng không còn là ước lượng tốt nhất
3 Phát hiện
3.1 Quan sát đồ thị của et theo e t-1
Bứơc 1 Hồi quy mô hình gốc để tìm e t và e t-1
Bước 2 Vẽ đồ thị của e t theo e t-1 và nhận xét
3.2 Kiểm định Durbin – Watson
Kiểm định Durbin – Watson dựa trên thống kê
n
t
t t e
e e
1 2 2
2
1 ) (
n
e
e e
1 2
1 1ˆ
ρ là ước lượng cho ρ
Chú ý:Kiểm định DW sẽ chỉ áp dụng được nếu thoả mãn các điều kiện sau:
+ Mô hình phải có hệ số chặn
+ Biến giải thích phải là phi ngẫu nhiên
+ Nếu có hiện tượng tự tương quan thì đó chỉ là lược đồ AR(1)
+ Mô hình không chứa biếntrễ của biển phụ thuộc làm biến giải thích
+ Không có quan sát nào bị mất trong tệp số liệu
Do không tìm được chính xác phân phối xác suất của d nên dựa vào tính chất của nó để kết
luận
Trang 26Do - 1 ≤ ρ ˆ ≤ 1 → 0 ≤ d ≤ 4
Với n, k’ = k – 1 vµ α = 0,05 cho trước, tra bảng → d L và d U
Tự tương quan dương
ρ > 0
Khô
ng có kết luận
Tự tương quan âm
ρ < 0
0 d L d U 2 4 – d U 4 – d L
4
Hạn chế:
+ Vẫn còn hai miền không có kết luận ⇒ Dùng kiểm định DW cải biên
+ Không áp dụng được với các mô hình tự hồi quy
⇒ Trường hợp mô hình tự hồi quy có trễ bậc 1 của biến phụ thuộc làm biến giải thích thì dùng Kiểm định h -Durbin :
Y t = β1 + β2X t + β0Y t -1 + u t
h =
) ˆ ( 1
ˆ
0 β
ρ < 0
Không
có tự tương quan
ρ = 0
Tự tương quan dương
ρ > 0
- 1.96 1.96 3.3 Hồi qui phụ
H
0 :
:
H
0
p
α
α α
Không có tự tương quan đến bậc p
Có tự tương quan ở bậc tương ứng
H
0
p
α
α α
R R
Nếu F qs > Fα(k* − 1 ;n* −k*) thì bác bỏ H0
4 Khắc phục
Trang 27Mục đích là chuyển MH ban đầu có khuyết tật tự tương quan thành MH mới có cùng hệ số cũ nhưng không có tự tương quan
Mô hình ban đầu: Y t = β1 + β2 X t + u t
Có tự tương quan : u t = ρ u t -1 +εt với ρ ≠ 0 , εt thỏa mãn các giả thiết OLS
4.1 Khi ρ đã biết – Dùng phương pháp sai phân tổng quát
β → β ˆ 1 =
ρ
β
− 1
ˆ *
1 và βˆ2
i Trường hợp tự tương quan dương hoàn hảo ρ = 1
PT sai phân tổng quát ⇔∆Y t = β2∆X t + εt (phương trình sai phân cấp 1)
ii Trường hợp tự tương quan âm hoàn hảo ρ = – 1
X X Y
Y
ε β
=
2 2
1 2
1
4.2 Khi ρ chưa biết
Ước lượng ρ bằng các phương pháp khác nhau
iii Phương pháp Cochran-Orcutt
Hồi qui mô hình ban đầu: Y t = β1 + β2 X t + u t → ( 1 )
1 ˆ
β , ( 1 ) 2 ˆ
β , ( 1 )
t e
Hồi qui mô hình e t(1) = α + ρe t(1−)1 + v t → ρ ˆ ( 1 )
Lấy ρ ˆ ( 1 ) thay vào phương trình sai phân tổng quát → ( 2 )
1 ˆ
β , ( 2 ) 2 ˆ
β , ( 2 )
t e
Hồi qui mô hình ( 2 )
β , ( 3 )
2 ˆ
β , ( 3 )
t e
…
Quá trình lặp cho đến khi ρ ˆ ở hai bước kế tiếp chênh lệch nhau không đáng kể, βˆ1 và βˆ2 ở bước cuối cùng là ước lượng cho β1 và β2
iiii Phương pháp Durbin – Watson hai bước.
Trước hết viết lại mô hình sai phân tổng quat dưới dạng:
Y t = β1 (1- ρ) + β2 X t - β2ρX t-1 + ρY t-1 + ( u t - ρu t-1 )
Bước 1 Ước lượng mô hình trên thu được ρ ˆ
Bước 2 Thiết lập mô hình sai phân tổng quát và ước lượng nó để tìm βˆ1 và βˆ2
Chương 8 CHỈ ĐỊNH MÔ HÌNH
1 Thuộc tính của mô hình tốt
- Đầy đủ : không thiếu và không thừa biến giải thích
- Đồng nhất : số liệu thống nhất → tham số thống nhất
- Phù hợp lí thuyết : các hệ số phù hợp lý thuyết
Trang 28- Hàm hồi qui phù hợp : R2 lớn
- Khả năng phân tích và dự báo
2 Các loại sai lầm chỉ định và hậu quả.
2.1 Mô hình thừa biến giải thích
Mô hình sai: LnY i = β1 + β2 LnX i + v i
Có thể kiểm định thiếu biến và dạng hàm sai bằng các kiểm định sau:
Kiểm định Ramsey
Mô hình ban đầu: Y i = β1 + β2 X i + u i (1)
Nếu cho rằng mô hình thiếu biến Z i nào đó thì:
B1: Hồi qui mô hình ban đầu thu được các giá trị ước lượng Yˆ i
B2: Hồi qui MH hồi qui phụ :
Y i = [β1 + β2X i ] +α1
2 ˆ
m
, 1 , 0 :
H
0
: H 1
1 0 α
) 2 (
2 ) 1 (
2 ) 2 (
R R
Nếu F qs > Fα(k(2) – 1; n – k(2)) bác bỏ H0
2 Kiểm định nhân tử Lagrange (LM)
B1: Hồi qui mô hình ban đầu thu được các phần dư e i và giá trị ước lượng Yˆ i
B2: Hồi qui MH hồi qui phụ :
e i = [β1 + β2X i ]+α1
2 ˆ
m
, 1 , 0 :
H
0
: H 1
1 0 α
α
α MH (1) có dạng hàm
đúng
MH (1) có dạng hàm saiKiểm định χ2 : *2
2 nR
qs =
χ , nếu χ >qs2 χα2 (p) thì bác bỏ H0.
Trang 293 Phân phối xác suất của sai số ngẫu nhiên
Các suy diễn thống kê (khoảng tin cậy, kiểm định giả thiết) phụ thuộc giả thiết SSNN phân phối chuẩn Nếu SSNN không phân phối chuẩn thì các ước lượng vẫn là ước lượng tốt nhất, nhưng các phân tích không dùng được
H0 : SSNN phân phối chuẩn
H1 : SSNN không phân phối chuẩn
Kiểm định Jarque – Bera:
Với S là hệ số bất đối xứng (skewness), K là hệ số nhọn (kutosis) của e i
2 2
2 S K n
1 Phân tích hồi quy (Regression analysis)
1.1 Bản chất của phân tích hồi quy
- Có nhiều phương pháp để lượng hoá các mối quan hệ kinh tế trong đó phân tích hồi quy là phương pháp quan trọng và phổ biến nhất hiện nay
- Phân tích hồi quy là phân tích mối liên hệ phụ thuộc của một hay một số biến gọi là biến phụ
thuộc (biến được giải thích, biến nội sinh) với một hoặc nhiều biến khác gọi là biến độc lập (biến giải
thích, biến ngoại sinh hoặc biến hồi quy)
+ Biến phụ thuộc là biến được xác định bởi mô hình và giá trị của nó phụ thuộc vào giá trị của các biến độc lập trong mô hình
+ Biến độc lập là biến mà giá trị của chúng được xác định ngoài mô hình
+ Tham số là nhân tố phản ánh xu hướng, mức độ ảnh hưởng của biến độc lập đến biến phụ thuộc
- Chú ý: Một biến số trong các mô hình khác nhau có thể đóng vai trò khác nhau, thậm chí trong
cùng một mô hình nó cũng có thể có vai trò khác nhau do mục đích sử dụng mô hình khác nhau
+ Một kỹ sư nông nghiệp muốn nghiên cứu mối liên hệ phụ thuộc của năng suất lúa (biến phụ thuộc) vào lượng phân bón và lượng mưa (các biến độc lập)
- Trong thực tế với mỗi giá trị xác định của biến độc lập, biến phụ thuộc không chỉ nhận một giá trị tương ứng duy nhất vì chịu tác động của nhiều nhân tố ngoài các biến độc lập do đó trong phân tích hồi quy ta phải đại diện cho biến phụ thuộc bằng giá trị trung bình của nó Như vậy phân tích hồi quy nghiên cứu mối liên hệ phụ thuộc hàm số giữa giá trị trung bình của biến phụ thuộc vào giá trị của biến độc lập
- Ký hiệu:
Y là biến phụ thuộc (Dependent variable)
X1, X2, ,Xk là các biến độc lập (Independent variables)
- Các biến độc lập là các biến phi ngẫu nhiên, giá trị của chúng được cho trước Trong điều kiện đó biến phụ thuộc là một biến ngẫu nhiên có quy luật phân bố xác suất nào đó
Trang 30+ Hàm E Y X( / )= f X( ) gọi là hàm hồi quy đơn - Simple regression (hàm hồi quy có một biến độc lập)
+ Hàm E Y X X( / 1, 2, ,X k)= f X X( ,1 2, ,X k) gọi là hàm hồi quy bội- Multiple regression (hàm hồi quy có hơn một biến độc lập)
- Mục đích của phân tích hồi quy:
+ Ước lượng giá trị trung bình của biến phụ thuộc khi biết giá trị của biến độc lập, tức là phải ước lượng các tham số của mô hình
+ Kiểm định các giả thuyết về bản chất của mối quan hệ giữa biến phụ thuộc và biến độc lập mà lý thuyết kinh tế đưa ra Trong trường hợp này phải trả lời hai câu hỏi:
+> Có tồn tại quan hệ giữa biến phụ thuộc và biến độc lập hay không?
+> Nếu tồn tại quan hệ thì mức độ chặt chẽ như thế nào?
+ Dự báo giá trị trung bình của biến phụ thuộc khi biết giá trị của biến độc lập
1.2 Phân tích hồi quy và các quan hệ khác
- Phân tích hồi quy và quan hệ hàm số: Trong quan hệ hàm số thì các biến không phải là các biến
ngẫu nhiên vì ứng với mỗi giá trị xác định của biến độc lập có một giá trị duy nhất của biến phụ thuộc, trong phân tích hồi quy các biến phụ thuộc là các biến ngẫu nhiên
- Phân tích hồi quy và phân tích tương quan: Phân tích tương quan đo mức độ kết hợp tuyến tính
giữa hai biến bằng hệ số tương quan và không phân biệt giữa các biến, chúng có tính chất đối xứng, trong khi đó phân tích hồi quy ước lượng và dự báo một biến trên cơ sở giá trị đã cho của các biến khác, các biến không có tính chất đối xứng
- Phân tích hồi quy và quan hệ nhân quả: Quan hệ nhân quả là quan hệ hai chiều giữa hai đối tượng
trong đó vai trò của các đối tượng được xác định rõ đâu là nguyên nhân và đâu là kết quả, trong phân tích hồi quy biến giải thích không nhất thiết là nguyên nhân gây lên biến phụ thuộc, mối quan hệ giữa các biến được xác lập tuỳ thuộc vào mục đích nghiên cứu
1.3 Bản chất nguồn số liệu cho phân tích hồi quy
+ Số liệu kết hợp (Pooled data) là số liệu tổng hợp của hai loại trên
- Nguồn gốc của số liệu
+ Số liệu từ các nguồn được phát hành như: Niên giám thống kê, tạp chí,
+ Số liệu từ các cuộc điều tra thực tế hoặc đi mua
- Bản chất chung của số liệu kinh tế – xã hội
+ Có sẵn để thu thập, tính toán phù hợp với mục đích nghiên cứu
+ Phần lớn là các số liệu phi thực nghiệm mang tính ngẫu nhiên, kém tin cậy
- Để nghiên cứu BNN (X, Y) ta lập các bảng phân phối xác suất:
+ Bảng phân phối xác suất đồng thời của X và Y:
X
Trang 31
- Giả sử PRF có dạng tuyến tính:
( / i) i;( 1 )
E Y X = +β β X i= ÷k hoặc E Y X( / )=β β1+ 2X
Trong đó β β1, 2 gọi là các hệ số hồi quy (Regression Coefficient):
+ Hệ số β1 = E Y X( / i =0) gọi là hệ số chặn (Intercept - INPT) Nó cho biết giá trị trung bình của
Y khi biến Xi = 0
+ Hệ số 2 E Y X( / )
X
β = ∂
∂ gọi là hệ số góc (Slope): Nó cho biết khi X tăng lên 1 đơn vị thì giá trị
trung bình của Y thay đổi như thế nào
- Tại mỗi giá trị cá biệt Yi của Y ta có: Y i = +β β1 2X i +U i i;( = ÷1 N) gọi là mô hình hồi quy tổng thể (Population Regression Model – PRM)
- Đặt: U i = −Y i E Y X( / i);(i = ÷1 N) gọi là sai số ngẫu nhiên (Random error) Nó phản ánh chênh lệch giữa giá trị cá biệt của Y với giá trị trung bình của nó
- Sai số ngẫu nhiên đại diện cho tất cả những yếu tố không phải biến độc lập có trong mô hình nhưng cũng tác động đến phụ thuộc, đó là:
+ Những yếu tố không biết
+ Những yếu tố không có số liệu
+ Những yếu tố mà tác động của nó quá nhỏ không mang tính hệ thống
- Sự tồn tại của sai số ngẫu nhiên là tất yếu khách quan và nó có vai trò đặc biệt quan trọng trong phân tích hồi quy, nó phải thoả mãn những điều kiện nhất định thì thì việc phân tích trên mô hình hồi quy mới có ý nghĩa
3 Hàm hồi quy mẫu
- Trong thực tế chúng ta không có được tổng thể hoặc có nhưng không thể (không cần thiết) nghiên cứu toàn bộ tổng thể vì vậy không thể tìm được PRF mặc dù dạng của PRF có thể biết
- Mẫu ngẫu nhiên là một bộ phận mang thông tin của tổng thể được lấy ra từ tổng thể theo những nguyên tắc nhất định
- Giả sử từ tổng thể lập mẫu ngẫu nhiên kích thước n: W = {(Xi, Yi): i = ÷1 n}
- Trong mẫu W = {(Xi, Yi): i = ÷1 n)} tồn tại một hàm số có dạng giống như PRF mô tả xu thế biến động của trung bình biến phụ thuộc theo biến độc lập, thực chất nó là một ước lượng điểm của PRF, ký hiệu: ˆ ˆ1 ˆ2 ;( 1 )
Y = +β β X i= ÷n và gọi là hàm hồi quy mẫu (Sample Regression Function - SRF)
Trang 32- Trong đó:β βˆ ˆ1, 2 gọi là các hệ số hồi quy ước lượng được (Estimated regression coeffcient), thực chất chúng là các ước lượng điểm của β β1, 2 và ˆ
i
Y là các giá trị ước lượng được (Fitted value), thực chất
nó là các ước lượng điểm của E(Y/Xi)
- Tại một giá trị cá biệt của Y ta có: ˆ1 ˆ2 ;( 1 )
i
Y
- Bản chất của các phần dư ei giống như các sai số ngẫu nhiên Ui
- Tương ứng với mỗi mẫu rút ra từ tổng thể ta sẽ tìm được một hàm hồi quy mẫu (SRF), tức là có rất nhiều SRF khác nhau mà chúng đều là các ước lượng điểm của PRF Vậy SRF nào là ước lượng tốt nhất cho PRF?
(Tham khảo các thí dụ 1.1 (T 9), thí dụ 1.3 ( T16), Giáo trình)
Chương II
Mô hình hồi quy hai biến, Ước lượng và kiểm định giả thuyết
1 Phương pháp bình phương nhỏ nhất (Ordinary Least Squares - OLS)
1.1 Nội dung của phương pháp OLS
- Xét mô hình hồi quy đơn dạng tuyến tính:
Trang 33- Nội dung của phương pháp OLS là tìm các ước lượng điểm β βˆ ˆ1, 2 của β 1 vàβ 2 sao cho tổng
- Ta cần xác định β βˆ ˆ1, 2 sao cho: f ( ,β βˆ ˆ1 2)→Min
- Các hệ số β βˆ ˆ1, 2 là nghiệm của hệ phương trình sau:
- Các hệ số β βˆ ˆ1, 2 tìm được bằng phương pháp trên gọi là các ước lượng bình phương nhỏ nhất
1.2 Tính chất của các ước lượng
- Tính chất 1: SRF đi qua điểm trung bình mẫu ( , )X Y : Y = +β βˆ1 ˆ2X (?)
- Tính chất 2: Trung bình số học của các giá trị ước lượng bằng trung bình mẫu của các giá trị quan sát
Trang 34Cov e Y Y e
=
= ∑ = (?)
1.3 Các giả thiết cơ bản của phương pháp OLS
Giả thiết 1: Mô hình hồi quy có dạng tuyến tính đối với tham số
- Mô hình tuyến tính theo cả tham số và biến số:
Q =β K L eβ β (Mô hình hàm sản xuất gộp dạng Cobb – Douglas)
- Khi nói hàm hồi quy tuyến tính thì người ta quy ước rằng đó là hàm tuyến tính đối với tham số,
nó có thể không phải là tuyến tính đối với biến số
- Đối với hàm hồi quy tuyến tính ta có thể sử dụng trực tiếp phương pháp OLS để ước lượng các tham số còn đối với các hàm phi tuyến thì cần phải tuyến tính hóa nó nếu có thể sau đó áp dụng phương pháp OLS để ước lượng các tham số
Giả thiết 2: Các biến giải thích là phi ngẫu nhiên
- Để phân tích sự phụ thuộc của Y vào X thì ta giả thiết giá trị của biến X là xác định trước, tức là phi ngẫu nhiên
- Nếu X và Y đều là biến ngẫu nhiên thì khi đó quan hệ giữa X và Y là quan hệ tương quan
Giả thiết 3: Kỳ vọng toán của các sai số ngẫu nhiên bằng không
( )i ( / i) 0;( )
E U = E U X = ∀i
- Các sai số ngẫu nhiên có thể ảnh hưởng âm hoặc ảnh hưởng dương đến E(Y/ X) hoặc có ảnh hưởng nhưng chúng không ảnh hưởng một cách hệ thống đến giá trị trung bình của biến phụ thuộc, tức
là về mặt trung bình thì các ảnh hưởng đó bằng không
- Từ giả thiết này suy ra: E Y X( / i) = β β1+ 2X i(?)
Giả thiết 4: Phương sai của các sai số ngẫu nhiên là đồng đều
- Từ giả thiết này suy ra: Var Y( )i =σ2( )∀i (?)
Giả thiết 5: Các sai số ngẫu nhiên không tương quan với nhau
( ,i j) 0;( )
Cov U U = ∀ ≠i j
- Nếu giả thiết này được thoả mãn thì mô hình cần ước lượng gọi là không có hiện tượng tự tương quan ơ [ No Autocorrelation (No Serial correlation) ]
Trang 35- Nếu giả thiết này không được thoả mãn thì mô hình cần ước lượng gọi là có hiện tượng tự tương quan [ Autocorrelation (Serial correlation) ].
Giả thiết 6: Các sai số ngẫu nhiên không tương quan với biến giải thích
( ,i i) 0;( )
Cov U X = ∀i
Nếu giả thiết 2 được thoả mãn thì giả thiết 6 cũng được thoả mãn (?)
Giả thiết 7: Kích thước của mẫu phải lớn hơn số tham số của mô hình
- Nếu mô hình hồi quy hai biến thì số quan sát phải lớn hơn 2 (n > 2)
- Nếu mô hình hồi quy k biến thì số quan sát phải lớn hơn k (n > k)
Giả thiết 8: Các giá trị của biến giải thích phải khác nhau và càng khác nhau nhiều càng tốt.
Giả thiết 9: Mô hình được chỉ định đúng
- Dạng hàm của mô hình được lựa chọn đúng
- Số biến được lựa chọn đưa vào mô hình là phù hợp
Giả thiết 10: Không có đa cộng tuyến giữa các biến giải thích của mô hình hồi quy bội (No multicolinearty).
- Chú ý: Trong thực tế các giả thiết trên có những giả thiết thường được thoả mãn nhưng cũng có những giả thiết không được thỏa mãn và dẫn đến những hậu quả nhất định đối với mô hình ước lượng được
2 Các tham số đặc trưng của ước lượng
2 1
ˆ( )
n i i n i i
X Var
2 1
ˆ( )
n i i n i i
X SD
e n
−
∑ (?) và E(σˆ2)=σ2( σˆ2 là ước lượng không chệch của σ2)
2 1
ˆ
( 2)
n i i
e n
−
∑ gọi là sai số chuẩn của đường hồi quy (Standard error of regression), nó chính là độ
lệch chuẩn của các giá trị Y quanh đường hồi quy mẫu
- Khi thay σ2 bằng σˆ2 thì SD( )βˆ1 trở thành Se( )βˆ1 :
Trang 362 1 1
2 1
ˆ ˆ
( )
n i i n i i
X Se
2 1
ˆ( ) n
i i
Var
x
σ β
=
=
2 2 β
1
ˆ( )
n i i
SD
x
σ β
( )
n i i
Se
x
σ β
ˆ
ˆ ˆ ˆ( , ) ( ) n
i i
Trang 37=∑ =∑ − (Residual sum of squares)
+ TSS là tổng bình phương chung của toàn bộ các sai lệch giữa các giá trị quan sát Yi (trong mẫu) với giá trị trung bình của nó
+ ESS là tổng bình phương các sai lệch giữa các giá trị ước lượng được ˆ
- (TSS) Toàn bộ sự biến thiên của biến phụ thuộc Y xung quanh giá trị trung bình của nó có thể tách thành hai bộ phận:
+ (ESS) Các biến thiên của Y được giải thích thông qua hàm hồi quy, tức là thông qua các biến giải thích có mặt trong hàm hồi quy
PRF SRF
1 1 2 2
ˆ ˆ,
β ββ β>>
Y
Trang 38+ (RSS) Các biến thiên của Y được giải thích bên ngoài mô hình, tức là không thông qua các biến giải thích có mặt trong hàm hồi quy.
- Ký hiệu: R2 ESS 1 RSS
TSS TSS
= = − gọi là hệ số xác định của mô hình (Determination coeffcient – Squares) Hệ số này đo tỷ lệ % sự biến thiên của Y được giải thích thông qua hàm hồi quy, tức là được giải thích thông qua biến độc lập của mô hình Nó được sử dụng để đặc trưng cho mức độ thích hợp của hàm hồi quy
ˆ ˆ
n i
n
Y i
i
x
S R
S y
+ Nếu R2 = 0: Hàm hồi quy hoàn toàn không giải thích sự biến thiên của Y
+ Nếu R2 = 1: Hàm hồi quy giải thích 100% sự biến thiên của Y
+ Nếu R2 = 0,9: Hàm hồi quy giải thích 90% sự biến động của Y, tức là sự biến động của biến giải thích trong hàm hồi quy chi phối 95% sự biến động của Y
4 Hệ số tương quan
- Hệ số tương quan là căn bậc hai của hệ số xác định, ký hiệu: R = R2
- Hệ số tương quan đo mức độ phụ thuộc tuyến tính giữa biến X và Y
+ Tính chất 2: R > 0 (hay R < 0) tức là X và Y quan hệ cùng chiều ( hay ngược chiều );
+ Tính chất 3: R = 0 tức là X và Y không phụ thuộc tương quan tuyến tính;
+ Tính chất 4: R = ±1 tức là X và Y có quan hệ phụ thuộc hàm số tuyến tính
5 Phân phối xác suất của sai số ngẫu nhiên
- Để có thể phân tích về mặt thống kê đối với mô hình ta cần phải biết phân phối xác suất của các ước lượng, các phân phối này tuỳ thuộc vào phân phối xác suất của các sai số ngẫu nhiên
- Giả thiết 11: Các sai số ngẫu nhiên có phân phối chuẩn: U i : Normal,( )∀i
- Các căn cứ để đưa ra giả thiết này:
+ Ui thường là tổng hợp của một số lớn các yếu tố ngẫu nhiên độc lập cùng tuân theo một quy luật phân phối xác suất nào đó và ảnh hưởng đến Y bé đều như nhau do đó Ui có phân phối chuẩn (định lý giới hạn trung tâm);
+ Quy luật phân phối chuẩn chỉ có hai tham số là kỳ vọng toán và phương sai nên dễ tính toán;+ Quy luật phân phối chuẩn có tính chất là nếu Ui phân phối chuẩn thì một hàm tuyến tính của nó cũng có phân phối chuẩn
+ Quy luật phân phối chuẩn có tính chất là tính độc lập và không tương quan là đồng nhất
- Như vậy, kết hợp với các giả thiết ban đầu ta có:
Trang 39(11) : ;( )
i i
(Normal Independent)
- Mô hình thoả mãn toàn bộ 11 giả thiết nêu trên gọi là mô hình hồi quy tuyến tính cổ điển (Classic Linear Regression Model – CLRM) và từ chương I đến chương IV chúng ta chỉ nghiên cứu mô hình CLRM
6 Định lý Gauss – Markov
- Nếu mô hình thoả mãn các giả thiết nêu trên (CLRM) thì khi đó:
+ Các ước lượng β βˆ ˆ1, 2 thu được từ phương pháp OLS là các ước lượng tuyến tính, không chệch
và có phương sai nhỏ nhất trong lớp các ước lượng tuyến tính không chệch của β β1, 2 (Best Linear Unbiassed Estimator – BLUE) (?)
+ Ước lượng σˆ2 là ước lượng phi tuyến, không chệch và có phương sai nhỏ nhất trong lớp các ước lượng phi tuyến không chệch của σ2 (Best UNlinear Unbiassed Estimator – BUE).(?)
- Phân phối của các ước lượng:
+ βˆ1 và βˆ2 có phân phối chuẩn: βˆ1 : N( ,β1 Var( ))βˆ1 và βˆ2 : N( ,β2 Var( ))βˆ2
+> Khi đó biến ngẫu nhiên: 1 1 1
1
ˆ
(0,1)ˆ
( )
SD
β β β
n
Se
β β β
+ Biến phụ thuộc Yi có phân phối chuẩn: Y i : N(β β1+ 2X i,σ2);( )∀i (?)
- Nhận xét: β βˆ ˆ1, 2,σˆ2 là các ước lượng điểm của β β σ1, 2, 2nên tính đại diện không cao do đó cần phải tìm các ước lượng khoảng tin cậy và kiểm định các giả thuyết thống kê của chúng
7 Khoảng tin cậy và kiểm định giả thuyết về các hệ số hồi quy
7.1 Đối với βj;(j = ÷1 2)
a Phương pháp ước lượng khoảng tin cậy
ˆˆ( )
Trang 40- Chú ý: Phân phối Student là phân phối đối xứng nên 1( 12) (1 2)
T−α− = −Tα −
- Trong thực tế người ta thường sử dụng một trong ba công thức sau:
+ Khoảng tin cậy đối xứng ( 1 2
b Phương pháp kiểm định giả thuyết
- Kiểm định các cặp giả thuyết:
* 0
* 1
:
(1):
H H
* 1
:
(2):
H H
* 1
:
(3):
H H
ˆˆ( )
= : nếu giả thuyết H0 là đúng
-Miền bác bỏ với mức ý nghĩa α cho trước được xác định như sau:
+ Với cặp giả thuyết (1) ta tìm được giá trị 1( 2) ( 2)
: 0
(1): 0
j j
H H
β β
: 0
(2): 0
j j
H H
β β
: 0
(3): 0
j j
H H
β β
p Quy tắc kết luận với mức ý nghĩa α cho trước như sau:
+ Với cả 3 cặp giả thuyết :
+> Nếu α > p thì bác bỏ giả thuyết H0
+> Nếu α < p thì không có sơ sở bác bỏ giả thuyết H0
7.2 Đối với σ2
a Phương pháp ước lượng khoảng tin cậy