Phương pháp luận + Đặt giả thiết về vấn đề nghiên cứu + Xây dựng mô hình dựa trên các luận thuyết kinh tế hay các mô hình lý thuyết kinh tế đã đưa ra - Mô hình toán kinh tế - Mô hình k
Trang 1Phần I Kinh tế lượng cơ bản
Bài mở đầu
1 Khái niệm về Kinh tế lượng
Kinh tế lượng là môn khoa học bao gồm toán kinh tế, thống kê, lý thuyết kinh tế, với mục đích là tìm ra kết quả định lượng, thực nghiệm cho các lý thuyết kinh tế và kiểm chứng lại các kết quả mà lý thuyết kinh tế đã đưa ra
Về ý nghĩa: Econometrics = Econo + metrics = Kinh tế + Đo lường
Mục tiêu nghiên cứu : Là các mối quan hệ giữa các biến số kinh tế, các quá
trình kinh tế xã hội, các mối quan hệ xảy ra giữa các đối tượng, các chủ thể, các yếu tố kinh tế xã hội
Công cụ sử dụng chủ yếu : Là các mô hình gọi là các mô hình kinh tế
lượng
Kết quả : Là kết quả định lượng, sử dụng kết quả là những con số để trả lời
các câu hỏi, đưa ra khuyến nghị, dự báo, đánh giá chính sách, phân tích tácđộng,… trong kinh tế
Kiến thức nền tảng cần phải trang bị trước khi học kinh tế lượng, đó là: Kinh tế học (Kinh tế vi mô + vĩ mô), Mô hình toán kinh tế, Xác suất thống
kê toán, tin học
2 Phương pháp luận
+) Đặt giả thiết về vấn đề nghiên cứu
+) Xây dựng mô hình (dựa trên các luận thuyết kinh tế hay các mô hình lý thuyết kinh tế đã đưa ra)
-) Mô hình toán kinh tế
-) Mô hình kinh tế lượng
+) Thu thập số liệu và ước lượng các hệ số của mô hình
+) Kiểm định, đánh giá và phân tích mô hình
+) Sử dụng kết quả để phân tích và dự báo về kinh tế hay khuyến nghị chính sách
3 Số liệu để phân tích
Số liệu được dùng để phân tích trong môn Kinh tế lượng là số liệu thống
kê về kinh tế và bao gồm các loại số liệu sau
-) Số liệu theo thời gian (chuỗi thời gian)
-) Số liệu không gian (hay số liệu chéo)
-) Số liệu hỗn hợp (theo cả thời gian và không gian)
Yêu cầu về số liệu: Đó là số liệu được điều tra ngẫu nhiên, phù hợp với mục đích và đối tượng nghiên cứu
Nguồn số liệu: Số liệu được thu thập qua các cuộc điều tra (khảo sát) hay được cung cấp bởi các cơ quan chuyên môn (như tổng cục thống kê…)
Trang 2Mô hình kinh tế lượng
1 Phân tích hồi quy
Phân tích hồi quy là phân tích mối liên hệ phụ thuộc giữa một biến (gọi là biến phụ thuộc,biến được giải thích, biến nội sinh,…) phụ thuộc vào một (hay một số) biến gọi là biến độc lập, biến giải thích hay biến ngoại sinh, biến hồi quy,…
+) Biến phụ thuộc ký hiệu là Y
+) Biến độc lập ký hiệu là X, hay X1, X2,…, Xk (k nguyên dương)
- Các biến độc lập là các biến không ngẫu nhiên, giá trị của chúng đượccho trước Trong điều kiện đó biến phụ thuộc là một biến ngẫu nhiên cóquy luật phân phối xác suất xác định
+ Hàm E Y X( / )= f X( ) gọi là hàm hồi quy đơn - Simple regression
(hàm hồi quy có một biến độc lập)
+ Hàm E Y X X( / 1, 2, ,X k) = f X X( ,1 2, ,X k) gọi là hàm hồi quy
bội-Multiple regression (hàm hồi quy có hơn một biến độc lập)
- Mục đích của phân tích hồi quy:
+ Ước lượng giá trị trung bình của biến phụ thuộc khi biết giá trị của biếnđộc lập, tức là phải ước lượng các tham số của mô hình
+ Kiểm định các giả thuyết về bản chất của mối quan hệ giữa biến phụthuộc và biến độc lập mà lý thuyết kinh tế đưa ra Trong trường hợp nàyphải trả lời hai câu hỏi:
•) Có tồn tại quan hệ giữa biến phụ thuộc và biến độc lập hay không?
•) Nếu tồn tại quan hệ thì mức độ chặt chẽ như thế nào?
+ Dự báo giá trị trung bình của biến phụ thuộc khi biết giá trị của biến độclập
2 Mô hình hồi quy đơn (hay mô hình hồi quy 2 biến)
2.1 Mô hình hồi quy tổng thể
- Toàn bộ tập hợp các phần tử đồng nhất theo một dấu hiệu nghiên cứuđịnh tính hoặc định lượng nào đó được gọi là tổng thể nghiên cứu hay tổngthể
- Giả sử có một tổng thể nghiên cứu gồm N phần tử với hai dấu hiệu nghiên cứu: X, Y tạo thành một biến ngẫu nhiên hai chiều (X, Y).
- Để nghiên cứu BNN (X, Y) ta lập các bảng phân phối xác suất:
+ Bảng phân phối xác suất đồng thời của X và Y:
Trang 3
P P[(Y= y1)/Xi] P[(Y= y2)/Xi] P[(Y = yh) /Xi]
Kỳ vọng toán của Y với điều kiện của X = Xi
Nó cho biết giá trị trung bình của Y thay đổi như thế nào theo X
Giả sử PRF có dạng tuyến tính
E Y X( / i) = β β1+ 2X i i;( = ÷1 k) hoặc E Y X( / )= β β1+ 2X
Trong đó β β1, 2 gọi là các hệ số hồi quy (Regression Coefficient):
+) Hệ số β1 = E Y X( / i =0) gọi là hệ số chặn (Intercept - INPT) hệ số này
cho biết giá trị trung bình của biến phụ thuộc Y khi biến X = 0.
+) Hệ số 2 E Y X( / )
X
β = ∂
∂ gọi là hệ số góc (Slope) hệ số này cho biết khi X
tăng lên 1 đơn vị thì giá trị trung bình của Y thay đổi như thế nào.
- Ứng với mỗi giá trị cá biệt Yi của Y ta có:
Y i = +β β1 2X i +u i (i = ÷1 N)
gọi là mô hình hồi quy tổng thể (Population Regression Model – PRM).
Với u i = −Y i E Y X( / i) gọi là sai số ngẫu nhiên (Random error), phản ánh chênh lệch giữa giá trị cá biệt của Y với giá trị trung bình của Y.
- Sai số ngẫu nhiên u i đại diện cho tất cả những yếu tố không phải biến độclập có trong mô hình nhưng cũng tác động đến biến phụ thuộc, đó là: + Những yếu tố không biết
Trang 4+ Những yếu tố mà tác động của nó quá nhỏ không mang tính hệ thống
- Sự tồn tại của sai số ngẫu nhiên là tất yếu khách quan và nó có vai tròđặc biệt quan trọng trong phân tích hồi quy, nó phải thoả mãn những điềukiện nhất định thì việc phân tích trên mô hình mới có ý nghĩa
2.2 Mô hình hồi quy mẫu
- Trong thực tế chúng ta không có được tổng thể hoặc có nhưng không thểnghiên cứu toàn bộ tổng thể, vì vậy không thể tìm được PRF mặc dù dạngcủa PRF có thể biết
- Mẫu ngẫu nhiên là một bộ phận mang thông tin của tổng thể được lấy ra
ˆ ˆ1 ˆ2 ;( 1 )
Y = +β β X i= ÷n gọi là hàm hồi quy mẫu (Sample Regression Function - SRF)
- Trong đó: β βˆ ˆ1, 2 gọi là các hệ số hồi quy ước lượng được (Estimatedregression coeffcient), thực chất chúng lần lượt là các ước lượng điểm của
1, 2
β β và ˆ
i
Y là các giá trị ước lượng được (Fitted value), thực chất nó là
các ước lượng điểm của E(Y/Xi).
- Ứng với mỗi giá trị cá biệt của Y ta có:
ˆ1 ˆ2 ;( 1 )
Y = +β β X +e i = ÷n gọi là mô hình hồi quy mẫu (Sample Regression Model – SRM)
với e i = −Y Y i i ˆ ;( 1 )i = ÷n gọi là phần dư (Residual), thực chất chúng là
các ước lượng điểm của các sai số ngẫu nhiên u i Các phần dư e i phản ánh
chênh lệch giữa giá trị cá biệt Yi trong mẫu W với giá trị ước lượng được
1 2:(/)i i
Trang 5Tương ứng với mỗi mẫu rút ra từ tổng thể ta sẽ tìm được một hàm hồi quymẫu SRF, tức là có rất nhiều SRF khác nhau mà chúng đều là các ướclượng điểm của PRF, ta cần tìm SRF nào đại diện tốt nhất cho PRF.
3 Mô hình hồi quy bội (hay mô hình hồi quy k biến)
3.1 Mô hình hồi quy tổng thể
Mô hình hồi quy tổng thể (PRM) và hàm hồi quy tổng thể (PRF) có dạng:
β β β gọi là các hệ số góc riêng phần (các hệ số hồi quy
tương ứng với các biến X1, X2,…,Xk)
- Giá trị của k cho biết số tham số cần ước lượng của mô hình.
- Hệ số chặn β1 = E Y X( / 2i = X3i = = X ki =0) là giá trị trung bình của
Y khi X mi =0;(∀ = ÷m 2 k)
- Hệ số ( / 2, 3, , )
k m
đơn vị thì trung bình của Y thay đổi như thế nào trong điều kiện các biến Xj; (∀ ≠j m) không thay đổi
Dạng ma trận của mô hình
Đặt: X i = (1 X 2i X 3i … X ki ) β =
1 2
k
β β
111
k k
L
; β =
1 2
k
β β
N
u u u
Trang 6Với một mẫu kích thước n: W ={( ,Y X i 2i, ,X ki) :i = ÷1 n} thì hàm hồiquy mẫu (SRF) và mô hình hồi quy mẫu (SRM) có dạng:
111
k k
L
βˆ
1 2
ˆˆ
ˆ
k
β β
n
e e e
Trang 7Bài 2
Ước lượng và phân tích mô hình
1 Phương pháp bình phương nhỏ nhất
1.1 Ước lượng mô hình hồi quy đơn(hay mô hình hồi quy 2 biến)
Xét mô hình hồi quy đơn dạng tuyến tính
1 2 2
ˆ ˆ( , )
0ˆ
ˆ ˆ( , )
0ˆ
f
f
β β β
β β β
Trang 8Nếu đặt x i = X i − X, y i = −Y Y i thì
1 2
2 1
ˆ
n
i i i n i i
x y x
1.2 Ước lượng mô hình hồi quy tổng quát (hay mô hình hồi quy bội)
Xét mô hình hồi quy bội (hay mô hình hồi quy k biến) dạng tuyến tính
1 2 2
1 2
( , , , )
0ˆ
( , , , )
0ˆ
( , , , )
0ˆ
k
k
k k
Trang 9Dạng ma trận, tìm véc tơ βˆ sao cho e ’ e →min với
M
LL
Để giải được hệ trên điều kiện cần là ma trận X ’ X không suy biến, hay các
biến độc lập không có quan hệ cộng tuyến với nhau
2 Các giả thiết của phương pháp bình phương nhỏ nhất
Để giải được nghiệm ˆ ( 1 )
j j k
β = ÷ và nghiệm có thể sử dụng trongphân tích, các giả thiết của phương pháp bình phương nhỏ nhất được đặtra
Giả thiết 1: Hàm hồi quy tuyến tính theo tham số
Giả thiết 2: Các biến độc lập không ngẫu nhiên
Giả thiết 3: Trung bình sai số ngẫu nhiên bằng không, E u( ) 0i = ∀i
Giả thiết 4: Phương sai của sai số ngẫu nhiên là không đổi,
Giả thiết 7: Số quan sát nhiều hơn số tham số cần ước lượng
Giả thiết 8: Các biến độc lập không có quan hệ cộng tuyến với nhau
Giả thiết 9: Dạng hàm của mô hình được chỉ định đúng
Dưới dạng ma trận, các giả thiết được mô tả như sau
Giả thiết 1: PRF có dạng E(Y) = Xβ hay Y = Xβ + u
Giả thiết 2: Ma trận X không ngẫu nhiên
Giả thiết 3: E(u) = [0]
Trang 10Giả thiết 6: Cov(u, X) = [0]
Giả thiết 7: n > k
Giả thiết 8: r(X) = k (hạng của ma trận X bằng k)
Định lý Gauss – Markov: Nếu các giả thiết của phương pháp bình
phương nhỏ nhất được thỏa mãn thì βˆ = (X ’ X) -1 X ’ Y là ước lượng tuyến tính, không chệch, tốt nhất của β.
3 Tham số của ước lượng
Bằng phương pháp ước lượng bình phương nhỏ nhất, tìm được các
σ = Var(ui), nhưng do tổng thể chưa biết nên σ2chưa biết
Khi đó ước lượng cho σ2được tính theo công thức
σ được gọi là độ lệch chuẩn của đường hồi quy (S.E of Regression) Khi
thay σˆ2cho σ2 thì độ lệch chuẩn của ˆ
Trang 112 1
n i i
X E
e Y
=
=
∑
Tính chất 5: Đồ thị hàm hồi quy mẫu đi qua điểm trung bình mẫu
Chú ý: Nếu với mẫu ngẫu nhiên W ={( ,Y X i 2i,X3i, ,X ki); i = ÷1 n}
thì các ước lượng nhận được bằng phương pháp LS là các đại lượng ngẫunhiên, tuy nhiên với một phép thử trên mẫu ngẫu nhiên ta được một mẫuvới những giá trị cụ thể, hay mẫu cụ thể
w ={ y x x i, 2i, 3i, ,x ki); i = ÷1 n}
Trang 124 Phân tích các hệ số
Như trên đã trình bày các ước lượng nhận được bằng phương pháp LS làdựa vào thông tin mẫu Xuất phát từ các ước lượng nhận được ta muốn suyđoán thống kê về các tham số của tổng thể thì ta cần phải biết quy luậtphân phối xác suất của các ước lượng Do quy luật phân phối xác suất củacác ước lượng đều có liên quan trực tiếp với quy luật phân phối xác suấtcủa sai số ngẫu nhiên, do vậy ta giả thiết sai số ngẫu nhiên có phân phốichuẩn (xem giả thiết 3 + 4 ở trên)
β là hàm tuyến tính của các sai số
ngẫu nhiên ui nên
Var( )
j j j j
j j
σ β β
ˆ
ˆ( )
j j j
Se
β β β
4.1 Ước lượng khoảng cho các hệ số hồi quy
Với độ tin cậy 1−α cho trước, α α1+ 2 =α
+) Khoảng tin cậy cho từng hệ số
Với mẫu ngẫu nhiên ta có
Trang 13+) Khoảng tin cậy cho hai hệ số
Với mẫu ngẫu nhiên ta có
Se(β βˆi ± ˆj)= Var(β βˆi ± ˆj) = Var( ) Var( ) 2βˆi + βˆj ± Cov( ,β βˆ ˆi j)
Nếu xây dựng khoảng tin cậy cho aβi ±bβj (a, b là hằng số) thì ta xây
dựng tương tự như trên và lưu ý
4.2 Ước lượng khoảng cho phương sai sai số ngẫu nhiên
Với mẫu ngẫu nhiên ta có
2 1
χ
−
>
−
Trang 14+) Kiểm định về từng hệ số hồi quy : Do chưa có tổng thể nên ta chưa biết
được các βj, nhưng có thể cho rằng nó bằng β*j (với β*j cho trước ) haykhông ? khi ấy ta đưa ra giả thuyết H0:βj = β*j Để kiểm định giả thuyếtnày ta chọn tiêu chuẩn kiểm định
*ˆ
ˆ( )
j j j
T Se
β β β
ˆ( )
j j j
Se
β β β
−
α cho trước tùy thuộc vào giả thuyết đối H1 mà ta xây dựng được cácmiền bác bỏ giả thuyết H0 tương ứng với các trường hợp sau
-) Nếu ta kiểm định cặp giả thuyết
* 0
* 1
::
ˆ
( )
j j n k j
T t Se
β β β
* 1
::
j j n k j
T t Se
β β β
−
−
Với mẫu cụ thể và với α cho trước mà T qs >tα(n k− ) thì ta bác bỏ H0
-) Nếu ta kiểm định cặp giả thuyết
* 0
* 1
::
T t Se
β β β
H H
β β
j qs
j
T Se
β β
=
Trang 15Với trường hợp riêng ta có các chú ý sau :
•) Nếu ta bác bỏ H0 thì ta nói hệ số βj khác 0 một cách có ý nghĩa, hay hệ
số βj có ý nghĩa thống kê Nếu hệ số βj không có ý nghĩa thống kê thì cónghĩa là biến độc lập Xj không giải thích cho biến phụ thuộc Y, ngược lạinếu hệ số βj có ý nghĩa thống kê thì có nghĩa là biến độc lập Xj có giảithích cho biến phụ thuộc Y
•) Có thể kiểm định bằng phương pháp P – value, theo đó với α cho trước
mà α > P – value thì bác bỏ giả thuyết H0
+) Kiểm định về nhiều hệ số hồi quy : Do chưa có tổng thể nên ta chưa biết
được các βj, nhưng có thể cho rằng β βi ± j bằng β* (với β* cho trước )khi ấy ta đưa ra giả thuyết H0:β βi ± j =β* Để kiểm định giả thuyết này
ta chọn tiêu chuẩn kiểm định
± (với mẫu cụ thể, thay số
tính được T qs) Nếu giả thuyết H0:β βi ± j = β* là đúng thì
-) Nếu ta kiểm định cặp giả thuyết
* 0
* 1
* 1
Với mẫu cụ thể và với α cho trước mà T qs >tα(n k− ) thì ta bác bỏ H0
-) Nếu ta kiểm định cặp giả thuyết
* 0
* 1
Trang 16Với mẫu cụ thể và với α cho trước mà T qs < − tα thì ta bác bỏ H0.
Có thể mở rộng cho kiểm định giả thuyết về hơn hai hệ số, chẳng hạn
i j m
β β+ +β hay tổ hợp của các hệ số aβi +bβj (với a, b là các hằng sốcho trước)
5 Hệ số xác định
5.1 Phân tích độ biến động của biến phụ thuộc
Xuất phát từ mô hình hồi quy mẫu đó là
ˆ ˆ
Y = + ⇔ − = − +Y e Y Y Y Y e , bình phương hai vế đẳng thức này và áp dụng các tính chất của phương
Thì R2 gọi là hệ số xác định của mô hình
+) Dễ thấy 0 R≤ 2 ≤1
Trang 17+) Ý nghĩa của hệ số xác định R2 : Cho biết các biến độc lập có trong môhình giải thích được 100*R2 (%) sự biến động của biến phụ thuộc.
mẫu là ngẫu nhiên, tuy nhiên với mẫu cụ thể thì R2 là con số cụ thể
Khi thêm biến giải thích vào mô hình, nếu hệ số xác định điều chỉnh tănglên thì đó là một trong các tiêu chí cho thấy nên thêm biến giải thích nàyvào mô hình (tất nhiên cần chú ý đến ý nghĩa kinh tế của mô hình khi thêmbiến mới)
6 Kiểm định sự phù hợp của hàm hồi quy
Xét mô hình hồi quy k biến, hệ số xác định của mô hình trong tổng thể cho
biết độ biến động của biến phụ thuộc được giải thích bởi các biến độclaapjtrong mô hình Nếu R2 tổng thể bằng 0 thì các biến độc lập trong môhình không giải thích được cho sự biến động của biến phụ thuộc, khi ấy tanói hàm hồi quy không phù hợp Ngược lại nếu R2 tổng thể lớn hơn 0 thì
có nghĩa là trong mô hình có ít nhất một biến độc lập có giải thích cho sựbiến động của biến phụ thuộc, khi ấy ta nói hàm hồi quy phù hợp Để kiểmđịnh sự phù hợp của hàm hồi quy, ta kiểm định cặp giả thuyết sau (với R2trong tổng thể )
k j
Trang 18minh được ESS ~χ2(k −1) và RSS ~χ2(n k− )
Khi ấy với mức ý nghĩa α cho trước miền bác bỏ giả thuyết H0 là
2
(k-1; n-k) 2
ta chưa có cơ sở bác bỏ H0 ta kết luận hàm hồi quy không phù hợp
7 Kiểm định hồi quy có điều kiện ràng buộc (hay kiểm định thu hẹp hàm hồi quy)
Xét mô hình hồi quy k biến (hay k tham số)
Nếu giả thuyết H0 là đúng thì từ mô hình có k tham số (gọi là mô hình Lớn
– ký hiệu L) có thể thu hẹp về mô hình còn (k - m) tham số (gọi là mô hình
Trang 19
2 2 2
2 2
(m; n -k)
L N 2 L
Nếu với mẫu cụ thể và với mức ý nghĩa α cho trước mà Fqs > fα( ;m n k− ) thì
ta bác bỏ H0 , điều này có nghĩa trong các biến Xk-m+1, Xk-m+2, … , Xk có ítnhất một biến có giải thích cho biến phụ thuộc Y
Một số trường hợp đặc biệt
-) Trường hợp m = 1 thì kiểm định thu hẹp hàm hồi quy chính là kiểm định
về từng hệ số hồi quy, Fqs trong trường hợp này bằng bình phương Tqs ứng
với hệ số đó
-) Trường hợp m = k – 1 thì kiểm định thu hẹp hàm hồi quy chính là kiểm
định về sự phù hợp của hàm hồi quy
-) Kiểm định mở rộng hàm hồi quy tương đương với kiểm định thu hẹp
hàm hồi quy, chú ý rằng k luôn là số tham số của mô hình lớn, dù là kiểm
định về thu hẹp hay mở rộng hàm hồi quy
8 Dự báo
Khi véc tơ X0 = (1 X02 X03 L X )0k cho trước ta cần dự báo giá trịtrung bình và cá biệt của biến phụ thuộc
+) Dự báo giá trị trung bình E(Y/ X0)
Với độ tin cậy 1- α ta có khoảng tin cậy đối xứng của E(Y/ X0) như sau
+) Dự báo giá trị cá biệt (Y/ X0)
Với độ tin cậy 1- α ta có khoảng tin cậy đối xứng của (Y/ X0) như sau
Se =σ
Trang 20Trường hợp mô hình hồi quy đơn ta có
0
2 1
X X Se
0
2 1
1ˆ
i i
X X Se
Với TC là tổng chi phí, Q là sản lượng
Ta có mô hình hàm tổng chi phí như sau
Trang 21Để biết kết quả hồi quy có đáng tin cậy và tốt nhất cho phân tích haykhông ? ta cần đánh giá về mô hình, xem mô hình có vi phạm các giả thiếtcủa phương pháp LS hay không Với mỗi trường hợp mà mô hình vi phạmgiả thiết của phương pháp LS thì ta nói mô hình có khuyết tật.
Trang 22Đa cộng tuyến hoàn hảo và đa cộng tuyến không hoàn hảo.
+) Đa cộng tuyến hòa hảo là hiện tượng các biến độc lập trong mô hình
thỏa mãn điều kiện
λ2X2+λ3X3 + +L λk X k =0
Trong đó các hệ số λ λ2, , ,3 λk thỏa mãn điều kiện
λ22+λ32 + +L λk2 > 0
+) Đa cộng tuyến không hòa hảo là hiện tượng các biến độc lập trong mô
hình thỏa mãn điều kiện
+) Trường hợp có đa cộng tuyến hoàn hảo, khi đó hạng của ma trận X nhỏ
hơn k do đó ma trận vuông X’ X suy biến, nên không thể ước lượng được
các tham số của mô hình, không có kết quả tính toán
+) Khi có đa cộng tuyến không hoàn hảo thì ta vẫn ước lượng được cáctham số của mô hình, tuy nhiên các ước lượng điểm nhận được không còn
là ước lượng tốt nhất
+) Trường hợp đa cộng tuyến gần hoàn hảo (hay còn gọi là mức độ đacộng tuyến nghiêm trọng) thì các hệ số hồi quy ước lượng có thể sai về
dấu Các kết luận của kiểm định dựa vào các thống kê T và F cho kết luận
mâu thuỗn nhau
Trang 231.4 Phát hiện
+) Nếu có hiện tượng đa cộng tuyến hoàn hảo thì như trên đã phân tích takhông thể ước lượng được các tham số của mô hình, hay nói khác đi takhông có kết quả tính toán
+) Nếu có hiện tượng đa cộng tuyến không hoàn hảo, để phát hiện ta có thể
dựa vào các kết luận của kiểm định T và F, nếu các kết luận mâu thuỗn
nhau thì đó là dấu hiệu cho thấy mô hình có hiện tượng đa cộng tuyến.+) Trong trường hợp muốn kiểm tra xem biến độc lập nào thực sự cộngtuyến với các biến độc lập còn lại thì ta có thể dùng phương pháp hồi quyphụ
Với mỗi biến X j (j = ÷2 k) ta ước lượng mô hình (a) thu được R( )2a
Muốn xem xét biến X j (j = ÷2 k) có cộng tuyến với các biến độc lập cònlại hay không ? ta kiểm định cặp giả thuyết sau
0 1
::
2 ( )
( ) ( )
1( 1) 1
Với mẫu cụ thể và với mức ý nghĩa α cho trước mà F qs > fα(k−2;n k− +1) thì
ta bác bỏ H0 tức là biến Xj cộng tuyến với ít nhất một biến độc lập còn lại,khi ấy mô hình (1.1) (hay còn gọi là mô hình gốc) có hiện tượng đa cộngtuyến
Trang 24mô hình hồi quy phụ có thực sự khác 0 hay không ? Nếu tồn tại một hệ số
góc trong mô hình hồi quy phụ thực sự khác 0 thì Xj thực sự có phụ thuộc
tuyến tính vào ít nhất một biến độc lập khác, khi đó mô hình (1.1) có hiệntượng đa cộng tuyến
•) Vấn đề đa cộng tuyến là vấn đề về số liệu mẫu của các biến, không phải
của tổng thể nên không có kiểm định về hiện tượng đa cộng tuyến gữa cácbiến giải thích trong mô hình hồi quy tổng thể
•) Người ta không xem xét vấn đề có hay không có hiện tượng đa cộng
tuyến trong mô hình, mà người ta xem xét tính nghiêm trọng của hiệntượng đa cộng tuyến (nếu có), bởi vì mô hình gặp phải hiện tượng đa cộngtuyến nghiêm trọng mà không được xem xét khắc phục thì dùng mô hình
đó để phân tích sẽ mất tính chính xác hoặc sai lầm khi phân tích, dự báo
•) Chỉ quan tâm đến vấn đề đa cộng tuyến trong mô hình hồi quy bội.
2 Phương sai sai số (PSSS) thay đổi
2.1 Hiện tượng
Xét mô hình Y i = +β β1 2X i +u i (2.1)
Một trong những giả thiết của phương pháp LS đó là phương sai sai sốngẫu nhiên đồng đều, tức là Var(u ) =i σ2 ( )∀i
Nếu giả thiết này không được thỏa mãn, đó là
Var(u ) Var(u ) (i ≠ j ∀ ≠i j) hay Var(u ) =i σi2
Khi đó ta nói mô hình có hiện tượng phương sai sai số thay đổi
2.2 Nguyên nhân
-) Do bản chất của các hiện tượng kinh tế: Nếu các hiện tượng kinh tế theokhông gian được điều tra trên những đối tượng có quy mô khác nhau hoặccác hiện tượng kinh tế theo thời gian được điều tra qua các giai đoạn cómức biến động khác nhau thì PSSS có thể không đồng đều
-) Do định dạng không đúng dạng hàm của mô hình
-) Do số liệu không phản ánh đúng bản chất của hiện tượng kinh tế, chẳnghạn xuất hiện các quan sát ngoại lai
-) Do kỹ thuật thu thập, xử lý và bảo quản dữ liệu
Trang 252.3 Hậu quả
-) Các hệ số hồi quy ước lượng thu được bằng phương pháp LS là các ướclượng tuyến tính không chệch và vững song không còn là các ước lượnghiệu quả nhất
-) Khoảng tin cậy của các hệ số hồi quy sẽ rộng hơn, các kiểm định T, F
mất hiệu lực và các dự báo sẽ không còn chính xác
-) Ước lượng cho PSSS ngẫu nhiên là ước lượng chệch
2.4 Phát hiện
2.4.1 Phân tích định tính
- Căn cứ vào nội dung kinh tế của các biến số trong mô hình để xem xétkhả năng có xảy ra hiện tượng PSSS thay đổi hay không? Đây là cáchchuẩn đoán dựa vào thông tin tiên nghiệm về hiện tượng kinh tế
- Các số liệu chéo thường chứa đựng hiện tượng PSSS thay đổi
2.4.2 Dựa vào thông tin trên mẫu
- Do không có toàn bộ tổng thể vì vậy ta không biết được giá trị của các
Var(u ) = E(u )
i
σ = nên không thể biết được mô hình hồi quy tổng thể
có hiện tượng PSSS thay đổi hay không
- Các phần dư ei thu được từ mô hình hồi quy mẫu là các ước lượng điểm của các sai số ngẫu nhiên ui nên dựa vào các thông tin về chúng ta có thể
đưa ra các chuẩn đoán về PSSS
a Quan sát đồ thị của các phần dư
+) Bước 1: Ước lượng mô hình (2.1) bằng phương pháp LS tìm được các
phần dư ei
+) Bước 2: Vẽ đồ thị của các phần dư ei hay ei2 theo Xi, Yi, ˆ
i
Y hoặc theo cácquan sát
+) Bước 3: Căn cứ vào các đồ thị để chuẩn đoán về hiện tượng PSSS thayđổi
Trang 26Tiêu chuẩn kiểm định 2
2
ˆ
ˆ( )
Se
α α
Với mẫu cụ thể và với mức ý nghĩa α cho trước mà ( 2)
2
n qs
T >tα − thì ta bác
bỏ H0, kết luận mô hình (2.1) có PSSS thay đổi
[Nếu mô hình hồi quy bội thì giả thiết của kiểm định Park là
- Xét mô hình (2.1) và thực hiện các bước sau
+) Bước 1: Ước lượng mô hình (2.1) tìm được các phần dư ei
+) Bước 2: Ước lượng một trong các mô hình sau
Tiêu chuẩn kiểm định 2
2
ˆ
ˆ( )
Se
α α
Với mẫu cụ thể và với mức ý nghĩa α cho trước mà ( 2)
2
n qs
T >tα − thì ta bác
bỏ H0, kết luận mô hình (2.1) có PSSS thay đổi
[Nếu mô hình hồi quy bội thì ta có thể hồi quy e i2 hoặc e i lần lượt theotừng biến độc lập với các bậc khác nhau]
d Kiểm định White (kiểm định tổng quát)
- Xét mô hình: Y i = +β β1 2X2i +β3X3i +u i (2.2)Các bước kiểm định
Trang 27+) Bước 1: Ước lượng mô hình (2.2) tìm được các phần dư ei
+) Bước 2: Ước lượng mô hình hồi quy phụ sau bằng phương pháp LS
1 2 2 3 3 4 2 5 3 6 2 3
e = +α α X +α X +α X +α X +α X X +v (c)thu được hệ số xác định R2(c)
+) Bước 3: Kiểm định cặp giả thuyết
0 1
::
H H
PSSS mô hình (2.2) đồng đềuPSSS mô hình (2.2) thay đổi
Ta chọn tiêu chuẩn kiểm định χ2= n R ~× 2(c) χ2(5), với 5 = số tham sốcủa mô hình (c) trừ 1
[Trường hợp với mô hình tổng quát, mô hình k biến thì tiêu chuẩn kiểm
định χ2= n R ~× 2(c) χ2(m−1) với m là số tham số của mô hình hồi quy
phụ]
Với mẫu cụ thể và với mức ý nghĩa α cho trước mà χqs2 > χα2(5) thì ta bác
bỏ H0, kết luận mô hình (2.2) có PSSS thay đổi
Chú ý: Trong mô hình hồi quy phụ - mô hình (c) bắt buộc phải có hệ số
chặn và có thể không có các số hạng chéo nhưng cũng có thể có bậc caohơn của các biến độc lập
e Kiểm định dựa trên biến phụ thuộc (hay kiểm định Koenker - Bassett) Xét mô hình hồi quy k biến
Y i = +β β1 2X2i +β3X3i + +L βk X ki +u i (2.3)Giả thiết rằng PSSS thay đổi là một hàm của trung bình biến phụ thuộc
+) Bước 3: Kiểm định cặp giả thuyết
Để kiểm định cặp giả thuyết trên ta có các cách sau
Trang 28+) Cách 1: Kiểm định χ
Tiêu chuẩn kiểm định: χ2= n R ~× 2(d) χ2(1)
Với mẫu cụ thể và với mức ý nghĩa α cho trước mà χqs2 > χα2(1) thì ta bác
bỏ H0, kết luận mô hình (2.3) có PSSS thay đổi
Chú ý : Trường hợp kiểm định dựa trên biến phụ thuộc có thể kiểm định
bằng phương pháp P – value của các thống kê χ2 và F.
để quay lại mô hình (2.1)
2.5.2 Trường hợp chưa biết σi2
Trường hợp này có thể thay thế σi2 bởi các biến khác tương ứng với kiểmđịnh phát hiện Nếu phương pháp kiểm định dựa trên giả thuyết phương saisai số thay đổi theo yếu tố nào thì có thể chia 2 vế của phương trình hồiquy cho căn bậc hai của yếu tố đó
Do vậy có thể chia 2 vế của phương trình hồi quy cho :
-) Biến độc lập (chẳng hạn Xi) nếu giả thiết σi2 =αX i2
Trang 29-) Căn bậc hai của biến độc lập (chẳng hạn X i ) nếu giả thiết σi2 =αX i
-) Ước lượng của trung bình biến phụ thuộc (chẳng hạn Yˆi) nếu giả thiết
Cov(u t , u t-p) = 0 ∀ ≠p 0, p∈N
Nếu giả thiết trên không được thỏa mãn, tức là
∃ ≠p 0 mà Cov(u t , u t-p)≠0
thì ta nói mô hình (3.1) có tự tương quan bậc p
+) Trường hợp tự tương quan bậc 1, ứng với p = 1 ta có
-) Các ước lượng hồi quy thu được không phải là các ước lượng tốt nhất
-) Các khoảng tin cậy sẽ rộng hơn và các kiểm định T, F sẽ mất hiệu lực.
-) Giá trị σˆ2 là ước lượng chệch của σ2 và hệ số xác định của mô hìnhthường lớn hơn giá trị thực của nó
-) Các phân tích và dự báo dựa trên mô hình hồi quy ước lượng cũng mấttính chính xác
Trang 30nhiên u t
a) Quan sát đồ thị phần dư
+) Bước 1: Ước lượng mô hình gốc thu được các phần dư e e t, t−1
+) Bước 2: Vẽ đồ thị của e t theo e t−1 và nhận xét
b) Dùng mô hình hồi quy phụ
+) Bước 1: Ước lượng mô hình gốc thu được các phần dư e e t, t−1, ,e t p−
+) Bước 2: Ước lượng mô hình hồi quy phụ sau
e t = ρ1e t−1+ ρ2e t−2 + +L ρp t p e− +εt (e)
Thu được R2(e)
+) Bước 3: Kiểm định cặp giả thuyết
0 1
::
2 (e)
j j
H H
ρ ρ
j j
Se
ρ ρ
mức ý nghĩa α cho trước mà ( 2)
2
n qs
T >tα − thì ta bác bỏ H0
c) Kiểm định Durbin – Watson (DW)
Công thức tính thống kê Durbin - Watson
Trang 31t =1
e eˆ
e
ρ = ∑
∑ là
ước lượng điểm của ρ Do − ≤ ≤1 ρ 1 nên 0≤ ≤ ⇒ ≤ ≤ρˆ 1 0 d 4
Ta dùng thống kê DW để kiểm định hiện tượng tự tương quan bậc nhất của
mô hình gốc
Các bước tiến hành như sau
+) Bước 1: Ước lượng mô hình gốc thu được các phần dư e e t; t−1
+) Bước 2: Tính thống kê d theo công thức: DW =
2 1 2
2 1
n
t t t
n t t
e e d
::
H H
+) Bước 4: Với α =5% kích thước mẫu bằng n và số biến giải thích là k’ = k – 1, tra bảng các giá trị Durbin - Watson ta tìm được các giá trị
dL, dU và xây dựng bảng kết luận như sau:
Có tự tương
quan dương
ρ > 0
Không có kết luận
Không có tựtương quan
ρ = 0
Không cókết luận
Có tự tươngquan âm
ρ < 0
0 dL dU 2 4 – dU 4 – dL 4
So sánh d với bảng trên và kết luận.
Lưu ý: Tiêu chuẩn kiểm định DW có thể sử dụng nếu thoả mãn các điềukiện sau:
+ Mô hình gốc phải có hệ số chặn
+ Mô hình gốc không phải là mô hình tự hồi quy, tức là không chứa biếntrễ của biến phụ thuộc với tư cách là biến giải thích
Y t = β β1+ 2X t +β3Y t−1+u t
+ Không có quan sát nào bị mất trong tệp số liệu
+ Biến X là phi ngẫu nhiên
Trang 32Dùng để kiểm định hiện tượng TTQ bậc p
Các bước tiến hành
+) Bước 1: Ước lượng mô hình (3.1) thu được các phần dư e e t, t−1, ,e t p−
+) Bước 2: Lần lượt ước lượng các mô hình sau
t [ 1 2 t] 1 t 1 2 t 2 p t p t
e = α α+ X +ρ e− +ρ e− + +L ρ e− +v (*) tìm được 2
( )
R ∗ vàRSS(*)
Tiêu chuẩn kiểm định: χ2= (n-p) R ~× 2(*) χ2( )p
Với mẫu cụ thể và với mức ý nghĩa α cho trước mà χqs2 > χα2( )p thì tabác bỏ H0, kết luận mô hình gốc có TTQ bậc p
Cách 2: Kiểm định F
Tiêu chuẩn kiểm định:
2 2 ( ) ( ) ( ) ( )
Trang 333.5 Khắc phục
Xét mô hình (3.1), ta viết lại mô hình: Y t = β β1+ 2X t +u t và giả sử môhình có hiện tượng tự tương quan bậc nhất u t = ρu t−1+εt, ρ ≠ 0
a)Trường hợp đã biết ρ
Sử dụng phương pháp sai phân tổng quát Giả thiết rằng mô hình gốc đã
đúng ở thời kỳ t thì cũng đúng với thời kỳ t - 1 ta có
Y t−1 = +β β1 2X t−1+u t−1 ⇔ ρY t−1 = ρβ ρβ1+ 2X t−1+ ρu t−1 (3.2)Lấy phương trình (3.1) trừ đi phương trình (3.2) vế với vế ta có
Y t −ρY t−1 = β1(1−ρ β)+ 2(X t −ρX t−1) (+ u t −ρu t−1) (3.3)Đặt Y t* = −Y t ρY t−1; β1* = β1(1−ρ); X t* = X t −ρX t−1; εt = −u t ρu t−1
ˆˆ
1
β β
ρ
=
−
Mô hình (3.3) gọi là mô hình sai phân tổng quát
-) Nếu ρ =1 thì mô hình (3.1) có TTQ dương hoàn hảo, khi đó mô hình(3.3) trở thành mô hình sai phân cấp 1
b) Trường hợp chưa biết ρ
Dùng thống kê DW, khi đó các bước tiến hành như sau
+) Bước 1: Ước lượng mô hình gốc tìm được e e t, t−1 và tính thống kê d
Trang 34β βsau đó
Ước lượng mô hình e t(1) = ρ0+ ρ1e t(1)−1+εt thu được ρˆ1(1)
β β Ước lượng mô hình e t(2) = ρ0 +ρ1e t(2)−1 +εt thu được ρˆ1(2)
+) Bước 3 :
Thay ρˆ1(2) vào vị trí của ρˆ trong phương trình sai phân (3.5) và ướclượng phương trình này thu được ˆ1(3), ˆ2(3), (3)
t e
β β Ước lượng mô hình e t(3) = ρ0 +ρ1e t(3)−1 +εt thu được ρˆ1(3)
+) Bước 4 : Lại thay ρˆ1(3) vào vị trí của ρˆ trong phương trình sai phân(3.5) và ước lượng phương trình này thu được (4) (4) (4)
1 2
ˆ , ˆ ,
t e
β β
………
Tiếp tục quá trình cho đến khi ρˆ ở hai bước kế tiếp chênh lệch nhaukhông đáng kể, khi đó β βˆ ˆ1, 2 ở bước cuối cùng sẽ là ước lượng cho β β1, 2của mô hình (3.1)
Lưu ý : Để biết phương pháp Cochran – Orcutt đã khắc phục được hiệntượng TTQ hay chưa, ta phải thực hiện kiểm định Durbin – Watson đểkiểm tra lại
4 Định dạng mô hình
Nếu một mô hình được định dạng không đúng dạng hàm, hoặc thiếu biếnđộc lập cần thiết, thì các ước lượng nhận được bằng phương pháp LS cóthể không còn chính xác Chẳng hạn một mô hình thiếu biến giải thích cầnthiết hay dạng hàm không đúng có thể gây ra các hiện tượng phương saisai số thay đổi, tự tương quan
Xét mô hình Y i = +β β1 2X i +u i (4.1)
Để kiểm định xem mô hình (4.1) có thiếu các biến giải thích cần thiết haykhông ta dùng một trong hai kiểm định sau
4.1 Kiểm định Ramsey RESET
+) Bước 1 : Ước lượng mô hình (4.1) thu được (4.1)2 ; ˆ
i
R Y
+) Bước 2 : Ước lượng mô hình hồi quy phụ sau
Trang 35(Nếu mô hình gốc là mô hình Y t = +β β1 2X2t +β3X3t + +L βk X k t +u t
Trong đó n là số quan sát, m là số biến độc lập mới (hay số tham số αj)
trong mô hình (4.2), k là số tham số của mô hình gốc (với mô hình (4.1) thì
k = 2).
Với mẫu cụ thể và với mức ý nghĩa α cho trước mà F qs > fα( ;m n− −k m) thìbác bỏ giả thuyết H0, kết luận mô hình (4.1) thiếu biến giải thích cần thiết,hay mô hình (4.1) có dạng hàm chưa đúng
4.2 Kiểm định nhân tử Lagrange
+) Bước 1 : Ước lượng mô hình (4.1) thu được ; ˆ
(Nếu mô hình gốc là mô hình Y t = +β β1 2X2t +β3X3t + +L βk X k t +u t
Trang 36Với mẫu cụ thể và với mức ý nghĩa α cho trước mà χqs > χα( )m thì bác
bỏ giả thuyết H0, kết luận mô hình (4.1) thiếu biến giải thích cần thiết, hay
mô hình (4.1) có dạng hàm chưa đúng
5 Kiểm định giả thuyết về dạng phân phối của sai số ngẫu nhiên
Trong các mô hình hồi quy ta luôn giả thiết các sai số ngẫu nhiên tuân theoquy luật phân phối chuẩn, tuy nhiên trong thực tế giả thiết này có thể bị vi
phạm Để biết các sai số ngẫu nhiên ui trong mô hình (4.1) có tuân theo
quy luật phân phối chuẩn hay không ta thực hiện các bước kiểm định sau
+) Bước 1: Ước lượng mô hình (4.1) tìm được các phần dư ei
+) Bước 2: Tìm hệ số bất đối xứng S (Skewness) và hệ số nhọn
K (Kurtosis) của các phần dư e i
::
Với mẫu cụ thể và với mức ý nghĩa α cho trước mà χqs2 > χα2(2) thì bác
bỏ giả thuyết H0, kết luận các sai số ngẫu nhiên ui không tuân theo quy luậtphân phối chuẩn
Nếu các sai số ngẫu nhiên ui không tuân theo quy luật chuẩn thì có hai cách
khắc phục:
+ Tăng kích thước của mẫu
+ Bỏ bớt biến giải thích ra khỏi mô hình nếu có thể
Trang 37
mô hình mà trong số các biến, không những có cả biến định lượng mà còn
có cả biến định tính nữa, khi ấy chúng ta muốn ước lượng các tham số của
mô hình thì ta phải làm thế nào ?
Trước hết ta hiểu một biến định tính là biến như thế nào ?
+) Biến định tính là biến cho biết có hay không có một thuộc tính nào đó
+) Biến định tính có 2 phạm trù (trạng thái) : Giả sử ta có biến định tính
với hai phạm trù, chẳng hạn Avà A, điều đó có nghĩa là một cá thể chỉ cóthể thuộc vào một trong 2 phạm trù A hoặc A mà thôi
Ví dụ : Biến giới tính (có 2 phạm trù là Nam và Nữ), biến chất lượng sản
phẩm (có 2 phạm trù là Chính phẩm và Phế phẩm), biến tình trạng kinh tếcủa hộ gia đình miền núi (có 2 phạm trù Hộ nghèo và Hộ không nghèo).v.v
+) Biến định tính có h phạm trù (h > 2, h∈N): Giả sử ta có biến định tính
với h phạm trù, chẳng hạn A1, A2, , Ah điều đó có nghĩa là một cá thể chỉ có thể thuộc vào một trong h phạm trù A1, A2, , Ah mà thôi
Ví dụ : Biến vùng – miền có các phạm trù (Bắc, Trung, Nam) hay (Thành
thị, Nông thôn, Miền núi), biến trình độ học vấn có các phạm trù (Thấthọc, Tốt nghiệp cấp 1, Tốt nghiệp cấp 2, Tốt nghiệp cấp 3).v.v.Như vậy
biến vùng – miền có h = 3, biến trình độ học vấn có h = 4.
Như vậy biến định tính có những đặc điểm sau
Ví dụ : Ta muốn xem xét thu nhập của người lao động Hà nội phụ thuộc
vào giới tính như thế nào ? hay nói khác đi, ta cần trả lời câu hỏi là: liệu có
sự khác nhau về thu nhập trung bình giữa lao động Nam và lao động Nữ ?
Đặt Y = (Thu nhập của người lao động Hà nội), u là yếu tố ngẫu nhiên
10
D
=
Nếu là lao động NữNếu là lao động Nam
Trang 38Biến D được đặt như trên được gọi là biến giả (Dummy variable)
2 Quy tắc đặt biến giả
Nhận xét
+) Biến giả chỉ nhận giá trị 0 hoặc 1
+) Bất kỳ cá thể nào của tổng thể, đều phải có giá trị của biến giả
+) Các biến giả phân chia tổng thể thành những phần riêng biệt ứng với cácphạm trù (trạng thái) của biến định tính
Do đó nếu biến định tính có h phạm trù A1, A2, , Ah thì ta đặt h – 1 biến
giả Phạm trù mà tất cả các biến giả nhận giá trị 0 được gọi là phạm trù cơ
sở, giá trị trung bình của biến phụ thuộc ứng với phạm trù cơ sở chính là hệ
số chặn β1 Các hệ số ứng với các biến giả cho biết mức chênh lệch củatrung bình biến phụ thuộc ứng với phạm trù đang xét so với giá trị trungbình của biến phụ thuộc ứng với phạm trù cơ sở
3 Mô hình có nhiều biến định tính
Để hiểu mô hình có nhiều biến định tính là biến độc lập, ta nghiên cứu tiếp
D
=
Nếu là lao động NữNếu là lao động Nam
2
10
Trang 39-) E Y D( / 1i =1,D2i = = +0) β β1 2 cho biết thu nhập trung bình của laođộng Nữ làm việc ở khu vực nhà nước
-) E Y D( / 1i =0,D2i = = +1) β β1 3 cho biết thu nhập trung bình của lao
động Nam làm việc ở khu vực tư nhân
-) E Y D( / 1i =1,D2i = = +1) β β β β1 2 + +3 4 cho biết thu nhập trung bìnhcủa lao động Nữ làm việc ở khu vực tư nhân
4 Mô hình có một biến độc lập là định lượng và một biến độc lập là định tính
Xét ví dụ
Gọi X = (Thu nhập của người lao động Hà nội)
Y = (Tiêu dùng của người lao động Hà nội)
10
-) Nếu ta xét mô hình Y i = +β β1 2D i +β3X i +u i thì mô hình này gọi là môhình có biến định tính (biến giả) tác động đến hệ số chặn
-) Nếu ta xét mô hình Y i = +β β1 3X i +β4(D X i* i)+u i thì mô hình nàygọi là mô hình có biến định tính (biến giả) tác động đến hệ số góc
-) Nếu ta xét mô hình Y i = +β β1 2D i +β3X i +β4(D X i * i)+u i thì mô hìnhnày gọi là mô hình có biến định tính (biến giả) tác động đến cả hệ số chặn
và hệ số góc
Để xem xét mối quan hệ giữa tiêu dùng và thu nhập của người lao động
Hà nội làm việc ở khu vực tư nhân và nhà nước có sự khác nhau haykhông, ta kiểm định cặp giả thuyết sau
(Sử dụng kiểm định thu hẹp hàm hồi quy để kiểm định cặp giả thuyết trên)
5 So sánh hai hồi quy