Giá trị cá biệt Yi xoay quanh : Hàm hồi quy mẫu SRF: SRF là ước lượng của PRF có các tính chất tuyến tính, là ước lượng của , và là ước lượng của và với là ước lượng của Phương pháp bìn
Trang 1HƯỚNG DẪN LÀM BÀI TẬP KINH TẾ LƯỢNG (P1)
Phần 1 này sẽ hướng dẫn bạn tập làm quen với công thức một cách chi tiết
để áp dụng cho cả những phần sau này.
Trước hết là công thức chương hai – hồi quy hai biến Trong phần bài tập
áp dụng bên dưới bạn sẽ sử dụng những công thức ở đây.
MÔ HÌNH HỒI QUY HAI BIẾN
gọi là hệ số hồi quy
Giá trị cá biệt Yi xoay quanh :
Hàm hồi quy mẫu SRF: (SRF là ước lượng của PRF có các tính chất tuyến tính,
là ước lượng của , và là ước lượng của và
với là ước lượng của
Phương pháp bình phương nhỏ nhất
càng nhỏ càng tốt
trong đó
1
2
3
4
Trang 25
5 giả thiết của PP ước lượng bình phương nhỏ nhất
GT1: biến giải thích là phi ngẫu nhiên
GT2: kỳ vọng yếu tố ngẫu nhiên bằng không:
GT3: phương sai thuần nhất:
GT4: không có sự tương quan giữa các Ui: Cov(Ui,Uj)=0
GT5: không có sự tương quan giữa Ui và Xi: Cov(Ui,Xi)=0
GT6: Ui có phân bố N(0, )
Tính chất:
1 Là ước lượng không chệch và có phương sai cực tiểu
2 Khi số quan sát đủ lớn thì ước lượng xấp xỉ với giá trị thực của phân bổ
3
4
5
6 Trong các ước lượng của bất kể là tuyến tính hay phi tuyến tính thì
có phương sai nhỏ nhất
Độ chính xác của các ước lượng bình phương nhỏ nhất
Trang 3Trong đó được ước lượng bằng ước lượng không chệch của nó là
và là độ lệch tiêu chuẩn của các giá trị Y quanh đường hồi quy mẫu
Định lý gauss-markov: các ước lượng bình phương nhỏ nhất là các ước lượng
tuyến tính, không chệch và có phương sai nhỏ nhất trong lớp các ước lượng tuyến tính không chệch
(có nghĩa là không có có thể sử dụng để tính toán)
Hệ số r 2 đo độ phù hợp của hàm hồi quy mẫu SRF
là tổng bình phương giá trị quan sát Yi với giá trị trung bình
là tổng bình phương tất
cả các sai lệch giữa giá trị biến phụ thuộc Y nhận được với giá trị trung bình của chúng nhằm đo độ chính xác của hàm hồi quy
tổng bình phương tất cả các sai lệch giữa giá trị quan sát Y và giá trị nhận được từ hàm hồi quy
TSS = ESS + RSS
r2 đo tỉ lệ phần trăm của toàn bộ sai lệch của Y với giá trị trung bình của chúng r2
được sử dụng để đo độ thích hợp của hàm hồi quy r là hệ số tương quan mẫu Tính chất:
-
- R có thể âm hoặc dương, dấu của r phụ thuộc vào dấu của tỷ số chính là dấu của Cov(X,Y), hay dấu của hệ số góc
-
- Tính chất đối xứng r(X,Y)=r(Y,X)
Trang 4- Nếu X*=aX+c ;Y*=bY+a với a,b,c,d là hằng số, a,b> thì r(X*,Y*)=r(X,Y)
- Nễu X,Y độc lập với nhau thì r(X,Y)=0 nhưng điều ngược lại không đúng
- r đo sự phụ thuộc tuyến tính nhưng không có ý nghĩa trong việc định rõ tính chất các quan hệ phi tuyến
- r đo sự phụ thuộc tuyến tính giữa X và Y vậy không đòi hỏi X,Y có quan
hệ nhân quả
Kiểm định giả thiết về các hệ số hồi quy – Khoảng tin cậy
Với giả thiết
Trong đó
1 khoảng tin cậy của β 1
với hệ số tin cậy 1-α ta có
và khoảng tin cậy 1-α của β1:
1.1 kiểm định giả thiết đối với β 1
|t| ˃
t ˃
t ˂
-2 khoảng tin cậy của β 2
với hệ số tin cậy 1-α ta có
và khoảng tin cậy 1-α của β2:
2.1 kiểm định giả thiết đối với β 2
|t| ˃
Trang 5Phải Β2 ≤ β2* Β2 ˃ β2*
t ˃
t ˂
-3 khoảng tin cậy của ϭ 2
ta có
Và khoảng tin cậy 1- α của ϭ2
3.1 kiểm định giả thiết đối với ϭ 2
Hai phía Phải trái
Kiểm định sự phù hợp của hàm hồi quy, phân tích hồi quy và phân tích
phương sai
Giả thiết :
Công thức :
Phân tích hồi quy và dự báo
Có 2 loại báo : - dự báo trung bình có điều kiện của Y với một giá trị Xo
- dự báo giá trị cá biệt của Y với X0
1 dự báo loại 1
khoảng tin cậy (1-α) của E(Y/X0) :
Phương sai giá trị trung bình:
Trang 62 dự báo loại 2
khoảng tin cậy của Y0 :
Phương sai giá trị cá biệt:
BÀI TẬP ÁP DỤNG Cho số liệu về năng suất (tạ/ha) của một loại giống cây trồng và mức phân bón (tạ/ha) cho loại cây này trong vòng 10 năm qua bảng số liệu như sau.
Thực tế thì năng suất phụ thuộc vào mức phân bón nên năng suất là biến phụ thuộc (Y) và phân bón là biến giải thích (X)
-12
17 x -12=204
37.0836 2.91642
A, lập mô hình hồi quy
Mục đích:
Trang 7Cần đi xác định
Vậy hàm hồi quy mẫu:
B, giải thích ý nghĩ kinh tế của hệ số nhận được
- thứ 1: hệ số mang ý nghĩa là nếu không dùng phân bón (X=0) thì năng suất trung bình đạt 27.1254 (tạ/ha)
- thứ 2: hệ số mang ý nghĩa là nếu tăng 1 tạ phân bón (X+1) thì năng suất tăng 1.6597 (tạ/ha)
- thứ 3: dấu của hệ số mang dấu dương chứng tỏ X tăng thì Y tăng điều này phù hợp với thực tế rằng tăng phân bón thì tăng năng suất
C, Tính độ lệch chuẩn của các
Giải quyết câu này là đi tính
Dựa vào bảng công thức trên thì những gì chúng ta còn thiếu là
Giờ làm lần lượt theo chiều mũi tên
-
-
-
Trang 8
=>
D, với mức ý nghĩa 5% hãy cho biết mức phân bón có ảnh hưởng tới năng suất không?
Giải quyết câu này là đi kiểm định xem phân bón có ảnh hưởng tới năng suất hay không? Nói cách khác là X có ảnh hưởng tới Y hay không? Ta cần kiểm định cặp giả thiết
Dùng chỉ tiêu kiểm định:
ở đây ta kiểm định chỉ tiêu (= và ≠) nên sẽ sử dụng
để tính t thì ta đã có:
để tính ta đã có:
=>
vậy ta kết luận lượng phân bón có ảnh hưởng tới năng suất của cây trồng
E, hãy tìm khoảng tin cậy 95% cho các hệ số hồi quy
Giải quyết câu này nghĩa là ta đi tìm khoảng tin cậy cho
Đơn thuần chỉ là áp dụng khoảng tin cậy ở bảng lý thuyết bên trên
mức ý nghĩa là α thì khoảng tin cậy sẽ là 1-α
Trang 9Chỉ tiêu kiểm định
Khoảng tin cậy 1-α của hệ số hồi quy
Như vậy:
khoảng tin cậy của beta 1:
=>
=> 22.5611 < β1 < 31.6897
tương tự với beta 2:
=> 1.4256 < β2 < 1.8938
F, hãy tính và giải thích ý nghĩa của kết quả nhận được
Để giải quyết câu này thì chỉ cần áp dụng công thức tính r2 ở bảng công thức phía trên
Những gì chúng ta thiếu là RSS và TSS
để tính RSS chúng ta có ei2
để tính TSS chúng ta có yi2
Nhận xét ý nghĩa: X giải thích xấp xỉ r 2 (%) sự biến thiên của Y
Lượng phân bón giải thích xấp xỉ 97,10% lượng biến thiên năng suất
Ngoài ra ta cũng có cách tính r2 thứ 2 theo công thức
G, với mức phân bón 20 tạ/ha hãy dự báo giá trị trung bình và giá trị cá biệt của năng suất với hệ số tin cậy 95%
Giải quyết câu này là đi tìm khoảng tin cậy cho
dự báo trung bình:
dự báo cá biệt:
Trang 10Những cái chúng ta có n=10, Xo=20, α=0.05(1-độ tin cậy),
,
Dự báo giá trị trung bình năng suất cây trồng
chỉ tiêu:
khoảng tin cậy 95%:
60.3194 – 2.306x0.7952 ≤ E(Y/X 0 ) ≤ 60.3194 + 2.306x0.7952 58.4857 ≤ E(Y/X 0 ) ≤ 62.1531
Dự báo giá trị cá biệt
chỉ tiêu:
khoảng tin cậy 95%:
60.3194 – 2.306x2.5584 ≤ Y0 ≤ 60.3194 + 2.306x2.5584
54.4198 ≤ Y0 ≤ 66.2191
H, Trình bày vào MFIT 3
Ordinary Least Squares Estimation
******************************************************************
********************************************************
Dependent variable is Y
(biến phụ thuộc là Y)
10 observations used for estimation from 1 to 10
(số lượng quan sát ở bài này quan sát trong 10 năm)
******************************************************************
********************************************************
Regerssor Coefficient Standard Error T-Ratio [prob]
(biến độc lập) (hệ số) (sai số chuẩn se)
INPT 27.1250 1.9793
(tên thường dùng cho biến độc lập) (
X 1.6597 0.1013
Trang 11(biến giải thích)
******************************************************************
********************************************************
R-Squared 0.97105 F-statistic
(hệ số r 2 ) (kiểm định F)
R-Bar-Squared S.E of Regression 2.4317
(hệ số ) (sai số tiêu chuẩn đường hồi quy )
Residual Sum of Squares 47.3056 Mean of Dependent Variable 57
(giá trị RSS) (giá trị trung bình của Y)
S.D.of Dependent Variable
(độ lệch tiêu chuẩn biến phụ thuộc
Maximum of long-likelihood
(giá trị logarit của hàm hợp lý)
DW-statistic
(thống kê Durbin-Watson)
HƯỚNG DẪN LÀM BÀI TẬP KINH TẾ LƯỢNG (P2)
Nối tiếp hồi quy đơn là hồi quy bội ở phần 2 này việc giải bài tập hướng dẫn
sẽ mang tính định hướng ngắn gọn là chính chứ không trình bày cụ thể như ở phần 1 bởi việc áp dụng công thức, khi nào áp dụng công thức nào không có khác nhiều so với hồi quy đơn.
Tổng hợp công thức chương 3 – hồi quy bội
;
; ; ; ;
Trang 12Hệ số xác định bội R
Hệ số xác định bội đã hiệu chỉnh :
Hệ số tương quan X 2 và X 3 :
Hệ số tương quan:
;
Kiểm định hệ số hồi quy:
- Khoảng tin cậy:
- Nếu
- Nếu
Kiểm định F(kiểm định loại ít nhất 1)
*không có điều kiện:
Nếu
*có điều kiện ràng buộc:
Nếu
*Nếu biến phụ thuộc Y thay đổi thì dùng điều kiện:
Kiểm định
Trang 13
Miền bác bỏ
- Hai phía
- Phía phải:
- Phía phải:
Dự báo giá trị trung bình
Chỉ tiêu :
Khoảng tin cậy
Dự báo giá trị cá biệt
Chỉ tiêu:
Khoảng tin cậy
BÀI TẬP ÁP DỤNG
Cho mức sản lượng (tạ/ha), lượng phân bón (tạ/ha), lượng thuốc trừ sâu (tạ/ha) trong 10 năm bằng bảng sau:
Trang 14Nhắc lại kiến thức:
chữ i trong những công thức trên chỉ mang ý nghĩa là y nào thì tương ứng với x đó (y đầu tiên thì sử dụng x2, x3 đầu tiên, y thứ 2 thì dùng x2, x3 thứ 2…
A, ước lượng mô hình
Hướng dẫn: mô hình hồi quy mẫu
Bằng công thức ở trên tìm được kết quả
B, giải thích ý nghĩa hệ số hồi quy
Trang 15Hướng dẫn: chỉ ra 3 điều
-
- Con số
- Con số
C, phân bón và thuốc trừ sâu có ảnh hưởng tới năng suất hay không ? cho α=5%
Hướng dẫn : kiểm định các hệ số của phân bón và thuốc trừ sâu là Nếu
thì là không ảnh hưởng, còn ngược lại thì có ảnh hưởng Bởi vậy ta
sẽ có 2 kiểm định bằng :
Áp dụng công thức ở trên ta có kết quả
-
-
-
D, tìm khoảng tin cậy cho các hệ số hồi quy
Hướng dẫn: câu này chỉ đơn thuần là áp dụng công thức Nhưng để khỏi mất công nhớ thêm công thức này thì bạn có thể áp dụng mẹo sau
Áp dụng công thức ta có kết quả
-
-
E, giải thích ý nghĩa của R 2
Hướng dẫn: tính chỉ tiêu R2 sau nêu ra ý nghĩa của con số đó
Áp dụng công thức ta có kết quả
Trang 16F, ‘cả’ phân bón và thuốc trừ sâu đều không ảnh hưởng tới năng suất
Hướng dẫn: câu này khác với câu C ở chỗ đều không do đó phải kiểm định
Lý do dùng R2 ở đây là bởi tính chất của R2: 0 ≤ R2 ≤ 1: nếu bằng không thì mô hình không giải thích được % nào sự phụ thuộc của Y vào X nếu (R2>0) thì dù nhiểu dù ít Y cũng có sự thay đổi theo một trong hai X hoặc cả hai X
Áp dụng công thức ta có kết quả
G, có thể bỏ X3 ra khỏi mô hình không?
Hướng dẫn: ở đây chính là đi xem mô hình có cả X2,X3 và mô hình sau khi loại X3 bằng kiểm định
Vì sao lại dùng F có ràng buộc thì cần chú thích nội dung chỉ tiêu F như sau:
Áp dụng công thức ta có kết quả