4 HAU- QUA CUA BA CONG TUYEN

Một phần của tài liệu Giáo trình kinh tế lượng phần 1 (Trang 162 - 166)

Cần phải nói ngay rằng, trừ trường hợp hoàn hảo, đa cộng tuyến hoàn toàn không vi phạm gì tới các giả thuyết cơ bản từ A1 đến A6 của mô hình hồi quy tuyến tính [xem Chương II]. Vì 4 ‘Tire la ta ding cong thic: ESS = (1—- R°YTSS . 3

3 _ Như thông lệ, Syy, = xer — x3) là phương sai mẫu của biến 1.

150

vậy, mọi tính chất tốt của hồi quy tuyến tính, được phát biểu bởi

định lý Gauss-Matkov, đều được bảo toàn. Cụ thể là tính không chệch và hiệu quả của ước lượng. Và các thống kê /-s/af va F- stat, được xây dựng dựa trên các giả thuyết Al — A6, van có giá

trị cho việc kiếm định những giả thuyết, liên quan tới các tham số của tổng thể. Không một kết luận gì về hồi quy /Š bị ảnh

hưởng bởi sự hiện diện của đa cộng tuyến. Thậm chí ngay cả chất lượng dự báo của mô hình, trong nhiều trường hợp, cũng không bị ảnh hướng. Chẳng hạn như trong ví dụ ghi ở Bảng 6.1.

Ta dễ dàng nhận thấy rằng, mặc đù hệ số ước lượng bị đao động

rất mạnh khi bỏ bớt biến PỉP hoặc GNP. Nhưng hệ số đo lường

chất luong dy bdo, RMSE và MAE, trong cả 3 mô hình A, B va C gần như không thay đổi.

Như đã nêu, sự phiền toái của đa cộng tuyến đến từ chính bản chất của nó. Đó là sự tương quan quá cao giữa các biến giải thích, làm khó khăn cho việc điễn giải tác động riêng phần của từng yếu tế lên biến được giải thích. Để thấy rõ điều này, chúng

ta hãy xét thêm ví dụ sau. ,

Vi du 6.2: Tiéu ding hé gia dinh 6 My.

Klein va Goldberger (1955) ding dét ligu thống kê vé chi tiêu hộ gia đình: C; tiền hrơng: W; thu nhập từ làm nông nghiệp:

4; và các khoản thu nhập khác, không phải từ nông trại và tiền lương: P. Chuỗi thời gian này được ghỉ từ năm 1928 đến 1950.

Giai đoạn 1942 — 1944 bị loại bỏ do đó là thời kỳ thé chiến. Các tác giả muốn nghiên cứu mối quan hệ giữa tiêu dùng tổng gộp với các thành phần của tổng thu nhập; mà chúng biến động rất sát nhau do quan hệ liên ngành. Vì vậy, ta kỳ vọng rằng đây là một ví dụ tốt để nghiên cứu tác động của đa cộng tuyến.

Mô hình hồi quy được đưa ra bởi Klein và Goldbeger như sau:

C, =8 + 0, + BP + BA, +8, (6.15)

Các kết quả ước lượng được tóm tắt dưới đây:

151

Bảng 6.3a. Biển được giải thích: Tiêu đàng C, giai đoạn 1928- 1950

Variable

Coefficient Std. Error +t-Statistic Prob.

Constant 8.132839 8.921104 0911640 0.3755 w 1.058783 0.173579 6.099719 0.0000 P 9452244 0.655757 0.689652 0.5003 A 0.121150 1.087042 0.111449 0.9126

Bảng 6.3b. Biến được giải thích: Tiêu ding C, giai đoạn 1928-1948

Variable Coefficient. Std. Error t-Statistic Prob.

Constant 22.98535 9.028852 2.545767 0.0233 wW 0.631291 0.202721 3.114082 0.0076 P 0.051176 0.567543 0.090171. 0.9294 A 2.640910 1.236690 2.135467 0.0509

Trong Bang 6.3a, biéu hiện của đa cộng tuyén là rất rõ. Hệ số đi với thu nhập bằng luong W là quá lớn, bằng 1. 058. Tức là cứ 1$ tang thém về tiền lương dẫn đến sự tăng thêm về tiêu dùng hơn 18. Tiếp theo, hệ số ước lượng đi kèm với thu nhập từ nông trại 4 và các thu nhập khác P là không có ý nghĩa, cho dù về mặt lý thuyết, chúng đáng ra phải hết sức quan trọng trong việc giải thích cho hành vi tiêu dùng. Cuối cùng, hãy so sánh hai kết quả ước lượng 6 6.3a va 6. 3b. Bang sau chỉ khác trước là việc ước lượng bỏ đi hai quan sát cuối cùng. Nhưng chỉ có đó thôi ¡ cũng đủ tạo ra đao động rất mạnh của các hệ SỐ ước hượng. Hệ số đi kèm với A tăng tới 220%, thể hiện tính ấn định rất thấp của hồi quy.

Dưới đây chúng ta tổng kết lại những biểu hiện của đa cộng tuyến:

1. Thay đổi nhỏ: về dữ liệu có thể đẫn đến sự dao động rất manh

“Của các hộ số ữữc › lượng.

2. Các hệ số ước lượng thường có sai số (standard error) rất lớn và có mức ý nghĩa rất thấp, bất kể rằng, một cách đồng thời, chúng lại có ý nghĩa.

3. Các hệ số ước lượng có thể đi kèm với đấu sai, hoặc với giá trị ở mức không thế chấp nhận được. Điều đó làm cho việc giải thích các tác động riêng phần của từng nhân tố trở nên khó khăn.

152

5. MỘT SỐ GIẢI PHÁP

Nếu cá nhân nhà nghiên cứu không quan tâm tới việc diễn.

giải ý nghĩa của từng biến, mà chỉ tới độ chính xác của dự báo;

thì đa cộng tuyến không hẳn là một sự phiền toái. Như ở ví dụ

6.1, vì POP và GNP, một cách đồng thời, là có ý nphĩa, nên việc

giữ chúng lại sẽ làm cải thiện độ chính xác của ước lượng. Thể hiện bởi hệ số #A⁄SE trong mô hình C là thấp nhất trong cả 3 mô

hình. Thêm vào đó, như đã nêu ở mục IV.ó, Chương IV, việc

loại bỏ cặp biến có ý nghĩa khỏi mô hình sẽ làm các kiểm định .

thống kê trở nên vô giá trị. Chính vì vậy, đôi khi, vì đòi hỏi về tinh đích thực của cả lý thuyết và thực tiễn, ta phải “phớt lờ” vấn đề đa cộng tuyến.

Tuy nhiên, khi việc diễn giải ý nghĩa của các hệ số hồi quy

hay tác động riêng phần trở nên quan trọng, thì đa cộng tuyến cần phải được xử lý. Một trong các giải pháp đơn giản nhất là tăng số quan sát Cụ thể, hãy nhìn vào thức (6.14):

œ7

q—®#?)s *:*⁄;

Var 8, = „ Rõ ràng rằng, nếu ta có thể tăng dữ liệu quan sát sao cho biên độ dao động của Ä; là 5 4x, ting lên, thì dĩ nhiên là độ chính xác của ước lượng sẽ được cải thiện [Var By) giảm], bat kể có sự hiện điện của đa cộng tuyến.

Cuối cùng, hãy biến mình thành nhà thử nghiệm mô hình

trong “phòng Lab”. Cu thé la hay thử nghiệm các cách tiếp cận khác nhau, cho phép giảm nhẹ vân đề đa cộng tuyên. Như trong ví dụ 6.1, chúng ta có thê thử làm mô hình sau:

HOUSING: = 2.079 + 0.936. GNF — 0.698INTRATE

POP POP

(0.62) (2.55) (-3.75)

Rõ ràng, đa cộng tuyến không biến mất nhưng được cải thiện rõ rệt.

153

Một phần của tài liệu Giáo trình kinh tế lượng phần 1 (Trang 162 - 166)

Tải bản đầy đủ (PDF)

(168 trang)