CHƯƠNG 3: PHƯƠNG PHÁP NGHIÊN CỨU
3.1 Thiết kế nghiên cứu
3.2.3 Phương pháp ước lượng
123doc.vn
Với đặc tính của dữ liệu bảng cho các kết quả ước lượng các của tham số trong mô hình tin cậy hơn vì sự biến động trong dữ liệu bảng là nhiều nên làm độ chính xác của các ước lượng càng cao. Đồng thời dữ liệu bảng khắc phục được các vấn đề không đồng nhất của các cá thể quan sát (individual heterogeneity), giảm thiểu những vấn đề về đa cộng tuyến và ước lượng thiên lệch, chỉ rõ được mối quan hệ thay đổi theo thời gian (time-varying relationship) giữa biến độc lập và biến phụ thuộc (Hsiao, 2014). Vì những ưu điểm vượt trội của dữ liệu bảng hơn dữ liệu chéo và dữ liệu chuỗi thời gian nên tác giả lựa chọn mô hình ước lượng dựa trên dữ liệu bảng.
Các mô hình hồi quy dữ liệu bảng thường được sử dụng trong dữ liệu bảng bao gồm mô hình bình phương nhỏ nhất gộp (pooled OLS), mô hình tác động cố định (fixed effects model – FEM) và mô hình tác động ngẫu nhiên (random effects model – REM). Bên cạnh đó, mô hình GLS được dùng để khắc phục các lỗi của mô hình FEM và REM.
Mô hình OLS gộp thực chất là mô hình OLS thông thường, điều này xảy ra khi sử dụng dữ liệu bảng nhưng không phân biệt theo thời gian và theo đối tượng như vậy hồi quy mô hình OLS gộp chính là mô hình OLS thông thường. Nếu dữ liệu phù hợp với mô hình OLS gộp hơn hai mô hình FEM và REM thì chúng ta không cần phân tích mô hình FEM và REM nữa mà chỉ cần xem xét mô hình OLS gộp cho dữ liệu thu thập được và thực hiện các kiểm định cho mô hình OLS thông thường.
Theo Gujarati (2008), để các tham số trong ước lượng OLS không bị sai lệch, mô hình cần phải thỏa mãn các giả như sau:
Giả định về phân bố chuẩn (Normality): Sai số có phân bố chuẩn
𝜺𝒊 = 𝑵(,𝜺 ) Giả định phương sai sai số đồng nhất (Homocedasticity):
Phương sai các sai số ngẫu nhiên là không đổi. 𝟐 =𝟐 Giả định về quan hệ độc lập giữa các biến phụ thuộc: Các 𝒄𝒐𝒗(𝑿𝒊, 𝑿𝒋) = 𝟎
123doc.vn
biến phụ thuộc không được quan hệ cộng tuyến hoàn toàn với nhau
Giả định về sự độc lập của sai số (Serial correlation): Các sai số không có tương quan với nhau
𝒄𝒐𝒗(𝑼𝒊, 𝑼𝒋) = 𝟎
Giả định về về sự độc lập giữa biến phụ thuộc và sai số:
Không có sự tương quan giữa x và u 𝒄𝒐𝒗(𝑿𝒊, 𝑼𝒋) = 𝟎 Giả định về quan hệ tuyến tính (Linearity): Quan hệ giữa x
và y là tuyến tính
Các giả định trên sẽ được kiểm định bằng các công cụ trên Stata 13 cho dữ liệu bảng.
Bảng 3.1. Kiểm định giả thiết cho OLS
Giả định Công cụ kiểm định (Stata 13) Sai số có phân phối chuẩn Kdensity, Skewness, Kurtosis Phương sai các sai số ngẫu nhiên là không đổi Breusch-Pagan test
Đa cộng tuyến VIF (collin)
Các sai số không có tương quan với nhau Wooldridge test (xtserial) Để khắc phục khuyết tật trong mô hình hồi quy OLS gộp bài nghiên cứu sử dụng hai phương pháp ước lượng đặc trưng cho dữ liệu bảng là FEM và REM (Greene, 2007).
Mô hình tác động cố định (FEM) là mô hình sử dụng nhân tố cố định để xem xét sự ảnh hưởng của nó đến mô hình, có thể được xem giống như mô hình OLS sử dụng biến giả, các biến giả đóng vai trò cố định: cố định các đơn vị chéo, cố định thời gian hoặc cố định cả 2 nhân tố. Mô hình FEM phù hợp trong những trường hợp mà tung độ gốc của từng cá nhân có thể tương quan với một hay nhiều biến độc lập.
Nhược điểm của mô hình này là nó làm giảm bậc tự do của dữ liệu đi rất nhiều và vì có quá nhiều biến nên nguy cơ đa cộng tuyến sẽ tăng.
Khi tiếp cận theo ý tưởng rằng sự khác biệt về các điều kiện đặc thù của các
123doc.vn
đơn vị chéo được chứa đựng trong phần sai số ngẫu nhiên, nó được thể hiện trong mô hình tác động ngẫu nhiên. Mô hình tác động ngẫu nhiên (REM) là mô hình xem xét đến các khác biệt của riêng các cá thể quan sát qua thời gian ảnh hưởng đến mô hình nghiên cứu. Do đó, tự tương quan là một vấn đề cần phải giải quyết khi áp dụng mô hình này, tuy nhiên vấn đề phương sai sai số thay đổi lại có thể được loại bỏ tốt hơn so với các mô hình khác.
Để lựa chọn xem mô hình nào phù hợp với dữ liệu nghiên cứu thì bài luận đi thực hiện các kiểm định.
✓ Kiểm định F-test được dùng để lựa chọn xem mô hình tác động cố định FEM có hoạt động tốt hơn so với mô hình OLS gộp hay không.
H0: Mô hình OLS tốt hơn mô hình FEM
H1: Mô hình OLS không tốt bằng mô hình FEM
Nếu giá trị, Pvalue < 0.05 = > Mô hình FEM là tốt hơn và ngược lại.
✓ Dùng kiểm định Breusch-Pagan test để lựa chọn xem mô hình tác động ngẫu nhiên (REM) có tốt hơn so với mô hình Pooled OLS hay không.
H0: Mô hình OLS tốt hơn mô hình REM
H1: Mô hình OLS không tốt bằng mô hình REM
Nếu giá trị, P-value < 0.05 = > Mô hình REM tốt hơn và ngược lại
✓ Dùng kiểm định Hausman test để lựa chọn mô hình tác động cố định FEM và mô hình tác động ngẫu nhiên REM chúng ta sử dụng.
H0: Mô hình REM tốt hơn mô hình FEM
H1: Mô hình REM không tốt bằng mô hình FEM
Nếu giá trị, P-value > 0.05 => Mô hình REM tốt hơn và ngược lại
Sau khi lựa chọn được mô hình hồi quy với dữ liệu bảng phù hợp sẽ được thực hiện các kiểm định giả thuyết bằng các câu lệnh trong phần mềm Stata 13 như sau:
✓ Hiện tượng đa cộng tuyến (multicollinearity)
123doc.vn
Để kiểm định hiện tượng đa cộng tuyến, chỉ số thường dùng là hệ số phóng đại phương sai VIF (Variance Inflation Factor). Để tính VIF luận văn sử dụng giá trị phóng đại phương sai VIFj của các biến độc lập trong mô hình, nếu toàn bộ các VIFj <10 thì kết luận không có hiện tượng đa cộng tuyến giữa các biến độc lập trong mô hình và ngược lại.
✓ Hiện tượng phương sai sai số thay đổi (heterokedascity)
Để kiểm định phương sai thay đổi bài luận sử dụng kiểm định xttest0 với mô hình tác động ngẫu nhiên (REM), và kiểm định xttest3 với mô hình tác động cố định (FEM) cùng chung hai giả thuyết kiểm định là:
H0: Không có hiện tượng phương sai thay đổi H1: Có hiện tượng phương sai thay đổi.
Nếu P-value > 5% chấp nhận H0. Kết luận mô hình hồi quy không có hiện tượng phương sai thay đổi. Ngược lại nếu P-value < 5% thì mô hình có hiện tượng phương sai thay đổi.
✓ Tự tương quan của mô hình (autocorrelation)
Để kiểm định tự tương của các biến trong mô hình ta dùng xtserial để thực hiện.
H0: Không có hiện tượng tự tương quan H1: Có hiện tượng tự tương quan
Nếu P-value > 5% chấp nhận H0. Kết luận mô hình hồi quy không xảy ra hiện tượng tự tương quan. Còn khi P-value < 5% chấp nhận H1 mô hình hồi quy có hiện tượng tự tương quan.
123doc.vn
Bảng 3.2. Kiểm định giả thuyết cho mô hình FEM và REM
Kiểm định Câu lệnh FEM Câu lệnh REM
Phương sai sai số thay đổi (heterokedascity)
xttest3
p-value< 0.05:
bác bỏ Ho, có pssstđ
xttest0
p-value<0.05:
bác bỏ Ho, có pssstđ
Tự tương quan (autocorrelation)
xtserial y x
p-value< 0.05:
bác bỏ Ho, có tương quan
chuỗi
xtserial y x
p-value<0.05:
bác bỏ Ho, có tương quan
chuỗi Đa cộng tuyến
(multicollinearity)
collin y x VIF<10: không
bị đa cộng tuyến collin y x
VIF<10: không bị đa cộng
tuyến (Nguồn: Tác giả tự tổng hợp) Mô hình ước lượng REM và FEM có thể khắc phục được một số nhược điểm của OLS nhưng thực tế cho thấy phương pháp ước lượng này vẫn chưa giải quyết được một số hiện tượng vi phạm giả thiết khiến cho ước lượng kém chính xác: (1) phương sai sai số thay đổi, (2) tự tương quan. Vấn đề này được khắc phục thông qua sử dụng mô hình hồi quy FGLS (Generalized Least Squares).