21 Bảng 3.2.1 Kết quả mô phỏng ước lượng sai số chuẩn theo Fama-Macbeth với hiệu ứng thời gian trong dữ liệu .... 27 Bảng 4.2.1 Kết quả mô phỏng ước lượng sai số chuẩn theo Fama-Macbeth
Trang 1BỘ GIÁO DỤC ĐÀO TẠO TRƯỜNG ĐẠI HỌC KINH TẾ THÀNH PHỐ HỒ CHÍ MINH
Trang 2BỘ GIÁO DỤC ĐÀO TẠO TRƯỜNG ĐẠI HỌC KINH TẾ THÀNH PHỐ HỒ CHÍ MINH
NGUYỄN TRỌNG Ý ƯỚC LƯỢNG SAI SỐ CHUẨN TRONG MÔ HÌNH TÀI CHÍNH VỚI DỮ LIỆU BẢNG: SO SÁNH CÁC
PHƯƠNG PHÁP
Chuyên ngành : Tài Chính Ngân Hàng
Mã số: 60340201 LUẬN VĂN THẠC SĨ KINH TẾ
NGƯỜI HƯỚNG DẪN KHOA HỌC: GS.TS TRẦN NGỌC THƠ
Thành phố Hồ Chí Minh -2014
Trang 3LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi Các số liệu và kết quả nghiên cứu trong luận văn này là trung thực và không trùng lặp với các đề tài khác
Trang 4MỤC LỤC Trang phụ bìa
Lời cam đoan
Mục lục
Danh mục bảng
Danh mục hình
Tóm tắt 1
Chương 1 Giới thiệu chung 1
Chương 2 Ước lượng mô hình trong điều kiện hiệu ứng công ty cố định 4
2.1 Các ước lượng sai số chuẩn vững (robust standard error estimates) 4
2.2 Kiểm định các ước lượng sai số chuẩn bằng mô phỏng 8
2.3 Sai số chuẩn theo phương pháp Fama-Macbeth 11
2.4 Mô phỏng ước lượng sai số chuẩn Fama-Macbeth 13
2.5 Các sai số chuẩn Newey-West 17
Chương 3 Ước lượng sai số chuẩn trong điều kiện hiệu ứng thời gian 19
3.1 Các ước lượng sai số chuẩn vững 20
3.2 Các ước lượng Fama-Macbeth 23
Chương 4 Ước lượng sai số chuẩn trong điều kiện cả hiệu ứng công ty và hiệu ứng thời gian 26
4.1 Sai số chuẩn ước lượng theo Rogers 26
4.2 Ước lượng Fama-Macbeth 29
Chương 5 Ước lượng sai số chuẩn trong điều kiện hiệu ứng công ty tạm thời 31
5.1 Hiệu ứng công ty tạm thời : định dạng cấu trúc dữ liệu 31
5.2 Hiệu ứng cố định- biến giả công ty (Fixed Effects-Firm Dummies) 33
5.3 Sai số chuẩn Fama-Macbeth hiệu chỉnh 35
Chương 6 Ứng dụng thực nghiệm 40
Trang 56.1 Ứng dụng trong định giá tài sản 41 6.2 Ứng dụng trong Tài Chính Doanh Nghiệp 45 Chương 7 Mô hình định giá tài sản dựa trên dữ liệu Việt Nam 50 7.1 Phân tích so sánh tổng quát giữa sai số chuẩn ước lượng theo phương pháp White và phương pháp Rogers (phân nhóm) 50 7.2 Mô hình hồi quy trên dữ liệu thực 54 Chương 8 Kết luận 62
Trang 6DANH MỤC BẢNG
Bảng 2.2.1 Kết quả mô phỏng ước lượng sai số chuẩn OLS và Rogers trong trường hợp tồn tại hiệu ứng công ty trong dữ liệu 9 Bảng 2.4.1 Kết quả mô phỏng ước lượng sai số chuẩn theo Fama-Macbeth với hiệu ứng công ty trong dữ liệu 15 Bảng 3.1.1 : Kết quả mô phỏng ước lượng sai số chuẩn OLS và Rogers trong trường hợp tồn tại hiệu ứng công ty trong dữ liệu 21 Bảng 3.2.1 Kết quả mô phỏng ước lượng sai số chuẩn theo Fama-Macbeth với hiệu ứng thời gian trong dữ liệu 24 Bảng 4.1.1 Kết quả mô phỏng ước lượng sai số chuẩn OLS và Rogers trong trường hợp tồn tại đồng thời hiệu ứng công ty và thời gian trong dữ liệu 27 Bảng 4.2.1 Kết quả mô phỏng ước lượng sai số chuẩn theo Fama-Macbeth với tồn tại đồng thời hiệu ứng công ty và thời gian trong dữ liệu 30 Bảng 5.2.1 Ước lượng sai số chuẩn với hiệu ứng công ty không cố định
Sai số chuẩn OLS và Rogers 33 Bảng 5.3.1 Ước lượng sai số chuẩn với hiệu ứng công ty không cố định
Sai số chuẩn Fama-Macbeth
36 Bảng 6.1.1 Ứng dụng định giá tài sản 42 Bảng 6.2.1 Ứng dụng tài chính doanh nghiệp- Hồi quy cấu trúc vốn
47
Trang 7Bảng 7.2.1 Thống kê mô tả dữ liệu nghiên cứu 55 Bảng 7.2.2 Kết quả ƣớc lƣợng mô hình định giá tài sản với dữ liệu Việt Nam 56
Trang 8DANH MỤC HÌNH
Hình 2.1.1 Ma trận phương sai - hiệp phương sai của phần dư 7 Hình 3.1.1 Sai số chuẩn đúng và sai số chuẩn Rogers khi số lượng nhóm (số năm ) thay đổi 23 Hình 5.1.1 Hệ số tương quan giữa phần dư khi thay đổi hiệu ứng công ty cố định (ρ) và
hệ số tự tương quan bậc 1 (ϕ) 32 Hình 7.1.1 Ma trận phương sai - hiệp phương sai ước lượng theo phương pháp White 51 Hình 7.1.2 Ma trận phương sai- hiệp phương sai ước lượng theo phương pháp Rogers phân nhóm theo công ty 53
Trang 9Ước Lượng Sai Số Chuẩn Trong Mô Hình Tài Chính Với Dữ Liệu Bảng: So Sánh Các
Phương Pháp
Tóm tắt
Trong nghiên cứu thực nghiệm định giá tài sản và tài chính doanh nghiệp, các nhà nghiên cứu thường xuyên đối mặt với dữ liệu bảng Trong các dữ liệu bảng này, các phần dư có thể tương quan giữa các công ty hoặc tương quan giữa các thời kỳ, và
do đó các sai số chuẩn theo OLS có thể bị chệch Trong lịch sử, có hai hướng nghiên cứu sử dụng các phương pháp khác nhau để giải quyết vấn đề này Nghiên cứu về tài chính doanh nghiệp dựa vào sai số chuẩn của Rogers, trong khi đó mô hình định giá tài sản sử dụng phương pháp Fama-Macbeth để ước lượng sai số chuẩn Bài nghiên cứu này tìm hiểu các phương pháp khác nhau được sử dụng trước đây và lý giải khi nào các phương pháp khác nhau này thu được cùng một sai số chuẩn( giá trị đúng) và khi nào chúng cho ra các kết quả khác nhau Ý định của bài nghiên cứu nay là nhằm cung cấp các kiến thức nền tảng để lý giải tại sao các phương pháp khác nhau đôi khi lại cho ra các kết quả nghiên cứu khác nhau và hướng dẫn trong việc sử dụng các phương pháp này
Chương 1 Giới thiệu chung
Chúng ta đều biết rằng các sai số chuẩn theo OLS chỉ đúng khi các phần dư có phân phối độc lập và đồng nhất Khi các phần dư giữa các quan sát tương quan với nhau, sai số chuẩn theo OLS sẽ bị chệch (biased) và nó sẽ ước lượng cao hơn hoặc thấp hơn mức biến động thực của tham số ước lượng Mặc dù việc sử dụng các dữ liệu bảng
đã khá phổ biến, cách thức mà các nhà nghiên cứu sử dụng để giải quyết vấn đề sai số ước lượng bị chệch cũng khá đa dạng Trong các nghiên cứu về tài chính có ước lượng
dữ liệu bảng mà được xuất bản gần đây, 45% không báo cáo việc điều chỉnh sai số chuẩn khi các phần dư phụ thuộc lẫn nhau Trong số các nghiên cứu còn lại, những phương pháp để ước lượng tham số cũng như sai số chuẩn trong trường hợp tương
Trang 10quan trong nhóm (cluster) cũng đa dạng 31% các bài nghiên cứu này sử dụng biến giả cho mỗi nhóm 34% ước lượng cả tham số lẫn sai số chuẩn sử dụng phương pháp Fama-Macbeth Hai phương pháp còn lại sử dụng OLS để ước lượng tham số nhưng có điều chỉnh sai số chuẩn trong tình huống tương quan trong nhóm 7% trong số này sử dụng phương pháp điều chỉnh sai số chuẩn bằng Newey-West (Newey-West, 1987) trong khi 22% sử dụng sai số chuẩn Rogers (Williams, 2000, Rogers, 1993, Moulton,
1990, Moulton, 1986) đó chính sai số chuẩn White được điều chỉnh để tính tới trường hợp tương quan trong nhóm Các sai số chuẩn này còn được gọi là sai số chuẩn được phân theo nhóm
Mặc dù các nghiên cứu trước đó đã đưa ra rất nhiều phương pháp để ước lượng sai số chuẩn trong dữ liệu bảng nhưng nó cung cấp rất ít hướng dẫn cho những nhà nghiên cứu để xem xét khi nào thì phương pháp họ đang sử dụng là hợp lý Bởi vì các phương pháp này đôi khi lại cho ra kết quả ước lượng khác nhau nên việc hiểu được làm cách nào để so sánh giữa các phương pháp với nhau hết sức quan trọng Ngoài ra, các nhà nghiên cứu cũng cần phải hiểu được khi nào các phương pháp này sẽ cho ra các ước lượng sai số chuẩn khác nhau và khi nào chúng lý giải việc lựa chọn các ước lượng là khác nhau Đây là mục tiêu của bài nghiên cứu này
Có hai hình thức phụ thuộc rất phổ biến trong ứng dụng tài chính Hai hình thức này sẽ đóng vai trò nền tảng cho việc phân tích trong bài nghiên cứu Các phần dư ước lượng
có thể tương quan giữa các đơn vị chéo (quan sát giữa các năm khác nhau của một công ty bị tương quan) Trong bài nghiên cứu này, chúng ta gọi nó là hiệu ứng công ty (firm effect) Ngoài ra, phần dư của một năm bất kỳ có thể bị tương quan giữa các công
ty, nó được gọi là hiệu ứng thời gian (time effect) Bài nghiên cứu sẽ xem xét kết quả
mô phỏng dữ liệu bảng trong cả hai hình thức phụ thuộc trên, đầu tiên sẽ thực hiện riêng rẽ sau đó sẽ thực hiện đồng thời cả hai hiệu ứng Với dữ liệu được mô phỏng đó,
ta có thể ước lượng các tham số và độ lệch chuẩn sử dụng các phương pháp và so sánh
Trang 11kết quả với nhau Trong phần II của bài nghiên cứu, chúng ta sẽ tìm hiểu các phương pháp ước lượng sai số chuẩn trong điều kiện có hiệu ứng tác động cố định (fixed effect) Các sai số ước lượng theo OLS và Fama-Macbeth đều bị chệnh dưới và độ lớn của nó sẽ tăng lên khi hiệu ứng công ty gia tăng Sai số chuẩn Rogers không bị chệch bởi đã tính đến sự phụ thuộc do hiệu ứng công ty Các sai số chuẩn theo Newey- West được điều chỉnh cho dữ liệu dạng bảng tuy cũng bị chệch nhưng mức độ rất nhỏ
Trong phần III, một phân tích tương tự sẽ được thực hiện nhưng thay vì phân tích hiệu ứng công ty thì phần này phân tích hiệu ứng thời gian Bởi vì phương pháp Fama-Macbeth được thiết kế để xử lý hiệu ứng thời gian nên các sai số chuẩn của các tham
số ước lượng theo phương pháp này sẽ không chệch là tương đối hiệu quả hơn so với ước lượng OLS Những suy đoán ban đầu trong hai phần đầu sẽ được đưa vào phần IV, phần này sẽ thực hiện mô phỏng dữ liệu dựa trên đồng thời cả hiệu ứng thời gian và hiệu ứng công ty Trong những phần nêu trên, hiệu ứng công ty được giả định như một hằng số( không suy giảm theo thời gian) Nhưng trong thực tế, hiệu ứng công ty trong phần dư có thể suy giảm theo thời gian và do đó tương quan giữa các phần dư cũng giảm xuống khi khoảng cách của chúng tăng lên Trong phần V, chúng ta phân tích kết quả mô phỏng dữ liệu với cấu trúc tương quan tổng quát hơn Điều này không chỉ cho phép chúng ta có thể so sánh các sai số ước lượng giữa các phương pháp OLS, phương pháp phân nhóm, Fama-Macbeth một cách tổng quát và còn cho phép chúng ta xác định một cách tương đối lợi ích của việc sử dụng phương pháp hiệu ứng cố định-FE (sử dụng các biến giả công ty) để ước lượng các tham số và liệu điều này có thể thay đổi cách thức ước lượng hay không Hầu hết các bài nghiên cứu không thực hiện báo cáo sai số chuẩn ước lượng theo các phương pháp khác nhau Chính vì thế trong phần
VI, chúng ta phân tích kết quả áp dụng các kỹ thuật ước lượng sai số chuẩn cho hai bộ
dữ liệu thực và so sánh một cách tương đối các kết quả với nhau Điều này cho phép chúng ta thấy được các chỉ dẫn cho việc sử dụng kỹ thuật ước lượng trong các tình
Trang 12huống cụ thể khác nhau cũng như chỉ ra sự khác biệt của các phương pháp ước lượng
để có thể cung cấp các thông tin còn thiếu xót trong mô hình và định hướng cải thiện
mô hình cho tốt hơn
Chương 2 Ước lượng mô hình trong điều kiện hiệu ứng công ty cố định
2.1 Các ước lượng sai số chuẩn vững (robust standard error estimates)
Nhằm đưa ra phán đoán tại sao sai số chuẩn theo phương pháp OLS không đúng
và sai số chuẩn theo phương pháp Rogers khắc phục điều này thế nào, chúng ta sẽ xem xét một cách ngắn gọn việc tính toán phương sai của một tham số ước lượng được diễn đạt như thế nào Mô hình hồi quy chuẩn cho dữ liệu bảng được viết như sau:
it
ε it
βX it
1 t
2 it
N
1 i T
1 t
it it
N
1 i T
1 t
2 it
N
1 i T
1 t
it it it
N
1 i T
1 t
2 it
N
1 i T
1 t
it it
OLS
^
X
εXβ
X
)εβ(XX
X
YXβ
(2)
Và phương sai ước lượng của các tham số :
Trang 13
2 X
2 ε
2 2 X
2 ε 2 X
2 N
1 i T
1 t
2 it N
1 i T
1 t
2 it 2 it
2 N
1 i T
1 t
2 it
2 N
1 i T
1 t
it it
^
OLS
NTζ
ζ
NTζζ
NTζ
Xε
XE
Xε
XE
)βVar(
3 Giả định độc lập hay bị vi phạm trong mô hình dữ liệu bảng và bài nghiên cứu sẽ
tập trung giải quyết vấn đề này
Mở rộng các giả định về phần dư độc lập, chúng ta sẽ giả định rằng dữ liệu có hiệu ứng
cố định (fixed effect) Do đó phần dư sẽ bao gồm yếu tố công ty cụ thể cùng với đặc trưng cho mỗi quan sát Phần dư sẽ được biểu diễn ở dạng:
it i
Giả định rằng biến độc lập X cũng bao hàm yếu tố công ty:
it i
Mỗi yếu tố trong biến X (φ và ν) và ɛ (λ và η) được giả định là độc lập lẫn nhau Điều này là cần thiết để các tham số ước lượng được vững (consistent) Đây là cấu trúc đặc trưng của một dữ liệu bảng và nó hàm ý mức độ tương quan giữa các quan sát của một công ty cho trước Cả biến độc lập và phần dư đều tương quan giữa hai quan sát trong cùng một công ty cho trước, nhưng giả định độc lập giữa các công ty khác nhau:
Trang 14s tj,iif
0
s tj,iif /ζζρ
stj,iif
1 )ε,corr(ε
s tj,iif
0
s tj,iif /ζζρ
stj,iif
1)X,corr(X
2 ε
2 γ ε
js it
2 X
2 μ X
js it
Với cấu trúc dữ liệu như trên, tôi có thể tính toán các sai số chuẩn của tham số ước
lượng theo phương pháp OLS dựa trên các phương trình (1), (4), (5) Bởi vì các sai số
không còn độc lập trong nhóm, bình phương của tổng các sai số không bằng với tổng các sai số bình phương Các biến độc lập cũng có tính chất tương tự Hiệp phương sai cũng nên được đưa vào Phương sai của tham số ước lượng OLS:
2 X
2 ε
2 2 X
2 ε ε 2 X X
2 ε 2 X
N 1 i
2 N
1 i T
1 t
2 it T
1 t
1 T
1 t T
1 t s
is it is it 2
it 2 it
N 1 i
2 N
1 i T
1 t
2 it
2 T
1
t it it
2 N
1 i T
1 t
2 it
2 N
1 i T
1 t it it OLS
ρ1)ρ(T1NTζ
ζ
NTζζ
ρζ1)ρNT(Tζ
NTζ
Xε
εXX2
εXE
Xε
XE
Xε
XE
]ββ
Trang 15thời khác 0 Mức độ sai lệch gia tăng khi số năm trong dữ liệu tăng lên (Bertrand, Duflo, và Mullainathan, 2004) Để hiểu được ý tưởng này, chúng ta xem xét một trường hợp đặc biệt trong đó các biến độc lập và phần dư tương quan hoàn toàn với nhau theo thời gian (ρX =1 và ρΕ =1) Trong trường hợp này, mỗi năm gia tăng sẽ không cung cấp thêm bất cứ thông tin nào và sẽ không có tác động đến sai số chuẩn chính xác của mô hình Tuy nhiên, các sai số chuẩn theo phương pháp OLS sẽ giả định rằng cứ mỗi năm tăng lên sẽ cung cấp thêm N quan sát và do đó sai số chuẩn ước lượng sẽ nhỏ lại, làm cho kết quả ước lượng không chính xác
Tương quan của các phần dư trong nhóm là vấn đề mà phương pháp sai số chuẩn của Rogers (sai số chuẩn White được điều chỉnh cho trường hợp nhóm) sẽ xử lý Bằng cách bình phương tổng của Xitɛit trong mỗi nhóm, hiệp phương sai giữa các phần dư trong
nhóm sẽ được ước lượng (xem hình 2.1.1, trang 7) Mối tương quan này có thể tồn tại
ở nhiều dạng hàm, và được giả định có cấu trúc phi tham số Tuy nhiên, tổng của Xitɛitbình phương được giả định là có cùng phân phối đối với các nhóm khác nhau Do đó các sai số chuẩn sẽ vững khi số lượng nhóm tăng lên (Donald và Lang, 2001; và Wooldridge, 2002) Chúng ta sẽ quay lại thảo luận vấn đề này trong phần III
Hình 2.1.1 : Ma trận phương sai - hiệp phương sai của phần dư
Trang 162.2 Kiểm định các ước lượng sai số chuẩn bằng mô phỏng
Để so sánh một cách tương đối sự chính xác của các phương pháp ước lượng khác nhau và củng cố cho những nhận định được nêu ở trên trong bài nghiên cứu, chúng ta sẽ phân tích kết quả mô phỏng một dữ liệu bảng cụ thể và sau đó ước lượng
hệ số chặn cũng như sai số chuẩn của chúng Bằng việc làm như thế nhiều lần chúng ta
có thể quan sát được giá trị sai số chuẩn đúng cũng như giá trị sai số chuẩn ước lượng
trung bình Trong lần mô phỏng đầu tiên, bài nghiên cứu chỉ xem xét sự hiện diện của
hiệu ứng công ty cố định trên biến độc lập và phần dư, hiệu ứng thời gian cố định không được đưa vào Chính vì đó dữ liệu mô phỏng sẽ có dạng như được mô tả trong
phương trình (4) và (5) (ở phía trên) Trong suốt quá trình mô phỏng, bài nghiên cứu
này tuân theo các giả định rằng độ lệch chuẩn của biến độc lập và phần dư là không đổi
và lần lượt có giá trị là một và hai Điều này sẽ dẫn đến giá trị R2 chỉ đạt giá trị 20% nhưng điều này không có gì là bất thường trong mô hình hồi quy tài chính thực nghiệm Trong những quá trình mô phỏng khác, chúng ta sẽ lần lượt xem xét các trường hợp khi giá trị tỷ trọng phương sai đại diện cho hiệu ứng công ty trong biến độc lập thay đổi Tỷ trọng này có giá trị từ 0% đến 75% với giá trị cho mỗi lần tăng là 25%
(xem bảng 2.2.1, trang 9) Điều này được thực hiện tương tự đối với phần dư Cách
làm nay cho phép chúng ta tìm hiểu mức độ chệch của sai số chuẩn OLS phụ thuộc như thế nào vào độ lớn của yếu tố hiệu ứng công ty tồn tại trong biến độc lập và phần dư
Trang 17Bảng 2.2.1 : Kết quả mô phỏng ước lượng sai số chuẩn OLS và Rogers trong trường hợp tồn tại hiệu ứng công ty trong dữ liệu
1.0006 0.0288 0.0283 0.0282
1.0002 0.0279 0.0283 0.0282
1.0001 0.0283 0.0283 0.0282
25%
1.0004 0.0287 0.0283 0.0283
0.9997 0.0353 0.0283 0.0353
0.9999 0.0403 0.0283 0.0411
0.9997 0.0468 0.0283 0.0463
50%
1.0001 0.0289 0.0283 0.0282
1.0002 0.0414 0.0283 0.0411
1.0007 0.0508 0.0283 0.0508
0.9993 0.0577 0.0283 0.0590
75%
1.0000 0.0285 0.0283 0.0282
1.0004 0.0459 0.0283 0.0462
0.9995 0.0594 0.0283 0.0589
1.0016 0.0698 0.0283 0.0693
Ghi chú: bảng bao gồm kết quả ước lượng tham số và sai số chuẩn dựa trên mô phỏng 5000
dữ liệu bảng (10 năm và 500 công ty mỗi năm) Hệ số góc đúng bằng 1, độ lệch chuẩn của biến độc lập là bằng 1 và của sai số là bằng 2 Tỷ lệ sai số chuẩn của phần dư do yếu tố công ty thay đổi trong các dòng trong bảng và biến động từ 0% (không tồn tại hiêu ứng công ty) đến 75% Tỷ lệ sai số chuẩn của biến độc lập do yếu tố công ty thay đổi trong các cột trong bảng và biến động từ 0% (không tồn tại hiêu ứng công ty) đến 75% Mỗi ô trong bảng sẽ bao gồm giá trị trung bình và độ lệch chuẩn của tham
số ước lượng theo phương pháp OLS (Avg(β OLS ) và Std(β OLS )) Độ lệch chuẩn chính là giá trị sai số chuẩn đúng của tham số ước lượng Giá trị thứ ba trong mỗi ô là sai số chuẩn của tham số được ước lượng theo phương pháp OLS Giá trị thứ tư trong mỗi ô là sai số chuẩn của tham số được ước lượng
Trang 18theo phương pháp Rogers (phương pháp phân nhóm) Sai số chuẩn được tính toán dựa trên phân nhóm theo công ty để xem xét sự tương quan giữa các quan sát trong cùng một công ty ở các năm khác nhau
Kết quả mô phỏng được báo cáo ở bảng 2.2.1, trang 9 Hai yếu tố đầu tiên trong mỗi ô
là giá trị trung bình của hệ số ước lượng và độ lệch chuẩn của hệ số ước lượng Độ lệch chuẩn là giá trị sai số chuẩn đúng (true standard error) của hệ số ước lượng và là giá trị
lý tưởng của sai số chuẩn ước lượng Sai số chuẩn ước lượng trung bình theo phương pháp OLS (average standard error estimated by OLS) là giá trị thứ ba trong mỗi ô và giá trị này bằng với sai số chuẩn đúng trong dòng đầu tiên của bảng kết quả Khi không
có hiệu ứng công ty trong phần dư (phần dư độc lập giữa các quan sát), sai số chuẩn
ước lượng bằng phương pháp OLS là chính xác ( xem bảng 2.2.1, dòng 1, trang 9)
Khi không có hiệu ứng công ty trên biến độc lập (các quan sát giữa biến độc lập là độc lập với nhau), giá trị sai số chuẩn trung bình được ước lượng bằng OLS cũng chính xác
ngay cả khi phần dư bị tương quan (xem bảng 2.2.1, cột 1, trang 9) Những kết quả này đều là hệ quả của phương trình (7) Sai số chuẩn theo OLS bị chệch là do sự phụ thuộc
trong biến độc lập và phần dư Khi giá trị tương quan của một trong hai yếu tố này bằng 0 thì sai số chuẩn theo OLS là không chệch
Khi có hiệu ứng công ty cả trong biến độc lập lẫn phần dư thì sai số chuẩn OLS bị ước lượng thấp hơn so với giá trị sai số chuẩn đúng và mức độ ước lượng thấp này có thể rất lớn Ví dụ, khi 50% độ biến động trong cả phần dư và biến độc lập là do hiệu ứng công ty cố định (ρX=ρƐ=0.5), giá trị sai số chuẩn ước lượng OLS bằng một nửa giá trị sai số chuẩn đúng (0.557 = 0.0283/0.0508) Giá trị sai số chuẩn ước lượng bằng OLS không thay đổi khi tôi tăng hiệu ứng công ty ở các cột (trong biến độc lập) hoặc ở các dòng (trong phần dư) Trong khi đó giá trị sai số chuẩn thực sự có tăng lên
Khi thực hiện ước lượng sai số chuẩn của tham số ước lượng bằng phương pháp Rogers, giá trị sai số chuẩn ước lượng rất gần với giá trị sai số chuẩn đúng Những giá trị ước lượng này cũng tăng theo giá trị đúng khi mức độ biến động do hiệu ứng công
Trang 19ty tăng lên Các sai số chuẩn theo phương pháp Rogers tính toán một cách chính xác sự phụ thuộc lẫn nhau của dữ liệu dạng bảng (Rogers, 1993, Williams, 2000)
Mức độ chệch của sai số chuẩn OLS rất nhạy cảm với số lượng kỳ (số năm) được sử dụng để ước lượng Khi số lượng kỳ trong nghiên cứu là gấp đôi thì phương pháp OLS tạo ra một số lượng quan sát cũng gấp đôi Tuy nhiên nếu biến độc lập và phần dư trong cùng một nhóm là tương quan với nhau, lượng thông tin (biến động của biến độc lập) sẽ không tăng lên gấp đôi Mức độ chệch tăng từ 30% khi số năm quan sát của mỗi năm là 5 đến 70% khi số năm là 50 năm (trong trường hợp ρX=ρƐ=0.5) Trong khi đó giá trị sai số chuẩn vững thì luôn gần đúng với giá trị đúng của nó và độc lập với số kỳ trong dữ liệu
2.3 Sai số chuẩn theo phương pháp Fama-Macbeth
Một phương pháp khác để ước lượng các hệ số hồi quy và các sai số chuẩn trong trường hợp các phần dư không độc lập với nhau là phương pháp Fama-Macbeth (Fama and MacBeth, 1973) Trong phương pháp này, các nhà nghiên cứu thực hiện T lần hồi quy dữ liệu chéo Giá trị trung bình của T lần ước lượng chính là giá trị hệ số ước lượng:
1 i
2 it
N
1 i
it it T
1 t N
1 i
2 it
N
1 i
it it
T
1 t
t FM
X
Y X T
1 β X
Y X T
1
T
β β
(8)
Trang 20Và giá trị phương sai ước lượng theo phương pháp Fama-Macbeth được tính toán theo công thức:
2
FM t
FM 2
1 T
β β T
1 β
Tuy nhiên trong công thức tính phương sai, các hệ số hồi quy theo năm (βt) được giả
định là độc lập với nhau Như chúng ta có thể thấy trong công thức (8) và (9), cách tính
phương sai ở trên chỉ đúng nếu Xitɛit và Xisɛis không tương quan với nhau, với t khác s Như đã thảo luận ở trên, giả định này là không đúng khi có hiệu ứng công ty trong dữ liệu (ρxρƐ khác 0) Do đó, phương sai ước lượng theo Fama-Macbeth sẽ rất nhỏ khi có
sự hiện diện của hiệu ứng công ty Trong trường hợp có hiệu ứng công ty, giá trị thực của phương sai theo ước lượng Fama-Macbeth là:
) β , β Cov(
T
1) T(T T
) β Var(
T
) β , β Cov(
2 T
) β Var(
) β Var(
T
1 ) β Var(
s t 2
t
2
1 T
1 t T
1 t s
s t t
T
1 t t 2
Với cấu trúc dữ liệu cho trước trong phương trình (4) và (5), hiệp phương sai của các
hệ số ước lượng giữa các năm khác nhau thì độc lập với khoảng cách giữa hai năm t-s
và có thể được xác định theo công thức sau:
Trang 212 X
2 ε ε X
2 ε ε 2 X X 2 2 X
N
1 i
is it is it 2
2 X
N
1 i is is N
1 i it it 2
2 X
1 N
1 i
2 is N
1 i is is N
1 i it it
1 N
1 i
2 it s
t
Nζ
ζρρ
ζρζNρ)(Nζ
εεXXE)(Nζ
εXε
XE)(Nζ
Xε
Xε
XX
E)β,βCov(
Kết hợp phương trình (10) và (11) ta được phương trình diễn đạt giá trị đúng của
phương sai ước lượng theo Fama-Macbeth:
2 X
2 ε
2 X
2 ε ε X 2
2 X
2 ε
s t 2
t FM
ρ 1)ρ (T 1 NTζ
ζ
Nζ
ζ ρ ρ T
1) T(T Nζ
ζ T
1
) β , β Cov(
T
1) T(T T
) β Var(
) β Var(
2.4 Mô phỏng ước lượng sai số chuẩn Fama-Macbeth
Để nghiên cứu mức độ chệch của ước lượng sai số chuẩn theo phương pháp Macbeth, bài nghiên cứu này phân tích việc tính toán các giá trị ước lượng của hệ số
Trang 22Fama-chặn và sai số chuẩn Fama-Macbeth với mỗi bộ dữ liệu mô phỏng gồm 5000 quan sát như đã được sử dụng ở bảng 1 ở trên Kết quả mô phỏng được báo cáo trong bảng 2 Ước lượng Fama-Macbeth cũng có đặc tính vững và hiệu quả như OLS (mức tương quan của hai phương pháp này ở mức cao trên 0.99) Độ lệch chuẩn của hệ số ước lượng của hai phương pháp này cũng giống nhau (so sánh giá trị thứ hai trong mỗi ô ở
bảng 2.2.1, trang 9 và bảng 2.4.1, trang 15) Giống như các ước lượng sai số chuẩn
OLS, sai số chuẩn Fama-Macbeth có khuynh hướng chệch thấp xuống phía dưới (xem
bảng 2.4.1, trang 15)
Tuy nhiên, mức độ chệch thực tế lớn hơn so với những hàm ý trong phương trình (12)
và lớn hơn so với OLS Ví dụ, giả sử ρX=ρƐ=75%, sai số chuẩn OLS bị chệch 60%
(0.595 = 1- 0.0283/0.0698, xem bảng 2.2.1, trang 9 ) trong khi sai số chuẩn Macbeth chệch 74% (0.738 = 1 - 0.0699/0.0183, xem bảng 2.4.1, trang 15) Xem xét
Fama-tam giác dưới trong bảng 2, từ bên trái phía trên xuống bên phải phía dưới, giá trị đúng của sai số chuẩn tăng lên trong khi sai số chuẩn ước lượng theo Fama-Macbeth thì bị chững lại (shrink) Khi hiệu ứng công ty tăng lên (ρX, ρƐ tăng lên) thì độ chệch trong sai số chuẩn theo Fama-Macbeth thậm chí tăng còn nhanh hơn so với sai số chuẩn theo OLS Mức độ chệch trong ước lượng sai số chuẩn của Fama-Macbeth tăng mạnh như vậy là do cách tính toán phương sai ước lượng của phương pháp này
Trang 23Bảng 2.4.1: Kết quả mô phỏng ước lượng sai số chuẩn theo Fama-Macbeth
với hiệu ứng công ty trong dữ liệu
1.0002 0.0280 0.0277
1.0001 0.0283 0.0275
25% 1.0004 0.0288
0.0275
0.9997 0.0354 0.0268
0.9998 0.0403 0.0259
0.9997 0.0469 0.0250 50% 1.0000 0.0289
0.0276
1.0002 0.0415 0.0259
1.0007 0.0509 0.0238
0.9993 0.0578 0.0219 75% 1.0000 0.0286
0.0277
1.0004 0.0460 0.0248
0.9995 0.0595 0.0218
1.0016 0.0699 0.0183
Ghi chú: Bảng bao gồm kết quả ước lượng tham số và sai số chuẩn dựa trên mô phỏng 5000 dữ liệu bảng (10 năm và 500 công ty mỗi năm) Hệ số góc đúng bằng 1, độ lệch chuẩn của biến độc lập là bằng 1 và của sai số là bằng 2 Tỷ lệ sai số chuẩn của phần dư do yếu tố công ty thay đổi trong các dòng trong bảng và biến động từ 0% (không tồn tại hiêu ứng công ty) đến 75% Tỷ lệ sai số chuẩn của biến độc lập do yếu
tố công ty thay đổi trong các cột trong bảng và biến động từ 0% (không tồn tại hiêu ứng công ty) đến 75% Gía trị đầu tiên trong mỗi ô là hệ số ước lượng bình quân dựa trên phương pháp ước lượng Fama-Macbeth (chúng ta thực hiện ước lượng cho mỗi năm, sau đó lấy giá trị trung bình của 10 năm) Giá trị thứ hai là độ lệch chuẩn của hệ
số ước lượng theo Fama-Macbeth Đây chính là giá trị sai số chuẩn đúng Giá trị thứ
ba là sai số chuẩn ước lượng theo phương pháp Fama-Macbeth
Trang 24Để thấy được điều này ta sẽ diễn giải mở rộng phương trình (9)
2
T
1 t
T
1 t N
1 i
2 it
N
1 i it it
N
1 i
2 it
N
1 i it it
FM
X
ε X T
1 X
ε X 1)
T(T
1 β
2
T
1 t
N
1 i
2 it i
N
1 i
it i it i
N
1 i
2 it i
N
1 i
it i it i
) ν (μ
) ε )(γ ν (μ T
1 )
ν (μ
) ε )(γ ν (μ 1)
có giá trị là (σƐ/NσX)1/2 ) Giá trị sai số chuẩn ước lượng theo Fama-Macbeth sẽ bằng 0 Nguyên nhân dẫn đến việc bị chệch này sẽ bị thu nhỏ lại khi số lượng năm nghiên cứu tăng lên bởi khi đó giá trị ước lượng của hệ số góc sẽ hội tụ về giá trị đúng của nó Hiệu ứng công ty có thể sẽ kém quan trọng hơn khi biến phụ thuộc là tỷ suất sinh lợi (giá trị tỷ suất sinh lợi vượt trội không có tương quan chuỗi) so với các ứng dụng của tài chính doanh nghiệp khi các hiệu ứng công ty không quan sát được là cực kì quan trọng (xem phần VI) Hiện tượng chệch mà chúng ta đã lưu ý ở trên sẽ ít quan trọng
Trang 25hơn trong các ứng dụng này Điều này là không có gì ngạc nhiên khi phương pháp Fama-Macbeth được xây dựng để tính toán cho trường hợp có sự tương quan giữa các quan sát của các công ty khác nhau trong cùng một năm chứ không tính toán cho sự tương quan giữa các quan sát cùng một công ty trong các năm khác nhau Thực tế, Fama và Macbeth cũng đã tiến hành kiểm tra mức độ tương quan trong phần dư ở các
mô hình của mình và phát hiện ra nó gần như bằng 0 Tuy nhiên, các ứng dụng của nó được nhắc đến trong phần tài liệu tham khảo không phải lúc nào cũng đúng với các nền tảng lý thuyết Phương pháp Fama-Macbeth được xây dựng để xử lý hiệu ứng thời gian trong dữ liệu bảng chứ không phải hiệu ứng công ty, tôi sẽ quay lại với cấu trúc dữ liệu này trong phần sau
2.5 Các sai số chuẩn Newey-West
Một phương pháp khác được sử dụng để giải quyết trường hợp tương quan giữa các phần dư là Newey-West (Newey and West, 1987) Phương pháp này được sử dụng một cách phổ biến để xử lý tương quan chuỗi khi không biết dạng hàm của phần dư trong một chuỗi thời gian bất kỳ Nó được điều chỉnh để áp dụng trong trường hợp dữ liệu bảng bằng cách ước lượng tương quan giữa các phần dư trễ trong cùng một nhóm (see Bertrand, Duflo, and Mullainathan, 2004, Doidge, 2004, MacKay, 2003, Brockman and Chung, 2001) Vấn đề chọn độ dài của trễ thì hết sức đơn giản trong dữ liệu bảng, bởi vì độ trễ tối đa trong mô hình thì nhỏ hơn 1 năm so với số năm tối đa cho mỗi công ty Để xem xét mức độ hiệu quả tương đối của Newey-West và các phương khác, chúng ta sẽ phân tích kết quả mô phỏng 5000 bộ dữ liệu với 5000 quan sát cho mỗi bộ Mỗi bộ dữ liệu sẽ bao gồm 500 công ty và 10 năm cho mỗi công ty Hiệu ứng công ty được giả định chiếm 25% mức độ biến động của cả biến độc lập cũng như phần dư
Sai số chuẩn ước lượng bởi Newey-West là một hàm tăng theo độ dài của trễ trong tiến trình mô phỏng này Khi độ dài của trễ bằng 0, sai số chuẩn ước lượng có giá trị đúng
Trang 26bằng với sai số chuẩn White, một phương pháp chỉ hiệu quả để xử lý phương sai thay đổi Sai số chuẩn ước lượng này có giá trị giống với sai số chuẩn OLS trong mô phỏng bởi vì phần dư có phương sai không đổi Không có gì ngạc nhiên khi sai số chuẩn này được ước lượng thấp một cách đáng kể so với sai số chuẩn đúng Khi độ dài của trễ tăng từ 0 đến 9, sai số chuẩn ước lượng theo phương pháp Newey-West tăng từ 0.0283 (giống với kết quả ước lượng theo OLS/White) đến 0.0328 khi độ dài của trễ là Khi có
sự hiện diện của hiệu ứng công ty cố định, quan sát của một công ty cho trước sẽ tương quan với các quan sát khác của cùng công ty đó và không phụ thuộc vào khoảng cách thời gian giữa hai quan sát đó Chính vì vậy, khi độ dài của trễ tối đa không thể vượt quá T-1 sẽ khiến cho các sai số chuẩn theo Newey-West bị ước lượng thấp hơn giá trị sai số chuẩn đúng khi hiệu ứng công ty được cố định (chúng tôi sẽ quay lại vấn đề hiệu ứng công ty trong phần V) Tuy nhiên ngay cả khi độ dài của trễ là tối đa (bằng 9), các ước lượng theo Newey-West vẫn bị chệch dưới một khoảng nhỏ gần 8% so với gí trị sai số chuẩn đúng [0.084 = 1-0.0328/0.0358] Sai số chuẩn vững ước lượng thấp hơn giá trị sai số chuẩn đúng gần 2%
Quá trình mô phỏng chỉ ra rằng, khi áp dụng phương pháp Newey-West để ước lượng sai số chuẩn trong trường hợp dữ liệu bảng thì kết quả ước lượng thu được sẽ không giống với sai số chuẩn Rogers Sự khác biệt giữa hai phương pháp này là do công thức trọng số được sử dụng bởi Newey-West Khi ước lượng sai số chuẩn, Newey-West nhân phần hiệp phương sai giữa các phần dư có độ trễ j (ɛt,ɛt-j) với trọng số [1-j/(M+1)] với M là độ trễ tối ưu cụ thể Nếu tôi cho giá trị M=T-1, khi đó ma trận trung tâm trong công thức hiệp phương sai của phương pháp Newey-West sẽ là:
Trang 27T1t
εitεisXit
)XT
j(12
T1t
2itε
2itX
N1i
1T1t
T1t
εitεjitXitw(j)X2
T1t
2itε
2itX
N1i
1T1t
T1t
εitεisXits)Xw(t2
T1t
2itε
2itXN
1i
2T
1
t it
εitX
(14)
Công thức trên gần giống với công thức xác định sai số chuẩn của Rogers chỉ trừ phần trọng số [w(j)] Rogers sử dụng một hàm trọng số cho tất cả các hiệp phương sai Phương pháp Newey-West ban đầu được xây dựng cho một chuỗi thời gian đơn nhất
và hàm trọng số được sử dụng sao cho ma trận ước lượng phải là một ma trận xác định
dương (positive semi-definite matrix) Đối với j cố định, trọng số w(j) tăng lên khi giá
trị độ trễ tối đa (M) tăng lên Phương pháp Newey-West chỉ ra rằng nếu giá trị M được tăng lên đến giá trị cỡ mẫu T đủ lớn thì ước lượng của phương pháp này là vững (consistent) Tuy nhiên, trong cấu trúc dữ liệu bảng thì số kì thường ngắn Trong khi tính vững của ước lượng Rogers thì phụ thuộc vào số nhóm và trong dữ liệu thì thường lớn còn phương pháp Newey-West thì lại dựa vào số lượng thời kì do đó thường dẫn đến sai số chuẩn ước lượng thấp hơn so với giá trị thực
Chương 3 Ước lượng sai số chuẩn trong điều kiện hiệu ứng thời gian
Để làm rõ hai phương pháp trên có hiệu quả hay không khi có dữ liệu có sự hiện diện của hiệu ứng thời gian chúng ta sẽ phân tích trong trường hợp dữ liệu có chứa duy nhất yếu tố hiệu ứng thời gian (các quan sát của các công ty khác nhau trong cùng một thời kỳ tương quan với nhau) Đây là dạng dữ liệu mà phương pháp Fama-Macbeth được áp dụng để xử lý Việc giả định cấu trúc dữ liệu chỉ bao gồm hiệu ứng thời gian
sẽ khiến cho các phương trình diễn đạt ở trên cơ bản là không thay đổi đáng kể Các sai
số chuẩn cũng được diễn đạt tương tự và chính xác khi chúng ta thay đổi vai trò N với
Trang 283.1 Các ước lượng sai số chuẩn vững
Mô phỏng dữ liệu với chỉ hiệu ứng thời gian có nghĩa là biến phụ thuộc vẫn
được xác định như phương trình (1) nhưng biến độc lập và sai số được biểu diễn như
sau:
it
νt
δitX
it
εt
δitε
chuẩn vững được báo cáo trong bảng 3.1.1, trang 21 Có một số điểm thú vị cần lưu ý
trong kết quả Đầu tiên, cũng như hiệu ứng công ty, sai số chuẩn ước lượng OLS là chính xác trong trường hợp không có hiệu ứng thời gian trong biến độc lập hoặc phần
dư Khi hiệu ứng thời gian trong biến độc lập và phần dư cùng tăng, có sự chênh lệch đáng kể trong ước lượng sai số chuẩn OLS và sai số chuẩn đúng Khi một nửa sự biến động của biến độc lập và phần dư là do hiệu ứng thời gian thì sai số chuẩn OLS ước
lượng thấp hơn 91% so với giá trị sai số chuẩn đúng [0.909 = 1 - 0.0282/0.3105, xem
bảng 3.1.1, trang 21]
Trang 29Bảng 3.1.1 : Kết quả mô phỏng ước lượng sai số chuẩn OLS và Rogers trong trường hợp tồn tại hiệu ứng thời gian trong dữ liệu
1.0002 0.0291 0.0288 0.0276
1.0006 0.0293 0.0295 0.0275
0.9994 0.0314 0.0306 0.0270
25%
1.0006 0.0284 0.0279 0.0268
1.0043 0.1490 0.0284 0.1297
0.9962 0.2148 0.0289 0.1812
0.9996 0.2874 0.0300 0.2305
50%
0.9996 0.0276 0.0274 0.0258
0.9997 0.2138 0.0278 0.1812
0.9919 0.3015 0.0282 0.2546
1.0079 0.3986 0.0292 0.3248
75%
1.0002 0.0273 0.0267 0.0244
0.9963 0.2620 0.0271 0.2215
0.9970 0.3816 0.0276 0.3141
0.9908 0.4927 0.0284 0.3986
Ghi chú: bảng bao gồm kết quả ước lượng tham số và sai số chuẩn dựa trên mô phỏng 5000
dữ liệu bảng (10 năm và 500 công ty mỗi năm) Hệ số góc đúng bằng 1, độ lệch chuẩn của biến độc lập là bằng 1 và của sai số là bằng 2 Tỷ lệ sai số chuẩn của phần dư do yếu tố thời gian thay đổi trong các dòng trong bảng và biến động từ 0% (không tồn tại hiêu ứng công ty) đến 75% Tỷ lệ sai số chuẩn của biến độc lập do yếu tố thời gian thay đổi trong các cột trong bảng và biến động từ 0% (không tồn tại hiêu ứng công ty) đến 75% Mỗi ô trong bảng sẽ bao gồm giá trị trung bình và độ lệch chuẩn của tham số ước lượng theo phương pháp OLS (Avg(β OLS ) và Std(β OLS )) Độ lệch chuẩn chính là giá trị sai số chuẩn đúng của tham số ước lượng Giá trị thứ ba trong mỗi ô là sai số chuẩn của tham số được ước lượng theo phương pháp OLS Giá trị thứ tư trong mỗi ô là sai số chuẩn của tham số được ước lượng theo
Trang 30phương pháp Rogers (phương pháp phân nhóm) Sai số chuẩn được tính toán dựa trên phân nhóm theo thời gian để xem xét sự tương quan giữa các quan sát của các công ty khác nhau trong cùng một năm
Sai số chuẩn vững (robust) thì đúng hơn OLS nhưng không giống với kết quả đối với hiệu ứng công ty, sai số chuẩn vững cũng bị ước lượng thấp hơn so với giá trị sai số chuẩn đúng Mức độ ước lượng dưới tương đối thấp, từ 13% [1-0.1297/0.1490] khi hiệu ứng thời gian chiếm 25% đến 19% [1-0.3986/0.4927] khi hiệu ứng thời gian tăng lên 75% Vấn đề phát sinh bởi số lượng nhóm cụm bị hạn chế (số năm quan sát) Khi tôi ước lượng sai số chuẩn trong điều kiện hiệu ứng công ty, tôi có 500 công ty (500 nhóm) và 10 năm cho mỗi nhóm, trong khi tôi chỉ có 10 năm (10 nhóm) và 500 công ty mỗi năm khi ước lượng trong điều kiện hiệu ứng thời gian Bởi vì phương pháp ước lượng vững không đặt ra hạn chế cho sự tương quan của các phần dư trong nhóm, nên tính vững của ước lượng phụ thuộc vào số lượng nhóm khi ước lượng sai số chuẩn Như vậy, 10 nhóm là quá nhỏ còn 500 thì đủ (see Kezdi, 2002, and Bertrand, Duflo, and Mullainathan, 2004 cho các kết quả tương tự)
Để tìm hiểu vấn đề này, chúng ta sẽ xem xét kết quả mô phỏng các bộ dữ liệu với 5000 quan sát mỗi bộ nhưng số lượng năm (số nhóm) thay đổi từ 10 đến 100 Trong tất cả các mô phong, áp dụng mức biến động trong biến độc lập và phần dư do hiệu ứng thời gian là 25% Độ chệch của sai số chuẩn ước lượng vững giảm xuống khi số lượng nhóm tăng lên, giảm từ 13% khi có 10 năm còn 4% khi có 40 năm và còn dưới 1% khi
có 100 năm (xem hình 3.1.1, trang 23) Chính vì đó, độ chệch trong ước lượng sai số
chuẩn vững là do số nhóm quá nhỏ Tuy nhiên trong dữ liệu tài chính thì ít có một bộ
dữ liệu bảng nào có thể bao gồm 10 hay 20 năm, do đó đây là một vấn đề trong thực tiễn áp dụng
Trang 31Hình 3.1.1: Sai số chuẩn đúng và sai số chuẩn Rogers khi số lượng nhóm (số năm )
thay đổi
Ghi chú: hình trên minh họa sai số chuẩn ước lượng đúng và sai số chuẩn ước lượng Rogers thể hiện trên trục tung khi số lượng nhóm (số năm) thể hiện trên trục hoành thay đổi
3.2 Các ước lượng Fama-Macbeth
Khi chỉ có hiệu ứng thời gian, tương quan giữa các tham số ước lượng ở mỗi năm với nhau bằng 0 và do đó sai số chuẩn ước lượng bởi Fama-Macbeth là đúng (xem
phương trình 9 và 12) Điều nãy cũng đúng với kết quả mô phỏng tìm được (xem bảng
3.2.1, trang 24) Sai số chuẩn ước lượng này rất gần với giá trị sai số chuẩn ước lượng
đúng và do đó kích thước của các khoảng tin cậy là chính xác
0 0.04
Trang 32Bảng 3.2.1: Kết quả mô phỏng ước lượng sai số chuẩn theo Fama-Macbeth
với hiệu ứng thời gian trong dữ liệu
1.0004 0.0331 0.0318
1.0007 0.0396 0.0390
0.9991 0.0573 0.0553
25%
1.0005 0.0252 0.0239
1.0003 0.0284 0.0276
1.0006 0.0343 0.0338
0.9999 0.0496 0.0480 50%
1.0000 0.0200 0.0195
1.0002 0.0231 0.0227
1.0006 0.0280 0.0276
1.0007 0.0394 0.0387
75%
1.0001 0.0142 0.0138
0.9996 0.0161 0.0159
1.0000 0.0200 0.0196
0.9999 0.0285 0.0276
Ghi chú: bảng bao gồm kết quả ước lượng tham số và sai số chuẩn dựa trên mô phỏng
5000 dữ liệu bảng (10 năm và 500 công ty mỗi năm) Hệ số góc đúng bằng 1, độ lệch chuẩn của biến độc lập là bằng 1 và của sai số là bằng 2 Tỷ lệ sai số chuẩn của phần
dư do yếu tố thời gian thay đổi trong các dòng trong bảng và biến động từ 0% (không tồn tại hiêu ứng công ty) đến 75% Tỷ lệ sai số chuẩn của biến độc lập do yếu tố thời gian thay đổi trong các cột trong bảng và biến động từ 0% (không tồn tại hiêu ứng công ty) đến 75%.Gía trị đầu tiên trong mỗi ô là hệ số ước lượng bình quân dựa trên phương pháp ước lượng Fama-Macbeth (chúng ta thực hiện ước lượng cho mỗi năm, sau đó lấy giá trị trung bình của 10 năm) Giá trị thứ hai là độ lệch chuẩn của hệ số ước lượng theo Fama-Macbeth Đây chính là giá trị sai số chuẩn đúng Giá trị thứ ba
là sai số chuẩn ước lượng theo phương pháp Fama-Macbeth
Trang 33Ngoài việc đưa ra một sai số chuẩn ước lượng không chệch, Fama-Macbeth cũng tạo ra một ước lượng hiệu quả hơn so với OLS Ví dụ, trong trường hợp 25% biến động của biến độc lập và phần dư do hiệu ứng công ty thì độ lệch chuẩn do Fama-Macbeth ước lượng được nhỏ hơn 81% [1-0.0284/0.1490] so với sai số chuẩn ước
lượng bằng OLS (so sánh bảng 3.1.1, trang 21 với bảng 3.2.1, trang 24)
Fama-Macbeth cải thiện được tính hiệu quả so với OLS bởi phương pháp này có tính đến hiệu ứng thời gian Bằng cách chạy có mô hình hồi quy chéo ở mỗi năm, hệ số chặn của phương trình hồi quy sẽ hấp thu và là các ước lượng cho yếu tố hiệu ứng thời gian
Vì sự biến động do hiệu ứng thời gian không còn trong phần dư nên độ biến động trong phần dư của Fama-Macbeth ít hơn đáng kể so với trong hồi quy OLS Phương sai của phần dư thấp dẫn đến biến động trong hệ số ước lượng thấp và do đó sẽ hiệu quả hơn Chúng ta sẽ xem xét lại vấn đề này trong phần tới khi đưa cả hiệu ứng công ty và hiệu ứng thời gian vào trong mô hình
Như vậy theo kết quả mô phỏng từ đầu, phương pháp tốt nhất để ước lượng tham số và sai số chuẩn trong dữ liệu bảng phụ thuộc vào tính chất phụ thuộc trong dữ liệu Nếu
dữ liệu bảng chỉ bao gồm hiệu ứng công ty, sai số chuẩn Rogers (nhóm dữ liệu theo công ty) chiếm ưu thế ước lượng chính xác giá trị sai số chuẩn Nếu cấu trúc dữ liệu chỉ bao gồm hiệu ứng thời gian thì phương pháp Fama-Macbeth lại chiếm ưu so với Rogers Khi số lượng năm quan sát lớn thì ước lượng sai số chuẩn của cả Fama-Macbeth và Rogers đều chính xác Ước lượng Fama-Macbeth thì hiệu quả hơn so với OLS mặc dù lợi thế này sẽ biến mất khi các biến giả thời gian được đưa vào mô hình
Trang 34Chương 4 Ước lượng sai số chuẩn trong điều kiện cả hiệu ứng công ty và hiệu ứng thời gian
Mặc dù các kết quả nghiên cứu ở trên cung cấp nhiều thông tin hữu ích nhưng
nó dường như không mô tả một cách đầy đủ dữ liệu thực tế trong nghiên cứu tài chính thực nghiệm Hầu hết các dữ liệu bảng đều bao gồm cả hiệu ứng công ty và hiệu ứng thời gian Do đó chúng ta cần đánh giá mức độ hiệu quả tương đối của các phương pháp trên trong điều kiện tồn tại cả hiệu ứng công ty và thời gian Trong phần này chúng ta sẽ phân tích kết quả mô phỏng dữ liệu trong đó cả biến độc lập và phần dư sẽ bao gồm hiệu ứng công ty và thời gian
Vấn đề khái niệm trong việc sử dụng các kỹ thuật ước lượng (sai số chuẩn Rogers hoặc Fama-Macbeth) cũng tương tự như trong tương quan hai chiều (công ty và thời gian) Phương pháp sai số chuẩn vững cho phép chúng ta phỏng đoán cấu trúc tương quan trong mỗi nhóm Tuy nhiên cái giá của việc này là phần dư của các nhóm khác nhau không được tương quan với nhau Do đó nếu chúng ta nhóm quan sát theo công ty thì chúng ta phải giả định rằng phần dư của các công ty khác nhau trong cùng một thời kỳ không được tương quan với nhau Trong thực tế, các nhà nghiên cứu xứ lý một chiều tương quan bằng cách sử dụng biến giả và nhóm các quan sát cho chiều tương quan còn lại Bởi vì trong dữ liệu bảng, số lượng công ty là nhiều hơn số lượng thời kỳ nên hầu hết các nghiên cứu sẽ sử dụng biến giả cho các năm (để hấp thu hiệu ứng thời gian) và phân nhóm theo công ty (Anderson and Reeb, 2004, Gross and Souleles, 2004, Petersen and Faulkendar,2004, Sapienza, 2004, and Lamont and Polk, 2001) Tôi cũng sử dụng phương pháp này trong phần mô phỏng của mình
4.1 Sai số chuẩn ước lượng theo Rogers
Để xem xét hiệu quả tương đối của hai phương pháp trên, 5000 bộ dữ liệu được
sử dụng để mô phỏng bao gồm cả hiệu ứng công ty và hiệu ứng thời gian Trong quá trình mô phỏng, phần biến động do hiệu ứng công ty sẽ chiếm từ 25% đến 50 % , phần
Trang 35biến động do hiệu ứng thời gian cũng được giả định là từ 25% đến 50% của tổng biến động của biến độc lập Giả định như vậy sẽ cho chúng tôi ba khả năng đối với biến độc lập [(25,25),(25,50), và (50,25)] Trường hợp (50,50) bị loại trừ vì như vậy sẽ không tồn tại biến động của yếu tố riêng biệt công ty-năm Áp dụng tương tự cho yếu tố phần
dư ta sẽ có được 9 trường hợp mô phỏng (xem bảng 4.1.1, trang 27)
Bảng 4.1.1: Kết quả mô phỏng ước lượng sai số chuẩn OLS và Rogers trong trường hợp tồn tại đồng thời hiệu ứng công ty và thời gian trong dữ liệu
1.0004 0.0547 0.0347 0.0548
1.0004 0.0489 0.0283 0.0489
1.0005 0.0362 0.0231 0.0364
1.0015 0.0515 0.0283 0.0508
0.9993 0.0468 0.0231 0.0461
1.0002 0.0493 0.0283 0.0490
1.0008 0.0690 0.0347 0.0692
0.9994 0.0631 0.0283 0.0630
Ghi chú: bảng bao gồm kết quả ước lượng tham số và sai số chuẩn dựa trên mô phỏng 5000 dữ liệu bảng (10 năm và 500 công ty mỗi năm) Hệ số góc đúng bằng 1, độ lệch chuẩn của biến độc lập là bằng 1 và của sai số là bằng 2 Trong các mô phỏng này,tỷ lệ phương sai của biến độc lập cũng như phần dư do hiệu ứng công ty gây ra
Trang 36chiếm đồng thời 25% hoặc 50% Tỷ lệ phương sai do hiệu ứng thời gian cũng chiếm đồng thời 25% hoặc 50% Ví dụ, ô cuối cùng trong cột số liệu đầu tiên, biến động của phần dư bao gồm 50% do hiệu ứng công ty và 25% do hiệu ứng thời gian trong khi biến động của biến độc lập bao gồm 25% từ hiệu ứng công ty và 25% từ hiệu ứng thời gian Mỗi ô trong bảng sẽ bao gồm giá trị ước lượng tham số trung bình theo OLS và
độ lệch chuẩn của nó Giá trị thứ ba trong mỗi ô là trung bình sai số chuẩn ước lượng theo phương pháp OLS Giá trị thứ tư trong mỗi ô là trung bình sai số chuẩn ước lượng theo phương pháp Rogers với phân nhóm theo công ty để xem xét sự tương quan giữa các quan sát trong cùng một công ty ở các năm khác nhau Mỗi mô hình hồi quy
sẽ bao gồm 9 biến giả theo năm
Kết quả mô phỏng trong trường hợp có cả hiệu ứng công ty và hiệu ứng thời
gian (bảng 4.1.1, trang 27) tương tự như kết quả chỉ có hiệu ứng công ty cố định (bảng
2.2.1, trang 9) Sai số chuẩn theo OLS bị ước lượng thấp so với giá trị sai số chuẩn
đúng trong khi sai số chuẩn Rogers (phân nhóm theo công ty) thì thực sự chính xác và không phụ thuộc vào cách thức định dạng mức độ của hiệu ứng công ty và hiệu ứng thời gian như thế nào Như chúng ta thấy ở trên, mức chệch của sai số chuẩn OLS tăng lên khi hiệu ứng công ty gia tăng Độ lớn của hiệu ứng thời gian cũng tác động tương
tự lên mức chệch tuy nhiên không mức độ không lớn như là hiệu ứng công ty Chúng
ta xem hai ví dụ sau để làm rõ nhận định này Trong bảng 2.2.1, hiệu ứng công ty
chiếm 25% mức độ biến động của biến phụ thuộc lẫn phần dư, OLS ước lượng dưới
mức giá trị sai số chuẩn đúng 20% [1-0.0283/0.0353, xem bảng 2.2.1, trang 9] Trong
bảng 4.1.1, có hai trường hợp mà hiệu ứng công ty cố định chiếm 25% cả biến độc lập
lẫn phần dư Khi độc lớn hiệu ứng thời gian chiếm 25% thì OLS bị chệch 31%
[1-0.0283/0.0407, xem bảng 4.1.1, trang 27], khi độ lớn hiệu ứng thời gian tăng lên 50% thì OLS bị chệch 45% [1-0.0283/0.0515, xem bảng 4.1.1, trang 27] Biến giả thời gian,
bằng cách hấp thu phần biến động bởi hiệu ứng thời gian từ biến độc lập và phần dư
Trang 37làm tăng tỷ trọng mức độ biến động còn lại (ρX or ρƐ tăng lên) do hiệu ứng công ty gây nên
4.2 Ước lượng Fama-Macbeth
Các thuộc tính thống kê của OLS và Fama-Macbeth là tương tự nhau Giá trị
trung bình và sai số chuẩn của các ước lượng là gần như bằng nhau (so sánh bảng
4.1.1, trang 27 và bảng 4.2.1, trang 30), và tương quan của hai ước lượng không bao
giờ thấp hơn 0.999 trong bất kỳ lần mô phỏng nào Khi đưa thêm các biến giả thời gian
và mô hình OLS, một yếu tố hiệu quả khi thêm vào ước lượng Fama-Macbeth, sự khác
biệt trong tính hiệu quả giữa hai phương pháp thể hiện trong bảng 3.1.1 và bảng 3.2.1
biến mất Phương pháp OLS bây giờ cũng cho kết quả ước lượng hiệu quả như là Fama-Macbeth, ngay cả trong điều kiện tồn tại hiệu ứng thời gian Tuy nhiên sai số chuẩn ước lượng bởi Fama-Macbeth một lần nữa lại quá nhỏ như kết quả tìm kiếm
được trong trường hợp không tồn tại hiệu ứng thời gian ở bảng 2.4.1, trang 15 Ví dụ
trong trường hợp 25% biến động của biến độc lập và phần dư là do hiệu ứng công ty, 25% là do hiệu ứng thời gian, thì Fama-Macbeth ước lượng thấp hơn giá trị sai số thực 37% [1-0.0258/0.0407]
Các kết luận ở các bảng trên vẫn đúng trong trường hợp phần này Trong điều kiện tồn tại hiệu ứng công ty sai số chuẩn ước lượng OLS và Fama-Macbeth bị chệch
về phái dưới đáng kể Sai số chuẩn ước lượng theo Rogers tính toán đến sự phân nhóm theo công ty cho ra một ước lượng trung bình tương đối chính Trong điều kiện tồn tại hiệu ứng thời gian, nếu sử dụng biến giả để kiểm soát, kết quả trên là không thay đổi, ngoại trừ việc nhấn mạnh độ lớn của hiệu ứng thời gian và khiến cho độ chệch trong sai số chuẩn OLS và Fama-Macbeth lớn hơn