1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Ưu điểm của dữ liệu bảng pptx

15 666 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 15
Dung lượng 252,55 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

¾Bỏ qua yếu tố thời gian ¾Chỉ là các quan sát dữ liệu thuần túy 4 Ưu điểm của dữ liệu bảng Nghiên cứu được sự khác biệt giữa các đơn vị chéo mà trước đây chúng ta hay sử dụng dummy Nâng

Trang 1

Dữ liệu bảng (Panel Data)

Các loại dữ liệu

Time – series Cross – sections Panel

Trang 2

và dữ liệu chéo gộp chung

Dữ liệu bảng là các quan sát về một chỉ tiêu nào đó sẽ bao gồm quan sát chéo và quan sát theo thời gian

Cần phân biệt dữ liệu bảng và dữ liệu chéo gộp chung (pooled): i,t??

¾Bỏ qua yếu tố thời gian

¾Chỉ là các quan sát dữ liệu thuần túy

4

Ưu điểm của dữ liệu bảng

Nghiên cứu được sự khác biệt giữa các đơn

vị chéo mà trước đây chúng ta hay sử dụng dummy

Nâng cao được số quan sát của mẫu và phần nào khắc phục được hiện tượng đa cộng tuyến

Chứa đựng nhiều thông tin hơn các dữ liệu khác

Trang 3

Ưu điểm của dữ liệu bảng (tt)

Nghiên cứu được động thái thay đổi của các đơn vị chéo theo thời gian

Một mô tả dạng hàm dữ liệu bảng đơn giản

và các ý tưởng khai thác từ dữ liệu bảng:

mối quan hệ giữa năng suất lúa với lao động nông nghiệp

Tổ chức dữ liệu bảng

Unstacked: Các đơn vị chéo được sắp xếp theo thời gian một cách riêng biệt theo từng biến (vd trong tài liệu đọc của Gujarati, đây

là cách thông thường khi mô tả dữ liệu bảng-ví dụ bằng Eviews)

Stacked: Các đơn vị chéo được sắp xếp theo thời gian và các đơn vị chéo này được nhóm lại với nhau theo từng biến

Trang 4

Ví dụ về dữ liệu bảng stacked

T N, N,2 N,1

T , 2

2 , 2 1 , 2 T , 1

2 , 1 1 , 1

Y Y Y Y Y Y Y Y Y

M

M M M

T N, N,2 N,1

, 2

2 , 2 1 , 2 , 1

2 , 1 1 , 1

X X X

M

M M M

T

T

X X X X X X

T N, N,2 N,1

, 2

2 , 2 1 , 2 , 1

2 , 1 1 , 1

Z Z Z

M

M M M

T

T

Z Z Z Z Z Z

8

Ví dụ về dữ liệu bảng Unstacked

254,2 2202,9

361,6 1940

186,6 2132,2

74,4 1940

312,7 1957,3

230,4 1939

172,6 2256,2

48,1 1939

260,2 1801,9

262,3 1938

156,2 2039,7

44,6 1938

118,1 2673,3

469,9 1937

118,0 2803,3

77,2 1937

50,5 1807,1

355,3 1936

104,4 2015,8

45,0 1936

53,8 1362,4

209,9 1935

97,8 1170,6

33,1 1935

US GE

C –1

F –1 I

Quan sát

C –1

F –1 I

Quan sát

Trang 5

Các loại dữ liệu bảng

Dữ liệu bảng cân bằng (balanced): khi các đơn vị chéo có cùng số quan sát theo thời gian

Dữ liệu bảng không cân bằng (unbalance):

khi các đơn vị chéo không có cùng số quan sát theo thời gian

Ý tưởng cơ bản về dữ liệu bảng

Dữ liệu bảng không thể thực hiện hồi qui bằng OLS thông thường

Các trường hợp có thể xảy ra cho các đơn vị chéo

¾Các đơn vị chéo có điều kiện đặc thù giống

nhau

¾Các đơn vị chéo có điều kiện đặc thù khác

nhau

Trang 6

Ý tưởng cơ bản về dữ liệu bảng (tt)

¾Các đơn vị chéo có sự khác biệt về tác động

biên của các nhân tố ảnh hưởng

¾Các đơn vị chéo vừa khác biệt về điều kiện

đặc thù và vừa khác biệt về tác động biên của các nhân tố ảnh hưởng

¾Các đơn vị chéo không có sự khác biệt về

điều kiện đặc thù và tác động biên của các biến độc lập đang xét

12

Dummy và dữ liệu bảng

Dummy có giải quyết các vấn đề của dữ liệu bảng?

Câu trả lời là được nhưng rất phức tạp và không hiệu quả

Trang 7

Dạng tổng quát mô hình

Yit = β1it+ β2itX 2it+ β3itX 3it + u it

Các tiếp cận ước lượng mô hình tổng quát

Tiếp cận tác động cố định

Tất cả các hệ số đều không đổi theo thời gian và các đơn vị chéo (pure pooled)

Hệ số độ dốc không đổi theo thời gian và các đơn vị chéo nhưng hệ số trục tung khác nhau giữa các đơn vị chéo (+dummy)

Hệ số độ dốc không đổi theo thời gian và các đơn vị chéo nhưng hệ số trục tung biến đổi giữa các đơn vị chéo và thời gian

Trang 8

Tiếp cận tác động cố định (tt)

Tất cả các hệ số biến đổi theo các đơn vị chéo (dummy + interactive)

Tất cả các hệ số biến đổi theo các đơn vị chéo và theo thời gian (dummy +

interactive)

16

Tất cả các hệ số không đổi

OLS- Pooled (hồi qui kết hợp tất cả các quan sát)

Yit = β1+ β2X 2it+ β3X 3it + u it

Nhược điểm

¾ Nhận dạng sai thể hiện ở DW

¾Ràng buộc quá chặt về các đơn vị chéo,

điều này khó xảy ra trong thực tế

Trang 9

Tất cả các hệ số không đổi (tt)

Y^ = –63,3041 +0,1101X2 + 0,3034X3

se (29,6124) (0,0137) (0,0493)

t (–2,1376) (8,0188) (6,1545)

R2 = 0,7565 DW = 0,2187

n = 80 df = 77

Phương trình 16.3.1 trong bài đọc

Hệ số trục tung biến đổi theo chéo

Phương pháp FEM – LSDV

Yit = β1it+ β2X 2it+ β3X 3it + u it

FEM: mặc dù có sự khác biệt các đơn vị chéo về hệ số trục tung nhưng lại không khác biệt theo thời gian

Giải pháp dummy?

Trang 10

Intercept biến đổi theo đơn vị chéo (tt)

β2X2it + β3X3it + uit

20

Intercept biến đổi theo đơn vị chéo (tt)

Hãy xem kết quả mô hình ước lượng 16.3.4

Mô hình này tốt hơn mô hình đầu tiên ở các

hệ số xác định, ý nghĩa thống kê t và DW

Sự sai lầm về nhận dạng được cải thiện Thoả mãn kiểm định Wald

Trang 11

Intercept biến đổi theo thời gian

Tiếp tục sử dụng biến dummy cho thời gian Tốn kém thời gian

Không có ý nghĩa thống kê Time effect: điều này có nghĩa là các yếu tố đặc thù của ngành không thay đổi theo thời gian

¾Yit = λ0 + λ1 Dum35 + λ2 Dum36+ + λ19

Dum53 + β2X2it + β3X3it + uit (16.3.6)

Intercept biến đổi theo đơn vị chéo

và theo thời gian

Sử dụng dummy một lần nữa cho cả đơn vị chéo và thời gian

Kết quả

¾Các hệ số của dummy ít có ý nghĩa thống kê

¾Mô hình tốt là mô hình có các biến giả theo

các đơn vị chéo

Trang 12

chéo

Sử dụng dummy theo các đơn vị chéo cho intercept và slope

Kết quả hồi qui ở 16.3.8

¾ Các hàm đầu tư của các đơn vị chéo khác

nhau

¾Không thể sử dụng dữ liệu pooled để hồi

qui hàm đầu tư cho tất cả các đơn vị chéo

mà không tính đến đặc thù của chúng

24

Trục trặc khi sử dụng FEM (LSDV)

Giảm bậc tự do của dữ liệu đi rất nhiều Nguy cơ đa cộng tuyến vì có quá nhiều biến

Giả định cổ điển về uit ~ N (0, σ2) rất khó thực hiện

¾Cần thiết có một phương pháp khác

Trang 13

Tiếp cận REM (ECM)

Ý tưởng của tiếp cận này cho rằng sự khác biệt về các điều kiện đặc thù của các đơn vị chéo được chứa đựng trong phần sai số ngẫu nhiên

¾ β1i = β1 + εi

¾Y it = β1 + β2X 2it + β3X 3it + εi + u it

= β1 + β2X 2it+ β3X 3it + w it

¾ w it = εi + u it

Giả định REM

Giả định thông thường

2

, 0

~

, 0

~

u it

i

N u

N

σ σ

Trang 14

Sự khác biệt giữa FEM và ECM

FEM có riêng từng Intercept cho từng đơn vị chéo

và chúng ta quan sát được ECM chỉ có một intercept duy nhất cho tất cả các đơn vị chéo, giá trị này là giá trị trung bình của tất

cả các đơn vị chéo

Sự khác biệt của các đơn vị chéo ước lượng bằng ECM nằm trong thành phần ngẫu nhiên εi

28

Lựa chọn mô hình cho dữ liệu bảng

Ý tưởng kinh tế lượng

¾FEM khi εi và các biến độc lập được giả

thiết có mối quan hệ chặt chẽ (chọn mẫu không đại diện)

¾ ECM khi εi và các biến độc lập được giả

thiết không có mối quan hệ chặt chẽ (chọn mẫu ngẫu nhiên)

Căn cứ vào n và t: Judge

Trang 15

Lựa chọn mô hình cho dữ liệu bảng

Căn cứ vào N và T: Judge

¾ECM và FEM không phân biệt khi T lớn và N

nhỏ

¾ECM và FEM sẽ khá khác biệt về kết quả khi

N lớn và T nhỏ

9ECM thích hợp khi các đơn vị chéo ngẫu nhiên

9FEM sẽ thích hợp khi các đơn vị chéo không

được lựa chọn ngẫu nhiên

Ngày đăng: 13/08/2014, 10:20

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w