Bài giảng Phân tích định lượng Bài 4 ThS Vũ Hữu Thành

Dữ liệu chéo hay dữ liệu theo không gian Cross-sectional data:Các giá trị của một hoặc nhiều biến được thu thập tại cùng một thời điểm 2.. Các dữ liệu chéo của từng đối tượng như doanh n

Trang 1

nalysis

A

info

Giảng viên: Ths Vũ Hữu Thành.

Nơi làm việc: Khoa Tài chính – Ngân hàng, ĐH Mở Điện thoại: 0938077776

Email: thanh.vuh@gmail.com

Trang 2

P anel D ata R egression

Trang 3

1 Dữ liệu chéo hay dữ liệu theo không gian (Cross-sectional data):

Các giá trị của một hoặc nhiều biến được thu thập tại cùng một thời điểm

2 Dữ liệu chuỗi thời gian (Time – series): Các giá trị của một hoặc nhiều biến được thu thập trong một giai đoạn

3 Dữ liệu bảng (panel data, longitudinal data, rosssectional time-series data

Các loại hình

dữ liệu

1 Là dữ liệu kết hợp giữa dữ liệu chéo và dữ liệu theo thời gian Các dữ liệu chéo của từng đối tượng (như doanh nghiệp, cá nhân …) sẽ được đo lặp lại theo từng thời điểm khác nhau

2 Loại dữ liệu này vừa phân tích được đối tượng theo không gian và theo thời gian

Đặc điểm dữ

liệu bảng

Trang 4

1 Kiểm soát được tính không đồng nhất từ các đối tượng quan sát

Ưu điểm dữ

liệu bảng

2 Bằng cách nghiên cứu các dữ liệu chéo một cách lặp đi lặp lại, dữ liệu bảng thực hiện tốt hơn các nghiêncứu về những thay đổi xảy ra liên tục

1 Dữ liệu bảng ngắn (short panel): Nhiều đối tượng được quan sát trong thời gian ngắn

2 Dữ liệu bảng dài (long panel): Một số ít đối tượng được quan sát trong thời gian dài

3 Dữ liệu bảng kết hợp (short panel and long panel): Nhiều đối tượng được quan sát trong thời gian dài

Ba loại hình

dữ liệu bảng

Mỗi loại dữ liệu bảng sẽ có những khác biệt nhỏ trong ước lượng

Trang 5

id Name Year ROA1 ROE Current_ratio Axit

1 ABT 2008 0.069668 0.065824 3.898441602 1.946903

1 ABT 2009 0.172443 0.206455 3.88842975 3.036423

1 ABT 2010 0.15831 0.211302 2.645730317 2.016027

1 ABT 2011 0.222258 0.254348 4.239249889 2.990029

2 ACL 2008 0.223329 0.50874 1.521035796 1.190687

2 ACL 2009 0.098261 0.267804 1.115761027 0.836681

2 ACL 2010 0.133083 0.261035 1.099327103 0.644905

2 ACL 2011 0.198009 0.385392 1.196426899 0.665263

3 AGF 2008 0.03748 0.018517 0.969358019 0.568287

3 AGF 2009 0.036298 0.023039 1.155066288 0.725999

3 AGF 2010 0.060055 0.067643 1.063423883 0.5514

3 AGF 2011 0.066414 0.094459 1.152046304 0.678557

Số đối tượng

quan sát

Dữ liệu thời gian

Dữ liệu chéo

Vũ Hữu Thành

Trang 6

I Mô hình tổng quát

𝑌𝑖𝑡 = α + 𝛽2𝑋2𝑖𝑡+ 𝛽3𝑋3𝑖𝑡+ ⋯ + 𝛽𝑛𝑋𝑛𝑖𝑡+ 𝑣𝑖𝑡 Trong đó:

- i: Đối tượng thứ i được quan sát (đơn vị chéo thứ i)

- t: Thời đoạn quan sát thứ t của đơn vị chéo thứ i

- α: Hệ số chặn

- β: Ảnh hưởng biên của từng biến số độc lập

- vit: Sai số của mô hình

1 Mô hình

tổng quát

Tùy vào cách phân tích vitmà mô hình trên chia thành hai mô hình sau:

(i) Mô hình sai số một nhân tố;

(ii) Mô hình sai số hai nhân tố

𝑌𝑖𝑡 = α + 𝛽2𝑋2𝑖𝑡+ ⋯ + 𝛽𝑛𝑋𝑛𝑖𝑡+ 𝑢𝑖+ 𝑒𝑖𝑡 Trong đó:

- vit= 𝑢𝑖+ 𝑒𝑖𝑡

- µ𝑖: ảnh hưởng của từng đơn vị đặc thù i không thay đổi theo thời gian nhưng không quan sát được

- eit : những sai số còn lại chưa đưa vào mô hình

2 Mô hình sai số một

nhân tố

One way – error

component model or

Individual-specific/time

effects model

Tùy vào việc 𝑢𝑖 có tương quan với các biến X hay không mà mô hình này sẽ chia

làm 2 loại: (i) Mô hình các ảnh hưởng cố định – Fixed effects hoặc (ii) Mô hình các

ảnh hưởng ngẫu nhiên (Random effects)

Trang 7

I Mô hình tổng quát

𝑌𝑖𝑡 = α + 𝛽2𝑋2𝑖𝑡+ ⋯ + 𝛽𝑛𝑋𝑛𝑖𝑡+ 𝑢𝑖+ λ𝑡+ 𝑒𝑖𝑡

Trong đó:

- vit= 𝑢𝑖+ λ𝑡+ 𝑒𝑖𝑡

- 𝑢𝑖: ảnh hưởng của từng đơn vị đặc thù i

- λ𝑡: ảnh hưởng của thời gian (hệ số chặn thay đổi theo thời gian)

- eit : những sai số còn lại chưa đưa vào mô hình

3 Mô hình sai số hai

nhân tố

Two way – error

component model or

Individual-specific and

time effects model

Tùy vào việc 𝑢𝑖 có tương quan với các biến X hay không mà mô hình này sẽ chia

làm 2 loại: (i) Mô hình các ảnh hưởng cố định – Fixed effects hoặc (ii) Mô hình các

ảnh hưởng ngẫu nhiên (Random effects)

Đ ặc điểm của mô hình Panel

• Tìm hiểu sự tác động của những biến số độc lập mà giá trị của nó thay đổi theo

thời gian (điều này là khác với dữ liệu chéo);

• Tìm hiểu sự tác động của những yếu tố thuộc về đặc điểm của đơn vị được quan

sát mà những yếu tố này không thay đổi theo thời gian.

Trang 8

II Các phương pháp ước lượng

1 Pooled Regresstion;

2 Fixed effects Regresstion;

3 Random effects Regresstion

3 phương pháp ước lượng chính

Cả ba phương pháp ước lượng đều đưa biến giả Dummy là năm vào mô hình để kiểm soát sự thay đổi của các biến số độc lập theo thời gian Trong khi đó đối với những yếu tố thuộc về đặc điểm của đổi đối tượng quan sát không thay thay đổi theo thời gian:

(i) Nếu không có bất cứ tác động nào tới Y  Sử dụng Pool;

(ii) Nếu có tác động tới các biến độc lập X  Sử dụng Fixed Effect;

(iii) Nếu không có tác động tới các biến độc lập X  Sử dụng Random Effect

1 Pooled Regresstion

• 𝑌𝑖𝑡 = α + 𝛽2𝑋2𝑖𝑡 + 𝛽3𝑋3𝑖𝑡 + ⋯ + 𝛽𝑛𝑋𝑛𝑖𝑡 + 𝑇𝑖𝑚𝑒𝐷𝑢𝑚𝑚𝑦 + 𝑣𝑖𝑡

Việc hồi quy theo Pool khiến cho mô hình gặp hiện tượng thiếu biến: Thiếu những ảnh hưởng không đổi theo thời gian của từng Id

Ommitted Variable problem:

- Ước lượng bị chệch (biased)

- Ước lượng không vững (Unconsistent)

Trang 9

2 F ixed Effect

• 𝑌𝑖𝑡 = α + 𝛽2𝑋2𝑖𝑡 + 𝛽3𝑋3𝑖𝑡 + ⋯ + 𝛽𝑛𝑋𝑛𝑖𝑡 + 𝑇𝑖𝑚𝑒𝐷𝑢𝑚𝑚𝑦 + 𝑢𝑖 + 𝑒𝑖𝑡

FE xuất hiện 𝑢𝑖 là những yếu tố cố định không đổi theo thời gian

Những yếu tố này không quan sát được và nằm ở sai số Nó có thể tác

động lên cả X và Y Vì 𝑢𝑖 tác động tới X nên vittác động tới X  Làm

cho ước lượng bị chệch và không vững Do vậy cần phải biến đổi

phương trình để các ước lượng β là không chệch và vững

Trong đó:

v it = 𝑢𝑖+ 𝑒𝑖𝑡

Trong mô hình này chúng ta giả sử ui có tác động tới x Có nghĩa là

Cov(ui,xit) ≠ 0 Điều này có nghĩa là sai số kế hợp: vit = ui + eitsẽ tương

quan với các biến độc lập xit Để xử lý tình trạng này, chúng ta phải tìm

cách khử ui

Trang 10

pháp biến

đổi:

Yit– Y*

t= α + β1(X1it– X*

1t) + … + βn(Xnit– X*

nt) + 𝑇𝑖𝑚𝑒𝐷𝑢𝑚𝑚𝑦 + vit– v*

t

ΔYit= α + β1ΔX1it+ … + βnΔXnit+ 𝑇𝑖𝑚𝑒𝐷𝑢𝑚𝑚𝑦 + Δvit Lúc này Δvit= (ui+ eit) – (u*

i+ e*

it) = eit- e*

it

Do uiđã bị khử nên Δvitkhông tác động tới ΔXnitnữa Lúc này sẽ ước lượng được các β đảm bảo không chệch và vững trong khi đó vẫn thỏa mãn được sự tác động của các yếu tố cố định theo thời gian

2 F ixed Effect

• 𝑌𝑖𝑡 = α + 𝛽2𝑋2𝑖𝑡 + 𝛽3𝑋3𝑖𝑡 + ⋯ + 𝛽𝑛𝑋𝑛𝑖𝑡 + 𝑇𝑖𝑚𝑒𝐷𝑢𝑚𝑚𝑦 + 𝑢𝑖 + 𝑒𝑖𝑡

RE xuất hiện 𝑢𝑖 là những yếu tố cố định không đổi theo thời gian Những yếu tố này không quan

sát được và nằm ở sai số Nó được giả định là không tác động lên X Vì 𝑢𝑖không tác động tới X nên vitkhông tác động tới X

Tuy nhiên vấn đề ở chỗ, ui+ eitđược gọi là sai số kết hợp theo từng thời điểm vì vậy nó có thể xuất hiện hiện tượng tự tương quan ở sai số Để xử lý vấn đề này khổng thể chạy Pool thông thường mà phải biến đổi mô hình

Trong đó:

vit= 𝑢𝑖+ 𝑒𝑖𝑡

Trang 11

Cách thức

biến đổi:

Hồi quy phương trình trên theo OLS được gọi là GLS

Từ công thức: Corr(vit,vis) = σ2

u/(σ2

u+ σ2

e) Đặt: θ = 1 – [σ2

u/(Tσ2

u+ σ2

e)]1/2

Phương trình biến đổi:

Yit– θY*

t= β0(1 – θ) + β1(X1it– θX*

1t) + … + βn(Xnit– θX*

nt) + 𝑇𝑖𝑚𝑒𝐷𝑢𝑚𝑚𝑦 + uit – θu*

t

L ựa chọn FE và RE :

Hausman Test

Trang 12

I H ausman test

Hausman test là kiểm định phổ biến dùng để lựa chọn giữa hai loại mô

hình FE hay RE Giả thuyết của Hausman như sau:

H0: FE = RE  Sử dụng RE hiệu quả hơn

H1: FE ≠ RE  Sử dụng FE hiệu quả hơn

K iểm định cho FE và RE

Trang 13

I Các loại kiểm định dành cho FE

X ử lý v i phạm m ô hình

Trang 14

Trường hợp 1

FE : P hương sai sai số thay đổi

FE : T ự tương quan ở sai số - AR(1)

Trang 15

Hướng xử lý: Sử dụng phương pháp ước lượng FGLS – Feagible Genaral Least Square

FE : T ự tương quan ở sai số - AR(1)

Ví dụ: Sử dụng file: 03 Xu ly sai pham mo hinh 2

FE : P hương sai sai số thay đổi + T ự

tương quan ở sai số - AR(1)

Trang 16

Hướng xử lý: Sử dụng phương pháp ước lượng PCSE

quan ở sai số - AR(1)

FE : P hương sai sai số thay đổi + T ương

quan giữa sai số của các đơn vị chéo

Trang 17

Hướng xử lý: Sử dụng phương pháp ước lượng FGLS – feasible generalized least

squares

quan giữa các sai số của đơn vị chéo

Ghi chú: Thông thường đã xuất hiện tương quan giữa sai số của các đơn vị chéo thì

sẽ bị hiện tượng phương sai sai số thay đổi

FE : P hương sai sai số thay đổi + T ương

quan giữa sai số của các đơn vị chéo + T ự

tương quan

Định dạng
Số trang	17
Dung lượng	2,48 MB