KIẾM ĐỊNH GIẢ THUYẾT ĐỐI VỚI MÔ HÌNH LOGIT VÀ PROBIT

Một phần của tài liệu Bài giảng kinh tế lượng 2 (Trang 121 - 124)

Kiểm ịnh t ược dùng khi chỉ kiểm ịnh riêng lẻ một hệ số, chẳng hạn Ho:  ii* Kiểm ịnh F (Wald test) kiểm ịnh về tổ họp tuyến tính của các hệ số, chẳng hạn

1 2 4

2  , 0 Kiểm ịnh LM (score statistic) bằng tiêu chuẩn 2 ể kiểm ịnh Ho:

1 2 ... 0

k m k m k

        

7.1. Kiểm định bằng tỷ số hàm hợp lý (LR)

Đối với mô hình Logit, Probit và các mô hình logistic khác, tiêu chuẩn có hiệu quả hon là kiểm ịnh bằng tỷ số hàm hợp lý LR (Wooldridge, 2008). Tỷ số hàm họp lý là một thống kê dùng ể so sánh sự phù hợp của hai mô hình. Giả thiết Ho là giả thiết nào ó về các hệ số của các biến ộc lập, về quan hệ giữa các hệ số,...

Chẳng hạn:

0 1 2

2 2 2

1 1 2

: ... 0

: ... 0

k m k m k

k m k m k

H H

  

  

   

   

   

   

Thống kê tỷ số hợp lý: R2(LURLR) (3.33)

trong ó LUR và LR là giá trị Ln hàm hợp lý khi không có Ho và khi có H0. Nếu số các iều kiện ràng buộc bằng m và giả thiết Ho úng thì LR phân bố xấp xỉ 2(m).

Các phần mềm như SPSS, EVIEWS, STATA,... ều ước lượng ược các mô hình logistic và ưa ra các thống kê như các mô hỉnh tuyến tính khác.

Số o ộ phù hợp cũng ược tính toán gọi là ―tỷ lệ phần trăm dự báo úng‖. Tỷ lệ phần trăm dự báo úng ược tính toán như sau:

Với mỗi i, tính xác suất ể Y nhận giá trị bằng 1, tức là tính PiP Y( 1|XXi) Giá trị dự báo *1 1

0

i i

neu p c

Y neu p c

 

   (3.34) Thông thường c = 0,5 (Wooldridge, 2008).

So sánh Y* với Y ta tính ược tỷ lệ phần trăm dự báo úng. Chẳng hạn mẫu có n = 300 quan sát, trong ó Y = 0 có 180 quan sát, Y* tương ứng có 150 giá trị bằng 0 và 60 giá trị Y* = 1 tương ứng với Y = 1, khi ó tỷ lệ phần trăm dự báo úng 210/300 = 70%.

Có một ộ o khác Psedo R-squared = 1 - LUR/LO. Trong ó, Lo là giá trị Ln của

hàm hợp lý khi mô hình chỉ có hệ số chặn. Ý nghĩa của ộ o này ược giải thích giống như R2.

7.2. Kiểm định sai số tiêu chuẩn Huber/White (QML)

Kiểm ịnh Huber/White ối với các sai số tiêu chuẩn ngoại lai (robust) ược tính cho các sai số tiêu chuẩn tựa hợp lý tối a (QML) hay pseudo-ML (Các sai số tiêu chuẩn này không phải ngoại lai theo phương sai của sai số thay ổi mà ngoại lai ối với ịnh dạng phân bố của Y).

1 1 1

ˆ ˆ ˆ ˆ ˆ

QML( )

Cov  HggH (3.35) Trong ó ˆg và ˆH là gradien và ma trận Hessian của ln(L) với các giá trị ước lượng ML.

7.3. Các sai số tiêu chuẩn của mô hình tuyến tính tổng quát (GLM Standard Errors).

Nhiều mô hình biến phụ thuộc là rời rạc hay biến phụ thuộc bị giới hạn thuộc vào một lớp các mô hình tuyến tính tống quát. Giả thiết của mô hình tuyến tính tổng quát là phân bố của biến nội sinh thuộc vào họ các phân bố dạng mũ và trung bình có iều kiện có dạng phí tuyến của phân tuyến tính Xi:

( i| i ) ( i ) E Yy X  h X

Dù hiệp phương sai QML là ngoại lai đối với định dạng của phân bố, các ước lượng không có tính hiệu quả. Một ước lượng vững khác của hiệp phương sai tìm ược nếu ta thêm iều kiện phương sai úng tỷ lệ với phương sai của phân bố ược sử dụng ể xác ịnh logarit hàm hợp lý:

2

( i| i ) ar (ML i| i ) Var Yy X  V Yy X

Nói cách khác tỷ lệ phương sai có iều kiện ối với trang bình là một hằng số 2. Hằng số này ộc lập với X.

Đa số các kết quả thực nghiệm ều có 2> 1, trường hợp này ược gọi là khuếch tán hay phân kỳ. Nếu như iều kiện phương sai tỷ lệ này ược thoả m n thì ước lượng vững của hiệp phương sai GLM ược cho bởi:

Trong ó:

2 2

2 1

1 1

( ˆ )

1 1

ˆ ( , ,ˆ ˆ ( , , )ˆ ˆ

n n

i i

i t

i t

y y e

n k v X n k v X

      

  

    (3.36)

7.4. Kiểm định sự phù hợp (Goođness-of-Fit Test) Hosmer- Lemeshow

Giả sử số liệu phân thành nhóm, j = 1,2,... J. Ký hiệu nj là số quan sát trong nhóm j

số quan sát Y =1 và giá trị dự báo trung bình trong nhóm j là:

( )

ˆ( ) ˆ / (1 ( ˆ)) /

i t j

i j i j

i i

Y j y

p j p n F X n

 

   

  (3.37)

Thống kê kiểm ịnh Hosmer-Lemeshow:

2

1

( ( ) ˆ( )) ˆ (1 ˆ( ))

j

j

j j j

Y j n p j

HLn p p j

 

  (3.38)

Phân bố của HL chưa biết, tuy nhiên Hosmer và Lemeshow (1989) từ các kết quả mô phỏng ưa ra bằng chứng rằng nếu mô hình ược ịnh dạng úng thi HL có phân bố

2 với J-2 bậc tự do (Các phát hiện này dựa trên mô phỏng khi J gần n).

7.5. Kiểm định sự phù hợp Andrews

Các số liệu ược nhóm thành từng nhóm. J là số nhóm. Do Y là biến nhị phân, nên có 2*J các ô mà bất kỳ quan sát nào cũng rơi vào một trong các ô này. Andrews (1988a, 3.18; 1988b,17) ề xuất 3 kiểm ịnh phụ thuộc vào việc chọn ma trận trọng số.

A=(aij) cấp n*J, ai j = l ( i j)- ˆi trong ó hàm chỉ số l (i j) bằng 1 nếu i j và bằng 0 nếu ngược lại. ỏ các nhóm có Y=0.

( ) /

B L   là ma trận cấp n*k. Thống kê kiểm ịnh Andrews nR2, R2 nhận ược khi hồi quy một hằng số (số 1) theo các cột của A và . Giả thiết Ho: mô hình ịnh dạng úng, nR2 có phân bố 2( )J

Như vậy ý tưởng kiếm ịnh theo Andrews hay Hosmer-Lemeshow là kiểm ịnh sự phù hợp của phân bố xác suất bằng tiêu chuẩn 2. ằng cách so sánh giá trị kỳ vọng ước lượng ược với giá trị quan sát ược phân nhóm. Nếu có sự khác biệt lớn thì bác bỏ giả thiết mô hình ưa ra là phù hợp với số liệu.

Về vấn ề phân nhóm, trước hết phải chọn biến ể thực hiện việc phân nhóm. Tiếp ến cần ưa ra quy tắc phân nhóm. Quy tắc phân nhóm dựa vào hoặc là các giá trị khác biệt hoặc là lượng của biên phân nhóm.

Nếu như biến phân nhóm chỉ có ít giá trị khác biệt thì nên chọn phân nhóm theo các giá trị khác biệt này (Distinct values), mỗi nhóm tương ứng với một giá trị.

Nếu như biến phân nhóm có một số lớn các giá trị khác biệt, thì xác ịnh số nhóm trở lên phức tạp. Trong trường hợp này có thể chưa chắc nhóm ủ số nhóm ặt ra hoặc số quan sát trong mỗi nhóm bằng nhau hoặc số quan sát trong từng nhóm không ủ lớn. Nếu gặp các tình huống này cần phải hiệu chỉnh lại. Đa số các phần mềm ều trợ giúp giải quyết trong trường hợp này.

VIII MÔ HÌNH PROBIT: VÍ DỤ THỰC NGHIỆM

Để mô tả các cơ chế vừa ược thảo luận, ta sẽ sử dụng dữ liệu trong bảng cho.

Dựa trên n.e.d, chúng ta thu ược các kết quả sau:

Iˆ i = -1.0088 +0.0481 Xi

(0.0582) (0.0025) R2 =0.9786 T = (-17.330) (19.105)

nó chỉ ra rằng khi X tăng một ơn vị, về trung bình, I tăng 0.05 ơn vị. Như lưu ý ở phần trước, giá trị chỉ số Ii càng cao, xác suất việc có ô tô riêng của hộ gia ình càng lớn. Do vậy, nếu X =6 (nghìn), Iˆ từ kết quả ở trên, ó là -0.7202 nhưng nếu X =7, i Iˆ là -i 0.6721; thành phần ầu tiên tương ứng với xác suất khoảng 0.24 và thành phần thứ hai tương ứng với xác suất khoảng 0.25. Tất cả có thể thu ược từ CDF chuẩn tích luỹ chuẩn hoá hoặc, một cách hình học.

Các kết quả ước lượng dựa trên probit ( = n.e.d +5) như sau, trong ó Zi = probit:

Zi = 3.9911 + 0.0481 Xi

(0.0582) (0.0025) R2=0.9786 t = (68.560) (19.105)

Ngoại trừ hệ số chặn, các kết quả này là ồng nhất với kết quả chỉ ra ở trên.

Nhưng iều ó không quá ngạc nhiên.

Một phần của tài liệu Bài giảng kinh tế lượng 2 (Trang 121 - 124)

Tải bản đầy đủ (PDF)

(362 trang)