Ta nhận xét rằng, việc chọn mô hinh A thay vì mô hình B
hàm ý rằng, ta đã coi giá thuyết ÍJ : y = Ú là đứng. Trong khi
việc chọn A và loại bỏ mô hình C lại bao hàm rằng, ta coi gia thuyét déng thoi: H, : 8, = 8, =0 lading. Viéc kiém dinh mite độ có ý nghĩa của từng tham số mô hình, như đã đề cập, được tiến hành bởi T test. Trong khi đó, việc kiểm định giả thuyết đồng thời lại chưa được để cập. Nên ta không biết liệu có nên
bỏc bú hay khụng giả thuyết đồng thời: Jfụ : ỉ; = ỉ, =0. Tỳc là
ta chưa có cơ sở để loại mô hình C.
Cụ thể hơn, trong Chương HI, chúng ta đã nói rằng, kiểm định T test về mức độ có ý nghĩa của tham số ước lượng có thể được làm đơn giản bởi việc sử dụng ứ-value. Trong mụ hỡnh ...phân tích ở. đây, ta thấy, chỉ.có.hệ.số hôi. quy. của. SQET-là.có.ý...
nghĩa giải thớch trong cả 3 mụ hỡnh A, B và C. Trong khi ứ- value của BEDRMS và BATHS trong cả hai mô hình B và C đều
qué cao ( p—value > 0.05). Tức là các hệ số hồi quy đi kèm với
các biến giải thích này là không có ý nghĩa ở mức  = 5%. Vì vậy, xét một cách riêng biệt, ta nên loại từng biến này ra khỏi mô hình. Nhưng liệu cả hai biến đó, một cách đồng thời, lại có ý nghĩa giải thích thì sao? Điều đó đẫn đến vấn đề kiểm định giả dưới đây.
94
Việc loại bỏ cùng một lúc hai biến BEDRMS va BATHS la tương đương với việc chấp nhận giả thuyết đông thời:
Hy: f,;=8, =0. Ta muốn nhân mạnh rằng, giả thuyết đó là
hoàn toàn khác với việc, cùng một lúc, xảy ra hai giả thuyết
tiộng biột: 1, : 8, =0 va H,: ỉ, = 0. Từng giả thuyết riờng biệt
đúng, không có nghĩa là giả thuyết đồng thời cũng đúng.
Bây giờ, ta hãy xét xem làm thế nào để kiểm định giả thuyết đồng thời 1g : ổ; = 8, = 0. Hãy nhìn lại hai mô hình sau:
(U): PRICE = B, + B,SQFT + B,BEDRMS + B, BATHS + € (4.1)
(R): PRICE = 8, + 8,SOFT + , (4.2)
Mô hình (Ủ) [tức là mô hình C trong Bảng 4.2], như đã nói, được gọi là mô hình không bị ràng buộc (unrestricted model).
Mô hình (R) [tức là mô hình A trong Bảng 4.2], như đã nói, được gọi là mô hình bị ràng buộc (restricted model). Ta nhắn mạnh lại răng, sở dĩ gọi như vậy là vì mô hình (R) chính là mô hình (U), nhưng chịu ràng buộc là Íạ : ổ; = 0, =0. Việc lựa chọn xem mô hình nao 1a đúng, về thực chất quy về việc kiểm định giả thuyệt kép sau:
H 1 =0 ys. „; không phảilà Hạ
A, =0 ;
Chúng ta đã nhận xét rằng, việc đưa thêm biến giải thích vào
mô hình luôn làm iăng mức độ giải thích của mô hình, tức là làm giảm tổng bình phương sai số #ZSS. Vì vậy, ta luôn có:
ESSp > ESS„. Trong đó, zss„ là tổng bình phương sai số ước
lượng của mô hình (R) và ESS, là của mô hình (U).
Chúng ta nhận xét thêm rằng, nếu các biến BEDRMS và BATHS là không có ý nghĩa lắm cho việc giải thích giá căn hộ
(PRICE), thì việc đưa chúng vào mô hình sẽ làm tổng bình
phương sai sô ước lượng giảm đi, nhưng không nhiêu. Nói khác
95
đi, nếu giả thuyết Hạ là đúng, thì higu (ESS, -ESS,) la
dương, nhưng với độ lớn không đáng kế. Ngược lại, nếu Jạ là sai, thì việc đưa thêm các biến BEDRMS và BATHS sẽ cải thiện đáng kế mức độ giải thích của mô hình. Do vậy, độ lệch (ESS, ~ ESS, ) sẽ rất lớn. Như vậy, chứng ta có thể đi đến nhận
định rằng, khi higu (ESS, - #SS„,) là lớn, thì ta sẽ bác bỏ giá thuyết jạ (RH,). Tuy nhiên, như thé nao thì hiệu (ESS„— ESS„) được coi là lớn? Điều đó dẫn đến việc lập thống
kê Ƒ, mà ta sẽ trình bày dưới dạng tổng quát như sau. Xét hai lựa chọn về mô hình khác nhau:
(ŒU:Ÿ=/ỉ+0,1;+8,4j+...+ 0v +ế (4.3)
(R): Y= 8, + BX, + BiXy ++ Be Xp HE (4.4)
Mô hình (4.4) chính là mô hình (4.3), với J rang bude:
Bega = Beagag = = By = 0. N6i khde di, ta mudn kiém dinh
giá thuyết đồng thời sau:
y_,u =0
Hạ: Bru 79 oe H, : khéng phải là đụ
8c =0
Người ta có thể chứng minh được rằng, d đại j lượng sa Sau có
phân: bố: -FˆvớiJvà (N= Ky bậc tực dozer re __ mnwmyvrereer
_ Œ§S, — ESSu)/J
'~ pm. J0 E) PNR) (45)
Trong (4.5), nếu (ESS; — ESSự)có giá trị lớn, thì sẽ khiến cho Ƒ; cũng có giá trị lớn. Điều đó dẫn đến nguyên tắc là, nếu Ÿ„
lớn hơn giá trị F-tra bảng: # > F;(J,M— K), khi đó, việc thêm
96
các biến giải thích là cần thiết. Do vậy, ta bác bó giá thuyết (RHp).
Ngược lại, nêu #; < F; (7, — K} thì việc thêm các biến giải thích
là không cần thiết. Và do vậy, ta sẽ không bác bỏ giả thuyết nói
rằng, chúng đồng thời không có ý nghĩa giải thích (DNRH,).
DNRH, RH
Đồ thị 4.1. Kiếm định giả thuyết với F test
Ví dụ 4.1 (tiếp theo): trong ví dụ về giá căn hộ, với việc chọn giữa mô hình (4l) và (42) ta có . zSS„=18,274,
k§S„ = 16,700 [xem Bang 4.2], 7 =2,(W - K) =10. Vì vậy:
Fe (18,274 -16,700)/2 * 16,700/10 =0471
Ta có thể tra bảng E-statistic: fags(2,10) = 4.1. Vì vậy, ta có:
E<Fqg(210). Tức là ta sẽ không bác bổ giả thuyết
ly: 8; = , =0. Khi đó, mô hình với chỉ một biến giải thích là
._ diện tích sử dụng (SÓF7) được coi là mô hình đúng nhất, theo kiểm định Wald.