1. Trang chủ
  2. » Tất cả

Chuong-3-xay-dung-khoang-tin-cay-kiem-dinh-gia-thiet-thong-ke

9 1 0

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 9
Dung lượng 813,54 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Chương 3 SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY Chương 2 đã trình bày phương pháp OLS đối với mô hình hồi quy bội, cũng như các giả thiết để đảm bảo rằng các ước lượng thu đượ

Trang 1

Chương 3 SUY DIỄN THỐNG KÊ

VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY

Chương 2 đã trình bày phương pháp OLS đối với mô hình hồi quy bội, cũng như các giả thiết để đảm bảo rằng các ước lượng thu được là các ước lượng điểm tốt nhất cho các hệ số hồi quy của tổng thể

Chương này tiếp tục trình bày bài toán suy diễn thống kê về các hệ số hồi quy tổng thể sử dụng các thông tin thu được từ kết quả ước lượng Tất cả các suy diễn này được đưa ra dựa trên điều kiện là các giả thiết của mô hình phải được thỏa mãn và được áp dụng cho các mô hình hồi quy hai biến cũng như mô hình hồi quy nhiều biến

§1 QUY LUẬT PHÂN PHỐI XÁC SUẤT CỦA

Xét mô hình hồi quy tuyến tính k biến:

Với hàm hồi quy mẫu thu được từ mẫu ngẫu nhiên kích thước n: {(X2i, , Xki, Yi), i =1, 2, , n}:

̂ ̂ ̂ ̂

Để biết quy luật phân phối của các ̂ chúng ta đưa ra giả thiết sau:

Giả thiết 5: Sai số ngẫu nhiên tuân theo quy luật chuẩn:

Các giả thiết 1 - 5 được gọi là các giả thiết của mô hình hồi quy tuyến tính cổ điển, và mô hình thỏa mãn các giả thiết này được gọi là mô hình hồi quy tuyến tính cổ điển

Định lý 3.1: Khi các giả thiết 1 - 5 thỏa mãn ta có:

Trong đó được tính theo công thức ( ̂ )

Định lý 3.2: Khi các giả thiết 1- 5 thỏa mãn ta có:

Trang 2

̂ ̂ Tương tự ta cũng có:

̂ ̂

̂ ̂ với a, b là hai số thực bất kỳ không đồng thời bằng 0

§2 BÀI TOÁN XÂY DỰNG KHOẢNG TIN CẬY

CHO CÁC HỆ SỐ HỒI QUY

Ý nghĩa: Bài toán xây dựng KTC cho hệ số hồi quy nhằm trả lời câu hỏi sau: khi một (hay

nhiều) biến độc lập thay đổi một đơn vị thì giá trị trung bình của biến phụ thuộc thay đổi trong khoảng nào?

I Khoảng tin cậy cho một hệ số hồi quy: đánh giá tác động khi một biến độc lập thay đổi

Khoảng tin cậy đối xứng với độ tin cậy (1-α) cho các hệ số hồi quy được xác định bởi công thức sau:

̂ ( ̂ ) ̂

( ̂) Nghĩa là: Với độ tin cậy (1-α) khi biến Xj gia tăng 1 đơn vị và các yếu tố khác không đổi thì trung bình của biến Y gia tăng trong khoảng này

Ví dụ

II Khoảng tin cậy cho biểu thức của hai hệ số hồi quy: đánh giá tác động khi hai biến độc lập cùng thay đổi

Một cách tổng quát, với a và b là các giá trị bất kỳ (có thể nhận giá trị dương hoặc âm), thì khoảng tin cậy cho mức gia tăng của trung bình của biến Y khi X2 tăng a đơn vị và X3 tăng b đơn vị được tính bởi công thức:

̂ ̂ ⁄ ( ̂ ̂ ) ̂ ̂ ⁄ ̂ ̂

Trong đó sai số chuẩn được tính theo công thức:

( ̂ ̂ ) √ ̂ ̂ ̂ ̂

Trang 3

Ví dụ 2.5. Điều tra về mối quan hệ giữa thu nhập và chi tiêu hộ gia đình, thu được kết quả sau:

̂

se 9.65 0.016 0.004 Trong đó CT là chi tiêu (triệu đồng/năm), TN là thu nhập từ lao động (triệu đồng/năm) và

TS là giá trị tài sản (tỷ đồng) của hộ gia đình

Khi giá trị tài sản tăng thêm 10 triệu đồng nhưng thu nhập lao động giảm 1 triệu, khi đó ảnh hưởng lên mức chi tiêu sẽ có thể nhận giá trị trong khoảng nào? Biết rằng ̂ ̂ )=0.0001

3.2.4 Các yếu tố ảnh hưởng đến độ dài khoảng tin cậy

 Số bậc tự do (n-k): số bậc tự do càng bé thì ⁄ càng nhỏ và như vậy KTC càng rộng Như vậy với cùng một kích thước mẫu n, số biến độc lập đưa vào mô hình càng lớn thì nó sẽ có tác động làm giảm độ chính xác của ước lượng Vậy việc đưa vào một biến số sẽ có hai tác động đến kết quả ước lượng: một mặt nó giúp làm gia tăng R2 , do đó gia tăng khả năng giải thích biến phụ thuộc của mô hình, do đó gia tăng khả năng dự báo của mô hình, mặt khác nó làm giảm độ chính xác của ước lượng Tác động này là khá lớn khi kích thước mẫu là nhỏ, nhưng sẽ giảm dần và trở nên không đáng kể khi kích thước mẫu trở nên khá lớn

 Mối tương quan tuyến tính giữa Xj và các biến độc lập còn lại trong mô hình: ta biết rằng mối tương quan này được đo bởi R2 , mối tương quan tuyến tính càng chặt thì

R2 này càng cao Theo công thức (3.3.5), khi R2j cao sẽ làm cho ( ̂) lớn, và KTC rộng Khi R2j gần đến giá trị 1, KTC sẽ rộng ra vô cùng và trở nên mất ý nghĩa thực

tế

§3 BÀI TOÁN KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

VỀ HỆ SỐ HỒI QUY

I Kiểm định giả thuyết về một hệ số hồi quy

Xét mô hình hồi quy

Một câu hỏi cơ bản mà người làm mô hình quan tâm là: liệu biến Xj nào đó trong mô hình có tác động đến biến Y hay không

Ta biết rằng nếu Xj có tác động đến biến Y thì , và ngược lại, nếu Xj không tác động đến biến Y thì

Quy tắc:

Trang 4

1 Lập cặp giả thuyết như sau: H: ̂ ; K: ̂

2 Xét thống kê:

̂ ̂

3 Nếu |t|>tα/2(n-k): bác bỏ giả thiết H, chấp nhận đối thiết K

4 Nếu |t|<tα/2(n-k): chấp nhận giả thiết H, bác bỏ đối thiết K

Việc kiểm định các giả thuyết dạng này có thể được tóm tắt trong bảng sau:

Trong đó:

Ví dụ 3.5: Khi nghiên cứu các yếu tố tác động lên tiền lương của người lao động ngành may mặc, với tập số liệu 30 quan sát ta thu được kết quả ước lượng sau:

̂

se (0.15) 0.02 0.05

Trong đó W, GD và KN lần lượt là mức lương (triệu đồng/tháng), số năm đi học (năm), và kinh nghiệm của người lao động (năm)

Gỉa sử trung bình mỗi năm lương của viên chức nhà nước tăng ở mức cố định 0.15 triệu Vậy có thể cho rằng mức tăng theo số năm kinh nghiệm của những người làm ngành may mặc có cao hơn so với viên chức nhà nước hay không?

II Kiểm định giả thuyết về một ràng buộc giữa các hệ số hồi quy - kiểm định T

Xét mô hình hồi quy k biến:

Bài toán: Trong nhiều ứng dụng thực tế, chúng ta cần kiểm định về mối quan hệ giữa

các hệ số hồi quy, như so sánh tác động giữa hai biến độc lập lên biến phụ thuộc Hoặc giả sử kết quả hồi quy cho thấy ̂ ̂ , và ta muốn kiểm định giả thuyết cho rằng tác động của biến Xi và Xj lên biến Y là khác nhau hay giống nhau… Khi đó các bài toán kiểm định giả thuyết về một ràng buộc giữa hai hệ số hồi quy có thể được tóm tắt trong bảng sau

Trang 5

Loại cặp giả thiết H K Bác bỏ H nếu

Hai phía * * |tqs|>tα/2(n-k)

Một phía * * tqs<-tα(n-k)

Một phía * * tqs>tα(n-k)

̂ ̂ ̂ ̂

a, b, a* là các hằng số cho trước, tùy vào yêu cầu cụ thể của giả thuyết cần kiểm định

Ví dụ 3.7. Để xem xét mối quan hệ giữa các yếu tố đầu vào với sản lượng trong các nhà máy dệt kim, người ta chạy mô hình hồi quy với số liệu từ 35 nhà máy và thu được kết quả sau

Q = 150 + 0.5K+ 0.7L+e (se) (1.2) (0.1) (0.2) Trong đó Q là số áo sản xuất được (trăm chiếc áo), K là số máy dệt (máy), L là số lao động (10 người)

Giả sử rằng chi phí để thuê 10 lao động cũng bằng chi phí thuê 1 máy dệt Với mức ý nghĩa 5%, có thể cho rằng tiền chi cho lao động hiệu quả hơn tiền chi cho máy dệt hay không? Biết rằng ( ̂ ̂ )

Giả thiết H: ; Đối thiết K:

Chú ý: Trong các phần mềm thông dụng như Eviews hay Stata đều báo cáo giá trị P tương

ứng với kiểm định giả thuyết về sự bằng 0 của các hệ số hồi quy Với giá trị P này, việc đưa

ra kết luận kiểm định trở nên thuận tiện hơn: khi giá trị P này bé hơn mức ý nghĩa thì ta sẽ bác bỏ H (Excel tra bảng hàm phân phối Student: TINV(prob,fredom))

Quy tắc kiểm định sử dụng giá trị xác suất:

Nếu giá trị xác suất P tương ứng với giá trị quan sát của thống kê kiểm định là nhỏ hơn mức

ý nghĩa α thì ta sẽ bác bỏ giả thuyết H

III Kiểm định giả thuyết về nhiều ràng buộc của các hệ số hồi quy- kiểm định F

Trong hai mục trên chúng ta đã xem xét bài toán kiểm định giả thuyết liên quan đến một hệ

số hồi quy, hoặc liên quan đến hai hệ số hồi quy nhưng chỉ trong một ràng buộc, và kiểm định T là kiểm định thông dụng để thực hiện các kiểm định này

Xét mô hình hồi quy k biến:

Giả sử chúng ta muốn kiểm định đồng thời hai ràng buộc:

H: ; K:

Trang 6

Khi đó, mô hình hồi quy sau là hoàn toàn tương đương:

(*) còn được gọi là mô hình không có ràng buộc; (**) là mô hình có ràng buộc

Nếu H là đúng thì kết quả ước lượng hai mô hình này phải khá giống nhau, và như vậy

sự khác biệt giữa RSS trong hai mô hình ước lượng là khá nhỏ Do đó nếu sau khi ước lượng, kết quả cho thấy sự khác biệt giữa RSS của hai mô hình là lớn thì đây là chứng cứ để bác bỏ giả thuyết H

1 Quy tắc kiểm định F

Bước 1: Thiết lập cặp giả thuyết thống kê

Bước 2: Ước lượng hàm hồi quy không có ràng buộc (*) và hàm hồi quy có ràng buộc (**), thu được RSS(U) và RSS(R) tương ứng, trong đó U và R dùng để gắn với mô hình không có ràng buộc (unrestricted) và mô hình có ràng buộc (restricted)

Bước 3: Tính giá trị quan sát của thống kê kiểm định, F, theo công thức sau:

Trong đó m là số ràng buộc trong giả thuyết H và k(U) là số hệ số hồi quy trong mô hình không có ràng buộc

Bước 4: Do đó nếu Fqs > f(m,n-k(U)) thì giả thuyết H sẽ bị bác bỏ, trong trường hợp ngược lai, chúng ta chưa có đủ cơ sở để bác bỏ H

Tra hàm excel phân phối Fisher: FINV(0.05,2,2)

Ví dụ 3.9: Xét mô hình hồi quy về tiền lương với 32 kết quả quan sát:

L = 2404 + 86.12 GD - 14.88 MGD - 30.25 AE + e

RSS = 3649563, n=32 trong đó L, GD, MGD và AE lần lượt là tiền lượng, trình độ học vấn, trình độ học vấn người mẹ, số anh chị em trong gia đình của người lao động

Để kiểm định các yếu tố " học vấn người mẹ" và " số anh chị em trong gia đình" là đồng thời không ảnh hưởng tới tiền lương người lao động, ta thực hiện như sau:

H: ; K:

Ước lượng mô hình hồi quy có ràng buộc:

thu được RSS = 3770332

Trang 7

Do đó giá trị quan sát của thống kê kiểm định Fqs=0.46<f0.05(2,28): bác bỏ H

2 Kiểm định F sử dụng R 2

Khi biến phụ thuộc của mô hình không ràng buộc và mô hình có ràng buộc là như nhau, giá trị Fqs trong công thức (3.3.4) có thể được tính bởi công thức tương đương sau:

Ví dụ 3.10: Sử dụng số liệu cons3, ta có hàm hồi quy ước lượng sau:

CT = 78.27 + 0.72TN - 0.002TS +3.89CK +0.18TNP + e,

Se (32.15) 0.037) (0.054) (4.19) (0.60), R2 = 0.9996646, n = 30

Trong đó CT, TN, TS, CK và TNP lần lượt là chi tiêu, thu nhập từ lao động, giá trị tài sản, thu nhập từ chứng khoán, và thu nhập phụ khác trong năm

Giả sử muốn kiểm định giả thuyết cho rằng các biến TS, CK và TNP đều cùng không tác động đến CT, ta thực hiện như sau:

Thiết lập cặp giả thuyết:

H: ; K:

Ước lượng mô hình có ràng buộc sau:

CT=

Ta có kết quả sau: CT = 80.16 + 0.85TN + e,

Se (8.52) (0.004)

R2 = 0.999338, n = 30

Do đó giá trị quan sát của thống kê kiểm định là:

Fqs=10.88>f0.05(3,25) : chấp nhận K

IV Kiểm định về sự phù hợp của hàm hồi quy

Một trường hợp đặc biệt của kiểm định giả thuyết về nhiều ràng buộc của các hệ số hồi quy là bài toán kiểm định sau:

H: ; K:

Giả thuyết H này ngụ ý rằng toàn bộ các biến độc lập trong mô hình đều không ảnh hưởng đến biến phụ thuộc Nếu H0 là đúng thì mô hình là không có ý nghĩa (non-significant), hay

Trang 8

còn được gọi là mô hình không phù hợp Do đó kiểm định trên còn được gọi là kiểm định

về sự phù hợp của hàm hồi quy

Để áp dụng quy trình kiểm định F trình bày trong mục 3.3.4 nói trên với cặp giả thuyết (3.3.5) chúng ta ước lượng hai mô hình:

1 Mô hình gốc - mô hình không có điều kiện ràng buộc:

2 Và mô hình với điều kiện ràng buộc:

Mô hình này không có biến độc lập nên có hệ số xác định bằng 0

Do hai mô hình đều có cùng biến phụ thuộc nên thống kê kiểm định có thể được tính theo công thức:

So sánh giá trị này với fα (k-1,n-k) sẽ cho ta đưa ra các kết luận tương ứng

bt1ch1.wf1

trang 28

§5 DỰ BÁO GIÁ TRỊ CỦA BIẾN PHỤ THUỘC

VÀ SAI SỐ DỰ BÁO

I Dự báo giá trị của biến phụ thuộc

Xét mô hình hồi quy k biến sau đây:

và hàm hồi quy mẫu tương ứng:

̂ ̂ ̂ ̂ Khi các giả thiết 1-4 thỏa mãn, ta có

Trang 9

Do trong công thức (3.3.6) được thay bằng ước lượng của nó là nên ta có:

Với

Do đó ta có:

Như vậy khoảng tin cậy với độ tin cậy (1) cho giá trị trung bình của biến phụ thuộc khi X = Xi là:

Ngày đăng: 19/03/2022, 12:03

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w