Đinh Thị Thanh Bình Khoa Kinh Tế Quốc Tế- Đại học Ngoại thương Chương 4 Kiểm định giả thuyết thống kê với phương trình hồi qui đơn biến... H0 gọi là giả thiết thống kê giả thiết kh
Trang 1TS Đinh Thị Thanh Bình Khoa Kinh Tế Quốc Tế- Đại học Ngoại thương
Chương 4 Kiểm định giả thuyết thống kê với phương
trình hồi qui đơn biến
Trang 2KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
Ví dụ như một viện nghiên cứu nông nghiệp cho
rằng giống lúa mới SYM05 có năng suất trung
bình 9 tấn/ha Để đánh giá nhận định này, ta thiết
lập giả thiết sau:
H 0: µ = 9
H 1: µ ≠ 9
Với µ là năng suất trung bình thực tế của giống lúa này
µ0 = 9 là năng suất trung bình của giống lúa này theo báo cáo của viện nghiên cứu
2
Trang 3 H0 gọi là giả thiết thống kê (giả thiết không- null
hypothesis)
H1 gọi là giả thiết đối (alternative hypothesis)
Nếu sau khi kiểm định ta chấp nhận H0 (xem H0 là đúng) thì đánh giá nhận định của viện nghiên cứu là đúng Còn nếu ta bác bỏ H0 (xem H0 là sai) thì cho rằng nhận định của viện nghiên cứu là sai
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
Trang 44
Để kiểm định giả thiết xem chấp nhận hay bác bỏ H0thì người ta phải dựa vào kết quả khảo sát trên mẫu và đưa ra quyết định dựa trên mẫu Có bốn trường hợp có thể xảy ra:
Quyết định chủ quan Thực tế khách quan Bác bỏ H 0 Chấp nhận H 0
H 0 sai Đúng Sai lầm loại II
H 0 đúng Sai lầm loại I Đúng
Trang 5 Xác suất xảy ra sai lầm loại I thường được xét nhỏ hơn hoặc bằng một giá trị số α cho trước, và α gọi là mức ý nghĩa của kiểm định Xác suất xảy ra sai lầm loại II thường ký hiệu là β:
P(sai lầm loại I) = P(bác bỏ H0/H0 đúng) ≤ α
P(sai lầm loại II) = P(chấp nhận H0/H0 sai) =
Trang 61 Phân bố xác suất của các ước lượng OLS
Giả thiết 6: Sai số u độc lập với các biến X và có phân
Trang 7Định lý 4.2: Với giả thiết từ 1-6,
trong đó k là số lượng biến độc lập
Trang 82 Kiểm định giả thuyết về hệ số hồi quy
Có ba dạng giả thuyet kiểm định như sau về hệ số hồi quy:
Trong đó, βi nhận giá trị là β0 hoặc β1 (trong phạm
vi mô hình hồi quy đơn mà ta đang xét)
là giả thiết về giá trị thực của βi,
* 0
:
:
i i
i i
* 0
:
:
i i
i i
* 0
:
:
i i
i i
Trang 9Các thông số cần thiết
Thống kê T
Mức ý nghĩa
Hệ số tin cậy
Giá trị tới hạn (critical value): c
(1 )
Trang 102.1 Ước lượng khoảng: một vài tư tưởng
Ta biết rằng và là ước lượng điểm (point estimators) của β0 và β1 nhưng do các dao động của việc lấy mẫu lặp lại nên các ước lượng điểm có thể khác với giá trị thực mặc dù trung bình giá trị của các ước lượng và bằng với giá trị thực β0
và β1
Do đó người ta muốn xây dựng một khoảng xung quanh giá trị ước lượng điểm với lòng tin rằng giá trị thực sẽ nằm trong khoảng đó với một độ tin cậy nhất định
Cách làm này gọi là ước lượng khoảng
10
0 ˆ
0
ˆ
Trang 11Khoảng tin cậy của hệ số β1
Với các giả thiết 1-6, ta có:
i
x x T
Trang 12Khoảng tin cậy của hệ số β1
Xác định giá trị tới hạn để diện tích trong phân phối của T nằm giữa và
Khoảng tin cậy chứa β1 với xác suất bằng là:
Trang 13Khoảng tin cậy của hệ số β1
Khoảng tin cậy bên phải:
Khoảng tin cậy bên trái:
1 1
( ), )
( c se
1 1
( )
( , c se
Trang 14Khoảng tin cậy của hệ số β0
Tương tự như trên ta có thể xây dựng được khoảng
tin cậy cho hệ số β0 như sau:
Trong đó:
n
i i
n X se
Trang 15Khoảng tin cậy của hệ số β0
Khoảng tin cậy bên phải:
Khoảng tin cậy bên trái:
0 0
( ), )
( c se
0 0
( )
( , c se
Trang 16Kết luận của phương pháp khoảng tin cậy
rơi vào khoảng này thì ta bác bỏ giả thiết H0
rơi vào khoảng này thì ta bác giả thiết H0
rơi vào khoảng này thì ta bác giả thiết H0
Trang 172.2 Phương pháp giá trị tới hạn
Bước 1: Tính giá trị
Bước 2: Tra bảng t-student với mức ý nghĩa α/2 (nếu
là kiểm định hai phía) hoặc mức ý nghĩa α (nếu là
kiểm định một phía) để có giá trị tới hạn hoặc
Bước 3: So sánh với giá trị tới hạn Quy tắc quyết
/2
* 0
ˆ
ˆ ( )
Trang 182.2 Phương pháp giá trị tới hạn
Quy tắc quyết định
Trang 192.3 Phương pháp giá trị p-value
Bước 1: tính giá trị
Bước 2: tính p-value = P (|T| > t0), trong đó T là đại lượng ngẫu nhiên có phân phối t-student với (n-2) bậc tự do t0 là giá trị cụ thể của T
Bước 3: nếu cho trước mức ý nghĩa α, quy tắc
Trang 203 Kiểm định giả thuyết về phương sai của nhiễu
Phương pháp tiến hành kiểm định giả thiết tương tự như kiểm định giả thiết về hệ số hồi quy Bảng 2.06 trình bày một cách tóm tắt các loại giả thiết, phương pháp kiểm định và quy tắc quyết định
Trong giả thiết H0, là giá trị số cho trước và:
20
2 0
2
2 2 2
p value P T t H
Trang 213.1 Khoảng tin cậy của phương sai
Phương sai của tổng thể chính là phương sai của thành phần nhiễu ui mà ta kí hiệu là σ2
Với giả thiết về phân phối chuẩn của nhiễu, ta có thống kê:
2
2
2 2
Trang 223.2 Khoảng tin cậy của phương sai
Xác định giá trị tới hạn để diện tích trong phân phối của nằm giữa và
Khoảng tin cậy chứa là:
Trang 23Bảng 4.1 Kiểm định giả thiết về phương sai của nhiễu
= 2 0
σ2 ≠ 2
0
Khoảng tin cậy
2 2
2 0
/2 1 /2
ˆ [(n 2) ,(n 2) ]
2
= 2 0
σ2> 2
0
Khoảng tin cậy
2 2
0
ˆ [(n 2) , ]
c
Giá trị tới hạn T c
p-value p-value < α
Khoảng tin cậy
2
2 ˆ [ ,(n 2) ]
Trang 244 Kiểm định sự phù hợp của mô hình hồi quy
5.1 Các tổng bình phương độ lệch
5.2 Hệ số xác định (đơn)
5.3 Kiểm định sự phù hợp của mô hình hồi quy
24
Trang 25i i
SSR Y Yi i u
Trang 2828
Trong mô hình 2 biến:
2 2
i
i R
i
X X
Y Y
SST SST
Hệ số xác định R 2: đo mức độ phù hợp của hàm hồi quy
mẫu
Trang 294.3 Hệ số xác định (đơn)
Nếu chia cả tử và mẫu của phân số trên cho mẫu n (hoặc 1) nếu là mẫu nhỏ) thì ta sẽ được :
(n- và là phương sai mẫu của X và Y
r2 đo tỷ lệ hay số phần trăm của toàn bộ sai lệch của Y với giá trị trung bình của chúng được giải thích bằng mô hình (hay biến độc lập)
S n
r
S n
Trang 306.3.2
4.4 Kiểm định sự phù hợp của mô hình hồi quy
Để đánh giá mức độ thích hợp của mô hình hồi quy, nghĩa là mô hình hồi quy giải thích được bao nhiêu % sự thay đổi của biến phụ thuộc Y, thì ta sử dụng hệ số xác định r2
Hệ số r2 càng gần 1 bao nhiêu thì mô hình hồi quy càng có ý nghĩa bấy nhiêu
30
Trang 314.4 Kiểm định mô hình
Chúng ta quan tâm đến việc đánh giá xem giá trị của r2khác 0 có ý nghĩa thống kê hay không Nghĩa là ta tiến hành kiểm định giả thiết:
Đối với mô hình hồi quy hai biến, giả thiết trên tương đương với giả thiết:
2 0
2 1
: 0 : 0
H H
Trang 324.4.1 Phương pháp giá trị tới hạn
Bước 2: Tra bảng F với mức ý nghĩa α và hai bậc
tự do (1, n-k-1) ta được giá trị tới hạn cα, (1, n-k-1)
Bước 3: So sánh F0 và cα, (1, n-k-1)
Nếu F0 > cα, (1, n-k-1) bác bỏ H0
Nếu F0 < cα, (1, n-k-1) không có cơ sở để bác bỏ
R n k
Trang 334.4.2 Phương pháp giá trị p-value
Fisher có hai bậc tự do là (k, n-2)
Nếu p-value < α : bác bỏ H0
Nếu p-value > α : không có cơ sở để bác bỏ H
R