Chương 6: Kiểm định giả thuyết thống kêBài toán kiểm định giả thyết thống kê Kiểm định giả thuyết về trung bình của phân phối chuẩn Kiểm định giả thuyết về phương sai... Một mẫu thử được
Trang 1Xác suất thống kê
Chương 6: Kiểm định giả thuyết
thống kê
TS Trần Vũ Đức
Bộ môn Toán, khoa KHCN, ĐH Hoa Sen
Học kỳ 1, 2010-2011
Trang 2Chương 6: Kiểm định giả thuyết thống kê
Bài toán kiểm định giả thyết thống kê
Kiểm định giả thuyết về trung bình của phân
phối chuẩn
Kiểm định giả thuyết về phương sai
Trang 3Giới thiệu
Xét một biến ngẫu nhiên X có phân phối Fθ với tham số θ chưa biết (θ có thể là trung bình µ, phương sai σ2 hoặc tỷ lệ p) Ta đặt giả thuyết là
θ lớn hơn (hoặc < hoặc =) một giá trị θ0 nào đó
Một mẫu thử được lấy ngẫu nhiên từ dân số, và qua quá trình tính toán, ta có thể kết luận được
số liệu thu được có hợp lý với giả thuyết đặt ra hay không
Trang 4Giả thuyết không và giả thuyết ngược
Giả sử Fθ là phân phối chuẩn N(θ, 4) Xét các giả
thuyết sau:
(a) H : θ = 1 (b) H : θ , 1
(c) H : θ > 1 (d) H : θ < 1
Giả thuyết mà nếu đúng sẽ cho biết phân phối của Fθ được gọi là giả thuyết không (null
hypothesis), được ký hiệu H0 Các giả thuyết còn lại gọi là giả thuyết ngược (alternative
hypothesis), ký hiệu là H1 Ví dụ, (a) là giả thuyết không, (b-c-d) là các giả thuyết ngược
Trang 5Giả thuyết không và giả thuyết ngược
Giả sử Fθ là phân phối chuẩn N(θ, 4) Xét các giả thuyết sau:
(a) H : θ = 1 (b) H : θ , 1
(c) H : θ > 1 (d) H : θ < 1
Giả thuyết mà nếu đúng sẽ cho biết phân phối của Fθ được gọi là giả thuyết không (null
hypothesis), được ký hiệu H0 Các giả thuyết còn lại gọi là giả thuyết ngược (alternative
hypothesis), ký hiệu là H1 Ví dụ, (a) là giả
thuyết không, (b-c-d) là các giả thuyết ngược
Trang 6Miền bác bỏ và miền chấp nhận
Từ các số liệu quan sát X1, , Xn, ta xây dựng một tham số thống kê cho phép kiểm định, gọi là T
T = T(X1, , Xn) Miền bác bỏ (Rejection region): là miền chứa các giá trị của tham số thống kê T làm cho giả thuyết
H0 bị bác bỏ
Miền chấp nhận (Acceptance region): là miền chứa các giá trị của tham số thống kê T làm cho giả thuyết H0 không bị bác bỏ
Trang 7Các loại sai lầm
Sai lầm loại 1:
Là sai lầm khi ta bác bỏ giả thuyết H0 trong khi
H0 đúng
Xác suất của sai lầm loại 1 được ký hiệu là α:
α = P (bác bỏ H0| H0 đúng)
Sai lầm loại 2:
Là sai lầm khi ta chấp nhận giả thuyết H0 trong khi H0 sai
Xác suất của sai lầm loại 2 được ký hiệu là β
β = P (chấp nhận H0| H0 sai)
Trang 8Các loại sai lầm
Sai lầm loại 1:
Là sai lầm khi ta bác bỏ giả thuyết H0 trong khi
H0 đúng
Xác suất của sai lầm loại 1 được ký hiệu là α:
α = P (bác bỏ H0| H0 đúng) Sai lầm loại 2:
Là sai lầm khi ta chấp nhận giả thuyết H0 trong khi H0 sai
Xác suất của sai lầm loại 2 được ký hiệu là β
β = P (chấp nhận H0| H0 sai)
Trang 9Các loại sai lầm
Ta quy ước chỉ quan tâm đến α và tìm cách hạn chế sai lầm này ở mức thấp nhất Thông thường
α không được vượt quá 1%, 5% hoặc 10%
α còn được gọi là mức ý nghĩa (level of
significance) của phép kiểm định
Trang 10Các bước làm kiểm định thống kê
1 Kiểm tra điều kiện: X ∼ N (µ, σ2) hoặc
n ≥ 30
2 Viết các giả thuyết kiểm định (H0 và H1)
3 Xác định mức ý nghĩa α của phép kiểm định
4 Xây dựng và tính toán tham số thống kê
5 Xác định miền chấp nhận H0
6 Đưa ra kết luận