XÁC SUT THNG KÊ TRONG Y HOC XÁC SUẤT THỐNG KÊ TRONG Y HỌC KHOA CÔNG NGHỆ THÔNG TIN BỘ MÔN KHOA HỌC CƠ BẢN Lê Thị Mai Thanh Ngày 30 tháng 3 năm 2022 Đặt vấn đề Một địa phương đang trồng thử nghiệm một.
Trang 1XÁC SUẤT THỐNG KÊ TRONG Y HỌC
KHOA CÔNG NGHỆ THÔNG TIN
BỘ MÔN KHOA HỌC CƠ BẢN
Lê Thị Mai Thanh
Trang 2Năng suất lúa trung bình của giống lúa truyền thống là 5,5 tấn/ha
Năng suất trung bình của giống lúa mới
có cao hơn giống lúa truyền thống hay không?
Từ thông tin thu được (từ mẫu), có
phương pháp nào trả lời câu hỏi trên không và
nếu có thì cách thức giải quyết như thế nào?
Trang 3Chương 5: Kiểm định giả thuyết thống kê
5.1 Kiểm định giả thuyết thống kê
5.1.1 Định nghĩa
Giả thuyết thống kê là các phát biểu (chưa biết đúng hay sai) về cáctham số, dạng qui luật phân phối hoặc tính độc lập của các biến ngẫunhiên
Việc dựa vào số liệu thu được tìm ra kết luận bác bỏ hay chấp nhậnmột giả thuyết(H0) với một mức ý nghĩa nào đó gọi là kiểm định giảthuyết thống kê
• H0 : giả thuyết không (giả thuyết cần kiểm định)
• H1 : là đối thuyết
Trang 45.1 Kiểm định giả thuyết thống kê
5.1.1 Định nghĩa
Ví dụ
H0 : Biến ngẫu nhiên X có phân phối chuẩn tắc
H1: Biến ngẫu nhiên X không có phân phối chuẩn tắc
Đây là giả thuyết đặt ra đối với phân phối chưa biết của biến, tức là tađang ngờ rằng biến có phân phối chuẩn tắc
Trang 55.1 Kiểm định giả thuyết thống kê
5.1.2 Các thành phần của bài kiểm định
1 Xét định vấn đề cần kiểm định
2 Lập giả thuyết H0, H1
3 Tiêu chuẩn kiểm định G = G(X1, , Xn)
- Là một hàm thống kê, được tính toán theo các giá trị trong mẫu
- Nói đơn giản, tiêu chuẩn G đo sự sai khác giữa giả thuyết đặt ra
và thực tế quan sát được về X
- Ta sẽ đưa ra quyết định chấp nhận hay bác bỏ giả thuyết dựavào tiêu chuẩn G một cách “hợp lí” Thông thường, nếu G nhận giátrị lớn ta sẽ bác bỏ giả thuyết và ngược lại
- Vì ta không có toàn bộ thông tin về biến X nên quyết định mà
ta đưa ra dựa trên tiêu chuẩn G hoàn toàn có thể dẫn tới sai lầm
Trang 65.1 Kiểm định giả thuyết thống kê
5.1.2 Các thành phần của bài kiểm định
4 Sai lầm trong kiểm định
Sai lầm loại 1
• Bác bỏ H 0 trong khi thực tế H 0 đúng.
• Xác suất mắc sai lầm loại 1 là : P (G ∈ W α |H 0 ) = α
Sai lầm loại 2
• Chấp nhận H 0 trong khi thực tế H 0 sai.
• Xác suất mắc sai lầm loại 2 là P (G / ∈ W α |H 1 ) = β
Sai lầm nào quan trọng hơn?
Làm sao xác định được đâu là sai lầm loại 1, 2?
Sai lầm loại I và loại II rất tương đối, nó không có sẵn từ đầu, màchỉ xác định khi ta đã đặt giả thuyết
Ta phải xem xét sai lầm nào quan trọng hơn, tức là khi phạm phải
sẽ chịu tổn thất lớn hơn, thì ta sẽ đặt bài toán để sai lầm đó là loại I
Trang 7Ví dụ
Với một bác sĩ khám bệnh, ông ta có thể sai phải một trong hai tìnhhuống sai lầm sau:
1 Người có bệnh, sau khi thử nghiệm, ông kết luận không có bệnh
2 Người không bệnh, sau khi thử nghiệm, ông kết luận: nhập viện!Sai lầm nào là loại 1? Sai lầm nào là loại 2? Ta chưa xácđịnh được
Bệnh lao phổi là bệnh mà nếu phát hiện để điều trị gần như chắc chắn
sẽ khỏi, còn nếu không được phát hiện kịp thời để điều trị thì bệnh sẽnặng dần và dẫn đến tử vong
Khi đó sai lầm 1 "có bệnh bảo không" là quan trọng hơn, nó có thểdẫn đến tử vong, còn sai lầm 2 "không bệnh bảo có" cũng gây tổn hại,nhưng ít tổn hại hơn sai lầm 2
Do đó ta đặt giả thuyết H0: “người này có bệnh”
Trang 85.1 Kiểm định giả thuyết thống kê
5.1.2 Các thành phần của bài kiểm định
Nếu giả thuyết là đúng thì Wα là miền có xác suất nhỏ
⇒ biến cố G ∈ Wα có xác suất nhỏ Do đó, nếu trong lần đầu lấymẫu, G rơi vào miền Wα, điều này mâu thuẫn với nguyên lí xác suấtnhỏ nên phải bác bỏ giả thuyết
Trang 95.1 Kiểm định giả thuyết thống kê
2 Tiêu chuẩn kiểm định và miền bác bỏ G = G (X1, X2, , Xn) , Wα
3 Từ mẫu cụ thể tính giá trị quan sát G và so sánh với miền bác bỏ
Wα
- Nếu G ∈ Wα thì bác bỏ H0
- Nếu G /∈ Wα thì chưa đủ cơ sở bác bỏ H0
Trang 105.2 Kiểm định trung bình và kiểm định tỉ lệ
Nếu H0 đúng thì G ∼ N (0, 1) và miền bác bỏ giả thuyết là
Wα= −∞, −zα/2 ∪ zα/2, ∞
trong đó zα/2 là giá trị tới hạn mức α
2 của phân phối chuẩn tắc.
Trang 115.2 Kiểm định trung bình và kiểm định tỉ lệ
Nếu|g| ≥ zα/2 thì bác bỏ H0, ngược lại thì chấp nhận H0
Trang 125.2.1 Kiểm định trung bình tổng thể
Ví dụ
Theo tiêu chuẩn thì trọng lượng các gói hạt nêm được đóng trên mộtmáy tự động là 453 g Kiểm tra ngẫu nhiên 81 gói ta thấy trọng lượngtrung bình là 448 g Với mức ý nghĩa 0,05 có thể cho rằng trọng lượngcác gói hạt nêm không đạt tiêu chuẩn hay không, biết rằng trọng lượnggói hạt nêm là biến ngẫu nhiên có phân phối chuẩn với độ lệch chuẩn
là 36g?
Giải
Gọi X là trọng lượng của gói hạt nêm
µ là trọng lượng trung bình của gói hạt nêm trong nhà máy
Ta có: X ∼ N (µ, σ), với
σ = 36g; n = 81; ¯x = 448; α = 0, 05%; µ0 = 453
Trang 135.2 Kiểm định trung bình và kiểm định tỉ lệ
Trang 145.2 Kiểm định trung bình và kiểm định tỉ lệ
Giả sử, năng suất lúa A có phân phối chuẩn với phương sai là 4
Với mức ý nghĩa 5%, khẳng định đưa ra có đáng tin không?
Trang 155.2 Kiểm định trung bình và kiểm định tỉ lệ
Do |g| > zα/2 nên bác bỏ H0
Trang 165.2 Kiểm định trung bình và kiểm định tỉ lệ
5.2.1 Kiểm định trung bình tổng thể
Trường hợp chưa biết σ và n ≥ 30
Chọn tiêu chuẩn kiểm định G = ( ¯X − µ0)
√n
tự trường hợp biết σ
Ví dụ
Điều tra nhịp mạch của 64 thanh niên làm nghề điện ta có nhịp mạchtrung bình 74 lần/phút và độ lệch mẫu hiệu chỉnh bằng 9 Với mức ýnghĩa 5%, nhịp mạch của thanh niên làm nghề điện có khác nhịp mạchtrung bình bình thường là 72 lần/phút hay không?
Trang 17(74 − 72)√64
• Do |g| < zα/2 nên chấp nhận H0
Trang 185.2 Kiểm định trung bình và kiểm định tỉ lệ
5.2.1 Kiểm định trung bình tổng thể
Trường hợp chưa biết σ và n < 30
Chọn tiêu chuẩn kiểm định G = ( ¯X − µ0)
√nS
Nếu X ∼ N (µ, σ2) thì G ∼ t(n − 1) có phân phối Student với bậc tự do(n − 1)
Phương pháp thực hiện và quy tắc thực hành tương tự trường hợp đầuchỉ khác ở chỗ ta tra bảng Student tìm tα/2(n − 1)
Trang 195.2 Kiểm định trung bình và kiểm định tỉ lệ
và độ lệch chuẩn là 0.035cm
Với mức ý nghĩa 5%, hãy cho nhận xét về nghi ngờ trên
Trang 215.2 Kiểm định trung bình và kiểm định tỉ lệ
5.2.2 Kiểm định giả thuyết về tỉ lệ
Giả sử tổng thể X có tỷ lệ phần tử có tính chất A là p chưa biết Vớimức ý nghĩa α , kiểm định giả thuyết
pp0(1 − p0)
Nếu H0 đúng thì G ∼ N (0, 1)
Trang 225.2 Kiểm định trung bình và kiểm định tỉ lệ
5.2.2 Kiểm định giả thuyết về tỉ lệ
Quy trình các bước thực hiện
Từ mức ý nghĩa α: ϕ(zα/2) = 1 − α
2 tra bảng Laplace tìm zα/2.
Tính giá trị kiểm định g = (f − p0)
√n
pp0(1 − p0)
Nếu|g| ≥ zα/2 thì bác bỏ H0, ngược lại thì chấp nhận H0
Trang 235.2 Kiểm định trung bình và kiểm định tỉ lệ
5.2.2 Kiểm định giả thuyết về tỉ lệ
Ví dụ
Trong một dây chuyền sản xuất thuốc có ý kiến cho rằng: có 20% viênkhông đạt tiêu chuẩn Kiểm tra ngẫu nhiên 100 viên thì thấy có 13viên không đạt tiêu chuẩn Với mức ý nghĩa 5%, hãy cho nhận xét về ýkiến trên
Trang 245.2 Kiểm định trung bình và kiểm định tỉ lệ
5.2.2 Kiểm định giả thuyết về tỉ lệ
pp0(1 − p0) =
(0.13 − 0.2)√100p0.2(1 − 0.2) = −1.75
• Do |g| ≤ zα/2 nên chấp nhận H0
Vậy với mức ý nghĩa 5%, tỉ lệ viên thuốc không đạt chuẩn là 20%