Chương 9 Xử lý số liệu sẽ học về các nội dung - Tham khảo dữ liệu về tỷ lệ và số lượng - Kiểm tra Chi-Square bằng cách sử dụng Phân phối Đa thức - Kiểm định giả thuyết về tỷ lệ cho n lớn - Tính toán kích thước mẫu cho CI - Tham chiếu cho dữ liệu đếm hai chiều
Trang 1Bài tập chương 9: Xử lý số liệu
Phần 9.1
9.2 Khi bị quân Đức giam cầm trong Thế chiến II, nhà toán học người Anh Jobn Kerrich đã tung một đồng xu 10, 000 lần và thu được 5067 cái đầu Gọi p là xác suất của một cái đầu trên một ngón tay Chúng tôi muốn kiểm tra xem dữ liệu có phù hợp với giả thuyết không điều đó đồng tiền là công bằng
a Đặt giả thuyết Tại sao phương án phải có hai phía?
Giả thuyết ở đây là H0: p = ½, H1: p ≠ ½
Ở đây ta dùng giả thuyết 2 phía là do đồng tiền chỉ có thể có 2 kết quả sấp và ngửa
b Tính giá trị P Bạn có thể từ chối Ho ở mức 0,05 không?
Có: 𝑝̂ = 5067/10000
z = 𝑝̂−𝑝0
√𝑝0(1−𝑃0)
𝑛
; thay số 𝑝̂ = 5067/10000; p0 = 1/2; n = 10000, ta được z = 1,34
P- value = 2 (1- ø(z)) = 2 (1 – ø (1,34)) = 2 (1-0,9099) = 0,1802
c Tìm 95% CI cho tỷ lệ số đầu của đồng xu của Kerrich
Ta có: α = 0,05 nên zα = z0,025 = 1,96
Khoảng tin cậy ở đây là: thay số 𝑝̂ = 0,5067; 𝑞̂ = 1- 0,5067 = 0,4933; n = 10000
[ 𝑝̂ − 𝑧𝛼∕2√𝑝̂𝑞̂
𝑛; 𝑝̂ + 𝑧𝛼∕2√𝑝̂𝑞̂
𝑛 ] = [0,4969; 0,5164]
9.4 Phần bị lỗi trong quy trình sản xuất số lượng lớn là được ước tính bằng cách sử
dụng CI 95% với sai số chênh lệch 0,2%
a Nếu dự đoán tiên nghiệm ở phân số bị lỗi là 1%, thì nên lấy mẫu bao nhiêu phần?
So sánh con số này với kích thước mẫu mà bạn sẽ cần nếu không có thông tin tiên nghiệm nào về phân số thực bị lỗi được giả định
Dự đoán tiên nghiệm ở tỷ phần bị lỗi p* = 1% = 0,01 thì số mẫu cần lấy là:
𝒏 = (𝒛𝜶∕𝟐
𝑬 )𝟐⋅ 𝒑∗⋅ 𝒒*, thay số z0,025 = 1,96; E = 0,2% = 0,2.10-2, p* = 0,01; q* = 0,99
Ta được n = 9507,96 hay 9508 mẫu
Nếu không có tủ phần lỗi p* thì công thức sẽ được viết
𝒏 = (𝒛𝜶∕𝟐
𝑬 )𝟐⋅ 𝒑∗⋅ 𝒒* = (𝒛𝜶∕𝟐
𝑬 )𝟐⋅𝟏
𝟒
b Vấn đề đáng chú ý khi ước tính một phần rất nhỏ bị lỗi là không thể thu được các chất khử bọt trong mẫu, khiến không thể tính được CI Bạn sẽ sử dụng phương pháp
Trang 2lấy mẫu nào để đảm bảo rằng sẽ có đủ số lượng khuyết tật trong mẫu để cung cấp thông tin đáng tin cậy về phần sai hỏng thực sự?
Sử dụng phương pháp lấy mẫu ước tính giá trị có nghĩa
9.6 Một xét nghiệm máu nhằm xác định những bệnh nhân có “nguy cơ cao” mắc
bệnh tim đã cho kết quả dương tính trên 80 trong tổng số 100 bệnh nhân tim đã biết, nhưng cũng trên 16 bệnh nhân trên 200 bệnh nhân bình thường được biết
a Tìm CI 90% đưa ra kết quả kiểm tra, được xác định là xác suất trong số các bênh
nhân mắc bệnh tim được xác định chính xác
Với câu a: n = 100; x = 80; 𝑝̂ = 0,8
Do đó khoảng tin cậy ở đây là:; thay số: 𝑝̂ = 0,8; 𝑞̂ = 0,2; n = 100; z0,05 = 1,645
[ 𝑝̂ − 𝑧𝛼∕2√𝑝̂𝑞̂
𝑛; 𝑝̂ + 𝑧𝛼∕2√𝑝̂𝑞̂
𝑛 ] = [0,7342; 0,8658]
b Tìm CI 90% để biết tính chính xác của thử nghiệm, được xác định là xác suất một bệnh nhân bình thường được xác định chính xác
Với câu b: n = 200; x = 184; 𝑝̂ = 0,92
Do đó khoảng tin cậy ở đây là:; thay số: 𝑝̂ = 0,92; 𝑞̂ = 0,08; n = 200; z0,05 = 1,645
[ 𝑝̂ − 𝑧𝛼∕2√𝑝̂𝑞̂
𝑛; 𝑝̂ + 𝑧𝛼∕2√𝑝̂𝑞̂
𝑛 ] = [0,89; 0,95]
Phần 9.2
9.10 Để đánh giá sự thay đổi trong quan điểm về quan điểm của công chúng đối với
giáo dục song ngữ, một cuộc thăm dò qua điện thoại đã được thực hiện vào tháng 9 năm 1993 và một lần nữa vào tháng 9 năm 1995 Kết quả dựa trên cuộc khảo sát của
1000 người lớn Mỹ liên hệ trong mỗi cuộc thăm dò là 40% so với năm 1993 Cuộc thăm
dò ý kiến và 48% từ cuộc thăm dò năm 1995 ủng hộ việc dạy tất cả trẻ em bằng tiếng Anh hơn các lựa chọn thay thế song ngữ Có sự thay đổi đáng kể trong quan điểm không? Trả lời bằng cách thực hiện một phép thử hai mặt để biết ý nghĩa của sự khác biệt giữa hai tỷ lệ tại = 05 Tại sao một giải pháp thay thế hai phía lại thích hợp ở đây?
Bài giải: Giả thuyết 2 chiều ở đây là H0: 𝑃̂1 = 𝑃̂2; H1: 𝑃̂1 ≠ 𝑃̂2
Khoảng tin cậy là:
Trang 3Giá trị z = 𝑝̂1−𝑝̂2
√𝑝̂1𝑞̂1
𝑛1 +
𝑝 ̂2𝑞̂2 𝑛2 = - 3,615; ta thấy: |z| > z0,025 = 1,96 nên ta từ chối H0
9.12 Tập dữ liệu sau đây từ một nghiên cứu của nhà hóa học nổi tiếng và người đoạt
giải Nobel Linus Pauling (1901-1994) cho biết tỷ lệ bị cảm của 279 vận động viên trượt tuyết người Pháp được chọn ngẫu nhiên vào nhóm Vitamin C và giả dược
Có sự khác biệt đáng kể về tỷ lệ mắc bệnh cảm lạnh giữa nhóm Vitamin C và nhóm giả dược ở mức = 0,05 không? Bạn kết luận gì về hiệu quả của Vitamin C trong việc ngăn ngừa bệnh cảm lạnh?
Bài giải: Giả thuyết 2 chiều ở đây là H0: 𝑃̂1 = 𝑃̂2; H1: 𝑃̂1 ≠ 𝑃̂2; z0,025 = 1,96
Ta tính được: 𝑝̂1 = 17/139 = 0,1223; 𝑝̂2 = 31/140 = 0,2214; 𝑃̂ = 𝑝̂1 +𝑝̂2
𝑛 1 +𝑛 2 = 1,23.10-3 𝑞̂ = 1- 𝑃̂ = 0,99877
Có: z = 𝑝̂1−𝑝̂2
√𝑝̂𝑞̂(1
𝑛1+
1 𝑛2)
; thay số: 𝑝̂1 = = 0,1223; 𝑝̂2 = = 0,2214; 𝑃̂ = 1,23.10-3; 𝑞̂ = 0,99877
Z = - 23,61; ta thấy |z| >> z0,025 = 1,96 do đó ta từ chối H0;
Nhạn xét được Vitamin C có hiệu quả điều trị thấp hơn so với Placebo trong việc chữa cảm lạnh
9.14 Một nghiên cứu đã đánh giá sự bài tiết thromboglobulin trong nước tiểu ở 12 bệnh nhân bình thường và 12 bệnh nhân đái tháo đường '' Cung kết quả tóm tắt thu được bằng cách mã hóa các giá trị từ 20 trở xuống là “thấp” và các giá trị trên 20 là
“cao”, như được trình bày trong bảng sau
Trang 4a Thiết lập các giả thuyết để xác định xem có sự khác biệt trong việc bài tiết thrombogiobulin qua nước tiểu giữa bệnh nhân bình thường và bệnh nhân tiểu đường Thử nghiệm thống kê nào thích hợp để kiểm tra các giả thuyết?
Các giả thuyết có thể có ở đây là: p1: Normal P2: diabetic
H0: 𝑃̂1 = 𝑃̂2; H1: 𝑃̂1 ≠ 𝑃̂2
H0: 𝑃̂1 = 𝑃̂2; H1: 𝑃̂1 > 𝑃̂2
H0: 𝑃̂1 = 𝑃̂2; H1: 𝑃̂1 < 𝑃̂2
Ở đây giả thuyết được kiểm tra là: H0: 𝑃̂1 = 𝑃̂2; H1: 𝑃̂1 ≠ 𝑃̂2; giả thuyết 1 chiều thấp hơn
b Tính giá trị P của phép thử Kết luận của bạn là gì khi sử dụng = 05?
Dựa vào bảng 9.3 trong giáo trình
Ta có các giá trị: n1 = 12; n2 = 12; n = n1 + n2 = 24; m = 14 và x =20
PL = P (X ≤ x| X + Y = m) = P (X ≤ 20| X + Y = 14) = ∑ (
𝑛 1
𝑖 )(
𝑛 2
𝑚−𝑖) ( 𝑛𝑚) 𝑖≤𝑥
; giá trị giới hạn dưới của i là m – n2 = 14 – 12 = 2 ta tính được
PL = P (X ≤ 20| X + Y = 14) = ∑ (12𝑖 )( 1214−𝑖)
(2414)
20
Suy ra P – value = 1 – 0,9986 = 0,0014
với 2 phía thì P- value = 2.0,0014 = 0,0028
9.16 Trong một lớp tiến hành diễn thuyết, hai bài phát biểu thuyết phục, một bài ủng
hộ và một bài khác lại chống đối, được thực hiện bởi hai học sinh về việc phương án khách mời cho các bữa tiệc huynh đệ / nữ sinh Ý kiến của 52 sinh viên khác trong lớp đã được thu thập về vấn đề này trước và sau bài phát biểu với những phản hồi sau đây
Trang 5Bài giải: Áp dụng bảng 9.5
P – value = P (B ≥ b| B+ C = m) (1
2)𝑚∑ (𝑚
𝑖 )
𝑚 𝑖=𝑏 ; thay số: b =8; c = 26; m = 34; i = b = 8
Phần 9.3
9.18 Số lần sinh đầu tiên cho 700 phụ nữ được thống kê theo tháng từ Bệnh viện Đại học của Basel, Thụy Sĩ
Nêu giả thuyết tbe để kiểm tra cung tbat bizths lan truyền đồng đều trong năm Thực hiện kiểm định các giả thuyết tại = 05
Bài giải: Ta có : p0 = p1 = p2 = … = p12 = 1
12
Giả thuyết ở đây: H0: p = 1
12; H1: p ≠ 1
12
Giá trị ei = n.pio = 700 1
12 = 175
3
Kiểm định: χ2 = ∑ 𝑛𝑖− 𝑒𝑖
𝑒𝑖
12 𝑖=1 = 19,725
Có bậc tự do ở dây là 12 – 1=11 nên χ11;0,05 = 19,675, nhận thấy χ2 > χ11;0,05 nên ta từ chối H0
Còn bài 9.20