Chương 8 xử lý số liệu - xử lý 2 mẫu sẽ học về các nội dung: - Thiết kế mẫu độc lập - Thiết kế các cặp phù hợp - So sánh trung bình 2 quần thể - Thiết kế độc lập cho các mẫu nhỏ
Trang 1Lê Bình Minh – 20172298
Bài tập chương 8 - Xử lý số liệu
Phần 8.2
8.6 Các dây chuyền sản xuất trong một nhà máy sản xuất được thiết lập để tạo ra các
ổ bi bằng thép với đường kính 1 micron Mười ổ bi được chọn ngẫu nhiên từ hai dây chuyền Đường kính của các ổ bi được đo bằng micrômet là:
a Giải thích tại sao các mẫu này độc lập:
Hai mẫu này là độc lập do số liệu thu thập được của 2 mẫu này là khác nhau
b Đặt một biểu đồ Q- Q của dữ liệu Một bộ đường kính ổ bi có xu hướng lớn hơn khác?
Đường kính ổ bi theo xu hướng 2 sẽ lớn hơn đường kính ổ bi theo xu hướng đầu tiên
8.8 Ảnh hưởng của hai loại vi rút trên lá thuốc lá được nghiên cứu bằng cách xoa một chế phẩm có chứa mỗi loại vi rút lên một nửa khác nhau của mỗi 8 lá thuốc Số lượng vết thương được đếm trên hai nửa của những lá này như sau
Trang 2a Giải thích lý do tại sao những mẫu này lại bị trùng khớp với nhau
Những mẫu này trùng khớp nhau là do 2 loại virus này đều được thực hiện trên cùng một mẫu
b.Lập biểu đồ phân tán về số lượng vết bệnh Các cặp có xu hướng nằm trên hoặc dưới đường 45 ° qua nguồn gốc? Một loại virus có xu hướng tạo ra nhiều vết bệnh hơn virus kia?
Ta nhận thấy các cặp xu hướng này nằm gần sát so với đường 45o Virus loại 1 gây
ra nhiều bệnh hơn virus loại 2
8.10 Tham khảo dữ liệu từ Bài tập 4.22 Tính khoảng tin cậy 95% cho sự khác biệt trung bình 1 - 2 giữa nồng độ dopamine của hai nhóm bệnh nhân với giả định 22
2
=
Có sự khác biệt có ý nghĩa thống kê ở = 0,05 giữa hai nhóm không?
Bài giải : Nhóm người loạn thần: 𝑥̅ = 0,02426; s2 = 0,005140, n1 = 11
Với nhóm người không loạn thần: 𝑦̅ = 0,01643, s1 = 0,004696, n2 = 15
Ta tính được S2 = (𝑛1−1)𝑠1+(𝑛2−1)𝑠2
𝑛1+ 𝑛2−2 = 2,27.10-5 nên s = 4,764.10-3 Khoảng tin cậy 95% cho sự khác biệt trung bình 1 - 2 giữa nồng độ dopamine của hai nhóm bệnh nhân với giả định 22
2
=
𝑥̅ − 𝑦̅ − 𝑡𝑛1+𝑛2−2,𝛼∕2⋅ 𝑠√𝑛1
1+ 1
𝑛2 ≤ μ1 – μ2 ≤ 𝑥̅ − 𝑦̅ + 𝑡𝑛1+𝑛2−2,𝛼∕2⋅ 𝑠√𝑛1
1+ 1
𝑛2
Trang 3Thay số: 𝑥̅ = 0,02426; 𝑦̅ = 0,01643; s = 4,764.10-3; n1 = 11; n2 = 15; t24;0.025 = 2,064
Ta tính được khoảng tin cậy là [3,92.10-3; 0,01173]
Ta nhận thấy không có sự khác biệt thống kê giữa 2 nhóm
8.12 Tham khảo dữ liệu từ Bài tập 8.5 về ảnh hưởng của tạo hạt mây đối với lượng mưa
a Lập các biểu đồ bình thường của dữ liệu thô và dữ liệu đã chuyển đổi loga Nêu lý
do tại sao dữ liệu được tạo thành log nên được sử dụng để so sánh chính thức Sử dụng
dữ liệu được chuyển đổi loga trong các phân tích sau
Ta có bảng số liệu
(xi)
UnSeeded (yi)
di = xi - yi i Seeded
(xi)
UnSeeded (yi)
di = xi -
yi
Vẽ đồ thị dữ liệu ban đầu
Trang 4Đồ thị đã chuyển đổi sang loga
Dữ liệu đã dùng chuyển đổi sang loga được dùng để so sánh chính thức là vì các điểm phân bố của đồ thị nằm gần sát với đường tuyến tính so với đồ thị với dữ liệu ban đầu
b Kiểm tra Ho: 1 =2 với H1: 1 2 với =0.05, giả sử 2
2 2
1
= Kết luận của bạn?
Đây là giả thuyết 2 chiều
Ta có 𝑡𝑛1+𝑛2−2,𝛼/2 = t50;0.025 = 2,0086; s1 = 650,82; s2 = 278,44, 𝑥̅ = 442,08; 𝑦̅ = 164,65 Tính được s = √(𝑛1 −1)𝑠1+(𝑛 2 −1)𝑠2
𝑛1+ 𝑛2−2 = 460,35
T = |𝑥̅− 𝑦̅|
𝑠.√1
𝑛1+
1
𝑛2
= 2,172; ta có |t| = 2,172 > t50;0,025 = 2,0086 do đó ta từ chối H0 nên có thể
sẽ 1 2
c Lặp lại (a) mà không giả sử 22
2
1
= So sánh kết quả
Trang 5Với 𝜎12 ≠ 𝜎22, t= |𝑥̅− 𝑦̅|
√ 𝑠12 𝑛1+
𝑠22 𝑛2
Ta có: υ = (𝜔1 +𝜔2)2
𝜔12 𝑛1−1+
𝜔22 𝑛2−1
trong đó: 𝜔1 = 𝑠1
𝑛 1; 𝜔2 = 𝑠2
𝑛 2
Thay số: s1 = 650,82; s2 = 278,44; n1 = n2 = 26, tính được ω1 = 16291,02; ω2 = 2981,87 Tính được υ = 33,85 ta chọn υ = 33, nên t tυ, α/2 = t33;0,025 = 2,0345
Giá trị t = t= |𝑥̅− 𝑦̅|
√ 𝑠12 𝑛1+
𝑠22 𝑛2
= 1,998
Ta nhận thất t = 1,998 < t33;0,025 = 2,0345 do đó ta không từ chối H0
8.14 Một cửa hàng thực phẩm duy trì số liệu thống kê về doanh số bán hàng của khách hàng trong một tuần trong tháng 8, phản ánh lượng hàng tạp hóa thông thường và một tuần trong tháng 12 phản ánh lượng hàng tạp hóa cao hơn do kỳ nghỉ lễ Hồ sơ về số lượng mục được xử lý mỗi phút (IPM) và phần trăm thời gian nhàn rỗi (PIT) đã có sẵn trong tuần thứ hai cho 25 nhân viên Sự khác biệt (tháng 8 trừ tháng 12) cho mỗi nhân viên đã được tính toán
a Mức trung bình của tháng 8 của IPM là 27,5; mức trung bình của tháng 12 là 25,5
Độ lệch chuẩn của sự khác biệt là sd = 2,0 So sánh IPM cho hai mùa sử dụng khoảng tin cậy 95%
Ta có: giá trị trung bình tháng 8: 𝑥̅ = 27,5
Giá trị trung bình tháng 12: 𝑦̅ = 25,5
Tính được: 𝑑̅ = 𝑥̅ − 𝑦̅ = 2,0; ta có: tn-1, α/2 = t24;0,025 = 2,064
Khoảng tin cậy 95% cho 𝜇1− 𝜇2 là:
[𝑑̅ - 𝑡𝑛−1,𝛼/2 𝑠𝑑
√𝑛; 𝑑̅ + 𝑡𝑛−1,𝛼/2 𝑠𝑑
√𝑛 ] = [1,1744; 2,8256]
Kiểm tra student: t = 𝑠𝑑𝑑̅
√𝑛
= 5; nhận thấy |t| = 5 > t24;0,025 = 2,064
b Mức thuế trung bình tháng 8 của PIT là 37,3; mức trung bình của tháng 12 là 30,6
Độ lệch chuẩn của sự khác biệt là sd = 13,0 So sánh thuế PIT cho hai mùa sử dụng khoảng tin cậy 95%
Ta có: giá trị trung bình tháng 8: 𝑥̅ = 37,3
Giá trị trung bình tháng 12: 𝑦̅ = 30,6
Tính được: 𝑑̅ = 𝑥̅ − 𝑦̅ = 6,7; ta có: tn-1, α/2 = t24;0,025 = 2,064, sd = 13,0
Khoảng tin cậy 95% cho 𝜇1− 𝜇2 là:
[𝑑̅ - 𝑡𝑛−1,𝛼/2 𝑠𝑑
√𝑛; 𝑑̅ + 𝑡𝑛−1,𝛼/2 𝑠𝑑
√𝑛 ] = [1,3336; 12,0664]
Trang 6Kiểm tra student: t = 𝑠𝑑𝑑̅
√𝑛
= 2,576; nhận thấy |t| = 2,576 > t24;0,025 = 2,064
c Bạn có thể kết luận gì về sự khác biệt trong việc xử lý khối lượng thông thường so với khối lượng ngày lễ cao?
Hàng hóa thông thường có giá trị về IPM và PIT cao hơn khối lượng hang hóa với những ngày nghỉ lễ có khối lượng cao
Phần 8.4
8.18 Một nhà hàng thêm một lò nướng thương mại mới vào nhà bếp của mình Người
ta hy vọng rằng lò mới có nhiệt lượng phân bố đều hơn so với lò hiện tại Lò được làm nóng đến 350 ° F, sử dụng bộ điều khiển nhiệt và các số đọc nhiệt độ thu được từ các nhiệt kế được đặt tại 9 vị trí trong mỗi lò, thu được dữ liệu sau:
Lò hiện tại: n1 = 9 x = 352,4 s1 = 2,3
Lò mới: n2 = 9 y= 350,2 s2 = 1.1
Kiểm tra Ho: 22
2
1
2 2
1
sử dụng =0.05 Dữ liệu có chỉ ra rằng lò nướng mới không cung cấp nhiều sưởi ấm hơn so với hiện tại?
Bài giải: Ta tính được F = 𝑠1
𝑠2 = 4,3719 Có: 𝑓𝑛1−1,𝑛2−1,𝛼 = f8;8;0,05 = 3,44:
Nhận thấy F = 4,3719 > f8;8;0,05 = 3,44 nên ta từ chối H0