Câu 7 Chọn dữ liệu cho 2 biến để lập bài toán kiểm định so sánh về sự phân tán Trình bày các bước thực hiện và nhận xét kết quả Khảo sát huyết áp lúc nghỉ ngơi của nam và nữ từ 40 – 50 tuổi, người ta[.]
Trang 1Câu 7: Chọn dữ liệu cho 2 biến để lập bài toán kiểm định so sánh về sự phân tán Trình bày các bước thực hiện và nhận xét kết quả
Khảo sát huyết áp lúc nghỉ ngơi của nam và nữ từ 40 – 50 tuổi, người ta có bảng số liệu sau :
Với mức ý nghĩa là 5% hãy so sánh mức độ phân tán về huyết áp khi nghỉ ngơi của nam và nữ Giả thiết hàm lượng này phân bố theo quy luật chuẩn
Bài làm
Dạng bài: Kiểm định giả thuyết cho phương sai hai tổng thể
Công cụ: F-Test Two-Sample for Variances
Cơ sở lý thuyết:
Lý thuyết kiểm định phương sai hai tổng thể
Khi cần kiểm định hai tổng thể có mức độ đồng đều như nhau hay không chúng ta dùng phương pháp kiểm định phương sai của hai tổng thể độc lập dựa trên một đại lượng F như sau: F = 𝑆12 /𝑆22
Trong đó:
𝑆1 là phương sai của mẫu thứ nhất, mẫu này có cỡ n1
𝑆2 là phương sai của mẫu thứ hai, mẫu này có cỡ n2
- Thông thường để xác định mẫu nào là mẫu thứ nhất và mẫu nào là mẫu thứ hai ta làm như sau: trong khi tính đại lượng F thì giá trị phương sai lớn hơn sẽ được đặt ở
tử số, và như vậy mẫu tương ứng với phương sai đó là mẫu thứ nhất
- Giả thiết đặt ra là kiểm định hai bên:
Trang 2𝐻0: 𝜎1 2 = 𝜎2 2
𝐻1: 𝜎1 2 ≠ 𝜎2 2
- Nếu tỉ số F rất lớn hoặc rất nhỏ ta có thể suy diễn bằng hai phương sai tổng thể khó mà bằng nhau, ngược lại nếu tỉ số này gần đến 1 ta sẽ có bằng chứng ủng hộ giả thuyết 𝐻0 Như vậy tỉ lệ F lớn đến đâu thì xem như là đủ bằng chứng bác bỏ 𝐻0 và ngược lại
- Nếu tổng thể lấy mẫu được giả định có phân phối bình thường thì tỉ lệ F có phân phối xác suất gọi tên là phân phối Fisher Các giá trị tới hạn của phân phối F phụ thuộc và hai giá trị bậc tự do, bậc tự do tử số (d𝑓1=𝑛1 − 1) gắn liền với mậu thứ nhất và bậc tự do mẫu số gắn liền với mẫu thứ hai ( d𝑓2=𝑛2 − 1)
- Quy tắc thực sự để bác bỏ 𝐻0 với kiểm định hai bên khi d𝑓1=𝑛1 – 1 và d𝑓2=𝑛2 −
1 mức ý nghĩa αlà: giả thiết 𝐻0 bị bác bỏ nếu giá trị kiểm định F lớn hơn giá trị tới hạn trên 𝐹𝑈 =F 𝑑𝑓1; 𝑑𝑓2; 𝛼 /2 của phân phối F hoặc bé hơn giá trị tới hạn dưới 𝐹𝐿 =
𝑑𝑓1; F𝑑𝑓2; −𝛼/ 2 tức là 𝐹𝑡𝑡< 𝐹𝑑𝑓1; 𝑑𝑓2;− 𝛼 /2 hoặc 𝐹𝑡𝑡 > 𝐹𝑑𝑓1; 𝑑𝑓2; 𝛼/ 2
- Nếu chúng ta kiểm định bên phải:
𝐻0: 𝜎1 2 = 𝜎2 2
𝐻1: 𝜎 12 > 𝜎22
Quy tắc bác bỏ 𝐻0 là khi 𝐹𝑡𝑡 > FU(𝑛1−1; 𝑛2−1; 𝛼)
Phương pháp kiểm định phương sai tổng thể
Giả thiết: 𝐻0: 𝜎1 2 = 𝜎1 2
𝐻1: 𝜎12 > 𝜎2 2
Giá trị thống kê:
Phân phối Fischer : ɣ1 = 𝑁 1 - 1 ; ɣ2 = 𝑁2 - 1
Biện luận:
Nếu F < 𝐹𝛼(ɣ1;ɣ2) ¿> ¿Chấp nhận giả thuyết H0 với xác
Trang 3Giả thiết kiểm định H0 và giả thiết đối H1
Tiêu chuẩn kiểm định F = 𝑆12 /𝑆22
Xác định miền bác bỏ với tùy thuộc vào giá trị F tra bảng
Dựa vào Tiêu chuẩn Kiểm định và Miền Wa đưa ra kết luận
Các bước thực hiện:
Nhập dữ liệu vào bảng tính :
Giả thiết: 𝐻0: 𝜎1 2 = 𝜎1 2
𝐻1: 𝜎12 > 𝜎2 2
Giá trị thống kê:
Phân phối Fischer : ɣ1 = 𝑁 1 - 1 ; ɣ2 = 𝑁2 - 1
Biện luận:
Nếu F < 𝐹𝛼(ɣ1;ɣ2) ¿> ¿Chấp nhận giả thuyết H0 với xác
Trang 4 Vào Data/ Data Analysis/ F-Test Two-Sample for Variances
Chọn các mục như hình:
+Input: địa chỉ tuyệt đối chứa dư liệu tương ứng của mẫu 1 và 2 +Output options: vị trí xuất kết quả
Kết quả:
Trang 5 Biện luận:
Gọi 𝜎1 2 ,𝜎2 2 là phương sai mức độ phân tán giữa chỉ số huyết áp của nam và huyết áp của nữ
Giả thiết:
+ 𝐻0: 𝜎1 2 = 𝜎2 2 “ mức độ phân tán về huyết áp khi nghỉ ngơi của nam
và nữ là giống nhau ”
+ H 1: 𝜎 12 > 𝜎2 2 “ mức độ phân tán về huyết áp khi nghỉ ngơi của nam nhỏ hơn mức độ phân tán về huyết áp khi nghỉ ngơi của nữ ”
F= 1,1832 < 2,124 => chấp nhận H0
Vậy: Chỉ số huyết áp của nam và nữ phân tán như nhau