TỔNG QUAN VỀ KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ
Kiểm định sự đồng nhất của các phương sai
1.1.1.Kiểm định sự đồng nhất của hai phương sai
Trong nghiên cứu thống kê, giả sử chúng ta có hai mẫu I và II với số lượng tương ứng là n1 và n2 Vấn đề cần giải quyết là kiểm định xem hai mẫu này có được lấy từ các tập dữ liệu có cùng phương sai hay không Việc này giúp xác định tính đồng nhất của phương sai giữa hai nhóm, từ đó hỗ trợ cho các phân tích và kết luận chính xác hơn.
Tiêu chuẩn kiểm định: Muốn kiểm định hai phương sai, người ta dùng tiêu chuẩn F- tiêu chuẩn Fisher So sánh
Tính theo các số đo của mẫu thứ I và mẫu thứ II với giá trị tra bảng F 1-p (f 1 , f 2 ).
Khi dùng tiêu chuẩn một phía thì đối thiết : :
Thì chấp nhận giả thiết H 0 , ngược lại H 0 bị bác bỏ.
Khi dùng tiêu chuẩn hai phía thì đối thiết : :
Nếu F< F 1-p/2 (f 1 , f 2 ) thì H 0 được chấp nhận.
1.1.2.Kiểm định sự đồng nhất của nhiều phương sai
Giả sử có m tập chính Gỉa thiết không cần kiểm định là H 0 :
Nếu số lượng mẫu lấy từ m tập chính bằng nhau; n 1 = n 2 =…= n m = n. Để kiểm định sự đồng nhất các phương sai dùng tiêu chuẩn Cochran:
So sánh giá trị tính được với giá trị tra bảng, (ở phần phụ lục) G 1-p (f,m) Nếu G < G 1-p (f,m), thì H 0 được chấp nhận.
Nếu G > G 1-p (f,m), H 0 bị bác bỏ Trong trường hợp này thường chấp nhận đối thiết
Nếu số lượng mẫu lấy từ các tập không bằng nhau( số bậc tự do khác nhau) thì dùng tiêu chuẩn Bartlet Trong trường hợp này phải tính:
Sau đó so sánh với giá trị bảng.
Nếu (1.8)Thì H 0 được chấp nhận; ngược lại, H 0 bị bác bỏ và chấp nhận đối thiết
Các bước của việc kiểm định giả thiết thống kê
Bước 1: Thành lập giả thuyết Ho
Bước 2: Thành lập giả thuyết H1
Bước 3: Xác định mức ý nghĩa α
Bước 4: Chọn các tham số thống kê thích hợp cho việc kiếm định và xác định các miền bác bỏ, miền chấp nhận và giá trị giới hạn.
Bước 5: Tính toán các giá trị của các tham số thống kê trong việc kiểm định dựa trên số hiệu của mẫu ngẫu nhiên.
Bước 6: Ra quyết định: Nếu các giá trị tính toán rơi vào miền bác bỏ
Ho thì ra quyết định bác bỏ Ho Ngược lại sẽ chấp nhận Ho.
MỘT SỐ BÀI TOÁN KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ.10 2.1 Khái niệm
Nội dung của bài toán kiểm định
Trong nghiên cứu thống kê, chúng ta thường đặt ra hai giả thiết H0 và H1, trong đó H1 là giả thiết đối nghịch với H0 Dựa vào số liệu thu thập được, nhiệm vụ của chúng ta là xác định tính đúng sai của giả thiết H0 Quy trình quyết định chấp nhận hoặc bác bỏ giả thiết này được gọi là kiểm định thống kê.
Khi cảm thấy mệt mỏi, chúng ta thường nghi ngờ rằng mình có thể bị bệnh, điều này được gọi là giả thuyết H0 Ngược lại, giả thuyết H1 là "mình không mắc bệnh" Việc đi khám bệnh nhằm xác định tình trạng sức khỏe thực chất là quá trình kiểm định giả thuyết H0 để xem nó có đúng hay không.
Khi giả thiết H 0 có dạng: H 0 : a = a 0 (a là 1 tham số nào đó của đại lượng ngẫu nhiên ta đang nghiên cứu; a 0 là giá trị đã biết)
Kiểm định giả thiết với H1 là a ≠ a0 được gọi là kiểm định hai phía, vì miền bác bỏ nằm ở cả hai bên của miền chấp nhận.
Giả thiết đối dạng H 1 : a ≠ a 0 thường được áp dụng khi ta chưa biết rõ trong thực tế a > a 0 hay a< a 0
Nếu qua quan sát và phân tích, chúng ta nhận thấy xu hướng a > a0, thì có thể đặt giả thuyết H1: a > a0 Ngược lại, nếu khả năng a < a0 được xác định, ta có thể đặt giả thuyết H1: a < a0.
Kiểm định giả thiết với giả thiết đối dạng H1: a > a0 được gọi là kiểm định giả thiết phía bên phải Ngược lại, nếu kiểm định giả thiết với H1: a < a0, thì đây là kiểm định phía bên trái.
< a 0 thì được gọi là kiểm định giả thiết về phía bên trái
Các sai lầm mắc phải khi làm kiểm định
Khi làm kiểm định, ta có thể mắc phải các sai lầm sau đây:
Sai lầm loại 1: Bác bỏ 1 giả thiết đúng ( Bác bỏ H 0 khi H 0 đúng).
Sai lầm loại 2: Chấp nhận 1 giả thiết sai (Nhận H 0 khi H 0 sai).
Thực tế Chấp nhận H 0 Bác bỏ H 0
1 Dựa vào các thông tin dự báo thời tiết, trung tâm khí tượng thủy văn dự báo 1 cơn bão sắp đến sẽ đổ bộ vào miền Nam thì H 0 : “Bão đổ bộ vào miền Nam” (H 1 :”bão không đổ bộ vào miền Nam) Khi đó sai lầm loại 1 là rất tai hại vì khi đó, do không kịp thời chuẩn bị ứng phó nên bão sẽ gây ra những thiệt hại nặng nề.
2 Cho đậu 1 thí sinh yếu kém (mà đáng ra phải rớt) hoặc cho rớt 1 thí sinh giỏi (mà đáng lẽ ra phải đậu) đều là những sai lầm tai hại Thực tế, cho thấy, có những cuộc thi mà kết quả chỉ dựa vào số lượng tin nhắn bình chọn thì chứa đựng nhiều sai lầm.
Khi kiểm định một giả thuyết, mục tiêu là giảm thiểu tối đa xác suất xảy ra cả hai loại sai lầm Tuy nhiên, trong thực tế, việc này là không khả thi, vì giảm sai lầm loại 1 sẽ dẫn đến việc tăng xác suất sai lầm loại 2 và ngược lại.
Trong thống kê, lỗi loại 1 được xem là nghiêm trọng hơn và cần được hạn chế Để đạt được điều này, với xác suất α đã xác định, quyết định đưa ra phải đảm bảo rằng P(Phạm sai lầm loại 1) ≤ α Giá trị α được gọi là mức ý nghĩa của kiểm định.
Một số bài toán kiểm định thường gặp
2.4.1 Kiểm định giả thiết về số trung bình:
Giả sử đại lượng ngẫu nhiên gốc X trong tổng thể phân phối theo quy luật chuẩn với kỳ vọng μ và phương sai mẫu σ² Cần thực hiện kiểm định giả thiết để xác định các tham số này một cách chính xác.
( là 1 giá trị đã biết khi đặt ) Để kiểm định giả thiết trên, ta tiến hành lấy mẫu với kích thước n và xét các trường hợp sau:
Giả sử là mẫu độc lập của X Khi đó:
Với mức ý nghĩa , chọn miền bác bỏ giả thiết trong đó thỏa:
Rõ ràng và được xác định bởi bảng giá trị tích phân Laplace.
Hoàn toàn tương tự cho các phép kiểm định trung bình 1 phía, ta có thể tóm tắt bởi bảng sau:
Giả sử là mẫu độc lập của X Khi đó:
Với mức ý nghĩa , chọn miền bác bỏ giả thiết : trong đó là phân phối Student n-1 bậc tự do.
Hoàn toàn tương tự cho các phép kiểm định trung bình 1 phía, ta có thể tóm tắt bởi bảng sau:
2.4.2 Kiểm định so sánh 2 giá trị trung bình :
Cho là mẫu độc lập của X. là mẫu độc lập của X.
Trường hợp 1: Nếu đã biết.
Với mức ý nghĩa , chọn miền bác bỏ giả thiết : được tra từ bảng phạn phối Student (m+n-2) bậc tự do.
Trường hợp 2: Nếu chưa biết.
Với mức ý nghĩa , chọn miền bác bỏ giả thiết : trong đó: được tra từ bảng phân phối Student (m+n-2) bậc tự do tương ứng là phương sai mẫu của X và Y.