Khi đưa ra một giả thuyết gốc, người ta còn nghiên cứu một mệnh đề mâu thuẫn với nó gọi là giả thuyết đối hay đối thuyết và ký hiệu là ?1 để khi ?0 bị bác bỏ thì thừa nhận ?1.. Lúc đó t
Trang 1Bài giảng
Xác suất thống kê
Nam Dinh,Februay, 2008
Trang 2KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ
Trang 4Giả thuyết đưa ra g ọi là biến ngẫu nhiên g ốc ký hiệu là 𝐻0 Khi đưa ra một giả thuyết gốc, người ta còn nghiên cứu một
mệnh đề mâu thuẫn với nó gọi là giả thuyết đối (hay đối thuyết)
và ký hiệu là 𝐻1 để khi 𝐻0 bị bác bỏ thì thừa nhận 𝐻1 Cặp 𝐻0 và
𝐻 gọi là cặp giả thuyết thống kê.
Trang 6thống kê vì nó d ựa vào thông tin thực nghiệm của m ẫu để kết
luận
Trang 7rút ra từ tổng thể tìm được một biến cố A nào đó sao cho xác su ất xảy ra của A bằng α bé đến mức có thể coi A không xảy ra trong một phép thử
Lúc đó trên một mẫu cụ thể thực hiện phép thử với biến cố
A, nếu A xảy ra thì chứng tỏ 𝐻0 sai và bác b ỏ nó, còn nếu A không xảy ra thì chưa có cơ sở để bác bỏ 𝐻0
Trang 8thước n
𝑊 = (𝑋1, 𝑋2, … , 𝑋𝑛)
Và chọn lập thống kê:
𝐺 = 𝑓(𝑋1, 𝑋2, … , 𝑋𝑛, 𝜃0) Với 𝜃0 là tham số liên quan đến giả thuyết cần kiểm định Điều kiện đặt ra đối với G là nếu 𝐻0 đúng thì quy luật phân phối xác suất của
Trang 9tương ứng sao cho với điều kiện giả thuyết 𝐻0 đ úng thì xác suất G nhận g iá trị tại miền 𝑊𝛼 b ằng α Điều kiện này được viết như sau:
𝑃(𝐺 ∈ 𝑊𝛼 /𝐻0) = 𝛼
Trang 10g iả thuyế t 𝐻0 Các g iá trị cò n lại của G thuộ c m iề n 𝑊𝛼 g ọ i là m iề n khô ng b ác b ỏ g iả thuyế t hay đ ô i khi cò n g ọ i là m iề n thừa nhận
g iả thuyế t Điểm g iới hạn p hân chia g iữa m iề n b ác b ỏ và m iề n thừa nhận g ọ i là g iá trị tới hạn
Trang 11𝑤 = (𝑥1, 𝑥2, … , 𝑥𝑛) và qua đó tính được giá trị cụ thể của tiêu chuẩn kiểm định G
𝐺𝑞𝑠 = 𝑓(𝑥1, 𝑥2, … , 𝑛𝑛, 𝜃0) Giá trị này gọi là giá trị quan sát của tiêu chuẩn kiểm định
Trang 121 Nếu 𝐺𝑞𝑠 ∈ 𝑊𝛼 thì kết luận 𝐻0 sai, d o đ ó b ác b ỏ 𝐻0 và thừa nhận 𝐻1
2 Nếu 𝐺𝑞𝑠 ∉ 𝑊𝛼 thì kết luận chưa có cơ sở b ác b ỏ 𝐻0 (thực
tế là thừa nhận 𝐻0 )
Trang 13lập tức b ác b ỏ 𝐻0 Như vậy ta có thể mắc phải sai lầm loại 1 với xác suất b ằng α
Sai lầm lo ại 2: Thừa nhận 𝐻0 tro ng khi 𝐻0 sai hay 𝐺𝑞𝑠 ∉ 𝑊𝛼tro ng khi 𝐻1 đ úng
Giả sử xác suất mắc sai lầm lo ại 2 là β 𝑃(𝐺 ∉ 𝑊𝛼 /𝐻1) = 𝛽
Trang 14loại sai lầm cho trong b ảng:
β
Không bác b ỏ
𝐻0
Quyết định đúng xác suất bằng 1- α
Sai lầm loại 2 xác suất bằng β
Trang 15sai lầm Do vậy trong thực tế thì với α cho trước người tasex tìm miền 𝑊𝛼 sao cho β là nhỏ nhất
Trang 17Giả sử b iế n n g ẫ u n h iê n g ố c X t ro n g t ổ n g t h ể p h â n p h ố i ch u ẩ n 𝑋~𝑁(𝜇, 𝜎2) nhưng chưa b iế t μ Nế u có cơ sở đ ể g iả thuyế t rằng
g iá t rị củ a n ó b ằ n g 𝜇0 t a đ ưa ra g iả t h u yế t t h ố n g kê 𝐻0: 𝜇 = 𝜇0 Để kiể m đ ịn h g iả t h u yế t t rê n, t ừ t ổ n g t h ể t a lậ p m ẫ u:
𝑊 = (𝑋1, 𝑋2, … , 𝑋𝑛)
Để chọ n thống kê G ta xé t hai trường hợp
Trang 18a, Đã biết phương sai 𝜎2
Chọn
𝐺 = 𝑋 − 𝜇0
𝜎 𝑛 Giả sử nếu 𝐻0 đúng tức là 𝜇 = 𝜇0 thì
𝐺 = 𝑈 = 𝑋 − 𝜇
𝜎 𝑛 ~ 𝑁(0,1) 𝑃(𝐺 ∈ 𝑊𝛼 /𝐻0) = 𝛼
Trang 19Trường hơp 1: 𝐻0: 𝜇 = 𝜇0 ; 𝐻1: 𝜇 > 𝜇0
Với 𝛼 cho trước có thể tìm được cặp giá trị 𝛼1, 𝛼2 sao cho
𝛼1 + 𝛼2 = 𝛼 và tương ứng ta tìm được cặp giá trị 𝑢1−𝛼1, 𝑢𝛼2 thoả mãn:
Trang 20𝑢1−𝛼1 = −𝑢𝛼1 < 0 , do vậy trường hợp 𝑃 𝐺 < 𝑢1−𝛼1 = 0 suy ra
𝛼2 = 𝛼 Vậy
𝑃(𝐺 ∈ 𝑊𝛼 /𝐻0) = 𝑃 𝐺 > 𝑢𝛼 = 𝛼
Ta thu được miền bác bỏ bên phải là:
Trang 21Trường hơp 2: 𝐻0: 𝜇 = 𝜇0 ; 𝐻1: 𝜇 < 𝜇0
Với 𝛼 cho trước có thể tìm được cặp giá trị 𝛼1, 𝛼2 sao cho
𝛼1 + 𝛼2 = 𝛼 và tương ứng ta tìm được cặp giá trị 𝑢1−𝛼1, 𝑢𝛼2 thoả mãn:
Trang 22𝑃(𝐺 ∈ 𝑊𝛼 /𝐻0) = 𝑃 𝐺 < 𝑢1−𝛼 = 𝑃 𝐺 < −𝑢𝛼 = 𝛼
Ta thu được miền bác bỏ bên trái là:
Trang 23Trường hơp 3: 𝐻0: 𝜇 = 𝜇0 ; 𝐻1: 𝜇 ≠ 𝜇0
Với 𝛼 cho trước có thể tìm được cặp giá trị 𝛼1, 𝛼2 sao cho
𝛼1 + 𝛼2 = 𝛼 và tương ứng ta tìm được cặp giá trị 𝑢1−𝛼1, 𝑢𝛼2 thoả mãn:
𝑃 𝐺 < 𝑢1−𝛼1 = 𝛼1
𝑃 𝐺 > 𝑢𝛼2 = 𝛼2
Trang 24Lấy 𝛼1 = 𝛼2 =
2 nên 𝑢1−𝛼1 = −𝑢𝛼 /2, 𝑢𝛼2 = 𝑢𝛼/2 Vậy 𝑃(𝐺 ∈ 𝑊𝛼 /𝐻0) = 𝑃 𝐺 > 𝑢𝛼 /2 = 𝛼
Ta có miền bác bỏ hai phía:
Trang 25Từ một mẫu cụ thể 𝑤 = (𝑥1, 𝑥2, … , 𝑥𝑛) ta tính giá trị quan sát của tiêu chuẩn kiểm định:
Trang 26Bác bỏ Thừa nhận
Trang 27α Bác bỏ Thừa nhận
Trang 28Bác bỏ Thừa nhận Bác bỏ
Trang 29Ví dụ
Trong năm trước, trọng lượng trung bình trước khi xuất chuồng của bò ở một trại chăn nuôi là 380 kg Năm nay người ta áp dụng một chế độ chăn nuôi mới với hy vọng bò sẽ tăng trọng nhanh hơn Sau thời gian áp dụng thử, người ta áp dụng ngẫu nhiên 50 con bò trước khi xuất chuồng đem cân và tính được trọng lượng trung bình của chúng là
390kg Vậy với mức ý nghĩa α = 0,01 có thể cho rằng trọng lượng trung bình của bò đã tăng lên hay không? Giả thiết trọng lượng của bò là biến ngẫu nhiên chuẩn với độ lệch chuẩn là 35,2kg
Trang 30EX = μ trọng lượng TB của bò sau khi áp dụng chế độ chăn nuôi mới
Trang 31b, Chưa biết phương sai 𝜎2
Chọn
𝐺 = 𝑋 − 𝜇0
𝑠 𝑛 Giả sử nếu 𝐻0 đúng tức là 𝜇 = 𝜇0 thì
𝐺 = 𝑇 = 𝑋 − 𝜇
𝑠 𝑛 ~ 𝑇(𝑛 − 1) 𝑃(𝐺 ∈ 𝑊𝛼 /𝐻0) = 𝛼
Để tìm miền bác bỏ 𝑊𝛼 ta xét các trường hợp Thực hiện tương tự
ta có:
Trang 35Từ một mẫu cụ thể 𝑤 = (𝑥1, 𝑥2, … , 𝑥𝑛) ta tính giá trị quan sát của tiêu chuẩn kiểm định:
Trang 36phối chuẩn với trọng lượng trung bình theo tiêu chu ẩn là 50kg Nghi
ngờ bị đóng thiếu, người ta đem cân ng ẫu nhiên 25 bao và thu được kết quả sau:
Trọng lượng bao(Kg)
Trang 37𝑋~𝑁 𝜇; 𝜎2 , 𝛼 = 0,01
𝐻0: 𝜇 = 50, 𝐻1: 𝜇 < 50 Miền bác bỏ:
Trang 38biến ngẫu nhiên g ốc 𝑋~𝑁(𝜇1, 𝜎1 ), ở tổng thể thứ hai ta xét biến ngẫu nhiên g ốc 𝑌~𝑁(𝜇2, 𝜎22) Từ hai tổng thể nói trên rút ra hai mẫu ngẫu nhiên đ ộc lập có kích thước tương ứng 𝑛1 và 𝑛2:
𝑊𝑋 = (𝑋1, 𝑋2, … , 𝑋𝑛1)
𝑊𝑌 = (𝑌1, 𝑌2, … , 𝑌𝑛2)
Nếu 𝜇1 và 𝜇2 chưa biết song có cơ sở đ ể giả thuyết rằng giá trị
của chúng b ằng nhau, người ta đưa ra giả thuyết thống kê:
Trang 42𝑛: 𝐺 > 𝑢𝛼
2 = −∞; −𝑢𝛼
2 ∪ (𝑢𝛼
2; +∞)
Trang 43giá trị q uan sát của tiêu chuẩn kiểm định:
Trang 44loại chi tiết Để dánh giá xem chi phí trung bình về nguyên liệu tiêu hao theo hai phương án ấy có khác nhau hay không người ta sản xuất thử và thu được kết quả như sau:
Phương án 1 2,5 3,2 3,5 3,8 3,5 Phương án 2 2,0 2,7 2,5 2,9 2,3 2,6 Với mức ý nghĩa α = 0,05, hãy kết luận về vấn đề trên nếu biết rằng chi phí nguyên liệu theo cả hai phương án để là biến ngẫu nhiêu chuẩn với 𝜎12 =
𝜎22 = 0,16
Trang 45Gọi 𝑋 là chi phí tiêu hao khi sx 1 sp theo phương án 1
𝐸𝑋 = 𝜇1 là chi phí tiêu hao TB khi sx 1 sp theo phương án 1
𝑋~𝑁(𝜇1, 𝜎12) Gọi 𝑌 là chi phí tiêu hao khi sx 1 sp theo phương án 2
𝐸𝑌 = 𝜇2 là chi phí tiêu hao TB khi sx 1 sp theo phương án 2
𝑌~𝑁(𝜇2, 𝜎22)
Trang 460,16 6
= 3,3 ∈ 𝑊𝛼
Bác bỏ 𝐻0, thừa nhận 𝐻1 tức là phương án sx 1 có mức tiêu hao nguyên liện
Trang 47𝐺 = 𝑇 = 𝑋 − 𝑌
𝐴 ~𝑇(𝑛1 +𝑛2−2)
Thực hiện tương tự như phần 2.1b ta có:
Trang 51Từ các mẫu cụ thể 𝑤𝑋 = 𝑥1, 𝑥2, … , 𝑥𝑛 , 𝑤𝑌 = (𝑦1, 𝑦2, … , 𝑦𝑛) ta tính giá trị quan sát của tiêu chuẩn kiểm định:
Trang 52Ví dụ Một nghiên cứu được thực hiện đối với 20 một phường và 19 người ở phường khác trong thành phố để xen thu nhập bình quân(tính bằng triệu đồng) của dân cư hai phường đó có thực sự khác nhau hay không Các số liệu mẫu như sau:
𝑛1 = 20, 𝑥 = 18,27, 𝑠𝑥2 = 8,74, 𝑛2 = 19, 𝑦 = 16,78, 𝑠𝑦2 = 6,58
Với mức ý nghĩa α = 0,05 có thể cho rằng thu nhập trung bình của dân cư hai phường đó có khác nhau hay không? Giả sử thu nhập hàng năm của dân cư
Trang 53Giải
Gọi 𝑋 là thu nhập của một người dân ở phường 1
𝐸𝑋 = 𝜇1 là thu nhập TB của một người dân ở phường 1
𝑋~𝑁(𝜇1, 𝜎12) Gọi 𝑌 là thu nhập của một người dân ở phường 2
𝐸𝑌 = 𝜇2 là thu nhập TB của một người dân ở phường 2
𝑌~𝑁(𝜇2, 𝜎22)
𝐻0: 𝜇1 = 𝜇2, 𝐻1: 𝜇1 ≠ 𝜇2
Trang 55Nếu p chưa biết nhưng có cơ sở giả thuyết rằng giá trị của nó bằng 𝑝0 thì ta đưa ra giả thuyết:
Trang 56𝐺 = 𝑓 − 𝑝0
𝑝0𝑞0 𝑛 Nếu 𝐻0 đúng thì:
𝐺 = 𝑈 = 𝑓 − 𝑝
𝑝𝑞 𝑛~𝑁(0,1)
Trang 57𝑃(𝐺 ∈ 𝑊𝛼 /𝐻0) = 𝑃 𝐺 > 𝑢𝛼 = 𝛼
Ta thu được miền bác bỏ bên phải là:
Trang 58𝑃(𝐺 ∈ 𝑊𝛼 /𝐻0) = 𝑃 𝐺 < 𝑢1−𝛼 = 𝑃 𝐺 < −𝑢𝛼 = 𝛼
Ta thu được miền bác bỏ bên trái là:
Trang 59𝑃(𝐺 ∈ 𝑊𝛼 /𝐻0) = 𝑃 𝐺 > 𝑢𝛼/2 = 𝛼
Ta có miền b ác b ỏ hai p hía:
𝑊𝛼 = 𝐺 = 𝑓 − 𝑝0
𝑝0𝑞0 𝑛: 𝐺 > 𝑢𝛼/2 = (−∞; −𝑢𝛼/2) ∪ (𝑢𝛼/2; +∞)
Trang 60𝐺𝑞𝑠 = 𝑓 − 𝑝0
𝑝0𝑞0 𝑛
Và so sánh 𝐺𝑞𝑠 với 𝑊𝛼 để đ ưa ra kết luận:
- Nếu 𝐺𝑞𝑠 ∈ 𝑊𝛼 thì bác b ỏ 𝐻0 thừa nhận 𝐻1
Trang 61A là 60% Sau m ột chiến dịch quảng cáo, người ta muốn đánh giá xem chiến dịch quảng cáo này liệu có thực sự mang lại hiệu quả hay không Để làm điều đó, người ta phỏng vấn ngẫu nhiên 400 khách hàng thì thấy có 250 người dùng lo ại sản phẩm nói trên Với mức ý nghĩa 0,05 hãy kết luận về chiến dịch quảng cáo.
Trang 62𝐻0: 𝑝 = 0,6; 𝐻1: 𝑝 > 0,6 Suy ra miền bác bỏ:
𝑊𝛼 = 𝑢0,05; +∞ = (1,65; +∞)
𝐺𝑞𝑠 =
250
400 − 0,6 0,6(1 − 0,6) 400 = 0,258 ∉ 𝑊𝛼
Trang 63biến ngẫu nhiên g ốc 𝑋 tuân theo quy luật không-một với
𝑃 𝑋 = 1 = 𝑝1, 𝑃 𝑋 = 0 = 1 − 𝑝1 = 𝑞1
ở tổng thể thứ hai ta xét biến ngẫu nhiên gốc 𝑌 tuân theo quy
luật không -một với
𝑃 𝑌 = 1 = 𝑝2, 𝑃 𝑋 = 0 = 1 − 𝑝2 = 𝑞2Với 𝑝1 và 𝑝2 chưa biết Nếu có cơ sở cho rằng chúng bằng nhau thì ta giả thuyết :
𝐻0: 𝑝1 = 𝑝2 = 𝑝
Trang 64thước tương ứng 𝑛1 và 𝑛2:
𝑊𝑋 = (𝑋1, 𝑋2, … , 𝑋𝑛1)
𝑊𝑌 = (𝑌1, 𝑌2, … , 𝑌𝑛2) với 𝑋 = 1
~𝑁(0,1)
Trang 70máy sản suất thu được số liệu sau:
Nhà máy
Số sản phẩm đươch kiểm tra
Số phế phẩm
A 𝑛1 = 1000 𝑥1 = 20
B 𝑛2 = 900 𝑥2 = 30 Với mức ý nghĩa α = 0,05 có thể coi tỉ lệ phế phẩm của hai nhà máy
là như nhau được hay không?
Trang 74𝐺 = 𝜒2 =
𝜎02 = 𝜎2 ~𝜒(𝑛−1)
Với 𝛼 cho trước có thể tìm được cặp giá trị 𝛼1, 𝛼2 sao cho
𝛼1 + 𝛼2 = 𝛼 và từ đó tìm được hai giá trị tới hạn khi bình phương tương ứng là 𝜒1−𝛼
Trang 77𝑃(𝐺 ∈ 𝑊𝛼 /𝐻0) = 𝑃 (𝐺 < 𝜒
1−𝛼2 ) + ( 𝐺 > 𝜒𝛼
2
) = 𝛼 Nên ta có miền bác bỏ :
Trang 78Bác bỏ Thừa nhận
Trang 79Bác bỏ Thừa nhận
α
Trang 80Bác bỏ Thừa nhận
α/2
Bác bỏ
α/2
Trang 81được 𝑠2 = 14,6 Với mức ý nghĩa α = 0,01 hãy kết luận máy móc
có hoạt động có bình thường không, biết rằng kích thước chi tiết
là biến ngẫu nhiên phân phối chuẩn có dung sai theo thiết kế là
𝜎02 = 12