Bài giảng Lý thuyết xác suất và thống kê toán: Chương 8 - Mai Cẩm Tú
Trang 1KIEM DINH GIA THUYET THONG KE
Mai Cẩm Tú (TKT) Lý thuyết Xác suất và Thống kê Toán 2012 252/293
Trang 2Nội dung chương 8
@ Khai niém chung
Trang 3Nội dung chương 8
@ Khái niệm chung
@ Kiểm định giả thuyết về tham số của 1 biến
ngẫu nhiên
Trang 4Nội dung chương 8
@ Khái niệm chung
@ Kiểm định giả thuyết về tham số của 1 biến
ngẫu nhiên
@ Kiểm định giả thuyết về tham số của 2 biến
ngẫu nhiên
Trang 51.1 Giả thuyết thống kê
Định nghĩa: Giả thuyết thống kê là giả thuyết
+ về dạng phân phối xác suất của biến ngẫu nhiên, + về các tham số đặc trưng của biến ngẫu nhiên
hoặc
+ về tính độc lập của biến ngẫu nhiên
Mai Cẩm Tú (TKT) Lý thuyết Xác suất và Thống kê Toán 2012 254/293
Trang 61.1 Giả thuyết thống kê
Định nghĩa: Giả thuyết thống kê là giả thuyết
+ về dạng phân phối xác suất của biến ngẫu nhiên, + về các tham số đặc trưng của biến ngẫu nhiên
hoặc
+ về tính độc lập của biến ngẫu nhiên
Giả thuyết thống kê đưa ra được kí hiệu là Họ và
goi 1a gia thuyết gốc
Mệnh đề mâu thuẫn với giả thuyết gốc gọi là giả
thuyết đối, kí hiệu Hi
Cặp Họ, Hì gọi là cặp giả thuyết thống kê
Trang 7Thi du 8.1 Xét nhu cầu của thị trường về loại sản
Trang 8Thi du 8.1 Xét nhu cầu của thị trường về loại sản
phẩm nào đó
Họ : nhu cầu trung bình bằng 10 tấn/ngày (¡: = 10)
H, : uw # 10( hoac pp < 10; hoặc ¿ > 10)
Họ : nhu cầu X tuân theo quy luật chuẩn
H: : X không tuân theo quy luật chuẩn
Trang 9Thi du 8.1 Xét nhu cầu của thị trường về loại sản
phẩm nào đó
Họ : nhu cầu trung bình bằng 10 tấn/ngày (¡: = 10)
H, : uw # 10( hoac pp < 10; hoặc ¿ > 10)
Họ : nhu cầu X tuân theo quy luật chuẩn
H: : X không tuân theo quy luật chuẩn
Họ : nhu cầu X và giá Y độc lập với nhau
H: : X và Y không độc lập
Trang 10Thi du 8.1 Xét nhu cầu của thị trường về loại sản
phẩm nào đó
Họ : nhu cầu trung bình bằng 10 tấn/ngày (¡: = 10)
H, : uw # 10( hoac pp < 10; hoặc ¿ > 10)
Họ : nhu cầu X tuân theo quy luật chuẩn
H: : X không tuân theo quy luật chuẩn
Họ : nhu cầu X và giá Y độc lập với nhau
H: : X và Y không độc lập
Có 2 loại là giả thuyết đơn và giả thuyết kép
Trang 11Phương pháp chung để kiểm định giả thuyết thống kê:
+ Giả sử Họ đúng từ đó dựa vào thông tin của mẫu rút ra một biến cố A nào đó (gọi là miền bác bỏ giả
thuyết) sao cho P(A) = œ bé đến mức có thể coi A
không xảy ra trong một phép thử
Trang 12
Phương pháp chung để kiểm định giả thuyết thống kê:
+ Giả sử Họ đúng từ đó dựa vào thông tin của mẫu rút ra một biến cố A nào đó (gọi là miền bác bỏ giả
thuyết) sao cho P(A) = œ bé đến mức có thể coi A
không xảy ra trong một phép thử
Trang 13Phương pháp chung để kiểm định giả thuyết thống kê:
+ Giả sử Họ đúng từ đó dựa vào thông tin của mẫu rút ra một biến cố A nào đó (gọi là miền bác bỏ giả
thuyết) sao cho P(A) = œ bé đến mức có thể coi A
không xảy ra trong một phép thử
Trang 141.2 Tiêu chuẩn kiểm định giả thuyết thống kê
Lập mẫu ngẫu nhiên : W = (X:,X¿, , Xn)
Trang 151.3 Miền bác bỏ giả thuyết
Khi đã biết quy luật phân phối xác suất cua G thi
với xác suất a cho trước khá bé có thể tìm được
miền W,„ tuơng ứng sao cho
P(Gc W„/Hạ) =a
2012 258/293
Trang 161.3 Miền bác bỏ giả thuyết
Khi đã biết quy luật phân phối xác suất cua G thi
với xác suất a cho trước khá bé có thể tìm được
miền W,„ tuơng ứng sao cho
P(Gc W„/Hạ) =a
Giá trị œ gọi là mức ý nghĩa của kiểm định
Miền W/, gọi là miền bác bỏ giả thuyết Họ với mức
ý nghĩa a
W,, gọi là miền thừa nhận giả thuyết
Điểm giới hạn phân chia miền bác bỏ và miền thừa
nhận giả thuyết gọi là giá trị tới hạn
Trang 171.4 Giá trị quan sát của tiêu chuẩn kiểm định
Với một mẫu cụ thể w = (X4, Xa , Xa) ta tính được
Trang 181.4 Giá trị quan sát của tiêu chuẩn kiểm định
Với một mẫu cụ thể w = (X4, Xa , Xa) ta tính được
giá trị cụ thể của G là
Gạs — f(X Xa, .? Xn, A.)
Giá trị này được gọi là giá trị quan sát của tiêu
chuẩn kiếm định
1.5 Quy tắc kiểm định giả thuyết thống kê
a Néu Ggs c W, thì bác bỏ Họ, thừa nhận Hi
b Nếu Gạ; g W,, thì chưa có cơ sở để bác bỏ Họ
(trên thực tế vẫn thừa nhận Họ)
Trang 191.6 Sai lâm loại một và sai lâm loại hai
a Sai lam loại I Bác bỏ giả thuyết Họ trong khi Họ đúng xác suất mắc sai lầm loại 1 là:
P(Gec W,, / Ho) =a
Trang 20
1.6 Sai lâm loại một và sai lâm loại hai
a Sai lam loại I Bác bỏ giả thuyết Họ trong khi Họ đúng xác suất mắc sai lầm loại 1 là:
P(Gec W,, / Ho) =a
Trang 211.7 Thủ tục kiểm định giả thuyết thống kê
a Kiểm định với giá trị cho rước của o
Mai Cẩm Tú (TKT) Lý thuyết Xác suất và Thống kê Toán 2012 261/293
Trang 221.7 Thủ tục kiểm định giả thuyết thống kê
a Kiểm định với giá trị cho rước của o
b Kiểm định với giá trị cho trước của œ và 6
Xác định kích thước mẫu phù hợp để xác suất mắc sai lầm loại l không vượt quá œ và xác suất mắc sai
lầm loại 2 không vượt quá đ đã cho
Trang 23
2.1 Kiểm định giả thuyết về kì vọng toán của
biến ngẫu nhiên phân phối theo quy luật chuẩn
a Khi đã biết phương sai oˆ
Giả sử biến ngẫu nhiên gốc phân phối theo quy luật
chuẩn N(¡,ø?) với phương sai ø2 đã biết nhưng
chưa biết kì vọng toán /¡ Ta đưa ra giả thuyết
Họ : [6 = Họ
Lập mẫu kích thước n: W = (X\.X¿, , Xn)
Từ đó tìm được trung bình mẫu X
Mai Cẩm Tú (TKT) Lý thuyết Xác suất và Thống kê Toán 2012 262/293
Trang 24Chọn tiêu chuẩn kiểm định là thống kê
Với œ cho trước có thể tìm được giá trị tới hạn
chuẩn u, sao cho P(U > u,) = a
Xét W, = {U: U> u,} thi
P(G € W,,/Ho) = P(U > u,) =a
Trang 28+ Nếu Ugs c W,, thì bác bỏ Họ, thừa nhận H:
+ Nếu Uạ; £ W,, thì chưa có cơ sở để bác bỏ Họ
Trang 29
b Khi chưa biết phương sai
Ta có bảng sau:
Trang 30
Thi du 8.2 Chi tiêu của một sinh viên (triệu
đồng/tháng) là biến ngẫu nhiên phân phối chuẩn
Điều tra chi tiêu của 25 sinh viên thì có bảng sau:
Lấy a =0,05 cho moi cau hoi sau đây:
a, C6 thé cho rằng chi tiêu trung bình của sinh viên
là 2,5 triệu đồng/tháng?
b, Chi tiêu trung bình của sinh viên tối đa là bao
nhiêu?
Trang 31
Thí dụ 8.3 Theo dõi thời gian hoàn thành sản phẩm
ở 100 công nhân ta thu được bảng số liệu sau:
T/gian(ph) | 10-12 12-14 14-16 16-18
Số sản phẩm | 12 28 40 20
Biết rằng thời gian hoàn thành 1 sản phẩm là biến
ngẫu nhiên phân phối chuẩn Cho a = 0,05
a, Có cần thay đối định mức không? Biết trước đây định mức trung bình về thời gian hoàn thành một sản phẩm là 14 phút
b, Có thể cho rằng thời gian trung bình để hoàn
thành sản phẩm không dưới 13 phút được không?
c, Hay cho biết thời gian trung bình để hoàn thành
I sản phẩm nằm trong khoảng nào?
Trang 32
2.2 Kiểm định giả thuyết về phương sai của biến ngẫu nhiên phân phối chuẩn
Giả sử trong tổng thể nghiên cứu biến ngẫu nhiên
gốc X ~ N(¡, ơ? ) với ø2 chưa biết
Ta có bảng tổng hợp:
2(n—1 Ho: 0% =02 |o74 0% = VN: :xÊ< XI n2
Trang 33
Chú ý: Độ phân tán được đặc trưng bởi øÊ hoặc ø
nên khi viết Họ phải chú ý đơn vị đo
Độ dao động, biến động, biến đổi cùng
chiều với độ phân tán
Độ đồng đều, ổn định, biến đổi ngược chiều
với độ phân tán
Mai Cẩm Tú (TKT) Lý thuyết Xác suất và Thống kê Toán 2012 270/293
Trang 34
Chú ý: Độ phân tán được đặc trưng bởi øÊ hoặc ø
nên khi viết Họ phải chú ý đơn vị đo
Độ dao động, biến động, biến đổi cùng
chiều với độ phân tán
Độ đồng đều, ổn định, biến đổi ngược chiều
Trang 35
Thí dụ 8.4 Trọng lượng của sản phẩm được sản
xuất tự động là biến ngẫu nhiên phân phối chuẩn Nghi ngờ độ đồng đều về trọng lượng sản phẩm
giảm sút người ta cân thử 12 sản phẩm và tìm được
Trang 362.3 Kiểm định giả thuyết về tham số p của biến
ngẫu nhiên phân phối không - một
Giả sử biến ngẫu nhiên gốc X ~ A(p) Khi đó p
chính là cơ cấu của tổng thể nghiên cứu
Trang 37
2.3 Kiểm định giả thuyết về tham số p của biến
ngẫu nhiên phân phối không - một
Giả sử biến ngẫu nhiên gốc X ~ A(p) Khi đó p
chính là cơ cấu của tổng thể nghiên cứu
Trang 38
2.3 Kiểm định giả thuyết về tham số p của biến
ngẫu nhiên phân phối không - một
Giả sử biến ngẫu nhiên gốc X ~ A(p) Khi đó p
chính là cơ cấu của tổng thể nghiên cứu
Trang 39Thí dụ 8.5 Kiểm tra ngẫu nhiên 100 sản phẩm của
lô hàng này thấy có 4 phế phẩm
a, Có thể cho rằng tỷ lệ chính phẩm của lô hàng này
vượt quá 90% được không? Kết luận với œ = 0, 05
b, Lô hàng đủ tiêu chuẩn xuất khẩu nếu tỷ lệ phế phẩm không vượt quá 5% Với mức ý nghĩa 0,05 có
cho phép lô hàng xuất khẩu được không?
c, Biết rằng cả lô hàng có 10000 sản phẩm Với độ tin cậy 0,95 hãy cho biết số phế phẩm tối đa của lô
hàng này
d, Biết rằng cả lô hàng có 10000 sản phẩm Với
mức ý nghĩa 5% có thể cho rằng số phế phẩm của
lô hàng nhỏ hơn 600 không?
Mai Cẩm Tú (TKT) Lý thuyết Xác suất và Thống kê Toán 2012 273/293
Trang 40
Thí dụ 8.3 Theo dõi thời gian hoàn thành sản phẩm
ở 100 công nhân ta thu được bảng số liệu sau
T/gian(ph) | 10-12 12-14 14-16 16-18
Số sản phẩm | 12 28 40 20
ø, Với mức ý nghĩa 5% có thể cho rằng có 2/3 số
công nhân có thời gian hoàn thành sản phẩm cao hơn 14 phút được không?
Trang 41
Thí dụ 8.6 (Bài toán cơ cấu) Điều tra 500 người
dân ở 1 khu vực thì có 300 người mua bảo hiểm,
trong đó có 150 người mua bảo hiểm của công ty
A Lấy œ = 0,05
a Hãy ước lượng tỷ lệ người dân khu vực này đã
mua bảo hiểm
b Có thể cho rằng có 1/3 số người dân khu vực này
đã mua bảo hiểm của công ty A
c Biết rằng công ty A đã bán được 5000 bảo hiểm
ở khu vực này Hãy ước lượng tối đa số người dân
đã mua bảo hiểm ở khu vực đang xét
Mai Cẩm Tú (TKT) Lý thuyết Xác suất và Thống kê Toán 2012 275/293
Trang 42
2.4 Kiểm định giả thuyết về hai kì vọng toán
của hai biến ngẫu nhiên phân phối chuẩn
Gia su x, ~ N( 101, 07), X2 ~ N( v2, a3)
Từ hai tổng thể trên rút ra hai mẫu độc lập
Trang 432.4 Kiểm định giả thuyết về hai kì vọng toán
của hai biến ngẫu nhiên phân phối chuẩn
Trang 45
Thí dụ 8.7 Kiểm tra chỉ số thông minh của trẻ em
ở 2 vùng và thu được kết quả sau:
Vùng thứ nhất: n,;=38; Xxị=89,7; sị = 12,2 Vung thứhai: nạ =40; Xxạ=94,5; sạ= 13,05
Với mức ý nghĩa œ = 0,05 có sự khác biệt đáng kể
về sự phát triển trí tuệ của trẻ em thuộc hai vùng
nói trên không?
Mai Cẩm Tú (TKT) Lý thuyết Xác suất và Thống kê Toán 2012 278/293
Trang 46
2.5 Kiểm định giả thuyết về sự bằng nhau của
hai phương sai của hai biến ngẫu nhiên phân
phối chuẩn
Ta có các trường hợp sau:
Trang 47
Thí dụ 8.8 Độ rủi ro trong đầu tư thường được đo
bằng phương sai của tỷ lệ thu hồi vốn Cho số liệu sau về kết quả điều tra của hai ngành kinh tế
Ngành A: Số dự án điều tra: 10
Tốc độ hoàn vốn trung bình: 10,48 Phuong sai: 1,44
Ngành B: Số dự án điều tra: 15
Tốc độ hoàn vốn trung binh:11 Phuong sai: 16
Với mức ý nghĩa 0,05 có thể cho rằng rủi ro đầu tư
ở ngành B cao hơn ngành A hay không Giả thiết tỷ
lệ thu hồi vốn là biến ngẫu nhiên phân phối chuẩn
Trang 48
2.6 Kiểm định giả thuyết về hai tham số p của
hai biến ngẫu nhiên phân phối A(p)
Gia su x, ~ A(p1) va X2 ~ A(p2)
Rút ra hai mẫu ngẫu nhiên độc lập
(m > 30, nạ > 30)
Ta có các trường hợp sau:
Trang 49
Thí dụ 8.9 Điều tra 100 sinh viên trường A thì có
40 nữ, 200 sinh viên trường B thì có 90 nữ Với
mức ý nghĩa 0,05 có thể cho rằng tỷ lệ sinh viên nữ
ở 2 trường là như nhau hay không?
Mai Cẩm Tú (TKT) Lý thuyết Xác suất và Thống kê Toán 2012 282/293
Trang 50
Thí dụ 8.9 Điều tra 100 sinh viên trường A thì có
40 nữ, 200 sinh viên trường B thì có 90 nữ Với
mức ý nghĩa 0,05 có thể cho rằng tỷ lệ sinh viên nữ
ở 2 trường là như nhau hay không?
Thí dụ 8.10 Kiểm tra 200 công nhân ở một khu
công nghiệp thì có 105 công nhân nam, còn lại là công nhân nữ Trong đó có 80 công nhân nam và
60 công nhân nữ đã có bảo hiểm
a Có thể cho rằng tỷ lệ công nhân nam bằng tỷ lệ
công nhân nữ không? Lấy a = 0, 05
b Với mức ý nghĩa 5% có thể cho rằng tỷ lệ công
nhân nam có bảo hiểm cao hơn tỷ lệ công nhân nữ
có bảo hiểm không?
Trang 51
Thí dụ 8.11 Theo dõi lợi nhuận của cửa hàng A
trong một số ngày thì có kết quả:
Biết lợi nhuận 1 ngày (triệu đồng) phân phối Chuẩn
a Hãy ước lượng lợi nhuận trung bình một ngày
của cửa hàng với độ tin cậy 0,95
b Trước đây lợi nhận trung bình I ngày của cửa
hàng là 3,3 triệu đồng Có thể cho rằng lợi nhuận
trung bình của cửa hàng đã tăng lên hay không?
Cho œ = 0,025
2012 283/293
Mai Cẩm Tú (TKT) Lý thuyết Xác suất và Thống kê Toán
Trang 52
c Hãy ước lượng bằng khoảng tin cậy 2 phía
phương sai về lợi nhuận 1 ngày của cửa hàng với độ tin cậy 0,9
d Trước đây độ lệch chuẩn về lợi nhuận 1 ngày của cửa hàng là 0,7 triệu đồng Có thể cho rằng mức độ
ồn định về lợi nhuận đã giảm hay không? Lấy
a = 0,05
e Với độ tin cậy 0,95 hãy ước lượng tỷ lệ ngày có lợi nhuận từ 5 triệu đồng trở lên
ø Có thể cho rằng tỷ lệ ngày có lợi nhuận từ 5 triệu
đồng trở lệ không vượt quá 12% được không? Lấy
a = 0,05
Trang 53
h Tại cửa hàng B theo dõi 60 ngày thì thấy có 10 ngày có lợi nhuần từ 5 triệu đồng trở lên và tính
được trung bình là 3,8 triệu đồng, độ lệch chuẩn
mẫu 1,2 triệu đồng Với mức ý nghĩa 5% có thể cho rằng:
1, Lợi nhuận trung bình của A và B như nhau?
ii, DO phân tán về lợi nhuận của A và B như