Lý thuyết chi tiết rõ ràng và ví dụ về tất cả các dạng bài toán Xstk: Kiểm định giả thuyết thống kê dành cho sinh viên các trường đại học và cao đẳng.................................................................................
Trang 1Xác suất thống kê B KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
Nguyễn Thị Hồng Nhungnthongnhung89@gmail.com, nthnhung@hcmus.edu.vn
Khoa Toán Trường Đại học Khoa Học Tự Nhiên Hồ Chí Minh
Ngày 4 tháng 5 năm 2017
Trang 2Miền bác bỏ - Tiêu chuẩn kiểm định
Sai lầm loại I và loại II
p- giá trị
Kiểm định giả thuyết cho kỳ vọng
Kiểm định giả thuyết cho tỷ lệ
So sánh hai tỷ lệ
So sánh hai kỳ vọng
So sánh hai kỳ vọng, TH biết phương sai
So sánh hai kỳ vọng, TH không biết phương sai, mẫu lớn
So sánh hai kỳ vọng, TH không biết phương sai, mẫu nhỏ
Nguyễn Thị Hồng Nhung nthongnhung89@gmail.com, nthnhung@hcmus.edu.vn ( ĐHKHTN) XSTKB Ngày 4 tháng 5 năm 2017 2 / 78
Trang 3Định nghĩa
Ví dụ 1:
Giám đốc một nhà máy sản xuất bo mạch chủ máy vi tính tuyên bố rằngtuổi thọ trung bình của một bo mạch chủ do nhà máy sản xuất là 5 năm;đây là một giả thuyết về kỳ vọng của biến ngẫu nhiên X := tuổi thọ củamột bo mạch chủ Để đưa ra kết luận là chấp nhận hay bác bỏ giả thuyếttrên, ta cần dựa vào mẫu điều tra và quy tắc kiểm định thống kê
Trang 4Bài toán kiểm định giả thuyết thống kê Định nghĩa
Định nghĩa
Định nghĩa
Giả thuyết thống kê là những phát biểu về các tham số, quy luật
phân phối, hoặc tính độc lập của các đại lượng ngẫu nhiên
Kiểm định giả thuyết là quá trình mà qua đó có thể quyết định bác
bỏ giả thuyết hay không, dựa vào mẫu (X1, , Xn) lấy từ tổng thể
Trang 5Định nghĩa
Định nghĩa
Giả thuyết thống kê là những phát biểu về các tham số, quy luậtphân phối, hoặc tính độc lập của các đại lượng ngẫu nhiên
Kiểm định giả thuyết là quá trình mà qua đó có thể quyết định bác
bỏ giả thuyết hay không, dựa vào mẫu (X1, , Xn) lấy từ tổng thể
Trang 6Bài toán kiểm định giả thuyết thống kê Giả thuyết không và đối thuyết
Định nghĩa
Định nghĩa
Trong bài toán kiểm định giả thuyết,
Giả thuyết không (null hypothesis) là giả thuyết cần được kiểm định
Ký hiệu: H0
Đối thuyết (alternative hypothesis)là giả thuyết được xem xét đểthay thế giả thuyết không Ký hiệu: H1
Trang 7Định nghĩa
Định nghĩa
Trong bài toán kiểm định giả thuyết,
Giả thuyết không (null hypothesis) là giả thuyết cần được kiểm định
Ký hiệu: H0
Đối thuyết (alternative hypothesis)là giả thuyết được xem xét đểthay thế giả thuyết không Ký hiệu: H1
Trang 8Định nghĩa
Định nghĩa
Trong bài toán kiểm định giả thuyết,
Giả thuyết không (null hypothesis) là giả thuyết cần được kiểm định
Ký hiệu: H0
Đối thuyết (alternative hypothesis)là giả thuyết được xem xét đểthay thế giả thuyết không Ký hiệu: H1
Trang 9Định nghĩa
Định nghĩa
Trong bài toán kiểm định giả thuyết,
Giả thuyết không (null hypothesis) là giả thuyết cần được kiểm định
Ký hiệu: H0
Đối thuyết (alternative hypothesis)là giả thuyết được xem xét đểthay thế giả thuyết không Ký hiệu: H1
Trang 10Định nghĩa
Xét bài toán kiểm định tham số, giả sử ta quan trắc mẫu ngẫu nhiên(X1, , Xn) từ biến ngẫu nhiên X có hàm mật độ xác suất f (x ; θ) phụthuộc vào tham số θ Gọi Θ là không gian tham số, và Θ0 và Θc0 là haitập con rời nhau của Θ sao cho Θ0∪ Θc
0 = Θ Giả thuyết (giả thuyếtkhông) và đối thuyết của bài toán có dạng như sau
H0: θ ∈ Θ0
H1: θ ∈ Θc0
Trang 11Bài toán kiểm định giả thuyết thống kê Giả thuyết không và đối thuyết
Ví dụ-Giả thuyết không và đối thuyết
khi dùng thuốc bác sĩ điều trị cần quan tâm đến giả thuyết sau
một lô hàng mua của một nhà cung cấp Giả sử tỷ lệ sản phẩm kémtối đa được phép là 5% Khách hàng cần quan tâm đến giả thuyết sau
Trang 12Ví dụ-Giả thuyết không và đối thuyết
khi dùng thuốc bác sĩ điều trị cần quan tâm đến giả thuyết sau
một lô hàng mua của một nhà cung cấp Giả sử tỷ lệ sản phẩm kémtối đa được phép là 5% Khách hàng cần quan tâm đến giả thuyết sau
Trang 13Bài toán kiểm định giả thuyết thống kê Cách đặt giả thuyết
Cách đặt giả thuyết
1 Giả thuyết được đặt ra với ý đồ bác bỏ nó, nghĩa là giả thuyết đặt ra
ngược lại với điều ta muốn chứng minh, muốn thuyết phục
tác dụng trả lời bài toán thực tế đặt ra
quy luật phân phối xác suất của đại lượng ngẫu nhiên được chọn làmtiêu chuẩn kiểm định
4 Khi đặt giả thuyết, ta thường so sánh cái chưa biết với cái đã biết Cáichưa biết là điều mà ta cần kiểm định, kiểm tra, làm rõ “Cái đã biết”
là những thông tin trong quá khứ, các định mức kinh tế, kỹ thuật
Trang 14Bài toán kiểm định giả thuyết thống kê Cách đặt giả thuyết
Cách đặt giả thuyết
1 Giả thuyết được đặt ra với ý đồ bác bỏ nó, nghĩa là giả thuyết đặt ra
ngược lại với điều ta muốn chứng minh, muốn thuyết phục
tác dụng trả lời bài toán thực tế đặt ra
quy luật phân phối xác suất của đại lượng ngẫu nhiên được chọn làmtiêu chuẩn kiểm định
4 Khi đặt giả thuyết, ta thường so sánh cái chưa biết với cái đã biết Cáichưa biết là điều mà ta cần kiểm định, kiểm tra, làm rõ “Cái đã biết”
là những thông tin trong quá khứ, các định mức kinh tế, kỹ thuật
Trang 15Bài toán kiểm định giả thuyết thống kê Cách đặt giả thuyết
Cách đặt giả thuyết
1 Giả thuyết được đặt ra với ý đồ bác bỏ nó, nghĩa là giả thuyết đặt ra
ngược lại với điều ta muốn chứng minh, muốn thuyết phục
tác dụng trả lời bài toán thực tế đặt ra
quy luật phân phối xác suất của đại lượng ngẫu nhiên được chọn làm
tiêu chuẩn kiểm định
4 Khi đặt giả thuyết, ta thường so sánh cái chưa biết với cái đã biết Cáichưa biết là điều mà ta cần kiểm định, kiểm tra, làm rõ “Cái đã biết”
là những thông tin trong quá khứ, các định mức kinh tế, kỹ thuật
Trang 16Cách đặt giả thuyết
1 Giả thuyết được đặt ra với ý đồ bác bỏ nó, nghĩa là giả thuyết đặt rangược lại với điều ta muốn chứng minh, muốn thuyết phục
tác dụng trả lời bài toán thực tế đặt ra
quy luật phân phối xác suất của đại lượng ngẫu nhiên được chọn làmtiêu chuẩn kiểm định
4 Khi đặt giả thuyết, ta thường so sánh cái chưa biết với cái đã biết Cáichưa biết là điều mà ta cần kiểm định, kiểm tra, làm rõ “Cái đã biết”
là những thông tin trong quá khứ, các định mức kinh tế, kỹ thuật
Trang 17Bài toán kiểm định giả thuyết thống kê Cách đặt giả thuyết
Cách đặt giả thuyết
Tổng quát, một bài toán kiểm định giả thuyết cho tham số θ sẽ có một
trong 3 dạng dưới đây (θ0 là giá trị kiểm định đã biết):
Trang 18Bài toán kiểm định giả thuyết thống kê Cách đặt giả thuyết
Cách đặt giả thuyết
Tổng quát, một bài toán kiểm định giả thuyết cho tham số θ sẽ có một
trong 3 dạng dưới đây (θ0 là giá trị kiểm định đã biết): Hai phía:
Trang 19Bài toán kiểm định giả thuyết thống kê Cách đặt giả thuyết
Cách đặt giả thuyết
Tổng quát, một bài toán kiểm định giả thuyết cho tham số θ sẽ có một
trong 3 dạng dưới đây (θ0 là giá trị kiểm định đã biết): Hai phía:
Trang 22Bài toán kiểm định giả thuyết thống kê Miền bác bỏ - Tiêu chuẩn kiểm định
Miền bác bỏ-Tiêu chuẩn kiểm định
Định nghĩa
Xét bài toán kiểm định giả thuyết H0 và đối thuyết H1 Giả sử rằng H0
đúng, từ mẫu ngẫu nhiên X = (X1, , Xn) chọn hàm
Z = h(X1, , Xn; θ0) sao cho với số α > 0 bé tùy ý ta có thể tìm dược
tập hợp Wα thỏa điều kiện
Tập hợp Wα gọi là miền bác bỏ giả thuyết H0 và phần bù Wαc gọi là
miền chấp nhận giả thuyết H0 Đại lượng ngẫu nhiên
Z = h(X1, , Xn; θ0) gọi là tiêu chuẩn kiểm địnhgiả thuyết H0 Giá trị αgọi là mức ý nghĩa của bài toán kiểm định
Trang 23Miền bác bỏ-Tiêu chuẩn kiểm định
Định nghĩa
Xét bài toán kiểm định giả thuyết H0 và đối thuyết H1 Giả sử rằng H0
đúng, từ mẫu ngẫu nhiên X = (X1, , Xn) chọn hàm
Z = h(X1, , Xn; θ0) sao cho với số α > 0 bé tùy ý ta có thể tìm dượctập hợp Wα thỏa điều kiện
Tập hợp Wα gọi là miền bác bỏ giả thuyết H0 và phần bù Wαc gọi là
miền chấp nhận giả thuyết H0 Đại lượng ngẫu nhiên
Z = h(X1, , Xn; θ0) gọi là tiêu chuẩn kiểm địnhgiả thuyết H0 Giá trị α
Trang 24Miền bác bỏ-Tiêu chuẩn kiểm định
Định nghĩa
Xét bài toán kiểm định giả thuyết H0 và đối thuyết H1 Giả sử rằng H0
đúng, từ mẫu ngẫu nhiên X = (X1, , Xn) chọn hàm
Z = h(X1, , Xn; θ0) sao cho với số α > 0 bé tùy ý ta có thể tìm dượctập hợp Wα thỏa điều kiện
Tập hợp Wα gọi là miền bác bỏ giả thuyết H0 và phần bù Wαc gọi là
miền chấp nhận giả thuyết H0 Đại lượng ngẫu nhiên
Z = h(X1, , Xn; θ0) gọi là tiêu chuẩn kiểm địnhgiả thuyết H0 Giá trị αgọi là mức ý nghĩa của bài toán kiểm định
Trang 25Bài toán kiểm định giả thuyết thống kê Miền bác bỏ - Tiêu chuẩn kiểm định
Miền bác bỏ-Tiêu chuẩn kiểm định
Thực hiện quan trắc dựa trên mẫu ngẫu nhiên (X1, , Xn) ta thu được
Trang 26Bài toán kiểm định giả thuyết thống kê Miền bác bỏ - Tiêu chuẩn kiểm định
Miền bác bỏ-Tiêu chuẩn kiểm định
Thực hiện quan trắc dựa trên mẫu ngẫu nhiên (X1, , Xn) ta thu được
mẫu thực nghiệm (x1, , xn) Từ mẫu thực nghiệm này, ta tính được giá
trị của Z là z = h(x1, , xn; θ0)
Nếu z ∈ Wα thì ta bác bỏ giả thuyết H0
α thì ta chưa đủ cơ sở để bác bỏ H0
Trang 27Bài toán kiểm định giả thuyết thống kê Miền bác bỏ - Tiêu chuẩn kiểm định
Miền bác bỏ-Tiêu chuẩn kiểm định
Thực hiện quan trắc dựa trên mẫu ngẫu nhiên (X1, , Xn) ta thu được
mẫu thực nghiệm (x1, , xn) Từ mẫu thực nghiệm này, ta tính được giá
trị của Z là z = h(x1, , xn; θ0)
Nếu z ∈ Wα thì ta bác bỏ giả thuyết H0
α thì ta chưa đủ cơ sở để bác bỏ H0
Trang 28Miền bác bỏ-Tiêu chuẩn kiểm định
Thực hiện quan trắc dựa trên mẫu ngẫu nhiên (X1, , Xn) ta thu đượcmẫu thực nghiệm (x1, , xn) Từ mẫu thực nghiệm này, ta tính được giátrị của Z là z = h(x1, , xn; θ0)
Nếu z ∈ Wα thì ta bác bỏ giả thuyết H0
α thì ta chưa đủ cơ sở để bác bỏ H0
Trang 29Bài toán kiểm định giả thuyết thống kê Sai lầm loại I và loại II
Sai lầm loại I và loại II
Trong bài toán kiểm định giả thuyết thống kê, ta có thể mắc phải các
sai lầm sau
a Sai lầm loại I: là sai lầm mắc phải khi ta bác bỏ H0 trong khi thực tếgiả thuyết H0 đúng Xác suất mắc sai lầm loại I được gọi là mức ýnghĩa của kiểm định α
α = P(Wα|H0)
b Sai lầm loại II: là sai lầm mắc phải khi ta chấp nhận giả thuyết H0trong khi thực tế H0 sai Xác suất mắc sai lầm loại II được kí hiệu β
β = P(Wαc|H1)
Trang 30Bài toán kiểm định giả thuyết thống kê Sai lầm loại I và loại II
Sai lầm loại I và loại II
Trong bài toán kiểm định giả thuyết thống kê, ta có thể mắc phải các
sai lầm sau
a Sai lầm loại I: là sai lầm mắc phải khi ta bác bỏ H0 trong khi thực tế
giả thuyết H0 đúng Xác suất mắc sai lầm loại I được gọi là mức ý
nghĩa của kiểm định α
α = P(Wα|H0)
b Sai lầm loại II: là sai lầm mắc phải khi ta chấp nhận giả thuyết H0trong khi thực tế H0 sai Xác suất mắc sai lầm loại II được kí hiệu β
β = P(Wαc|H1)
Trang 31Sai lầm loại I và loại II
Trong bài toán kiểm định giả thuyết thống kê, ta có thể mắc phải cácsai lầm sau
a Sai lầm loại I: là sai lầm mắc phải khi ta bác bỏ H0 trong khi thực tếgiả thuyết H0 đúng Xác suất mắc sai lầm loại I được gọi là mức ýnghĩa của kiểm định α
α = P(Wα|H0)
b Sai lầm loại II: là sai lầm mắc phải khi ta chấp nhận giả thuyết H0trong khi thực tế H0 sai Xác suất mắc sai lầm loại II được kí hiệu β
β = P(Wαc|H1)
Trang 32Sai lầm loại I và loại II
Hình: Sai lầm loại I và sai lầm loại II
Trang 33Bài toán kiểm định giả thuyết thống kê p- giá trị
p− giá trị
Định nghĩa 4
Tương ứng với một giá trị thống kê kiểm định tính trên một mẫu các giá
trị quan trắc xác định, p− giá trị là mức ý nghĩa nhỏ nhất dùng để bác bỏ
giả thuyết H0
Dựa vào đối thuyết H1, các bước tính p− giá trị như sau:
dựa trên mẫu (x1, , xn), giả sử bằng a
2 p− giá trị cho bởi
p =
P [|TS | > |a||H0] , kiểm định hai phía
P [TS < a|H0] , kiểm định một phía - bên trái
P [TS > a|H0] , kiểm định một phía - bên phải
Trang 34Bài toán kiểm định giả thuyết thống kê p- giá trị
p− giá trị
Định nghĩa 4
Tương ứng với một giá trị thống kê kiểm định tính trên một mẫu các giá
trị quan trắc xác định, p− giá trị là mức ý nghĩa nhỏ nhất dùng để bác bỏ
giả thuyết H0
Dựa vào đối thuyết H1, các bước tính p− giá trị như sau:
dựa trên mẫu (x1, , xn), giả sử bằng a
p− giá trị cho bởi
p =
P [|TS | > |a||H0] , kiểm định hai phía
P [TS < a|H0] , kiểm định một phía - bên trái
P [TS > a|H0] , kiểm định một phía - bên phải
Trang 35p− giá trị
Định nghĩa 4
Tương ứng với một giá trị thống kê kiểm định tính trên một mẫu các giátrị quan trắc xác định, p− giá trị là mức ý nghĩa nhỏ nhất dùng để bác bỏgiả thuyết H0
Dựa vào đối thuyết H1, các bước tính p− giá trị như sau:
dựa trên mẫu (x1, , xn), giả sử bằng a
2 p− giá trị cho bởi
p =
P [|TS | > |a||H0] , kiểm định hai phía
P [TS < a|H0] , kiểm định một phía - bên trái
Trang 36Kiểm định giả thuyết cho trường hợp một mẫu
Kiểm định giả thuyết cho trường hợp một mẫu
♣ Trường hợp biết phương sai,
♣ Trường hợp không biết phương sai, mẫu nhỏ,
♣ Trường hợp không biết phương sai, mẫu lớn.
Kiểm định giả thuyết cho tỷ lệ
Trang 37Kiểm định giả thuyết cho trường hợp một mẫu
Kiểm định giả thuyết cho trường hợp một mẫu
♣ Trường hợp biết phương sai,
♣ Trường hợp không biết phương sai, mẫu nhỏ,
♣ Trường hợp không biết phương sai, mẫu lớn.
Kiểm định giả thuyết cho tỷ lệ
Trang 38Kiểm định giả thuyết cho trường hợp một mẫu
Kiểm định giả thuyết cho trường hợp một mẫu
♣ Trường hợp biết phương sai,
♣ Trường hợp không biết phương sai, mẫu nhỏ,
♣ Trường hợp không biết phương sai, mẫu lớn.
Kiểm định giả thuyết cho tỷ lệ
Trang 39Kiểm định giả thuyết cho trường hợp một mẫu
Kiểm định giả thuyết cho trường hợp một mẫu
♣ Trường hợp biết phương sai,
♣ Trường hợp không biết phương sai, mẫu nhỏ,
♣ Trường hợp không biết phương sai, mẫu lớn.
Kiểm định giả thuyết cho tỷ lệ
Trang 40Kiểm định giả thuyết cho trường hợp một mẫu
♣ Trường hợp biết phương sai,
♣ Trường hợp không biết phương sai, mẫu nhỏ,
♣ Trường hợp không biết phương sai, mẫu lớn.
Kiểm định giả thuyết cho tỷ lệ
Trang 41Kiểm định giả thuyết cho trường hợp một mẫu Kiểm định giả thuyết cho kỳ vọng
Kiểm định giả thuyết cho kỳ vọng.
TH biết σ2
• Các giả định:
Mẫu ngẫu nhiên X 1 , , X n được chọn từ tổng thể có phân phối chuẩn N(µ, σ 2 ) với kỳ vọng µ chưa biết.
Phương sai σ 2 đã biết.
Cho trước giá trị µ 0 , cần so sánh kỳ vọng µ với µ 0
Trang 42Kiểm định giả thuyết cho trường hợp một mẫu Kiểm định giả thuyết cho kỳ vọng
Kiểm định giả thuyết cho kỳ vọng.
TH biết σ2
• Các giả định:
Mẫu ngẫu nhiên X 1 , , X n được chọn từ tổng thể có phân phối chuẩn
N(µ, σ 2 ) với kỳ vọng µ chưa biết.
Phương sai σ đã biết.
Cho trước giá trị µ 0 , cần so sánh kỳ vọng µ với µ 0
Trang 43Kiểm định giả thuyết cho trường hợp một mẫu Kiểm định giả thuyết cho kỳ vọng
Kiểm định giả thuyết cho kỳ vọng.
TH biết σ2
• Các giả định:
Mẫu ngẫu nhiên X 1 , , X n được chọn từ tổng thể có phân phối chuẩn
N(µ, σ 2 ) với kỳ vọng µ chưa biết.
Phương sai σ2 đã biết.
Cho trước giá trị µ 0 , cần so sánh kỳ vọng µ với µ 0
Trang 44Kiểm định giả thuyết cho trường hợp một mẫu Kiểm định giả thuyết cho kỳ vọng
Kiểm định giả thuyết cho kỳ vọng.
TH biết σ2
• Các giả định:
Mẫu ngẫu nhiên X 1 , , X n được chọn từ tổng thể có phân phối chuẩn
N(µ, σ 2 ) với kỳ vọng µ chưa biết.
Phương sai σ2 đã biết.
Cho trước giá trị µ 0 , cần so sánh kỳ vọng µ với µ 0
Trang 45Kiểm định giả thuyết cho kỳ vọng.
TH biết σ2
• Các giả định:
Mẫu ngẫu nhiên X 1 , , X n được chọn từ tổng thể có phân phối chuẩn N(µ, σ 2 ) với kỳ vọng µ chưa biết.
Phương sai σ2 đã biết.
Cho trước giá trị µ 0 , cần so sánh kỳ vọng µ với µ 0
Trang 46Kiểm định giả thuyết cho trường hợp một mẫu Kiểm định giả thuyết cho kỳ vọng
Kiểm định giả thuyết cho kỳ vọng.
Các bước kiểm định TH biết σ2
1 Phát biểu giả thuyết không và đối thuyết,
Z0 =
¯
X − µ0σ/√n ∼ N (0, 1),
3 Giá trị thống kê kiểm định z0 = x −µ¯ 0
σ/√n,
5 Kết luận: Nếu z0∈ Wα, bác bỏ giả thuyết H0, ngược lại z0 ∈ W/ α,chưa đủ cơ sở bác bỏ giả thuyết H0