Khái niệm Giả thiết thống kê giả thiết là các phát biểu liên quan đến các số đặc trưng của ĐLNN, quy luật phân phối của ĐLNN, tính độc lập của các ĐLNN… Kiểm định là dựa vào một mẫu cụ t
Trang 1CHƯƠNG 8 Kiểm định giả thiết thống kê
(3LT + 3BT)
1 Khái niệm
Giả thiết thống kê (giả thiết) là các phát biểu liên quan đến các số đặc trưng của ĐLNN, quy luật phân phối của ĐLNN, tính độc lập của các ĐLNN…
Kiểm định là dựa vào một mẫu cụ thể, thực hiện một số thủ tục để đưa ra quyết định chấp nhận hoặc bác bỏ giả thiết thống kê
Trang 2Vì quyết định đưa ra chỉ dựa trên một mẫu cụ
sai Xác suất mắc sai lầm loại I gọi là mức ý nghĩa, ký hiệu α
Để tiến hành thủ tục kiểm định, trước tiên người ta xây dựng tiêu chuẩn kiểm định như sau:
suất của ĐLNN G được xác định
Trang 3Với mức ý nghĩa α, chọn miền bác bỏ Ho là Wαsao cho:
2 Kiểm định số đặc trưng tổng thể
2.1 Kiểm định trung bình tổng thể
Cho trước một mẫu cụ thể kích thước n, xét phát
Trang 4mức ý nghĩa α Để xem phát biểu trên có chấp nhận được hay không, ta cần kiểm định giả thiết:
thể có phân phối Chuẩn"
Khi một trong các trường hợp trên xảy ra thì với
/ n
− µ
Chuẩn Chính Tắc hay được xấp xỉ với phân phối
bởi S
Trang 5Phân tích vấn đề theo cách I
σ
o
X
chắn xảy ra trong thực tế, tức là với mẫu cụ thể kích
σ
o
x
σ
o
x
Trang 6đây là điều vô lý, chứng tỏ giả định µ = µo sai Vậy nếu dấu hiệu này xảy ra ta quyết định bác bỏ giả
α Vậy lập luận để dẫn đến điều vô lý nêu trên có thể bị sai với xác suất α, tức là quyết định bác bỏ giả
Trang 7Phân tích vấn đề theo cách II
Kết quả của việc ước lượng µ với độ tin cậy 1–α
xảy ra trong thực tế, tức là với mẫu cụ thể kích thước
Ta có:
Trang 8lập luận để dẫn đến điều vô lý nêu trên có thể bị sai
có thể gặp sai lầm với xác suất α
Các phân tích trên gợi ý cho ta chọn:
σ
o
X/ n(Nếu chưa biết σ thì thay bởi S)
Trang 9TH4 n ≤≤≤≤ 30, chưa biết phương sai tổng thể
do Tất cả lập luận bên trên đều áp dụng được, miễn
S / n
Tóm tắt – Kiểm định hai phía trung bình tổng thể (H1: µµµµ ≠≠≠≠ µµµµo)
Tính giá trị kiểm định (KĐ) và tra giá trị tới hạn
Trang 10(TH) Nếu giá trị kiểm định có trị tuyệt đối lớn hơn
σ
o
x/ n (Nếu chưa biết σ thì thay bởi s) Giá trị tới hạn được tra theo hai trường hợp:
phân phối Chuẩn"
phối Chuẩn
Trang 11Ví dụ
(1) Trọng lượng ghi trên bao bì của một loại sản phẩm 6Kg Lấy ngẫu nhiên 121 sản phẩm và cân thử thì tính được trọng lượng trung bình là 5,975Kg và phương sai là 5,7596 Với mức ý nghĩa 5% thì trọng lượng ghi trên bao bì có chấp nhận được không?
Ta cần kiểm định giả thiết:
nhận được"
chấp nhận được"
Ta có:
Trang 12Giá trị kiểm định: KĐ = x − µo
=NORMSINV(1–0,025)
Trọng lượng ghi trên bao bì chấp nhận được (với mức
Trang 13Ta cần kiểm định giả thiết:
Trang 14Các chi tiết sản xuất không đúng chuẩn (với độ tin cậy 95%)
Từ dữ liệu của một mẫu cụ thể, với mức ý nghĩa
α cho trước, ta cần kiểm định:
thể có phân phối Chuẩn"
Khi một trong các trường hợp trên xảy ra thì với
/ n
− µ
Chuẩn Chính Tắc hay được xấp xỉ với phân phối
Trang 15Chuẩn Chính Tắc Trường hợp chưa biết σ thì thay bởi S
xảy ra với xác suất 1–α Vì vậy nếu với một mẫu cụ
σ
o
x
Trang 17Phân tích tương tự trên với phân phối Student,
ta chọn:
S / n
Tóm tắt – Kiểm định phải trung bình tổng thể (H1: µµµµ > µµµµo)
Cho trước một mẫu cụ thể và mức ý nghĩa α Ta tính giá trị kiểm định (KĐ) và tra giá trị tới hạn (TH) Nếu giá trị kiểm định lớn hơn giá trị tới hạn
Trang 18(Nếu chưa biết σ thì thay bởi s) Giá trị tới hạn được tra theo hai trường hợp:
phân phối Chuẩn"
Trang 19con gà xuất chuồng thì tính được trọng lượng trung bình là 1,87Kg và phương sai là 0,25 Hãy cho nhận xét về phương pháp chăn nuôi mới với mức ý nghĩa 5%
Do gà tăng trọng nên ta kiểm định giả thiết:
làm gà tăng trọng"
Trang 20Giá trị tới hạn: α = 5% ⇒ TH = t(n–1)α = t(24)0,05 =1,711
=TINV(0,05*2; 24)
Phương pháp chăn nuôi mới không làm gà tăng trọng (với mức ý nghĩa 5%)
Từ dữ liệu của một mẫu cụ thể, với mức ý nghĩa
α cho trước, ta cần kiểm định:
Trang 21Phân tích tương tự trên, ta đi đến kết luận:
thể có phân phối Chuẩn"
σ
o
X/ n(Nếu chưa biết σ thì thay bởi S)
S / n
Trang 22Tóm tắt – Kiểm định trái trung bình tổng thể (H1: µµµµ < µµµµo)
Cho trước một mẫu cụ thể và mức ý nghĩa α Ta tính giá trị kiểm định (KĐ) và tra giá trị tới hạn (TH) Nếu giá trị kiểm định nhỏ hơn giá trị tới hạn
phân phối Chuẩn"
Trang 23n ≤≤≤≤ 30, chưa biết σ2 và tổng thể có phân phối Chuẩn
Ví dụ
Mức tiêu hao nguyên liệu để sản xuất một sản phẩm là ĐLNN có phân phối chuẩn Mức tiêu hao trung bình là 1,2Kg với độ lệch chuẩn 3,1Kg Sau một thời gian sản xuất, người ta kiểm tra mức sử dụng nguyên liệu của 25 sản phẩm thì thu được bảng sau:
Mức NL (Kg) 0,9 1,0 1,1 1,2 1,3
Với mức ý nghĩa 5%, hãy cho nhận xét về mức tiêu hao nguyên liệu trung bình
Trang 24Do lượng tiêu hao nguyên liệu trung bình giảm nên
ta kiểm định giả thiết:
không thay đổi"
Trang 25Mức tiêu hao nguyên liệu trung bình không thay đổi (với mức ý nghĩa 5%)
2.2 Kiểm định tỷ lệ tổng thể
Từ dữ liệu của một mẫu cụ thể, với mức ý nghĩa
α cho trước, ta cần kiểm định:
Trang 26Chính Tắc Vì vậy, với mẫu cụ thể kích thước n, nếu
Tóm tắt – Kiểm định hai phía tỷ lệ tổng thể
(H1: p≠≠≠≠ po)
Tính giá trị kiểm định (KĐ) và tra giá trị tới hạn
Trang 27(TH) Nếu giá trị kiểm định có trị tuyết đối lớn hơn
Ta cần kiểm định giả thiết:
Trang 28H1: p ≠ po "Tỷ lệ sinh viên trên 35 tuổi không phải là 2%"
Tỷ lệ sinh viên trên 35 tuổi không phải là 2% (với độ tin cậy 95%)
Trang 292.2.2 Kiểm định phải (H1 : p > po)
Từ dữ liệu của một mẫu cụ thể, với mức ý nghĩa
α cho trước, ta cần kiểm định:
Lập luận tương tự trên, ta chọn:
Tóm tắt – Kiểm định phải tỷ lệ tổng thể
Tính giá trị kiểm định (KĐ) và tra giá trị tới hạn
Trang 30(TH) Nếu giá trị kiểm định lớn hơn giá trị tới hạn
Ta cần kiểm định giả thiết:
Trang 31Ho: p=po "Tỷ lệ sản phẩm có chất lượng cao
không đổi"
tăng sau khi cải tiến sản xuất"
Tỷ lệ sản phẩm có chất lượng cao có tăng sau khi cải tiến sản xuất (với mức ý nghĩa 5%)
Trang 322.2.3 Kiểm định trái (H1 : p < po)
Từ dữ liệu của một mẫu cụ thể, với mức ý nghĩa
α cho trước, ta cần kiểm định:
Lập luận tương tự trên, ta chọn:
Tóm tắt – Kiểm định trái tỷ lệ tổng thể
Tính giá trị kiểm định (KĐ) và tra giá trị tới hạn
Trang 33(TH) Nếu giá trị kiểm định nhỏ hơn giá trị tới hạn
24 người vẫn còn hút thuốt Với mức ý nghĩa 5%, hãy cho biết:
a) Việc vận động tuyên truyền có làm giảm tỷ lệ người hút thuốt không?
Trang 34b) Nếu tuyên bố tỷ lệ người hút thuốt trong khu dân cư này chỉ còn 2% thì có chấp nhận được không? a) Ta cần kiểm định giả thiết:
Trang 35Tỷ lệ người hút thuốt có giảm sau khi vận động tuyên truyền (với mức ý nghĩa 5%)
b) Ta cần kiểm định giả thiết:
Trang 36Tỷ lệ người hút thuốt không phải chỉ còn 2% (với mức ý nghĩa 5%)
2.3 Kiểm định phương sai tổng thể
Ta chỉ xét trường hợp tổng thể là ĐLNN có phân phối Chuẩn
Từ dữ liệu của một mẫu cụ thể, với mức ý nghĩa
α cho trước, ta cần kiểm định:
Ho: σ2 = σo2 với H1: σ2 ≠ σo2
Trang 37ĐLNN −
σ
2 2
(n 1)S
có phân phối Chi Bình n–1 bậc
o
σcó phân phối Chi Bình n–1 bậc tự do Ta có:
P(χ21–α/2< 2
2 o
2 α/2)=1–α
Vậy nếu với một mẫu cụ thể kích thước n, ta thấy
(n 1)s
< χ2 1–α/2 thì giả thiết Ho
bị bác bỏ
Theo phân tích trên, ta chọn:
Trang 38Tiêu chuẩn kiểm định: G = −
σ
2 2 o
(n 1)S
Tóm tắt – Kiểm định hai phía phương sai tổng thể (H1 : σσ σ σ 2≠≠≠≠ σσ σ σo2)
Tính giá trị kiểm định và tra giá trị tới hạn nhỏ
định lớn hơn giá trị tới hạn lớn hoặc nhỏ hơn giá trị
Trang 39Ví dụ
Đường kính của một trục máy chọn ngẫu nhiên là một ĐLNN có phân phối Chuẩn Độ lệch chuẩn của máy tiện sản xuất trục máy theo thiết kế là 5mm Người ta nghi ngờ máy tiện bị hư nên đo thử đường kính của 20 sản phẩm thì tính được phương sai mẫu là 27,5 Với mức ý nghĩa 2% hãy cho biết máy tiện có hoạt động bình thường không?
Ta cần kiểm định giả thiết:
H1: σ2≠σo2 "Máy tiện bị hư"
Trang 40Máy tiện hoạt động bình thường (với mức ý nghĩa 2%)
Trang 412.3.2 Kiểm định phải (H1 : σ σσ σ 2>σ σσ σo2)
Từ dữ liệu của một mẫu cụ thể, với mức ý nghĩa
α cho trước, ta cần kiểm định:
Ho: σ2 = σo2 với H1: σ2 > σo2 Phân tích tương tự trên, ta chọn:
σ
2 2 o
(n 1)S
Tóm tắt – Kiểm định phải phương sai tổng thể (H1 : σ σσ σ 2>σ σσ σo2)
Tính giá trị kiểm định (KĐ) và tra giá trị tới hạn
Trang 42(TH) Nếu giá trị kiểm định lớn hơn giá trị tới hạn
Công thức tính giá trị kiểm định:
2 2 o
Trang 43Hãy cho kết luận về mức chênh lệch chiều cao hiện nay với độ tin cậy 95%
Vì độ lệch chuẩn tăng nên ta kiểm định giả thiết:
đổi so với 5 năm trước"
so với 5 năm trước"
2 o
Trang 44Điều kiện bác bỏ Ho là KĐ > TH thoả, quyết định
Mức chênh lệch về chiều cao tăng so với 5 năm trước (với độ tin cậy 95%)
Từ dữ liệu của một mẫu cụ thể, với mức ý nghĩa
α cho trước, ta cần kiểm định:
Ho: σ2 = σo2 với H1: σ2 < σo2 Phân tích tương tự trên, ta chọn:
σ
2 2 o
(n 1)S
Trang 45Tóm tắt – Kiểm định trái phương sai tổng thể (H1 : σ σσ σ 2 < σσ σ σo2)
Tính giá trị kiểm định (KĐ) và tra giá trị tới hạn (TH) Nếu giá trị kiểm định nhỏ hơn giá trị tới hạn
Trang 46súc được 2 tháng tuổi, người ta cân và tính được độ lệch chuẩn là 6,253Kg Khi được 3 tháng tuổi, cân 50 con gia súc chọn ngẫu nhiên thì tính được độ lệch chuẩn là 5,975Kg Với mức ý nghĩa 4%, hãy cho kết luận về mức chênh lệch trọng lượng của bầy gia súc sau khi nuôi 3 tháng
Vì độ lệch chuẩn giảm nên ta kiểm định giả thiết:
gia súc 3 tháng tuổi không đổi so với lúc 2 tháng tuổi"
gia súc 3 tháng tuổi giảm so với lúc 2 tháng tuổi"
Trang 47Mức chênh lệch trọng lượng bầy gia súc 3 tháng tuổi
4%)
Trang 483 Kiểm định phi số
3.1 Kiểm định quy luật phân phối xác suất
3.1.1 Phương pháp ước lượng hợp lý tối đa
Xét ĐLNN X đã biết quy luật phân phối tổng quát nhưng chưa biết một hay một số tham số Một
chứa các giá trị hợp lệ của θ ký hiệu là Θ
Xét trường hợp X là ĐLNN rời rạc
là:
Trang 49L(θ) =P(x1,θ).P(x2,θ) P(xn, θ)
lượng hợp lý tối đa của θ
là hàm ước lượng hợp lý tối đa của θ
θ cũng là điểm mà hàm L đạt cực đại trên miền
Θ Do L là tích nên để đơn giản hoá việc tìm cực đại, người ta thường xét hàm lnL
Trường hợp X là ĐLNN liên tục, giá trị hàm
Theo ý nghĩa của hàm mật độ, hàm L sẽ là:
Trang 50Ví dụ
(1) Cho biết X~(λ)
a) Tìm hàm ước lượng hợp lý tối đa của λ
b) Cho mẫu cụ thể của X:
Trang 51ln L
∂
n i
i 1
xn
i 1
xn
i 1
Xn
=
∑
b) Với mẫu cụ thể dạng điểm có tần số ta tính được
tối đa của λ theo công thức trên là 10/12 = 0,83
Trang 52(2) Cho biết X~(µ, σ2) Tìm hàm ước lượng hợp lý
Trang 53Bằng cách tính tiếp các đạo hàm riêng ta thấy
3.1.2 Kiểm định phân phối của ĐLNN
Ta kiểm định giả thiết ĐLNN X có quy luật phân phối xác suất Q gồm r tham số chưa biết với mức ý nghĩa α Các giả thiết:
Trang 54Ho: X có phân phối xác suất theo quy luật Q
Q
Xét mẫu ngẫu nhiên kích thước n Chia miền giá trị
với một mẫu cụ thể
Các tham số của quy luật phân phối Q được ước
với phân phối Chi Bình k–r–1 bậc tự do Ta có:
Trang 55Theo phân tích trên, ta chọn:
Vậy thủ tục kiểm định ĐLNN X có phân phối xác suất theo quy luật Q với r tham số chưa biết như sau:
Trang 56Cho trước một mẫu cụ thể kích thước n dạng
có quy luật phân phối Q với r tham số chưa biết Từ mẫu cụ thể, ước lượng hợp lý tối đa để tính giá trị của r tham số này Cũng từ mẫu cụ thể, chọn các tập
Tính giá trị kiểm định (KĐ) và tra giá trị tới hạn (TH) Nếu giá trị kiểm định lớn hơn giá trị tới hạn
Trang 57Gọi X là điểm của sinh viên gặp ngẫu nhiên Ta cần kiểm định giả thiết:
Trang 58Miền giá trị của X là tập hợp {F, D, C, B, A} Dựa theo mẫu cụ thể, chia miền giá trị của X thành 5 tập
bảng phân phối dự đoán Lập bảng tính giá trị tới hạn:
Trang 59k = 5 r = 0 α = 5%
=CHIINV(0,05;4)
Dự đoán đúng (mức ý nghĩa 5%)
(2) Gọi X là lượng khách vào quán trong khoảng thời gian 30 phút Quan sát 100 lần thì được bảng số liệu sau:
Trang 60Ho : X có phân phối (λ)
Tham số λ theo giá trị ước lượng hợp lý tối đa:
i
n xn
∑
Miền giá trị của X là tập hợp số nguyên không âm Dựa theo mẫu cụ thể, chia miền giá trị của X thành
theo công thức của phân phối (3) Lập bảng tính giá trị tới hạn:
Trang 62Điều kiện bác bỏ Ho là KĐ > TH thoả Quyết định
ĐLNN X có phân phối không theo quy luật Poisson (mức ý nghĩa 5%)
(3) Gọi X là chiều cao (m) một loại cây Lấy mẫu một số cây và đo chiều cao thì được bảng số liệu sau:
Với mức ý nghĩa 5%, hãy cho biết chiều cao loại
Ta cần kiểm định giả thiết:
Trang 63Giả định Ho đúng, tức là xem X có phân phối (µ,
i
n xn
∑
2 2
Miền giá trị của X là tập số thực Dựa theo mẫu cụ
phối (16,35; 5) Lập bảng tính giá trị kiểm định:
Trang 65Điều kiện bác bỏ Ho là KĐ > TH không thoả Quyết
ĐLNN X có phân phối Chuẩn (mức ý nghĩa 5%)
3.2 Kiểm định tính độc lập của hai dấu hiệu
Xét hai thuộc tính của mỗi phần tổng thể mà ta gọi là hai dấu hiệu A và B Giả sử dấu hiệu A có h
Ai (Bj)
Hai dấu hiệu A và B gọi là độc lập nếu mọi cặp
Trang 66Ta cần kiểm định giả thiết:
Khi n đủ lớn, theo định nghĩa Thống Kê của Xác
Trang 67Giả định Ho đúng, khi n đủ lớn thì ĐLNN sau có phân phối xấp xỉ phân phối Chi Bình (h–1)(k–1) bậc tự do:
Trang 68Vậy nếu với một mẫu cụ thể kích thước n, ta thấy
Theo phân tích trên, ta chọn:
Tiêu chuẩn kiểm định: G =
Vậy thủ tục kiểm định dấu hiệu A và B độc lập như sau:
Cho trước một mẫu cụ thể kích thước n dạng
liệu mẫu ta lập bảng ghi tần số xuất hiện biến cố
Trang 69tra giá trị tới hạn TH Nếu giá trị kiểm định lớn hơn
Công thức tính giá trị kiểm định:
Trang 70Thời gian sử dụng đtdd
Ta cần kiểm định giả thiết:
sử dụng điện thoại di động
dụng điện thoại di động
Lập bảng để tính giá trị kiểm định:
Trang 71Khuyến mại không ảnh hưởng đến thời gian sử dụng điện thoại di động (với mức ý nghĩa 5%)
Trang 72(2) Để biết giới tính của sinh viên có ảnh hưởng hay không đến loại hình giải trí, người ta thăm dò
50 sinh viên và thu được số liệu sau:
Loại hình giải trí Giới tính
Xem bóng đá Xem phim Nghe nhạc
"Giới tính của sinh viên có ảnh hưởng đến loại hình giải trí" có đúng không với mức ý nghĩa 5%?
Ta cần kiểm định giả thiết:
đến loại hình giải trí
loại hình giải trí
Trang 73Lập bảng để tính giá trị kiểm định:
Nhận xét giới tính của sinh viên có ảnh hưởng đến loại hình giải trí là đúng (với mức ý nghĩa 5%)