Nội dungTập hợp - Giải tích tổ hợp Biến cố và xác suất Biến ngẫu nhiên và quy luật phân phối xác suất Một số biến ngẫu nhiên thông dụng Lý thuyết mẫu Ước lượng tham số thống kê Kiểm định
Trang 1Bài Giảng Môn học Xác Suất và Thống Kê
Nguyễn Văn Thìn
Khoa Toán - Tin Học Đại Học Khoa Học Khoa Học Tự Nhiên Tp.HCM
Ngày 4 tháng 9 năm 2011
Trang 2Nội dung
Tập hợp - Giải tích tổ hợp
Biến cố và xác suất
Biến ngẫu nhiên và quy luật phân phối xác suất
Một số biến ngẫu nhiên thông dụng
Lý thuyết mẫu
Ước lượng tham số thống kê
Kiểm định giả thiết thống kê
Kiểm định giả thiết về trung bình của tổng thể
Kiểm định giả thiết về tỷ lệ của tổng thể
Trang 3Bài toán kiểm định giả thiết thống kê.
Định nghĩa (Giả thiết thống kê, kiểm định giả thiết thống kê)
Giả thiết thống kêlà những giả thiết nói về các tham số, dạng quy
luật phân phối, hoặc tính độc lập của các đại lượng ngẫu nhiên
Việc tìm ra kết luận bác bỏ hay chấp nhận một giả thiết gọi là
kiểm định giả thiết thống kê
Ví dụ
Trong một báo cáo nói rằng: thu nhập bình quân của những người
làm trong ngành thư viện ở Việt Nam là 7 triệu đồng một tháng
thì ta có thể coi đó là một giả thiết thống kê, giả thiết này nói về
một tham số (kỳ vọng) của biến ngẫu nhiên X biểu thị mức lương
của những người làm trong ngành thư viện Dựa vào số liệu của
một mẫu điều tra về thu nhập và quy tắc kiểm định để đưa một
kết luận là bác bỏ hay chấp nhận giả thiết nói trên
Trang 4Cách đặt giả thiết.
1 Giả thiết được đặt ra với ý đồ bác bỏ nó, nghĩa là giả thiết đặt
ra ngược lại với điều ta muốn chứng minh,muốn thuyết phục
2 Giả thiết được đặt ra sao cho khi chấp nhận hay bác bỏ nó sẽ
có tác dụng trả lời mà bài toán thực tế đặt ra
3 Giả thiết được đặt ra nếu nó đúng thì ta sẽ xác định được qui
luật phân phối xác suất của đại lượng ngẫu nhiên được chọn
làm tiêu chuẩn kiểm định
4 Khi đặt giả thiết ta thường so sánh cái chưa biết với cái đã
biết Cái chưa biết là điều mà ta cần kiểm định, kiểm tra, làm
rõ "Cái đã biết" mà ta nói ở đây thường là những thông tin
quá khứ, các định mức kinh tế, kỹ thuật
5 Giả thiết đặt ra thường mang ý nghĩa: "không khác nhau",
hoặc "khác mà không có ý nghĩa" hoặc "bằng nhau"
Trang 5Giả thiết không và đối thiết
Giả thiết cần kiểm định được gọi làGiả thiết không ký hiệuH0
Một mệnh đề đối lập với H0 được gọi là Giả thiết đối (Đối thiết)
và được ký hiệu làH1
Ví dụ
H0: θ = θ0; H1: θ 6= θ0
Nếu ta kiểm định giả thiết với đối thiết dạng như trên thì kiểm
định được gọi là kiểm địnhgiả thiết hai phía Nếu kiểm định giả
thiết với đối thiết có dạng H1 : θ > θ0 hoặc H1 : θ < θ0 thì kiểm
định được gọi là kiểm địnhgiả thiết một phía
Trang 6Tiêu chuẩn kiểm định.
Xuất phát từ yêu cầu của bài toán thực tế , ta nêu ra giả thiết H0
và đối thiết của nó
Giả sử rằng H0 đúng, từ đó tìm một biến cố có xác suất đủ bé để
có thể tin rằng biến cố đó hầu như không thể xảy ra trong một
phép thử Muốn vậy từ mẫu ngẫu nhiên (X1, X2, , Xn) ta chọn
Z = f (X1, , Xn, θ0) sao cho:
Nếu H0 đúng thì ta sẽ xác định được quy luật phân phối xác suất
của Z và với mẫu cụ thể ta có thể tính được giá trị của Z Đại
lượng ngẫu nhiên Z được gọi làTiêu chuẩn kiểm định giả thiết H0
Trang 7Miền bác bỏ, mức ý nghĩa.
Do quy luật phân phối xác suất của Z đã biết nên với α bé tùy ý
ta có thể tìm được miền Wα sao cho P(Z ∈ Wα) = α Miền Wα
được gọi làmiền bác bỏgiả thiết H0 và α được gọi làmức ý nghĩa
của kiểm định
Thực hiện một phép thử đối với mẫu ngẫu nhiên (X1, , Xn) ta
thu được mẫu cụ thể (x1, , xn) Từ mẫu cụ thể này ta tính được
giá trị của Z (ký hiệu là z) và gọi là giá trị thực nghiệm
z = f (x1, , xn, θ0)
• Nếu z ∈ Wα thì ta bác bỏ giả thiết H0, thừa nhận H1
• Nếu z /∈ Wα thì ta chấp nhận H0
Trang 8Sai lầm loại 1 và sai lầm loại 2.
Khi kiểm định giả thiết thống kê, chúng ta có thể mắc phải một
trong hai loại sai lầm sau đây:
a Sai lầm loại 1: Là sai lầm mắc phải khi ta bác bỏ giả thiết H0
trong khi thực tế thì giả thiết H0 đúng
b Sai lầm loại 2: Là sai lầm mắc phải khi ta chấp nhận giả thiết
H0 trong khi thực tế thì giả thiết H0 sai
Trang 9Quy trình kiểm định.
Quá trình kiểm định giả thiết thống kê được tiến hành theo các
bước sau đây
1 Phát biểu giả thiết không H0 và đối thiết H1 Quyết định dữ
liệu nào cần được thu thập và thu thập dưới các điều kiện
nào Chọn lựa một kiểm định thống kê (cùng với mô hình
thống kê liên kết với nó) để kiểm định H0
2 Từ một số kiểm định có thể được dùng cho mô hình nghiên
cứu, chọn ra kiểm định thích hợp nhất dựa trên cơ sở là các
điều kiện của nghiên cứu và các giả định cơ sở của kiểm định
3 Chọn mức ý nghĩa α và kích thước mẫu n
4 Tìm phân phối mẫu của kiểm định thống kê dưới điều kiện H0
đúng
Trang 105 Trên cơ sở (2), (3) và (4) đã trình bày ở trên, xác định miền
bác bỏ của kiểm định thống kê tương ứng
6 Thu thập dữ liệu Sử dụng dữ liệu thu được từ mẫu, tính giá
trị của kiểm định Nếu giá trị của thống kê nằm trong miền
bác bỏ, ta bác giả thiết H0, nếu giá trị thu được nằm ngoài
miền bác bỏ, kết luận không thể bác bỏ giả thiết H0 ở mức ý
nghĩa đã chọn
Trang 11Quy trình kiểm định trong bài làm
1 Từ mẫu cụ thể đã cho tính giá trị của các thống kê tương ứng
với tiêu chuẩn kiểm định trong trường hợp tương ứng
2 Với mức ý nghĩa α cho trước, xác định miền bác bỏ
3 Kiểm tra giá trị của tiêu chuẩn kiểm định có nằm trong miền
bác bỏ hay không và kết luận
Trang 12Kiểm định giả thiết về trung bình của tổng thể.
Bài toán
Cho tổng thể với trung bình µ chưa biết với phương sai có thể đã
biết hoặc chưa biết Từ mẫu ngẫu nhiên (X1, X2, , Xn) hãy kiểm
định
H0: µ = m0, H1: µ 6= m0 (µ < m0, µ > m0)
với mức ý nghĩa α
Trang 13Kiểm định giả thiết về trung bình của tổng thể.
Trường hợp kích thước mẫu n ≥ 30 (hoặc n < 30 nhưng X có
phân phối chuẩn), σ2 đã biết
Chọn thống kê
Z = X − m¯ σ 0
√ n
=
√n( ¯X − m0)σ
làm tiêu chuẩn kiểm định Nếu giả thiết H0 đúng thì Z ∼ N(0, 1)
Từ đây ta suy ra miền bác bỏ tương ứng với từng loại đối thiết
Trang 14Kiểm định giả thiết về trung bình của tổng thể.
Ta có bảng tóm tắt các loại giả thiết và miền bác bỏ tương ứng
Trang 15Kiểm định giả thiết về trung bình của tổng thể.
Trường hợp kích thước mẫu n ≥ 30, σ2 chưa biết
Ta có thể dùng ước lượng của Var (X ) là S2 để thay thế cho σ2
Chọn thống kê
Z = X − m¯ S 0
√ n
=
√n( ¯X − m0)S
làm tiêu chuẩn kiểm định Nếu giả thiết H0 đúng thì Z ∼ N(0, 1)
Từ đây ta suy ra miền bác bỏ tương ứng với từng loại đối thiết
Trang 16Kiểm định giả thiết về trung bình của tổng thể.
Ta có bảng tóm tắt các loại giả thiết và miền bác bỏ tương ứng
Trang 17Kiểm định giả thiết về trung bình của tổng thể.
Trường hợp kích thước mẫu n < 30, σ2 chưa biết, X tuân theo
quy luật phân phối chuẩn
Chọn thống kê
T = X − m¯ S 0
√ n
=
√n( ¯X − m0)S
làm tiêu chuẩn kiểm định Nếu giả thiết H0 đúng thì
T ∼ T (n − 1) (Phân phối Student với n − 1 bậc tự do) Từ đây ta
suy ra miền bác bỏ tương ứng với từng loại đối thiết
Trang 18Kiểm định giả thiết về trung bình của tổng thể.
Ta có bảng tóm tắt các loại giả thiết và miền bác bỏ tương ứng
Trang 19Kiểm định giả thiết về tỷ lệ của tổng thể.
Bài toán
Cho tổng thể X , trong đó tỷ lệ cá thể mang đặc tính A nào đó là
trong tổng thể là p (p chưa biết) Từ mẫu ngẫu nhiên
(X1, X2, , Xn) hãy kiểm định
H0: p = p0, H1 : p 6= p0 (p < p0, p > p0)
với mức ý nghĩa α
Trang 20Kiểm định giả thiết về tỷ lệ của tổng thể.
Trường hợp kích thước mẫu n ≥ 30 (hoặc n < 30 nhưng X có
phân phối chuẩn, σ2 đã biết:
Quan sát sự xuất hiện của biến cố "Cá thể mang đặc tính A"
trong n phép thử độc lập Nếu có m lần xuất hiện biến cố trên thì
tần suất f =mn là một ước lượng điểm của xác suất P(A) = p
Gọi F là tần số xuất hiện A trong n phép thử thì F ∼ B(1, p)
Gọi (F1, , Fn) là một mẫu ngẫu nhiên của F , khi đó
¯
F = 1n
√
p0q0
làm tiêu chuẩn kiểm định Nếu giả thiết H0 đúng thì Z ∼ N(0, 1)
Từ đây ta suy ra miền bác bỏ tương ứng với từng loại đối thiết
Trang 21Kiểm định giả thiết về tỷ lệ của tổng thể.
Ta có bảng tóm tắt các loại giả thiết và miền bác bỏ tương ứng