Để thực hiện kiểm định giả thiết thống kê bằng Phương pháp p- giátrị, chúng ta cần có những kiến thức cơ bản về Xác suất- Thống kê như:mẫu số liệu và các đại lượng đặc trưng của mẫu số l
Trang 1ĐẠI HỌC ĐÀ NẴNGTRƯỜNG ĐẠI HỌC SƯ PHẠM
Trang 3LỜI CẢM ƠN
Trong suốt khoá học (2009- 2013) tại Trường Đại học Sư phạm - ĐHĐN,với sự nổ lực của bản thân và cùng sự giúp đỡ của các thầy cô giáo trongtrường, đặc biệt là các thầy cô giáo trong khoa Toán đã giúp em có mộtvốn tri thức vững vàng để hoàn thành luận văn tốt nghiệp Trong thời gianlàm luận văn, được sự giúp đỡ của giáo viên hướng dẫn ThS Lê Văn Dũng
về mọi mặt, từ nhiều phía em đã hoàn thành đúng thời gian qui định Emxin chân thành gửi lời cảm ơn đến :
- Các thầy cô giáo trong khoa Toán đã giảng dạy cho em những kiếnthức chuyên môn làm cơ sở để thực hiện tốt luận văn tốt nghiệp và tạođiều kiện cho em hoàn thành tốt khoá học
- Đặc biệt, em xin gửi lời cảm ơn chân thành đến ThS Lê Văn Dũng làngười luôn theo sát chỉ bảo hướng đi và cho em những lời khuyên quí báucũng như cung cấp các thông tin và căn cứ khoa học để em định hướngtốt trong khi làm luận văn tốt nghiệp
- Nhân đây em cũng xin gởi lời cảm ơn đến gia đình, bạn bè đã giúp
đỡ động viên tôi cả về vật chất lẫn tinh thần trong suốt quá trình làmluận văn tốt nghiệp
Mặc dù luận văn đã được hoàn thành đúng thời gian qui định nhưng
do điều kiện thời gian và kiến thức còn hạn chế nên luận văn của em khôngtránh khỏi những thiếu sót Vì vậy, em rất mong nhận được sự đóng góp
ý kiến của các thầy cô và các bạn để tạo điều kiện cho luận văn của emđược hoàn thiện hơn
Đà Nẵng, tháng 05 năm 2013
Sinh viên thực hiệnPhan Thị Thanh Nhạn
Trang 4SVTH: Phan Thị Thanh Nhạn Trang 3
Trang 5LỜI MỞ ĐẦU
1 Lí do chọn đề tài
Ngày nay, Xác suất thống kê là môn học cơ sở được giảng dạy trongcác trường đại học, cao đẳng Không những thế nó còn được ứng dụngnhiều trong các ngành như kinh tế, kỹ thuật, sinh học, y học, Nó giúpchúng ta cách tổ chức chỉ đạo, sản xuất, phân phối lưu thông, góp phần
dự báo kinh tế, đánh giá chất lượng sản phẩm, năng suất lao động, thunhập và xử lý 1 khối lượng lớn số liệu thông tin,
Kiểm định giả thiết thống kê là một phần không thể thiếu trong phânmôn này Nó không chỉ giúp ta kiểm chứng được sự đúng sai của nhữnggiả thiết đặt ra mà còn giúp ta có quyết định đúng đắn trước một vấn đề.Trong đời sống, kiểm định là một công việc tất yếu trong kinh doanh, ykhoa, sản xuất, học tập Chính vì vậy, kiểm định không chỉ quan trọngtrong lý thuyết mà còn rất hữu dụng trong thực tế
Để thực hiện kiểm định giả thiết thống kê bằng Phương pháp p- giátrị, chúng ta cần có những kiến thức cơ bản về Xác suất- Thống kê như:mẫu số liệu và các đại lượng đặc trưng của mẫu số liệu, các quy luật phânphối xác suất, các ước lượng điểm, hàm ước lượng
Cùng với những phương pháp kiểm định truyền thống, phương phápp- giá trị kiểm định giả thiết thống kê là phương pháp khá đơn giản, dễthực hiện dựa trên con số xác suất để đưa ra kết luận
Với các lí do trên tôi quyết định chọn đề tài nghiên cứu cho luận văncủa tôi là : Phương pháp p- giá trị kiểm định giả thiết thống kê
2 Mục đích nghiên cứu
Phương pháp p- giá trị có thể dùng để kiểm định giả thiết được đưa
ra từ các đại lượng ngẫu nhiên rời rạc hay từ một mẫu số liệu Đây là 1
Trang 6phương pháp rất hữu hiệu và hạn chế được một số nhược điểm của thống
kê cổ điển Phương pháp này được đánh giá là một cuộc cách mạng quantrọng trong xác suất thống kê
3 Đối tượng nghiên cứu
Đề tài nghiên cứu về Phương pháp p- giá trị kiểm định giả thiết thống
kê
4 Phạm vi nghiên cứu
Nghiên cứu các tài liệu về xác suất, phương pháp kiểm định P- giá trị Phạm vi nghiên cứu tập trung chủ yếu vào phần Kiểm định giả thuyếtthống kê
5 Phương pháp nghiên cứu
Để thuận tiện cho việc nghiên cứu và soạn thảo luận văn này, tôi sửdụng phần mềm latex để thực hiện, vì Latex là một phần mềm tương đối
dễ sử dụng, rất linh hoạt trong việc tìm và sửa lỗi Và đặc biệt là phầnmềm miễn phí Bên cạnh đó tôi còn sử dụng phần mềm EXCEL để tínhtoán
Thu thập các bài báo khoa học, các tài liệu liên quan đến đề tài.Tham khảo các tài liệu trên mạng Internet
Địa chỉ : http://math.mercyhurst.edu/
6 Ý nghĩa khoa học
Luận văn được trình bày có hệ thống với các mục rõ ràng chặt chẽ
về Phương pháp P-giá trị để kiểm định giả thuyết thông kê Bên cạnh đó,luận văn còn đưa ra ví dụ áp dụng thực tế của việc kiểm định giả thuyếtcũng như phương pháp kiệm định Do đó, luận văn này góp phần tạo rađược một số tài liệu tham khảo cho sinh viên trong ngành toán
7 Cấu trúc luận văn
Bố cục bao gồm 2 chương :
• Chương 1 Kiến thức cơ sở
• Chương 2 Phương pháp P- giá trị kiểm định giả thuyết
Do thời gian thực hiện khóa luận không nhiều, kiến thức còn hạn chếnên khi làm khóa luận không tránh khỏi những hạn chế và sai sót Tôi
Trang 7Phương pháp p-giá trị kiểm định giả thiết Đà Nẵng, 05 - 2013
mong nhận được sự góp ý của quý thầy cô và các bạn Tôi xin chân thànhcảm ơn!
Trang 8Chương 1 KIẾN THỨC CƠ SỞ 9
1.1 Một số phân phối xác suất quan trọng 9
1.1.1 Phân phối nhị thức 9
1.1.2 Phân phối chuẩn 9
1.1.3 Phân phối Student 10
1.1.4 Phân phối khi bình phương 10
1.2 Mẫu số liệu 11
1.3 Các đại lượng đặc trưng của mẫu số liệu 11
1.4 Mẫu ngẫu nhiên 12
1.5 Ước lượng điểm 12
1.5.1 Ước lượng điểm và hàm ước lượng 12
Chương 2 PHƯƠNG PHÁP P-GIÁ TRỊ KIỂM ĐỊNH GIẢ THIẾT 14 2.1 Kiểm định giả thiết về kì vọng của phân phối chuẩn 14
2.1.1 Đã biết phương sai 14
2.1.2 Chưa biết phương sai 18
2.2 Kiểm định phương sai của phân phối chuẩn 21
2.3 Kiểm định tham số p của phân phối nhị thức B(n; p) 25
2.4 So sánh hai kì vọng của hai phân phối chuẩn 29
2.4.1 Đã biết phương sai σ12 và σ22 29
2.4.2 Chưa biết hai phương sai nhưng hai phương sai bằng nhau 32
2.4.3 Chưa biết hai phương sai và hai phương sai không bằng nhau 35
Trang 9Phương pháp p-giá trị kiểm định giả thiết Đà Nẵng, 05 - 2013
2.5 So sánh hai tỉ lệ 38
Trang 101.1 Một số phân phối xác suất quan trọng
Biến ngẫu nhiên rời rạc X được gọi là có phân phối nhị thức với tham
số n, p nếu miền giá trị của X là {0, 1, , n} và P (X = k) = Cnkpk(1 −p)n−k, k = 0, 1, , n
Khi đó E(X) = np và V ar(X) = np(1 − p)
Kí hiệu: X ∼ B(n, p)
Biến ngẫu nhiên liên tục X gọi là có phân phối chuẩn nếu có hàm mậtđộ:
2πe
−(x−µ)22σ2 , x ∈ R,
2π
Rx
−∞e−t2/2dt
Kí hiệu phân phối chuẩn tắc là Z = N (0; 1)
Giá trị tới hạn của phân phối chuẩn tắc
Cho α ∈ (0; 1) và Z ∼ N (0; 1) Ta gọi giá trị z(α) là giá trị tới hạnmức α của phân phối chuẩn tắc Z nếu P (Z > z(α)) = α
Trang 11Phương pháp p-giá trị kiểm định giả thiết Đà Nẵng, 05 - 2013
Xấp xỉ phân phối nhị thức bằng phân phối chuẩn
Định lý 1.1.1 (Định lý giới hạn tích phân Moivre-Laplace) Giả sử Xn làbiến ngẫu nhiên có phân phối nhị thức B(n; p) Đặt
Nói cách khác, với n đủ lớn ta có B(n; p) ≈ N (np; np(1 − p))
Biến ngẫu nhiên liên tục X được gọi là có phân phối Student n bậc tự
2n
− n+1 2
∀x ∈ R,
trong đó Γ(x) = R0∞ux−1e−udu gọi là hàm Gamma
Kí hiệu X ∼ Tn
Giá trị tới hạn của phân phối Student
Cho α ∈ (0; 1) Ta gọi giá trị tn(α) là giá trị tới hạn mức α của phânphối Student n bậc tự do nếu P (Tn > tn(α)) = α
Định lý 1.1.2 Cho {X1, X2, , Xn} là các biến ngẫu nhiên độc lập cùngphân phối với biến ngẫu nhiên X có phân phối chuẩn N (µ, σ2) Khi đóbiến ngẫu nhiên
X − µ
n
có phân phối Student (t-phân phối) n − 1 bậc tự do (Tn−1)
Biến ngẫu nhiên liên tục X được gọi là có phân phối khi bình phương
Trang 12trong đó Γ(x) = R0∞ux−1e−udu gọi là hàm Gamma.
Kí hiệu X ∼ χ2n
Giá trị tới hạn của phân phối khi bình phương
Cho α ∈ (0; 1) Ta gọi giá trị kn(α) là giá trị tới hạn mức α của phânphối khi bình phương n bậc tự do nếu P (χ2n > kn(α)) = α
1.2 Mẫu số liệu
Tiến hành quan sát ngẫu nhiên n lần độc lập về biến ngẫu nhiên X
thu được n giá trị của X là x1, x2, , xn Khi đó (x1, x2, , xn) được gọi
là mẫu số liệu của biến ngẫu nhiên X và n được gọi là kích thước mẫu.1.3 Các đại lượng đặc trưng của mẫu số liệu
Cho {x1, x2, , xn} là mẫu số liệu kích thước n
1) Trung bình mẫu, kí hiệu là x, được tính theo công thức:
x = x1 + x2 + + xn
1n
Trang 13Phương pháp p-giá trị kiểm định giả thiết Đà Nẵng, 05 - 2013
1.4 Mẫu ngẫu nhiên
Mẫu ngẫu nhiên là một bộ gồm các biến ngẫu nhiên X1, X2, , Xn độclập cùng phân phối xác suất với biến ngẫu nhiên X
Như vậy ta có thể xem mẫu số liệu (x1, x2, , xn) là một giá trị củamẫu ngẫu nhiên (X1, X2, , Xn)
1.5 Ước lượng điểm
Giả sử θ là một tham số của phân phối xác suất biến ngẫu nhiên X.Ước lượng điểm của tham số θ là một giá trị t chỉ phụ thuộc vào mẫu sốliệu x1, x2, , xn Nói cách khác, t là một hàm n biến số:
t = h(x1, x2, , xn)
Ví dụ 1.1 Cho biến ngẫu nhiên X có phân phối chuẩn N (µ; σ2) với cáctham số µ và σ chưa biết và (x1, x2, , xn) là một mẫu số liệu của X Khi
đó có thể xem x và s lần lượt là các ước lượng điểm của µ và σ
Ví dụ 1.2 Cho biến ngẫu nhiên X có phân phối nhị thức B(n; p) vớitham số nđã biết và tham số pchưa biết và k là một giá trị quan sát đượccủa X Khi đó f = k/n có thể xem là một ước lượng điểm của p
Vì(x1; x2; ; xn)có thể xem là giá trị của biến ngẫu nhiên(X1; X2; Xn)
nên t lại chính là một giá trị của biến ngẫu nhiên T = h(X1, X2, , Xn)
T = h(X1, X2, , Xn) gọi là hàm ước lượng
Trang 14Ước lượng không chệch
Hàm ước lượng T = h(X1, X2, , Xn) được gọi là ước lượng khôngchệch đối với tham số θ nếu E(T ) = θ Ngược lạị, ta gọi T là ước lượngchệch và E(T ) − θ gọi là độ chệch của ước lượng
Ước lượng không chệch của kì vọng và phương sai
Giả sử (X1, X2, , Xn) là một mẫu ngẫu nhiên của biến ngẫu nhiên X
và X có phân phối chuẩn N (µ; σ2) Khi đó
Ước lượng không chệch tham số p của phân phối nhị thức B(n; p)
Cho biến ngẫu nhiên X có phân phối nhị thức B(n; p) Khi đó P =ˆ X
n
là một ước lượng không chệch của tham số p
Trang 15PHƯƠNG PHÁP P -GIÁ TRỊ KIỂM ĐỊNH GIẢ THIẾT
2.1 Kiểm định giả thiết về kì vọng của phân phối
chuẩn
Cho X có phân phối chuẩn N (µ; σ2) với kì vọng E(X) = µ chưa biết
và phương sai V ar(X) = σ2 đã biết Giả sử với mức ý nghĩa α, ta cầnkiểm định giả thiết
Dễ thấy rằng P-giá trị càng bé thì khả năng bác bỏ giả thiết H0 càng cao
Do tính đối xứng qua trục tung của đồ thị hàm mật độ phân phối chuẩntắc nên
P −giá trị= P (|Z| > |υ|) = 2P (Z > |υ|)
Ví dụ 2.1 Tốc độ đốt cháy một loại nhiên liệu máy bay là đại lượng ngẫunhiên chuẩn với σ = 2cm/s Với mức ý nghĩa α = 0, 05 hãy kiểm định giả
14
Trang 16Kiểm định bên phải
Ta cần kiểm định giả thiết
H0 : µ = µ0
với đối thiết
H1 : µ > µ0,
trong đó µ0 là một hằng số
Phương pháp kiểm định cổ điển
- Miền bác bỏ H0: Wα = (z(α); +∞) với z(α) là giá trị tới hạn của phânphối chuẩn tắc N (0, 1);
Trang 17Phương pháp p-giá trị kiểm định giả thiết Đà Nẵng, 05 - 2013
Ví dụ 2.2 Trong năm trước trọng lượng trung bình của bò trước khixuất chuồng ở một trang trại là 380 kg Năm nay người ta áp dụng thửmột chế độ ăn mới với hy vọng là bò sẽ tăng trọng nhanh hơn Sau thờigian áp dụng thử người ta lấy ngẫu nhiên 50 con bò trước khi xuất chuồngđem cân và tính được trọng lượng trung bình của chúng là x = 390 kg.Với mức ý nghĩaα = 0, 01 có thể cho rằng trọng lượng trung bình của bòtrước khi xuất chuồng đã tăng lên không? Giả thiết trọng lượng của bò cóphân phối chuẩn với σ = 35, 2 kg
Giải Gọi X là trọng lượng bò trước lúc bò xuất chuồng sau khi áp dụngchế độ ăn mới và E(X) = µ là trọng lượng trung bình (chưa biết) Ta cầnkiểm định giả thiết
Kiểm định bên trái
Ta cần kiểm định giả thiết
H0 : µ = µ0
với đối thiết
H1 : µ > µ0,
trong đó µ0 là một hằng số
Phương pháp kiểm định cổ điển
- Miền bác bỏH0: Wα = (−∞; −z(α))với z(α) là giá trị tới hạn của phânphối chuẩn tắc N (0, 1);
Trang 19Phương pháp p-giá trị kiểm định giả thiết Đà Nẵng, 05 - 2013
σ ; giá trị z(α) và z(α/2) tra ở Bảng II; Φ(υ)
tra ở bảng I
Cho X có phân phối chuẩn N (µ; σ2) với kì vọng E(X) = µ chưa biết
và phương sai V ar(X) = σ2 cũng chưa biết Giả sử với mức ý nghĩa α, tacần kiểm định giả thiết
Ví dụ 2.4 Trọng lượng của một loại sản phẩm do một xí nghiệp sảnxuất đạt tiêu chuẩn nếu có trọng lượng là 6 kg Sau một thời gian sảnxuất người ta tiến hình kiểm tra ngẫu nhiên 121 sản phẩm do xí nghiệp
đó sản xuất và tính được trung bình mẫu x = 5, 8 kg và độ lệch chuẩn
sản phẩm của xí nghiệp đạt tiêu chuẩn không? Biết rằng trọng lượng sảnphẩm của xí nghiệp có phân phối chuẩn
Giải Gọi X là trọng lượng sản phẩm và E(X) = µ là trọng lượng sảnphẩm trung bình thực tế Ta cần kiểm định giả thiết
H0 : µ = 6
Trang 20với đối thiết
Kiểm định bên phải
Ta cần kiểm định giả thiết
kĩ thuật, tuổi thọ bóng đèn có tăng lên" không? Biết tuổi thọ bóng đèn cóphân phối chuẩn
Giải Gọi X là tuổi thọ bóng đèn sau cải tiến kĩ thuật và E(X) = µ làtuổi thọ trung bình Ta cần kiểm định giả thiết
H0 : µ = 2000
Trang 21Phương pháp p-giá trị kiểm định giả thiết Đà Nẵng, 05 - 2013
với đối thiết
Kiểm định bên trái
Giả sử với mức ý nghĩa α, ta cần kiểm định giả thiết
Giải Gọi X là chi tiêu của các gia đình và E(X) = µ là chi tiêu trungbình Ta cần kiểm định giả thiết H0 : µ = 2, 5 với đối thiết H1 : µ < 2, 5.Cách 1
• tn−1(α) = t99(0, 05) = z(0, 05) = 1, 6449
Trang 22s , giá trị tn−1(α) và tn−1(α/2)tra ở Bảng III.
Tính P -giá trị bằng Excel
Sử dụng hàm sau trong Excel để tính P-giá trị phân phối Student:
P (Tn > x) = T DIST (x, n, 1)
2.2 Kiểm định phương sai của phân phối chuẩn
Cho X có phân phối chuẩn N (µ; σ2) với kì vọng E(X) = µ chưa biết
và phương sai V ar(X) = σ2 cũng chưa biết Giả sử với mức ý nghĩa α, tacần kiểm định giả thiết
Trang 23Phương pháp p-giá trị kiểm định giả thiết Đà Nẵng, 05 - 2013
Kiểm định bên phải
Ta cần kiểm định giả thiết
Trang 24Ví dụ 2.8 Trọng lượng của gà con lúc mới nở là một biến ngẫu nhiên
có phân phối chuẩn Nghi ngờ về sự đồng đều của gà con bị giảm sút,người ta cân thử 12 con và tìm được s2 = 11, 41( đơn vị) Với mức ý nghĩa
Kiểm định bên trái
Ta cần kiểm định giả thiết
Trang 25Phương pháp p-giá trị kiểm định giả thiết Đà Nẵng, 05 - 2013
Giải Ta cần kiểm định giả thiết
Kết luận:
Trang 26Cho X có phân phối nhị thức B(n; p) với n lớn Giả sử với mức ý nghĩa
α, ta cần kiểm định giả thiết
p
p0(1 − p0) ,
trong đó k là 1 giá trị quan sát được của X
Trang 27Phương pháp p-giá trị kiểm định giả thiết Đà Nẵng, 05 - 2013
Ví dụ 2.10 Một Đảng Chính trị trong một cuộc bầu cử tổng thống ở
Mỹ tuyên bố rằng 45% cử tri sẽ bỏ phiếu cho ứng cử viên A của họ Chọnngẫu nhiên 200 cử tri để thăm dò ý kiến cho thấy 80 người trong số đótuyên bố sẽ bỏ phiếu cho ông A Với mức ý nghĩa α = 5%, hãy kiểm địnhxem dự đoán của Đảng trên có đúng hay không?
Giải Gọi p là tỉ lệ bỏ phiếu cho ứng cử viên A, X là số phiếu khi thăm
dò ngẫu nhiên 200 người X ∼ B(200; p)
Ta cần kiểm định giả thiết
Kiểm định bên phải
Ta cần kiểm định giả thiết
Trang 28Phương pháp P-giá trị
P −giá trị = P (Z > υ) với υ = (k/n − p0)
√n
p
p0(1 − p0) ,
trong đó k là 1 giá trị quan sát được của X
Ví dụ 2.11 Lô hàng đủ tiêu chuẩn xuất khẩu nếu tỷ lệ phế phẩm khôngvượt quá 3% Kiểm tra ngẫu nhiên 400 sản phẩm của lô hàng thấy có 14phế phẩm.Với mức ý nghĩa α = 0, 05 có cho phép lô hàng được xuất khẩuhay không?
Giải Gọi p là tỉ lệ phế phẩm của lô hàng, X là số phế phẩm khi lấy ngẫunhiên 400 sản phẩm X ∼ B(400; p)
Ta cần kiểm định giả thiết
Kiểm định bên trái
Ta cần kiểm định giả thiết
Trang 29Phương pháp p-giá trị kiểm định giả thiết Đà Nẵng, 05 - 2013
- Miền bác bỏ H0: Wα = (−∞; −z(α))
-Tính υ = (k/n − p0)
√n
p
p0(1 − p0) ,
trong đó k là 1 giá trị quan sát được của X
Ví dụ 2.12 Giám đốc một công ty tuyên bố 90% sản phẩm của công tyđạt tiêu chuẩn quốc gia Một công ty kiểm định độc lập đã tiến hành kiểmtra 200 sản phẩm của công ty đó thì thấy có 168 sản phẩm đạt yêu cầu.Với mức ý nghĩa α = 0, 05 có kết luận gì về tuyên bố trên?
Giải Gọi p là tỉ lệ sản phẩm của công ty đạt chuẩn quốc gia, X là số sảnphẩm đạt tiêu chuẩn khi lấy ngẫu nhiên 200 sản phẩm X ∼ B(200; p)
Ta cần kiểm định giả thiết