Lí do chọn đề tài Một số quy luật phân phối xác suất và bài toán kiểm định giả thiết thống kê là một vấn đề có vị trí quan trọng trong xác suất nói riêng và trong toánhọc hiện đại nói ch
Trang 1Mục lục
1.1 Xác suất 7
1.1.1 Phép thử và biến cố 7
1.1.2 Quan hệ giữa các biến cố 8
1.1.3 Không gian các biến cố sơ cấp 9
1.1.4 Các tính chất cơ bản của xác suất 10
1.2 Đại lượng ngẫu nhiên và hàm phân phối xác suất 11
1.2.1 Đại lượng ngẫu nhiên 11
1.2.2 Hàm phân phối xác suất 12
1.2.3 Hàm mật độ xác suất 13
1.3 Các tham số đặc trưng của đại lượng ngẫu nhiên 15
1.3.1 Kì vọng toán 15
1.3.2 Phương sai 17
1.3.3 Mốt 20
1.3.4 Trung vị (Median) 20
2 Một số quy luật phân phối xác suất thông dụng 22 2.1 Quy luật nhị thức B(n,p) 22
2.2 Quy luật phân phối chuẩn 24
2.2.1 Các tham số đặc trưng 27
Trang 22.2.2 Quy tắc 2σ và 3σ 28
2.3 Quy luật khi bình phương (χ2(n)) 29
2.3.1 Tính chất của quy luật khi bình phương 30
2.3.2 Các tham số đặc trưng 30
2.4 Quy luật Student T (n) 31
3 Một số bài toán kiểm định giả thiết thống kê đơn giản 34 3.1 Thiết lập bài toán 34
3.2 Kiểm định giả thiết về giá trị trung bình của ĐLNN có phân phối chuẩn 37
3.2.1 Trường hợp σ2 đã biết 37
3.2.2 Trường hợp σ2 chưa biết 39
3.3 So sánh hai giá trị trung bình của hai ĐLNN có phân phối chuẩn 41
3.3.1 Trường hợp σ12, σ22 đã biết 42
3.3.2 Trường hợp σ12, σ22 chưa biết (giả thiết σ12 = σ22) 44
3.4 Kiểm định về xác suất của đại lượng ngẫu nhiên có phân phối nhị thức 48
3.5 Kiểm định giả thiết về hai xác suất của hai đại lượng ngẫu nhiên có phân phối nhị thức 50
3.6 Kiểm định giả thiết về tính độc lập của hai dấu hiệu định tính 53
3.7 So sánh nhiều tỉ lệ của đại lượng ngẫu nhiên có phân phối nhị thức 56
Trang 3LỜI CẢM ƠNLời đầu tiên tôi xin bày tỏ lòng biết ơn sâu sắc tới: Ban chủ nhiệm khoaToán −Lý −Tin, phòng khảo thí và đảm bảo chất lượng, phòng đào tạođại học, các thầy cô trong tổ bộ môn Giải tích, đặc biệt là cô giáo PhạmThị Thái, người đã định hướng nghiên cứu, hướng dẫn, cũng như độngviên tôi có thêm nghị lực hoàn thành khóa luận này.
Nhân dịp này tôi xin cảm ơn tới người thân và các bạn sinh viên lớpK51 ĐHSP Toán và K51 ĐHSP Toán − Lý
Những ý kiến đóng góp, giúp đỡ, động viên của thầy cô và bạn bè đãtạo điều kiện thuận lợi để tôi hoàn thành khóa luận
Tôi xin chân thành cảm ơn!
Sơn la, tháng 5 năm 2014
Người thực hiệnSinh viên: Vũ Thị Huệ
Trang 4MỞ ĐẦU
1 Lí do chọn đề tài
Một số quy luật phân phối xác suất và bài toán kiểm định giả thiết thống
kê là một vấn đề có vị trí quan trọng trong xác suất nói riêng và trong toánhọc hiện đại nói chung, là một vấn đề mở rộng của lý thuyết xác suất Một
số quy luật phân phối xác suất và ứng dụng của nó trong bài toán kiểmđịnh giả thiết thống kê có rất nhiều ứng dụng trong thực tế Để học tốtnhững mảng kiến thức này, trước hết mỗi sinh viên phải tự trang bị chomình các kiến thức và phương pháp chủ yếu là tìm đọc tài liệu, tự nghiêncứu các nội dung liên quan Trong chương trình Xác Suất Thống Kê ở bậcđại học do thời gian học có hạn, một số quy luật phân phối xác suất và bàitoán kiểm định giả thiết thống kê chỉ đề cập đến thông qua một số kháiniệm, công thức và thông qua một số tính chất đơn giản mà chưa nêu rađược mối liên hệ giữa quy luật phân phối xác suất và sử dụng nó trongbài toán kiểm định giả thiết thống kê Cũng có rất nhiều cuốn sách trìnhbày về vấn đề này như "Xác Suất Thống Kê" của tác giả Đào Hữu Hồ,
"Lý Thuyết Xác Suất Và Thống Kê Toán" của tác giả Nguyễn Cao Văn Trong chương trình học tập của sinh viên đại học, xác suất được nghiêncứu chủ yếu trên cơ sở xác suất cổ điển Để thấy rõ mối quan hệ giữa Lýthuyết xác suất, cụ thể là: Một số quy luật phân phối xác suất, với thống
kê toán, cụ thể là: Bài toán kiểm định giả thiết thống kê đơn giản Hơnnữa cần làm rõ hơn cơ sở xây dựng để giải quyết các bài toán kiểm địnhđó
Xuất phát từ những lí do trên tôi đã mạnh dạn đi vào nghiên cứu "Một
số quy luật phân phối xác suất và ứng dụng của nó trong bài toán kiểmđịnh giả thiết thống kê đơn giản"
2 Mục đích, đối tượng, nhiệm vụ, phương pháp nghiên cứu, giớihạn phạm vi nghiên cứu
2.1 Mục đích nghiên cứu
Tìm hiểu một số quy luật phân phối xác suất thông dụng và bài toán
Trang 5kiểm định giả thiết thống kê liên quan đến quy luật phân phối đó Từ đónghiên cứu việc ứng dụng của quy luật phân phối xác suất trong một sốbài toán kiểm định giả thiết thống kê đơn giản.
2.2 Đối tượng nghiên cứu
Đối tượng nghiên cứu của khóa luận là một số quy luật phân phối trongxác suất thông dụng và bài toán kiểm định giả thiết thống kê đơn giản.2.3 Nhiệm vụ nghiên cứu
Với mục đích như trên, tôi đã đặt nhiệm vụ tìm hiểu và trình bày lạicác vấn đề kiến thức có liên quan một cách có hệ thống và logic Từ đóxây dựng cơ sở để giải quyết các bài toán kiểm định tương ứng Mỗi bàitoán đều có ví dụ áp dụng nó
2.4 Phương pháp nghiên cứu
Do đặt ra nhiệm vụ như trên và do đặc thù bộ môn, tôi chọn phươngpháp sưu tầm tài liệu, hỏi ý kiến chuyên gia, giảng viên hướng dẫn, nhómnghiên cứu Từ đó hệ thống lại kiến thức theo nội dung của khóa luận.2.5 Giới hạn phạm vi nghiên cứu
Phạm vi nghiên cứu là nghiên cứu vấn đề về quy luật phân phối xácsuất thông dụng và một số bài toán kiểm định giả thiết thống kê theo cổđiển
3 Bố cục
Từ mục đích và nhiệm vụ đặt ra bố cục của đề tài được sắp xếp nhưsau: Ngoài phần mở đầu, kết luận, mục lục, danh mục tài liệu tham khảo,nội dung đề tài gồm ba chương:
Chương 1: Trình bày các kiến thức cơ sở về xác suất
Chương đầu là một số nội dung kiến thức cơ bản nên chỉ dẫn nội dung.Một số kết quả không chứng minh
Chương 2: Trình bày về một số quy luật phân phối xác suất thông dụng.Chương 3: Chương này trình bày cơ sở xây dựng tiêu chuẩn kiểm địnhcủa một số bài toán kiểm định giả thiết thống kê
4 Đóng góp của khóa luận
Trang 6Khóa luận trình bày một cách có hệ thống kiến thức liên quan Xâydựng cơ sở kiểm định cho một số bài toán kiểm định gỉa thiết, kèm theo
nó là ví dụ minh họa Khóa luận là tài liệu tham khảo có giá trị cho cácbạn sinh viên quan tâm đến vấn đề một số quy luật phân phối xác suất vàứng dụng của nó trong bài toán kiểm định giả thiết thống kê đơn giản
Trang 7ấy, chẳng hạn nếu muốn quan sát việc xuất hiện mặt sấp hay mặt ngửacủa một đồng xu ta phải tung đồng xu, còn để xem viên đạn trúng bia haytrượt ta phải bắn các viên đạn.
Việc thực hiện nhóm các điều kiện cơ bản để quan sát một hiện tượngnào đó xảy ra hay không được gọi là thực hiện một phép thử ngẫu nhiên(viết tắt là phép thử) và người ta thường kí hiệu phép thử là G hoặc
Trang 8Ví dụ 1.2 Gieo một hạt đậu tương được xem như là một phép thử " Gieohạt đậu tương" Kết quả của phép thử này là hạt nảy mầm hoặc khôngnảy mầm đó là biến cố Như vậy biến cố của phép thử là: hạt nảy mầm,hạt không nảy mầm.
Như vậy một biến cố chỉ có thể xảy ra khi một phép thử gắn liền với nóđược thực hiện
Trong thực tế có thể xảy ra các loại biến cố sau:
• Biến cố chắc chắn là biến cố nhất định xảy ra khi thực hiện một phépthử, kí hiệu là Ω
• Biến cố không thể là biến cố nhất định không xảy ra khi thực hiện mộtphép thử, kí hiệu
• Biến cố ngẫu nhiên là biến cố có thể xảy ra hoặc không xảy ra khi thựchiện phép thử
Kí hiệu: A, B, C, hoặc Bi, i = 1, n
1.1.2 Quan hệ giữa các biến cố
Định nghĩa 1.3 Hai biến cố A và B gọi là xung khắc với nhau nếu chúngkhông thể đồng thời xảy ra trong một phép thử Trường hợp ngược lại, nếuhai biến cố có thể cùng xảy ra trong một phép thử thì được gọi là khôngxung khắc
Định nghĩa 1.4 Biến cố A được gọi là thuận lợi cho biến cố B nếu biến
cố A xảy ra kéo theo biến cố B cũng xảy ra và kí hiệu A ⊂ B
Định nghĩa 1.5 Các biến cố A1, A2, , An được gọi là một nhóm đầy đủcác biến cố nếu trong kết quả của một phép thử sẽ xảy ra một và chỉ mộttrong các biến cố đó
Nói cách khác các biến cố nói trên sẽ tạo nên một nhóm đầy đủ các biến
cố nếu chúng xung khắc từng đôi với nhau và tổng của chúng là biến cốchắc chắn
Trang 9Ví dụ 1.6 Phép thử gieo một con xúc xắc Ta kí hiệu các biến cố:
Bc và Bl là hai biến cố xung khắc với nhau
Biến cố B2 thuận lợi cho biến cố Bc, kí hiệu B2 ⊂ Bc
Biến cố B1, B2, B3, B4, B5, B6 tạo nên một nhóm đầy đủ các biến cố.Định nghĩa 1.7 Hai biến cố A và A gọi là đối lập với nhau nếu chúngtạo nên một nhóm đầy đủ các biến cố
Ví dụ 1.8 Bắn một viên đạn vào bia Gọi A là biến cố "Đạn bắn trúngbia", A là biến cố " Đạn bắn trượt bia" Khi đó A và A là hai biến cố đốilập nhau
1.1.3 Không gian các biến cố sơ cấp
Định nghĩa 1.9 Khi phép thử được thực hiện có thể xuất hiện nhiều biến
cố khác nhau Các biến cố không thể chia thành các biến cố khác được nữađược gọi là các biến cố sơ cấp Tập hợp các biến cố sơ cấp của một phépthử được gọi là không gian các biến cố sơ cấp và kí hiệu là Ω
Định nghĩa 1.10 Xác suất xuất hiện biến cố A trong một phép thử là tỉ
số giữa số biến cố thuận lợi cho A và tổng số các biến cố duy nhất đồngkhả năng có thể xảy ra khi thực hiện phép thử đó
Nếu kí hiệu P (A) là xác suất của biến cố A, m là số kết cục thuận lợicho biến cố A, n là số kết cục duy nhất đồng khả năng của phép thử thì ta có
P (A) = m
n.Nhận xét 1.11 • Biến cố duy nhất đồng khả năng có thể xảy ra khi thựchiện phép thử chính là biến cố sơ cấp của phép thử đó,
Trang 10• Xác suất của biến cố cho phép ta đánh giá khả năngxuất hiện biến cố đó.
Ví dụ 1.12 25 hành khách lên ngẫu nhiên 5 toa tàu Tìm xác suất đểa) Toa thứ nhất có đúng 4 hành khách
b) Mỗi toa có 5 hành khách
Giải
a) Số cách phân ngẫu nhiên 25 hành khách lên 5 toa tàu là 525
Gọi A là biến cố "Toa thứ nhất có 4 hành khách"
Số cách phân ngẫu nhiên 25 hành khách lên 5 toa tàu mà toa thứ nhất có
Số cách phân ngẫu nhiên 25 hành khách lên 5 toa tàu mà mỗi toa có 5hành khách là C255 C205 C155 C105 C55 = 25!
1.1.4 Các tính chất cơ bản của xác suất
• Xác suất của biến cố ngẫu nhiên là một số thuộc đoạn [0; 1], tức là
Trang 11Đặc biệt: Nếu A, B là hai biến cố xung khắc thì
P (A + B) = P (A) + P (B)
1.2 Đại lượng ngẫu nhiên và hàm phân phối xác suất
1.2.1 Đại lượng ngẫu nhiên
Định nghĩa 1.13 Hàm X xác định trên không gian biến cố sơ cấp Ω vànhận giá trị trong không gian R được gọi là đại lượng ngẫu nhiên (ĐLNN)nếu với x ∈ R tập hợp {w : X(w) < x} là biến cố ngẫu nhiên (w ∈ Ω)
Ta thường kí hiệu đại lượng ngẫu nhiên bằng chữ in hoa X, Y , Z, vàgiá trị của nó nhận kí hiệu bằng chữ thường x, y, z,
Ví dụ 1.14 Gọi X là " Số sản phẩm tốt " trong 10 sản phẩm được chọnngẫu nhiên từ lô sản phẩm có 100 sản phẩm tốt và 50 phế phẩm Khi đó
X là ĐLNN mà giá trị nó có thể nhận là: 0, 1, 2, , 10
Ví dụ 1.15 Gọi Y là " Số con trai trong một lần sinh một con" Khi đó
Y là đại lượng ngẫu nhiên giá trị mà nó có thể nhận là: 0, 1
Phân loại đại lượng ngẫu nhiên
Định nghĩa 1.16 Đại lượng ngẫu nhiên rời rạc là ĐLNN mà các giá trị
có thể nhận của nó là tập hợp hữu hạn hoặc vô hạn đếm được
Ví dụ 1.17 Một phân xưởng có 5 máy hoạt động độc lập với nhau Gọi
X là "Số máy hỏng trong một ca" Khi đó X là ĐLNN rời rạc nhận cácgiá trị có thể có là: 0, 1, 2, 3, 4, 5
Định nghĩa 1.18 ĐLNN được gọi là ĐLNN liên tục nếu các giá trị cóthể có của nó lấp đầy một khoảng nào đó trên trục số
Ví dụ 1.19 Phép thử bắn một viên đạn vào bia Nếu gọi X là "Khoảngcách từ điểm chạm của viên đạn đến tâm bia" thì X là ĐLNN liên tục vàcác giá trị có thể của X nằm trong khoảng (a, b) nào đó
Trang 121.2.2 Hàm phân phối xác suất
Ta thay kí hiệu (w : X(w) < x) bởi kí hiệu (X < x)
Định nghĩa 1.20 Hàm phân phối xác suất của ĐLNN X, kí hiệu F (x)
là xác suất để ĐLNN X nhận giá trị nhỏ hơn x, với x là một số thực bất
kì, tức là
F (x) = P (X < x), ∀x ∈ R
Nếu X là ĐLNN rời rạc nhận giá trị có thể x1, x2, , xn, với xác suấttương ứng p1, p2, , pn, thì hàm phân phối xác suất được xác định bằngcông thức
Trang 13Tính chất hàm phân phối xác suất
• Hàm phân phối xác suất luôn nhận giá trị trong đoạn [0; 1], tức là
• lim
x→+∞F (x) = 1
1.2.3 Hàm mật độ xác suất
Định nghĩa 1.22 Hàm mật độ xác suất của ĐLNN liên tục (kí hiệu f (x))
là đạo hàm của hàm phân phối xác suất của ĐLNN đó, tức là
a
f (x)dx
Trang 14Chú ý 1.23 Nếu ĐLNN X liên tục thì
P (a ≤ X < b) = P (a < X ≤ b) = P (a < X < b),với a, b là hằng số thực
• Hàm phân phối xác suất F (x) =
xR
Trang 15Hiển nhiên F (x) liên tục tại x = 0.
Xét tại x = 1 ta có lim
x→1 −F (x) = F (1) = alim
0 nếu x > 1c) Theo tính chất hàm phân phối xác suất
Trang 16Theo định nghĩa kì vọng toán của ĐLNN rời rạc ta có
0x(x2 + 2x)dx
0
= 11
6 .
Trang 17Tính chất của kì vọng
• Nếu C là hằng số thì E(C) = C
• Nếu X là ĐLNN có kì vọng E(X) và C là hằng số thì
E(CX) = CE(X)
• Nếu X, Y là hai ĐLNN có kì vọng tương ứng là E(X), E(Y ) thì
E(X + Y ) = E(X) + E(Y )
• Mở rộng: Nếu X1, X2, , Xn là các ĐLNN có các kì vọng tương ứng làE(X1), , E(Xn) thì
E(
nX
i=1
Xi) =
nX
i=1E(Xi)
• Nếu X và Y là hai ĐLNN độc lập có các kì vọng tương ứng là E(X), E(Y )thì
Định nghĩa 1.30 Giả sử X là ĐLNN có kì vọng là E(X) Khi đó người
ta gọi kì vọng của ĐLNN [X − E(X)]2 là phương sai của ĐLNN X, kí hiệu
Trang 18D(X), tức là
D(X) = E[X − E(X)]2.Như vậy: Nếu X là ĐLNN rời rạc nhận giá trị có thể x1, x2, , xn, vớixác suất tương ứng p1, p2, , pn, thì phương sai được xác định bởi côngthức
D(X) =
∞X
i=1[xi− E(X)]2pi
Nếu X là ĐLNN liên tục có hàm mật độ f (x) thì phương sai được xácđịnh bởi công thức
Tính chất của phương sai
• Phương sai của một hằng số C bằng 0, tức là
i=1
Xi) =
nX
i=1D(Xi)
Trang 19• Phương sai của tổng một hằng số với một ĐLNN bằng phương sai củachính ĐLNN đó
i=1
Xi) =
nX
i=1D(Xi)
Ta tìm D(Xi), i = 1, n theo công thức
D(Xi) = E(Xi)2 − [E(Xi)]2.Mỗi ĐLNN Xi đều có phân phối xác suất như sau:
Trang 20Vậy D(X) =
nP
• Xác suất lớn nhất nếu X là ĐLNN rời rạc,
• Hàm mật độ xác suất đạt cực đại nếu X là ĐLNN liên tục
Ví dụ 1.33 Cho ĐLNN X có phân phối xác suất như sau Tìm Xmod
Trang 21• Nếu X là ĐLNN rời rạc nhận giá trị x1, x2, , xn, thì Xme = xi nếuthỏa mãn
Do X là ĐLNN liên tục nên
F 12
= 1
2 ⇒ Xme = 1
2.
Trang 22dễ dàng hơn.
Giả sử trong bình có N quả cầu trong đó có M quả cầu trắng và N − Mquả cầu đen Mỗi phép thử là việc lấy ngẫu nhiên từ bình ra một quả cầu.Theo những cách lấy khác nhau sẽ dẫn đến những lược đồ khác nhau vàcác quy luật phân phối xác suất khác nhau
2.1 Quy luật nhị thức B(n,p)
Định nghĩa 2.1 ĐNNN rời rạc X nhận một trong các giá trị có thể
0, 1, , n với xác suất tương ứng được tính bằng công thức
P (X = k) = Cnkpkqn−k, p = 1 − q, k = 0, ngọi là phân phối theo quy luật nhị thức với tham số là n và p
Quy luật nhị thức được ký hiệu là B(n, p)
Bảng phân phối xác suất của ĐLNN X phân phối theo quy luật nhị thức
có dạng:
Trang 23X 0 1 k n
P Cn0p0qn Cn1p1qn−1 Cnkpkqn−k Cnnpnq0
Ví dụ 2.2 Trong một phân xưởng có 5 máy hoạt động độc lập Xác suất
để trong một ngày mỗi máy bị hỏng đều bằng 0, 1 Tìm xác suất để
a) Trong một ngày có hai máy hỏng
b) Trong một ngày có không quá hai máy hỏng
Trang 242.2 Quy luật phân phối chuẩn
Định nghĩa 2.3 ĐLNN liên tục X nhận giá trị trong khoảng (−∞; +∞)gọi là phân phối theo quy luật chuẩn với các tham số a và σ2 nếu hàm mật
độ xác suất của nó có dạng
f (x) = 1
σ√2πe
−(x − a)22σ2
Kí hiệu X ' N (a; σ2)
Đồ thị của hàm mật độ xác suất f (x) của hàm phân phối chuẩn có dạngnhư sau
Hình 2.1.Đồ thị hàm f (x) có phân phối chuẩn
Qua đồ thị ta thấy khi a và σ thay đổi dạng đồ thị của hàm mật độ xácsuất f (x) cũng thay đổi như sau
Khi a thay đổi thì dạng của đường cong f (x) không thay đổi song nó sẽdịch chuyển sang trái hoặc sang phải theo trục Ox Nếu σ tăng lên thì đồthị xuống thấp và phình ra, còn khi σ giảm thì đồ thị cao lên và nhọn thêm(Hình 2.2)
Trang 25Hình 2.2 Sự thay đổi của f (x) theo σHàm phân phối xác suất của ĐLNN X phân phối theo quy luật chuẩnđược xác định bằng biểu thức
F (x) = 1
σ√2π
xZ
−∞
e
−(u − a)22σ du, ∀u ∈ R
Đặc biệt nếu a = 0, σ = 1 thì ta có hàm mật độ xác suất
Trang 27đường cong có phân phối chuẩn chính tắc, trục Ou và đường thẳng U = uαbằng α (hình 2.4).
Hình 2.4.Giá trị tới hạn chuẩn uα
Từ hình vẽ trên ta thấy giá trị tới hạn chuẩn có tính chất sau
Ví dụ 2.6 Giả sử chiều cao X của trẻ em có phân phối chuẩn dạng
N (1, 3; 0, 01) Tính xác suất để trẻ em có chiều cao nằm trong khoảng(1, 2; 1, 4)
Trang 28Do đó nếu ĐLNN X chưa biết quy luật phân phối xác suất của nó, song
nó thỏa mãn các quy tắc 2σ hoặc quy tắc 3σ ta coi ĐLNN X có phân phốichuẩn
Trang 292.3 Quy luật khi bình phương (χ2(n))
Định nghĩa 2.7 ĐLNN X có phân phối χ2 với n bậc tự do nếu hàm mật
ex/2xn/2 − 1 với x > 0,
ex/2xn/2 − 1 = α
Nếu cho trước α dựa vào biểu thức trên ta tính đượcχ2(n)α
Trang 30Trên đồ thị (hình 2.5) ta thấy giá trị tới hạn chuẩn χ2(n)α là giá trị sao chodiện tích giới hạn bởi đường cong phân phối khi bình phương, trục Oχ2 vàđường thẳng χ2 = χ2(n)α bằng α.
Trong quy luật "khi bình phương" giá trị tới hạn χ2 là tham số được sửdụng nhiều Giá trị tới hạn "khi bình phương" mức α kí hiệu χ2(n)α là giátrị của ĐLNN χ2 tuân theo quy luật phân phối khi bình phương với n bậc
tự do thỏa mãn điều kiện
n = n1 + n2
• Nếu dãy các ĐLNN độc lập X1, X2, , Xn có phân phối chuẩn dạng
N (0, 1) thì χ2 =
nP