Gọi các biếnA : “Người thứ nhất bắn trung mục tiêu” B : “Người thứ hai bắn trúng mục tiêu” Biến cố A C B: “Có it nhất một người bắn trúng mục tiêu” d Biến cố tích AB .A \ B/ xảy ra khi v
Quan hệ giữa các biến cố
a) Quan hệ kéo theo.A B/ WNếu biến cố Axảy ra thì kéo theo biến cố
Ví dụ 1.5 Theo dõi 3 bệnh nhân phỏng đang được điều trị Gọi các biến cố:
A i : “Có i bệnh nhân tử vong”,i D 0; 1; 2; 3
B : “Có nhiều hơn một bệnh nhân tử vong”
Hai biến cố A và B được gọi là bằng nhau khi A B và B A, ký hiệu là A D B Biến cố tổng A C B xảy ra khi và chỉ khi ít nhất một trong hai biến cố A hoặc B xảy ra trong một phép thử Điều này có nghĩa là biến cố tổng là sự hợp của hai biến cố A và B, phản ánh tình huống ít nhất một trong chúng xảy ra.
Ví dụ 1.6 Hai xạ thủ cùng bắn vào một mục tiêu, mỗi người bắn một phát Gọi các biến cố:
A : “Người thứ nhất bắn trung mục tiêu”
B : “Người thứ hai bắn trúng mục tiêu”
Biến cố ACB thể hiện rằng có ít nhất một người bắn trúng mục tiêu, là một trong những khái niệm quan trọng trong xác suất Trong khi đó, biến cố tích AB hoặc A \ B xảy ra nếu và chỉ khi cả hai biến cố A và B cùng xảy ra trong một phép thử, giúp hiểu rõ hơn về các khả năng xảy ra đồng thời trong các tình huống thực tế Việc nắm vững các biến cố này giúp nâng cao kiến thức về xác suất và ứng dụng trong đời sống.
Ví dụ 1.7 Một sinh viên thi kết thúc 2 môn hoc Gọi các biến cố:
A : “Sinh viên thi đạt môn thứ nhất”
B : “Sinh viên thi đạt môn thứ hai”
Biến cố AB: "Sinh viên thi đạt cả hai môn" là ví dụ điển hình của một biến cố trong xác suất Hai biến cố A và B được gọi là xung khắc nếu chúng không cùng xảy ra trong cùng một phép thử, thể hiện rõ tính chất độc lập của các biến cố này Trong xác suất, biến cố không thể là những khả năng không bao giờ xảy ra khi thực hiện phép thử, ký hiệu là ;/, còn biến cố chắc chắn luôn xảy ra trong phép thử với ký hiệu Biến cố N của A, hay còn gọi là biến cố bù của A, là trường hợp ngược lại khi A không xảy ra, tức là A và A' (bù của A) là hai khả năng đối nghịch, giúp hiểu rõ hơn về các khả năng xảy ra trong xác suất.
Trang 4 Chương 1 Biến cố, xác suất của biến cố
Định nghĩa xác suất
Định nghĩa 1.1(Định nghĩa cổ điền) Xét một phép thử đồng khả năng, có không gian các biến cố sơ cấp
A là một biến cố Xác suất xảy ra biến cố A, ký hiệuP.A/
P.A/ D jAj jj D số trường hợp thuận lợi đối vớiA số trường hợp có thể
Ví dụ 1.8 Gieo một con xúc sắc cân đối Tính xác suất số chấm trên mặt xuất hiện lớn hơn 4.
Ví dụ 1.9 Xếp ngẫu nhiên 5 sinh viên vào một ghế dài có 5 chỗ ngồi. Tính xác suất hai người định trước ngồi cạnh nhau.
Tính chất 1.2 (Tính chất của xác suất) Xác suất có các tính chất: i 0 P.A/ 1 với mọi biến cốA. ii P.;/ D 0, P./ D 1. iii Nếu A B thì P.A/ P.B/. iv P.A/ D 1 P AN
Ví dụ 1.10 Một lọ đựng 4 bi trắng và 6 bi đen Từ lọ lấy ra ngẫu nhiên
3 bi, tính xác suất lấy được: a) Hai bi trắng. b) Ít nhất một bi trắng.
Chú ý: Trong câu b), chúng ta tính xác suất của biến cố bù sẽ đơn giản hơn Ta có
BN W “Lấy được không bi trắng”
Xác suất có điều kiện, sự độc lập
Xác suất có điều kiện
Định nghĩa 1.3 (Xác suất có điều kiện) P.AjB/là xác suất xảy ra biến cố Abiết rằng biến cố B đã xảy ra (P.B/ > 0).
Trong ví dụ này, một lọ chứa 4 viên bi trắng và 6 viên bi đen, và bạn lấy lần lượt 2 viên bi mà không hoàn lại Xác suất để viên bi thứ hai là trắng, biết rằng viên bi thứ nhất đã là trắng, được tính bằng cách xem xét xác suất của việc lấy viên bi trắng thứ nhất và sau đó tính xác suất lấy viên bi trắng thứ hai trong lần lấy thứ hai Đây là ví dụ minh họa cách tính xác suất có điều kiện trong xác suất thống kê, giúp hiểu rõ hơn về xác suất trong các tình huống thực tế.
B xảy ra đã lấy 1 bi trắng!
Trang 6 Chương 1 Biến cố, xác suất của biến cố
Trong ví dụ 1.12, ta xem xét việc rút ngẫu nhiên 2 lá bài từ bộ bài tây gồm 52 lá chia thành 4 chất và 2 màu đỏ, đen Đầu tiên, xác suất rút được hai lá bài cơ đã được tính dựa trên số lượng lá bài cơ trong bộ bài Tiếp theo, ta xác định xác suất rút được hai lá bài cơ khi biết rằng hai lá đó có màu đỏ, nhấn mạnh vào yếu tố điều kiện trong xác suất Các phép tính này giúp hiểu rõ hơn về khả năng xảy ra các trường hợp đặc biệt khi chơi bài tây, đồng thời cung cấp kiến thức về xác suất trong các trò chơi dùng bộ bài tiêu chuẩn.
Ví dụ 1.13 Một nhóm 100 người có:
+ 30 nữ, trong đó có 5 người hút thuốc.
Trong nhóm gồm 100 người, ta xét xác suất của các tình huống liên quan đến việc hút thuốc và giới tính của họ Đầu tiên, xác suất chọn ngẫu nhiên một người trong nhóm là nữ và người đó biết rằng họ hút thuốc, giúp xác định khả năng một người nữ trong nhóm cũng là người hút thuốc Ngược lại, ta cũng tính xác suất chọn một người hút thuốc và biết rõ họ là nữ, nhằm hiểu rõ mối liên hệ giữa giới tính và hành vi hút thuốc trong nhóm Các tính toán này giúp làm rõ mối liên hệ giữa giới tính và hành vi hút thuốc trong phạm vi nhóm 100 người, đồng thời tối ưu hóa các chiến lược truyền thông và phòng chống tác hại của thuốc lá dựa trên dữ liệu này.
Công thức xác suất điều kiện
Tính chất 1.4 Xác suất có điều kiện có các tính chất: i 0 P.AjB/ 1 với mọi biến cố A. ii Nếu A A 0 thì P.AjB/ P.A 0 jB/. iii P.AjB/ D 1 P ANjB
Trong ví dụ 1.14, một công ty cần tuyển 4 nhân viên từ 10 ứng viên nộp đơn, trong đó có 4 nữ, với khả năng trúng tuyển như nhau cho tất cả các ứng viên Xác suất chọn được 4 ứng viên phù hợp theo các tiêu chí nhất định là câu hỏi chính của bài toán này, đề cập đến việc tính xác suất trong các quy trình tuyển dụng công bằng Các tính toán xác suất này giúp doanh nghiệp đánh giá khả năng thành công khi lựa chọn ứng viên từ các hồ sơ dự tuyển đa dạng Hiểu rõ các công thức xác suất liên quan đến tổ hợp sẽ hỗ trợ tối ưu hóa quá trình tuyển dụng và dự đoán khả năng trúng tuyển của từng nhóm ứng viên.
Trang 8 Chương 1 Biến cố, xác suất của biến cố a) Cả 4 nữ trúng tuyển. b) Có ít nhất một nữ trúng tuyển. c) Cả 4 nữ trúng tuyển, biết rằng có ít nhất một nữ đã trúng tuyển.
Sự độc lập của hai biến cố
Trong xác suất thống kê, hai biến cố A và B được coi là độc lập khi khả năng xảy ra của B không bị ảnh hưởng bởi việc A có xảy ra hay không, và ngược lại Điều này được thể hiện qua định nghĩa: B xảy ra hay không cũng không làm thay đổi khả năng xảy ra của A, đảm bảo rằng các biến cố này không có mối liên hệ phụ thuộc lẫn nhau Đặc điểm này rất quan trọng trong phân tích xác suất để xác định tính độc lập giữa các biến cố, giúp đưa ra các dự đoán chính xác hơn dựa trên các giả thiết về sự không phụ thuộc.
Tính chất 1.6 Nếu Avà B độc lập thì i P.AjB/ D P.A/ và P.BjA/ D P.B/ ii Avà BN; AN và B; AN và BN độc lập.
Ví dụ 1.15 Tung một xúc sắc 2 lần Gọi các biến cố:
A: “Lần 1 xuất hiện mặt 6 chấm”
B : “Lần 2 xuất hiện mặt 6 chấm”
Hai biến cốA và B có độc lập?
Ví dụ 1.16 Một lọ đựng 4 bi trắng và 6 bi đen, thực hiện hai lần lấy bi. Mỗi lần lấy 1 bi (lấy không hoàn lại) Đặt các biến cố:
A : “Lần 1 lấy được bi đen”
B : “Lần 2 lấy được bi trắng”
Hai biến cốA và B có độc lập?
Các công thức tính xác suất
Công thức cộng
Chú ý:Nếu Avà B xung khắc.AB D ;/thì
Trang 10 Chương 1 Biến cố, xác suất của biến cố
Ví dụ 1.17 Một lớp học có 20 học sinh trong đó có 10 học sinh giỏi toán,
8 học sinh giỏi văn và 6 học sinh giỏi cả toán và văn Chọn ngẫu nhiên một học sinh, tính xác suất học sinh này giỏi ít nhất một môn.
Công thức cộng 3 biến cố:
P.ACB CC /DP.A/CP.B/CP.C /
Chú ý: Nếu A; B; C xung khắc từng đôi một thì
Công thức nhân
Chú ý: Nếu A và B độc lập thì P.AB/D P.A/P.B/
Mở rộng công thức nhân: Cho n biến cố A 1 ; A 2 ; : : : ; A n
Chú ý: Nếu A i ; i D 1; : : : ; n độc lập toàn bộ thì
Trong bài ví dụ 1.18, một người có 4 con gà mái và 6 con gà trống trong một lồng, tổng cộng 10 con gà Hai người đến mua gà lần lượt, mỗi người mua 2 con, và người bán chọn ngẫu nhiên từ lồng Tính xác suất để người thứ nhất mua được một con gà trống và người thứ hai mua được hai con gà trống, điều này yêu cầu xác định khả năng các lựa chọn của người mua dựa trên phân phối ngẫu nhiên của gà trong lồng Các tính toán xác suất này giúp hiểu rõ hơn về xác suất trong các hoạt động mua bán có chọn lựa ngẫu nhiên, đồng thời mở rộng kiến thức về xác suất trong các tình huống thực tế.
Trong kỳ thi, mỗi sinh viên phải thi hai môn với xác suất đạt môn thứ nhất là 0,8 Nếu sinh viên đó đạt môn thứ nhất, xác suất đạt môn thứ hai là 0,6; ngược lại, nếu không đạt môn thứ nhất, xác suất đạt môn thứ hai là 0,3 Xác suất tổng thể sinh viên A đạt môn thứ hai là 0,48 Sinh viên A có khả năng đạt 0,8, 0,12, hoặc 0,06 các số lượng môn đạt được tương ứng là 2, 1, hoặc 0 Xác suất sinh viên A đạt ít nhất một môn là 0,98 Khi biết sinh viên đạt ít nhất một môn, xác suất đạt môn thứ hai của sinh viên đó là khoảng 0,49, mang lại hiểu rõ hơn về khả năng thành công trong từng môn thi.
Trang 12 Chương 1 Biến cố, xác suất của biến cố
Trong ví dụ này, ta xét xác suất xảy ra các trường hợp khác nhau của 3 con gà mái với xác suất đẻ trứng trong ngày lần lượt là 0,4; 0,7; 0,8 Bài toán đề cập đến xác suất có đúng số lượng gà đẻ trứng trong ngày, như: xác suất có i con gà đẻ trứng (0 đến 3), xác suất ít nhất một con đẻ trứng, xác suất có nhiều nhất hai con đẻ trứng, và các xác suất liên quan khi biết về hành vi đẻ trứng của gà thứ nhất dựa trên các thông tin của ngày đó Các phép tính này giúp hiểu rõ hơn về xác suất tổng thể và các trường hợp xảy ra của các con gà mái trong quá trình đẻ trứng hàng ngày.
1 con đẻ trứng. f) Con gà thứ I đẻ trứng trong ngày biết rằng trong ngày đó có nhiều nhất 2 con đẻ trứng.
Trang 14 Chương 1 Biến cố, xác suất của biến cố
Công thức xác suất đầy đủ
Hệ đầy đủ (định nghĩa 1.7) bao gồm n biến cố A₁, A₂, , Aₙ được gọi là hệ đầy đủ khi các biến cố này xung khắc từng đôi một và có ít nhất một biến cố xảy ra trong mỗi phép thử, đảm bảo tính bao gồm tất cả các khả năng xảy ra trong không gian mẫu của thử nghiệm xác suất.
Ví dụ 1.21 Từ một lọ có 4 bi trắng và 6 bi đen lấy ra 2 bi.
Khi đó A 0 IA 1 IA 2 là hệ đầy đủ.
Công thức xác suất đầy đủ: Cho A 1 IA 2 I: : :IA n (P.A i / > 0 ) là hệ đầy đủ các biến cố vàB là một biến cố bất kỳ Xác suất xảy ra biến cố B
P.B/ D P.A 1 /P.BjA 1 /CP.A 2 /P.BjA 2 /C CP.A n /P.BjA n /
Trong ví dụ 1.22, một đám đông có số đàn ông bằng nửa số đàn bà, với xác suất mắc bệnh tim lần lượt là 0,06 và 0,036 Để tính xác suất chọn ngẫu nhiên một người trong đám đông bị bệnh tim, cần xác định tỷ lệ phần trăm của đàn ông và đàn bà trong tổng thể Sau đó, áp dụng công thức xác suất tổng hợp dựa trên tỷ lệ phân bố giữa hai nhóm và xác suất mắc bệnh của từng nhóm Kết quả cho thấy xác suất để người được chọn bị bệnh tim là một phép tính kết hợp giữa xác suất chọn đàn ông hoặc đàn bà, được chuẩn hóa bởi tỷ lệ phần trăm của từng nhóm trong đám đông.
Công thức xác suất Bayes
Gải thiết giống công thức xác suất đầy đủ Xác suất:
Trong lớp học, số học sinh nam gấp 3 lần số học sinh nữ, với tỷ lệ học sinh nữ giỏi toán là 30% và tỷ lệ học sinh nam giỏi toán là 40% Xác suất một học sinh bất kỳ trong lớp giỏi toán được tính dựa trên tỷ lệ này, trong đó phần trăm học sinh nữ giỏi toán chiếm phần lớn khi so sánh với tổng số học sinh giỏi Khi chọn ngẫu nhiên một học sinh, xác suất học sinh này giỏi toán là tổng xác suất của cả nam và nữ giỏi toán Ngoài ra, nếu biết học sinh đó là nam, xác suất học sinh đó giỏi toán sẽ tăng lên dựa trên tỷ lệ học sinh nam giỏi toán trong lớp.
Trang 16 Chương 1 Biến cố, xác suất của biến cố
Trong ví dụ này, chúng ta có hai chuồng gà với số lượng trống và mái khác nhau: Chuồng I có 10 trống và 8 mái, trong khi Chuồng II có 12 trống và 10 mái Hai con gà di chuyển từ chuồng I sang chuồng II, sau đó có hai con gà rời khỏi chuồng II Các câu hỏi hướng tới xác suất của các tình huống cụ thể, như xác suất hai con gà chuyển từ chuồng I sang là trống hoặc mái, hoặc xác suất hai con gà rời khỏi chuồng II đều là trống, cùng với xác suất của một tình huống có điều kiện Các phép tính xác suất này giúp chúng ta hiểu rõ hơn về khả năng các biến cố xảy ra dựa trên phân phối ban đầu của các con gà trong mỗi chuồng.
Bài tập chương 1
Bài tập 1.1 Một nhóm khảo sát sở thích tiết lộ thông tin là trong năm qua:
45% người xem Tivi thích xem phim tình cảm Hàn quốc.
25% người xem Tivi thích xem phim hành động Mỹ.
10% thích xem cả hai thể loại trên.
Tính tỷ lệ nhóm người thích xem ít nhất một trong hai thể loại trên.
Trong bài tập này, có ba lô hàng mỗi lô chứa 20 sản phẩm, trong đó số sản phẩm loại A lần lượt là 12, 14 và 16 trong các lô I, II, III Bên mua ngẫu nhiên chọn 3 sản phẩm từ mỗi lô; nếu cả 3 sản phẩm đều là loại A trong một lô, bên mua sẽ chọn mua lô đó Xác suất lô thứ nhất được mua lần lượt là 0,193, lô thứ hai là 0,3193, và lô thứ ba là 0,4912 Xác suất có số lô được mua là 0,2795 khi không mua lô nào, 0,4678 khi mua 1 lô, 0,2225 khi mua 2 lô, và 0,0303 khi mua cả ba lô Xác suất có tối đa hai lô được mua là 0,9697, trong khi xác suất có ít nhất một lô được mua là 0,7205 Giả sử có ít nhất một lô được mua, xác suất lô II được mua là 0,4432, còn xác suất cả hai lô I và II đều được mua là 0,0855.
Trang 18 Chương 1 Biến cố, xác suất của biến cố g Giả sử có một lô được mua Tính xác suất lô II được mua (0,2803)
Trong bài tập này, ta có một hộp bóng bàn gồm 15 bóng mới và 8 bóng cũ Ở lần lấy bóng thứ nhất, xác suất lấy được số bóng cũ là 0,4150 khi lấy 2 bóng, 0,4743 khi lấy 1 bóng cũ và 0,1107 khi lấy 2 bóng cũ Ở lần thứ hai, xác suất lấy đúng 3 bóng mới là 0,1929 Ngoài ra, xác suất để lần thứ nhất lấy 1 bóng cũ và lần thứ hai lấy đúng 3 bóng mới là 0,0975 Cuối cùng, khi biết rằng lần thứ hai lấy được 3 bóng mới, xác suất lần thứ nhất lấy được 1 bóng cũ là một phần trong tính toán xác suất có ý nghĩa trong quá trình phân tích xác suất trong các bài toán liên quan đến lấy bóng từ hộp.
Trang 20 Chương 1 Biến cố, xác suất của biến cố
Trong bài tập này, dữ liệu về các bình đựng bi cho phép tính xác suất các trường hợp khác nhau Cụ thể, bình I chứa 4 bi trắng và 6 bi đen; bình II có 7 bi trắng và 3 bi đen; bình III gồm 6 bi trắng và 8 bi đen Quá trình lấy bi từ các bình và chuyển sang bình III được thực hiện theo các bước nhất định, sau đó tính xác suất các biến cố xảy ra Ví dụ, xác suất lấy ra từ bình I và II các bi trắng với số lượng khác nhau đã được tính toán có các giá trị là 0,18; 0,54; 0,28 Ngoài ra, xác suất ba bi lấy từ bình III gồm hai bi trắng là 0,3424 Cuối cùng, với giả định ba bi lấy từ bình III gồm hai bi trắng, xác suất hai bi lấy từ bình I và II là hai bi đen là 0,1408 Các tính toán này giúp hiểu rõ hơn về xác suất các biến cố xảy ra dựa trên các số liệu ban đầu của các bình bi.
Trong bài tập 1.5, chúng ta phân tích xác suất lấy được lọ thuốc A hết hạn từ một thùng kín chứa hai loại thuốc Thùng chứa số lượng lọ thuốc loại A bằng hai phần ba so với loại B, với tỉ lệ lọ thuốc A và B đã hết hạn lần lượt là 10% và 8%, giúp xác định khả năng lọ thuốc A đã hết hạn khi lấy ngẫu nhiên Ngoài ra, chúng ta còn tính xác suất tổng thể của việc lấy được lọ thuốc đã hết hạn sử dụng từ thùng, đạt 8,8%, dựa trên tỷ lệ hết hạn của từng loại thuốc Cuối cùng, trong trường hợp lọ thuốc còn hạn dùng được chọn ra, xác suất đó là lọ thuốc B khoảng 60,53%, giúp người dùng dự đoán chính xác hơn khi kiểm tra thuốc trong quá trình sử dụng.
Trong bài tập này, một người bắn ba phát đạn vào mục tiêu một cách độc lập với xác suất lần lượt là 0,55, 0,6 và 0,7 Xác suất mục tiêu bị hạ khi trúng 1, 2 hoặc 3 phát lần lượt là 0,2, 0,4 và 0,8 Công thức tính xác suất mục tiêu bị hạ dựa trên các xác suất bắn trúng từng phát và số lần trúng, giúp xác định khả năng tiêu diệt mục tiêu trong từng trường hợp khác nhau Việc tính toán này giúp nâng cao kỹ năng dự đoán xác suất và phân tích rủi ro trong các bài tập xác suất và thống kê.
1 Sinh viên hệ cao đẳng không phải làm các câu c, e, f.
Trong chương 1, chúng tôi trình bày về các biến cố và xác suất liên quan đến việc bắn trúng mục tiêu Xác suất để có chính xác i phát trúng mục tiêu (với i = 0, 1, 2, 3) lần lượt là 0,054; 0,273; 0,442; và 0,231 Xác suất để có tối đa hai phát trúng mục tiêu là 0,769 Xác suất mục tiêu bị hạ là 0,4162 Khi biết có hai phát trúng mục tiêu, xác suất phát thứ nhất trúng mục tiêu là 0,5724 Cuối cùng, nếu mục tiêu đã bị hạ, xác suất phát thứ nhất trúng mục tiêu là một thông số quan trọng trong phân tích xác suất.
(0,7189) f Biết rằng có nhiều nhất 2 phát trúng mục tiêu, tính xác suất mục tiêu bị hạ (0,3009)
Bài tập 1.7 Nhà máy có hai phân xưởng, sản lượng của phân xưởng I gấp 3 lần sản lượng của phân xưởng II Tỉ lệ phế phẩm của phân xưởng
I, II lần lượt là 7% và 12% Chọn ngẫu nhiên một sản phẩm của nhà máy, tính: a Xác suất chọn được sản phẩm tốt do phân xưởng I sản xuất.
(0,6975) b Xác suất chọn được phế phẩm (0,0825) c Giả sử chọn được sản phẩm tốt, tính xác suất sản phẩm này do phân xưởng I sản xuất (0,7602)
Trang 24 Chương 1 Biến cố, xác suất của biến cố
Trong bài tập này, một người buôn bán bất động sản đưa ra dự đoán về khả năng bán được một mảnh đất lớn dựa trên tình hình kinh tế Ông tin rằng, nếu nền kinh tế tiếp tục phát triển, xác suất bán được đất là 80%, trong khi nếu nền kinh tế ngừng phát triển, xác suất này giảm xuống còn 40% Theo dự báo của chuyên gia kinh tế, xác suất nền kinh tế tiếp tục tăng trưởng là 65% Do đó, xác suất bán được mảnh đất của người buôn bán là khoảng 66%, dựa trên tính toán xác suất tổng thể.
Bài tập 1.9 2 Có hai hộp đựng bi: hộp I có 5 bi trắng và 7 bi đen; hộp
II có 6 bi trắng và 4 bi đen Lấy 1 bi từ hộp I bỏ sang hộp II, rồi từ hộp
Trong bài viết này, chúng ta phân tích các xác suất liên quan đến việc lấy bi trắng từ hai hộp khác nhau Đầu tiên, xác suất lấy ra một bi trắng từ hộp II là 7/12 Tiếp theo, nếu biết rằng bi lấy từ hộp II là bi trắng, thì xác suất bi này đến từ hộp I cũng là bi trắng là 5/11 Cuối cùng, chúng ta xem xét xác suất bi này thuộc về hộp nào, dựa trên giả thiết bi lấy ra từ hộp II là bi trắng, nhằm xác định khả năng bi này xuất phát từ hộp nào một cách chính xác hơn.
I 12 5 11 1 = 12 7 d Giả sử bi lấy ra từ hộp II là bi trắng, tính xác suất bi này của hộp
2 Sinh viên hệ cao đẳng không phải làm các câu c, d.
Khái niệm biến ngẫu nhiên
2.2 Phân phối xác suất của biến ngẫu nhiên 27
2.3 Các đặc trưng số của biến ngẫu nhiên 35 2.4 Bài tập chương 2 40
2.1 Khái niệm biến ngẫu nhiên
- Xét một phép thử có không gian các biến cố sơ cấp Đặt
X được gọi là biến ngẫu nhiên, x gọi là giá trị của biến ngẫu nhiên X. f X 2 I g
Ví dụ 2.1 Thực hiện phép thử gieo đồng thời 2 đồng xu cân đối, chúng ta có không gian các biến cố sơ cấp
D fN 1 N 2 IN 1 S 2 IS 1 N 2 IS 1 S 2 g Đặt X.!/ là số đồng xu sấp khi kết quả phép thử là! Ta có:
Khi đó ta gọi X là biến ngẫu nhiên số đồng xu sấp khi tung 2 đồng xu.
- Có hai loại biến ngẫu nhiên:
Biến ngẫu nhiên rời rạc là biến ngẫu nhiên mà giá trị có thể của nó là một tập hữu hạn hoặc vô hạn đếm được.
Biến ngẫu nhiên liên tục là biến ngẫu nhiên mà giá trị có thể của nó lấp đầy một khoảng trên trục số.
Số chấm trên mặt xuất hiện khi tung một xúc sắc là biến ngẫu nhiên rời rạc (giá trị của X là tập hữu hạn).
Số cuộc gọi đến tổng đài điện thoại trong 1 giờ là biến ngẫu nhiên rời rạc (giá trị của X là tập vô hạn đếm được).
Thời gian hoàn thành 1 sản phẩn của một công nhân là biến ngẫu nhiên liên tục.
Phân phối xác suất của biến ngẫu nhiên
X là biến ngẫu nhiên rời rạc
Để mô tả phân phối xác suất của biến ngẫu nhiên rời rạc người ta sử dụng bảng phân phối xác suất:
Dòng 1 liệt kê giá trị có thể của X. f x i / DP.X D x i / ; i D 1; 2; : : : gọi là xác suất X nhận giá trị x i : Nếux 0 … fx 1 ; : : : ; x n ; : : :g thì f x 0 / D 0:
Trang 28 Chương 2 Biến ngẫu nhiên
Ví dụ 2.3 Thực hiện phép thử tung một xúc sắc Gọi X là số chấm trên mặt xuất hiện của xúc sắc X có bảng phân phối như sau:
Nhận xét: f x1/Cf x2/C Cf xn/C D 1:
Ví dụ 2.4 Cho biến ngẫu nhiên rời rạc X có bảng phân phối xác suất cho như sau:
P a 2a 3a 4a a Xác địnha. b Xác địnhP.X D 2/ : c Xác địnhP 1 < X < 4/ :
Ví dụ 2.5 mô tả tình huống một xạ thủ có 4 viên đạn, bắn lần lượt vào mục tiêu với xác suất trúng là 0,7 mỗi lần bắn Quá trình dừng lại khi viên đạn trúng mục tiêu hoặc hết đạn, tùy theo điều kiện nào xảy ra trước X là biến số thể hiện số viên đạn đã được bắn, và bài viết trình bày bảng phân phối xác suất của X để phân tích khả năng chiến thắng trong từng lần bắn.
Ví dụ 2.6 mô tả một xạ thủ với 6 viên đạn, thực hiện bắn độc lập từng viên vào mục tiêu, với xác suất trúng mục tiêu ở mỗi lần bắn là 0,7 Quá trình bắn sẽ dừng lại khi có đúng 3 viên trúng mục tiêu hoặc đạn đã hết Biểu đồ phân phối xác suất của biến ngẫu nhiên X – số viên đạn đã bắn – giúp xác định khả năng xảy ra của từng số lần bắn trong quá trình này, cung cấp thông tin quan trọng để phân tích hiệu quả của quá trình bắn súng trong các tình huống thực tế.
Ví dụ 2.7 Một lọ có 3 bi trắng và 7 bi đen Từ lọ này lấy ra ngẫu nhiên
4 bi Gọi X là số bi đen lẫn trong 4 bi lấy ra, lập bảng phân phối xác
Trang 30 Chương 2 Biến ngẫu nhiên suất của X:
X là biến ngẫu nhiên liên tục
Định nghĩa 2.1 (Hàm mật độ) Hàm số f x/ 0;8x 2 R được gọi là hàm mật độ của biến ngẫu nhiên liên tục X nếu
Nhận xét Với định nghĩa hàm mật độ ta có i Nếu X là biến ngẫu nhiên liên tục thì xác suất X thuộc một tập
A Rđược tính bằng tích phân của hàm mật độf x/ trên tập A: ii Mọi hàm mật độ phải thỏa hai điều kiệnf x/ 0và C1 R
Ví dụ 2.8 Cho hàm số f x/ D
0 nơi khác a Chứng tỏf x/ là hàm mật độ của biến ngẫu nhiênX: b Tính xác suất P.1 X 3=2/ : c Tính xác suất P.1 X 3/ :
Hàm phân phối xác suất
Định nghĩa 2.2 (Hàm phân phối xác suất) Hàm phân phối xác suất của biến ngẫu nhiênX, ký hiệu F x/
Trang 32 Chương 2 Biến ngẫu nhiên
NếuX là biến ngẫu nhiên rời rạc thì
NếuX là biến ngẫu nhiên liên tục có hàm mật độf x/ thì
Ví dụ 2.9 Cho biến ngẫu nhiênX có bảng phân phối như sau:
P 0; 2 0; 5 0; 3 a Tìm hàm phân phốiF x/ của X: b Vẽ đồ thị củaF x/:
Ví dụ 2.10 Cho biến ngẫu nhiên liên tục X có hàm mật độ f x/ D kx 3 khi0 x 1
0 nơi khác a Xác địnhk: b Tìm hàm phân phối xác suấtF x/: c Vẽ đồ thị hàm phân phốiF x/:
Trang 34 Chương 2 Biến ngẫu nhiên
Hàm phân phối xác suất F(x) có các tính chất quan trọng như sau: nó luôn nằm trong khoảng từ 0 đến 1, với F(−∞) = 0 và F(+∞) = 1 Hàm này là hàm không giảm, nghĩa là nếu x₁ < x₂ thì F(x₁) ≤ F(x₂) Ngoài ra, xác suất P(a ≤ X ≤ b) bằng hiệu của hai giá trị của hàm phân phối tại b và a, tức là F(b) - F(a) Đối với biến ngẫu nhiên liên tục có hàm mật độ f(x), hàm phân phối F(x) có thể được tính bằng tích phân của hàm mật độ trên khoảng từ −∞ đến x.
Ví dụ 2.11 Một phân xưởng có 2 máy hoạt động độc lập Xác suất trong
Trong một ngày làm việc, xác suất mỗi máy bị hỏng lần lượt là 0,3 và 0,4, tương ứng với hai loại máy khác nhau Gọi X là số máy hỏng trong một ngày làm việc, và bài toán yêu cầu lập bảng phân phối xác suất của biến ngẫu nhiên X để hiểu rõ khả năng xảy ra của từng số máy hỏng Để giải quyết, cần xác định hàm phân phối xác suất của X, giúp dự đoán các khả năng và tối ưu hóa quá trình bảo trì, nâng cao hiệu quả hoạt động của các thiết bị trong môi trường sản xuất.
Các đặc trưng số của biến ngẫu nhiên
Kỳ vọng - E X
Định nghĩa 2.4 (Kỳ vọng) Kỳ vọng của biến ngẫu nhiên X, ký hiệu
X là biến ngẫu nhiên rời rạc có bảng phân phối xác suất
X là biến ngẫu nhiên liên tục có hàm mật độ f x/
Anh A nuôi 5 con lợn có cân nặng lần lượt là 55 kg, 55 kg, 60 kg, 70 kg và 70 kg Để phân tích, ta chọn ngẫu nhiên một con lợn và gọi X là cân nặng của con đó Đầu tiên, ta lập bảng phân phối xác suất của X dựa trên tần suất xuất hiện của từng mức cân, sau đó tính kỳ vọng của X để đánh giá trung bình cân nặng Tiếp theo, ta xây dựng bảng phân phối xác suất của X^2 nhằm phân tích các biến đổi, và cuối cùng tính kỳ vọng của X^2 để hiểu rõ hơn về phân phối của bình phương cân nặng các con lợn.
Trang 36 Chương 2 Biến ngẫu nhiên
Giải Ý nghĩa của kỳ vọng: Kỳ vọng của X là trung bình các giá trị của
Tính chất 2.5 về kỳ vọng bao gồm các đặc điểm quan trọng như sau: Ec có giá trị bằng một hằng số c, chứng tỏ kỳ vọng của biến ngẫu nhiên nhân với hằng số giữ nguyên tỷ lệ Ngoài ra, kỳ vọng của tích kỳ vọng là bằng tích của các kỳ vọng (E[cX] = cE[X]), và kỳ vọng của tích hai biến ngẫu nhiên X và Y bằng tích của từng kỳ vọng khi X và Y độc lập (E[XY] = E[X]E[Y]) Khi Y là hàm của biến ngẫu nhiên X, kỳ vọng của Y có thể được tính dựa trên giá trị kỳ vọng của hàm h(X), giúp mở rộng khả năng phân tích các biến ngẫu nhiên phức tạp.
Khi X là biến ngẫu nhiên rời rạc
EY D Eh.X / D h.x 1 /f x 1 /C Ch.x n /f x n /C Khi X là biến ngẫu nhiên liên tục có hàm mật độ f x/ thì
Ví dụ 2.13 Thời gian học rành nghề sửa ti vi của một người là một biến ngẫu nhiên - X (năm) có hàm mật độ. f x/ D
0 khix … 0I2/ a Tính thời gian trung bình một người học rành nghề sửa tivi. b TínhE.2X C3/: c TínhE.X 2 /:
Phương sai - V arX
Định nghĩa 2.6 (Phương sai) Phương sai của biến ngẫu nhiên X, ký hiệu VarX
Ví dụ 2.14 Anh A nuôi 5 con lợn có cân nặng (kg) 55, 55, 60, 70, 70. Chọn ngẫu nhiên một con và mang cân, gọiX là cân nặng Tính phương sai của X.
Trang 38 Chương 2 Biến ngẫu nhiên Ý nghĩa phương sai: Phương sai là trung bình của bình phương sai khác giữa các giá trị của X so với trung bình của nó Do đó phương sai dùng để đo độ phân tán các giá trị của X so với trung bình của nó. Nghĩa là phương sai lớn thì độ phân tán lớn và ngược lại.
Do đơn vị của phương sai bằng bình phương đơn vị củaX Để có cùng đơn vị, ta định nghĩa độ lệch chuẩn
Ví dụ 2.15 Giả thiết giống ví dụ 2.13 Thời gian học rành nghề sửa ti vi của một người là một biến ngẫu nhiên - X (năm) có hàm mật độ. f x/ D
Tính chất 2.7 Phương sai có các tính chất: i Var.c/ D 0; c là hằng số. ii Var.cX / Dc 2 VarX: iii Var.X CY / D VarX CVarY; nếu X và Y độc lập.
ModX
Định nghĩa 2.8 Mod của biến ngẫu nhiên S, ký hiệu ModX
X là biến ngẫu nhiên rời rạc
X là biến ngẫu nhiên liên tục có hàm mật độ f x/
Ví dụ 2.16 Cho biến ngẫu nhiênX có bảng phân phối xác suất cho như sau:
Ví dụ 2.17 Cho biến ngẫu nhiên liên tục X có hàm mật độ f x/ D
Trang 40 Chương 2 Biến ngẫu nhiên
Bài tập chương 2
Bài tập 2.1 Cho biến ngẫu nhiên rời rạcX có bảng phân phối xác suất
P 0; 3 0; 2 0; 2 0; 2 0; 1 a Giá trị của tham sốa để EX D 0; 3: (-0,2) b Tìm hàm phân phối xác suất củaX:
Bài tập 2.2 Theo thống kê, một người Mỹ 25 tuổi sẽ sống thêm trên
Trong vòng một năm, xác suất người đó sống là 0,992 và xác suất tử vong là 0,008 Công ty bảo hiểm A đề nghị bán bảo hiểm nhân thọ trị giá 10.000 USD với phí bảo hiểm là 100 USD Trung bình, công ty A dự kiến lãi bao nhiêu từ hợp đồng này dựa trên xác suất sống và tử vong của người đó Các tính toán cho thấy, lợi nhuận trung bình của công ty A sẽ là 92 USD mỗi hợp đồng bán ra Đây là một ví dụ điển hình về cách bảo hiểm nhân thọ hoạt động dựa trên xác suất và rủi ro, giúp các công ty định lượng lợi nhuận kỳ vọng từ các hợp đồng bảo hiểm.
Bài tập 2.3 Người thợ chép tranh mỗi tuần chép hai bức tranh độc lập
A và B với xác suất hỏng tương ứng là 0,03 và 0,05 Biết rằng nếu thành
Người thợ có thể kiếm lời trung bình từ việc chép tranh mỗi tuần là 2,062 triệu đồng Cụ thể, lợi nhuận kỳ vọng từ bức tranh A là 1,3 triệu đồng, trong khi nếu hỏng, anh ta chịu lỗ 0,8 triệu đồng Tương tự, đối với bức tranh B, lợi nhuận là 0,9 triệu đồng và lỗ 0,6 triệu đồng khi hỏng Tính toán này dựa trên xác suất thành công và thất bại của người thợ để xác định mức thu nhập trung bình hàng tuần.
Bài tập 2.4 Nhu cầu hằng ngày của 1 khu phố về 1 loại thực phẩm tươi sống có bảng phân phối xác suất
Cửa hàng nhập khẩu mỗi ngày 34 kg thực phẩm với giá 25.000 đồng/kg, sau đó bán ra với giá 40.000 đồng/kg, mang lại lợi nhuận trước khi giảm giá Trong trường hợp hàng tồn kho, cửa hàng buộc phải hạ giá xuống còn 15.000 đồng/kg để bán hết, gây ảnh hưởng đến lợi nhuận Tính toán lợi nhuận trung bình hàng ngày cho loại thực phẩm này cho thấy trung bình cửa hàng lời khoảng 475.000 đồng mỗi ngày.
Bài tập 2.5 Tuổi thọ (X-tuổi) của người dân ở một địa phương là biến ngẫu nhiên có hàm phân phối cho như sau
1 e x khi 0 < x với D 0; 013 Tính: a Tỷ lệ người dân thọ từ 60 đến 70 tuổi (0,0559) b Xác định hàm mật độ củaX: c Tính tuổi thọ trung bình và VarX: 1=I1= 2
Trang 44 Chương 2 Biến ngẫu nhiên
Bài tập 2.6 Tuổi thọ (X-tháng) của một bộ phận của một dây chuyền sản xuất là biến ngẫu nhiên liên tục có hàm mật độ: f x/ D
0 khix ….0I40/ a Xác suất tuổi thọ của bộ phận này nhỏ hơn 6 tháng.(0,4688) b Tuổi thọ trung bình của dây chuyền này (10,118 tháng) c Tìm hàm phân phối xác suất củaX:
Bài tập 2.7 Tuổi thọ của một loại côn trùng nào đó là một đại lượng ngẫu nhiên liên tục X (đơn vị tháng) có hàm mật độ f x/ D kx 2 4 x/ khi 0 x 4
0 nơi khác a Tìm hằng số k (3/64) b TìmF x/. c TìmE.X /,Var X / và Mod.X / (12/5; 16/25; 8/3) d Tính xác suất để côn trùng chết trước một tháng tuổi.(13/256)
Trang 46 Chương 2 Biến ngẫu nhiên
Bài tập 2.8 X là biến ngẫu nhiên có hàm mật độ f x/ D kx 2 0 < x < 1
0 nơi khác a Tìm k để hàm f x/ là hàm mật độ khi đó tìm kỳ vọng và phương sai của X: (3; 3/4; 3/80) b TínhP.1=2 < X < 3=2/ ;P.X 1=2/ : (7/8) c Biết Y D X 3 ; tìm P.1d < Y < 1=8/ : (7/64)
Bài tập 2.9 Cho hàm số f x/ D kx.2 x/ khi 1 < x < 2
0 nơi khác a Xác định giá trị của k để f x/ là hàm mật độ của biến ngẫu nhiên
X Với k vừa tìm được tính kỳ vọng và phương sai của biến ngẫu nhiênX (3/2; 11/8; 19/320) b Tìm hàm phân phối F x/ của biến ngẫu nhiên X. c Tính xác suất P.Y > 2X / vớiY D X 3 : 2 p
Trang 48 Chương 2 Biến ngẫu nhiên
Một số phân phối xác suất thông dụng
Phân phối Bernoulli
3.5 Phân phối chuẩn 56 3.6 Bài tập chương 3 60
Trong phép thử này, chúng ta tập trung vào hai biến cố A và N với xác suất P(A) = p Loại phép thử này còn gọi là phép thử Bernoulli, chuyên dùng để mô tả các tình huống có hai kết quả đối lập như thành công hoặc thất bại Biến ngẫu nhiên trong phép thử Bernoulli thể hiện khả năng xảy ra của một biến cố duy nhất, giúp phân tích xác suất một cách chính xác và rõ ràng hơn Đây là công cụ quan trọng trong thống kê và xác suất học để nghiên cứu các biến cố rắn rõ ràng, góp phần vào việc xây dựng các mô hình dự đoán hiệu quả.
Biến ngẫu nhiên X gọi là có phân phối nhị thức tham số p, ký hiệu
X B.p/: Ta có bảng phân phối xác suất củaX B.p/
Tính chất 3.1 Các đặc trưng của X B.p/ i EX D p:
Trang 50 Chương 3 Một số phân phối xác suất thông dụng ii VarX D pq:
Ví dụ 3.1 Trả lời ngẫu nhiên một câu hỏi trắc nghiệm có 4 đáp án, trong đó chỉ có một đáp án đúng Gọi biến ngẫu nhiên:
Phân phối nhị thức
Xét dãy n phép thử Bernoulli độc lập và cùng phân phối,
Trong bài viết này, chúng ta đề cập đến phân phối Bernoulli, trong đó biến ngẫu nhiên X biểu thị số lần xảy ra của sự kiện A trong n lần thử Biến X được định nghĩa là tổng số lần A xảy ra, còn được gọi là số lần thành công trong n phép thử Phân phối Bernoulli tham số p thể hiện xác suất xảy ra của sự kiện A trong mỗi lần thử độc lập Ký hiệu X ~ Binomial(n, p) mô tả rõ ràng mối liên hệ giữa số lần thành công và các tham số của phân phối.
Trong ví dụ 3.2, một xạ thủ bắn 3 phát đạn vào mục tiêu từ độc lập, với xác suất trúng mục tiêu mỗi lần là 0,7 Các biến ngẫu nhiên liên quan giúp mô tả khả năng trúng mục tiêu trong các lần bắn này, cung cấp những phân tích chính xác về xác suất thành công của xạ thủ Việc nắm rõ xác suất trúng mục tiêu giúp nâng cao hiệu quả dự đoán và đánh giá hiệu suất của xạ thủ trong các tình huống thực tế.
0 Lần i bắn không trúng MTI ; i D 1; 2; 3
X D X 1 C X 2 CX 3 ; X B.3I0; 7/: X là số phát trúng mục tiêu trong 3 phát, giá trị có thế củaX là0; 1; 2: Xác suất có 2 phát trúng mục tiêu:
0; 7:0; 7:0; 3 D 0; 7/ 2 :0; 3 Phát 1,2 trúng MT 0; 7:0; 3:0; 7 D 0; 7/ 2 :0; 3 Phát 1,3 trúng MT 0; 3:0; 7:0; 7 D 0; 7/ 2 :0; 3 Phát 2,3 trúng MT
Công thức tính xác suất của X B.nIp/
Xác suất trong n lầ thực hiện phép thử Bernoulli có k lần A xảy ra
Tính chất 3.2 Các đặc trưng của X B.nIp/ i EX D np: ii VarX D npq: iii np q ModX np q C1:
Ví dụ 3.3 trình bày về một đề thi gồm 10 câu hỏi, mỗi câu có 4 lựa chọn trong đó chỉ có một đáp án đúng, và sinh viên A trả lời ngẫu nhiên tất cả các câu Phân phối xác suất của số câu trả lời đúng của sinh viên A (X) được xác định dựa trên phân phối nhị thức với tham số là 10 và xác suất thành công 0,25 cho mỗi câu Xác suất sinh viên A trả lời đúng từ 2 đến 3 câu được tính bằng cách cộng xác suất tương ứng của các giá trị X = 2 và X = 3 Ngoài ra, xác suất sinh viên A trả lời đúng ít nhất một câu được tính là 1 trừ đi xác suất trả lời sai toàn bộ 10 câu Số câu trung bình sinh viên A dự kiến trả lời đúng và phương sai của X được xác định từ kỳ vọng và phương sai của phân phối nhị thức Số câu có khả năng trả lời đúng cao nhất chính là giá trị X = 3, phù hợp với giá trị trung bình gần nhất Cuối cùng, đề thi cần ít nhất bao nhiêu câu để xác suất sinh viên A trả lời đúng ít nhất một câu đạt mức 0,99, điều này giúp xác định số câu tối thiểu cần có trong đề thi để đạt được mục tiêu xác suất mong muốn theo quy luật xác suất.
Trang 52 Chương 3 Một số phân phối xác suất thông dụng
Phân phối siêu bội
Ví dụ 3.4 mô tả về việc lấy 4 bi từ một lọ chứa 3 bi trắng và 7 bi đen, và xác suất của số bi đen trong số đó được xác định bằng biến ngẫu nhiên X Để phân tích, ta lập bảng phân phối xác suất của X, trong đó X có thể từ 0 đến 4, tương ứng với số bi đen lấy ra trong 4 bi Bảng này cho phép tính xác suất từng trường hợp dựa trên phép tính tổ hợp, giúp người đọc hiểu rõ hơn về phân phối xác suất của biến ngẫu nhiên trong bài toán lựa chọn ngẫu nhiên này Bằng cách này, ta có thể dễ dàng tính xác suất của từng số bi đen trong lần lấy bi, hỗ trợ phân tích thống kê và dự đoán trong các bài toán xác suất.
Lấy ra 4 bi có k bi đen!
Mô hình siêu bội: Từ một tập có N phần tử gồm:
N N A phần tử khác phần tử A:
Từ tập N lấy ra n phần tử Gọi X là số phần tử A lẫn trong n phần tử lấy ra, X gọi là có phân phối siêu bội tham số N; N A ; n, ký hiệu X H.N; N A ; n/
Lấy ra n PT được kP T A! k Phần tử A n k Phần tử AN
Công thức tính xác suất cho X H.N; N A ; n/
Xác suất trong n phần tử lấy ra từ tập N có k phần tử AW
Tính chất 3.3 Các đặc trưng của X H.N; N A ; n/ i EX D npI p D N A N
Trong ví dụ 3.5, có 20 chi tiết máy, trong đó 15 chi tiết tốt và 5 chi tiết không tốt Khi lấy ngẫu nhiên 4 chi tiết máy từ tập này, biến X đại diện cho số chi tiết tốt trong số đó Phân phối xác suất của X có thể được xác định dựa trên phân phối Hypergeometric, phù hợp với trường hợp lấy mẫu không hoàn lại Xác suất để lấy được chính xác 3 chi tiết tốt trong 4 chi tiết đã chọn có thể tính bằng công thức xác suất Hypergeometric Trung bình số chi tiết tốt lấy được (hy vọng) và phương sai của biến X có thể được tính dựa trên các công thức phân phối Hypergeometric, giúp đánh giá chính xác khả năng và phân bố của số chi tiết tốt trong quá trình lấy mẫu ngẫu nhiên.
Trang 54 Chương 3 Một số phân phối xác suất thông dụng
Phân phối Poisson
Trong bài viết này, chúng ta bắt đầu bằng việc phân tích mô hình số cuộc gọi đến tổng đài điện thoại, tập trung vào các cuộc gọi đến tại các thời điểm ngẫu nhiên T₁, T₂, , trong khoảng thời gian từ 0 đến It Có hai giả định chính về các cuộc gọi đến: đầu tiên, các cuộc gọi đến diễn ra độc lập và theo phân phối Poisson, giúp mô hình hóa sự ngẫu nhiên của các cuộc gọi trong thời gian Thứ hai, tần suất các cuộc gọi trung bình mỗi đơn vị thời gian được xác định rõ ràng, tạo điều kiện để phân tích thống kê và dự báo lưu lượng cuộc gọi một cách chính xác Việc hiểu rõ về mô hình này giúp tối ưu hóa quản lý tổng đài, nâng cao hiệu quả phục vụ khách hàng và cải thiện trải nghiệm người dùng.
Tính đồng nhất của hệ thống tổng đài được thể hiện qua số cuộc gọi trung bình đến tổng đài trong một khoảng thời gian t Trung bình số cuộc gọi đến tổng đài trong bất kỳ khoảng thời gian nào tỷ lệ thuận với độ dài của khoảng thời gian đó, giúp đánh giá chính xác hiệu suất hoạt động và khả năng phục vụ khách hàng của tổng đài Đây là yếu tố quan trọng để tối ưu hóa nguồn lực và nâng cao trải nghiệm khách hàng trong dịch vụ gọi điện.
Tính độc lập Số cuộc gọi đến trong các khoảng thời gian phân biệt là các biến ngẫu nhiên độc lập nhau.
Trong quá trình phân chia khoảng thời gian Œ0It thành n phần nhỏ, với n đủ lớn, mỗi phần có độ dài t = 1/n, ta đảm bảo rằng mỗi khoảng thời gian nhỏ này chỉ chứa tối đa một cuộc gọi đến Việc phân chia này giúp mô phỏng chính xác hơn các sự kiện xảy ra trong khoảng thời gian, đồng thời tối ưu hóa quá trình phân tích dữ liệu Biến ngẫu nhiên được sử dụng để biểu diễn số lượng cuộc gọi trong mỗi khoảng thời gian nhỏ, qua đó giúp đánh giá xác suất và hành vi của hệ thống một cách chính xác hơn.
(1 Có cuộc gọi đến trong khoảng i 1/t =nIi t =n
Trong khoảng thời gian không có cuộc gọi đến, ta giả định rằng các lần gọi đến là độc lập và đồng nhất Xác suất để không có cuộc gọi trong khoảng thời gian này là dựa trên độ dài của khoảng chia, được tính bằng p = D / n, trong đó D là độ dài của khoảng thời gian và n là số phần chia Theo giả định tính độc lập, số cuộc gọi đến trong khoảng thời gian t tuân theo phân phối xác suất phù hợp, đảm bảo tính chính xác của mô hình thống kê trong phân tích tổng số cuộc gọi.
Chuyển qua giới hạn khi n ! C1 ta được n !C1lim
D e kŠ Định nghĩa 3.4 (Phân phối Poisson) Biến ngẫu nhiên X được gọi là có phân phối Poisson tham số (ký hiệu X P / nếu biến ngẫu nhiên X nhận giá trị k D 0; 1; : : : với
Tính chất 3.5 Các đặc trưng của X P / i EX D : ii VarX D : iii 1 ModX :
Trong bài tập ví dụ 3.6, chúng ta xem xét một siêu thị nơi trung bình cứ 5 phút có 10 khách đến quầy tính tiền, ứng dụng phân phối Poisson để tính xác suất Đầu tiên, xác suất để trong 1 phút có đúng 3 khách đến quầy sẽ được tính bằng công thức Poisson với tham sốλ bằng 2 (vì trung bình 10 khách trong 5 phút, tương đương 2 khách mỗi phút) Thứ hai, xác suất để trong 1 phút có từ 1 đến 3 khách đến quầy sẽ là tổng các xác suất của 1, 2 và 3 khách, giúp dự đoán chính xác hơn lưu lượng khách đến trong thời gian ngắn Cuối cùng, số khách có khả năng đến quầy tính tiền nhiều nhất trong 1 giờ được xác định dựa trên phân phối Poisson với λ lớn hơn, giúp nhà quản lý dự đoán cao điểm lưu lượng khách để tối ưu hóa dịch vụ và nguồn lực.
Trang 56 Chương 3 Một số phân phối xác suất thông dụng
Phân phối chuẩn
Định nghĩa 3.6 (Phân phối chuẩn) Biến ngẫu nhiên X được gọi là có phân phối chuẩn tham số và 2 , ký hiệuX N I 2
, nếu X có hàm mật độ: f x/ D 1 p
2 2 ; x 2R Đồ thị hàm mật độ của X N.I 2 / x
Nhận xét: Đồ thị hàm mật độ chuẩn có dạng hình “chuông” đối xứng qua x D
Tính chất 3.7 Các đặc trưng của X N I 2 i EX D : ii VarX D 2 : iii ModX D :
Các đồ thị hàm mật độ biến ngẫu nhiên chuẩn với trung bình là và
D 2 Định nghĩa 3.8 (Phân phối chuẩn: D 0I 2 D 1) Hàm mật độ của biến ngẫu nhiên Z N 0I1/ có dạng f z/ D 1 p2e z
Hình sau là đồ thị hàm mật độ củaz N 0I1/
3 x Định nghĩa 3.9(Hàm Laplace) Cho biến ngẫu nhiênZ N 0I1/ : Đặt hàm
2 dz; x 2R gọi là hàm Laplace (Giá trị của'.x/; x 0 được cho trong bảng A.2)
Tính chất 3.10 Hàm Laplace '.x/ có các tính chất: i ' x/ D '.x/: ii '.C1/ D 0; 5I' 1/ D 0; 5: iii Nếu Z N.0I1/thì P.a < Z < b/ D '.b/ '.a/: iv Nếu X N I 2 thì biến ngẫu nhiên Z D X
Ví dụ 3.7 Cho biến ngẫu nhiên X N 0I1/ ;tính các xác suất. a P 1 < X < 2/ : b P.1; 5 < X / : c P.X < 1/ :
Trang 58 Chương 3 Một số phân phối xác suất thông dụng
Ví dụ 3.8 Cho biến ngẫu nhiênX N 3I2 2
: Tính các xác suất: a P.1 < X / : b P.jX 1j < 2/ : c P.jX 1j > 1/ :
Sinh viên sắp tốt nghiệp tại trường đại học có điểm TOEIC phân phối chuẩn với trung bình 560 và độ lệch chuẩn 78 Để tìm tỷ lệ sinh viên có điểm nằm trong khoảng 600 đến 700, ta sẽ sử dụng các công thức tính xác suất dựa trên phân phối chuẩn Ngoài ra, để xác định tỷ lệ sinh viên có điểm TOEIC trên 500, ta sẽ tính xác suất của điểm trên ngưỡng này Cuối cùng, nhà trường muốn xác định điểm TOEIC tối thiểu để đảm bảo 80% sinh viên đủ điều kiện tốt nghiệp, và điểm này cần được tính chính xác bằng cách ngược phân phối chuẩn, lấy phần nguyên làm kết quả.
Tuổi thọ của máy cắt cỏ là biến ngẫu nhiên có phân phối chuẩn với trung bình 82 tháng, trong khi nhà sản xuất bảo hành 33 tháng và 2,5% sản phẩm bị trả lại trong thời gian này Độ lệch chuẩn của tuổi thọ máy cắt cỏ có thể tính dựa trên tỷ lệ phần trăm sản phẩm hỏng trong thời gian bảo hành, giúp xác định độ biến động của tuổi thọ sản phẩm Xác suất một máy có tuổi thọ trên 50 tháng có thể được tính bằng cách sử dụng phân phối chuẩn, cho thấy khả năng máy hoạt động lâu hơn trung bình Khi xem xét 10 máy cắt cỏ bán ra, xác suất có 2 máy hỏng trong thời gian bảo hành có thể được ước lượng bằng phân tích xác suất nhị thức, trong khi đó, số máy trung bình dự kiến hỏng trong thời gian này giúp dự đoán tỷ lệ phá hỏng chung của lô hàng.
Trang 60 Chương 3 Một số phân phối xác suất thông dụng
Bài tập chương 3
Trong bài tập 3.1, một nhà vườn trồng 121 cây mai, trong đó mỗi cây có xác suất nở hoa là 0,75 trong dịp Tết, với giá bán 0,5 triệu đồng cho mỗi cây hoa nở Trung bình, số cây mai nở hoa trong dịp Tết dự kiến là khoảng 90,75 cây, phản ánh khả năng nở hoa của từng cây Nếu nhà vườn bán hết những cây mai đã nở hoa, doanh thu chắc chắn đạt khoảng 45,5 triệu đồng, giúp nhà vườn dự đoán thu nhập rõ ràng và chính xác nhất trong dịp Tết năm nay.
Bài tập 3.2 Chủ vườn lan đã để nhầm 20 chậu lan có hoa màu đỏ với
Trong bài toán này, có 100 chậu lan chưa nở hoa màu tím, và một khách hàng chọn ngẫu nhiên 15 chậu từ tổng số 120 chậu lan Xác suất để có từ 5 đến 6 chậu lan có hoa màu đỏ trong số đó được tính là khoảng 0,0723 Ngoài ra, với biến ngẫu nhiên X là số chậu lan có hoa màu đỏ khách hàng chọn, ta có thể xác định kỳ vọng của X là 5/2 và phương sai là 125/68, giúp dự đoán chính xác hơn về số lượng chậu lan có hoa màu đỏ trong lần chọn này.
Trang 62 Chương 3 Một số phân phối xác suất thông dụng
Trong bệnh viện A, trung bình mỗi 3 giờ có 8 ca mổ, cho thấy tần suất mổ trung bình là 2,67 ca/giờ Sử dụng phân phối Poisson, ta tính được số ca mổ chắc chắn nhất sẽ xảy ra trong 25 giờ là 66 ca Đồng thời, xác suất trong 5 giờ có từ 10 đến 12 ca mổ là khoảng 28,21% Các số liệu này giúp dự đoán chính xác hoạt động phẫu thuật tại bệnh viện A, hỗ trợ lập kế hoạch và tối ưu hóa nguồn lực y tế.
Trong bài tập 3.4, chúng ta xem xét một lô hàng gồm 20 sản phẩm, trong đó có 4 phế phẩm Nghiên cứu xác suất chọn liên tiếp 3 lần (với hoàn lại) từ lô hàng, mỗi lần chọn 4 sản phẩm, để xác định khả năng có đúng 1 lần chọn được không quá 1 phế phẩm là 0,066 Ngoài ra, xác suất trung bình số lần chọn có không quá 1 phế phẩm trong 3 lần là 2,514, giúp đánh giá khả năng kiểm tra chất lượng sản phẩm hiệu quả trong quy trình kiểm thử hàng loạt.
Trong bài tập 3.5, giá cà phê trên thị trường được mô tả là một biến ngẫu nhiên theo phân phối chuẩn với trung bình là 26.000 đồng/kg và độ lệch chuẩn là 2.000 đồng Để xác định giá trị k tại đó cà phê có giá lớn hơn k với xác suất 90%, ta cần tìm giá trị k sao cho P(X > k) = 0,9 Dựa trên phân phối chuẩn, ta sẽ sử dụng các bảng Z hoặc công thức chuyển đổi để tính toán, từ đó xác định chính xác giá trị k phù hợp, giúp các nhà đầu tư và doanh nghiệp dự đoán chính xác xu hướng giá cà phê trên thị trường.
Thời gian mang thai của sản phụ được mô tả là biến ngẫu nhiên có phân phối chuẩn với trung bình 280 ngày Tỷ lệ một sản phụ mang thai trên 290 ngày là 25,14%, giúp xác định độ lệch chuẩn của thời gian mang thai là 15 ngày Việc tính toán này giúp hiểu rõ hơn về phân phối thời gian mang thai bình thường của phụ nữ, đáp ứng các yêu cầu về kiến thức sinh học và y tế Độ lệch chuẩn 15 ngày thể hiện mức độ biến động của thời gian mang thai quanh trung bình 280 ngày, hỗ trợ các bác sĩ trong việc dự đoán chính xác hơn các chu kỳ thai kỳ.
Trang 64 Chương 3 Một số phân phối xác suất thông dụng
Trong bài tập 3.7, chiều dài của linh kiện điện tử A tại cửa hàng B được mô tả là biến ngẫu nhiên X theo phân phối chuẩn N(12, 5) Công ty cần mua 7 chiếc linh kiện có chiều dài từ 11,98mm đến 13mm, và xác suất để trong số này có từ 5 đến 6 chiếc sử dụng được là 1,06%, trong khi xác suất để ít nhất một chiếc sử dụng được là 0,8531 Các tính toán này giúp đánh giá chính xác khả năng cung cấp linh kiện phù hợp với tiêu chuẩn kỹ thuật từ kho hàng B.
Bài tập 3.8 Thời gian chơi thể thao trong một ngày của một thanh niên là biến ngẫu nhiên X (giờ/ngày) có hàm mật độ f x/ D
Trong bài toán này, ta tính được xác suất một thanh niên có thời gian chơi thể thao chưa tới 30 phút hàng ngày là 0,2679 Trung bình một thanh niên chơi thể thao khoảng 0,6530 giờ mỗi ngày Trong một nhóm 100 thanh niên, trung bình có 73,21 người chơi thể thao hơn 30 phút/ngày Để xác định số lượng thanh niên cần chọn để đảm bảo gặp ít nhất một người chơi thể thao chưa tới 30 phút/ngày với xác suất trên 95%, ta cần chọn ít nhất 10 người.
Trang 66 Chương 3 Một số phân phối xác suất thông dụng
Bài tập 3.9 Tuổi thọ của người dân ở một địa phương là một biến ngẫu nhiên - X (tuổi) có hàm mật độ f x/ D
Trong địa phương, tuổi thọ trung bình của người dân là khoảng 76,93 tuổi Tỉ lệ người dân sống trên 60 tuổi chiếm khoảng 45,84% tổng dân số Trung bình, mỗi 1.000 người dân, có khoảng 458 người trên 60 tuổi, thể hiện dân số ngày càng có xu hướng già đi rõ rệt.
Bài tập 3.10 Thời gian học rành nghề sửa ti vi của một người là một biến ngẫu nhiên -X (năm) có hàm mật độ. f x/ D
Xác định hằng số A trong nghiên cứu này là (9/40), giúp làm rõ các yếu tố ảnh hưởng đến quá trình học nghề Thời gian trung bình để một người trở thành thành thạo nghề là khoảng 1,3 năm, cho thấy quá trình học tập không diễn ra quá nhanh Theo đó, xác suất một người học rành nghề trong vòng chưa tới 6 tháng là 0,1094, phản ánh tỷ lệ thành công ngắn hạn Ngoài ra, khi chọn ngẫu nhiên 5 học viên, xác suất có đúng 2 người học rành nghề dưới 6 tháng là 0,0845, giúp các nhà nghiên cứu hiểu rõ hơn về khả năng rút ngắn thời gian học nghề của các học viên.
Trang 68 Chương 3 Một số phân phối xác suất thông dụng
Tổng thể, mẫu
4.3 Các đặc trưng của mẫu 72
Ta cần nghiên cứu đặc tínhX (cân nặng, chiều cao ) của tập lớn gồm
Tập hợp gồm N phần tử, còn gọi là tổng thể, thường không được quan sát toàn bộ do nhiều lý do khác nhau Việc bỏ qua một số phần tử giúp tiết kiệm thời gian và công sức trong quá trình phân tích dữ liệu Trong thống kê, chúng ta thường dựa vào mẫu để đưa ra các nhận định về tổng thể mà không cần xem xét tất cả các phần tử Điều này giúp nâng cao hiệu quả công việc và giảm thiểu chi phí nghiên cứu Việc giới hạn phạm vi khảo sát cũng giúp tập trung vào các yếu tố quan trọng hơn trong tổng thể.
Làm hư hại tất cả các phần tử (kiểm tra đồ hộp, bắn thử đạn)
Thời gian và kinh phí hạn chế khiến việc nghiên cứu một đặc điểm của trẻ trở nên khó khăn, đặc biệt khi số phần tử quá lớn Không thể chờ đợi để nghiên cứu toàn bộ trẻ em trên thế giới trước khi đưa ra kết luận, do đó cần các phương pháp nghiên cứu phù hợp và nhanh chóng để đưa ra những phát hiện khả thi trong lĩnh vực này.
Trong thống kê, người ta lấy mẫu từ tổng thể để quan sát đặc tính X, giúp xác định các đặc trưng của mẫu Sau đó, sử dụng các công cụ toán học để ước lượng và đưa ra kết luận về toàn bộ tổng thể mà không cần khảo sát tất cả các phần tử Phương pháp này giúp tiết kiệm thời gian và công sức, đồng thời đảm bảo độ chính xác trong phân tích dữ liệu.
Muốn mẫu lấy ra đại diện tốt cho tổng thể thì mẫu phải thỏa mãn hai điều kiện chính:
Mẫu phải chọn ngẫu nhiên từ tổng thể.
Các phân phối của mẫu phải được chọn độc lập nhau.
Trang 70 Chương 4 Lý thuyết mẫu
Khi quan sát phần tử thứ i, ta gọi X_i là biến ngẫu nhiên thể hiện giá trị quan sát của đặc tính X tại phần tử đó Trong trường hợp cụ thể, nếu X_i có giá trị x_n, thì bộ n giá trị cụ thể x_1, x_2, , x_n được gọi là mẫu cụ thể, với cỡ mẫu là n Bộ n biến ngẫu nhiên độc lập X_1, X_2, , X_n được gọi là mẫu ngẫu nhiên, phản ánh tập hợp các quan sát độc lập và ngẫu nhiên của đặc tính X trong dữ liệu.
Ví dụ 4.1 minh họa cách khảo sát điểm môn xác suất thống kê của sinh viên lớp A gồm 100 sinh viên bằng phương pháp lấy mẫu ngẫu nhiên cỡ mẫu là 5 Trong đó, các điểm của 5 sinh viên được chọn lần lượt là X₁ = 3, X₂ = 7, X₃ = 8, X₄ = 5, X₅ = 7, tạo thành mẫu cụ thể là {3, 7, 8, 5, 7}.
Trong mẫu ngẫu nhiên, các giá trị quan sát X₁, X₂, , Xₙ đều có cùng phân phối với X và độc lập nhau, đảm bảo tính chất quan trọng của mẫu ngẫu nhiên Điều này giúp phân tích dữ liệu dễ dàng hơn và đảm bảo tính khách quan trong các phân tích thống kê.
Mô tả dữ liệu
Phân loại mẫu ngẫu nhiên
Mẫu ngẫu nhiên còn được phân làm 2 loại:
Mẫu chỉ quan tâm đến các phần tử có tính chất A hay không được gọi là mẫu định tính, giúp phân loại dữ liệu dựa trên đặc điểm cụ thể Giả sử tỷ lệ phần tử A trong tổng thể là p, ta đặt tham số này để xác định xác suất của các phần tử thuộc tính chất A Phương pháp này giúp phân tích dữ liệu một cách chính xác, tối ưu trong các nghiên cứu thống kê và ra quyết định dựa trên đặc điểm tham số p.
1 Nếu phần tử thứ i loại A
0 Nếu phần tử thứ i khác loại A ; i D 1; : : : ; n Khi đó các X i độc lập và cùng phân phối xác suất vớiX; X i B.p/:
Mẫu định lượng quan tâm đến các yếu tố về lượng như chiều cao, cân nặng và mức hao phí nhiên liệu của một loại động cơ Những yếu tố này giúp đánh giá chính xác hiệu suất và khả năng hoạt động của thiết bị, đồng thời hỗ trợ trong việc cải tiến công nghệ để tối ưu hóa tiêu thụ nhiên liệu và nâng cao hiệu quả vận hành Việc phân tích các đặc điểm định lượng còn giúp doanh nghiệp đưa ra quyết định chính xác nhằm nâng cao chất lượng sản phẩm và đáp ứng tốt hơn yêu cầu thị trường.
Sắp xếp số liệu
Giả sử mẫu cụ thể có các giá trị khác nhau x₁, x₂, , x_k, với k < n, trong đó mỗi giá trị x_i xuất hiện n_i lần sao cho tổng n_i bằng n Dữ liệu được sắp xếp theo thứ tự tăng dần của các giá trị x_i, giúp phân tích dễ dàng và chính xác hơn trong việc thống kê tần số xuất hiện của từng giá trị Việc xác định số lượng các giá trị khác nhau cũng như tần số của chúng đóng vai trò quan trọng trong quá trình xử lý dữ liệu thống kê và dự đoán xu hướng.
X x 1 x 2 x k n i n 1 n 2 n k Bảng này gọi làbảng tần số dạng điểm.
Ví dụ 4.2 Khảo sát tuổi (X) trẻ bắt đầu đến trường ở một địa phương, lấy mẫu cỡ 10 ta có mẫu cụ thể như sau:
Có bảng tần số dạng điểm:
Giả sử mẫu cụ thể x 1 ; : : : ; x n / có nhiều giá trị khác nhau (quan sát từ biến ngẫu nhiên liên tục) thường người ta phân dữ liệu theo khoảng:
Bảng tần số dạng khoảng là loại bảng thống kê thể hiện số quan sát có giá trị nằm trong từng khoảng giá trị xác định Trong đó, n_k là số quan sát thuộc khoảng a_k đến a_{k+1}, giúp thống kê phân bố dữ liệu rõ ràng hơn Khi tính toán, ta chuyển sang dạng bảng tần số dạng điểm bằng cách lấy giá trị chính giữa của mỗi khoảng, tức là x_k = (a_k + a_{k+1})/2, để dễ dàng phân tích và biểu diễn dữ liệu thống kê.
Ví dụ 4.3 Khảo sát thời gian (tuần) mang thai của thai phụ không hút thuốc Tiến hành lấy mẫu, người ta có số liệu cho như bảng sau:
Bảng tần số dạng điểm có dạng:
Trang 72 Chương 4 Lý thuyết mẫu
Các đặc trưng của mẫu
Trung bình mẫu
Xét mẫu ngẫu nhiên X 1 ; : : : ; X n / lấy từ X: Định nghĩa 4.3 (Trung bình mẫu) Biến ngẫu nhiên
XN D 1 n X 1 C CX n / được gọi là trung bình mẫu.
Từ các tính chất của mẫu ngẫu nhiên, ta có:
Tính chất 4.4 Trung bình mẫu có tính chất: i EXN D 1 n EX 1 C CEX n / D n n D : ii VarXN D 1 n 2 VarX 1 C CVarX n /D n 2 n 2 D 2 n
Cho mẫu cụ thể x 1 ; : : : ; x n /, trung bình mẫu xN D 1 n.x 1 C Cx n / và trung bình của bình phương x 2 D 1 n.x 1 2 C Cx n 2 /
Chú ý Khi số liệu cho dưới dạng bảng tần số thì xN D 1 n.x 1 n 1 C x k n k / và trung bình của bình phương làx 2 D 1 n.x 1 2 n 1 C x k 2 n k /
Phương sai mẫu
Xét mẫu ngẫu nhiên.X 1 ; : : : ; X n / lấy từ X: Định nghĩa 4.5 (Phương sai mẫu) Biến ngẫu nhiên
SO 2 D 1 n X 1 X /N 2 C C.X n X /N 2 được gọi là phương sai mẫu.
Tính chất 4.6 Phương sai mẫu có các tính chất i SO 2 D EX 2 EX / 2 ii ESO 2 D n 1 n 2 :Cho mẫu cụ thể.x1; : : : ; xn/, phương sai mẫu sO 2 D x 2 xN 2 :
Phương sai mẫu có hiệu chỉnh
Xét mẫu ngẫu nhiên.X 1 ; : : : ; X n / lấy từ X: Định nghĩa 4.7 (Phương sai mẫu có hiệu chỉnh) Biến ngẫu nhiên
S 2 D 1 n 1 X 1 X /N 2 C C.X n X /N 2 được gọi là phương sai mẫu có hiệu chỉnh.
Tính chất 4.8 Phương sai mẫu có các tính chất i S 2 D n n 1SO 2 ii ES 2 D 2 :
Cho mẫu cụ thể x1; : : : ; xn/; phương sai mẫu có hiệu chỉnh s 2 D n n 1sO 2 :
Phương sai mẫu có đơn vị đo bằng bình phương của đơn vị đo đặc tính X, điều này giúp chúng ta hiểu rõ hơn về độ phân tán của dữ liệu Để thống nhất đơn vị, ta sử dụng khái niệm độ lệch chuẩn của mẫu (sO D p), nhằm phản ánh mức độ biến động của dữ liệu một cách trực quan hơn Độ lệch chuẩn giúp chuyển đổi giá trị phương sai từ đơn vị bình phương sang đơn vị gốc của đặc tính X, mang lại kết quả dễ hiểu và phù hợp trong phân tích thống kê.
Trang 74 Chương 4 Lý thuyết mẫu Độ lệch chuẩn của mẫu có hiệu chỉnh, s D p s 2
Ví dụ 4.5 Khảo sát chiều cao cm/ của nữ sinh trong một trường đại học ta có số liệu như sau
6.153C160C145C162C165C158/ D 157; 1666 Trung bình của bình phương x 2 D 1
Phương sai mẫu có hiệu chỉnh s 2 D n n 1sO 2 D 6
543; 1598 D 51; 7907 Độ lệch chuẩn của mẫu sO D p
43; 1598 Độ lệch chuẩn của mẫu có hiệu chỉnh s D p s 2 D p
Chú ý Hướng dẫn sử dụng máy tính cầm tay tính các đặc trưng mẫu a Máy FX500MS (tương tự cho máy FX570MS) 1
– Bước 1: Ấn phím Mod đến khi màn hình xuất hiện chữ SD và chọn số tương ứng với mục SD
– Bước 3: Sau khi đã nhập hết các số liệu tiếp theo bạn nhấn phím on
– Bước 4: Xuất kết quả nhấn Shift ; 2
1 Dấu “;” trong hướng dẫn là thể hiện cách bước giữa hai lần nhấn
Tính s.x n 1/ W 3; = b Máy FX500ES (tương tự cho FX570ES )
– Bước 1: Shift; Mode;#; chọn (Stat); chọn (Off) (Số liệu nhập vào không có tần số)
– Bước 2: Mod; chọn (Stat); chọn (1-Var)
– Sau khi đã nhập hết các số liệu tiếp theo bạn nhấn phím on – Xuất kết quả Shift; 1; chọn (Var)
Ví dụ 4.6 Điểm môn xác suất thống kê của một số sinh viên khoa A cho như sau Điểm 5 6 7 8 9 10
Chú ý Hướng dẫn sử dụng máy tính cầm ta tính các đặc trưng mẫu (mẫu có tần số) a Máy FX500MS (tương tự cho máy FX570MS)
Trang 76 Chương 4 Lý thuyết mẫu
– Bước 1: Ấn phím Mod đến khi màn hình xuất hiện chữ SD và chọn số tương ứng với mục SD
– Bước 4: Sau khi đã nhập hết các số liệu tiếp theo bạn nhấn phím on
– Bước 3: Xuất kết quả nhấn Shift; 2
Tính s.x n 1/ W 3; = b Máy FX500ES (tương tự cho FX570ES)
– Bước 1: Shift; Mode; #; chọn (Stat); chọn (On) (Số liệu nhập vào có tần số)
– Bước 2: Mod; chọn (Stat); chọn (1-Var)
Cột x: 5 ; =; 6; =; 7; =; 8; =; 9; =; 10; Cột Freq: 2; =; 4; =; 12; =; 15; =; 6; =; 2; – Sau khi đã nhập hết các số liệu tiếp theo bạn nhấn phím on – Xuất kết quả Shift; 1; chọn (Var)
Trong ví dụ 4.7, năng suất lúa trong một vùng được xác định là một đại lượng ngẫu nhiên có phân phối chuẩn, phản ánh tính chất biến đổi tự nhiên của sản lượng Khi tiến hành gặt ngẫu nhiên 115 ha của vùng này, dữ liệu thu thập được thể hiện qua bảng số liệu, giúp phân tích chính xác hơn về mức độ biến động năng suất lúa trong khu vực Việc hiểu rõ sự phân phối chuẩn của năng suất lúa là cơ sở quan trọng để dự báo và đưa ra các quyết định quản lý nông nghiệp hiệu quả.
Chương 5 Ước lượng tham số
Ước lượng điểm
5.3 Khoảng tin cậy 80 5.4 Bài tập chương 5 85
Giả sử biến ngẫu nhiên X có tham số chưa biết, dựa vào mẫu ngẫu nhiên X₁, X₂, , Xₙ, ta sử dụng thống kê O để ước lượng giá trị của tham số đó Có hai phương pháp ước lượng chính: ước lượng điểm, dùng thống kê O để đưa ra một giá trị ước lượng chính xác cho tham số và ước lượng khoảng, xác định một khoảng tin cậy (I2) dựa trên thống kê O, nhằm cung cấp một khoảng tin cậy chứa tham số thực với xác suất cao.
5.2 Ước lượng điểm Định nghĩa 5.1 (Ước lượng không chệch) Thống kê O được gọi là ước lượng không chệch cho tham số nếu E /O D :
Ví dụ 5.1 Giả sử biến ngẫu nhiên X có giá trị trung bình là Từ X ta lập mẫu ngẫu nhiên X 1 ; : : : ; X n / Khi đó XN là ước lượng không chệch 1
Ta nhận thấy thống kê O D 1
Trong thống kê, ước lượng không chệch là một phương pháp giúp ước lượng tham số một cách chính xác, với các ước lượng như X̄, 1 X̄, n / cũng đều là ước lượng không chệch cho tham số đó Để chọn được ước lượng phù hợp, cần dựa vào tiêu chuẩn hiệu quả, theo đó ước lượng không chệch O được gọi là hiệu quả nhất khi có phương sai nhỏ nhất trong các ước lượng không chệch của tham số Định lý Cramér-Rao cung cấp bất đẳng thức về phương sai của ước lượng không chệch, giúp xác định giới hạn dưới về độ chính xác của các ước lượng này trong mô hình thống kê, đặc biệt khi mẫu ngẫu nhiên tuân theo hàm mật độ f liên quan đến tham số đang xét.
Bất đẳng thức Crammé-Rao cung cấp một giới hạn dưới cho phương sai của ước lượng vô hướng, cho thấy rằng khi kích thước mẫu cố định, không thể có ước lượng với độ chính xác tùy ý Điều này có nghĩa là mọi ước lượng không chệch đều có sai số trung bình bình phương tối thiểu không thể nhỏ hơn một hằng số xác định trước Bất đẳng thức này giúp hiểu rõ giới hạn tối đa của độ chính xác trong ước lượng tham số thống kê khi mẫu dữ liệu không đổi.
Nhận xét Vậy nếu O là ước lượng hiệu quả của thì phương sai của nó là
Trong đóf x; / là hàm mật độ xác suất của biến ngẫu nhiên gốc.
Các thống kê X ; SN 2 ; F là ước lượng hiệu quả cho tham số ; 2 ; p: Ta có quy tắc thực hành ước lượng điểm như sau:
Tham số lý thuyết Đặc trưng mẫu Ước lượng
VarX D 2 s 2 2 s 2 p (tỷ lệ phần tử A ) f=tỷ lệ phần tử A trên mẫu p f
Trang 80 Chương 5 Ước lượng tham số
Khoảng tin cậy
Mô tả phương pháp
Theo bất đẳng thức Crammé-Crao, khi ta sử dụng bất kỳ hàm ước lượng
Trong quá trình ước lượng tham số, luôn tồn tại một mức sai số nhất định, do đó cần chấp nhận một phạm vi sai số hợp lý Điều này giúp đảm bảo rằng giá trị thực của tham số nằm trong khoảng tin cậy đã xác định, tối ưu hóa độ chính xác của kết quả ước lượng Việc chấp nhận sai số có kiểm soát là yếu tố quan trọng trong phân tích thống kê và thiết kế thí nghiệm, nhằm nâng cao tính khả thi và độ chính xác của các phương pháp ước lượng.
: Khoảng này gọi là khoảng tin cậy, giá trị sai số" gọi là độ chính xác Ở đây ta không tuyệt đối tin rằng giá trị thật luôn nằm trong
O "I O C" mà ta chỉ tin rằng
Trong đó 1 ˛ gọi làđộ tin cậy. Định nghĩa 5.4 Giả sử trong ước lượng cho tham số
Trong phân tích thống kê, với một mẫu thực nghiệm gồm các giá trị x₁, x₂, , xₙ, chúng ta xác định các thống kê Oₓ và O_C để xây dựng khoảng tin cậy Khoảng tin cậy của tham số với độ tin cậy 1−α (hay còn gọi là khoảng tin cậy 100(1−α)%) của tham số đó giúp đưa ra các ước lượng chính xác và tin cậy về giá trị thực của tham số Đây là công cụ quan trọng trong phân tích dữ liệu nhằm đảm bảo tính khả thi và độ chính xác của các ước lượng thống kê trong nghiên cứu.
Khoảng tin cậy cho trung bình
Gọi là trung bình của X chưa biết ta tìm khoảng 1 I 2 / chứa sao cho P 1 < < 2 / D 1 ˛ Khoảng tin cậy 1 I 2 /D xN "I NxC"/, với
" gọi là độ chính xác của ước lượng Trong đó" tính như sau:
Dưới đây là ví dụ về khảo sát thời gian tự học X (giờ/tuần) của sinh viên hệ chính quy tại trường đại học A trong thời gian gần đây Bảng số liệu thu thập từ khảo sát cho thấy mức độ tự học của sinh viên khác nhau, phản ánh rõ nhu cầu và thói quen học tập hàng tuần của sinh viên trường Các kết quả này giúp đánh giá hiệu quả quá trình tự học và đề xuất các giải pháp nâng cao kỹ năng tự học của sinh viên đại học A Thống kê từ khảo sát cung cấp thông tin quý báu để cải thiện chương trình đào tạo và thúc đẩy sự chủ động trong học tập của sinh viên.
Số SV 10 35 45 36 10 8 Ước lượng thời gian tự học trung bình của một sinh viên với độ tin cậy 95% cho hai trường hợp: a Biết D 2 b Chưa biết
Giải Từ mẫu ta tính được n D 144I Nx D 7; 1736Is D1; 2366.
Gọi là thời gian tự học trung bình của sinh viên khoảng tin cậy cho với độ tin cậy 95% có dạng
Tiếp theo ta tính" cho từng trường hợp: a Biết D 2
Chú ý Cho trước độ tin cậy là 1 ˛ D 0; 95 cho nên ta có 1 ˛ 2 D 0; 475. Tra bảng A.2 ta có t 0;475 D 1; 96. b Không biết
Chú ý Với t0;475 D 1; 96 được tính như câu a.
Ví dụ 5.3 Khảo sát cân nặng (kg) của gà khi xuất chuồng, người ta cân một số con và kết quả cho như sau:
Trang 82 Chương 5 Ước lượng tham số
Trong bài viết này, chúng tôi tập trung vào việc ước lượng cân nặng trung bình của gà khi xuất chuồng dựa trên phân tích thống kê với độ tin cậy 95% Khi biết độ lệch chuẩn của cân nặng gà là D = 0.3, chúng ta có thể dễ dàng tính toán khoảng tin cậy chính xác hơn, giúp xác định phạm vi mà cân nặng trung bình của gà nằm trong đó Ngược lại, khi không biết độ lệch chuẩn D, cần sử dụng phương pháp ước lượng bằng mẫu để xây dựng khoảng tin cậy phù hợp, nhấn mạnh tầm quan trọng của việc thu thập dữ liệu mẫu đủ lớn để đảm bảo độ chính xác trong ước lượng Các kết quả này góp phần nâng cao hiệu quả trong quản lý chăn nuôi và đưa ra quyết định chính xác về tiêu chuẩn xuất chuồng gà.
Giải Từ mẫu ta tính đượcn D 9I Nx D 1; 9333Is D 0; 2549.
Gọi là cân nặng trung bình của gà khi xuất chuồng. a Cho biết D 0; 3
" D s pnt ˛ n 1 D 0; 2549 p9 2; 306D 0; 1959 Vậy khoảng tin cậy
Chú ý Cho trước độ tin cậy là 1 ˛ D 0; 95 cho nên ta có ˛ D 0; 05 Tra bảng A.3 ta có t 0;05 8 D 2; 306.
Trong ước lượng trung bình, có ba chỉ tiêu chính cần chú ý, bao gồm: mức độ chính xác " và cỡ mẫu n Nếu biết hai trong số các chỉ tiêu này, ta có thể xác định được chỉ tiêu thứ ba một cách chính xác Đặc biệt, việc xác định cỡ mẫu n nhỏ nhất đảm bảo độ chính xác không vượt quá " và độ tin cậy đạt mức 1 - α, giả định cỡ mẫu lớn để đảm bảo tính đại diện chính xác của dữ liệu.
2 n nhỏ nhất thỏa điều kiện trên là n D ˇ ˇ ˇ ˇ
2ˇ ˇ ˇ ˇC1 b Xác định độ tin cậy của ước lượng khi biết độ chính xác của ước lượng Trước hết xác định giá trị t 1 ˛
2 D "p n s Và từ đây dễ dàng tính được 1 ˛:
Trong ví dụ 5.4, sau khi cân thử 121 sản phẩm với đơn vị tính bằng kg, ta đã tính được độ lệch chuẩn D = 5,76 Để ước lượng trọng lượng trung bình của các sản phẩm với độ tin cậy 95%, cần xác định độ chính xác phù hợp Đồng thời, xác định cỡ mẫu nhỏ nhất để đạt được độ chính xác dưới 0,4 với mức độ tin cậy 95% cũng là yêu cầu quan trọng Ngoài ra, khi muốn ước lượng trung bình với độ chính xác là 0,5, ta cần tính toán độ tin cậy phù hợp để đảm bảo kết quả chính xác và tin cậy cao.
Giải a Xác định độ chính xác:
C1D 139 c Xác định độ tin cậy, trước hết ta tính t 1 ˛
1212; 4 D 2; 29Tra bảng A.2 ta tính được 1 ˛ 2 D 0; 489 Từ đó suy ra 1 ˛ D 0; 978
Khoảng tin cậy cho tỷ lệ
Gọi p là tỷ lệ phần tửA chưa biết ta tìm khoảng p 1 Ip 2 / chứa p sao cho
Trang 84 Chương 5 Ước lượng tham số f là tỷ lệ phần tử A tính trên mẫu.
"gọi là độ chính xác của ước lượng được tính như sau:
Trong ví dụ này, chúng ta khảo sát tỷ lệ phế phẩm của một nhà máy sản xuất với mẫu gồm 800 sản phẩm, trong đó phát hiện 8 phế phẩm Với độ tin cậy 95%, có thể ước lượng tỷ lệ phế phẩm của nhà máy dựa trên số liệu thu thập được Phân tích dữ liệu cho thấy tỷ lệ phế phẩm ước lượng của nhà máy là 1%, giúp đánh giá chất lượng sản phẩm và tối ưu quy trình sản xuất.
Giải Gọi f là tỷ lệ phế phẩm trên mẫu f D 8
: p là tỷ lệ phế phẩm của nhà máy. Độ chính xác của ước lượng tỷ lệ
800 1; 96 D 0; 0069 Vậy khoảng tin cậy cho p với độ tin cậy 95% là
Chú ý Xác định các chỉ tiêu ước lượng a Xác định cỡ mẫu n nhỏ nhất sao cho độ chính xác không lớn hơn " và độ tin cậy là 1 ˛ Ta có n f 1 f /
n nhỏ nhất thỏa điều kiện trên là n D ˇ ˇ ˇ ˇ f 1 f /
2ˇ ˇ ˇ ˇC1 b Xác định độ tin cậy của ước lượng khi biết độ chính xác của ước lượng Trước hết xác định giá trị t 1 ˛
Và từ đây dễ dàng tính được1 ˛ bằng bảng A.2.
Trong ví dụ 5.6, quan sát 800 sản phẩm sản xuất ra, trong đó có 128 mẫu loại A Để xác định độ chính xác khi ước lượng tỷ lệ sản phẩm loại A với mức tin cậy 95%, ta cần tính toán dựa trên tỷ lệ mẫu Cần xác định cỡ mẫu nhỏ nhất để ước lượng tỷ lệ sản phẩm loại A với độ chính xác nhỏ hơn 0,023 và độ tin cậy 95%, nhằm đảm bảo kết quả đáng tin cậy Ngoài ra, nếu muốn biết độ tin cậy phù hợp để ước lượng tỷ lệ sản phẩm loại A chính xác với độ sai số 0,022, ta cần thực hiện các tính toán phù hợp để xác định mức độ tin cậy phù hợp nhất.
Giải Gọi: f là tỷ lệ sản phẩm loại Atính trên mẫu f D 128
. p là tỷ lệ sản phẩm loại Ado xí nghiệp sản xuất ra. a Độ chính xác của ước lượng
0; 023 2 1; 96 2 ˇ ˇ ˇ ˇC1 D 977 c Xác định độ tin cậy 1 ˛ t 1 ˛
2 D " r n f 1 f / D 0; 022 s 8000; 16.1 0; 16/ D 1; 69Tra bảng A.2 ta tính được 1 ˛ 2 D 0; 4545 Từ đó suy ra 1 ˛ D 0; 909
Bài tập chương 5
Dưới đây là kết quả kiểm tra ngẫu nhiên 25 bóng đèn của một hãng điện tử với độ tin cậy 95%, dựa trên dữ liệu về tuổi thọ trung bình là 5000 giờ và độ lệch chuẩn đã hiệu chỉnh là 200 giờ, giả thuyết rằng tuổi thọ của bóng đèn tuân theo phân phối chuẩn Khoảng tin cậy 95% cho tuổi thọ trung bình của loại bóng đèn này nằm trong khoảng từ 4917,44 giờ đến 5082,56 giờ.
Trang 86 Chương 5 Ước lượng tham số
Trong bài tập 5.2, chúng ta kiểm tra ngẫu nhiên 25 bóng đèn của một hãng điện tử và phát hiện độ lệch chuẩn của mẫu có hiệu chỉnh là 200 giờ Với giả thuyết rằng tuổi thọ của bóng đèn theo phân phối chuẩn, chúng tôi sử dụng dữ liệu này để ước lượng tuổi thọ trung bình của loại bóng đèn, đảm bảo độ chính xác là 73,12 giờ Kết quả cho thấy, mức độ tin cậy của ước lượng này lên tới 92%, phản ánh độ tin cậy cao trong dự đoán tuổi thọ trung bình của bóng đèn.
Trong bài tập 5.3, khảo sát 25 người sử dụng điện thoại di động cho thấy số tiền trung bình hàng tháng phải trả là 200 nghìn đồng, với độ lệch chuẩn mẫu hiệu chỉnh là 50 nghìn đồng Giả thiết rằng số tiền phải trả có phân phối chuẩn Với mức độ tin cậy 95%, khoảng tin cậy của số tiền trung bình hàng tháng mà mỗi người phải trả nằm trong khoảng từ 179,36 nghìn đồng đến 220,64 nghìn đồng.
Trong bài tập 5.4, chúng ta khảo sát 25 người dùng điện thoại di động về số tiền họ phải trả hàng tháng, với độ lệch chuẩn mẫu đã hiệu chỉnh là 50 nghìn đồng Giả sử số tiền phải trả trong một tháng theo phân phối chuẩn, ta muốn xác định độ tin cậy khi độ chính xác (khoảng tin cậy) là 19,74 nghìn đồng Kết quả, khoảng tin cậy này đạt mức 94%, giúp người dùng và nhà cung cấp dịch vụ hiểu rõ hơn về mức độ chính xác của ước lượng trung bình chi phí hàng tháng.
Trong bài tập 5.5, chiều dài của loại sản phẩm được mô tả là biến ngẫu nhiên có phân phối chuẩn Khi đo ngẫu nhiên 10 sản phẩm cùng loại, chiều dài trung bình ghi nhận là 10,02m với độ lệch chuẩn mẫu chưa hiệu chỉnh là 0,04m Để xác định khoảng tin cậy 95% cho chiều dài trung bình của sản phẩm này, ta sử dụng các phương pháp thống kê phù hợp Kết quả tính toán cho thấy khoảng tin cậy của chiều dài trung bình nằm trong khoảng từ 9,9898m đến 10,0502m, giúp các nhà sản xuất và kiểm định chất lượng có căn cứ đánh giá chính xác hơn về đặc điểm sản phẩm.
Bài toán kiểm định giả thiết
Giả thiết không, đối thiết
Trong chương này, chúng ta giới thiệu bài toán thống kê liên quan đến tham số chưa biết nằm trong không gian tham số Giả định dữ liệu có thể phân chia thành hai tập riêng biệt là 0 và 1, và nhiệm vụ của nhà thống kê là xác định chính xác xem dữ liệu đó thuộc tập nào Đây là bài toán phân loại hai lớp phổ biến trong thống kê và học máy Việc đưa ra quyết định đúng đắn dựa trên mẫu dữ liệu là chìa khóa để xác định tham số phù hợp, từ đó giúp ứng dụng đưa ra dự đoán chính xác hơn.
Chúng ta đặt H 0 để ký hiệu giả thiết 2 ‚ 0 ; và H 1 ký hiệu giả thiết
Trong kiểm định giả thiết, chúng ta cần xác định xem dữ liệu hỗ trợ giả thiết H0 hay H1, vì chỉ có một trong hai giả thiết này là đúng Quy trình này đòi hỏi quyết định chấp nhận H0 để bác bỏ H1 hoặc ngược lại, giúp đưa ra kết luận chính xác về dữ liệu nghiên cứu Giả thiết H0 thường được gọi là giả thiết không, đóng vai trò nền tảng trong việc xác định sự khác biệt hoặc hiệu quả giữa các nhóm nghiên cứu Vai trò của hai giả thiết H0 và H1 trong kiểm định giả thiết cơ bản giống nhau, mặc dù trong thực tế có những khác biệt nhỏ về mục đích và cách tiếp cận Các kiểm định giả thiết là bước quan trọng trong các phân tích thống kê, giúp xác định tính xác thực của giả thiết ban đầu dựa trên dữ liệu thu thập được.
H 1 gọi là đối thiết Chúng ta sẽ dùng các thuật ngữ này trong phần còn lại của chương.
Miền tới hạn
Ta xét bài toán với giả thiết có dạng như sau:
Giả thiết không H 0 W 2 ‚ 0 Đối thiếtH 1 W 2 ‚ 1
Trước khi chọn giả thiết nào sẽ được chấp nhận, chúng ta bắt đầu với mẫu ngẫu nhiên X₁, X₂, , Xₙ được trích xuất từ phân phối của đặc tính X với tham số chưa biết Không gian mẫu, ký hiệu là sample space, chứa tất cả các kết quả có thể xảy ra khi lấy mẫu ngẫu nhiên Điều này giúp đảm bảo quá trình phân tích thống kê chính xác và phù hợp với các quy tắc xác suất.
Trong quá trình kiểm định thống kê, dữ liệu được chia thành hai tập con quan trọng: một tập chứa tất cả các giá trị của biến số X phù hợp để chấp nhận giả thuyết H0, và một tập còn lại gồm các giá trị X đủ để bác bỏ H0 Việc xác định các tập này giúp đưa ra kết luận chính xác về giả thuyết thống kê, đảm bảo quá trình kiểm định diễn ra minh bạch và hợp lý Chia dữ liệu thành hai phần này là bước cốt lõi trong phân tích thống kê nhằm kiểm tra tính phù hợp của giả thuyết với dữ liệu thực tế, giúp nhà phân tích ra các quyết định đúng đắn dựa trên kết quả kiểm định.
Miền tới hạn (ký hiệu C) là tập hợp các giá trị của biến X khiến H₀ bị bác bỏ Hàm sức mạnh của kiểm định, được ký hiệu là β(x), thể hiện xác suất dẫn đến việc bác bỏ H₀ khi giá trị của X là x, trong đó β(x) bằng 1, còn ngược lại là 0 khi không bác bỏ H₀ Nếu C là miền tới hạn của kiểm định, thì hàm xác suất này được xác định dựa trên các quy luật xác suất của dữ liệu, theo mối liên hệ cụ thể giữa X và việc chấp nhận hay bác bỏ H₀.
Trong thống kê, xác suất bác bỏ giả thuyết H₀ là một phần quan trọng của kiểm định giả thuyết Trong trường hợp lý tưởng, hàm xác suất D₀, với mọi giá trị 2 và 0, và hàm D₁, với mọi giá trị 2 và 1, đều có các giá trị nhất định để đảm bảo kết luận chính xác Khi hàm xác suất này đảm bảo các giá trị này, ta có thể khẳng định rằng bất kể giá trị thực tế, kết luận về giả thuyết luôn đúng với xác suất bằng 1, mang lại độ tin cậy cao trong phân tích thống kê.
Hai loại sai lầm
Khi chọn một trong hai quyết định trên sẽ nẩy sinh ra hai sai lầm:
Sai lầm loại I: Bác bỏH 0 khiH 0 đúng, xác suất sai lầm loại I là
Sai lầm loại II: Chấp nhậnH 0 khiH 0 sai, xác suất sai lầm loại II là
Trang 90 Chương 6 Kiểm định giả thiết
Ví dụ 6.1 Cần nghiên cứu tác dụng phụ của một loại thuốc mới vừa được nghiên cứu ta đặt giả thiết và đối thiết như sau
Giả thiếtH 0 W Thuốc có tác dụng phụ Đối thiếtH 1 W Thuốc không có tác dụng phụ
Kết luận Thực tế Thuốc có tác dụng phụ Thuốc không có tác dụng phụ Chấp nhận H 0 Kêt luận đúng Sai lầm loại II
Bác bỏH 0 Sai lầm loại I Kết luận đúng
Trong quá trình đưa ra giả thiết, việc mắc sai lầm loại I (kết luận sai khi thuốc thực sự có tác dụng phụ nhưng bị bỏ qua) gây hậu quả nghiêm trọng hơn so với sai lầm loại II (kết luận sai khi thuốc không có tác dụng phụ trong khi thực tế có) Điều này nhấn mạnh tầm quan trọng của việc giảm thiểu rủi ro trong quy trình nghiên cứu và phân tích, đặc biệt trong lĩnh vực y học, nơi quyết định an toàn và hiệu quả của thuốc Việc cảnh giác cao và lựa chọn phương pháp phù hợp giúp hạn chế tối đa những hậu quả nghiêm trọng từ các sai lầm thống kê này, đảm bảo an toàn cho người dùng và nâng cao chất lượng nghiên cứu.
Lẽ tự nhiên trong quá trình chọn miền C là nhằm mục tiêu giảm thiểu cả hai xác suất phạm sai lầm Tuy nhiên, không thể đồng thời cực tiểu hóa cả hai loại sai lầm khi cỡ mẫu cố định do mối quan hệ nghịch lý giữa chúng Hai xác suất này tương quan chặt chẽ với nhau, thể hiện rõ ràng qua các công thức và lý thuyết thống kê liên quan Việc hiểu rõ mối liên hệ này giúp ta xác định đường đi tối ưu trong quá trình đưa ra quyết định, cân nhắc phù hợp giữa các sai lầm loại I và loại II.
Do đóC cực tiểuP.CjH 0 / chưa chắc đã cực tiểu P CNjH 1
Phương pháp chọn miền tới hạn
Trong quá trình xác định miền C, ta cố định xác suất sai lầm loại I là P(C|H0) không đổi và tìm miền C sao cho xác suất phạm sai lầm loại II là P(C|H1) đạt giá trị cực tiểu hoặc tương đương, nghĩa là chọn miền C sao cho P(C|H1) vô cùng nhỏ nhất hoặc P(C|H1) cực đại để giảm thiểu khả năng sai sót trong quá trình đưa ra quyết định Việc này giúp tối ưu hoá quyết định thống kê và nâng cao độ chính xác của bài toán phân loại.
P.CjH 1 / đạt cực đại hay
/ ˛ với 2‚ 0 / đạt cực đại với 2‚ 1 (6.1)
Ta gọi ˛ là mức ý nghĩa của kiểm định, khi cố định ˛ và có hàm lực lượng /;8 2 ‚ 1 lớn nhất thì qui tắc này gọi là qui tắc mạnh nhất.
Kiểm định giả thiết về trung bình
Giả sử (chưa biết) là trung bình của biến ngẫu nhiên X, cần kiểm định
Biết 2 t D j Nx 0 j pn t D j Nx 0 j pn t 1 ˛
Không biết 2 t D j Nx 0 j s pn t D j Nx 0 j s pn (t 1 ˛
Chấp nhận giả thiếtH 0 khit t 1 ˛
Bác bỏ giả thiếtH 0 khi t > t 1 ˛
Dựa trên ví dụ 6.2, việc cân thử 15 con gà tây tại trại chăn nuôi cho kết quả trung bình là 3,62 kg với độ lệch chuẩn D0 = 0,01, giúp xác định tính chính xác của các giả thuyết về trọng lượng trung bình Trong trường hợp giám đốc trại tuyên bố trọng lượng trung bình của gà tây là 3,5 kg, kết quả kiểm tra thống kê cho thấy không thể tin tưởng vào tuyên bố này với mức ý nghĩa D 1% Ngược lại, khi sử dụng thức ăn mới và kết quả trung bình xuất chuồng là 3,9 kg, phân tích thống kê cho phép kết luận về ảnh hưởng của loại thức ăn này đối với trọng lượng gà tây với mức ý nghĩa D 1%, từ đó hỗ trợ quyết định về việc áp dụng thức ăn mới trong chăn nuôi.
Giải a Gọi cân nặng trung bình của gà khi xuất chuồng Cần kiểm định:
Giả thiếtH 0 W D 3; 5kg Đối thiết H 1 W ¤ 3; 5kg t D j Nx 0 j pn D j3; 62 3; 5j
2 nên bác bỏ giả thiết Vậy giám đốc báo cáo sai.
Trang 92 Chương 6 Kiểm định giả thiết b Gọi cân nặng trung bình của gà tây khi xuất chuồng (trước khi sử dụng thức ăn mới)
Giả thiếtH 0 W D 3; 9kg Đối thiếtH 1 W ¤ 3; 9kg t D jx n 0 j pn D j3; 62 3; 9j
2 nên bác bỏ giả thiết Vậy thức ăn mới có tác dụng tốt.