LÝ THUYẾT XÁC SUẤT 1.1 Lịch sử xác suất thông kê 1.1.1 Trong th ực tế Sau sự thiên tài của nhà toán học người Nga Xô Viết Andrei KolmogorovMai, 2016, lý thuyết xác suất đã trở thành mộ
Trang 1TRƯỜNG ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC BÁCH KHOA THÀNH PHỐ HỒ CHÍ MINH
CHƯƠNG TRÌNH KỸ SƯ CHẤT LƯỢNG CAO VIỆT PHÁP
TP HỒ CHÍ MINH, 2021
Trang 2BÁO CÁO CUỐI KỲ MÔN HỌC PHÂN TÍCH DỮ LIỆU (800702(VP_HK211)
HỌ VÀ TÊN: NGUYÊN THANH PHÚ
Trang 3Ph ụ lục
CHƯƠNG 1 LÝ THUYẾT XÁC SUẤT 8
1.1 Lịch sử xác suất thông kê 8
1.1.1 Trong thực tế 8
1.1.2 Trong xây dựng 8
1.2 Định nghĩa 9
1.2.1 Uncertainty ( độ không chắc chắc) 9
1.2.2 Phép thử ( Random experiment) 9
1.2.3 Không gian mẫu ( Outcome spaces hoặc Sample spaces) 9
1.2.4 Biến cố ( Events) 10
A Biến cố chắc chắn 10
B Biến cố trống 11
C Biến cố ngẫu nhiên 11
D Biến cố bằng nhau 11
E Quan hệ giữa các biến cố 12
F Các phép toán tập hợp 13
1.3 Xác suất 15
A Định nghĩa theo suy luận Frequentist: 15
B Định nghĩa cổ điển 16
C Định nghĩa theo suy luận Bayesian 16
D Định nghĩa xác suất theo tiên đề 17
1.4 Các phép tính xác suất 19
Trang 41.4.1 Xác suất của biến cố đối lập 19
1.4.2 Định lý cộng xác suất 19
1.4.3 Định lý nhân xác suất 20
A Xác suất có điều kiện 20
B Biến cố độc lập 21
C Định lý nhân xác suất 21
CHƯƠNG 2 BIẾN NGẪU NHIÊN RỜI RẠC 24
2.1 Biến ngẫu nhiên rời rạc 24
2.1.1 Định nghĩa 24
A Biến ngẫu nhiên 24
B Biến ngẫu nhiên rời rạc (Discrete random variables) 24
2.1.2 Các đặc trưng của biến ngẫu nhiên rời rạc 25
A Kỳ vọng (Expectation) 25
B Phương sai ( Variance) 26
C Độ lệch chuẩn (Standard deviation) 28
D Trung vị 28
E Moment trung tâm (mô-men) 28
F Biến ngẫu nhiên chuẩn hóa (Standardized random variables) 29
2.1.3 Hàm và phân phối của biến ngẫu nhiên rời rạc 30
A Hàm khối xác suất ( Probrability mass function) 30
B Hàm phân phối xác suất 31
C Phân phối Bernoulli 33
Trang 5D Phân phối nhị thức (Binomial distribution) 34
E Phân phối hình học 35
F Phân phối Poisson 36
CHƯƠNG 3 BIẾN NGẪU NHIÊN LIÊN TỤC 39
3.1 Biến ngẫu nhiên liên tục 39
3.1.1 Định nghĩa 39
A Biến ngẫu nhiên liên tục 39
B Hàm mật độ xác suất (Probability density function) 39
3.1.2 Các đặc trưng của biến ngẫu nhiên liên tục 41
A Kỳ vọng 41
B Phương sai 41
3.2 Các phân phối liên tục 41
3.2.1 Phân phối đều 41
3.2.2 Phân phối mũ (Exponential Distribution) 43
3.2.3 Phân phối chuẩn (Normal Distribution) 44
A Phân phối chuẩn 44
B Phân phối chuẩn chuẩn tắc 46
C Tích phân Laplace 47
D Công thức tính xác suất 47
3.2.4 Phân phối Chi-Bình phương( Chi-Squared) 49
3.2.5 Phân phối Student 51
3.3 Hệ số Z của Altman 52
Trang 63.3.1 Giới thiệu 52
3.3.2 Công thức 53
CHƯƠNG 4 KIỂM ĐỊNH GIẢ THIẾT 54
4.1 Khái niệm 54
4.1.1 Giả thiết không (Null Hypothesis) 54
4.1.2 Giả thiết nghịch (Alternative hypothesis) 54
4.1.3 Mức ý nghĩa 55
4.1.4 Miền bác bỏ 55
4.1.5 Kiểm định giả thiêt thông kê 55
4.2 Kiểm định giả thiết tham số 57
4.2.1 Kiểm định giá trị kì vọng của phân phối chuẩn 57
4.2.2 Kiểm định so sánh hai trung bình 62
4.2.3 Kiểm định phương sai 64
A Kiểm định phương sai (A chi-square test) 64
B So sánh phương sai ( F-test) 66
4.2.4 Kiểm định tỷ lệ 68
A Kiểm định giải thiết về tỷ lệ tổng thể 68
B Kiểm định so sánh hai tỷ lệ 69
4.3 Kiểm định giả thiết phi tham số 70
4.3.1 Kiểm định quy luật phân phối (Chi-Square Goodness-of-Fit Test) 70
A Trường hợp không có những tham số chưa biết 70
B Trường hợp có những tham số chưa biết 72
Trang 74.4 Kiểm định tính độc lập (Contingency table) 73
4.4.1 Bảng tương quan 73
4.4.2 Kiểm định Chi-Squared về tính độc lập (Chi-square test of independence) 74
CHƯƠNG 5 QUY HOẠCH TUYẾN TÍNH 77
5.1 Định nghĩa quy hoạch tuyến tính 77
5.2 Sự tồn tại nghiệm và tính chất tập nghiệm quy hoạch tuyến tính 78
5.2.1 Sự tồn tại nghiệm 78
5.2.2 Tính chất tập nghiệm 82
5.3 Giải bài toán quy hoạch tuyến tính hai biến bằng phương pháp hình học 83
5.4 Phương pháp đơn hình 88
5.4.1 Thuật toán đơn hình dạng bảng(Kim, 2008) 89
Tài liệu tham khảo 97
Trang 8CHƯƠNG 1 LÝ THUYẾT XÁC SUẤT
1.1 Lịch sử xác suất thông kê
1.1.1 Trong th ực tế
Sau sự thiên tài của nhà toán học người Nga Xô Viết Andrei Kolmogorov(Mai, 2016), lý thuyết xác suất đã trở thành một nhánh toán học chặt chẽ cung cấp cơ sở cho việc nghiên cứu các quá trình ngẫu nhiên, phép tính ngẫu nhiên và nhiều lý thuyết toán học được sử dụng để hiểu ngẫu nhiên hệ thống cung cấp các ý tưởng và công cụ mới để chứng minh toán học các định lý trong các lĩnh vực lý thuyết số, tổ hợp, phương trình vi phân và vi phân hình học
1.1.2 Trong xây d ựng
Lý thuyết xác suất là nền tảng của thống kê Có rất nhiều ứng dụng của xác suất trong xã hội Ví dụ, chúng ta cần sử dụng lý thuyết xác suất trong các lĩnh vực khác nhau như kế toán, tài chính, thiết kế tổ chức và quản lý nguồn nhân lực và đặc biệt trong ngành xây dựng là đưa ra quyết định trong những điều kiện không chắc chắn
Điều quan trọng là phải nhận ra rằng những thứ khác nhau có thể xảy ra sai sót trong quá trình khác nhau bao gồm các sự kiện như sai sót và lỗi trong quá trình thiết kế, các hư hỏng và tai nạn trong quá trình xây dựng, vận hành Các nguyên nhân tiềm ẩn , sai lầm, hỏng hóc và tai nạn có thể rất nhiều, bao gồm cả lỗi của con người, hư hỏng của các bộ phận kết cấu, các tình huống tải trọng khắc nghiệt và không kém phần các mối nguy hiểm của môi trường tự nhiên Lập kế hoạch cẩn thận trong giai đoạn đầu của dự án là cách duy nhất để kiểm soát các rủi ro liên quan đến các sự kiện đó
Tóm lại, phần quan trọng nhất của lý thuyết xác suất là nghiên cứu về độ không chắc chắn
Trang 9Do đó, trong những bối cảnh này, sự không chắc chắn có liên quan đến kết quả của những quan sát có thể có
1.2.2 Phép th ử ( Random experiment)
Là một quá trình dẫn đến một số (có thể là vô hạn) các kết quả có thể xảy ra và kết quả thực tế xảy ra phụ thuộc vào các ảnh hưởng không thể dự đoán trước Một phép thử thường được lặp lại nhiều lần
Ví dụ: đo chiều cao, làm xét nghiệm, chẩn đoán bệnh hay điều trị bệnh,…là các phép thử
1.2.3 Không gian m ẫu ( Outcome spaces hoặc Sample spaces)
Không gian mẫu Ω là tập hợp của tất cả kết quả có thể có của phép thử ngẫu nhiên
Không gian mẫu hay không gian mẫu toàn thể, thường được ký hiệu là S, Ω
hay U (tức "universal set")
Ví dụ:
Trang 10+Để nghiên cứu hiện tượng ngẫu nhiên về sự xuất hiện sấp hay ngửa khi tung một
đồng tiền, không gian mẫu của thí nghiệm đó là tập hợp Ω ={ngửa, sấp}
Đối với một số thí nghiệm, có thể có hai hoặc nhiều hơn không gian mẫu
Ví dụ:
+Trong một cuộc đua ngựa, nếu chúng ta chỉ quan sát người chiến thắng, chúng ta
có thể lấy Ω = { tất cả số con ngựa trong cuộc đua} , khi chúng ta coi người chiến thắng có thể là một trong những con ngựa có mặt ngày hôm đó
+ Ngoài ra nếu chúng ta quan sát toàn bộ cuộc đua, chúng ta có thể lấy Ω = {thứ tự xếp hạng có thể xảy ra}
1.2.4 Bi ến cố ( Events)
Các tập con của không gian mẫu được gọi là biến cố
Hình 1 Minh họa tập hợp con Dựa vào khả năng xuất hiện của hiện tượng chia các hiện tượng thành 3 loại
A Biến cố chắc chắn
Trang 11Biến cố nhất định xảy ra sau phép thử gọi là biến cố chắc chắn, ký hiệu là Ω
+ Ví d ụ: Tung một con xúc sắc, gọi A là biến cố có số chấm nhỏ hơn hoặc bằng 6,
khi đó A là biến cố chắc chắn
B Biến cố trống
Biến cố nhất định không xảy ra sau phép thử gọi là biến cố không thể có ( biến cố trống) , ký hiệu là Φ
C Biến cố ngẫu nhiên
Biến cố có thể xảy ra, cũng có thể xảy ra sau phép thử Biến cố ngẫu nhiên thường được ký hiệu bởi các chữ A, B, C,… hoặc các chữ số kèm theo chỉ số như A1, A2,
B1, B2, C1, C2, C3,…
+ Ví dụ: Nếu gọi Ai là biến cố con xúc sắc xuất hiện mặt có i chấm (i= 1,6 ) thì A1,
A2, A3, A4, A5,A6 là các biến cố ngẫu nhiên
D Biến cố bằng nhau
Biến cố A gọi là kéo theo biến cố B nếu A xảy ra thì B xảy ra , ký hiệu là A⊂B
Nếu đồng thời có A⊂B và B⊂A thì các biến cố A và B gọi là bằng nhau.(Huy, 2019)
Ví dụ: Tung một con xúc xắc nếu gọi Ai là biến cố con xúc sắc xuất hiện mặt có i chấm (i= 1,6 ), B là biến cố được số nút chia hết cho 3, C là biến cố được số nút chẵn P2 là biến cố được số nút nguyên tố chẵn Khi đó ta có
A2⊂C, A3⊂B
A2⊂P2, P2⊂A2, A2=P2
Từ các định nghĩa, với mọi biến cố A ta có : A⊂Ω, Ω⊂A
Trang 12Do các quan hệ này nên ta có: Các biến cố trống đều bằng nhau và các biến cố chắc chắn đều bằng nhau
E Quan hệ giữa các biến cố
Cho hai biến cố A và B Khi đó ta gọi:
i Tổng của A và B, hay A cộng B
Là biến cố xảy ra khi A xảy ra hoặc B xảy ra, ký hiệu A+B
ii Tích của A và B, hay A nhân B,
Là biến cố xảy ra nếu A và B đồng thời xảy ra, ký hiệu A.B hoặc AB
iii Hiệu của A và B, hay A trừ B
Là biến cố xảy ra nếu A xảy ra nhưng B không xảy ra, ký hiệu A-B
iv Biến cố xung khắc
Hai biến cố A và B gọi là xung khắc nếu chúng không thể đồng thời xảy ra sau phép thử Nói cách khác nếu biến cố A đã xảy ra thì biến cố B không xảy ra và ngược lại, hoặc cả hai biến cố A và B đều không xảy ra sau phép thử
Như vậy, nếu A và B là hai biến cố xung khắc thì A.B = Φ
+Ví dụ Tung một con xúc xắc, gọi A là biến cố: “Xuất hiện mặt có chấm số chấm lớn hơn hoặc bằng 4”, B là biến cố: “Xuất hiện mặt có chấm số chấm nhỏ hơn hoặc bằng 2”
Ta thấy hai biến cố và không cùng xảy ra, do đó A và B là hai biến cố xung khắc
v Đôi một xung khắc
Trang 13Các biến cố A1,A2,…An gọi là đôi một xung khắc nếu hai biến cố khác nhau bất kỳ trong đó dều là xung khắc, tức là:
Ai.Aj=Φ với mọi i≠j +Ví dụ: Tung một con xúc sắc
Gọi: Ai = {con xúc sắc xuất hiện mặt có i chấm} (i = 1,6 ) thì A1 và A2 là hai biến
cố xung khắc, A1 và A6 là hai biến cố xung khắc , A5 và A6 là 2 biến cố xung khắc, vậy A1, A2, A3, A4, A5, A6 là một hệ gồm 6 biến cố xung khắc từng đôi
vi Biến cố đối lập
Biến cố đối lập của A là biến cố xảy ra nếu A không xảy ra và không xảy ra nếu A
xảy ra, ký hiệu 𝐴 hoặc 𝐴𝑐 Nếu A và 𝐴 là 2 biến cố đối lập thì A + 𝐴 = Ω và A 𝐴
= Φ
+ Ví dụ: Một bà mẹ sinh con, biến cố sinh con trai và biến cố sinh con gái là biến
cố đối lập
vii Nhóm đầy đủ các biến cố
Các biến cố A1,A2,…An gọi là nhóm đầy đủ các biến cố nếu chúng đôi một xung khắc và ít nhất một trong chúng chắc chắn xảy ra , tức là:
{𝐴𝐴𝑖 𝐴𝑗 = 𝛷 với mọi i ≠ j
1 + 𝐴2 + ⋯ + 𝐴𝑛 = Ω+ Ví dụ với mọi biến cố A, hai biến cố A, 𝐴 là một nhóm đầy đủ các biến cố
F Các phép toán tập hợp
i Phép giao
Trang 14Giao của hai tập hợp A và B, kí hiệu A ∩ B là tập hợp gồm các phần tử thuộc A và
B, là biến cố xảy ra khi A và B cùng xảy ra
Hình 2 Biểu đồ Venn thể hiện phép giao
Trang 15A Định nghĩa theo suy luận Frequentist:
Định nghĩa theo suy luận Frequentist của xác suất là cách giải thích điển hình của xác suất bởi nhà thực nghiệm Theo cách hiểu này, xác suất P (A) chỉ đơn giản là tần suất xuất hiện tương đối của sự kiện A như được quan sát trong một thí nghiệm với n thử nghiệm, tức là xác suất của một sự kiện A được xác định là số lần sự kiện
A xảy ra chia cho số thử nghiệm được thực hiện:(M.H.Faber, 2012)
𝑃(𝐴) = lim𝑛𝑁𝐴
𝑒𝑥𝑝𝑣ớ𝑖 𝑛𝑒𝑥𝑝 → ∞ Trong đó 𝑁𝐴 là số lần biến cố A xảy ra, 𝑛𝑒𝑥𝑝 là tổng số lần thử nghiệm
+ Ví d ụ: Theo suy luận Frequentist, khi đưa ra xác suất để đạt mặt ngửa khi tung
đồng xu, kết quả sẽ không có Ngoại trừ, khi đã nhận được thêm dữ liệu là sau
Trang 161000 lần tung, thì đạt được mặt ngửa là 563 lần thì câu trả lời là xác suất sẽ là 0.563 khi tung ra được mặt ngửa Tuy nhiên khi tiếp tục tung thì xác suất sẽ dần về 0.5, khi đó ta có nhiều kết quả , rất khó trong việc đưa ra quyết định.Theo định nghĩa xác suất của Frequentist , chỉ những sự kiện ngẫu nhiên lặp đi lặp lại (như kết quả của việc tung một đồng xu) mới có xác suất Trường phái Frequentist phủ định việc gắn xác suất với các giả thuyết hoặc với bất một giá trị cố định mà chưa biết trước.(Thống kê suy luận – Hai trường phải triết học, 2019)
B Định nghĩa cổ điển
Định nghĩa xác suất cổ điển bắt nguồn từ những ngày mà phép tính xác suất được thành lập bởi Pascal và Fermat(Alsalam, 1998) Giả sử phép thử có n trường hợp đồng khả năng, trong số đó có m trường hợp thuận lợi cho biến cố A khi đó ta gọi xác suất của biến cố A là:(Huy, 2019)
𝑃(𝐴) = 𝑚𝑛Như vậy, xác suất của biến cố A là tỷ số về khả năng biến cố xuất hiện
• Thí nghiệm không cần tiến hành vì đã biết trước câu trả lời
C Định nghĩa theo suy luận Bayesian
Các suy diễn từ Bayesian cho phép ta cập nhật những suy diễn xác suất khi thay đổi niềm tin con người, các chứng cứ và thông tin từ dữ liệu:
Trang 17P(A)= mức độ “niềm tin” mà biến cố A xảy ra Mức độ niềm tin là sự phản ánh trạng thái tâm trí của cá nhân về kinh nghiệm, chuyên môn và sở thích.(M.H.Faber, 2012)
Trái ngược với suy luận theo Frequentist, Bayesian là trường phái tạo ra sự linh
hoạt trong đo lường khả năng xảy ra của biến cố, nơi mà chúng ta có thể thay đổi xác suất theo kinh nghiệm một cách linh hoạt thay vì những sự thật tần suất khô khan(Khanh, 2021) Ưu điểm của trường phái Bayesian đó là hoạt động hiệu quả hơn trong các tác vụ dự báo với kích thước mẫu nhỏ
+ Ví d ụ: Tung một đồng tiền cân đối, đồng chất Gọi S là biến cố được mặt sấp, N
là biến cố được mặt ngửa.Ban đầu bạn thực hiện 3 lần tung và thu được kịch bản là [S,N,N]
Theo trường phái Frequentist, Ở lượt tung thứ 4 có quá ít bằng chứng để bạn tin rằng xác suất mặt sấp là 1/3, vì lý do số lượt tung quá ít và đồng xu là đồng chất
Bạn vẫn có niềm tin về tỷ lệ xác suất là cân bằng giữa hai mặt dựa trên phân tích lý trí rằng đồng xu là đồng chất nên mặt sấp và mặt ngửa có vai trò bình đẳng Tổng xác suất của mặt ngửa và mặt xấp là 1 nên xác suất mỗi mặt sẽ là 1/2 Khi đưa ra phỏng đoán về lượt tung thứ 4 bạn không tin xác suất sẽ là 1/3 là một sự thật mà tin vào lý trí khi cho rằng xác suất là 1/2 Đây là suy luận theo Bayeasian
D Định nghĩa xác suất theo tiên đề
Ký hiệu A là tập hợp các biến cố trong một phép thử Ta gọi xác suất là một quy
tắc đặt mỗi A∈A (Ghahramani, 1999)
(I) 0 ≤ 𝑃(𝐴) ≤ 1, 𝐴 ∈ 𝑨
Trang 18Tiên đề (I) : Tiên đề xác suất đầu tiên là xác suất của bất kỳ sự kiện nào là một số
thực không âm Điều này có nghĩa là xác suất nhỏ nhất có thể là 0 và nó không thể
là vô hạn Bộ số mà chúng ta có thể sử dụng là số thực Điều này đề cập đến cả số hữu tỉ, còn được gọi là phân số và số vô tỉ không thể được viết dưới dạng phân số Một điều cần lưu ý là tiên đề này không nói gì về xác suất của một sự kiện có thể lớn như thế nào Tiên đề loại trừ khả năng xảy ra các xác suất âm Nó phản ánh quan điểm rằng xác suất nhỏ nhất, dành riêng cho các sự kiện không thể xảy ra, bằng không
Tiên đề (II) : Tiên đề thứ hai về xác suất là xác suất của toàn bộ không gian mẫu là
một Nói một cách hình tượng, chúng ta viết P ( A) = 1 Ngụ ý trong tiên đề này là khái niệm rằng không gian mẫu là mọi thứ có thể cho thí nghiệm xác suất của chúng ta và rằng không có sự kiện nào bên ngoài không gian mẫu
Tự nó, tiên đề này không đặt giới hạn trên về xác suất của các sự kiện không phải
là toàn bộ không gian mẫu Nó phản ánh rằng một cái gì đó chắc chắn tuyệt đối có xác suất là 100%
Tiên đề (III) :Tiên đề thứ ba về xác suất đề cập đến các sự kiện loại trừ lẫn
nhau Tiên đề thứ ba cho rằng đối với một chuỗi các sự kiện loại trừ lẫn nhau, xác suất xuất hiện của ít nhất một trong số chúng bằng tổng xác suất của chúng
Mặc dù tiên đề thứ ba này có vẻ không hữu ích cho lắm, nhưng chúng ta sẽ thấy rằng kết hợp với hai tiên đề kia, nó thực sự khá mạnh mẽ
Trang 191.4 Các phép tính xác suất
1.4.1 Xác su ất của biến cố đối lập
Với mọi biến cố A, ta có 𝑃(𝐴) = 1 − 𝑃(𝐴)
Chứng minh : Ta có theo tiên đề III và I
Giả sử trong n trường hợp đồng khả năng có thể xảy ra của phép thử:
+ Có m1 trường hợp thuận lợi cho việc xuất hiện của biến cố A, tức là: P(A)=m1/n + Có m2 trường hợp thuận lợi cho việc xuất hiện của biến cố B, tức là: P(B) =m2/n
Trang 20+ Có m trường hợp thuận lợi cho việc xuất hiện cả biến cố A và B, tức là có m trường hợp thuận lợi cho việc xuất hiện biến cố tích A.B Do đó P(A.B) =m.n khi đó số trường hợp thuận lợi cho việc xuất hiện của biến cố tổng (A + B) là: (m1 + m2 – m)
Vì vậy P(A+B) =m1 + m2 – m𝑛 = 𝑃(𝐴 + 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 𝐵)
+Ví d ụ: Có 400 người trong 1 sự kiện Trong đó 300 người tham gia đạp xe hoặc
bơi , 160 người bơi và 120 người bơi và đạp xe Xác suất để chọn ra người tham gia bơi
Giải: Gọi A là biến cố người tham gia bơi,B là biến cố người tham gia đạp xe Khi đó A+B là biến cố người tham gia đạp xe hoặc bơi
Ta có P(A+B)=300/400, P(A)=160/400, P(AB) =120/400
Theo định lý: P(B) = P(A+B)+P(AB) –P(A)
= 300/400+120/400-160/400=260/400=0.65
1.4.3 Định lý nhân xác suất
A Xác suất có điều kiện
Cho hai biến cố A và B Ta gọi xác suất của biến cố A khi biến cố B đã xảy ra là xác suất của A với điều kiện B, ký hiệu P(A/B)
+Ví d ụ: Giả sử 1 lớp chia làm 3 nhóm thực tập Nhóm I có 30 sinh viên trong đó
có 10 nữ, nhóm II có 25 sinh viên trong đó có 10 nữ, nhóm III có 25 sinh viên trong đó có 8 nữ Chọn ngẫu nhiên trong lớp ra một sinh viên, tìm xác suất để đó là sinh viên nữ thuộc nhóm 2?
Trang 21Giải: Gọi B là biến cố sinh viên chọn ra là nữ
A là biến cố sinh viên thuộc nhóm 2
+ Ví d ụ: Khi tung 2 đồng xu, rõ ràng đồng xu này có xuất hiện mặt sấp hay không,
cũng không ảnh hưởng tới xác suất để đồng xu kia xuất hiện mặt sấp (hay ngửa) Như vậy, việc bà mẹ này sinh con trai hay không, cũng không ảnh hưởng tới xác suất sinh con trai (gái) của bà mẹ khác Ta đã nhận biết đưuọc các biến cố vừa xét là độc lập
số trường hợp thuận lợi cho cả biến cố A và B xảy ra
khi đó P(A.B) =m/n và P(A)=m1.n
Trang 22Ta đi tìm P(B/A), với điều kiện biến cố A đã xảy ra rồi thì số kết cục duy nhất đồng khảnăng của phép thử đối với biến cố B là m1 , trong đó m là kết cục thuận lợi cho biến cố B xảy ra
Khi đó theo định nghĩa ta có: P(B/A) =m/m1=𝑚/𝑛
𝑚1/𝑛 = P(A B)/P(A) Vậy p(A.B) = p(A).p(B/A)
Hoàn toàn tương tự ta cũng có thể chứng minh được p(A.B) = p(B).p(A/B)
+ Ví d ụ:
Một tập gồm 10 chứng từ, trong đó có 2 chứng từ không hợp lệ Một cán bộ kế toán rút ngẫu nhiên 1 chứng từ và tiếp đó rút ngẫu nhiên 1 chứng từ khác để kiểm tra
a Tính xác suất để cả 2 chứng từ rút ra đều hợp lệ
b Nếu người đó rút chứng từ thứ ba Tính xác suất để trong chứng từ rút ra chỉ có chứng từ thứ 3 không hợp lệ
Giải: Gọi A = {cả 2 chứng từ rút ra đều hợp lệ}
B = {trong 3 chứng từ rút ra, chỉ có chứng từ thứ 3 không hợp lệ}
Nếu gọi Ai = {chứng từ rút ra lần thứ i là hợp lệ} (i = 1,3) Khi đó ta có :
A = A1 A2 và B = A1 A2 A3
Vì vậy các xác suất cần tìm là:
P(A) = P(A1 A2) = P(A1) P(A2/ A1) =8
10.79 =2845
Trang 23P(B) = P(A1 A2 A3) = P(A1) P(A2/A1) P( 𝐴3/A1 A2)=8
10.79.28 = 457
ii Hệ quả
Nếu A và B là hai biến cố độc lập:
𝑃(𝐴𝐵) = 𝑃(𝐴) 𝑃(𝐵) Tổng quát:
Nếu trong một phép thử, các biến cố A1, A2, …, An có thể cùng xảy ra thì: P(A1 A2 … An) = P(A1).P( A2/A1)….P(An/A1 A2 … An-1)
Giải:
Gọi A = {cả 2 máy đều không bị hỏng trong một ca làm việc}
Nếu gọi Ai = { máy thứ i không bị hỏng trong một ca làm việc} (i =1,2), khi đó ta có: A = A1.A2
Vì vậy xác suất cần tìm là: P(A) = p(A1.A2)
Theo giả thiết A1, A2 là 2 biến cố độc lập với nhau nên ta có:
P(A) = P(A1.A2) = P(A1).P(A2) = 0,72
Trang 24CHƯƠNG 2 BIẾN NGẪU NHIÊN RỜI RẠC
2.1 Biến ngẫu nhiên rời rạc
2.1.1 Định nghĩa
A Biến ngẫu nhiên
Giả sử A1,A2,…An là một nhóm đầy đủ các biến cố Khi đó có một quy tắc X đặt mỗi biến cố Ai với một số xi(i=1, 𝑛) gọi là một đại lượng ngẫu nhiên Đại lượng ngẫu nhiên còn gọi là biến ngẫu nhiên (Huy, 2019)
+ Ví d ụ:
Tung một con xúc xắc Gọi X là số nút xuất hiện Khi đó X là đại lượng ngẫu
nhiên Tập giá trị của X là {1,2,3,4,5,6} nên ta thờng viết:
X={1,2,3,4,5,6}
B Biến ngẫu nhiên rời rạc (Discrete random variables)
Là biến ngẫu nhiên mà giá trị có thể có của nó lập thành một tập hợp hữu hạn hoặc đếm được các giá trị Nói cách khác, ta có thể liệt kê tất cả các giá trị của biến ngẫu nhiên đó
+Ví d ụ:
Tung một đồng tiền cho đến khi được mặt ngửa thì dừng Gọi X là số lần tung Khi
đó X là đại lượng ngẫu nhiên:
X={1,2,…,n}
Đại lượng ngẫu nhiên có dạng:
X={x1,x2,…,xn,…}
Trang 25Các đại lượng này có các giá trị rời nhau, gọi là đại lượng ngẫu nhiên rời rạc
2.1.2 Các đặc trưng của biến ngẫu nhiên rời rạc
A Kỳ vọng (Expectation)
i Kỳ vong được sử dụng đầu tiên bởi Pascal nhưng sau này được phổ biến và trình bày bởi Huygens vào cuối thế kỉ thứ 17
Cho X là đại lượng ngẫu nhiên rời rạc nhận một trong các giá trị có thể có
x1,x2,…,xn với xác suất tương ứng p1, p2,…pn thì ky vọng của X, ký hiệu là E(X) được tính theo công thức:
𝜇 =E(X)= x1p1+x2p2+….+xnpn+….=∑∞ 𝑥𝑛𝑝𝑛
𝑛=1
Vậy: Kỳ vọng của đại lượng ngẫu nhiên là trung bình theo xác suất các giá trị có thể nhận cảu đại lượng ngẫu nhiên đó E(X) là một giá trị trung bình của các xi, mỗi xi được tính với tỷ trọng pi
Tuy nhiên , khi chơi nhiều ván, thì tỷ lệ chiến thắng sẽ phụ thuộc vào số lần chơi nhiều hơn là may mắn Gọi n là số ván chơi Xác suất lần lượt là 0.6n cho lần thua 1$; 0.3n,0.08n và 0.02n cho lần thắng 1$, 2$ và 3$
Ta có: 0.6𝑛 × (−1) + 0.3𝑛 × 1 + 0.08𝑛 × 1 + 0.02𝑛 × 1 = −0.08𝑛
Trang 26Vậy ta có trung bình mỗi ván ta mất 0.08$ Tóm lại, người ấy càng chơi nhiều ván,
sự may mắn sẽ ít được phụ thuộc Bài toán cho giá trị E(X) khi này là âm(-0.08),
có nghĩa, càng chơi nhiều ván thì tỷ lệ thua của ta càng nhiều Nếu kỳ vọng E(X)
=0 thì khi càng chơi, người chơi sẽ tiến dần đến sự hòa vốn
B Phương sai ( Variance)
i Cho X là một đại lượng ngẫu nhiên có kỳ vọng E(X) Khi đó ta gọi
phương sai của X là kì vọng của bình phương độ sái khác giữa X và E(X), ký hiệu là D(X) Vậy:
𝐷(𝑋) = 𝐸[(𝑋 − 𝐸(𝑋))2]
Trang 27Nếu D(X) lớn chứng tỏ sự biến động của X lớn, nếu D(X) nhỏ thì các giá trị của
X biến động ít, tương đối ổn định
Lưu ý:
Phương sai càng lớn thì ta nói biến càng biến động, càng dao động, càng phân tán
Phương sai càng nhỏ thì ta nói biến càng ổn định, càng tập trung, càng đồng đều
Đơn vị của phương sai là bình phương đơn vị của biến ngẫu nhiên Nếu X có đơn
vị là USD thì V(X) đơn vị là USD2; nếu X đơn vị là m (mét) thì V(X) có đơn vị là
m2
Vì phương sai liên quan đến phép tính bình phương, đơn vị của phương sai biến trở thành bình phương đơn vị của biến, nên không thể so sánh phương sai với kỳ vọng hay với giá trị của biến Để dùng cho các phân tích tiếp theo, người ta tính một đại lượng là căn bậc hai của phương sai, gọi là độ lệch chuẩn
ii Tính chất của phương sai
Với mọi đại lượng ngẫu nhiên X,Y và hằng số C ta có:
Phương sai của hằng số bằng không:
Trang 28C Độ lệch chuẩn (Standard deviation)
Độ lệch chuẩn cũng có ý nghĩa như phương sai Độ lêch chuẩn của biến ngẫu nhiên
X, ký hiệu là (X), là căn bậc hai của phương sai của X:
Điều khác biệt lớn nhất là độ lệch chuẩn có đơn vị là đơn vị của X, và như vậy có
thể so sánh độ lệch chuẩn với giá trị có thể có của X, so sánh với kỳ vọng của X
E Moment trung tâm (mô-men)
Cho X là đại lượng ngẫu nhiên có kỳ vọng E(X)=a Ta gọi moment trung tâm cấp k của X là :(Huy, 2019)
Trang 29 Kỳ vọng là moment bậc 1 với a=0, gọi là moment gốc bậc 1
Phương sai là moment bậc 2 với a=E[X], gọi là moment quy tâm bậc 2
F Biến ngẫu nhiên chuẩn hóa (Standardized random variables)
Cho X là biến ngẫu nhiên có kỳ vọng 𝜇 và phương sai σ² Khi đó biến ngẫu nhiên với công thức :
𝑋∗ = 𝑋 − 𝜇𝜎Đại lượng X* được gọi là biến ngẫu nhiên chuẩn hóa của X
Khi chuẩn hóa biến ngẫu nhiên X, ta biến nó trở thành giá trị kỳ vọng và biến đơn
vị về đơn vị của độ lệch chuẩn Lúc này, ta sẽ so sánh các đại lượng với nhau mà
Trang 30không cần sự cạn thiệp của đơn vị đo ban đầu Sự chuẩn hóa trở nên có ích khi được so sánh hai hoặc nhiều biến ngẫu nhiên lại với nhau
+Ví d ụ:
Trong một lớp học, bạn Nam được điểm cuối kỳ trong môn toán và môn văn lần lượt là 72 và 85 Trong đó, môn Văn có số điểm trung bình và độ lệch chuẩn lần lượt là 82 và 7 Và môn Toán có số điểm trung bình và độ lệch chuẩn lần lượt là 68
2.1.3 Hàm và phân ph ối của biến ngẫu nhiên rời rạc
A Hàm khối xác suất ( Probrability mass function)
i Hàm khối xác suất p(x) của một biến ngẫu nhiên rời rạc X được định
nghĩa là :
𝑝(𝑥) = 𝑃(𝑋 = 𝑥) Giả sử X là các giá trị X={x1,x2,…,xn,…} khi ấy: ta được X=xi: p(xi)=P(X=xi)≠0
ii Tính chất của hàm khối
Trang 31B Hàm phân phối xác suất
i Cho X là một đại lượng ngẫu nhiên Ta gọi hàm:
𝐹(𝑥) = 𝑃(𝑋 < 𝑥) là hàm phân phối xác suất của đại lượng ngẫu nhiên
Hàm phân phối xác suất là quy luật cho biết cách gán mỗi xác suất cho mỗi khoảng giá trị của tập số thực, sao cho các tiên đề xác suất được thỏa mãn.(Phân phối xác
Trang 32Giải: Xe buýt đến trạm ở thời điểm bất kỳ, từ 10 đến 1012 , suy ra ta có t
𝑡 𝜖 (10; 1012), ta có hệ phương trình
{
𝐹(𝑡) = 𝑃(𝑋 ≤ 𝑡) = 0, 𝑣ớ𝑖 𝑡 ≤ 0𝐹(𝑡) = 𝑃(𝑋 ≤ 𝑡) = 𝑡 − 10
10 12 − 10= 2(𝑡 − 10), 𝑣ớ𝑖 10 ≤ 𝑡 < 10
12𝐹(𝑡) = 𝑃(𝑋 ≤ 𝑡) = 1, 𝑣ớ𝑖 𝑡 ≥ 1012
Hình 4 Hàm phân phối của ví dụ xe buýt
Trang 33C Phân phối Bernoulli
Nếu thử nghiệm ngẫu nhiên có hai kết quả có thể xảy ra:
Thành công và thất bại
Đúng và sai
Thì những thử nghiệm trên thường được gọi là phép thử Bernoulli
i Một biến ngẫu nhiên rời rạc X có phân phối Bernoulli với tham số p, trong
đó 0 ≤ 𝑝 ≤ 1, nếu hàm khối xác suất của nó được cho bởi p(1)=P(X=1)=p
và p(0)= P(X=0)=1-q, với tham số p có giá trị bằng 1
ii Tính chất của phân phối Bernoulli(Ghahramani, 1999):
Trang 34Đại lượng X là biến ngẫu nhiên Bernoulli với tham số p =1/3 Vậy ta có hàm xác suất như sau:
𝑝(𝑥) =
{
2
3 , 𝑣ớ𝑖 𝑥 = 01
3 , 𝑣ớ𝑖 𝑥 = 1
0 , 𝑛ơ𝑖 𝑘ℎá𝑐Vậy kỳ vọng E(X) =p=1/3 và phương sai D(X)=1/3(1-1/3)=2/9
D Phân phối nhị thức (Binomial distribution)
Phân phối nhị thức (Binomial Distribution) là một dạng lan truyền xác suất rời rạc
Nó được sử dụng trong trường hợp thí nghiệm chỉ có hai khả năng – thành công và thất bại Phân phối nhị thức là một phân phối xác suất rời rạc, nó thể hiện xác suất của một tập gồm hai kết quả khác nhau: thành công (p) và thất bại (q)
i Đại lượng ngẫu nhiên rời rạc 𝑋 = {0,1,2, … , 𝑛} gọi là phân phối nhị thức
nếu tồn tại số 𝑝 ∈ (0,1) sao cho:
𝑝𝑘 = 𝑃(𝑋 = 𝑘) = 𝐶𝑛𝑘𝑝𝑘𝑞𝑛−𝑘, 𝑞 = 1 − 𝑞, 𝑘 = 0, 𝑛 Trong trường hợp này ta ký hiệu 𝑋~𝐵(𝑛, 𝑝)
Nếu bài toán thỏa mãn lược đồ Bernoulli, nghĩa là chỉ ra được:
Có n phép thử độc lập
Trong mỗi phép thử, xác suất xuất hiện biến cố A không đổi là P(A) = p
X là số lần xuất hiện biến cố A trong n phép thử đó thì X phân phối theo quy
luật Nhị thức
ii Tính chất của phân phối nhị thức
Kỳ vọng của biến ngẫu nhiên X bằng tổng các kỳ vọng thành phần của X
Trang 35Trong bệnh viện vào thứ Năm tuần trước, có 10 đứa bé chào đời, trong đó có 6 đứa
bé trai Tìm xác suất để 6 đứa bé đầu chào đời liên tiếp là bé trai?
Gọi A là biến cố 6 đứa bé đầu là bé train ad 4 đứa còn lại là bé gái Gọi X là số bé
t, vậy X là biến nhị thức có tham số là 10 và ½ Vậy xác suất cần tìm là
i Một biến ngẫu nhiên rời rạc X có phân phối hình học với tham số p,
trong đó 𝑝 ∈ (0,1) , có công thức xác suất thành công với n lần thử:
𝑃(𝑋 = 𝑛) = 𝑝 × 𝑞𝑛−1
Với p là xác thành công cho một lần thử duy nhất
q là xác suất thất bại cho một lần thử duy nhất
n là số lần thử
Trang 36ii Tính chất của phân phối hình học
F Phân phối Poisson
Trong phân phối nhị thức, khi xảy ra n! số lần thử, dãy số nào quá lớn để có thể thực hiện công việc tính toán(Ghahramani, 1999) Phân bố Poisson được ra đời để
Trang 37phục vụ cho công tác này Là xác suất của biến ngẫu nhiên rời rạc và nó thường được sử dụng rộng rãi trong các công việc có thể đo đạc được Sự phân bố này được đưa ra bởi nhà toán học người Pháp, tiến sỹ Simon Denis Poisson vào năm
1837 và phân bố này được đặt theo tên ông Sau khi ông qua đời, nhà toán học người Nga L.V.Bortkiewicz đã hoàn tất những công việc còn lại Hiện nay, phân phối Poisson được phổ biến nhất, chỉ đứng sau phân phối nhị thức và phân phối chuẩn trong ngành thống kê
Phép tuần hoàn Poisson được tận dụng như một phần của các trường hợp mà xác suất xuất hiện của một sự kiện là nhỏ, nghĩa là sự kiện chỉ xảy ra một lần sau một khoảng thời gian dài Ví dụ, xác suất xảy ra lỗi trong quá trình thành lập tập đoàn
là nhỏ, xác suất xảy ra chấn động trong một năm là nhỏ, việc rủi ro xảy ra trên đường phố là nhỏ, và tương tự như vậy Tất cả đều là những trường hợp mà xác suất xảy ra sự kiện là nhỏ
i Đại lượng ngẫu nhiên 𝑋 = {0,1,2, … , 𝑛} gọi là có phân phối Poisson nếu
tồn tại 𝑎 > 0, a là tham số của phân phối Poisson:
Trang 38Trung bình trong một cuốn sách, cứ 3 trang là có 1 lỗi đánh máy Nếu số lồi đánh máy là biến ngẫu nhiên Poisson, xác suất để có ít nhất 1 lỗi trên cuốn sách đó là bao nhiêu?
Giải: Gọi X là số lỗi trên 1 trang cụ thể X là biến ngẫu nhiên Poisson với tham số k=1/3=E(X) có công thức
𝑃(𝑋 = 𝑘) = (1/3)𝑘𝑒−1/3
𝑛!
Suy ra,:𝑃(𝑋 ≥ 1) = 1 − 𝑃(𝑋 = 0) = 1 − 𝑒−13 ≈ 0.28
Trang 39CHƯƠNG 3 BIẾN NGẪU NHIÊN LIÊN TỤC
3.1 Biến ngẫu nhiên liên tục
3.1.1 Định nghĩa
A Biến ngẫu nhiên liên tục
Nếu với biến ngẫu nhiên rời rạc ta có thể liệt kê các giá trị có thể, thì biến ngẫu nhiên liên tục các giá trị có thể có của nó lấp đầy một khoảng và không thể liệt kê chi tiết ra được
Trong thực tế, có nhiều biến ngẫu nhiên bản chất là rời rạc, tuy nhiên vì số lượng giá trị cảu nó là rất nhiều nên cũng có thể xét như là biến ngẫu nhiên liên tục
+Ví d ụ:
Trọng lượng của một loại sản phẩm, mực nước biển tại một thời điểm là những đại lượng ngẫu nhiên liên tục
B Hàm mật độ xác suất (Probability density function)
i Cho X là đại lượng ngẫu nhiên liên tục, có hàm phân phối F(x) là một
đạo hàm Khi đó ta gọi hàm:
𝑓(𝑥) = 𝐹′(𝑥) là hàm mật độ xác suất Hàm mật độ xác suất của biến ngẫu nhiên liên tục X, ký hiệu là f(x), là hàm số không âm trong khoảng giá trị của X và diện tích tạo bởi hàm số đó và trục hoành bằng 1, thể hiện sự phân phối xác suất của X
ii Tính chất của hàm mật độ xác suất
Hàm mật độ xác suất của đại lượng ngẫu nhiên X có các tính chất sau:
𝑓(𝑥) ≥ 0
Trang 40Hiển nhiên f(x)≥ 0 và diện tích của tam giác ABC trên đồ thị bằng 1
Hình 5 Đồ thị hàm f(x)