BÀI GIẢNG xác suất và các phép tính xác suất trong THỐNG KÊ NỘI DUNG 1. Trình bày được khái niệm cơ bản về xác suất của một sự kiện 2. Thực hiện được các phép tính xác suất trên sự kiện ngẫu nhiên 3. Trình bày được khái niệm phân bố xác suất và các dạng phân bố xác suất 4. Tính được xác suất của một sự kiện ngẫu nhiên dựa vào phân bố xác suất của sự kiện dó.
Trang 1Xác su t và các phép ấ
Trang 24 Tính được xác suất của một sự kiện ngẫu nhiên dựa
vào phân bố xác suất của sự kiện dó
Trang 3M c tiêu 1: Xác su t m t s ụ ấ ộ ự
ki n ệ
• Khả năng xuất hiện một sự kiện, thông thường đó là một sự
kiện không chắc chắn hoặc một sự kiện trong tương lai.
• Xác suất lấy được quả bóng xanh trong rổ có 6 quả bóng xanh và
Trang 4Xác su t m t s ki n (tt) ấ ộ ự ệ
• Có n thử nghiệm, sự kiện A là sự kiện quan tâm:
• Số lần xuất hiện sự kiện A: m
• Số lần thử nghiệm: n
Xác suất xuất hiện sự kiện A là: P(A) = m/n
• Ví dụ: Có 100 người được hỏi “đã từng QHTD với GMD
chưa?”, trong đó có 32 người trả lời “có”
Trang 6M c tiêu 2: Tính xác su t ụ ấ
• Số người hút thuốc lá theo nhóm tuổi
Trang 8• Hoặc A xuất hiện
• Hoặc B xuất hiện
• Hoặc cả A và B cùng xuất hiện
Trang 10Xác su t có đi u ki n ấ ề ệ
• Xác suất để xuất hiện sự kiện B khi sự kiện A đã xảy ra gọi là xác
suất có điều kiện Ký hiệu P(B|A)
• Xác suất 1 người bị cúm khi đã được tiêm phòng vaccine cúm
• Xác suất chọn người 30-39 tuổi: P(A) = 867/2534
• Xác suất chọn người vừa 30-39 vừa không hút thuốc P(B ) =
406/2534
Xác suất chọn được người không hút thuốc khi biết người đó 30-39: P(B|A) = = 406/867 = 0,4683
•
Trang 12Phép nhân xác su t: P(A∩B) ấ
• Chính là phép GIAO hai sự kiện
• Công thức tính xác suất có điều kiện: P(B|A) =
P(A ∩ B) = P(B ∩ A) = P(A|B) × P(B) = P(B|A) × P(A)
• Ví dụ: Xác suất chọn 1 nhân viên tuổi 30-39 (A) và không hút thuốc (B):
• P(Z) = P(A ∩ B) = P(B ∩ A) 406/2534 = 0,1602
• P(A ∩ B) = P(B|A) × P(A) = (406/867) x (867/2534) = 406/2534= 0,1602
• P(A ∩ B) = P(A|B) × P(B) = (406/1039) x (1039/2534) = 406/2534= 0,1602
•
Trang 14• Biến ngẫu nhiên rời rạc: số bé trai trong các lần sinh
• Biến ngẫu nhiên liên tục: thời gian chờ đợi
Trang 15Phân b xác su t (tt) ố ấ
• Ví dụ: Nghiên cứu trên 173 gia đình, hỏi các gia đình về việc
“có bao nhiêu (k) người thân làm chung công ty” Kết quả như
0,31 0,12 0,05 0,03 0,02
P 2 (X≤k)
0,08 0,39+0,08=0,47 0,31+0,47=0,78
0,90 0,95 0,98 100
Trang 16Phân b xác su t (tt) ố ấ
• Bảng, biểu đồ, hàm số mô tả mối quan hệ giữa một biến ngẫu nhiên X và xác suất xảy ra biến X thì gọi là phân bố xác suất của biến X
• Ví dụ:
• Bảng phân bố xác suất của X
• P1(X=k) là hàm phân bố xác suất của X tại một điểm k
• P2(X≤k) là hàm phân bố xác suất tại các giá trị nhỏ hơn k, hay còn
gọi là hàm mật độ xác suất tích lũy
• Tính chất:
• Tổng xác suất của tất cả các trường hợp X bằng 1
• Xác suất tại một điểm k: 0 ≤ P(X=k) ≤1
Trang 17Ví d th c hành 1: bi n r i r c ụ ự ế ờ ạ
• Chồng nhóm máu O, vợ nhóm máu A và có 3 người con Tính
xác suất để cặp vợ chồng này có 0, 1, 2, 3 người con có nhóm máu A.
• Bước 1: Liệt kê các trường hợp có thể xảy ra:
• Cả 3 trẻ đều có nhóm máu O: OOO
• Có 2 trẻ nhóm máu O và một trẻ nhóm máu A: OOA, OAO, AOO
• Có 1 trẻ nhóm máu O và hai trẻ có nhóm máu A: OAA, AOA, AAO
• Cả ba trẻ đều có nhóm máu A: AAA
Tổng cộng có 8 trường hợp
• Bước 2: Xác suất của từng trường hợp: 1/8
• Bước 3: Các khả năng của X trong từng trường hợp
Trang 18Ví d th c hành (tt) ụ ự
• Bước 4: Xác định số lượng người con nhóm máu A trong từng
trường hợp (gọi k là số lượng người con nhóm máu A)
• Bước 5: Tính xác suất cho từng giá trị X khi X=k
Bước 5 là hàm phân bố xác suất
Hàm mật độ xác suất tích lũy
Trang 19• Xác suất thành công (p) là như nhau đối với mỗi phép thử
• Ví dụ: Tỷ lệ mắc bệnh tim mạch trong cộng đồng là 25% Nếu chọn ngẫu nhiên 10 người, tính xác suất:
• không có ai mắc bệnh tim mạch
• 1 người mắc bệnh tim mạch
• 2 người mắc bệnh tim mạch….
•
Trang 21Ví d th c hành 2 ụ ự
• Tỷ lệ nhóm máu A trong một quần thể là 40%
• Chọn ngẫu nhiên 10 người trong quần thể đó, tính xác suất để có đúng 3 người có nhóm máu A
• Chọn ngẫu nhiên 10 người trong quần thể đó, tính xác suất để có
ít hơn 3 người có nhóm máu A
• Phân phối nhị thức là cho biến ngẫu nhiên rời rạc
Trang 22Bài t p th c hành ậ ự
• Biết rằng trong một cộng đồng, tỷ lệ người dân bị đái tháo đường là 12% Nếu chúng ta chọn ngẫu nhiên 10 người từ
cộng đồng đó, hãy tính:
• xác suất để 1 người bị đái tháo đường
• xác suất để 5 người không bị đái tháo đường
• xác suất để có nhiều nhất 2 người đái tháo đường
• Biết rằng trong một cộng đồng, tỷ lệ người dân bị THA là 25% Nếu chúng ta chọn ngẫu nhiên 10 người từ cộng đồng đó, hãy tính:
• xác suất để 1 người bị THA
• xác suất để có nhiều nhất 3 người bị THA
• xác suất để ít nhất 4 người THA
Trang 24Phân ph i chu n ố ẩ
• Hàm mật độ:
• Tính chất:
• Đường cong có dạng đối xứng qua giá trị trung bình µ
• Tổng diện tích nằm dưới phân phối chuẩn bằng 1
• Trung bình, trung vị và mode là bằng nhau
• Độ lệch chuẩn σ xác định độ phân tán xung quanh giá trị trung bình và hình dạng của phân phối
Trang 25Phân b chu n t c ố ẩ ắ
Trang 28Cách tra b ng: Di n tích phía bên trái ả ệ
Trang 29Ví d th c hành 3 ụ ự
• Tìm diện tích phía bên phải của giá trị z =1,23
• Tìm diện tích phía bên trái của giá trị z =-0,5
• Tìm diện tích nằm giữa giá trị -0,5 và 1,23
Trang 31Ví d th c hành 5 ụ ự
• Trung bình là số gram protenin (thịt, cá, trứng và sữa) mà một người tiêu thụ trên ngày là 250g và độ lệch chuẩn là 25g Xác suất để chọn được một người có mức protein nằm trong
khoảng từ 225g đến 275g