Nội dung• Giới thiệu về phân phối chuẩn • Phân phối liên tục • Khái niệm phân phối chuẩn • Phân phối chuẩn tắc Phân phối Z • Một vài bài toán liên quan đến phân phối chuẩn • Tính xác suấ
Trang 1Bài 5:
Phân phối xác suất (tt)
Trang 2Nội dung
• Giới thiệu về phân phối chuẩn
• Phân phối liên tục
• Khái niệm phân phối chuẩn
• Phân phối chuẩn tắc (Phân phối Z)
• Một vài bài toán liên quan đến phân phối chuẩn
• Tính xác suất
• Tìm ngưỡng
• Xấp xỉ phân phối nhị thức bằng phân phối chuẩn
Trang 3Phân phối liên tục
• Phân phối được gọi là liên tục nếu
• biến ngẫu nhiên nhận giá trị trong một miền vô hạn không đếm được
• hàm phân bố tích lũy tạo thành một đường cong
liên tục
• nếu X là một biến ngẫu nhiên liên tục
• không thể sử dụng hàm độ lớn xác suất (pmf) cho X
• ta có thể tính xác suất cho một khoảng giá trị của X
• xác suất X = a với a là bất kỳ giá trị cụ thể nào đều bằng 0
Trang 4Phân phối liên tục
• Được đặc trưng bởi hàm mật độ xác suất (pdf)
f(x) thoả với a ≤ b bất kỳ
• Để tìm xác suất của một biến ngẫu nhiên liên tục, thường ta tính diện tích phần dưới đường cong nằm giữa 2 điểm cần tính xác suất
a
a ≤ X < b = ∫ f x dx
Trang 5Phân phối chuẩn
• Phân phối chuẩn là mô hình xác suất được đặc trưng bởi hai đại lượng
x f
x
, 2
1 )
2
2
) (
σ
µ
π σ
Trang 6Phân phối chuẩn
Trang 7Phân phối chuẩn tắc
• Là phân phối chuẩn chính tắc (phân phối Z)
• Trung bình µ = 0
• Phương sai σ2 =1
• Điểm chuẩn (điểm z) là giá trị biểu diễn độ lệch chuẩn trên hay dưới trung bình
• Bảng phân phối Z: bảng tra phân bố tích lũy
(cdf) khi biết giá trị z
2 1
2
) 0
2
1 2
1
1 )
(
z z
e e
Trang 8Phân phối chuẩn tắc
• Chuẩn hóa phân phối chuẩn N(µ,σ) là biến đổi phân phối chuẩn đã cho sang phân phối Z với N(µ = 0,σ = 1) hay N(0,1).
• Việc chuẩn hóa phân phối chuẩn cho trước để
có thể sử dụng được bảng phân phối Z không làm ảnh hưởng gì đến các xác suất cần tính và như vậy, không ảnh hưởng đến kết quả bài
Trang 9Bài toán 1: tính xác suất
• Bài toán: cho một/khoảng giá trị của X, tìm xác suất nhỏ hơn, lớn hơn hay trong khoảng này
• Các bước thực hiện
• Vẽ hình của phân phối
• Đưa về dạng bài toán xác suất Pr(X<b)
• Chính tắc hóa về phân phối Z
• Tra bảng phân phối Z
• Trả kết quả
Trang 10Ví dụ
• Chiều dài cá được mô hình hóa bằng phân
phối chuẩn N(µ=16 (cm), σ=4 (cm)) Ta cần trả lời các câu hỏi sau:
• Câu hỏi 1: Xác suất bắt được con cá nhỏ (nhỏ hơn
8 (cm))?
• Câu hỏi 2: Giả sử, ai bắt được con cá lớn (lớn hơn
24(cm)) sẽ được thưởng Hỏi xác suất được
thưởng là bao nhiêu?
• Câu hỏi 3: Xác suất bắt được con cá vừa (trong
khoảng 16-24(cm))?
Trang 11Ví dụ (tt)
• Bước 1: biểu diễn đồ thị của phân phối
• Nhớ lại
f(x)
Trang 12• Chú ý là kết quả vẫn không bị ảnh hưởng nếu
ta sử dụng dấu ≤, ≥ thay vì < hay >
Trang 14Ví dụ (tt)
• Bước 4: tra bảng phân phối Z
• Sử dụng bảng Z
• Để tìm xác suất nhỏ hơn z cho trước
• Tìm hàng biểu diễn ký số trước và sau chấm thập phân
• Tìm cột biểu diễn ký số thứ 2 sau dấu thập phân
• Giao của hàng và cột này chính là kết quả cần tìm
• Ví dụ tính P(Z<2.13)
• chọn giá trị ở ô tương ứng với hàng 2.1, cột 0.03 Kết quả là 0.9831, hay P(Z<2.13)=0.9831
Trang 15Bài toán 2: Tìm ngưỡng
• Bài toán: cho Pr(X<a) hay Pr(X>a), tìm a.
• Đối với Pr(X<a), giải như sau
• Diễn tả bài toán dưới dạng xác suất: Pr(X<a)
• Tìm ô có giá trị gần nhất với giá trị Pr(X<a) trong bảng Z
• Lấy nhãn của hàng và cột cộng lại được một số có
2 chữ số thập phân
• Chuyển Z trở về lại X theo công thức: X = Zσ + µ
• Với Pr(X>a), để ý là Pr(X>a) = 1 – Pr(X<a)
Trang 16Bài tập: bài toán 2
• Bài tập: Giả sử chiều dài cá trong hồ có phân
phối chuẩn N(µ=16(cm),σ=4(cm)) Ta muốn trả lời các câu hỏi sau:
• Câu hỏi 4: Biết 10% cá trong hồ là cá nhỏ, vậy thế
nào là cá nhỏ?
• Câu hỏi 5: Chỉ quan tâm đến 10% cá lớn nhất trong
hồ, vậy cá dài hơn bao nhiêu là cá lớn?
Trang 17Xấp xỉ nhị thức bằng pp chuẩn
• Trong phân phối nhị thức, tính xác suất khi số phép thử lớn (ví dụ như 100) là gần như không thể
• Phân phối chuẩn có thể được dùng để xấp xỉ
xác suất nhị thức khi n lớn.
Trang 19• Phân phối nhị thức là rời rạc, còn phân phối chuẩn
là liên tục Vậy, làm thế nào để chỉnh cho liên tục?
Trang 20Xấp xỉ nhị thức bằng pp chuẩn
(tt)
• Câu hỏi 1: n lớn bao nhiêu?
• Quy tắc: có thể sử dụng phối chuẩn để xấp
xỉ nhị thức khi n thỏa (n×p) > 5 và (n×(1 –
p)) > 5 Và n càng lớn thì xấp xỉ càng tốt
Trang 22Xấp xỉ nhị thức bằng pp chuẩn
(tt)
• Câu hỏi 3: hiệu chỉnh liên tục?
• Tại sao cần?
• Khi dùng phân phối chuẩn để xấp xỉ nhị thức, thực
chất ta đang thực hiện quá trình làm trơn cạnh của
các thanh của nhị thức bằng một đường cong liên
tục
Trang 23• Cộng thêm hay trừ đi một lượng bằng ½ tùy thuộc
xác suất ta cần tìm là lớn hơn hay nhỏ hơn
• Nếu xác suất nhỏ hơn hoặc bằng, cộng ½ vào X
trước khi lấy xác suất Chẳng hạn, nếu X ≤ 5 sẽ
được nắn thành 5.5
Trang 24Xấp xỉ nhị thức bằng pp chuẩn
• Quy tắc hiệu chỉnh (tt)
• Nếu xác suất lớn hơn hoặc bằng, trừ ½ khỏi X
trước khi lấy xác suất Chẳng hạn, nếu X ≥ 2 sẽ
được nắn thành 1.5
• Nếu xác suất nằm giữa 2 giá trị, chẳng hạn 2 ≤ X ≤
5, ta thực hiện các bước 1, 2 và 3a để nắn giá trị X
= 5; các bước 1, 2 và 3b để nắn X = 2
• Nếu xác suất bằng đúng 1 giá trị, nắn bằng cách
vừa cộng vừa trừ Chẳng hạn, P(X = 3) nắn thành P(2.5 ≤ X ≤ 3.5)
Trang 26Tóm tắt
• Phân phối chuẩn
• Phân phối liên tục
• Khái niệm phân phối chuẩn
Trang 27Từ khóa
• Phân phối chuẩn (normal distribution)
• Phân phối Z (Z distribution)
• Hàm mật độ xác suất (probability densition function – pdf)