Quá trình ngẫu nhiên ứng dụng. PHÂN PHỐI CÓ ĐIỀU KIỆN, HÀM MẬT ĐỘ CÓ ĐIỀU KIỆN, KỲ VỌNG CÓ ĐIỀU KIỆN, CHUẨN HÓA VÀ ÁP DỤNG Với một x cụ thể, hàm f(x,y) là một hình thức của hàm f(x,y), bằng phần giao của bề mặt hàm f(x,y) và mặt phẳng x = hằng số. Phân bố có điều kiện f(x,y) là phương trình của đường cong này, đường cong mà được chuẩn hoá bởi nhân tố 1/ f(x) sao cho tạo nên diện tích = 1
Trang 1TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
VIỆN CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
BÀI TẬP LỚN QUÁ TRÌNH NGẪU NHIÊN VÀ ỨNG DỤNG
TÊN ĐỀ TÀI
PHÂN PHỐI CÓ ĐIỀU KIỆN, HÀM MẬT ĐỘ CÓ ĐIỀU KIỆN,
KỲ VỌNG CÓ ĐIỀU KIỆN, CHUẨN HÓA VÀ ÁP DỤNG
HÀ NỘI 12-2016
Trang 2MỤC LỤC
1 PHÂN BỐ CÓ ĐIỀU KIỆN 4
1 HÀM MẬT ĐỘ CÓ ĐIỀU KIỆN 10
2 KỲ VỌNG CÓ ĐIỀU KIỆN 13
3 HÀM ĐẶC TRƯNG VÀ CHUẨN HÓA 19
3.1 Hàm đặc trưng 19
3.2 Vector chuẩn 21
3.3 Vector chuẩn phức 23
3.4 Dạng chuẩn bậc hai 24
4 ỨNG DỤNG THỰC TẾ CỦA XÁC SUẤT CÓ ĐIỀU KIỆN 27
5 GIẢI BÀI TẬP ỨNG DỤNG TRÊN MATLAB 29
Trang 31 PHÂN BỐ CÓ ĐIỀU KIỆN
(CONDITIONAL DISTRIBUTIONS)
Như chúng ta đã có, phân bố có điều kiện có thể thể hiện như xác suất có điều kiện:
Phân bố này đạt được bằng cách lấy đạo hạm Trong phần này, ta sẽ đánh giá các hàm này trong các trường hợp đặc biệt
Ví dụ 7-7:
Trước hết ta sẽ xác định phân bố có điều kiện F ( y∨x ≤ x) và mật độf y(y∨x ≤ x )
Với µ = (x≤x), (7-38) có:
Ví dụ 7-8: Tiếp theo ta sẽ xác định phân bố F(x,y|μ¿ cho
μ=(x1<x≤ x2) Trong trường hợp này, F (x , y∨μ) sẽ bằng:
Trang 4Trong trường hợp này, 7-38 sẽ thành:
Đạo hàm với biến là y, ta có:
(tham khảo 6.6):
Trang 52, Như chúng ta đã biết tích f (x)dy bằng xác suất của sự kiện
(y≤ y ≤ y +dy) Mở rộng xác suất có điều kiện này ta có:
Trang 6Cái này bằng khối của hình chữ nhật trong hình 7-3a chia cho khối trong phần thẳng đứng mà
x1<x ≤ x2 Tương tự, tích f(y|x)dy bằng tỷ lệ của khối trong hình chữ nhật (đã được đạo hàm) dxdy của hình 7-3b chia cho khối trong phần thẳng đứng (x, x+dx)
3 Xác suất hợp của x và y được xác định bằng phân phối hợp f(x, y) Vì: f ( x , y )=f ( y|x ) f ( x)
Ta kết luận được rằng xác suất hợp này cũng có thể xác định được thông qua phân phối biên f(x)
và phân phối có điều kiện f(y|x)
Ví dụ 7-9: chúng ta sẽ thấy nếu 2 biến ngẫu nhiên x và y là 2 biến có phân phối chuẩn với mean
= 0 thì:
Chứng minh: Số mũ trong 6-44 bằng:
Trang 7Chia cho f(x), bỏ −x2
/2 σ12 và ta có kết quả 7-42
Lý do tương tự dẫn đến kết luận rằng nếu x và y thuộc phân phối chuẩn với E{x} = n1 và E{y} =
n2thì f(y|x) sẽ được tính bằng 7-42 nếu y và x lần lượt được thay bằng y –n1 và x-n2 Nói cách khác, với x cho sẵn, f(y|x) là 1 phân phối chuẩn với trung bình = và hiệpphương sai =
Lý thuyết Bayes và xác suất toàn phần:
Từ 7-41 ta có:
Đây loại phân phối của 2-38
Tử số được biểu thị bằng f(y|x) và f(x)
Vì vậy:
Ta kết luận rằng (xác suất toàn phần)
Thay vào 7-43, ta có lý thuyết Bayes cho phân phối:
Trang 8Chú ý: như 7-44, để loại bỏ điều kiện x = x khỏi phân phối có điều kiện f(y|x), ta nhân phân phối
Trang 9Vì vậy từng nhân tố của ma trận là dương và tổng của mỗi hang =1 Ma trận như vậy gọi là Markoff Xác suất có điều kiện:
Là các nhân tố của ma trận N x M markoff
Hàm mật độ có điều kiện đã được định nghĩa ở phần Hàm phân phối có điều kiện(7.3) Chúng ta
sẽ thảo luận về phần mở rộng khác của phương trình
f(x|y) = f(x,y)/f(x) Lý luận như (7-41), chúng ta kết luận rằng hàm mật độ có điều kiện của các biến ngẫu nhiên xn, , xk+1 giả định xk, , x1 nhận bởi:
Hàm phân phối tương ứng thu được bởi lấy tích phân:
Trang 10Ví dụ:
Quy tắc dây chuyền, từ (8-35), suy ra:
Ví dụ 8-6 Chúng ta phải chứng minh cái [xem ở (5-18)] nếu x là một biến ngẫu nhiên
với phân phối F(x), thì biến ngẫu nhiên y = F(x) đơn điệu về thời gian (0,1) Sau đây là tổng quát
Nhận n tùy ý từ các biến ngẫu nhiên xi, chúng ta tạo các biến ngẫu nhiên
Chúng ta phải chứng minh rằng những biến ngẫu nhiên đó độc lập và mỗi cái đều đơn điệu về thời gian (0,1)
Bằng chứng Các biến ngẫu nhiên yi là các hàm của các biến ngẫu nhiên xi đạt được bằngphép biến đổi (8-38) Cho 0 <= yi <= 1, cái hệ
Có giải pháp duy nhất x1, , xn và Jacobi bằng
Trang 11Đây là ma trận tam giác, vì thế nó bằng kết quả của thành phần đường chéo.
Chèn vào (8-8) và sử dụng (8-37), ta rút ra
Trong không gian n chiều 0 <= yi <= 1, và 0 nếu ngược lại
Từ (8-5) và (8-35) suy ra
Tóm lại, chúng ta rút được những nguyên tắc cho việc bỏ biến ở bên trái hoặc bên phải của cái
“vạch điều kiện”: Để bỏ biến ở bên trái, chúng ta tích phân chúng Để bỏ biến ở bên phải, chúng
ta nhân hàm mật độ có điều kiện với các biến còn lại ở bên phải và tích phân kết quả Cái trường
Trang 12hợp đặc biệt sau đây được sử dụng rộng rãi (Chapman-Kolmogorrof)
Loại gián đoạn Những công thức trên vẫn đúng trong trường hợp biến ngẫu nhiên rời rạc, cung
cấp mật độ là các xác suất cộng lại Chúng ta đề cập như một ví dụ của loại rời rạc (8-39): Nếu biến rời rạc x1,x2, x3 nhận các giá trị ai, bk, cr tương ứng:
2 KỲ VỌNG CÓ ĐIỀU KIỆN
(CONDITIONAL EXPECTED VALUES)
Áp dụng định lý (5-29) đến mật độ có điều kiện,chúng ta đạt được giá trị trung bình của g(x):
(7-56)
Điều này được sử dụng để định nghĩa thời điểm có điều kiện của y:
Trang 13Sử dụng một tham số giới hạn như trong (7-41),chúng ta cũng có thể định nghĩa giá trị có điều kiện trung bình của Đặc biệt:
là giá trị trung bình có điều kiện của y giả sử x = x,và:
(7-58)
Là phương sai có điều kiện của nó
Cho mỗi giá trị của x,tích phân (7-57) là trung tâm của dải (x, x+dx).Quỹ tích của những điểm
này,như x thay đổi từ -∞ đến ∞,trong hàm:
(7-59)
Được hiểu như là đường hồi quy
Chú thích: Nếu 2 biến ngẫu nhiên x và y là hàm có liên quan và khối lượng xác suất trên mặt
phẳng xy có trên đường y = g(x) ,do đó E(y|x) = g(x)
Định lý Galton :hồi quy số hạng có gốc của nó trong quan sát sau quy cho nhà di truyền học
Francis Galton (1822-1911) “Population ex-tremes regress toward their mean.” Điều này
được áp dụng cho lớp cha và con trong thuật ngữ thống kê này có thể phân thành nhiều cụm trong số hạng của có điều kiện kỳ vọng
Giả sử rằng 2 biến ngẫu nhiên x và y là mô hình cao của lớp cha và lần lượt con của chúng.các biến ngẫu nhiên có cùng trung bình và phương sai,và chúng tương quan theo tỷ lệ thuận:
Trang 14
Điều này cho thấy đường hồi quy φ (x) là dưới đường y=x sao cho x >η và ở trên đường x <η Nếu như x và y cùng bình thường thì đường hồi quy cùng phương với φ ( x )=rx Với sự tùy ý của biến ngẫu nhiên,hàm φ ( x ) không tuân theo định lý Galton Số hạng regres - sion được sử
dụng,tuy nhiên, để đồng nhất hoá bất kỳ trung bình có điều kiện:
Ví dụ 7-14: Nếu x và y là bình thường như trong ví dụ 7-9.Khi này hàm:
(7-60)
Là đường thẳng với độ dốc và đi qua điểm Kể từ khi sự bình
thường của RVs giá trị trung bình có điều kiện của E( y∨x) trùng khớp với giá trị lớn nhất của
f ( y∨x ) Chúng ta kết luận quỹ tích của cực đại của toàn bộ điểm của f (x , y ) là 1 đường thẳng.
Từ định lý (7-2) nó theo sau:
Trang 15Biểu thức này có thể được dùng để xác định ,tuy nhiên,mật độ có điều kiện
của f (x , y∨x ) gồm khối tâm của đường trên đường x-không đổi.Để tránh xử lý đường khối
tâm,chúng ta sẽ định nghĩa như một giới hạn
Như chúng ta đã thấy trong ví dụ 7-8,mật độ có điều kiện của f (x , y∨x < x < x +∆ x) bằng 0 ngoài khoảng (x , x +∆ x ) và trong khoảng nơi được tạo bởi (7-39) khi x1=x và x2=x +∆ x.Do
đó,từ (7-61) với M={ x<x <x +∆ x } ta có:
Với ∆ x →0,tích phân ở trên tiến đến ,định nghĩa
với giới hạn ở trên,chúng ta có được:
Từ những điều ở trên có thể kết luận rằng (7-64) theo (7-56),tuy nhiên,điều đó không hoàn
toàn.Hàm g(x,y) và g(x,y) có cùng giá trị kỳ vọng,giả thiết x = x,nhưng chúng không bằng
nhau.Đầu tiên hàm g(x,y) của RVs x và y,và một đặc điểm của ζ nhận giá trị
Trang 16.Thứ hai là hàm g(x,y) của biến thực x và biến ngẫu nhiên y ,và đặc điểm
của ζ nhận giá trị của với x là một số tùy ý
Giá trị kỳ vọng có điều kiện
Giá trị có điều kiện của y,giả sử X = x ,là hàm của x được lấy bởi (7-59),sử dụng hàm này,chúng ta có cấu trúc Như chúng ta thấy ở (5-29) giá trị của biến ngẫu nhiên bằng:
Từ
Kết quả cơ bản này có thể được tổng quát hóa: Giá trị có điều kiện của
,giả thiết x = x là một hàm của biến thực x.Nó định nghĩa hàm của biến ngẫu nhiên x,chúng ta có thể thấy từ (7-2) và (7-61) ,giá trị của bằng:
Nhưng tích phân cuối bằng do đó:
Chú ý cuối cùng là:
Trang 183 HÀM ĐẶC TRƯNG VÀ CHUẨN HÓA
(CHARACTERISTIC FUNCTIONS AND NORMALITY)
Φ i(ω) là hàm đặc trưng của xi Áp dụng định lí chập cho biến đổi Fourier chúng ta thu được
(8-51)
Ví dụ 8-8: (a)(phép thử Bernoulli)
Ta có RVs xi, biến ngẫu nhiên xi đại diện cho lần tung đồng xu thứ i
x i=1 nếu mặt đồng xu ngửa, x i=0 nếu mặt đồng xu xấp
P{x i=1}=P{h}=p
Trang 19(np) k
k !
như trong (3-41) Trên thực tế, chúng ta có thể lập được nhiều kết quả chung hơn nữa Giả sử
RVs xi là độc lập và mỗi xi mang một giá trị 0 hoặc 1 với các xác suất pi tương ứng và qi=1− pi. Nếu pi ≪1 thì
Trang 20Là biến ngẫu nhiên phân phối chuẩn với A bất kỳ A=[a1, … , a n].
Từ định nghĩa chúng ta có những kết luận sau đây: nếu RV s xi có kì vọng bằng 0 và hiệp phương
sai ma trận C thì hàm đặc trưng đồng thời của chúng sẽ bằng
Φ ( Ω)=exp {−1
2ΩC Ω
t
} (8-57)Hơn nữa, hàm mật độ đồng thời sẽ bằng
Trang 21E{e jΩw}=exp [ σ w
2
2 ]Suy ra:
E{e jΩΩ X t}=exp {−1
2∑
i , jΩ
ω i ω jΩ C ijΩ} (8-60)
Như trong (8-57) Chứng minh (8-58) sẽ theo (8-57) và định lí Fourier nghịch đảo
Chú ý, cuối cùng, nếu RV s xi là chuẩn hóa đồng thời và không tương quan, chúng sẽ độc lập
Thật vậy, trong trường hợp này, ma trận hiệp phương sai của chúng là ma trận chéo và các phần
tử chéo bằng σ i2 Do đó C−1 cũng là ma trận chéo với các phần tử chéo là 1
Chứng minh: mở rộng luật số mũ về bên trái và bên phải của mặt phẳng trong (8-60) chúng ta
thấy rằng rõ ràng chỉ những điều kiện được chấp nhận bao gồm các tham số ω1ω2ω3ω4:
Trang 22Với 2n của RVs xi và y jΩ hàm này tuân theo luật số mũ trong (8-58) đã được xác định bởi các
điều kiện được chấp nhận của 2n, 2n ma trận
Φ Z (Ω)=E {exp ( jΩ( u1x1+…+un x n+v1y1+…+u n y n))}
Là tuân theo luật số mũ trong (8-60)
Trong đó U =[u1, … ,u n], V =[v1, … , v n] và Ω=U + jΩV
Ma trận hiệp phương sai của vecto Z phức hợp bởi n ma trận
C ZZ=E{Z t Z¿}=CXX+CYY−jΩ(C XY−CYX)
Với các phần tử E {z i , z jΩ¿
} Như vậy Czz theo lí thuyết từ những điều kiện được chấp nhận của
tham số thực n2 từ những điều này cho thấy rằng, trong trường hợp thực tế khác, hàm mật độ
f z(Z ) của Z nhìn chung không xác định được rõ ràng các điều kiện của Czz bởi vì f z(Z ) là một hàm mật độ tiêu chuẩn bao gồm các tham số của 2 n2
+n giả sử ví dụ như với n=1 Trong trường hợp không bị ràng buộc Z=z=x + jΩy là vô hướng và C zz=E {¿z∨¿2}¿ Vì vậy, C zz trên lí thuyết trong điều kiện được cho phép là một tham số đơn σ z2=E { x2
+y2
} Tuy nhiên f z ( Z )=f ( x , y ) là
Trang 23một hàm mật độ chuẩn hóa có hai biến số bao gồm ba tham số σ x , σ y và E {xy } Theo đó, hiện tại
ta xem xét một loại vecto chuẩn hóa đặc biệt được thống kê rõ ràng với những điều kiện trong
ma trận hiệp phương sai của chúng Loại này là quan trọng trong định lí điều chế [xem (11-3)]
Định lí của Goodman: Với hai vecto X và Y sao cho:
Trang 24(m) và y là X2(n) thì RV z=x + y is X2(m+n) (8-63)
Ngược lại, nếu z là X2
(m+n), x và y là độc lập, và x là X2(m) thì y là X2(n) Theo đó áp dụng này là quan trọng
Phương sai mẫu
Cho N (ɳ , σ ) RVs x ita có dạng phương sai mẫu như sau:
Trang 25việc chứng minh đã được hoàn thành.
Từ (8-65) và (5-71) theo đó giá trị trung bình của RV (n−1) s
Trang 26RVs của x1+x2 và x1−x2 là độc lập bởi vì chúng là tiêu chuẩn phối hợp vàE{ (x1+x2)(x1−x2) }=0.
Từ đó cho thấy rằng RVs x và s2 là độc lập Nhưng RV của (x1−x2)
4 ỨNG DỤNG THỰC TẾ CỦA XÁC SUẤT CÓ ĐIỀU KIỆN
Xác suất có điều kiện có ứng dụng trong các lĩnh vực đời sống như y học ,giáo dục, giao
thông ,công nghiệp
VD1: Một nhà máy sản xuất bóng đèn gồm 3 máy Máy A sản xuất 25%, máy B: 35%, máy C: 40% số bóng đèn Tỉ lệ sản phẩm hỏng của mỗi máy trên số sản phẩm do máy đó sản xuất lần lượt là 3%, 2%, 1% Một người mua bóng đèn do nhà máy đó sản xuất
Tính xác suất để sản phẩm này tốt
Bài giải:
Gọi H1 là biến cố sản phẩm được mua do máy A sản suất
H2 là biến cố sản phẩm được mua do máy B sản suất
H3 là biến cố sản phẩm được mua do máy C sản suất
B là biến cố sản phẩm được mua là sản phẩm hỏng
C là biến cố sản phẩm được mua là sản phẩm tốt
P(H1)=0,25, P(H2)= 0,35, P(H3) = 0,4, P(B/H1) =0,03, P(B/H2) =0,02, P(B/H3) =0,01
Ta có:
P(B) = P(H1).P(B/H1) + P(H2).P(B/H2) + P(H3).P(B/H3)
= 0,25.0,03 + 0,35.0,02 + 0,4.0,01
Trang 27= 0,0185.
Suy ra P(C)=1-P(B)=0.9815
VD2: Người ta nhận thấy rằng có 40% vụ tai nạn giao thông lái xe có nồng độ rượu cao quá mứccho phép Trong những người tham gia giao thông có 4 % người có nồng độ rượu cao Nồng độkhi uống rượu làm tăng khả năng gây tai nạn lên bao nhiêu lần ?
Bài giải:
Gọi A, B, C theo thứ tự là sự kiện bệnh nhân bị bênh tim mạch , huyết học ,tiêu hóa Gọi H là sự kiện khi khám gặp bệnh nhân nặng của cả 3 nhóm , p là xác suất gặp bệnh nhân nặng nhóm tiêu hóa
Theo giả thiết A,B,C là một hệ sự kiện đầy đủ ( hệ mà có tổng xác suất bằng 1 và Các sự kiện A,B,C đôi một xung khắc ) nên phải áp dụng công thức xác suất đầy đủ
Theo đề bài ta có: P(A)=P(B)=0,25 , P(C)=0.5, P(H/A)=0.4, P(H/B) = 0,5, P(H)=0.375
Áp dụng công thức xác suất đầy đủ :
Trang 28P(H) =P(A).P(H/A) +P(B).P(H/B) +P(C).P(H/C)
thay số 0,375=0,25.0,4+0,25.0,5+ 0,5.p =>p =0,3
5 GIẢI BÀI TẬP ỨNG DỤNG TRÊN MATLAB
Mỗi khi làm việc với một bảng số liệu, bạn cần đến các công cụ thống kê MATLAB cung cấp các sẵn các hàm thông dụng như: mean, median, mode, var, cov,
Bảng tóm tắt các hàm matlab liên quan đến các phân phối thường gặp
-Tạo 100 số ngẫu nhiên có phân phối chuẩn với μ = 100 và σ =15
Trang 30Phần Bài tập VD1: