+ P6 = 1 Các biến ngẫu nhiên Một biến mà giá trị của nó được xác định bởi kết quả của một phép thử ngẫu nhiên được gọi là biến ngẫu nhiên random varibale - rv.. Vậy, fx được gọi là PDF
Trang 1A.1 TOÁN TỬ TỔNG VÀ TÍCH
Ký tự hoa Hy Lạp ∑ (sigma) được sử dụng để biểu thị tổng Vậy,
Một số tính chất quan trọng của toán tử tổng ∑ gồm có:
1 ∑i n=1k=nk , với k là hằng số Vậy, ∑4i=13= ⋅ =4 3 12
2 kx i k x
i
n
i i
n
và 2 ở trên
4 (x i y i) x i y
i
n
i i n i
Trang 2x ij x x x j
m i
1 2 1
m
ij i n j m
n i
A.2 KHÔNG GIAN MẪU, ĐIỂM MẪU VÀ BIẾN CỐ
Tập hợp tất cả các kết quả có khả năng xảy ra của một phép thử ngẫu nhiên hay tình
cờ được gọi là tổng thể hay không gian mẫu, và từng phần tử của không gian mẫu này được gọi là điểm mẫu Vậy, trong phép thử tung hai đồng xu, không gian mẫu bao
gồm 4 kết quả có khả năng xảy ra như sau: HH, HT, TH và TT, với HH là hai lần tung đều sấp, HT có nghĩa là lần thứ nhất sấp và lần thứ hai ngửa, và v.v Mỗi trường hợp ở
trên là một điểm mẫu
Một biến cố là tập con của không gian mẫu Vậy, nếu gọi A là trường hợp 1
đồng sấp và 1 đồng ngửa thì trong số các kết quả có thể xảy ra ở trên, chỉ có hai kết
quả thuộc A, cụ thể là HT và TH Trong trường hợp này, A tạo thành một tập con
Tương tự, việc xảy ra hai lần sấp khi tung hai đồng xu là một biến cố Các biến cố
được gọi là xung khắc nếu việc xảy ra biến cố này loại trừ khả năng xảy ra biến cố
Trang 3kia Nếu trong ví dụ trên, HH xảy ra thì biến cố HT không thể cùng đồng thời xảy ra
Các biến cố được gọi là các biến cố đầy đủ nếu chúng đại diện cho toàn bộ các kết
quả có thể xảy ra của một phép thử Vậy, trong ví dụ trên, các biến cố (a) hai sấp, (b) hai ngửa và (c) một sấp, một ngửa đại diện cho toàn bộ các kết quả; có nghĩa là chúng là các biến cố đầy đủ
A.3 XÁC SUẤT VÀ CÁC BIẾN NGẪU NHIÊN
Xác suất
Gọi A là một biến cố trong một không gian mẫu P(A), xác suất của biến cố A, là tỷ lệ số lần biến cố A sẽ xảy ra trong các lần lặp lại của một phép thử Nói một cách khác, trong tổng số n kết quả đồng khả năng của một phép thử, nếu m trong số đó
thuận lợi cho việc xảy ra biến cố A, ta định nghĩa tỷ lệ m/n là tần suất tương đối của
A Với các giá trị lớn của n, tần suất tương đối này sẽ cho ta một con số gần đúng tốt cho xác suất của A
Các tính chất của xác suất P(A) là hàm giá trị thực1 và có các tính chất sau:
1 0 ≤ P(A) ≤ 1 với mọi A
2 Nếu A, B, C, tạo thành một tập hợp đầy đủ của các biến cố thì P(A + B + C + ) =
1, với A + B + C nghĩa là A hoặc B hoặc C, và v.v
3 Nếu A, B, C, là các biến cố xung khắc, thì
P(A + B + C + ) = P(A) + P(B) + P(C) +
Ví dụ 1 Xem xét phép thử tung một con súc sắc với các mặt đánh số từ 1 đến 6 Không
gian mẫu gồm các kết quả 1, 2, 3, 4, 5 và 6 Do vậy, sáu biến cố này chiếm toàn bộ không gian mẫu Xác suất của bất cứ một trong các số này xuất hiện là 1/6 do có sáu kết quả đồng khả năng và bất cứ một trong số chúng có cơ hội xuất hiện bằng nhau Do 1, 2, 3, 4, 5
và 6 tạo thành một tập hợp đầy đủ các biến cố, P(1 + 2 + 3 + 4 + 5 + 6) = 1 với 1, 2, 3,
có nghĩa là xác suất xuất hiện số 1 hay số 2 hay số 3, v.v Và do 1, 2, , 6 là các biến cố
xung khắc, tức là hai số không thể cùng xảy ra, , P(1 + 2 + 3 + 4 + 5 + 6) = P(1) + P(2) + + P(6) = 1
Các biến ngẫu nhiên
Một biến mà giá trị của nó được xác định bởi kết quả của một phép thử ngẫu nhiên
được gọi là biến ngẫu nhiên (random varibale - rv) Các biến ngẫu nhiên thường được
1 Một hàm số có miền và khoảng giá trị la øcác tập con của các số thực thường được gọi là hàm giá trị
thực Về chi tiết, xem Alpha C Chiang, Fundamental Methods of Mathematical Economics (Các phương
pháp toán kinh tế căn bản), Xuất bản lần bậc 3, Mc Graw-Hill, 1984, Chương 2
Trang 4biểu thị bởi các ký tự hoa X, Y, Z, v.v , và các giá trị mà chúng nhận được biểu thị bởi các ký tự thường x, y, z, v.v
Một biến ngẫu nhiên có thể rời rạc hay liên tục Một biến ngẫu nhiên rời rạc
chỉ nhận một số các giá trị có giới hạn (hay vô hạn đếm được).2 Ví dụ, trong việc tung
hai con súc sắc, mỗi con đánh số từ 1 đến 6, nếu ta định nghĩa biến ngẫu nhiên X là tổng các số xuất hiện trên mặt của con súc sắc, thì X sẽ nhận một trong các giá trị: 2, 3,
4, 5, 6, 7, 8, 9, 10, 11 hay 12 Như vậy, nó là một biến ngẫu nhiên rời rạc Mặt khác, một biến ngẫu nhiên liên tục là biến có thể nhận mọi giá trị trong một khoảng các giá trị Vậy, chiều cao của một người là một biến liên tục − trong khoảng, ví dụ, 60 đến 65
in, nó có thể nhận bất cứ giá trị nào, phụ thuộc vào độ chính xác của phép đo
A.4 HÀM MẬT ĐỘ XÁC SUẤT (PDF)
Hàm mật độ xác suất của một biến rời rạc
Gọi X là biến ngẫu nhiên rời rạc nhận các giá trị riêng rẽ x1, x2, , xn, Vậy, hàm số
f(x) = P(X = x i) với i = 1, 2, , n,
được gọi là hàm mật độ xác suất rời rạc (PDF) của X, với P(X = x i) là xác suất mà
biến ngẫu nhiên rời rạc X nhận giá trị x i
Ví dụ 2 Trong việc tung hai con súc sắc, biến ngẫu nhiên X, tổng của các số xuất hiện
trên mặt hai con súc sắc, có thể nhận một trong 11 giá trị PDF của biến này có thể được biểu diễn như sau (xem cả Hình A.1):
f(x) = 1
36
2 36
3 36
4 36
5 36
6 36
5 36
4 36
3 36
2 36
1 36
Các xác suất này có thể được dễ dàng chứng minh Trong tất cả 36 kết quả có thể xảy ra, trong đó một thuận lợi cho số 2, hai thuận lợi cho số 3 (do tổng 3 có thể xảy ra hoặc 1 ở con súc sắc đầu tiên và 2 ở con súc sắc thứ hai hay 2 ở con súc sắc đầu tiên và 1 ở con súc sắc thứ hai) và v.v
2 Đối với thảo luận đơn giản về khái niệm tập hợp vô hạn đếm được, xem R G D Allen, Basic
Mathematics (Toán học cơ bản), Macmillan, London, 1964, trang 104
Trang 5HÌNH A.1
Hàm mật độ của biến ngẫu nhiên rời rạc trong Ví dụ 2
Hàm xác suất của một biến ngẫu nhiên liên tục
Gọi X là một biến ngẫu nhiên liên tục Vậy, f(x) được gọi là PDF của X nếu các điều
kiện sau được thỏa mãn:
Đối với một biến ngẫu nhiên liên tục, trái với biến ngẫu nhiên rời rạc, xác suất
X nhận một giá trị cụ thể bằng 0;3 xác suất của một biến ngẫu nhiên liên tục chỉ tính
được trong một khoảng, như (a, b) trong Hình A.2
Ví dụ 3 Xem xét hàm mật độ sau:
Trang 6Ta có thể chứng minh ngay rằng f(x) ≥ 0 với mọi x trong khoảng 0 tới 3 và 1
2 0
x | ) = 1) Nếu muốn đánh giá PDF ở trên trong khoảng, ví dụ, 0 và 1, ta có 1
9
127
127
2 0
1
3 0 1
x dx x
∫ = ( | )= ; tức là, xác suất x nằm giữa 0 và 1 là 1/27
Hàm đồng mật độ xác suất
Đồng PDF rời rạc Gọi X và Y là hai biến ngẫu nhiên rời rạc Hàm số
Hàm mật độ xác suất biên tế
Trong quan hệ với f(x, y), f(x) và f(y) được gọi là các hàm mật độ xác suất riêng rẽ hay
biên tế Các PDF biên tế này được thiết lập như sau:
0 a b
HÌNH A.2
Hàm mật độ của đại lượng ngẫu nhiên liên tục
Trang 7với, ví dụ, ∑y là tổng tính theo tất cả các giá trị của Y và ∑ x là tổng tính theo tất cả các
X là 1 và ∑ y f(y) của tất cả các giá trị Y cũng vậy (Tại sao?)
PDF có điều kiện Như đã lưu ý ở Chương 2, trong phân tính hồi quy ta thường quan
tâm tới việc nghiên cứu hành vi của một biến theo các giá trị của (các) biến khác Điều này có thể thực hiện bằng cách xem xét PDF có điều kiện
Hàm số
f(x | y) = P(X = x | Y = y)
được gọi là PDF có điều kiện của X; nó cho ta xác suất X nhận giá trị x với điều kiện
là Y có giá trị y Tương tự,
f(y | x) = P(Y = y |X = x) cho ta PDF có điều kiện của Y
PDF có điều kiện có thể tính như sau:
Trang 8),()(
y f
y x f y x
)(
),()(
x f
y x f x y
Như biểu thức trên cho thấy, PDF có điều kiện của một biến có thể được biểu diễn bằng tỷ số giữa đồng PDF và PDF biên tế của một biến khác
Ví dụ 6 Tiếp tục với Ví dụ 4 và 5, hãy tính các xác suất có điều kiện sau:
53.051/27,0)3,2()32
f
Y X f Y
X f
Lưu ý rằng xác suất không có điều kiện f(X = −2) là 0,27, nhưng nếu Y đã nhận giá trị 3, xác suất X nhận giá trị −2 là 0,53
20.049,0/10,0)6(
6,2()62
) Y X f Y
X f
Cũng lưu ý rằng xác suất không có điều kiện X nhận giá trị 2 là 0,26, khác với 0,20 là xác suất X nhận giá trị 2 khi Y đã nhận giá trị 6
Độc lập về thống kê
Hai biến ngẫu nhiên X và Y độc lập về mặt thống kê khi và chỉ khi
f (x, y) = f(x)f(y)
tức là, nếu đồng PDF có thể được biểu diễn bằng tích của các PDF biên tế
Ví dụ 7 Một túi chứa 3 quả cầu đánh số 1, 2 và 3 Hai quả cầu được lấy ra từ túi một cách
ngẫu nhiên, có thay thế (nghĩa là quả cầu thứ nhất lấy ra được đưa trở lại vào túi trước
khi lấy lần thứ hai) Gọi X là chữ số quả cầu thứ nhất được lấy ra và Y là chữ số quả cầu thứ hai được lấy ra Bảng sau cho ta đồng PDF của X và Y
Trang 91 (tính bằng cách cộng hàng thứ nhất) Do f(X, Y) = f(X)f(Y) trong ví dụ này, ta có thể nói
rằng hai biến độc lập về mặt thống kê Ta có thể dễ dàng kiểm tra rằng đối với mọi tổ
hợp khác của các giá trị X và Y trong bảng trên, đồng PDF có thể được tính bằng tích của
các PDF riêng rẽ
Ta có thấy rằng các biến X và Y được cho trong ví dụ 4 là không độc lập về thống kê bởi
vì tích của hai PDF riêng rẽ không bằng với đồng PDF (lưu ý: f(X,Y)=f(X)f(Y) phải đúng với tất cả các tổ hợp của X và Y nếu hai biến này độc lập về thống kê
Đồng PDF liên tục. PDF f(x, y) của hai biến liên tục X và Y:
f (x, y) ≥ 0
1)
()
f( ) ( , ) PDF biên tế của Y
Ví dụ 9 Hai PDF biên tế của đồng PDF trong Ví dụ 8 được tính như sau:
2 2
3 2
3 2
2 2
1
0
2 1
0 1
0
1
0
2 1
xy x x dy
dx y
x
0 2
| ) 2 / 2
3 ( y−y có nghĩa là biểu thức trong ngoặc được tính tại giá trị giới hạn trên (bằng 1) và giá trị giới hạn dưới (bằng 0); giá trị trước trừ đi giá trị sau cho ta giá trị tích phân Vậy, trong ví dụ trên, các giới hạn là
1 2
3 tại y = 1 và tại y = 0, từ đó cho ta giá trị của tích phân là 1
Trang 10x y
f
y x
1
0
2
0 ≤ y ≤ 1
Để xem xét xem hai biến trong Ví dụ 8 có độc lập về thống kê hay không, ta cần phải tìm
xem f(x, y) có bằng f(x)f(y) không Do (2 − x − y) ≠
3 , ta có thể nói rằng hai biến không độc lập về thống kê
A.5 CÁC TÍNH CHẤT CỦA PHÂN PHỐI XÁC SUẤT
Một phân phối xác suất thường có thể được tóm tắt bằng một vài đặc điểm của nó, gọi
là các mômen của phân phối Hai trong số các mômen được sử dụng rộng rãi nhất là
giá trị trung bình hay giá trị kỳ vọng và phương sai
Giá trị kỳ vọng
Giá trị kỳ vọng của một biến ngẫu nhiên rời rạc X, ký hiệu bởi E(X), được định nghĩa
với ∑x là tổng tính theo tất cả các giá trị của X và với f(x) là PDF (rời rạc) của X
Ví dụ 10 Xem xét phân phối xác suất của tổng hai số trong phép thử tung hai con súc sắc
ở Ví dụ 2 (Xem Hình A.1) Nhân các giá trị khác nhau của X thu được với các xác suất
của chúng và cộng theo tất cả các quan sát, ta có:
)36
1(12
)36
3(4)36
2(3)36
1(2)
E
= 7 Kết quả trên là giá trị trung bình của tổng các số quan sát khi tung hai con súc sắc
Ví dụ 11 Ước lượng E(X) và E(Y) từ số liệu trong Ví dụ 4 Ta đã thấy rằng
f(x) 0.27 0,12 0,26 0,35
Trang 11f(y) 0,51 0,49 E(Y) = ∑
9 dx
x x
9
= 2,25
Các tính chất của giá trị kỳ vọng
1 Giá trị kỳ vọng của một hằng số là chính hằng số đó Vậy, nếu b là một hằng số thì
E (b) = b
2 Nếu a và b là hằng số,
E (aX + b) = aE(X) + b Biểu thức này có thể được tổng quát hóa Nếu X1, X2, , X N là N biến ngẫu nhiên và
a1, a2, , a N và b là hằng số, thì
Trang 12E (a1X1 + a2X2 + + a N X N + b) = a1E (X1) + a2E (X2) + + a N E (X N ) + b
3 Nếu X và Y là hai biến ngẫu nhiên độc lập, thì
E (XY) = E(X)E(Y) Tức là, kỳ vọng của tích XY bằng tích của các kỳ vọng (riêng rẽ) của X và Y
4 Nếu X là một biến ngẫu nhiên với PDF f(x) và nếu g(X) là một hàm bất kỳ của X, thì
E [g(X)] = ∑
x
x f X
g( ) ( ) nếu X rời rạc
= ∫−∞∞g(X)f(x)dx nếu X liên tục
Vậy, nếu g(X) = X2,
E (X2) = ∑
x
X f
= ∫−∞∞x2f(X)dx nếu X liên tục
Ví dụ 13 Xem xét PDF sau:
Phương sai
Gọi X là một biến ngẫu nhiên và đặt E(X) = µ Phân phối, hay sự phân tán, của các giá
trị X xung quanh giá trị kỳ vọng có thể được tính bằng phương sai với định nghĩa như
sau:
var(X) = σX2 = E(X − µ)2
Trang 13Căn bậc hai dương của σX2, σX , được định nghĩa là độ lệch chuẩn của X Phương sai
hay độ lệch chuẩn cho biết các giá trị của biến X phân phối gần hay xa giá trị trung
Để thuận tiện cho tính toán, công thức phương sai ở trên cũng có thể được biểu diễn như sau:
207
64 3
2
− − = = ,23
Ví dụ 14 Hãy tìm phương sai của biến ngẫu nhiên trong Ví dụ 3
var(X) = E(X2) − [E(X)]2
Bây giờ
E(X2) = x2 x dx
2 0 3
Trang 14Các tính chất của phương sai
1 E (X − µ)2 = E(X2) − µ2, như đã trình bày ở trên
2 Phương sai của một hằng số bằng 0
3 Nếu a và b là hằng số thì
var(aX + b) = a2var(X)
4 Nếu X và Y là các biến ngẫu nhiên độc lập thì
var(X + Y) = var(X) + var(Y) var(X − Y) = var(X) + var(Y)
Các biểu thức trên có thể được tổng quát hóa cho nhiều hơn hai biến
5 Nếu X và Y là các biến ngẫu nhiên độc lập, a và b là hằng số, thì
var(aX + bY) = a2var(X) + b2var(Y)
Hiệp phương sai
Gọi X và Y là hai biến ngẫu nhiên với giá trị trung bình tương ứng là µx và µy Hiệp
phương sai giữa hai biến được định nghĩa là
cov(X, Y) = E{(X − µx )(Y − µy )} = E(XY) − µxµy
Ta có thể thấy ngay rằng phương sai của một biến là hiệp phương sai của biến đó với chính nó
Hiệp phương sai được tính như sau:
x y
Trang 15Các tính chất của hiệp phương sai
1 Nếu X và Y độc lập, hiệp phương sai của chúng bằng 0, bởi vì
cov(X, Y) = E(XY) − µxµy
= µxµy − µxµy do E(XY) = E(Y)E(Y) = µxµy khi X và Y độc lập
= 0
với a, b, c và d là các hằng số
Ví dụ 15 Hãy tìm hiệp phương sai giữa các biến ngẫu nhiên rời rạc X và Y với đồng PDF
được trình bày trong Ví dụ 4 Từ Ví dụ 11, ta đã biết rằng µx = E(X) = 1,03 và µy = E(Y)
= 4,47
x y
( , )
∑
∑
= (−2)(3)(0,27) + (0)(3)(0,08) + (2)(3)(0,16) + (3)(3)(0) + (−2)(6)(0) + (0)(6)(0,04) + (2)(6)(0,10) + (3)(6)(0,35)
Hệ số tương quan
Hệ số tương quan (tổng thể) ρ (rô) được định nghĩa là:
Với định nghĩa này, ρ là đại lượng đo lường mối quan hệ tuyến tính giữa hai biến và
nằm giữa −1 và +1, − biểu thị quan hệ nghịch biến hoàn hảo và +1 biểu thị quan hệ đồng biến hoàn hảo
Từ công thức ở trên, ta có thể thấy rằng
cov(X, Y) = ρσxσy
Trang 16Ví dụ 16 Ước lượng hệ số tương quan cho số liệu trong Ví dụ 4
Từ các PDF trong Ví dụ 11, ta có thể dễ dàng chỉ ra rằng σx = 2,05 và σy = 1,50 Ta đã tính được rằng cov(X, Y) = = 2,24 Do vậy, áp dụng công thức ở trên, ta ước lượng ρ
bằng 2,24/[(2,05)(1,50)] = 0,73
Phương sai của các biến tương quan. Gọi X và Y là hai biến ngẫu nhiên Ta có
var(X + Y) = var(X) + var(Y) + 2cov(X, Y)
với σ1, σ2 và σ3 tương ứng là các độ lệch chuẩn của X1, X2 và X3, và với ρ12 là hệ số
tương quan giữa X1 và X2, ρ13 là hệ số tương quan giữa X1 và X3 và ρ23 là hệ số tương
quan giữa X2 và X3
Kỳ vọng có điều kiện và phương sai có điều kiện
Gọi f(x, y) là đồng PDF của các biến ngẫu nhiên X và Y Kỳ vọng có điều kiện của X, với điều kiện Y = y, được định nghĩa như sau:
i < j
i < j
Trang 17với E(X Y = y) có nghĩa là kỳ vọng có điều kiện của X với điều kiện Y = y và f(x Y =
y ) là PDF có điều kiện của X Kỳ vọng có điều kiện của Y, E(Y X = x), được định
Ví dụ 17 Tính E(X Y = 2) và var(X Y = 2) cho số liệu trong Ví dụ 4
Các mômen bậc cao hơn của phân phối xác suất
Mặc dù giá trị trung bình, phương sai và hiệp phương sai là những thước đo tổng hợp cho PDF đơn và đa biến được sử dụng nhiều nhất, đôi khi ta cần phải xem xét các mômen bậc cao hơn của PDF, như mômen bậc ba và bậc bốn Các mômen bậc ba và
bậc bốn của PDF đơn biến f(x) xung quanh giá trị trung bình (µ) được định nghĩa như sau:
Trang 18Mômen bậc ba: E(X − µ)3
Mômen bậc bốn: E(X − µ)4
Tổng quát, mômen bậc r xung quanh giá trị trung bình được định nghĩa như sau:
Mômen bậc r: E(X − µ)r
Các mômen bậc ba và bậc bốn của một phân phối thường được sử dụng để
nghiên cứu “hình dạng” của một phân phối xác suất, đặc biệt là skewness, S ( nghĩa là
bất cân xứng) và kurtosis (nghĩa là nhọn hay phẳng), như mô tả trong Hình A.3
HÌNH A.3
(a) Skewness; (b) kurtosis
Một đại lượng skewness được định nghĩa như sau:
Cân xứng Lệch về bên trái Lệch về bên phải
Trang 19X E S
bình trung trị giá quanh xung
hai bậc mômen của
phương Lập
bình trung trị giá quanh xung ba bậc mômen của
phương Bình
=
Lưu ý: Mômen bậc hai xung quanh giá trị trung bình đơn giản là phương sai
Một đại lượng kurtosis thường được sử dụng là:
2 2 4
])([
)(
X E K
hai bậc mômen của
phương Bình
bình trung trị giá quanh xung bốn bậc Mômen
=
Các PDF với giá trị của K nhỏ hơn 3 được gọi là platykurtic (mập hay đuôi ngắn) và các PDF với giá trị K lớn hơn được gọi là leptokurtic (ốm hay đuôi dài) Xem Hình
A.3 Một PDF với giá trị kurtosis bằng 3 được gọi là mesokurtic Phân phối chuẩn là
một ví dụ điển hình (Xem thảo luận về phân phối chuẩn trong Mục A.6)
Chúng tôi sẽ trình bày ngắn gọn làm thế nào các đại lượng skewness và kurtosis có thể được kết hợp để xác định xem một biến ngẫu nhiên có tuân theo phân phối chuẩn hay không Nhớ lại rằng thủ tục kiểm định giả thiết của chúng ta, như kiểm
định t và F, được dựa vào giả thiết (ít nhất là đối với các mẫu nhỏ hay có giới hạn) là
phân phối của biến đang xem xét (hay thống kê mẫu) tuân theo quy luật chuẩn Do vậy, trong các ứng dụng cụ thể, việc tìm xem giả thiết này có được thỏa mãn không là điều rất quan trọng
A.6 MỘT SỐ PHÂN PHỐI XÁC SUẤT LÝ THUYẾT QUAN TRỌNG
Trong các chương, những phân phối sau đây được sử dụng một cách rộng rãi
Phân phối chuẩn
Nổi tiếng nhất trong số tất cả các phân phối xác suất là phân phối chuẩn Dạng hình chuông của phân phối này khá quen thuộc với những ai có chút ít kiến thức về thống kê
Một biến ngẫu nhiên liên tục X được gọi là có phân phối chuẩn nếu PDF của nó
có dạng sau:
Trang 20f (x) = 1
2
12
2 2
σ π
µσ
với µ và σ2, gọi là các thông số của phân phối, tương ứng là giá trị trung bình và
phương sai của phân phối Sau đây là các tính chất của phân phối chuẩn:
1 Phân phối chuẩn đối xứng qua giá trị trung bình của nó
2 Khoảng 68% diện tích phía dưới đường cong chuẩn nằm giữa giá trị µ ± σ, khoảng 95% diện tích phía dưới đường cong chuẩn nằm giữa giá trị µ ± 2σ, và khoảng 99,7% diện tích phía dưới đường cong chuẩn nằm giữa giá trị µ ± 3σ, như minh họa trong Hình A.4
HÌNH A.4
Các diện tích dưới đường cong chuẩn
3 Phân phối chuẩn phụ thuộc vào hai thông số µ và σ2 Vậy, khi các thông số này
được xác định, ta có thể tìm xác suất X nằm trong khoảng nhất định bằng cách sử
dụng PDF của phân phối chuẩn Nhưng nhiệm vụ này có thể được giảm bớt đáng kể bằng cách tham chiếu Bảng D.1 của Phụ lục D Để sử dụng bảng này, ta chuyển
biến có phân phối chuẩn X với giá trị trung bình µ và phương sai σ2 thành biến
chuẩn hóa Z bằng phép biến đổi sau:
Z = x−µ
σ
Một tính chất quan trọng của mọi biến chuẩn hóa là giá trị trung bình của nó
bằng 0 và phương sai bằng 1 đơn vị Vậy, Z có giá trị trung bình bằng không và phương sai đơn vị Thay thế z vào PDF chuẩn ở trên, ta có:
68% (gần đúng) 95% (gần đúng) 99,7% (gần đúng)
Trang 21f (Z) = 1
2
12
2
π exp −
Z
f (Z) là PDF của biến chuẩn hóa Các xác suất trong Phụ lục D, Bảng D.1 được
dựa vào biến chuẩn hóa này
Theo quy ước, ta ký hiệu biến có phân phối chuẩn là
X ~ N(µ, σ2)
với ~ có nghĩa là “có phân phối”, N đại diện cho phân phối chuẩn và các con số
trong ngoặc là hai thông số của phân phối chuẩn, cụ thể là giá trị trung bình và phương sai Theo quy ước này,
X ~ N(0, 1) nghĩa là X là biến có phân phối chuẩn với giá trị trung bình bằng không và phương sai đơn vị Nói một cách khác, nó là biến chuẩn hóa Z
Ví dụ 18 Giả sử X ~ N(8, 4) Xác suất X nhận giá trị nằm giữa X1 = 4 và X2 = 12 bằng bao
nhiêu? Để tính xác suất yêu cầu, ta tính các giá trị Z sau:
Ví dụ 19 Xác suất X lớn hơn 12 trong ví dụ trên bằng bao nhiêu?
Xác suất X lớn hơn 12 giống như trường hợp lớn hơn 2 Từ Bảng D.1, rõ ràng là xác suất
này bằng (0,5 − 0,4772) hay 0,0228
4 Đặt X1 ~ N(µ1, σ12) và X2 ~ N(µ2, σ22) và giả thiết rằng chúng độc lập Bây giờ, ta xem xét kết hợp tuyến tính
Y = aX1 + bX2
với a và b là hằng số Ta có thể chỉ ra rằng
Y ~ N[(aµ1 + bµ2), (a2σ12 + b2σ22)]