không gian xác suấtA.- Biến cố ngẫu nhiên 1.- Khái niệm: Trong vô số các hiện t−ợng xảy ra chung quanh, ta có thể phân biệtthành hai loại: a Hiện t−ợng tất yếu: là hiện t−ợng mà nếu đ−ợc
Trang 1không gian xác suất
A.- Biến cố ngẫu nhiên
1.- Khái niệm: Trong vô số các hiện t−ợng xảy ra chung quanh, ta có thể phân biệtthành hai loại:
a) Hiện t−ợng tất yếu: là hiện t−ợng mà nếu đ−ợc thực hiện trong cùng một điều kiệnnh− nhau thì chúng cho các kết quả giống nhau
b) Hiện t−ợng ngẫu nhiên: là hiện t−ợng mà dù đ−ợc thực hiện trong cùng một điềukiện chúng vẫn cho các kết quả khác nhau
Ví dụ:
• Gieo một đồng xu, kết quả sấp hay ngữa là hiện t−ợng ngẫu nhiên,
• Khi gieo một con xúc sắc, số nốt xuất hiện ở mặt trên của nó là một hiệnt−ợng ngẫu nhiên
Đối t−ợng nghiên cứu của lý thuyết xác suất là các biến cố ngẫu nhiên, do vậy
ta cần trang bị cho chúng một cấu trúc toán học thích hợp Đó là đại số các biến
cố ngẫu nhiên
Ta sẽ luôn coi rằng các biến cố trong một đại số các biến cố đều có liên quantới kết quả của một "phép thử" nào đó ở đây "phép thử" đ−ợc hiểu là sự thực hiệnmột số điều kiện nhất định
Mỗi phép thử gắn với một tập hợp các kết quả có thể xảy ra với mỗi biến cốthuộc đại số các biến cố ta phải khẳng định đ−ợc rằng: khi một kết quả nào đó củaphép thử đ−ợc thực hiện nó xảy ra hay không xảy ra
Giả Sử A, B, C, là các biến cố ngẫu nhiên có liên quan tới kết quả của mộtphép thử F nào đó
• Ta nói A, B là đồng nhất, và viết A = B, nếu với mỗi kết quả có thể của phépthử chúng cùng xảy ra hoặc cùng không xảy ra
• Sự không xuất hiện của A đ−ợc xem là sự xuất hiện của biến cố đối A, kýhiệu Ac, hay A
• Sự xuất hiện đồng thời hai biến cố A, B đ−ợc coi là sự xuất hiện của biến cốgiao A giao B, ký hiệu A ∩ B hay A.B
• Sự không thể xuất hiện đ−ợc coi là một biến cố, gọi là biến cố không thể cóhay không, ký hiệu là ∅ hay V
• A, B gọi là xung khắc nếu AB = ∅
• Sự xuất hiện ít nhất một trong hai biến cố A, B đ−ợc coi là sự xuất hiện củabiến cố hợp A hợp B, ký hiệu A ∪ B Khi A.B = ∅ ta viết A + B thay A ∪ B
• Sự chắc chắn xuất hiện đ−ợc coi là một biến cố, gọi là biến cố chắc chắn, kýhiệu Ω
Trang 2\i=1
Ai
!c
=
n[i=1
Aic;
n[i=1
Aic
Ví dụ:Xét phép thử F: gieo đồng thời hai xúc sắc đều, đồng chất Gọi A, B, C, D, E
là các biến cố ngẫu nhiên liên quan đ−ợc xác định nh− sau:
A: "Tổng số nốt xuất hiện trên hai xúc sắc là số chẵn"
B: "Tổng số nốt xuất hiện trên hai xúc sắc là số lẻ"
C: "Số nốt xuất hiện trên mỗi xúc sắc là số lẻ"
D: "Số nốt xuất hiện trên mỗi xúc sắc là số chẵn"
E: "Số nốt xuất hiện trên hai xúc sắc cùng lẻ hoặc cùng chẵn"
Khi đó ta có các hệ thức (dễ dàng kiểm tra đ−ợc): A = E; Ac = B; A.B =
∅; A = C + D; D ⊂ A;
3.- Định nghĩa đại số vàσ đại số:
Trang 3Tập A các phần tử tùy ý A, B, C, được gọi là một đại số Boole hay mộttrường khi các điều kiện sau được thực hiện:
1 Ω ∈A
2 A ∈ A =⇒ Ac ∈ A
3 Ak ∈ A =⇒
nSk=1
2) Giả sử Ω là tập khác rỗng, ký hiệu C(Ω) là lớp mọi tập con của Ω Với cácphép toán tập hợp đã biết (lấy giao, hợp, phần bù) cùng với tập rỗng, C(Ω) lập nênmột đại số Boole
3) Giả sử A ⊂ Ω, Ω 6= ∅ Xét lớp CA = {∅, Ω, A, Ac} với các phép toán tập hợpthông thường CA tạo nên một σ- đại số
4.- Liên hệ giữa đại số các biến cố và đại số các tập hợp:
Mối liên hệ nầy được thể hiện qua định lý Stone dưới đây:
Định lý: Mỗi đại số các biến cố có một đại số các tập hợp đẳng cấu với nó
• Một biến cố A được gọi là phức hợp nếu nó có thể biểu diễn dưới dạng hợphai biến cố không đồng nhất với nó
• Một biến cố A không phải là phức hợp được gọi là biến cố sơ cấp
Từ các kết quả trên ta suy ra: một biến cố phức hợp có thể xuất hiện theo nhiềucách khác nhau Một biến cố sơ cấp chỉ xuất hiện theo một cách duy nhất Cácbiến cố sơ cấp thì xung khắc nhau
Trong đại số các biến cố, mỗi biến cố ngẫu nhiên biểu diễn được dưới dạngtổng một số hữu hạn các biến cố sơ cấp một cách duy nhất Như vậy một biến cố
A ứng với một tập các biến cố sơ cấp mà sự xuất hiện của mỗi biến cố nầy kéotheo sự xuất hiện của A Chúng được gọi là các biến cố thích hợp với A Tươngứng nầy bảo tồn các phép toán trong A; biến cố "không thể có" ứng với tập rỗng
∅ Biến cố "chắc chắn" Ω ứng với tập tất cả các biến cố sơ cấp của phép thử vì vậy
Ω được đồng nhất với không gian biến cố sơ cấp.
Trang 4B.- Xác suất
Quan sát các hiện tượng ngẫu nhiên ta thấy có những hiện tượng thường xảy
ra, có những hiện tượng ít xảy ra Xác suất là một đại lượng thể hiện mức độ xảy
ra (thường xuyên hay ít khi) của một biến cố trong lịch sử toán học đã có nhiều
định nghĩa cho khái niệm xác suất ở giáo trình nầy ta sẽ tiếp xúc với một số địnhnghĩa tiêu biểu
1.- Định nghĩa cổ điển của xác suất:
Nếu A là biến cố có n(A) biến cố sơ cấp thích hợp với nó trong một không gian
biến cố sơ cấp gồm n(Ω) biến cố cùng khả năng xuất hiện thì tỉ số P (A) = n(A)
n(Ω)
được gọi là xác suất của A
Như vậy điều kiện để áp dụng định nghĩa nầy là:
20.Chú ý: Để tính xác suất theo định nghĩa cổ điển ta phải tìm n(Ω) và n(A) mộtcông cụ được sử dụng nhiều là giải tích tổ hợp đã được chuẩn bị ở trung học
2.- Định nghĩa xác suất theo quan điểm hình học:
Khi n(Ω) vô hạn, ta không thể áp dụng định nghĩa cổ điển để tính xác suất.trong nhiều trường hợp ta có thể sử dụng định nghĩa xác suất theo quan điểm hìnhhọc như sau:
Giả sử một điểm được rơi ngẫu nhiên vào miền D, A là một miền con của D.Khi đó xác suất để điểm rơi ngẫu nhiên vào miền A được xác định bởi công thức:
P (A) = số đo miềnA
số đo miềnD(Số đo ở đây có thể là độ dài, diện tích hay thể tích tùy thuộc vào miền xét trên
đường thẳng, mặt phẳng hay không gian ba chiều)
Một ví dụ điển hình là "bài toán gặp gỡ":
Hai người hẹn gặp nhau tại một địa điểm vào khoảng từ 11 giờ đến 12 giờ Họqui ước rằng người đến trước sẽ chỉ đợi 20 phút, nếu không gặp sẽ đi Giả sử việc
Trang 5đến điểm hẹn của hai người là ngẫu nhiên tìm xác suất để hai người gặp nhau?
3.- Định nghĩa xác suất theo quan điểm thống kê:
Tiến hành n phép thử độc lập, như nhau và theo dõi sự xuất hiện biến cố A cóliên quan Gọi n là số phép thử đã tiến hành, n(A) là số phép thử có A xuất hiện,
tỉ số n(A)
n được gọi là tần suất xuất hiện A
Khi số phép thử n đủ lớn ta có thể lấy tần suất của A thay cho xác suất P (A)(mà ta chưa biết) Nếu tồn tại lim
n→∞
n(A)
n thì giới hạn nầy là P (A)
4.- Định nghĩa tiên đề của xác suất:
Cho Ω là một không gian; gọi A là σ - đại số các tập con của Ω P (.) là hàmtập xác định trên A Ta gọi P là hàm xác suất nếu các tiên đề sau đây được thỏamãn:
(i) P (A) ≥ 0, ∀A ∈ A
P (An)(iii) P (Ω) = 1
Bộ ba (Ω; A; P ) được gọi là không gian xác suất.
Từ hệ tiên đề trên người ta chứng minh được các tính chất của xác suất sau đây(ta chấp nhận không chứng minh để sử dụng tính toán xác suất):
Ak
=
nPk=1
P (Ak)
Mệnh đề 2: Giả sử A, B là là các biến cố ngẫu nhiên bất kỳ Khi đó:
a) P (A ∪ B) = P (A) + P (B) ư P (A.B)
b) chulucNếu A ⊂ B thì P (A) ≤ P (B)
c) ∀A ∈A, có 0 ≤ P (A) ≤ 1 và P (Ac) = 1 ư P (A)
Ví dụ: Một hộp chứa 5 cầu trắng, 3 cầu xanh và 4 cầu đen cùng kích thước Chọnngẫu nhiên cùng lúc 3 cầu Tìm xác suất để:
a) Cả ba cầu cùng màu
b) Có đúng hai cầu cùng màu
c) Có ít nhất hai cầu cùng màu
d) Cả ba cầu khác màu
C.- Xác suất điều kiện
Trang 6Trong mục nầy ta sẽ xây dựng một đại lượng để biểu thị khả năng xuất hiệnmột biến cố A khi có một biên cố B đã xuất hiện với xác suất nào đó.
1.- Định nghĩa:
Xét không gian xác suất (Ω; A, P )
Giả sử B là biến cố ngẫu nhiên có P (B) > 0, A ∈A Đại lượng P (A/B) =
P (A ∩ B)
P (B) được gọi là xác suất của A với điều kiện B.
Có tài liệu dùng ký hiệu: PB(A), PB(A)
Nhận xét:
• Trong định nghĩa xác suất cổ điển ta có: P (A/B) = n(A ∩ B)
n(B) , nghĩa là xácsuất điều kiện P (A/B) có thể xem như xác suất của A xét trong không gian B
• Với B ∈ A, P (B) > 0, ánh xạ P (./B) từ A vào R+ là một hàm xác suất
Mệnh đề nầy có thể chứng minh được bằng phương pháp qui nạp
Ví dụ: (Sơ đồ hộp Polia) Một hộp lúc đầu chứa a cầu trắng, b cầu đỏ Sau mỗilần chọn ngẫu nhiên một cầu, ta trả cầu đó vào hộp cùng với c cầu cùng màu vớicầu đã chọn Tìm xác suất để cầu trắng được chọn ở ba lần đầu
Đặt Ai: "cầu trắng được chọn ở lần i' (i = 1, 2, 3) Ta cần tính P (A1A2A3).Theo công thức nhân xác suất:
P (Bi).P (A/Bi)
Ví dụ: Một nông trường có 4 đội sản xuất Đội 1 sản 1
3 tổng sản lượng nôngsản của nông trường Đội 2 sản xuất 1
4 tổng sản lượng Đội 3 sản xuất 1
4 tổng sản
Trang 7lượng Đội 4 sản xuất 1
6 tổng sản lượng Tỉ lệ phế phẩm tương ứng với các đội sảnxuất là 0, 15; 0, 08; 0, 05; 0, 01 Lấy ngẫu nhiên một sản phẩm trong kho của nôngtrường Tìm xác suất để lấy phải một phế phẩm
P (Bi).P (A/Bi)
Ví dụ: Hai nhà máy cùng sản x uất một loại sản phẩm Nhà máy số 1 sản xuấtgấp k lần nhà máy số 2 Tỉ lệ thứ phẩm của hai nhà máy là p1, p2 Lấy ngẫu nhiênmột sản phẩm trong kho chung của hai nhà máy để kiểm tra thì gặp phải thứ phẩm.Tìm xác suất để thứ phẩm đó do nhà máy thứ hai sản xuất
Ví dụ: B1 = {A, B} độc lập ⇐⇒ P (A.B) = P (A).P (B)
1) Khi B có hơn hai biến cố thì rõ ràng nếu B độc lập lúc đó xác suất củagiao hai biến cố bất kỳ trong B cũng bằng tích các xác suất của các biến cố đó
Ta nói có sự độc lập từng đôi Nhưng sự độc lập từng đôi trong B không đủ suy
ra B độc lập
Xét thí dụ sau: Một khối tứ diện đều, đồng chất có ba mặt sơn tương ứng cácmàu trắng, xanh, đỏ Mặt thứ tư sơn cả ba màu trắng, xanh, đỏ Gieo ngẫu nhiêncác khối đó lên mặt phẳng Nếu gọi A, B, C tương ứng là: "mặt có màu trắng(xanh, đỏ) của tứ diện đó tiếp với mặt phẳng" Khi đó ta thấy B = {A, B, C} độc
Trang 8• Ngược lại, nếu P (A/B) = P (B) thì từ xác suất có điều kiện suy ra
P (A) = P (A/B) = P (A.B)
P (B)
=⇒ P (A.B) = P (A).P (B), nghĩa là {A, B} độc lập
Điều khẳng định trên có ý nghĩa: khi {A, B} độc lập (theo định nghĩa) thì sựxuất hiện của B không ảnh hưởng đến sự xuất hiện của A (vì P (A/B) = P (A)) vàngược lại Như vậy ta có thể nhận biết sự độc lập bằng trực giác, hay kinh nghiệmquan sát Điều đó rất có ý nghĩa thực tiễn
Trang 9đại lượng ngẫu nhiên
A.- Đại lượng ngẫu nhiên
Đại lượng ngẫu nhiên thường được ký hiệu bằng các mẫu tự la tinh in hoa:
X, T, ã ã ã Các giá trị của chúng thường được ký hiệu bởi các mẫu tự la tinh thường
x, y, ã ã ã
Người ta phân biệt hai đại lượng ngẫu nhiên (ĐLNN) là ĐLNN rời rạc và ĐLNNliên tục
2.- Đại lượng ngẫu nhiên rời rạc:
a) Định nghĩa: Một ĐLNN được gọi là ĐLNN rời nếu tập giá trị của nó là tậpcon hữu hạn hay vô hạn đếm được của tập số thực R
Ví dụ 1:
1) Gieo một con xúc sắc cân xứng và đồng chất Gọi X là số chấm xuất hiện ởmặt trên con xúc sắc Khi đó X là ĐLNN rời có tập giá trị X(Ω) = {1, 2, 3, 4, 5, 6}.2) Chọn ngẫu nhiên 3 đứa trẻ từ một nhóm gồm 6 bé trai và 4 bé gái Gọi X là
số bé gái trong nhóm chọn được X là một đại lượng ngẫu nhiên rời có tập giá trịX(Ω) = {0, 1, 2, 3}
3) Bắn liên tiếp từng phát một vào bia cho đến khi nào trúng bia thì dừng lại.Gọi X là số viên đạn cần bắn Khi đó X là ĐLNN rời có tập giá trị X(Ω) ={1, 2, 3, ã ã ã , n, ã ã ã }
b) Bảng phân phối xác suất:
Ngoài việc xác định tập giá trị của ĐLNN rời, một điều quan trọng nữa là taphải biết được xác suất để ĐLNN đó nhận các giá trị ấy là bao nhiêu Bảng phânphối xác suất của một ĐLNN rời là bảng trên đó ghi các giá trị mà X có thể nhận,kèm theo các xác suất để nó nhận các giá trị ấy
Trang 10X(Ω) x1 x2 xn
pk p1 p2 pntrong đó pk = P ({X = xk});
nX
C103 =
130Vậy bảng phân phối xác suất của X là:
p 305 1530 309 301
Ví dụ 3:
Một túi chứa 3 tấm thẻ đ−ợc đánh số 1, 2, 3 và túi thứ hai chứa 4 tấm thẻ đ−ợc
đánh số 4, 5, 6, 8 Chọn ngẫu nhiên từ mỗi túi 1 tấm thẻ rồi cộng hai số ghi trênhai tấm thẻ lại Gọi X là kết quả, hãy lập bảng phân phối xác suất của X
Trang 11P ({X = 6}) = P ({(1, 5), (2, 4)}) = 2
12; P ({X = 9}) = P ({(1, 8), (3, 6)}) =2
30 khi 0 < x ≤ 120
30 khi 1 < x ≤ 229
3.- §¹i l−îng ngÉu nhiªn liªn tôc:
a) §Þnh nghÜa: Mét §LNN nhiªn X ®−îc gäi lµ §LNN liªn tôc nÕu:
i) TËp c¸c gi¸ trÞ cña X lÊp ®Çy mét hay hîp cña mét sè kho¶ng cña trôc sè,thËm chÝ lÊp ®Çy c¶ toµn bé trôc sè
ii) Víi mäi a ∈ R, P ({X = a}) = 0
VÝ dô 1:
Trang 121) Lượng mưa hàng năm ở một địa phương là một ĐLNN liên tục có X(Ω) =(0, +∞)
2) Trọng lượng của đứa trẻ sơ sinh là một ĐLNN liên tục
Định nghĩa: Hàm số f (x) xác định trên toàn trục số được gọi là hàm mật độ của
ĐLNN liên tục X nếu:
a
f (x)dx
ở đây chú ý: P ({X = a}) = P ({X = b}) = 0 nên P (a ≤ X ≤ b) =
bZ
Trang 13P (2 < X < 3) =
3Z
2
f (x)dx =
3Z
Giải:
P (ư12 < X < 1) =
1Z
ư 1 2
f (x)dx =
0Z
ư 1 2(1 + x)dx +
1Z
v) Quan hệ giữa hàm mật độ và hàm phân phối:
Nếu f (x) và F (x) tương ứng là hàm mật độ và hàm phân phối của ĐLNN Xthì:
Trang 14f (x) = F0(x); F (x) =
xZ
π(1 + x2).
Theo iv): F (x) =
xZ
−∞
f (t)dt =
xZ
−∞
dtπ(1 + t2) =
8x
2 nÕu 0 < x < 2
P (0 < x < 1) =
1Z
0
f (x)dx =
1Z
Trang 15F (x) = a + b arctg x
ctrong đó a, b, c là các hằng số Tìm a, b, c và hàm mật độ xác suất f (x)
Giải:
lim
x→+∞F (x) = 1 ⇐⇒ a + bπ
2 = 1 (1)lim
Vậy a = 1
2; b =
1
π, c > 0 (tùy ý)
3.- Đại lượng ngẫu nhiên nhiều chiều:
a) Khái niệm ĐLNN nhiều chiều:
ở phần trên, ta đã xét các ĐLNN mà các giá trị của nó được biểu diễn bằngmột số Các ĐLNN như vậy được gọi là ĐLNN một chiều Ngoài các ĐLNN mộtchiều, trong thực tế ta còn gặp các ĐLNN mà giá trị của nó được xác định bằng 2,
3, n số Những đại lượng nầy được gọi một cách tương ứng là ĐLNN 2, 3, , nchiều Ta ký hiệu ĐLNN hai chiều là (X, Y ) (vectơ ngẫu nhiên hai chiều) Trong
đó X và Y được gọi là các thành phần của ĐLNN hai chiều Cả hai đại lượng X
và Y được xét một cách đồng thời tạo nên hệ hai ĐLNN Tương tự như vậy ĐLNN
n chiều có thể xem như hệ của n ĐLNN
Ví dụ 1:
Một máy sản xuất một loại sản phẩm Nếu kích thước của sản phẩm được đobằng chiều dài X và chiều rộng Y , thì ta có ĐLNN hai chiều (X, Y ); còn nếu tínhthêm cả chiều cao Z nữa thì ta có ĐLNN ba chiều (X, Y, Z)
Trong thực tế người ta cũng phân chia các ĐLNN nhiều chiều thành hai loại:rời rạc và liên tục
Các ĐLNN nhiều chiều được gọi là rời rạc nếu các thành phần của nó là ĐLNNrời rạc
Trang 16Các ĐLNN nhiều chiều được gọi là liên tục nếu các thành phần của nó là ĐLNNliên tục.
Sau đây ta chỉ xét các ĐLNN hai chiều
b) Qui luật phân phối xác suất của ĐLNN hai chiều:
Đối với các vectơ ngẫu nhiên hai chiều người ta cũng dùng bảng phân phối xácsuất, hàm phân phối xác suất, hàm mật độ xác suất để thiết lập bảng phân phốixác suất của chúng
(i) Bảng phân phối xác suất của vectơ ngẫu nhiên (VTNN) hai chiều:
Bảng phân phối xác suất của vectơ ngẫu nhiên hai chiều rời rạc là bảng liệt kêtất cả các giá trị có thể có của nó và các xác suất tương ứng Nó có dạng sau:
Để tạo nên một qui luật phân phối xác suất thì các xác suất p(xi, yj) phải thỏamãn điều kiện:
Trang 17Rõ ràng là:
nXi=1p(xi) = 1
Bảng phân phối xác suất của thành phần Y có dạng:
X y1 y2 ã ã ã yj ã ã ã ym
p p(y1) p(y2) ã ã ã p(yj) ã ã ã p(ym)
trong đó: p(yj) =
nXi=1p(xi, yj)
rõ ràng là:
mXj=1p(yj) = 1
Trang 18(ii) Hàm phân phối xác suất của VTNN hai chiều:
Xét VTNN hai chiều (X, Y ) có thể rời rạc hoặc liên tục Giả sử (x, y) là mộtcặp số thực bất kỳ Xét biến cố (X < x; Y < y) là biến cố để X nhận giá trị nhỏhơn x, và Y nhận giá trị nhỏ hơn y Khi x, y thay đổi thì xác suất của biến cố trêncũng thay đổi theo, nó là một hàm số của x và y
Hàm phân phối xác suất của VTNN hai chiều (X, Y ); ký hiệu F (x, y) là xácsuất để thành phần X nhận giá trị nhỏ hơn x và thành phần Y nhận giá trị nhỏhơn y với x, y là các số thực tùy ý
F (x, y) = P (X < x, Y < y)
Ví dụ 3:
Tìm xác suất để trong kết quả của phép thử thành phần X của VTNN hai chiều(X, Y ) nhận giá trị X < 2 và Y nhận giá trị Y < 3 nếu biết hàm phân phối xácsuất của nó có dạng:
Theo định nghĩa hàm phân phối xác suất của VTNN hai chiều ta có:
Đối với VTNN liên tục (X, Y ) ngoài hàm phân phối xác suất ra còn có thể dùnghàm mật độ xác suất biểu diễn phân phối xác suất của nó
Hàm mật độ xác suất của VTNN hai chiều liên tục (X, Y ); ký hiệu f (x, y) là
đạo hàm riêng hỗn hợp cấp hai của hàm phân phối xác suất
Theo định nghĩa hàm mật độ xác suất, trước hết ta tìm đạo hàm riêng của hàmphân phối xác suất theo x:
∂F (x, y)
∂x = cos x sin y
Trang 20B.- Kỳ vọng, phương sai và một số đặc trưng của đại lượng ngẫu nhiên
xkpk là kỳ vọng của ĐLNN X và ký
hiệu là EX:
EX =
∞Xk=1
xkpk
Trong trường hợp X(Ω) = {x1, x2, ã ã ã , xn} (hữu hạn) thì:
EX =
nXk=1
Trang 21x.0.dx +
1R0x.1.dx +
+∞
R1
930130
Trang 22x2k.pk.
Trang 23•Khi X là ĐLNN liên tục: E(X2) =
n(X1 + X2 + ã ã ã + Xn) làgiá trị của ĐLNN cần đo (với n đủ lớn)
Phương sai: Phương sai của ĐLNN đặc trưng cho độ phân tán của các giá trị của
X xung quanh giá trị kỳ vọng của nó Về mặt toán học phương sai DX là độ lệchbình phương trung bình của các giá trị của X so với kỳ vọng EX
Ví dụ 2:
Tính phương sai của ĐLNN ở ví dụ 1:
Ta có: E(X2) =
nXk=1
Trang 24Suy ra:
EX = np
nXk=1
Cn−1k−1pk−1qn−k
đặt i = k − 1, ta có:
EX = np
n−1Xi=0
Cn−1i piqn−1−i = np(p + q)n−1
vì p + q = 1 nên: EX = np
E(X2) =
nXk=0
k2.Cnk.pkqn−k =
nXk=0[k(k − 1) + k]Cnkpkqn−k =
=
nXk=0k(k − 1)Cnk.pkqn−k +
nXk=0
nh− vậy:
nXk=0k(k − 1)Cnkpkqn−k = n(n − 1)p2
nXk=2
Cn−2k−2pk−2qn−k =
= n(n − 1)p2(p + q)n−2 = n(n − 1)p2.Vậy:
Trang 25Tìm kỳ vọng và phương sai của X.
EX =
∞Xk=0
k.e
ưλ.λkk! = λe
ưλ
∞Xk=1
λkư1(k ư 1)!
đặt i = k ư 1, ta có: EX = λeưλ
∞Xi=0.λi
i! = λe
ưλeλ = λ
(Chú ý:
∞Xi=1
λii! = e
λ)
Ta có:
E(X2) =
∞Xk=0
k2.λ
k.eưλk! = e
ưλ.λ
∞Xk=1
k λkư1
(k ư 1)! =
λeưλ
∞Xi=0(i + 1).λ
ii! = λe
ưλ
∞Xi=0
i.λii! + λe
ưλ
∞Xk=0
λii! =
λ
∞Xi=0
i.λ
ieưλi!
+ λeưλeλ = λ2 + λ
(Chú ý:
∞Xi=0
i.λ
i.eưλi! = EX = λ)Vậy DX = E(X2) ư (EX)2 = (λ2 + λ) ư λ2 = λ
ư∞
x.0.dx +
1R0x.1.dx +
1R+∞
x2dx = 1
3.Vậy DX = 1
12
2 Covarian và hệ số tương quan:
a) Covarian: Covarian của hai ĐLNN X và Y là đại lượng ký hiệu cov (X, Y )
Trang 26cov (X, Y ) = E{(X ư EX)(Y ư EY )}
Dựa vào tính chất của kỳ vọng, ta có:
cov (X, Y ) = E(X.Y ) ư EX.EY
Từ định nghĩa, ta có : cov (X, X) = E{(X ư EX)2} = DX
CiXi
=
nXi,j=1
• Nếu DX hoặc DY bằng 0 thì qui ước RXY = 0
• Nếu RXY = 0 thì ta nói hai ĐLNN X và Y là không tương quan
Trang 27b − a nÕu a ≤ x ≤ b
0 nÕu x > bHµm ph©n phèi cña §LNN X cã d¹ng:
Trang 28−(x − a)22σ2
xZ
−∞
e−
(t − a)22σ2 dt
ta có: EX = a, DX = σ2; σ = √
DX+ ĐLNN X đ−ợc gọi là có phân phối chuẩn tắc, ký hiệu X ∼ N (0, 1) nếu nó
có phân phối chuẩn với a = 0 và σ2 = 1, tức là là hàm mật độ f (x) và hàm phânphối F (x) có dạng
f (x) = √1
2πe
−x22
F (x) = √1
2π
xZ
Trang 29Quan sát đồ thị hàm mật độ của các ĐLNN có cùng tham số a (a = 0) vàphương sai khác nhau Ta nhận thấy nếu σ tăng thì hàm mật độ "co" gần với trục
Ox và nếu σ giảm hàm mật độ "dãn" dọc theo trục Oy (h.a)
(h.b) mô tả hàm mật độ với phương sai bằng nhau và kỳ vọng a khác nhau
b) Định lý:
Nếu X ∼ N (a, σ2) thì Y = X ư a
σ ∼ N (0; 1)
Trong các giáo trình XSTK người ta lập sẵn các bảng giá trị của hàm mật độ
và hàm phân phối của ĐLNN có phân phối chuẩn tắc
Hàm mật độ chuẩn chính tắc thường được ký hiệu là:
ϕ(x) = √1
2πe
ưx22
Ta có ngay ϕ(ưx) = ϕ(x); lim
x→∞ϕ(x) = 0 Do đó bảng giá trị của ϕ(x) chỉ đượclập với x > 0; ϕ(x) ≈ ϕ(5) ≈ 0, 5, với x ≥ 5
Để thuận tiện, người ta sử dụng hàm:
Φ(x) = √1
2π
xZ
Trang 30Như vậy, xác suất để độ lệch giữa các giá trị ĐLNN X có phân phối chuẩn với
kỳ vọng của nó về giá trị tuyệt đối không vượt quá 3σ bằng 0, 9973 Điều đó nghĩa
là, hầu hết các giá trị của ĐLNN X rơi vào khoảng (a ư 3σ; a + 3σ) Qui tắc nầygọi là qui tắc 3σ và nó thường được sử dụng trong thống kê
Trang 31P (ư1 < X < 5) = P (X < 5) ư P (X < ư1) = P (Z < 1) ư P (Z < ư2) =Φ(1) + Φ(2) = 0, 3413 + 0, 4772 = 0, 8185.
2) 1 + x
2
n
ư n+1 2
Ta có: EX = 0 nếu n > 1; DX = n
n ư 2 nếu n > 2
Phân phối Student không có kỳ vọng khi n ≤ 1 và không có phương sai khi
n ≤ 2
Phân phối Student đóng vai trò quan trọng trong thống kê
Với n = 1 thì phân phối Student được gọi là phân phối Cauchy
2).2
n 2.xn2 ư1.eưx2 nếu x > 0
Ta có:
E(χ2(n)) = n; D(χ2(n)) = 2n
Trang 32b) Định lý:
Giả sử X1, X2, ã ã ã , Xn là các ĐLNN độc lập và có phân phối chuẩn chính tắc.Khi đó:
χ2 = X12 + X22 + ã ã ã + Xn2
có phân phối χ2 với n bậc tự do
8.- Phân phối F (phân phối Fisher):
Với n ≤ 2 thì phân phối F không có kỳ vọng; với n ≤ 4 phân phối F không
có phương sai
b) Định lý:
Giả sử X1, X2, ã ã ã , Xm; Xm+1, ã ã ã , Xm+n là m + n ĐLNN độc lập và có cùngphân phối chuẩn tắc Khi đó:
F =
1 m
mXk=1
Xk2
1 n
nXk=1
nY có phân phối F với (m, n) bậc tự do
Trang 33D.- Một số định lý giới hạn
Trong dãy n phép thử Bernouilli chúng ta đã xay dựng công thức tính xác suất
để biến cố A xuất hiện đúng k lần là:
Pn(k) = Cnkpkqnư1; q = 1 ư p
Tuy nhiên với với n lớn thì việc tính xác suất nầy gặp nhiều khó khăn Trongmục nầy chúng ta sẽ đưa ra một công thức dùng để tính gần đúng xác suất nóitrên
Do đó với n đủ lớn, ta có công thức gần đúng:
Pn(k) = λ
keưλk! ; λ = np (1)Công thức (1) dùng để tính gần đúng xác suất Pn(k) trong trường hợp xác suất
p gần bằng 0 hoặc gần bằng 1
Ví dụ 1:
Bắn các viên đạn vào mục tiêu một cách độc lập, xác suất trúng đích của mỗiviên đạn bằng 0, 001 Để diệt mục tiêu cần ít nhất hai viên đạn trúng mục tiêu.Tính xác suất để mục tiêu bị diệt khi bắn 5000 viên đạn
2.- Định lý giới hạn địa phương (định lý Moivre):
Trang 34mµ ¸p dông c«ng thøc (2) th× sai sè chØ nhá khi sè l−îng phÐp thö lín.
Φ(x) = √1
2π
xZ
0
e−t22dt
Trang 35ε
ppq n
§Ó tÝnh x¸c suÊt trong vÝ dô 4 ta ¸p dông c«ng thøc (4) víi n = 1000; p =
Trang 36Tổng thể (còn được gọi là tập hợp chính), là tập hợp tất cả các phần tử do mục
đích và phạm vi vấn đề cần nghiên cứu qui định
Đối với tổng thể, ta sử dụng một số khái niệm và ký hiệu sau:
i) N : Số phần tử của tổng thể và được gọi là kích thước (cỡ) của tổng thể.ii) H: Dấu hiệu mà ta khảo sát (trong kinh tế được gọi là chỉ tiêu, trong vật
lý gọi là đại lượng) Cần nhấn mạnh rằng, ta không nghiên cứu trực tiếp bản thântổng thể mà chỉ nghiên cứu dấu hiệu H của nó
iii) xi, i = 1, k: là những giá trị của dấu hiệu H đo được trên các phần tử củatổng thể , xi là thông tin mà ta cần đến, còn phần tử của tổng thể là vật mangthông tin
iv) Ni, i = 1, k: tần số của xi là số phần tử của tổng thể có chung giá trị xi ấy.v) pi, i = 1, k: tần suất của xi là tỷ số giữa tần số của xi và kích thước củatổng thể
pi = NiNBiểu diễn sự tương ứng của các giá trị xi và tần suất pi được gọi là bảng cơ cấucủa tổng thể theo dấu hiệu H
Bảng nầy có dạng:
Giá trịcủa H
Trang 37Bảng này mô tả đầy đủ dấu hiệu H, nhưng phải sử dụng nhiều số liệu Vì vậy
để phân tích dấu hiệu H người ta thường tóm tắt bảng trên bằng các số đặc trưng
k
X
i=1
(xi ư m)2pi (3.3)
1.1.2 Khái niệm mẫu
Khi nghiên cứu một đặc điểm, tính chất nào đó của tổng thể ta có thể tiến hànhtheo hai phương pháp sau:
a) Phương pháp điều tra toàn bộ: Mọi phần tử của tổng thể đều được khảo sát
Ưu điểm:
các kết luận rút ra phản ánh đúng bản chất của tổng thể
Nhược điểm:
- Chi phí lớn về tiền của, thời gian, nhân lực, phương tiện ã ã ã
- Quá trình điều tra cũng chính là quá trình phá hủy các phần tử được điều tra,
- Có những trường hợp ta không xác định được toàn bộ N phần tử của tổng thể
Chính vì lý do trên nên phương pháp điều tra toàn bộ ít được thực hiện
b) Phương pháp điều tra mẫu:
• Từ tổng thể ta lấy ra n phần tử (tập con của tổng thể) n << N
và đo lường giá trị của dấu hiệu H trên chúng
• Từ đó rút ra các kết luận khoa học trên mẫu rồi suy rộng cho toàn bộ tổngthể
Ưu điểm:
- Thu thập, xử lý và khai thác nhanh,
Trang 38- Toàn diện.
• Yêu cầu: Mẫu phải đại diện được cho tổng thể do đó khi lấy mẫu phải đảmbảo tính ngẫu nhiên của mẫu, không chọn mẫu theo một tiêu chuẩn chủ quan địnhtrước
1.2 Phương pháp lấy mẫu:
1.2.1 Mẫu có hoàn lại (có lặp):
Trong tổng thể gồm N phần tử ta chọn một phần tử khảo sát và ghi lại kết quả
X1 Trả lại phần tử đó vào tổng thể trước khi chọn phần tử tiếp theo để khảo sát
ã ã ã , cứ lặp lại như thế đến lần thứ n ta nhận được một mẫu với số liệu về dấu hiệu
đang khảo sát là (X1, X2, ã ã ã , Xn) Mẫu này được gọi là mẫu ngẫu nhiên hoàn lại(có lặp)
1.2.2 Mẫu ngẫu nhiên không hoàn lại (không lặp):
Từ tổng thể gồm N phần tử, ta chọn ra một phần tử, khảo sát và ghi lại kết quả
X1 Bỏ phần tử đó sang một bên trước khi chọn phần tử tiếp theo để khảo sát tiếp,
ã ã ã cứ lặp lại như thế cho đến lần thứ n ta được mẫu với số liệu về dấu hiệu đangkhảo sát là (X1, X2, ã ã ã , Xn) Mẫu này được gọi là mẫu ngẫu nhiên không hoànlại (không lặp)
Chú ý: Hai mẫu nói trên được gọi là mẫu ngẫu nhiên đơn giản Nhờ các định lýgiới hạn trong lý thuyết xác suất người ta đã chứng minh được rằng khi số phần tửtổng thể vừa đủ lớn thì có thể coi hai mẫu có lặp và không lặp là như nhau
Có thể kể thêm một số phương pháp sau:
1.3 Mẫu được chọn theo phương pháp cơ học:
1.4 Phương pháp điển hình:
1.5 Phương pháp phân dãy:
1.6 Sắp xếp các số liệu thực nghiệm theo nhóm:
Trên thực tế có nhiều bài toán liên quan đến việc xử lý số liệu thực nghiệm giải
được nhờ việc phân chia nhóm Các bài toán này thường được chia làm 3 loại sau:
- Chia toàn bộ tập mẫu thành các tập con gồm các phần tử có đặc tính thuầnnhất như nhau
- Nghiên cứu từng phần của tập mẫu theo dấu hiệu này hay dấu hiệu khác
- Nghiên cứu sự thay đổi phụ thuộc giữa các dấu hiệu trong phạm vi tập nàyhay tập khác
1.7 Sắp xếp các số liệu thực nghiệm theo dãy các giá trị khác nhau của biến:
Có hai loại số liệu: số liệu cho dưới dạng giá trị rời rạc của X hoặc số liệu cácgiá trị trong một khoảng liên tục của X
Trang 39VÝ dô sau ®©y lµ mét tr−êng hîp sè liÖu cho d−íi d¹ng rêi:
VÝ dô 1: §iÓm thi chøng chØ XSTK cña mét nhãm sinh viªn §HKH ®−îc thu thËpnh− sau:
B¶ng nµy cho mét xÊp xØ luËt ph©n bè cña §LNN X
VÝ dô 2: XÐt n¨ng suÊt cña c«ng nh©n x−ëng c¬ khÝ trong mét n¨m tÝnh ra phÇntr¨m KÕt qu¶ ®iÒu tra 117 c«ng nh©n nh− sau:
Trang 40Phương pháp chia khoảng:
Việc chia khoảng có thể được tiến hành theo nhiều cách khác nhau
Số khoảng: từ 6 đến 12 khoảng, xấp xỉ k = 1 + 3, 322 lg n
Độ dài khoảng: h = x∗ ư x∗
kVới x∗ ≤ xmin, x∗ ≥ xmax
Nếu gọi ai là đầu mút trái của khoảng thứ i thì:
a1 = x∗ ư h
2; a2 = a1 + h; a3 = a2 + h, ã ã ãtiếp tục làm cho tới lúc mút đầu của khoảng bằng hoặc bé hơn xmax
Số liệu ở ví dụ 2 có thể biểu thị bởi bảng sau:
1.8 Các loại bảng:
Sau khi sắp xếp số liệu quan sát (mẫu) ở 1.4 ta thường trình bày trên một bảng
số liệu để xử lý cho thuận lợi Vậy bảng là gì ? Cơ sở để hình thành bảng số, cácloại bảng sẽ được trình bày lần lượt ở dưới đây
Bảng là hình chữ nhật gồm nhiều dòng kẻ ngang, kẻ dọc tạo thành c ác ô nhỏ.Trong các ô nhỏ trống dùng để điền các chữ hoặc số (dữ liệu) cần thiết Cơ sở toánhọc để hình thành các loại bảng là ma trận
Đơn giản nhất là ma trận một hàng hay một cột, còn phần lớn là ma trận chữnhật, các phần tử của nó là những con số hoặc những chữ Trong
Ví dụ với số liệu trong bài toán phân tích phương sai hai yếu tố, ta phải dùng
đến ma trận khối để mô tả biến hai chiều
Ví dụ 3: Xét tác dụng của hai loại phân A và B đến năng suất cà chua Kết quảquan sát được cho ở bảng dưới đây (bảng 3)