Giáo trình Thống kê ứng dụng trong kinh tế và kinh doanh được biên soạn gồm các nội dung chính sau: biến ngẫu nhiên; một số phân phối xác suất thông dụng; nguyên lý thống kê và các khái niệm cơ bản; tóm tắt dữ liệu bằng đại lượng số; ước lượng tham số; kiểm định giả thiết thống kê; dự báo chuỗi thời gian. Mời các bạn cùng tham khảo!
Trang 1| ĐẠI HỌC VĂN LANG KHOA KHOA HỌC CƠ BẢN
THỐNG KÊ ỨNG DỤNG TRONG KINH TẾ VÀ KINH
DOANH
THÀNH PHỐ HỒ CHÍ MINH - 2019
Trang 3MỤC LỤC
CHƯƠNG 1 : BIẾN NGẪU NHIÊN
Mục lục chương 1 1
1.1 Khái niệm biến ngẫu nhiên 1
1.2 Biểu diễn biến ngẫu nhiên 3
1.2.1 Biến ngẫu nhiên rời rạc 3
1.2.2 Biến ngẫu nhiên liên tục 5
1.3 Hàm phân phối biến ngẫu nhiên 7
1.3.1 Định nghĩa hàm phân phối xác suất 7
1.3.2 Tính chất hàm phân phối xác suất 9
1.4 Hai biến ngẫu nhiên rời rạc độc lập 9
1.4.1 Hai biến ngẫu nhiên rời rạc độc lập 9
1.4.2 Kết hợp hai biến ngẫu nhiên rời rạc độc lập 9
1.5 Hàm của biến ngẫu nhiên 10
1.5.1 Hàm của biến ngẫu nhiên rời rạc 10
1.5.2 Hàm của biến ngẫu nhiên liên tục 11
1.6 Các đặc trưng của biến ngẫu nhiên 12
1.6.1 Kỳ vọng 12
1.6.2 Phương sai 15
1.6.3 Giá trị tin chắc nhất (Mode) 18
1.6.4 Trung vị 20
CHƯƠNG 2 : MỘT SỐ PHÂN PHỐI XÁC SUẤT THÔNG DỤNG Mục lục chương 2 22
2.1 Phân phối nhị thức 22
2.2 Phân phối siêu bội 26
2.3 Phân phối Poisson 30
2.4 Phân phối chuẩn 31
Trang 42.5 Phân phối Chi bình phương 35
2.6 Phân phối Student 37
CHƯƠNG 3 : NGUYÊN LÝ THỐNG KÊ VÀ CÁC KHÁI NIỆM CƠ BẢN Mục lục chương 3 41
3.1 Một số khái niệm dùng trong thống kê 41
3.1.1 Tổng thể thống kê và đơn vị tổng thể, và mẫu 43
3.1.2 Tiêu thức 44
3.1.3 Lượng biến 44
3.1.4 Tham số 45
3.1.5 Thang đo 45
3.1.6 Thiết kế thang đo 47
3.2 Thu thập và trình bày dữ liệu thống kê 47
3.2.1 Xác định dữ liệu và phương pháp thu thập dữ liệu sơ cấp 47
3.2.2 Các kỹ thuật lấy mẫu dữ liệu 48
3.2.3 Xác định quy mô mẫu 49
3.2.4 Phân tổ 50
3.2.5 Trình bày dữ liệu thống kê 52
3.2.6 Đồ thị biểu đồ thống kê 54
CHƯƠNG 4 : TÓM TẮT DỮ LIỆU BẰNG ĐẠI LƯỢNG SỐ Mục lục chương 4 55
4.1 Các đại lượng đo lường mức độ tập trung của dữ liệu 55
4.1.1 Số trung bình số học 55
4.1.2 Số trung bình điều hòa 57
4.1.3 Số trung bình nhân 58
4.1.4 Yếu vị (Mod) 59
4.1.5 Số trung vị (Median) 60
4.2 Các khuynh hướng đo độ phân tán 63
Trang 54.2.1 Khoảng biến thiên 65
4.2.2 Độ lệch tuyệt đối trung bình 64
4.2.3 Phương sai , độ lệch chuẩn 64
4.2.4 Hệ số biến thiên 65
4.3 Các khuynh hướng đo vị trí tương đối 67
4.3.1 Phân vị 67
4.3.2 Tứ phân vị 67
4.3.3 Giá trị 68
4.4 Hệ số tương quan của các bộ dữ liệu 70
4.4.1 Hiệp phương sai 70
4.4.2 Hệ số tương quan 72
4.5 Hệ số đo hình dạng của quy luật phân phối 74
4.2.5 Hệ số Kurtoris (độ nhọn) 74
4.2.6 Độ lệch – Skewness 75
CHƯƠNG 5 : ƯỚC LƯỢNG THAM SỐ Mục lục chương 5 77
5.1 CÁC TIÊU CHUẨN ƯỚC LƯỢNG 77
5.1.1 Ước lượng không chệch 77
5.1.2 Khoảng tin cậy 78
5.2 Khoảng tin cậy cho giá trị trung bình 79
5.3 Khoảng tin cậy cho độ lệch hai giá trị trung bình 81
5.4 Khoảng tin cậy cho giá trị tỷ lệ 83
5.5 Khoảng tin cậy cho độ lệch hai giá trị tỷ lệ 85
5.6 Khoảng tin cậy cho giá trị phương sai 85
5.7 Khoảng tin cậy cho dự đoán giá trị quan sát 87
CHƯƠNG 6 : KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ Mục lục chương 7 89
Trang 66.1 KHÁI NIỆM 89
6.1.1 Giả thiết và đối thuyết 89
6.1.2 Sai lầm loại I và sai lầm loại II 90
6.2 KIỂM ĐỊNH GIẢ THIẾT CHO MỘT GIÁ TRỊ TỶ LỆ TỔNG THỂ 91
6.2.1 Phân tích 91
6.2.2 Mô hình kiểm định 92
6.3 KIỂM ĐỊNH GIẢ THIẾT CHO MỘT TRUNG BÌNH TỔNG THỂ 93
6.3.1 Phân tích 93
6.3.2 So sánh trung bình tổng thể với một số khi biết phương sai 84
6.3.3 So sánh trung bình tổng thể với một số khi không biết phương sai 94
6.4 KIỂM ĐỊNH GIẢ THIẾT CHO PHƯƠNG SAI TỔNG THỂ 96
6.4.1 Phân tích 96
6.4.2 So sánh phương sai tổng thể với một số khi biết trung bình µ 96
6.4.3 So sánh phương sai tổng thể với một số khi chưa biết trung bình µ 97
6.5 KIỂM ĐỊNH GIẢ THIẾT CHO HAI GIÁ TRỊ TỶ LỆ TỔNG THỂ 98
6.5.1 Kiểm định giả thiết so sánh 2 tỷ lệ tổng thể sử dụng phân phối chuẩn 98
i Phân tích 98
ii Mô hình kiểm định 99
6.5.2 Kiểm định giả thiết so sánh 2 tỷ lệ tổng thể sử dụng phân phối chi bình phương 100
i Phân tích 100
ii Mô hình kiểm định 100
6.6 KIỂM ĐỊNH GIẢ THIẾT CHO HAI TRUNG BÌNH TỔNG THỂ 102
6.6.1 Phân tích 102
6.6.2 So sánh hai trung bình tổng thể khi biết phương sai 102
6.6.3 So sánh hai trung bình tổng thể khi không biết phương sai và cỡ mẫu lớn 103
6.6.4 So sánh hai trung bình tổng thể khi không biết phương sai, phương sai bằng nhau và cỡ mẫu nhỏ 103
Trang 76.7 KIỂM ĐỊNH GIẢ THIẾT CHO HAI PHƯƠNG SAI TỔNG THỂ 105
6.8 KIỂM TRA GIẢ THIẾT VỀ SỰ ĐỘC LẬP 106
6.8.1 Phân tích 106
6.8.2 Kiểm định độc lập của hai bộ dữ liệu định tính 107
CHƯƠNG 7 : DỰ BÁO CHUỖI THỜI GIAN Mục lục chương 7 109
7.1 CHUỖI THỜI GIAN, CÁC KHÁI NIỆM CƠ BẢN 109
7.1.1 Khái niệm chuỗi thời gian 109
7.1.2 Các thành phần chuỗi thời gian 109
i Thành phần xu hướng 109
ii Thành phần chu kỳ 110
iii Thành phần mùa 110
iv Thành phần bất thường 110
7.1.3 Các đại lượng mô tả chuỗi thời gian 111
i Mức độ trung bình theo thời gian 111
ii Lượng tăng giảm tuyệt đối 112
iii Tốc độ phát triển 112
iv Tốc độ tăng giảm 113
7.2 CÁC PHƯƠNG PHÁP DỰ BÁO ĐƠN GIẢN 113
7.3 CÁC PHƯƠNG PHÁP LÀM TRƠN 114
7.3.1 Dự báo bằng phương pháp trung bình trượt 114
7.3.2 Dự báo bằng san bằng hàm mũ 116
7.3.3 Dự báo bằng hàm xu thế tuyến tính 117
PHỤ LỤC.BẢNG PHÂN PHỐI XÁC SUẤT B1 BẢNG GIÁ TRỊ HÀM MẬT ĐỘ
N
0;1 121
B2 BẢNG TÍCH PHÂN LAPLACE 122
B3 BẢNG PHÂN PHỐI STUDENT 123
Trang 8B4 BẢNG PHÂN PHỐI CHI BÌNH PHƯƠNG 124
Trang 9Mục lục chương 1
1.1 Khái niệm biến ngẫu nhiên 1
1.2 Biểu diễn biến ngẫu nhiên 3
1.3 Hàm phân phối biến ngẫu nhiên 7
1.4 Hai biến ngẫu nhiên rời rạc độc lập 9
1.5 Hàm của biến ngẫu nhiên 11
1.6 Các đặc trưng số của biến ngẫu nhiên 13
Ở bước ban đầu khi tiếp cận về lý thuyết xác suất, sinh viên đã nghiên cứu về khái niệm biến cố, phân loại và phương pháp tính xác suất xảy ra của các biến cố Trong chương một này, mục tiêu là
hệ thống và quản lý khả năng xảy ra của các kết quả có thể có trong một phép thử Khái niệm mới
được đưa vào trong chương này là thuật ngữ biến ngẫu nhiên, là một khái niệm quan trọng trong
lý thuyết xác suất, giúp chúng ta hiểu rõ quy luật, bản chất của các hiện tượng và phép thử
1.1 KHÁI NIỆM BIẾN NGẪU NHIÊN
Trong nhiều trường hợp, chúng ta không quan tâm chi tiết đến mọi kết quả trong không gian mẫu của phép thử mà thay vào đó ta quan tâm đến phân nhóm cho các kết quả đó Ví dụ thực hiện phép thử tung 3 đồng xu lần lượt, ta có không gian mẫu của phép thử là:
S NNN NNS NSN NSS SNN SNS SSN SSS
Trong đó ký hiệu
S
: tung đồng xu được sấp và N: tung đồng xu được ngữa Như vậy ta có thể phân loại kết quả của phép thử thành 4 trường hợp: không được mặt sấp nào có xác suất là 18,
được một mặt sấp có xác suất là 3
8, được hai mặt sấp có xác suất là
3
8 và được ba mặt sấp có xác
suất là 1
8 Như vậy nếu ta đặt một biến ngẫu nhiên chỉ số mặt sấp có được sau 3 lần tung, kí hiệu
là X, thì X
0,1,2,3
sẽ đại diện cho 8 trường hợp trong không gian mẫu của phép thửNhư vậy khái niệm biến ngẫu nhiên được mô hình hóa như sau:
Định nghĩa Biến ngẫu nhiên X của một phép thử là một hàm số đi từ không gian các biến cố sơ
cấp vào R:
:
X
X X
Trang 10Hình 1.1: Biến ngẫu nhiên X
Người ta thường dùng các chữ in X; Y; Z; … để ký hiệu các biến ngẫu nhiên và cáxxc chữ thường x; y; z; … để chỉ các giá trị của biến ngẫu nhiên
Ta ký hiệu biến ngẫu nhiên X nhận giá trị x là Xx và xác suất để X nhận giá trị x là P X
x
Ví dụ 1.1
Thực hiện phép thử tung đồng xu 3 lần, gọi X là biến ngẫu nhiên chỉ số mặt sấp có được trong 3 lần tung
Ta có không gian mẫu của phép thử S
NNN NNS NSN NSS SNN SNS SSN SSS; ; ; ; ; ; ;
Và biến ngẫu nhiên
X S :
có các giá trị như sauTrong trường hợp này thì tập giá trị của biến ngẫu nhiên X là tất cả các giá trị nằm trong khoảng
253 ;257 mm
Dựa trên tập giá trị của biến ngẫu nhiên có thể nhận được, người ta phân biến ngẫu nhiên ra làm hai loại
Biến ngẫu nhiên được gọi là rời rạc: nếu tập giá trị của biến ngẫu nhiên chỉ nhận hữu hạn hoặc
vô hạn đếm được các giá trị Ta có thể liệt kê các giá trị của biến ngẫu nhiên rời rạc
x x
1; ; ; ;
2x
nBiến ngẫu nhiên được gọi là liên tục: nếu tập giá trị của biến ngẫu nhiên có thể lấy bất kỳ trên
một khoảng của trục số thực
Biến ngẫu nhiên
X
Trang 11Quan sát kết quả bài thi lấy chứng chỉ kiểm toán viên (CPA) của một nhân viên kế toán Bài kiểm tra gồm 4 phần Gọi X là số phần của bài kiểm tra mà nhân viên đó đã vượt qua Khi đó, X là biến ngẫu nhiên rời rạc vì tập các giá trị mà nó có thể nhận là hữu hạn gồm các giá trị 0, 1, 2, 3, 4
Ví dụ 1.4
Quan sát xe ô tô đi qua một trạm thu phí Biến ngẫu nhiên X là số xe hơi đi qua trạm thu phí trong
1 ngày Khi đó, X là biến ngẫu nhiên rời rạc có thể nhận một trong các giá trị của dãy vô hạn (0, 1,
2, … )
Ví dụ 1.5
Chiều cao của thanh niên Việt Nam thường nằm trong khoảng từ 150 cm đến 180 cm Chiều cao
đo được cụ thể của một thanh niên nào đó có thể nhận bất kỳ giá trị nào nằm trong khoảng này, tùy thuộc vào độ chính xác sủa phép đo
Ví dụ 1.6
Quan sát các cuộc gọi đến phòng tiếp nhận thông tin của một công ty bảo hiểm Gọi X là thời gian giữa hai cuộc gọi liên tiếp X có thể nhận bất kỳ giá trị nào trong khoảng
0;
X có thể nhậnvô số các giá trị, chẳng hạn 1,26 phút, 2,755 phút, …
1.2 BIỂU DIỄN BIẾN NGẪU NHIÊN
1.2.1
Biến ngẫu nhiên rời rạcI Bảng phân phối xác suất
Với Xlà biến ngẫu nhiên rời rạc, tập giá trị của X gồm các giá trị
x x
1; ; ; ;
2x
n vớiNhận xét Trong kết quả phép thử ngẫu nhiên, biến ngẫu nhiên rời rạc chỉ nhận một trong các giá
trị
x
1, , x
n,
nên các biến cố X x
j
và
Xx i
xung khắc với mọi i jTính chất Bảng phân phối xác suất của biến ngẫu nhiên có tính chất sau:
Trang 12Với phép thử gieo 4 đồng xu lần lượt, và đặt là biến ngẫu nhiên chỉ số mặt sấp có được sau 4 lần
tung Ta có bảng phân phối xác suất và hàm mật độ xác suất cho
16
416
616
416
116
Hình 1.2: Hàm mật độ xác suất biến ngẫu nhiên rời rạc
Ví dụ 1.8
Xem xét doanh thu bán xe ô tô tại cửa hàng Dicalo Motors ở Saratoga, New York Quan sát 300 ngày, thấy rằng có 54 ngày không bán được chiếc ô tô nào, 117 ngày bán được một chiếc, 72 ngày bán được 2 chiếc, 42 ngày bán được 3 chiếc, 12 ngày bán được 4 chiếc, 42 ngày bán được 3 chiếc,
12 ngày bán được 4 chiếc và 3 ngày bán được 5 chiếc Giả sử phép thử là chọn một ngày bất kỳ của DiCarlo Motors và định nghĩa biến ngẫu nhiên X là số chiếc ô tô bán được trong ngày đó Từ
dữ liệu quá khứ, ta biết X là biến ngẫu nhiên rời rạc có thể nhận một trong các giá trị 0, 1, 2, 3, 4,
5 Ta có bảng phân phối xác suất của biến ngẫu nhiên X như sau:
310
410
Phân phối xác suất của biến ngẫu nhiên X có thể được biểu diễn bằng công thức:
0 0.1 0.2 0.3 0.4 0.5
Trang 13Ứng với từng giá trị có thể có của X, ta có thể xác định phân phối xác suất f x
tương ứngChẳng hạn, ta có thể xác định
2210
P a X b
f x dxÝ nghĩa Hàm mật độ xác suất của biến ngẫu nhiên liên tục miêu tả xác suất biến ngẫu nhiên thuộc
một khoảng có giá trị bằng vùng diện tích của hàm mật độ trong khoảng đó
Hình 1.3: Hàm mật độ xác suất biến ngẫu nhiên liên tục
Nhận xét Tính chất ii) giúp chỉ ra mối quan hệ giữa định nghĩa hàm mật độ xác suất và công thức
tính xác suất trong chương 1
Trang 14125 so với 1 là xác suất X chắc chắn thuộc
0;1
Hình 1.4: Xác suất biến ngẫu nhiên liên tục
Gọi X là dung tích trên một chai nước giặt
a Xác suất để một chai chứa từ 12 đến 12,05 ounces là bao nhiêu?
Tức là ta cần tính P
12X12,05
Trang 15 12 0,02 11,98 12,02
11,9812,028 8
12,0211,98 0,32.
Vậy, xác suất để một chai không đạt tiêu chuẩn là 1 0,32 0,68.
1.3 HÀM PHÂN PHỐI BIẾN NGẪU NHIÊN
1.3.1
Định nghĩa hàm phân phối xác suấtHàm phân phối xác suấtcủa biến ngẫu nhiên X là hàm F x
được định nghĩa:F :
vớiF x P Xx
Hàm phân phối xác suất hay còn gọi là hàm phân phối tích lũy
Nhận xét Khai triển công thức hàm phân phối trong hai trường hợp:
I Biến ngẫu nhiên rời rạc
Hình 1.5: Hàm phân phối rời rạc
II Biến ngẫu nhiên liên tục
Trang 16; với h x
liên tục trên
a b;
thì hàm phân phối xác suất dạng
1.3.2
Tính chất hàm phân phối xác suấtHàm phân phối xác suất F x
có các tính chất cơ bản sau:i 0F x
1 , xii Hàm F x
là hàm không giảm, nghĩa là với x1x2F x
1 F x
2iii Với F x
là hàm phân phối của biến ngẫu nhiên liên tục ta cóP a X
b
F b
F a
Trang 17iv Quan hệ giữa f x
vàF x
: Nếu hàm phân phối xác suất F x
của biến ngẫu nhiên X khảvi tại mọi x , với f x
là hàm mật độ xác suất, thì ta có:1.4 HAI BIẾN NGẪU NHIÊN RỜI RẠC ĐỘC LẬP
Cho biến ngẫu nhiên X và Y rời rạc có bảng phân phối xác suất lần lượt:
1.4.1 Hai biến ngẫu nhiên rời rạc độc lập
Hai biến ngẫu nhiên X Y; được gọi là độc lập với nhau khi và chỉ khi xác suất biến ngẫu nhiên này nhận giá trị không ảnh hưởng đến xác suất biến ngẫu nhiên kia nhận giá trị Và theo công thức nhân xác suất trong chương 1 ta có:
Nghĩa là hai biến ngẫu nhiên X Y; độc lập với nhau
Cho biến ngẫu nhiên X và Y rời rạc, độc lập có bảng phân phối như ban đầu
Ta có biến ngẫu nhiên
X Y
có bảng phân phối xác suất dạng: Trang 181.5 HÀM CỦA BIẾN NGẪU NHIÊN
Cho biến ngẫu nhiên X và f x
là một hàm số xác định tại mọi giá trị trong tập giá trị của biến ngẫu nhiên X , thì Y f X
là một biến ngẫu nhiên mới và là hàm theo biến ngẫu nhiên X1.5.1 Hàm của biến ngẫu nhiên rời rạc
Cho biến ngẫu nhiên Xrời rạc có bảng phân phối xác suất
Và Y f X
là hàm theo biến ngẫn nhiên XBảng phân phối xác suất của biến ngẫu nhiên Y có dạng
Theo nguyên tắc:
Trang 191.5.2 Hàm của biến ngẫu nhiên liên tục
Cho biến ngẫu nhiên X rời rạc có hàm mật độ xác suất f x
Và Y h X
là hàm theo biến ngẫn nhiên XGọi G y
là hàm phân phối xác suất của biến ngẫu nhiên Y, ta có:Và hàm biến ngẫu nhiên Y X3, lập hàm mật độ xác suất cho biến ngẫu nhiên Y
GọiG y
là hàm phân phối xác suất cho biến ngẫu nhiên Y Trang 20I Kỳ vọng biến ngẫu nhiên rời rạc
Định nghĩa Giả sử biến ngẫu nhiên rời rạc X có bảng phân phối xác suất
16
16
16
16
thì kỳ vọng của biến ngẫu nhiên X
Trang 21Tương ứng với giá trị xác suất là
Vậy trung bình một lượt chơi thì người này mất hơn 5 cent
Nhận xét Về mặt hình ảnh ta có thể quan sát như sau:
19 tại 1 Thì giá trị EX 0,053 là cột mốc trên thanh đòn mà tại đó
thanh đòn cân bằng như hình vẽ
Dựa trên hai ví dụ 3.4 và 3.5 ta đưa ra ý nghĩa của kỳ vọng của biến ngẫu nhiên:
Ý nghĩa Tiến hành n phép thử, giả sử X là biến ngẫu nhiên nhận các giá trị có thể x x1; 2; ;x k với
số lần (tần số) n n1; ; ;2 n k Giá trị trung bình của biến ngẫu nhiên X trong n phép thử là
là xác suất để biến ngẫu nhiên X nhận giá trị x Nên theo công thức ikỳ vọng ta có về mặt giá trị trong tình huống này: X EX ; Kỳ vọng của biến ngẫu nhiên chính là giá trị trung bình theo xác suất của biến ngẫu nhiên Nó phản ánh giá trị trung tâm của phân phối xác suất
Và hình ảnh để diễn tả cho kỳ vọng như sau: cho một thanh đòn không có khối lượng và trên đó đặt các khối tròn có khối lượng lần lượt là p i i , 1, ,k tại các điểm có tọa độ x i trên thanh đòn
Ta có thể hình dung lúc này kỳ vọng của biến ngẫu nhiên chính là tọa độ của điểm trên thanh đòn mà tại đó giúp thanh đòn thăng bằng
Hình 1.7: Hình ảnh kỳ vọng
1 -
Trang 22Định nghĩa Giả sử biến ngẫu nhiên liên tục X có hàm mật độ xác suất làf x
, kỳ vọng của biếnngẫu nhiên X được định nghĩa:
III Tính chất kỳ vọng biến ngẫu nhiên
1 Tính chất kỳ vọng biến ngẫu nhiên
X, Y là hai biến ngẫu nhiên bất kỳ và
C
thì kỳ vọng của biến ngẫu nhiên có các tính chất sau:iv Nếu hai biến ngẫu nhiên X và Y độc lập thì E XY
EX EYCho biến ngẫu nhiên X có hàm mật độ xác suấtf x
, kỳ vọng của hàm của biến ngẫu nhiên h X
Tính chất kỳ vọng hàm biến ngẫu nhiên Cho h là hàm số thực bất kỳ
i Nếu X là biến ngẫu nhiên rời rạc có bảng phân phối xác suất cho bởi
Trang 23Để đối chiếu kết quả kỳ vọng của biến ngẫu nhiên X2, ta có 2 cách tính như sau
Cách 1 Lập bảng phân phối xác suất cho biến ngẫu nhiên X2
Kỳ vọng của biến ngẫu nhiên Y X3, kết quả tính và đối chiếu thông qua 2 cách:
Cách 1 Lập hàm mật độ xác suất cho biến ngẫu nhiên Y X3
Theo ví dụ 2.11) ta có hàm mật độ của biến ngẫu nhiên Y có dạng:
I Định nghĩa phương sai biến ngẫu nhiên
Đặc trưng thứ nhất của biến ngẫu nhiên là kỳ vọng, thể hiện giá trị trung tâm của biến ngẫu nhiên
Đăc trưng thứ hai thể hiện mức phân tán trung bình của các giá trị của biến ngẫu nhiên có thể
Trang 24Giả sử ta có biến ngẫu nhiên Xrời rạc, nhận các giá trị x i với i1,2, ,k Như vậy biến ngẫu nhiên thể hiện mức chênh lệch của giá trị biến ngẫu nhiên so với kỳ vọng là Y
X EX
Và biến ngẫu nhiên Y có thể nhận các giá trị âm và dương như hình vẽ dướiHình 1.8: Giá trị biến ngẫu nhiên phân bố xung quanh kỳ vọng
Trong một số trường hợp EY 0 và điều này không phản ánh đúng mức phân tán của giá trị biến ngẫu nhiên xung quanh kỳ vọng
Để khắc phục điều này, ta không tính trực tiếp sai lệch của giá trị biến ngẫu nhiên so với kỳ vọng,
mà ta tính thông qua trị tuyệt đối hoặc bình phương sai lệch Và để thuận tiện trong việc tính toán thì ta tìm trung bình của bình phương các sai lệch
Định nghĩa Cho biến ngẫu nhiên X có kỳ vọng là EX Phương sai của X, ký hiệu là
VarX
, được định nghĩa: Trang 25b Tính phương sai của X X1, 2
a Ta có bảng phân phối xác suất của X X1, 2là
410
210
210
Kỳ vọng của biến ngẫu nhiên X X1, 2 lần lượt bằng:
Nhận xét Kỳ vọng về trọng lượng của một quả thanh long trồng trên hai thửa là bằng nshau Nếu
bạn là người thu mua thanh long, bạn sẽ chọn của thửa nào?
b Phương sai của biến ngẫu nhiên X1:
Nhận xét Nếu theo định nghĩa phương sai, là kỳ vọng của bình phương sai lệch của biến ngẫu
nhiên so với giá trị kỳ vọng biến ngẫu nhiên, vậy trong ví dụ này với kỳ vọng của 2 biến ngẫu nhiên
là bằng nhau, thì phương sai về trọng lượng của quả thanh long của thửa ruộng hai lớn hơn của thửa 1 nghĩa là các quả thanh long của thửa 1 “đều” hơn so với thửa 2 Và nếu chọn thu mua, thì thanh long của thửa 1 sẽ được ưu tiên chọn hơn
II Tính chất phương sai
Cho hai biến ngẫu nhiên X, Y và hằng số thực
C
, phương sai có các tính chất sau Trang 26ii Var CX
C VarX2 y67hgiii Nếu X và Y độc lập thì Var X Y
VarX VarYDo cách xây dựng công thức tính phương sai của biến ngẫu nhiên mà đơn vị đo của phương sai bằng bình phương đơn vị đo của biến ngẫu nhiên Nên để đánh giá mức độ phân tán trung bình của giá trị biến ngẫu nhiên theo đơn vị đo của nó, người ta dùng một đặc trưng mới đó là độ lệch tiêu chuẩn
Định nghĩa Độ lệch tiêu chuẩn của biến ngẫu nhiên X bằng căn bậc hai phương sai của biến
ngẫu nhiên X, ký hiệu
VarX
1.6.3
Giá trị tin chắc nhấtGiá trị tin chắc nhất của biến ngẫu nhiên X, ký hiệu ModX
Trường hợp Xlà biến ngẫu nhiên rời rạc có bảng phân phối xác suất:
Trang 27
ModX x f Max f x x
Ý nghĩa Giá trị tin chắc nhất của biến ngẫu nhiên là giá trị của biến ngẫu nhiên mà đại diện nhất
cho phân bố Về mặt hình vẽ ta có hai trường hợp như sau:
Trường hợp X là biến ngẫu nhiên rời rạc:
Hình 1.9: Mod biến ngẫu nhiên rời rạc Trường hợp X là biến ngẫu nhiên liên tục:
Hình 1.10: Mod biến ngẫu nhiên liên tục Lưu ý Giá trị tin chắc nhất có thể không duy nhất
Trang 281.6.4
Trung vịTrung vị của biến ngẫu nhiên X, ký hiệu MedX
Trường hợp Xlà biến ngẫu nhiên rời rạc, có bảng phân phối xác suất
i i
i i
Ý nghĩa Trung vị của biến ngẫu nhiên là giá trị của biến ngẫu nhiên chia phân phối xác suất của
biến ngẫu nhiên thành hai phần bằng nhau
Nếu ta xét trong trường hợp biến ngẫu nhiên liên tục, thì về mặt hình học, trung vị là giá trị của biến chia vùng diện tích của hàm mật độ xác suất làm hai phần có diện tích bằng nhau
Hình 1.11: Trung vị biến ngẫn nhiên Nhận xét Trường hợp X là biến ngẫu nhiên rời rạc, có F x
là hàm phân phối xác suất, thì ta có:12
medX x F x F x
Trang 29Giả sử biến ngẫu nhiên liên tục X có hàm mật độ xác suất cho bởi
Theo định nghĩa ta có
med m
nếu
1 Trang 30Mục lục chương 2
2.1 Phân phối nhị thức 22
2.2 Phân phối siêu bội 26
2.3 Phân phối Poisson 30
2.4 Phân phối chuẩn 31
2.5 Phân phối Chi bình phương 35
2.6 Phân phối Student 37
2.1 Phân phối nhị thức
Định nghĩa (Phép thử Bernoulli) Phép thử mà ta chỉ quan tâm đến biến cố A cĩ xảy ra hay
khơng được gọi là phép thử Bernoulli
Ví dụ 2.1 Một sinh viên thi kết thúc mơn học A, ta quan tâm kết quả sinh viên này thi cĩ đạt hay khơng đạt Phép thử này là phép thử Bernoulli
Định nghĩa (Biến ngẫu nhiên Bernoulli) Thực hiện một phép thử Bernoulli, ta quan tâm đến
biến cố A cĩ xảy ra hay khơng Đặt : nếu biến cố A không xảy ra.
nếu biến cố A xảy ra
01
X
Giả sử P A
P X
1
p Khi đĩ biến ngẫu nhiên X được gọi là biến ngẫu nhiên Bernoulli với tham số p, ký hiệu X~B p
Bảng phân phối xác suất của biến ngẫu nhiên Bernoulli cĩ dạng
Dựa vào bảng phân phối xác suất của biến ngẫu nhiên Bernoulli cĩ EXp và VarXpq
Ví dụ 2.2 Sinh viên A trả lời một bài tập trắc nghiệm cĩ bốn lựa chọn trong đĩ chỉ cĩ một lựa chọn đúng, giả sử sinh viên này chọn câu trả lời một cách ngẫu nhiên Ta đặt biến ngẫu nhiên
nếu sinh viên trả lời sai
nếu sinh viên trả lời đúng
01
Trang 31thì X~B p Bảng phân phối xác suất của X
P 3/4 1/4
Trong thực tế ta thường thực hiện liên tiếp nhiều phép thử Bernoulli và đếm số lần xảy ra biến cố
A trong các lần thực hiện đĩ Phân phối xác suất số lần xảy ra A được trình bày ở mục kế tiếp
Định nghĩa (Phân phối nhị thức).Thực hiện n phép thử Bernoulli độc lập với xác suất xảy ra
biến cố A trong mỗi phép thử là p Đặt biến ngẫu nhiên
nếu biến cố A không xảy ra ở lần thử thứ i nếu biến cố A xảy ra ở lần thử thứ i
01
i
X
Biến ngẫu nhiên XX1X2 X n chỉ số lần A xảy ra trong n lần thực hiện
Biến ngẫu nhiên X được gọi là cĩ phân phối nhị thức tham số n và p; ký hiệu X~B n p
,
Ví dụ 2.3 Quan sát quyết định mua hàng của 5 khách hàng bước vào một cữa hàng quần áo Dựa trên kinh nghiệm từ trước, quản lý cửa hàng ước lượng xác suất khách hàng sẽ mua hàng là 0,3
và biết các khách hàng mua hàng độc lập với nhau Các vấn đề liên quan đến số lượng khách hàng mua hàng gồm:
a Xác suất cĩ 3 khách hàng sẽ mua hàng là bao nhiêu
b Trung bình sẽ cĩ bao nhiêu khách hàng sẽ mua hàng
c Độ lệch trung bình xung quanh giá trị trung bình của khách hàng sẽ mua hàng là bao nhiêu
d Số khách hàng chắc chắn nhất sẽ mua hàng hàng là bao nhiêu
Ví dụ 2.4 Một xạ thủ bắn 3 phát đạn vào một mục tiêu một cách độc lập, xác suất trúng mục tiêu
ở mỗi lần bắn là 0,7 Gọi các biến ngẫu nhiên:
nếu phát thứ i không trúng mục tiêu
nếu phát thứ i trúng mục tiêu
01
i
X
Vậy biến ngẫu nhiên : XX1X2X3~B
3;0.7
là số phát trúng mục tiêu trong 3 phát Giá trịcĩ thể của X là 0; 1; 2:
Ta thử tính xác suất cĩ 2 phát trúng mục tiêu:
nếu viên 1,2 trúng
nếu viên 1,3 trúng
nếu viên 2,3 trúng
2
2
3 2
Định lý Biến ngẫu nhiên X~B n p
,
i Xác suất cĩ đúng k lần biến cố A xảy ra
k k n k ; 0, ,n
P X k C p q k n
ii EXnp
iii VarXnpq với q = 1- p
iv np q ModX np q , người ta cịn gọi 1 ModX là số lần xuất hiện tin chắc nhất
Trang 32Tương tự
1
1
k k
P
P là dãy khơng tăng khi và chỉ khi k np q
Từ hai điều trên ta thu được:
1
np q ModX np q
Ví dụ 2.5 Một bài thi trắc nghiệm cĩ 10 câu hỏi, mỗi câu hỏi cĩ bốn lựa chọn trong đĩ chỉ cĩ một lựa chọn đúng Một sinh viên trả lời ngẫu nhiên tất cả các câu Gọi X là số câu trả lời đúng của sinh viên này
a Tính xác suất sinh viên trả lời đúng 2 câu
b Tính giá trị kỳ vọng, phương sai và Mod của biến ngẫu nhiên X
Hình 2.1: Đồ thị f x và
F x của
X~B
10;0.25
Giải Gọi biến ngẫu nhiên nếu trả lời đúng câu i.
nếu trả lời sai câu i
10
i
X
Trong đĩ P X
i 1
0.25 ;i1, 10.Biến ngẫu nhiên số câu đúng Trang 342.2 Phân phối siêu bội
Định nghĩa (phân phối siêu bội) một tập gồm có N phần tử, trong đó có NA phần tử có
tính chất A và N — NA phần tử không có tính chất A Từ tập ta lấy ngẫu nhiên n phần
tử (lấy một lần n phần tử hoặc lấy n lần không hoàn lại mỗi lần một phần tử)
Gọi X là số phần tử có tính chất A lẫn trong n phần tử lấy ra từ tập Khi đó X là biến ngẫu nhiên rời rạc nhận giá trị k sao cho
Ví dụ 2.8 Siêu thị mở đợt khuyến mãi dành cho khách hàng mua 5 sản phẩm từ một lô hàng gồm
15 sản phẩm trong đó có 5 sản phẩm loại A và 10 sản phẩm loại B Quản lý muốn quan tâm về số lượng sản phẩm mà khách hàng mua như sau
a Trong 5 sản phẩm khách hàng chọn, xác suất có 3 sản phẩm loại A là bao nhiêu
b Trung bình có bao nhiêu sản phẩm loại A mà khách hàng sẽ mua trong 5 sản phẩm
c Độ lệch chuẩn về số sản phẩm A mà khách hàng mua trong 5 sản phẩm
d Số sản phẩm A chắc chắn nhất mà khách hàng sẽ mua trong 5 sản phẩm
Ví dụ 2.9 Bộ phận marketing của một dooanh nghiệp có 50 nhân viên trong đó có 30 nhân viên nữ Cần chọn 10 nhân viên tiếp thị cho một sản phẩm mới, giả sử khả năng được chọn của các nhân viên là như nhau Gọi X là số nhân viên nữ được chọn Tính xác suất có
a Không quá 3 nhân viên nữ được chọn
b Ít nhất một nhân viên nữ được chọn
Giải X là số nhân viên nữ được chọn, khi đó X~H
50;30;10
a Xác suất không quá 3 nhân viên nữ được chọn :
Trang 35
0 10
30 20 10 50
Định lý Trong mơ hình phân phối siêu bội, khi thực hiện phép thử ta lấy liên tiếp n
lần khơng hồn lại, mỗi lần lấy một phần tử Ta gọi
nếu lần i lấy được phần tử loại A
nếu lần i không lấy được phần tử loại A
10
A : “ trong n lần đầu cĩ i phần tử loại A”, i1, ,n
i Xác suất lần n+1 lấy được phần tử loại A là
N EX N
;
A Ai
N N N Var X
Trang 36ii Phương sai
1
N n VarX npq
2
11
11
và là dãy không giảm khi và chỉ khi k k 0
Khi k không là số nguyên k ModX0 là số nguyên lớn nhất nhỏ hơn k : 0
Khi k là số nguyên Ta có ngay 0 ModXk0 vì khi k k k 0thì P là dãy không giảm k
Mặc khác, lúc này nên P kP k1cũng là ModX :
Trang 37a Lấy được ít nhất 1 quả cầu trắng
b Lấy được 2 quả cầu trắng
142
10 người, bảy người thích bóng đá và ba người thích bóng rổ Xét một mẫu ngẫu nhiên gồm 3 trong số 10 người trên
a Xác suất có đúng 2 người thích bóng đá là bao nhiêu?
Trang 38
2 1
7 3 3 10
2.3 Phân phối Poisson
Trong phần này ta xét biến ngẫu nhiên rời rạc thường dùng để ước lượng số lần xảy ra trong một khoảng thời gian hoặc không gian nhất định
Ví dụ 2.13 Biến ngẫu nhiên chỉ số ôtô đến một cửa hàng rửa xe trong một một giờ, số hư hỏng cần sửa chửa trên 10 dặm đường cao tốc, hoặc số lỗ lủng trên 100m ống dẫn nước Tính chất của phép thử Poisson:
1 Đối với hai khoảng bất kỳ có độ dài bằng nhau thì xác suất xảy ra bằng nhau
2 Việc xuất hiện hoặc không xuất hiện trong khoảng này độc lập với trong khoảng khác
Định nghĩa (Phân phối Poisson) Biến ngẫu nhiên rời rạc X nhận giá trị nguyên dương
được gọi là có phân phối Poisson với tham số , ký hiệu X~P
Ví dụ 2.14 Tại một trường đại học mở một khóa học, và học viên đăng ký qua điện thoại, theo kinh nghiệm trong những đợt ghi danh trước thì trung bình cứ 2 phút có 1 cuộc gọi đến Để đạt hiệu quả cao trong việc tiếp học viên, quản lý phòng ghi danh cần quan tâm đến việc bố trí nhân viên trực phù hợp thông qua các vấn đề
a Xác suất có 5 học viên gọi đến trong 10 phút
b Trung bình có bao nhiêu học viên gọi đến trong 10 phút
c Độ lệch chuẩn về số lượng học viên gọi đến trong 10 phút
d Số lượng học viên gọi điện đến chắc chắn nhất trong 10 phút là bao nhiêu
Ví dụ 2.15 Tại một nhà máy dệt, trung bình có 8 ống sợi bị đứt trong hai giờ Tìm xác suất để trong một giờ có không quá 2 ống sợi bị đứt
Giải Gọi X là số ống sợi bị đứt trong một giờ, X~P
4 Ta cần tìm xác suất0.05 0.1 0.15 0.2 0.25
Trang 39Định lý (Các đặc trưng của biến ngẫu nhiên phân phối Poisson) Nếu biến ngẫu nhiên X
có phân phối Poisson với tham số , X~P thì:
a Có đúng 5 cuộc gọi đến trong 1 phút
b Có ít nhất 2 cuộc gọi trong 1 phút
Giải Trung bình trong một phút có 10 cuộc gọi đến Gọi X là số cuộc gọi đến tổng đài
a Số cuộc gọi kỳ vọng trong một giờ là bao nhiêu?
b Xác suất có 3 cuộc gọi trong vòng 5 phút là bao nhiêu?
c Xác suất không có cuộc gọi nào trong một khoảng thời gian là 5 phút là bao nhiêu?
với X là số cuộc gọi đến trong 5 phút
c Xác suất không có cuộc gọi nào trong một khoảng thời gian là 5 phút là bao nhiêu?
2.4 Phân phối chuẩn
Định nghĩa (Phân phối chuẩn) Biến ngẫu nhiên lên tục X nhận giá trị trong khoảng
;
được gọi là có phân phối chuẩn tham số , Ký hiệu 0 X~N
, 2
nếu hàm mật độ xác suất có dạng Trang 40
tại x
Hình 2.6 là đồ thị của biến ngẫu nhiên chuẩn khi cố định , thay đổi giá trị của 0
2 0.2;1;5
Đồ thị hàm mật độ của biến ngẫu nhiên chuẩn với 2 0.2 sẽ cao hơn
và ít phân tán xung quanh giá trị trung bình hơn so với các trường hợp phương sai lớn hơn
Hình 2.6: Hàm f x của
X~N
; 2
Định lý (Các đặc trưng của biến ngẫu nhiên chuẩn) Nếu X là biến ngẫu nhiên có
phân phối chuẩn tham số ; thì
i EX và VarX 2
ii ModX
Định nghĩa (Phân phối chuẩn tắc) Biến ngẫu nhiên Z có phân phối chuẩn với tham
số và 0 được gọi là có phân phối chuẩn tắc, ký hiệu 2 1 Z~N