Biến cố {"một cây được chọn ngẫu nhiên từ một ô tiêu chuẩn có đường kính ngang ngực lớn hơn 30 cm và không quá 40 cm"} mô tả một tập hợp con của tất cả các cây trong ô tiêu chuẩn và do đ
Trang 1TRƯỜNG ĐẠI HỌC LÂM NGHIỆP - 2020
TS CAO THỊ THU HIỀN
THèNG K£
TRONG L¢M NGHIÖP
Trang 2TS CAO THỊ THU HIỀN
BÀI GIẢNG THỐNG KÊ TRONG LÂM NGHIỆP
TRƯỜNG ĐẠI HỌC LÂM NGHIỆP - 2020
Trang 4i
MỤC LỤC MỤC LỤC i
DANH MỤC CÁC BẢNG iii
DANH MỤC CÁC HÌNH v
LỜI NÓI ĐẦU 1
Chương 1 CƠ SỞ CỦA LÝ THUYẾT XÁC SUẤT 3
1.1 Thử nghiệm, biến cố, xác suất 3
1.2 Biến ngẫu nhiên 11
1.3 Ví dụ về các biến ngẫu nhiên rời rạc và liên tục 12
1.4 Kỳ vọng và phương sai 21
1.5 Các biến ngẫu nhiên và tổng của các biến ngẫu nhiên 24
Chươ ng 2 PHÂN BỐ CHUẨN 33
2.1 Phân bố chuẩn 33
2.2 Hình dạng phân bố 36
2.3 Tại sao phân bố chuẩn thú vị? 37
2.4 Các diện tích dưới đường cong phân bố chuẩn 43
2.4.1 Tìm các diện tích dưới đường cong phân bố chuẩn 43
2.4.2 Tìm hiểu thêm về việc tìm các diện tích dưới đường cong chuẩn tiêu chuẩn 45
2.5 Chuyển đổi thành điểm chuẩn 52
2.5.1 Chuyển đổi điểm thô thành điểm z 52
2.5.2 Chuyển đổi điểm z thành điểm thô 55
Chương 3 PHƯƠNG PHÁP BÌNH PHƯƠNG NHỎ NHẤT 59
3.1 Mô hình hồi quy tuyến tính và phương trình phân bố chuẩn Gaussian 59
3.2 Tương quan nhiều lớp và hệ số xác định 75
3.3 Ví dụ về mô hình hồi quy phi tuyến 76
Chương 4 THỐNG KÊ MÔ TẢ 80
4.1 Các khái niệm cơ bản và phân bố tần số 80
4.2 Đặc trưng vị trí, đặc trưng biến động và đặc trưng hình dạng 90
4.2.1 Đặc trưng vị trí 90
4.2.2 Đặc trưng biến động 101
4.3 Phân bố hai/nhiều hướng 106
4.4 Tương quan 111
Trang 5ii
Chương 5 THỐNG KÊ KẾT THÚC, ƯỚC TÍNH VÀ KIỂM TRA 115
5.1 Khoảng tin cậy 115
5.2 Tiêu chuẩn Gauss và xác suất của sai số 117
5.3 Tiêu chuẩn t của Student 124
5.4 Hai mẫu 125
5.5 Tiêu chuẩn t cho hai mẫu liên hệ 130
5.6 Phân tích phương sai một nhân tố 131
5.7 Phân tích phương sai hai nhân tố 135
5.8 Các dạng biến đổi 137
Chươ ng 6 HỒI QUY TUYẾN TÍNH ĐƠN GIẢN 139
6.1 Hồi quy và tương quan 139
6.2 Phương trình hồi quy tuyến tính đơn giản 141
6.3 Kiểm tra sự tồn tại của hồi quy 146
6.4 Khoảng tin cậy trong hồi quy 151
Chương 7 SO SÁNH CÁC PHƯƠNG TRÌNH HỒI QUY TUYẾN TÍNH ĐƠN 153 7.1 So sánh hai hệ số hồi quy 153
7.2 So sánh hai hệ số tự do 157
7.3 So sánh nhiều hệ số hồi quy 161
7.4 So sánh nhiều hệ số tự do 164
7.5 Nhiều so sánh giữa các hệ số hồi quy 165
7.6 Nhiều so sánh giữa các hệ số tự do 165
Chương 8 TƯƠNG QUAN TUYẾN TÍNH ĐƠN GIẢN 167
8.1 Hệ số tương quan 167
8.2 Khoảng tin cậy của hệ số tương quan tổng thế 171
TÀI LIỆU THAM KHẢO 176
Trang 6iii
DANH MỤC CÁC BẢNG Bảng 1.1 Kết quả thống kê loài cây và tính chất bị nhiễm nấm 8
Bảng 1.2 Bảng tổng hợp số cây theo loài và có/không nhiễm bệnh 8
Bảng 2.1 Các mẫu có dung lượng là 2 và trung bình mẫu tương ứng 39
Bảng 2.2 Các mẫu có dung lượng bằng 3 và trung bình mẫu tương ứng 40
Bảng 2.3 Tính xác suất theo các giá trị trong bảng 44
Bảng 2.4 Các diện tích tương ứng với z = 2,15 47
Bảng 2.5 Các diện tích tương ứng với z = 1,58 48
Bảng 2.6 Các diện tích tương ứng với z = 0,85 49
Bảng 2.7 Diện tích tương ứng từ z = 1,33 đến z = 0,33 50
Bảng 2.8 Diện tích tương ứng với z = −2,20 và z = 0,25 50
Bảng 2.9 Bảng hiển thị diện tích gần đúng nhỏ hơn khoảng 0,1 51
Bảng 3.1 Kết quả đo đường kính ngang ngực và chiều cao vút ngọn của cây rừng được đo cho ô tiêu chuẩn có diện tích 2.500 m2 ở trạng thái rừng lá rộng thường xanh ở vùng lõi Khu bảo tồn thiên nhiên Na Hang, Tuyên Quang 59
Bảng 3.2 Kết quả đo x và y 63
Bảng 3.3 Kết quả tính tổng và số trung bình 64
Bảng 3.4 Kết quả đo đường kính ngang ngực và chiều cao vút ngọn của cây rừng được đo cho ô tiêu chuẩn có diện tích 2.000 m2 ở trạng thái rừng lá rộng thường xanh nghèo kiệt tại Vườn quốc gia Bái Tử Long và trên địa bàn huyện Vân Đồn, tỉnh Quảng Ninh 66
Bảng 4.1 Số liệu kiểm kê chất lượng rừng trồng của loài cây Keo lai ở 100 ô tiêu chuẩn 83
Bảng 4.2 Kết quả điều tra đường kính ngang ngực của kiểu rừng kín lá rộng thường xanh mưa ẩm nhiệt đới tại xã Háng Đồng, huyện Bắc Yên, tỉnh Sơn La 83
Bảng 4.3 Kết quả lập bảng tần số về đường kính ngang ngực của 99 cây ở kiểu rừng kín lá rộng thường xanh mưa ẩm nhiệt đới 85
Bảng 4.4 Kết quả điều tra đường kính ngang ngực của của trạng thái rừng gỗ tự nhiên núi đất lá rộng thường xanh giàu tại xã Háng Đồng, huyện Bắc Yên, tỉnh Sơn La 86
Bảng 4.5 Kết quả lập bảng tần số thứ cấp về đường kính ngang ngực của trạng thái rừng gỗ tự nhiên núi đất lá rộng thường xanh giàu 88
Bảng 4.6 Ranh giới giữa các tổ 89
Bảng 4.7 Kết quả đo chiều cao cây rừng được đo cho ô tiêu chuẩn có diện tích 2.000 m2 ở trạng thái rừng gỗ tự nhiên núi đất lá rộng thường xanh phục hồi tại xã Long Hẹ, huyện Thuận Châu, tỉnh Sơn La 92
Trang 7iv
Bảng 4.8 Kết quả đo chiều cao cây rừng được đo cho ô tiêu chuẩn có diện tích 2.500 m2 ở trạng thái rừng gỗ tự nhiên núi đất lá rộng thường xanh phục hồi tại xã Liệp Tè, huyện Thuận Châu, tỉnh Sơn La 94
Bảng 4.9 Bảng tần số 95
Bảng 4.10 Kết quả đo đường kính ngang ngực của cây rừng được đo cho ô tiêu chuẩn có diện tích 2.000 m2 ở trạng thái rừng hỗn giao tre nứa tại xã Tà Hộc, huyện Mai Sơn, tỉnh Sơn La 96
Bảng 4.11 Kết quả sắp xếp các giá trị quan sát theo thứ tự từ nhỏ đến lớn 98
Bảng 4.12 Kết quả đo đường kính ngang ngực của cây rừng lá rộng thường xanh tại lâm trường Trường Sơn, tỉnh Quảng Bình 101
Bảng 4.13 Kết quả đo đường kính ngang ngực và chiều cao vút ngọn của cây rừng được đo cho ô tiêu chuẩn có diện tích 2.000 m2 ở trạng thái rừng lá rộng thường xanh tại huyện Vũ Quang, tỉnh Hà Tĩnh 106
Bảng 4.14 Bảng tương quan hai chiều 108
Bảng 5.1 Xác suất sai lầm loại 1 và loại 2 121
Bảng 5.2 Một số giá trị của xác suất sai lầm loại hai 123
Bảng 5.3 Bảng điều tra cây bị bệnh và không bị bệnh 127
Bảng 5.4 Kết quả điều tra xuất xứ 135
Bảng 5.5 Phân tích phương sai 135
Bảng 6.1 Kết quả điều tra ngày tuổi và chiều dài cánh của một loài chim 140
Bảng 6.2 Tổng hợp phân tích phương sai để kiểm tra giả thuyết H0: β = 0, H1: β ≠ 0 149
Bảng 6.3 Phân tích phương sai trong hồi quy 149
Bảng 7.1 Các tính toán để so sánh sự khác nhau giữa k hệ số hồi quy 162
Bảng 8.1 Các bảng phân bố chuẩn tiêu chuẩn 172
Trang 8v
DANH MỤC CÁC HÌNH Hình 1.1 Tập hợp các sự kiện cơ bản 4
Hình 1.2 Xác suất của hai biến cố 7
Hình 1.3 Xác suất có điều kiện 9
Hình 1.4 Xác suất lựa chọn các khúc gỗ đáp ứng đủ điều kiện 10
Hình 1.5 Biến ngẫu nhiên 11
Hình 1.6 Phân bố nhị thức 13
Hình 1.7 Phân bố Poisson 14
Hình 1.8 Phân bố số cây theo cỡ đường kính 15
Hình 1.9 Phân bố Gaussian 16
Hình 1.10 Xác suất của phân bố Gaussian 16
Hình 1.11 Hàm phân phối của phân bố Gaussian 17
Hình 1.12 Phân bố Weibull 3 tham số 20
Hình 1.13 Phân bố mũ 21
Hình 1.14 Kỳ vọng 21
Hình 1.15 Phân bố của Xi 30
Hình 1.16 Phân bố của các giá trị trung bình 30
Hình 1.17 Xác suất của phân bố nhị thức 32
Hình 2.1 Phân bố chuẩn 33
Hình 2.2 Phân bố chuẩn với các số trung bình khác nhau, độ lệch chuẩn giống nhau 34
Hình 2.3 Phân bố chuẩn với hai giá trị trung bình giống nhau, độ lệch chuẩn khác nhau 35
Hình 2.4 Ba phân bố chuẩn 35
Hình 2.5 Ví dụ về một phân bố lệch 36
Hình 2.6 Phân bố đều 36
Hình 2.7 Hộp chứa vé đánh dấu 1, 2, 3 38
Hình 2.8 Phân bố của X 39
Hình 2.9 Phân bố mẫu của giá trị trung bình cho n = 2 40
Hình 2.10 Phân bố của giá trị trung bình cho n = 3 41
Hình 2.11 Các mẫu cho số lượng trẻ em, n = 2 42
Hình 2.12 Đường cong phân bố chuẩn tiêu chuẩn hiển thị các diện tích 43
Hình 2.13 Diện tích bóng mờ biểu thị tỷ lệ điểm vượt quá z = 2,15 47
Hình 2.14 Diện tích bóng mờ biểu thị tỷ lệ các điểm lên tới z = 1,58 48
Hình 2.15 Diện tích bóng mờ biểu thị tỷ lệ các điểm từ z = -0,85 đến z = 0 49
Trang 9vi
Hình 2.16 Diện tích bóng mờ biểu thị tỷ lệ các điểm từ z = 0,33 đến z = 1,33 49
Hình 2.17 Diện tích bóng mờ biểu thị tỷ lệ các điểm từ z = -2,20 đến z = 0,25 50
Hình 2.18 Diện tích bóng mờ biểu thị 0,1 (10%) các điểm 51
Hình 2.19 Điểm thô và điểm z tương đương 53
Hình 2.20 Diện tích bóng mờ biểu thị tỷ lệ học sinh có điểm cao hơn Mai 55
Hình 2.21 Điểm trong bài kiểm tra tiếng Anh và điểm z tương ứng 55
Hình 2.22 Điểm z và điểm số thô tương ứng 56
Hình 2.23 Đường cong chuẩn với 95% số điểm nhỏ hơn z 57
Hình 3.1 Biểu đồ biểu diễn mối quan hệ H - D 61
Hình 3.2 Biểu đồ minh họa tổng bình phương độ lệch 61
Hình 3.3 Tổng của phần dư 62
Hình 3.4 Kết quả tính và biểu diễn quan hệ x - y 65
Hình 3.5 Quan hệ H - D theo dạng hàm bậc 2 70
Hình 3.6 Mối quan hệ giữa chiều cao, đường kính và tuổi 72
Hình 3.7 Mối quan hệ giữa chiều cao, đường kính và tuổi trong không gian ba chiều 73
Hình 3.8 Mối tương quan giữa chiều cao với đường kính 75
Hình 3.9 Mối quan hệ giữa tăng trưởng và tuổi 76
Hình 3.10 Hàm tăng trưởng 78
Hình 3.11 Đường cong chiều cao 78
Hình 4.1 Phân loại các biến định lượng 82
Hình 4.2 Phân bố tần số theo cỡ đường kính 86
Hình 4.3 Biểu đồ tần số tuyệt đối 89
Hình 4.4 Biểu đồ tần số tuyệt đối lũy tích 90
Hình 4.5 Hình minh họa độ nhọn phân bố 104
Hình 4.6 Phân bố có cùng một vị trí nhưng sự phân tán khác nhau 104
Hình 4.7 Phân bố có vị trí khác nhau nhưng sự phân tán là như nhau 105
Hình 4.8 Phân bố có vị trí khác nhau và sự phân tán cũng khác nhau 105
Hình 4.9 Đám mây điểm biểu diễn quan hệ H - D 108
Hình 4.10 Biểu đồ phân bố và tương quan H - D 109
Hình 4.11 Biểu đồ ba chiều 110
Hình 4.12 Biểu đồ biểu thị mối quan hệ của hai biến 112
Hình 4.13 Các cung phần tư với tích của tử số có giá trị dương và giá trị âm 112
Hình 5.1 Phân bố chuẩn tiêu chuẩn 115
Hình 5.2 Hàm mật độ của phân bố chuẩn tiêu chuẩn 116
Trang 10vii
Hình 5.3 Mật độ của (phải) và (trái) 119
Hình 5.4 Tiêu chuẩn Gauss một phía 120
Hình 5.5 Tiêu chuẩn Gauss hai phía 121
Hình 5.6 Nếu µ = µ1 > µ0, giả thuyết H1 là đúng 122
Hình 5.7 Nếu µ lớn hơn từ giả thuyết H1 122
Hình 5.8 Xác suất sai lầm với α = 0,05 124
Hình 5.9 Phân bố Student 125
Hình 5.10 Các khoảng tin cậy cho cây bị bệnh và không bị bệnh 128
Hình 5.11 Sai số dư 129
Hình 5.12 Tiêu chuẩn Fisher kiểm tra sự thuần nhất về phương sai 130
Hình 5.13 Tham số hóa 132
Hình 5.14 Tiêu chuẩn F của Fisher 134
Hình 5.15 Tương quan chéo giữa hai nhân tố với sự lặp lại nij 136
Hình 5.16 Thiết kế thí nghiệm hoàn toàn ngẫu nhiên 136
Hình 5.17 Ảnh hưởng của hai nhân tố có và không có tương tác với nhau 137
Hình 6.1 Chiều dài cánh của chim sẻ là một hàm của tuổi 140
Hình 6.2 Cặp giá trị thực (Xi, Yi) và cặt giá trị đường hồi quy (Xi, ) 142
Hình 6.3 Hệ số hồi quy của đường hồi quy có thể dương (a), âm (b) hoặc bằng (0) 143
Hình 6.4 Với các giá trị của tham số hồi quy khác nhau, có nhiều đường hồi quy khác nhau, mỗi đường có hệ số tự do khác nhau 144
Hình 6.5 Với các giá trị của tham số tự do khác nhau, có nhiều đường hồi quy khác nhau, mỗi đường có hệ số hồi quy khác nhau 145
Hình 7.1 Hai đường thẳng giao nhau tại giá trị X1 = 17,920C và Y = 63,79 µl/g/giờ 156
Hình 7.2 Phương trình hồi quy của hai mẫu 161
Hình 8.1 Mối tương quan tuyến tính đơn với các trường hợp 168
Trang 121
LỜI NÓI ĐẦU
Bài giảng này nhằm mục tiêu là giới thiệu về kỹ thuật của việc xử lý nhiều dữ liệu mà đã được thu thập trong nhiều lĩnh vực nghiên cứu, đặc biệt là trong lâm nghiệp Do đó, mục đích của tài liệu này nhằm (1) giới thiệu những kiến thức cơ bản nhất về thống kê cho sinh viên, giảng viên mà chưa có một chút kiến thức gì về thống kê và (2) là tài liệu tham khảo cho học viên cao học, cho giảng viên và các nhà nghiên cứu
Dữ liệu trong các ví dụ trong bài giảng này phần lớn là số liệu đo đếm ngoài thực địa của sinh viên trường Đại học Lâm nghiệp và để minh họa cho các quy trình thống kê Bài tập ở cuối một số chương có thể coi là ví dụ thêm cho các phương pháp thống kê Các ví dụ trong đây chủ yếu là minh họa cho các phương pháp tính toán và giúp sinh viên, học viên, giảng viên và các nhà nghiên cứu có thể hiểu được những kiến thức căn bản trong thống kê và có thể giải thích đúng các kết quả tính toán được Ngày nay, với sự phát triển của công nghệ thông tin, có rất nhiều phần mềm thống kê đã ra đời và được sử dụng rộng rãi trong giảng dạy và nghiên cứu và
đã giúp giải quyết được phần lớn các quy trình trong bài giảng này, tuy nhiên những phần mềm đó thường phải mua bản quyền hàng năm Do đó, tài liệu này sẽ là một trong những nguồn tham khảo có giá trị cho việc xử lý số liệu nói chung và trong lâm nghiệp nói riêng
Tác giả
Trang 132
Trang 143
Chương 1
CƠ SỞ CỦA LÝ THUYẾT XÁC SUẤT
1.1 Thử nghiệm, biến cố, xác suất
Lý thuyết xác suất và thống kê liên quan đến việc phân tích và định lượng các hiện tượng đại chúng Ở đây, dự đoán về tiến trình của các quá trình như vậy ở cảnh gần Một quá trình được gọi là một thử nghiệm nếu nó diễn ra trong các điều kiện không thể thay đổi, được xác định rõ và có thể lặp lại thường xuyên như mong muốn
a) Thí nghiệm nhân quả (xác định)
Trong cùng điều kiện và với mỗi lần lặp lại, chúng dẫn đến cùng một kết quả
Ví dụ: Nếu chúng ta bắc cầu cho các cực của nguồn điện 5 volt có điện trở 2,5 ohms thì dòng điện 2 ampe sẽ chạy qua
b) Thí nghiệm ngẫu nhiên
Các thí nghiệm không phải là nguyên nhân, nhưng thường dẫn đến kết quả khác nhau khi lặp lại
Ví dụ 1.1: Tung một đồng xu Ở đây, có thể xuất hiện mặt sấp hoặc mặt ngửa
Ví dụ 1.2: Lựa chọn ngẫu nhiên các cây trong ô tiêu chuẩn và đo đường kính
ngang ngực của cây hoặc xác định loài cây
Tập hợp tất cả các kết quả đầu ra của một thử nghiệm được gọi là không gian biến cố hoặc tổng thể Các yếu tố của nó được gọi là các biến cố cơ bản
với các biến cố cơ bản ω1, ω2, , ωn, nếu đó là không gian biến cố hữu hạn với N phần tử hoặc đối tượng Khi tung một đồng xu, N = 2, một hình lập phương
N = 6 Mặt khác, không gian biến cố Ω = {1, ω2, } biểu thị một không gian biến
cố vô hạn có thể đếm được, chẳng hạn như sẽ được sử dụng cho một thử nghiệm trong đó các số có vai trò, không giống như súc sắc, không theo dõi từ đầu được giới hạn ở trên Đây có thể là trường hợp, ví dụ, với số lượng quả trên cây hoặc số lượng vi khuẩn của một loài trong mẫu đất
Nếu ωi là các điểm tùy ý của một khoảng hoặc một bề mặt, thì người ta cũng nói về không gian biến cố liên tục (vô cùng lớn)
Trang 15của không gian biến cố = {(K, K), (K, Z), (Z, K), (Z, Z)} (với
N = 4) Khi tung xúc xắc, sự kiện {"khi tung thẳng con xúc xắc"} cũng là một tập con {2, 4, 6} ⊂ {1, 2, 3, 4, 5, 6} của không gian biến cố Biến cố {"một cây được chọn ngẫu nhiên từ một ô tiêu chuẩn có đường kính ngang ngực lớn hơn 30 cm và không quá 40 cm"} mô tả một tập hợp con của tất cả các cây trong ô tiêu chuẩn và
do đó là một biến cố
Hai biến cố đặc biệt là Ω và ∅ Ω là không gian sự kiện, cái gọi là biến cố an toàn, ∅ là tập rỗng, cái gọi là biến cố không thể
Trang 165
d) Xác suất
Khái niệm về sự tần số tương đối được biết đến từ thống kê mô tả có thể được coi đơn giản trong lý thuyết xác suất là một hàm (ngẫu nhiên) của các biến cố, một hàm đánh giá các biến cố theo tần suất xuất hiện của chúng Nếu một thử nghiệm được thực hiện n lần và sự xuất hiện của một biến cố A được quan sát k lần, thì ta
(4) Nếu A và B là các biến cố rời rạc A ∩ B = ∅, nghĩa là, kết quả thử nghiệm
Nếu người ta tưởng tượng rằng một thí nghiệm được lặp đi lặp lại liên tục và tần số tương đối của mỗi lần được xác định, thì người ta có thể mong đợi rằng dãy các tần số tương đối này sẽ hội tụ đến một giới hạn
với Nếu ví dụ tung đồng xu được lặp đi lặp lại rất thường xuyên, dự kiến trong khoảng một nửa các trường hợp sẽ xảy ra mặt ngửa, nghĩa là ftđ (A) → P (A) = 0,5 Điều này dẫn đến một thiết lập hàm mới, được xác định trên đại số ζ và có cùng thuộc tính với tần số tương đối
được gọi là phân bố xác suất Hàm này nhận các giá trị từ 0 đến 1 và nó được áp dụng như trên
Trang 176
Đôi khi xác suất có thể được bắt nguồn từ lý thuyết, chẳng hạn như tung đồng
xu hoặc lắc xúc xắc Đối với lắc xúc xắc, luôn giả sử P(i) = 1/6 cho tất cả các kết quả vì xúc xắc có 6 mặt i = 1, , 6 Có nhiều ví dụ khác trong đó tất cả các biến cố
cơ bản, như trong trường hợp hai biến cố vừa nêu, có cùng xác suất Trong những trường hợp như vậy, với mỗi ωi
sự xuất hiện của E với số N của kết quả có thể xảy ra trong Ω
Ví dụ 1.3: Xác suất tung chính xác 7 với hai con xúc xắc là bao nhiêu?
Đáp án như sau: Số lần thất bại có thể xảy ra N = 36 (cụ thể là tất cả các cặp (i, j) với i, j € {1, 2, 3, ,4 ,5, 6})
Số lần thuận lợi g = 6, vì E ={(1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1)}
P(E) = 6/36 = 1/6
Để tính toán với xác suất của các biến cố, đó là tập hợp con, có các quy tắc chung khác Quy tắc rất quan trọng được gọi là phép tính xác suất
Điều này được minh họa bằng hình 1.2 dưới đây:
Trang 187
Hình 1.2 Xác suất của hai biến cố
Từ hình trên, P được xác định với diện tích của các biến cố A và B, hoặc hợp của chúng Trung bình của hai biến cố sẽ được xem xét hai lần mà không trừ đi xác suất của nó Nếu giao điểm trống thì P (A ∩ B) = 0
Ví dụ 1.4: Cho tập hợp mười cây Ω = {ω1, ω2, …, ω10} Các cây ω3, ω7, ω8 là những cây Thông, ω1, ω3, 5, ω7 là những cây bị nhiễm nấm và nó được chặt ngẫu nhiên, đó là tất cả các cây có cùng xác suất bị chặt Tiếp tục là:
A = {một cây ngẫu nhiên là một cây Thông} = {ω3, ω7, ω8}
B = { Một cây chặt ngẫu nhiên bị nhiễm nấm} = {ω1, ω3, 5, ω7}
Xác suất mà một cây bị chặt ngẫu nhiên là Thông hoặc bị nhiễm nấm, tức là xác suất của biến cố ∪ B là bao nhiêu?
Một tính chất khác quan trọng hơn của xác suất được gọi là định lý nhân của xác suất
Điều ngược lại cũng được áp dụng, đó là, nếu A và B độc lập ngẫu nhiên, thì:
Trang 198
Cả hai là tương đương Trong ví dụ cuối:
Đó là, tính chất loài cây (cây Thông) và tính chất bị nhiễm nấm không độc lập
2 trong số 3 cây Thông bị nhiễm bệnh, nhưng chỉ có 2 trong số 7 cây không phải là cây Thông (xem Bảng 1.1) Do đó, các cây Thông cho thấy xu hướng chống lại bệnh nấm lớn hơn, hoặc nấm thích cây Thông hơn các loài cây khác
Bảng 1.1 Kết quả thống kê loài cây và tính chất bị nhiễm nấm
Ta có bảng chéo như sau:
Bảng 1.2 Bảng tổng hợp số cây theo loài và có/không nhiễm bệnh
Trang 20Điều này cũng có thể được minh họa một lần nữa trong hình đã được xem xét
ở trên như sau:
Hình 1.3 Xác suất có điều kiện
Nếu người ta đã biết rằng B đã xảy ra, thì chỉ những yếu tố (kết quả) của A mới được xem xét, cũng nằm trong B và do đó trong giao điểm A ∩ B Do đó, cũng rõ ràng rằng sự xuất hiện của A chỉ được xem xét trong không gian biến cố giới hạn ở B
Nếu hai biến cố A và B độc lập ngẫu nhiên, thì:
Do đó, xác suất xảy ra A là hoàn toàn độc lập với việc B đã xảy ra hay chưa,
cụ thể là luôn bằng P (A)
Ví dụ 1.5: Một cây gỗ bao gồm 10 khúc gỗ tròn Một khách hàng đã đưa ra
quy tắc để mua một cây gỗ như vậy khi hai khúc gỗ tròn được chọn ngẫu nhiên liên tiếp đáp ứng yêu cầu chất lượng của anh ta Tất nhiên, anh ta kéo khúc gỗ mà không đặt lại vị trí cũ, nghĩa là anh ta không thể kiểm tra cùng một khúc gỗ hai lần Câu hỏi đặt ra là với xác suất bằng bao nhiêu anh ta sẽ mua cây gỗ đó nếu 7 trong số 10 khúc gỗ tròn đáp ứng yêu cầu chất lượng của anh ta
Trang 2110
Đây là hai lựa chọn ngẫu nhiên phụ thuộc lẫn nhau, bởi vì kết quả của lựa chọn đầu tiên ảnh hưởng đến xác suất chọn khúc gỗ thứ hai tốt Để trả lời câu hỏi trước tiên chúng ta xác định không gian biến cố:
Ω = {(+, +), (+, -), (-, +), (-, -)}, Theo đó, ví dụ kết quả (+, -) có nghĩa là khúc gỗ tròn đầu tiên ổn, nhưng vòng thứ hai thì không Cả 4 biến cố cơ bản này chắc chắn không phải đều có khả năng như nhau, bởi vì các khúc gỗ tròn tốt thường phổ biến hơn các khúc gỗ chất lượng xấu, vì vậy có thể nói rằng (+, +) sẽ có nhiều khả năng hơn (-, -) Hơn nữa, hãy để A1 là biến cố mà khúc gỗ tròn đầu tiên được rút ra là ổn, A2 là sự kiện mà khúc thứ hai ổn, theo đó:
gỗ tròn đều theo thứ tự Xác suất của nó là sau khi chuyển đổi công thức cho xác suất có điều kiện là:
Kết quả 6/9 vì lần chọn thứ hai chỉ còn lại 9 khúc gỗ, trong đó có 6 khúc gỗ đáp ứng được điều kiện của người mua 7/10 là đã rõ ràng Người ta cũng có thể tưởng tượng một không gian sự kiện khác, cụ thể là được biểu thị bằng hình 1.4 như sau:
Hình 1.4 Xác suất lựa chọn các khúc gỗ đáp ứng đủ điều kiện
Khúc gỗ
Trang 2211
Dưới đây là 90 sự kiện được xem xét, và người ta cho rằng các khúc gỗ từ 1 đến 7 là những sự kiện tốt (là những khúc gỗ đáp ứng yêu cầu của người mua) Hai trục (trục tung và trục hoành) đại diện cho hai lần vẽ và các sự kiện trên đường chéo
là không thể khi kéo mà không đi qua Ở đây tất cả các sự kiện cơ bản đều có thể xảy ra như nhau và kết quả thuận lợi cho các trường hợp có thể xảy ra là 42/90 = 0,467, kết quả tương tự như trước
Ví dụ 1.6: Quay trở lại số liệu trong bảng 1.1, ta có xác suất cây Thông bị
nhiễm nấm là:
Trong khi cây Thông chỉ chiếm 3/10 tổng số cây, chưa đến một nửa
1.2 Biến ngẫu nhiên
Từ một số ví dụ ta thấy, không gian sự kiện thường là các tập hợp đối tượng trừu tượng, chẳng hạn như tập hợp các cặp cây hoặc cặp + và - trong ví dụ về 10 khúc gỗ (ví dụ 3.5), hay mặt sấp và mặt ngửa trong ví dụ tung đồng xu Đối với nhiều thí nghiệm, điều đó chứng tỏ có ý nghĩa không phải là xem xét các sự kiện cơ bản, mà là ánh xạ của chúng thông qua X thành tập hợp các số thực
Trong lựa chọn ngẫu nhiên các cây từ một lâm phần (mỗi cây đại diện cho một
sự kiện cơ bản), người ta không quan tâm đến loài cây cụ thể mà chỉ quan tâm tới đường kính ngang ngực của cây Sự chuyển đổi từ sự kiện cơ bản này sang kết quả
đo là ánh xạ vào các số thực (dương), như thể hiện trong hình 1.5 sau đây:
Hình 1.5 Biến ngẫu nhiên
Trang 2312
Với ánh xạ này từ không gian sự kiện thành các số thực, chúng tôi cũng muốn chuyển phân bố xác suất của thử nghiệm, bởi vì một thử nghiệm được mô tả bởi không gian sự kiện và phân bố xác suất có liên quan, tức là theo cặp (Ω, P)
Điều này được đảm bảo nếu, đối với mỗi sự kiện, A, nghĩa là, mọi tập hợp con
IR cần xem xét, thường là các khoảng - là khoảng [a, b] -, xác suất liên quan được lấy theo xác suất của ảnh gốc
sử rằng một cây có đường kính của nó rơi vào khoảng (30, 34) có thể được đánh giá một cách hữu ích với xác suất, nếu người ta xác định nó bằng tỷ lệ của các cây, có
hợp của tất cả các cây ωi với X(ωi) ∈ A ⊂ IR
Người ta nói về một biến ngẫu nhiên đa chiều (k chiều) khi:
1.3 Ví dụ về các biến ngẫu nhiên rời rạc và liên tục
Ví dụ 1.7: "Cây bị nhiễm nấm" Một biến ngẫu nhiên mô tả sự phá hoại của
nấm là:
Với:
Và được áp dụng như sau:
Trang 2413
Trong trường hợp này, chúng ta cũng nói về một biến ngẫu nhiên rời rạc Ví
dụ, chúng ta chỉ có hai nhận thức có thể Phân bố xác suất của chúng là phân bố nhị
phân bố B(1, p) tung đồng xu cũng được mô tả, trong đó giả sử là p = 0,5 Sau đó, phân bố B(n, p) vẫn sẽ được giới thiệu, mô tả xác suất của việc thực hiện số nguyên giữa 0 và n
Hình 1.6 Phân bố nhị thức
Hình khối với một khối có thể được mô tả bằng một biến ngẫu nhiên X nhưng
phân bối n đối tượng ngẫu nhiên và được chọn trả về trong các đối tượng k, giả sử
(1.11)
= 1/6 với tất cả i và k = 6 Được cuộn nhiều lần, ví dụ: 2 lần, ta có:
Trang 2514
X: (
Kết quả này, ví dụ, trong các xác suất sau:
Một phân bố rời rạc quan trọng khác là phân bố Poisson Các biến ngẫu nhiên trong phân bố Poisson có thể lấy tất cả các số tự nhiên bao gồm 0, đó là X = 0, 1, 2, 3 Xác suất của chúng là:
Hình 1.7 Phân bố Poisson
Đỉnh của phân bố dịch chuyển ngày càng xa về bên phải khi λ tăng và độ tán
xạ cũng tăng
Trang 2615
Việc đo đường kính của một cây được chọn ngẫu nhiên từ một lâm phần ban đầu cũng là một biến ngẫu nhiên rời rạc, vì có nhiều cây và do đó có thể có nhiều đường kính khác nhau Hàm phân bố của các đường kính này là hàm cầu thang Nhưng lâm phần có càng nhiều cây, cầu thang càng thấp và càng ngắn Điều tương
tự cũng có thể thấy trong biểu đồ phân bố đường kính, càng nhiều cây, càng nhiều
cỡ đường kính và có nhiều cỡ đường kính nhỏ Hai hình dưới đây cho thấy biểu đồ của 30 và 1.000 đối tượng được chọn ngẫu nhiên
(Nguồn: Trích từ phần mềm STATISTICA)
Hình 1.8 Phân bố số cây theo cỡ đường kính
Thay vì mô tả đầy đủ phân bố xác suất của các đường kính rời rạc, sẽ yêu cầu nhiều tham số như có các đường kính khác nhau, trong các trường hợp như vậy, cần tìm một hàm giới hạn phù hợp mô tả đầy đủ phân bố tần số Hai hình trên có dạng đường cong hình chuông Gaussian
(1.13)
điểm trên trục x mà trên đó hàm có cực đại và vị trí của hai điểm quay trái và phải của cực đại tại x = μ - ζ và x = μ + ζ, ở đây là 7 và 13 Phân bố xác suất này cũng
Trang 2716
Hình 1.9 Phân bố Gaussian
Do đó, một biến ngẫu nhiên rời rạc thực sự được coi gần như là một biến ngẫu nhiên liên tục Các ví dụ khác về các biến ngẫu nhiên liên tục như nhiệt độ hoặc lượng mưa, nhưng chỉ ở mức độ nếu người ta cho rằng chúng có thể được đo với độ chính xác như mong muốn
Đường cong hình chuông Gaussian là một ví dụ về phân bố xác suất của một đại lượng ngẫu nhiên ổn định Trong thực tế, có vô số đường cong hình chuông như
Hàm f (x) được gọi là mật độ xác suất Nó được cho là có liên quan rất chặt chẽ với biểu đồ và cho phép tính toán xác suất cho biến ngẫu nhiên X Xác suất nhận được nằm trong một khoảng [a, b] được đưa ra bởi tích phân cụ thể của hàm trên khoảng, đó là trong công thức:
(1.14)
Hình 1.10 Xác suất của phân bố Gaussian
khoảng xác suất 68%
Trang 2817
Nếu người ta biết một hàm nguyên thủy F của f, thì:
(Nguồn: Trích từ phần mềm STATISTICA)
Hình 1.11 Hàm phân phối của phân bố Gaussian
Trang 29và được định nghĩa bởi
Một lần nữa, với giá trị hàm F (x), nó chỉ ra xác suất mà việc thực hiện nằm ở bên trái của x Điều này tương ứng với Fn(x), tần số quan sát tương đối ở bên trái của x trong hàm phân bố thực nghiệm
Mật độ xác suất rất đơn giản là phân bố bằng nhau trong khoảng đơn vị:
(1.20)
Do đó, trong nhiều sách giáo trình, sẽ có các bảng tra của hàm phân bố N (0,1), trong đó ta thấy F(x) liên quan tới các giá trị x trong một khoảng [0, b] Hàm
với f (x) = Φ0,1(x)
Trang 3019
(1.21) Tất cả các phân phối chuẩn khác, tức là với các tham số khác 0 và 1, giờ đây có thể dễ dàng chuyển sang phân bố chuẩn tiêu chuẩn Đây là mối quan hệ quan trọng:
hàm tại điểm x như của phân bố N(0,1) tại điểm (x - µ)/ζ Do đó, tất cả các hàm phân
bố này có thể được tính bằng cách sử dụng bảng phân bố N (0,1) nếu biết µ và ζ Mối quan hệ này có thể được bắt nguồn rất dễ dàng với sự trợ giúp của quy tắc thay thế Thay u = (z - μ)/ζ như sau:
(1.23) (1.24)
ζ cắt ra và tích phân trên mật độ phân bố N (0,1) với giới hạn trên u(x) = (x -
Do đó, đối với biến ngẫu nhiên X có phân bố N(μ, ζ2), xác suất mà việc thực hiện (giá trị đo) nằm trong khoảng [a, b] có thể được tính như sau:
(1.25) Một ví dụ thứ ba về phân bố xác suất liên tục là phân bố Weibull hai tham số Mật độ và hàm phân bố là:
b được gọi là tỷ lệ - (scale) và tham số hình dạng c (shape) Phân bố này thường được sử dụng để mô tả các phân bố đường kính Phân bố Weibull 3 tham số được dịch sang phải và không bắt đầu từ 0 nhưng tại một điểm a > 0
Trang 3120
(Nguồn: Trích từ phần mềm STATISTICA)
Hình 1.12 Phân bố Weibull 3 tham số
Ví dụ cuối cùng là phân bố mũ, có dạng như sau:
Phân bố này chỉ có một tham số là
Trang 3221
(Nguồn: Trích từ phần mềm STATISTICA)
Hình 1.13 Phân bố mũ 1.4 Kỳ vọng và phương sai
Giá trị kỳ vọng và phương sai của các biến ngẫu nhiên X được ký hiệu là E(X)
và Var(X) hoặc EX và Var X và được xác định cho các biến ngẫu nhiên rời rạc bởi
(1.28) Trong đó: k là số lần thực hiện có thể và cũng có thể là vô hạn Ngoài ra, xác suất của tất cả các thực hiện phải được biết để tính toán Cả hai đại lượng là trung bình có trọng số Rõ ràng, người ta có thể hiểu giá trị kỳ vọng là trọng tâm của phân
bố khối lượng, được mô tả bởi phân bố xác suất
Hình 1.14 Kỳ vọng
Trang 3322
phân bố khối lượng này được xác định bởi:
tất cả đều dương và cộng với 1, thì chúng ta có giá trị kỳ vọng
Giá trị kỳ vọng của phân bố nhị thức B(1, p) là theo định nghĩa này
Do đó gần với 1 hơn với p > 0,5 và gần hơn với 0 với p < 0,5, nhưng luôn nằm giữa hai giá trị 0 và 1 Nếu muốn cân bằng hai khối lượng (1-p) và ghim tại các điểm 0 và 1, thì phải hỗ trợ trong trọng tâm xS = EX = p
Trang 3423
Với trường hợp biến rời rạc cũng tương tự, xem xét f(x)dx tương ứng với xác suất P(X = xi) và tích phân tổng cộng của tất cả các giá trị k
Đối với phân bố bằng nhau, ta có:
Bây giờ chúng ta muốn tính toán kỳ vọng và phương sai của phân bố Gaussian theo hai định nghĩa và một lần nữa sử dụng cùng một sự thay thế như trên để trả
(1.36) Tích phân đầu tiên của hai số nguyên là 0, bởi vì hệ số u của mật độ N(0, 1) tạo ra một hàm đối xứng với điểm gốc của tọa độ, tức là nó chạy về bên trái của điểm 0 bên dưới trục x và hình ảnh phản chiếu bên phải ở trên Nghĩa là, diện tích dưới hàm bên phải của điểm 0 là dương và có độ lớn bằng diện tích âm ở bên trái 0 Phần thứ hai của hai tích phân là 1, vì nó đại diện cho xác suất P(-∞, +∞) = 1 của phân bố N(0, 1), với sự thay thế tương tự như sau cho phương sai
(1.37) Trong dòng thứ ba của đạo hàm này, chỉ có một hàm e được thêm và trừ, với kết quả là tích phân thứ hai là 1 (đối số như trong giá trị kỳ vọng) và tích phân của tích phân thứ nhất là hàm gốc -u.exp(-u2/2 ) Cái sau có thể dễ dàng được tính toán
Trang 3524
lại bằng cách tính đạo hàm Thực tế là tích phân xác định trở thành 0 nằm một lần nữa trong tính đối xứng của hàm gốc với gốc của hệ tọa độ Nếu trước tiên người ta chèn -z và + z làm giới hạn tích hợp thay vì -∞ và +∞ và sau đó cho phép chúng đi đến vô cùng, thì ngay cả trước khi vượt biên, rõ ràng là:
(1.38) Phương sai và kỳ vọng của phân phối chuẩn Gaussian như sau:
Mối quan hệ giữa giá trị kỳ vọng hoặc phương sai và các tham số của mật độ xác suất liên quan không phải lúc nào cũng dễ dàng có thể được nhìn thấy từ phân phối Weibull với hai tham số b và c
1.5 Các biến ngẫu nhiên và tổng của các biến ngẫu nhiên
Trong các phần trước, các phân bố xác suất khác nhau đã được giới thiệu và đối với các mô hình thống kê ứng dụng, câu hỏi đặt ra bây giờ là làm thế nào để đưa
ra kết luận về phân bố xác suất liên quan đến không gian sự kiện và cho một thử nghiệm, đó là sử dụng một mẫu nhất định có thể kéo thông số Trong các trường hợp đơn giản, chẳng hạn như thử nghiệm tung đồng xu, thường biết rõ sẽ chọn phân
Trang 36Trong ước lượng tham số, như chúng ta sẽ thấy, tổng và giá trị trung bình số học, kết hợp tuyến tính chung của các biến ngẫu nhiên đóng một vai trò quan trọng Tình huống bắt đầu trong thực tế thường xảy ra n lần các sự kiện cơ bản của không gian sự kiện hoặc được đưa ra, ví dụ, bằng cách chọn ngẫu nhiên n lần của một cây
từ một lâm phần Nếu tính độc lập ngẫu nhiên được đưa ra bổ sung, thì một thí nghiệm như vậy có thể được mô tả bằng n biến ngẫu nhiên độc lập (một mẫu có kích thước n) với các phân bố giống hệt nhau, vì tất cả được thực hiện lặp đi lặp lại
từ cùng một không gian sự kiện
Chữ viết tắt độc lập ngẫu nhiên và phân phối đều là i.i.d Phân bố đều ở đây không có nghĩa là tất cả các biến ngẫu nhiên có phân bố bằng nhau, nhưng chỉ có điều chúng đều có cùng phân bố Trong chương tiếp theo, các kỹ thuật lấy mẫu phức tạp hơn sẽ được thảo luận
Nếu có chính xác k các phép đo khác nhau xj (j = 1, , k) trong một mẫu có kích thước n và tần số tương đối của xj là fj, trung bình có trọng số tương tự như định nghĩa của giá trị kỳ vọng
Sau đó, cần phải xem xét "ước tính hợp lý" nghĩa là gì Bạn sẽ cần giá trị kỳ vọng và phương sai của trung bình số học Tuy nhiên, tại thời điểm này, vẫn còn chỉ
ra một sự khác biệt quan trọng trong ký hiệu Các x nhỏ luôn được sử dụng ở đây để
mô tả các số đọc cụ thể hoặc các giá trị được quan sát thực tế, trong khi các X lớn được sử dụng để mô tả các biến ngẫu nhiên Theo nghĩa này:
(1.44)
Trang 3726
Biến ngẫu nhiên "trung bình số học" theo nghĩa của một quy tắc tính toán trừu tượng về cách tiến hành với các giá trị x sẽ được nâng lên cũng được gọi là công cụ ước tính, trong khi là ước tính Số sau là số cố định, số trước là số lượng ngẫu nhiên Phần giới thiệu này cần làm rõ rằng, trước khi nhập số liệu thống kê thực tế, vẫn cần xem xét loại phân bố nào và cụ thể là giá trị kỳ vọng và phương sai như tổng hoặc giá trị trung bình và, nói chung, kết hợp tuyến tính của các biến ngẫu nhiên, nếu phân bố, giá trị kỳ vọng và phương sai của mỗi Xi đã biết Cái sau thường là đúng, ít nhất là gần đúng, vì người ta có thể ước tính từ mẫu phân bố của
Xi (ví dụ biểu đồ), trong khi phân bố của trung bình số học của nó, , không thể được hiển thị ngay từ đầu, vì chỉ có mẫu đơn của một mẫu mới có thể hình dung được giá trị trung bình Hãy bắt đầu với các hàm đơn giản của các biến ngẫu nhiên Hàm tuyến tính của một biến ngẫu nhiên X: Z = aX + b
Chúng ta đang tìm kiếm kỳ vọng và phương sai của Z, nếu EX và Var X đã biết Nếu P là phân bố xác suất (rời rạc), f(x) là hàm xác suất của X, thì nó xuất phát
từ định nghĩa của giá trị kỳ vọng và phương sai, cũng như các quy tắc tính toán cơ bản cho tổng và tích phân cho các số thực a và b tùy ý
(1.45)
(1.46)
Cái trước là cho biến rời rạc, cái sau cho các biến ngẫu nhiên liên tục Vì đạo hàm rõ ràng là giống hệt nhau cho các tổng và tích phân, chúng ta chỉ xem xét phương sai cho các biến ngẫu nhiên rời rạc Đối với phương sai phát sinh:
(1.47)
Có thể thấy rằng việc thêm một hằng số không làm thay đổi phương sai của một biến ngẫu nhiên, vì b bị loại bỏ và việc nhân với một hằng số làm tăng phương sai với bình phương của hằng số
Ví dụ: Chuẩn hóa
Trang 3827
Bằng cách áp dụng quy tắc thay thế của phép tính tích phân rằng biến ngẫu
thành N(0,1) bằng cách trừ giá trị kỳ vọng và chia cho độ lệch chuẩn, cụ thể như sau
Sự chuyển đổi này còn được gọi là chuẩn hóa Với các quy tắc cho EX và Var
X như thấy ở trên, giờ đây nó có thể được hiển thị cho các biến ngẫu nhiên, thậm chí không phải là phân bố chuẩn, phép biến đổi này thường không có cùng kiểu phân bố như X, nhưng trong mỗi trường hợp EZ = 0 và Var Z = 1
(1.49) Quy tắc tính toán cho giá trị kỳ vọng ở đây với:
Theo đó, kết quả:
Đối với tổng của hai đại lượng ngẫu nhiên, áp dụng phương trình đơn giản sau (không cần chứng minh):
Do đó, giá trị kỳ vọng của một tổng của các biến ngẫu nhiên luôn bằng tổng giá trị kỳ vọng riêng lẻ và nói chung, điều này có nghĩa là không có sự độc lập ngẫu nhiên hoặc bất kỳ loại phân bố nào Điều này không áp dụng cho phương sai, bởi vì quy tắc tính toán ở trên cho tổng của hai biến ngẫu nhiên theo định nghĩa của phương sai và phép nhân của các biểu thức gốc:
Trang 3928
tương ứng với tử số của hệ số tương quan từ thống kê mô tả
(1.54) Bởi vì nó được áp dụng
(1.55)
Và với sự trợ giúp của hiệp phương sai này tương tự với hệ số tương quan theo kinh nghiệm rxy, người ta cũng có thể định nghĩa một hệ số tương quan lý thuyết hoặc hệ số tương quan thực:
(1.56)
Hiệp phương sai là thước đo mối quan hệ giữa X1 và X2 Do đó, đối với các biến ngẫu nhiên độc lập ngẫu nhiên mà hiệp phương sai và tương quan là 0, công thức đơn giản hơn được áp dụng
Chúng ta tóm tắt các quy tắc như sau Đối với bất kỳ biến ngẫu nhiên X, X1
và X2 và các số thực a và b
của tổng số áp dụng:
(1.58) Bằng nhiều ứng dụng và kết hợp, người ta có thể khái quát hóa thêm 4 quy tắc này và sử dụng chúng cho các kết hợp tuyến tính của các biến ngẫu nhiên, sao cho các biến ngẫu nhiên tùy ý với các giá trị kỳ vọng và phương sai tùy ý và
luôn giữ
Trang 401/n Nếu Xi độc lập ngẫu nhiên, thì ta có:
Lưu ý rằng các giá trị kỳ vọng và phương sai của tất cả các biến ngẫu nhiên
(1.63)