TRƢỜNG ĐẠI HỌC NÔNG NGHIỆP HÀ NỘI Bài giảng TOÁN THỐNG KÊ Mục lục Chương 4. NHỮNG KHÁI NIỆM CƠ BẢN MỞ ĐẦU VỀ THỐNG KÊ 3 3 3 1.2. 3 3 3 3 2.2. 5
Trang 1TRƯỜNG ĐẠI HỌC NÔNG NGHIỆP HÀ NỘI Bài giảng TOÁN THỐNG KÊ
Mục lục
Chương 4 NHỮNG KHÁI NIỆM CƠ BẢN MỞ ĐẦU VỀ THỐNG KÊ 3
I TỔNG THỂ VÀ MẪU 3
1.1 Tổng thể 3
1.2 Mẫu 3
1.3 Các phương pháp lấy mẫu 3
II BỐ TRÍ MẪU VÀ PHÂN PHỐI MẪU 3
2.1 Sắp xếp số liệu 3
2.2 Biểu diễn hình học của mẫu 5
III CÁC SỐ ĐẶC TRƯNG CỦA MẪU 5
3.1 Trung bình mẫu 5
2.2 Phương sai mẫu 5
2.3 Phương sai hiệu chỉnh của mẫu 6
IV MẪU NGẪU NHIÊN 8
4.1 Mẫu ngẫu nhiên 8
4.2 Các đặc trưng của mẫu ngẫu nhiên 8
4.3 Thống kê 8
V MỘT SỐ PHÂN PHỐI XÁC SUẤT DÙNG TRONG TOÁN THỐNG KÊ 8
5.1 Các định lý về phân phối chuẩn 8
5.2 Phân phối khi-bình phương (2 ) 9
5.3 Phân phối Student 9
5.4 Phân phối Fisher-Snedecor 10
5.5 Phân vị mức 1 – 10
BÀI TẬP CHƯƠNG 4 11
Chương 5 ƯỚC LƯỢNG THAM SỐ 12
Khái niệm về bài toán ước lượng tham số 12
I ƯỚC LƯỢNG ĐIỂM 12
1.1 Định nghĩa 12
1.2 Các loại ước lượng 12
1.3 Các ước lượng điểm thường gặp 13
a-/ Trung bình mẫu ngẫu nhiên: 13
b-/ Phương sai mẫu ngẫu nhiên hiệu chỉnh: 13
c-/ Tần suất 14
II ƯỚC LƯỢNG KHOẢNG 14
2.1 Khoảng tin cậy Độ tin cậy 14
2.2 Ước lượng kỳ vọng (giá trị trung bình) của phân phối chuẩn 15
a) Trường hợp biết phương sai D(X) = 2 15
b) Trường hợp không biết phương sai 2 16
2.3 Ước lượng phương sai của phân phối chuẩn 17
2.4 Ước lượng xác suất (tỷ lệ) 17
2.5 Kích thước mẫu cần thiết 19
BÀI TẬP CHƯƠNG 5 20
Trang 2Chương 6 KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ 22
I GIẢ THUYẾT, ĐỐI THUYẾT 22
1.1 Giả thuyết, đối thuyết 22
1.2 Quy tắc kiểm định giả thuyết 22
1.3 Các loại sai lầm 23
II CÁC BÀI TOÁN KIỂM ĐỊNH THAM SỐ 23
2.1 Kiểm định kỳ vọng của biến chuẩn 23
a) Trường hợp biết phương sai 2 23
b) Trường hợp chưa biết phương sai 2 24
c) Chú thích: 25
2.2 Kiểm định một xác suất (tỷ lệ) 27
2.3 Kiểm định sự bằng nhau của kỳ vọng hai biến chuẩn, mẫu độc lập 28
a) Trường hợp biết 2 2 x y σ và σ 28
b) Trường hợp không biết σ và σ 29 2 x 2 y c) Chú ý 30
2.4 Kiểm định sự bằng nhau của kỳ vọng hai biến chuẩn, mẫu theo cặp 31
2.5 Kiểm định sự bằng nhau của phương sai hai biến chuẩn 32
2.6 Kiểm định sự bằng nhau của hai xác suất (so sánh hai tỷ lệ) 33
III MỘT VÀI KIỂM ĐỊNH PHI THAM SỐ 34
3.1 Kiểm định luật phân phối xác suất 34
a) Trường hợp các pi đã biết 35
b) Trường hợp các pi phụ thuộc các tham số chưa biết 36
3.2 Kiểm định sự độc lập của hai đặc tính định tính 37
BÀI TẬP CHƯƠNG 6 40
Chương 7 TƯƠNG QUAN VÀ HỒI QUY TUYẾN TÍNH 45
I MẪU THỐNG KÊ HAI CHIỀU 45
1.1 Biến ngẫu nhiên hai chiều 45
1.2 Mẫu thống kê hai chiều 45
a) Nếu mẫu nhỏ (n nhỏ) 45
b) Nếu mẫu lớn và có nhiều số liệu trùng nhau 45
c) Nếu mẫu lớn và các số liệu ít trùng nhau 45
II HỆ SỐ TƯƠNG QUAN 46
2.1 Sự liên hệ tương quan 46
2.2 Hệ số tương quan lý thuyết 46
2.2 Hệ số tương quan mẫu 47
2.3 Kiểm định sự tương quan 48
III HỒI QUY TUYẾN TÍNH 49
3.1 Hàm hồi quy lý thuyết 49
3.2 Hàm hồi quy tuyến tính mẫu 50
3.3 Dự báo theo phương trình hồi quy 52
BÀI TẬP CHƯƠNG 7 54
CÁC BẢNG SỐ 57
Bảng1: Giá trị hàm phân phối chuẩn tắc: 57
Bảng 2: Phân vị Student: 58
Bảng 3: Phân vị khi bình phương 59
Bảng 4: Phân vị Fisher – Snedecor mức 0,05 60
Trang 3Chương 4 NHỮNG KHÁI NIỆM CƠ BẢN MỞ ĐẦU VỀ THỐNG KÊ
I TỔNG THỂ VÀ MẪU
1.1 Tổng thể
Trong thực tế và trong khoa học chúng ta thường phải khảo sát một tập hợp có rất nhiều phần tử Chẳng hạn khảo sát chiều cao của thanh niên Việt nam thì mọi thanh niên Việt nam đều là đối tượng cần khảo sát hay khảo sát nang suất của giống lúa A thì đối tượng khảo sát là mọi thửa ruộng trồng giống lúa A Trong lý thuyết toán thống kê, người ta gọi các tập hợp đó là tổng thể (còn gọi là tập hợp chính hoặc đám đông)
Số lượng các cá thể của tổng thể gọi là kích thước của tổng thể, thường ký hiệu bằng chữ
in hoa N
1.2 Mẫu
Do tổng thể quá lớn, và hơn nữa có nhiều nghiên cứu phải phá huỷ đối tượng nghiên cứu, chẳng hạn khi định lượng hàm lượng của một loại thuốc chữa bệnh nào đó bằng phương pháp hoá học
Bởi vậy cần chọn ra n phần tử của tổng thể để nghiên cứu, n phần tử được chọn đó gọi là một mẫu có kích thước n (hay mẫu có dung lượng n)
Kích thước mẫu thường rất nhỏ so với kích thước của tổng thể (n << N)
Tập hợp tất cả các mẫu có kích thước n có thể lấy được từ tổng thể gọi là không gian mẫu
có kích thước n
Nếu đặc tính cần nghiên cứu là đặc tính định lượng X, ký hiệu xi là giá trị của X đo được ở
cá thể thứ i của mẫu thì được bộ số liệu (x1, x2, , xn) Bộ số liệu (x1, x2, , xn) gọi là một mẫu thống kê kích thước n của X Dễ thấy khi đó đặc tính cần nghiên cứu X là một biến ngẫu nhiên
1.3 Các phương pháp lấy mẫu
Mục đích chọn mẫu là từ kết quả khảo sát các phần tử của mẫu để đưa ra kết luận cho cả tổng thể Vì thế mẫu phải đại diện cho cả tổng thể Muốn vậy mọi phần tử của tổng thể đều có cùng khả năng được chọn vào mẫu, nói cách khác việc chọn mẫu phải dựa trên nguyên tắc ngẫu nhiên
Các phương pháp cụ thể xem trong SGK (trang 97, 97)
II BỐ TRÍ MẪU VÀ PHÂN PHỐI MẪU
2.1 Sắp xếp số liệu
Xét mẫu (x1, x2, , xn) kích thước n của X Bước đầu tiên là phải sắp xếp lại các giá trị xi của mẫu để dễ dàng cho việc xử lý tiếp theo
a) Mẫu đơn:
Nếu dung lượng n nhỏ thì không cần thiết phải sắp xếp lại các số liệu thu thập được và gọi
là mẫu đơn
Với mẫu có dung lượng n lớn Khi đó có hai trường hợp:
b) Mẫu có tần số:
Nếu các số liệu thu thập được có nhiều giá trị giống nhau thì đếm số các giá trị giống nhau
và xếp các số liệu thành bảng hai dòng Chẳng hạn trong n giá trị thu được chỉ có k giá trị khác nhau là x1, x2, …, xk (trong đó xi < xi + 1) và có ni giá trị xi thì xếp thành bảng:
Trang 4X x1 x2 … xk
Trong đó n1 + n2 + … + nk = n
Các số ni gọi là tần số gặp giá trị xi trong mẫu và tỷ số
n
n
fi i gọi là tần suất gặp giá trị xi trong mẫu
Bảng trên gọi là mẫu có tần số
Thí dụ: Đo chiều cao của 20 thanh niên thấy có: 5 người cao 165 cm, 2 người cao 167, 3
người cao 164, 4 người cao 166, 2 người cao 163 và 1 người cao 168 Khi đó ta có bảng:
c) Mẫu phân lớp
Nếu các số liệu thu thập được không có, hoặc ít có các giá trị trùng nhau thì tiến hành phân khoảng các số liệu
Gọi xmin, xmax tương ứng là giá trị nhỏ nhất và lớn nhất của các số liệu thu thập được và giả
sử ta chia các số liệu thành k khoảng Khi đó đại lượng:
k
x x
h max min
gọi là độ rộng của lớp
Đặt x0 xmin; xi = x0 + ih, i = 1, 2, …, k sao cho xk xmax Mỗi khoảng (xi – 1, xi] được gọi
là một lớp (chú ý rằng cũng có thể chọn lớp là [xi – 1,xi)) Đếm các giá trị thuộc các lớp và xếp thành bảng:
X x0 – x1 x1 – x2 … xk – 1 – xk
Trong đó n1 + n2 + … + nk = n
Cũng như mẫu có tần số, các số ni gọi là tần số của lớp thứ i trong mẫu và tỷ số
n
n
fi i gọi
là tần suất của lớp i
Giá trị giữa lớp gọi là giá trị đại diện của lớp
Bảng trên gọi là mẫu phân lớp
Thí dụ: Cân thử 40 con gà 3 tháng tuổi được kết quả (đơn vị tính kg/con):
1,20 1,26 1,21 1,17 1,19 1,25 1,22 1,22 1,19 1,18 1,25 1,19 1,22 1,20 1,21 1,21 1,20 1,20 1,25 1,18 1,24 1,15 1,23 1,21 1,22 1,24 1,18 1,23 1,21 1,18 1,16 1,17 1,20 1,15 1,18 1,22 1,21 1,23 1,26 1,24
Ta có: xmax = 1,26; xmin = 1,15
Chia các số liệu thành 6 lớp (k = 6), chọn độ rộng của lớp là 0,02, lớp đầu tiên là (1,14; 1,16] được bảng phân lớp:
X (kg) 1,14 – 1,16 1,16 – 1,18 1,18 – 1,20 1,20 – 1,22 1,22 – 1,24 1,24 – 1,26
Chú thích: Nếu không phân lớp thì có bảng tần số:
X(kg) 1,15 1,16 1,17 1,18 1,19 1,20 1,21 1,22 1,23 1,24 1,25 1,26
Trang 52.2 Biểu diễn hình học của mẫu
Có thể lập bảng tần suất cho mẫu có tần số:
và cho mẫu phân lớp:
X x0 – x1 x1 – x2 … xk – 1 – xk
Trong các bảng trên thì fi = ni
n
Từ đó có dạng biểu diễn hình học cho mẫu có tần số hoặc mẫu phân lớp như sau: Chọn trục hoành biểu diễn các giá trị thu thập được và trục tung biểu diễn tần suất hoặc tần số khi đó
ta có một hình vẽ gọi là biểu đồ tần suất hoặc biểu đồ tần số Chẳng hạn biểu diễn hình học của hai thí dụ trong mục 2.1 là:
III CÁC SỐ ĐẶC TRƯNG CỦA MẪU
Sau khi sắp xếp lại các số liệu, ta thường phải tính các số đặc trưng của mẫu Sau đây là một số số đặc trưng chính của một mẫu thống kê
3.1 Trung bình mẫu
Số trung bình của mẫu thống kê (x1, x2, …, xn) là số:
1 i i n
2
n
1 n
x
x x
x (4.1)
Nếu mẫu cho có tần số:
1 i i i k
2 1
k k 2
2 1
n
1 n
n n
x n
x n x n
x (4.1a)
Nếu mẫu là phân lớp thì tính như mẫu có tần số, nhưng tính theo giá trị đại diện của lớp (giá trị giữa lớp)
Trung bình mẫu đặc trưng cho độ lớn của các số liệu quan sát được
2.2 Phương sai mẫu
Số phương sai của mẫu thống kê (x1, x2, …, xn) là số: s*2
=
n 1 i
2
i x) x ( n
1
(4.2) Biến đổi (4.2) được:
ni (fi)
5 (0,25)
4 (0,2)
3 (0.15)
2 (0,1)
1 (0,05)
0 163 164 165 166 167 168 X
ni (fi)
11 (11/40)
7 (7/40)
5 (5/40)
3 (3/40)
0 1,14 1,16 1,18 1,20 1,22 1,24 1,26 X
Trang 6s*2 = n 2
1 i
2 i 2
2 n
1 i i n
1 i
2 i 2
n
1 i i n
1 i
2
n
1 n
x x
n x
n
1 x n
(4.2a)
Nếu là mẫu có tần số thì: s*2
=
k
1 i
2 i
i(x x) n
n
1
(4.3) Biến đổi (4.3) được:
1 i
2 i i 2
2 n
1 i
n
1 i i i 2
i i 2
k
1 i i i k
1 i
2 i
n
1 n
x n x
n n x
n n
1 x n n
(4.3a) trong đó n = n1 + n2 + … + nk
Với mẫu phân lớp thì dùng công thức mẫu có tần số để tính và tính theo giá trị giữa của lớp (giá trị đại diện của lớp)
Căn bậc hai của phương sai gọi là độ lệch chuẩn của mẫu và ký hiệu là s*: 2
* s
*
s
2.3 Phương sai hiệu chỉnh của mẫu
Số phương sai hiệu chỉnh của mẫu thống kê (x1, x2, …, xn) là số: s2
= s*2 1 n
n
, nghĩa là:
s2 =
n 1 i
2
i x) x ( 1 n
1
(4.4)
Biến đổi (4.4) được: s2
=
1 n
x n x )
1 n ( n
x x
n 1 i
2 i
2 n 1 i i n
1 i
2 i
(4.4a)
Nếu là mẫu có tần số thì: s2
k 1 i
2 i
i(x x) n
1 n
1
(4.5)
Biến đổi (4.5) được: s2
=
1 n
x n x n )
1 n ( n
x n x
n
k 1 i
2 i i
2 k
1 i i i k
1 i
2 i i
trong đó n = n1 + n2 + … + nk
Với mẫu phân lớp thì dùng công thức mẫu có tần số để tính và tính theo giá trị giữa của lớp (giá trị đại diện của lớp)
Căn bậc hai của phương sai hiệu chỉnh gọi là độ lệch chuẩn hiệu chỉnh của mẫu và ký
hiệu là s: 2
s
s
Nếu coi trung bình mẫu x là tâm của dãy số liệu thu thập được thì đại lượng ei =xix là
độ lệch giữa xi và x , nó cho biết xi gần hay xa tâm x Bởi vậy phương sai mẫu cũng như phương sai mẫu hiệu chỉnh và các độ lệch chuẩn là đặc trưng cho độ phân tán các số liệu quan sát được quanh giá trị trung bình mẫu x
Chú ý rằng sau này chúng ta chỉ dùng phương sai hiệu chỉnh của mẫu s 2 mà không dùng phương sai mẫu s*2 Điều này sẽ được lý giải ở chương sau
Trang 7Phương sai, độ lệch chuẩn cũng như phương sai hiệu chỉnh, độ lệch chuẩn hiệu chỉnh đặc trưng cho độ phân tán của các số liệu quanh giá trị trung bình mẫu
Thí dụ 1 Tính các số đặc trưng của mẫu (số liệu của thí dụ 1 trong 2.1)
Giải: Thường dùng các công thức (4.1a), (4.2a) hoặc (4.3a), (4.4a) hoặc (4.5a) để tính các
số đặc trưng của mẫu Khi đó cần phải tính dung lượng mẫu n và các tổng: x, x2 Có hai cách tính các tổng này:
- Cách 1: Lập bảng tính như sau:
x ni nixi nixi2
- Cách 2: Tính theo hàng:
Dung lượng mẫu: n = 2 + 3 + … + 1 = 20
nixi = 163.2 + 164.3 + … + 168 = 3309
nixi2 = 1632.2 + 1642.3 + … + 1682 = 547511
Từ đó có: Trung bình mẫu: 165,45
20
3309
Phương sai mẫu: s*2 = (165,45)2
20
547511
=1,84750 độ lệch chuẩn: s* = 1,3592
Phương sai mẫu hiệu chỉnh: s2 =
19
) 45 , 165 ( 20
= 1,94474 s = 1,3945
Thí dụ 2 Tính các số đặc trưng của mẫu (số liệu của thí dụ 2 trong 2.1)
X (kg) 1,14 – 1,16 1,16 – 1,18 1,18 – 1,20 1,20 – 1,22 1,22 – 1,24 1,24 – 1,26
Giải: Có thể lập bảng tính như sau:
Lớp xi ni nixi nixi2 1,14-1,16 1,15 3 3,45 3,9675 1,16-1,18 1,17 7 8,19 9,5823 1,18-1,20 1,19 7 8,33 9,9127 1,20-1,22 1,21 12 14,52 17,5692 1,22-1,24 1,23 6 7,38 9,0774 1,24-1,26 1,25 5 6,25 7,8125
Trung bình mẫu:
40
12 , 48
x = 1,203
Trang 8Phương sai mẫu: s*2 = (1,203)2
40
9216 ,
57 = 0,00083 độ lệch chuẩn: s* = 0,0288
Phương sai mẫu hiệu chỉnh: s2 =
39
) 203 , 1 ( 40 9216 ,
= 0,00085 s = 0,0292
IV MẪU NGẪU NHIÊN
4.1 Mẫu ngẫu nhiên
Xét mẫu lượng n của biến ngẫu nhiên X Gọi Xi là biến ngẫu nhiên chỉ giá trị của X ở cá thể thứ i của mẫu thì được bộ biến ngẫu nhiên (X1, X2, …, Xn)
Bộ các biến ngẫu nhiên (X1, X2, …, Xn) gọi là mẫu ngẫu nhiên của X
Do việc khảo sát các cá thể trong mẫu là độc lập nên các biến ngẫu nhiên Xi trong mẫu ngẫu nhiên được coi là độc lập với nhau và cùng phân phối xác suất với X
Người ta còn nói mẫu thống kê (x1, x2, …, xn) là một thể hiện hay là một mẫu cụ thể của mẫu ngẫu nhiên (X1, X2, …, Xn)
4.2 Các đặc trưng của mẫu ngẫu nhiên
Cũng như mẫu thống kê (x1, x2, …, xn) của biến ngẫu nhiên X, với mẫu ngẫu nhiên (X1, X2, …, Xn) cũng có các đặc trưng của nó Đó là là:
Trung bình mẫu ngẫu nhiên:
n
X X
n
1 i
i
Phương sai mẫu ngẫu nhiên:
n
X X
* S
n 1 i
2 i
Phương sai hiệu chỉnh của mẫu ngẫu nhiên:
1 n
X X S
n 1 i
2 i 2
; … Các số dặc trưng của mẫu thống kê (x1, x2, …, xn) gọi là các thể hiện tương ứng của các đặc trưng của mẫu ngẫu nhiên
4.3 Thống kê
Xét mẫu ngẫu nhiên (X1, X2, …, Xn) Một hàm của mẫu ngẫu nhiên:
G = G(X1, X2, …, Xn) gọi là một thống kê
Như vậy các đặc trưng của mẫu ngẫu nhiên là các thống kê
Vì các thống kê là các hàm của các biến ngẫu nhiên nên nó cũng là các biến ngẫu nhiên và trong toán thống kê nó được khảo sát như mọi biến ngẫu nhiên khác, nghĩa là nó cũng có luật phân phối xác suất cũng như các số đặc trưng của nó
V MỘT SỐ PHÂN PHỐI XÁC SUẤT DÙNG TRONG TOÁN THỐNG KÊ
5.1 Các định lý về phân phối chuẩn
Phân phối chuẩn đã được trình bày trong chương 2, ở đây chỉ nêu thêm một số vấn đề về phân phối chuẩn
Với phân phối chuẩn có một số kết luận sau:
Trang 91) Nếu X ~ N(, 2
) thì:
Z =
X
~ N(0, 1)
2) Nếu các biến X1, X2, …, Xn độc lập và cùng
phân phối chuẩn N(, 2
) , thì:
, N
~ X n
1 X
2 n
1 i i
n n
1 X E n
1 X n
1 E X
E
n
1 i i n
1 i
1 X D n
1 X n
1 D X D
2 2 2 n
1 i
i 2
n
1 i i
3) Nếu X~N(x, x2
), Y~N(y, y2
) thì X Y ~ N(x y, x2
+ y2 ) (vì D(X Y) = D(X) + D(Y))
4) Trong toán thống kê thường phải tìm số u(/2) (còn ký hiệu là u/2) sao cho:
1 ) 2 / ( u
| X
|
P , với đã cho với X ~ N(, 2
)
Khi đó biểu thức đã cho là tương đương với: 2(u /2) – 1 = 1 – (u /2) = 1– /2
Từ đó số u(/2) được tìm bằng cách tra ngược bảng phân phối chuẩn: Tìm số 1 – /2 ở giữa bảng, dóng theo hàng và cột lên cột đầu tiên và hàng đầu tiên là số u(/2)
Thí dụ: u(0,025) = 1,96; u(0,05) = 1,645
5.2 Phân phối khi-bình phương (2 )
Định nghĩa: Nếu X1, X2, …, Xn là n biến ngẫu nhiên độc lập, cùng phân phối chuẩn tắc thì
n
2 2
2 1 2
X
X
có phân phối khi-bình phương với n bậc tự do Ký hiệu
2
~ 2
(n)
Chú ý rằng biến 2
~ 2 (n) chỉ nhận các giá trị không âm, đường cong mật độ xác suất của nó còn phụ
thuộc vào số bậc tự do n
Trong toán thống kê thường gặp biểu thức xác suất:
P(2 > 2(, n) ) = , với đã cho trong đó 2
~ 2(n) và phải tìm 2
(, n) (hay 2
, n) Khi đó số 2
(,n) được tìm trong bảng phân phối khi-bình phương ở giao của cột , dòng n Thí dụ: 2(0,05; 4) = 9,488; 2(0,95; 10) = 3,94
5.3 Phân phối Student
Định nghĩa: Nếu X, X1, X2, …, Xn là các biến ngẫu nhiên chuẩn tắc và độc lập với nhau
thì biến ngẫu nhiên
n 1 i
2 i
X n 1
X
T có phân phối Student với n bậc tự do Ký hiệu T ~ t(n)
f(q)
n1
n 2
O 2
( ,n 2 ) q 2
Đồ thị hàm mật độ biến 2
n bậc tự do (n 1 < n 2 )
f(t)
/2 /2 -t( /2) O t( /2) t
Đồ thị hàm mật độ biến Chuẩn
tham số , 2
Trang 10
Phân phối Student là phân phối đối xứng (đường
cong mật độ xác suất là đối xứng qua trục tung) Đồ thị
của hàm mật độ xác suất của biến Student có dạng
giống như đồ thị hàm mật độ xác suất của biến chuẩn
tắc, nhưng ít nhọn hơn (n càng lớn thì đường cong mật
độ xác suất càng nhọn)
Trong toán thống kê thường gặp biểu thức xác suất:
P(|T| > t(/2, n) ) = , với đã cho
trong đó T ~ t(n) phải tìm t(/2, n) (hay t/2, n)
Khi đó số t(/2, n) được tìm trong bảng phân phối Student ở giao của cột , dòng n
Thí dụ: t(0,025; 15) = 2,131; t(0,05; 15) = 1,753
Người ta chứng minh được rằng khi n lớn thì phân phối Student n bậc tự do là xấp xỉ phân phối chuẩn tắc Trong thực tế, nếu n > 30 thì phân phối Student n bậc tự do được coi là phân phối chuẩn tắc Vi thế:
t(0,025; 31) = t(0,025;35) = t(0,025; n) = 1,96, n31 (tra ở dòng cuối của bảng Student) t(0,05; 31) = t(0,05;35) = t(0,05; n) = 1,645, n31 (tra ở dòng cuối của bảng Student)
5.4 Phân phối Fisher-Snedecor
Định nghĩa: Nếu X1, X2, …, Xn và Y1, Y2, …, Ym là các biến ngẫu nhiên chuẩn tắc và độc
lập với nhau thì biến ngẫu nhiên
m 1 i
2 i
n 1 i
2 i
Y n
X m
F gọi là biến ngẫu nhiên Fisher với n, m bậc tự do
(Quy luật phân phối xác suất của F gọi là quy luật Fisher với n, m bậc tự do, chú ý bậc tự do của
tử số đọc trước) và ký hiệu F ~ F(n, m)
Trong toán thống kê thường gặp biểu thức xác suất:
P(F > F(,n,m) ) = , với đã cho
trong đó F ~ F(n,m) và phải tìm F(,n,m) (hay F, n, m)
Khi đó số F(,n,m) được tìm trong bảng phân phối
khi-bình phương ở giao của cột n, dòng m, bảng
Thí dụ: F(0,05; 9; 12) = 2,796
F(0,05; 12; 9) = 3,073
5.5 Phân vị mức 1 –
Phân vị mức 1 – của biến ngẫu nhiên X là số Xthỏa mãn:
P( X < X) 1 – P(X X) Nếu F(x) là hàm phân phối của X, thì từ tính chất của hàm phân phối, ta có:
F(X) 1 – F(X0)
Nếu X là biến ngẫu nhiên liên tục có hàm mật độ f(x) thì:
) (x)dx 1
X ( F
X
Các số u() ; 2
(, n); t(, n); F(, n, m) trong các phân phối trên chính là các phân vị mức 1 – của các phân phối tương ứng Chú ý là các phân vị trên có thể ký hiệu tương ứng:
u; 2
, n ; t , n; F , n, m
f(f)
n1,m1
n2,m2
O F( ,n1,m1) f F
Đồ thị hàm mật độ biến Fisher
n,m bậc tự do
f(t)
n1
n2 /2 /2 -t( /2,n1) O t( /2,n1) t T
Đồ thị hàm mật độ biến Student
n bậc tự do (n 1 > n 2 )