Nội dung hệ quả này còn là cơ sở cho một phương pháp được áp dụng trong thống kê là phương pháp mẫu mà thực chất của nó là dựa vào mẫu ngẫu nhiên để đi đến kết luận cho tổng thể các đối
Trang 178
Chương 5 CÁC ĐỊNH LÝ GIỚI HẠN
5.1 ĐỊNH NGHĨA Dãy các ĐLNN {Xn} được gọi là hội tụ theo xác suất tới ĐLNN X nếu với > 0, n
Trang 2nó
Ví dụ 1 Thu nhập trung bình hàng năm của dân cư một vùng là
700 USD và độ lệch chuẩn là 120 USD Hãy xác định một khoảng thu nhập hàng năm xung quanh giá trị trung bình của ít nhất 95% dân cư vùng đó
Giải Gọi X là thu nhập hàng năm của dân cư vùng đó thì X là
ĐLNN với quy luật phân phối xác suất chưa biết song có kỳ vọng toán E(X) = 700 và độ lệch chuẩn D(X) = 120 Do đó theo bất đẳng thức Trê-bư-sép, ta có:
5.3 ĐỊNH LÝ TRÊ-BƯ-SÉP
5.3.1 Định lý Giả sử X1, X2, , Xn là dãy các ĐLNN độc lập từng đôi một, có kỳ vọng E(Xi) đều hữu hạn (i 1, n ) và phương sai D(Xi) bị chặn trên bởi hằng số C (nghĩa là D(Xi) C, C là hằng số,
Trang 3hữu hạn (i1, n) Khi đó > 0
ta có:
n i n
ta cần thực hiện nhiều lần và lấy trung bình cộng của các kết quả làm giá trị thực của đại lượng
Nội dung hệ quả này còn là cơ sở cho một phương pháp được áp dụng trong thống kê là phương pháp mẫu mà thực chất của nó là dựa vào mẫu ngẫu nhiên để đi đến kết luận cho tổng thể các đối tượng được nghiên cứu
5.4 ĐỊNH LÝ BERNOULLI
Trang 481
Định lý: Giả sử fn(A) là tần suất xuất hiện biến cố A trong n phép thử độc lập và p là xác suất xuất hiện biến cố A trong mỗi phép thử Khi đó > 0 ta có: n
tế khi số phép thử tăng lên khá lớn ta lấy fn(A) làm giá trị xấp xỉ cho xác suất P(A)
5.5 ĐỊNH LÝ GIỚI HẠN TRUNG TÂM
Định lý Giả sử X1, X2, , Xn là dãy các ĐLNN độc lập cùng tuân theo một quy luật phân phối xác suất nào đó với kỳ vọng E(Xi) = và phương sai D(Xi) = 2
hữu hạn ( i 1, n ) Khi đó:
1 nếu A xuất hiện ở phép thử thứ i
0 nếu A không xuất hiện ở phép thử thứ i i
Trang 5 sẽ hội tụ theo xác suất tới
quy luật phân phối xác suất chuẩn hóa N(0, 1) khi n
Trong thực hành tính toán, khi n > 30 thì ta có thể xấp xỉ:
Ví dụ 1) Chọn ngẫu nhiên 192 số trên đoạn [0, 1] Tìm xác suất để
tổng số điểm thu đƣợc X nằm trong khoảng (88, 104)
Từ đó ta có E(Xi) = 0 1
0,52
i 1
, trong đó Xi độc lập và có cùng phân phối không một A(0,02) Từ đó theo định lý giới hạn trung tâm suy ra
X N(, 2), trong đó = np = 1000.0,02 = 20; 2
= np(1 – p) = 19,6 P(40 X 50)
Trang 683
BÀI TẬP CHƯƠNG 5
Bài 5.1 Xác suất xuất hiện sản phẩm loại 1 khi kiểm tra một sản
phẩm là 0,5 Gọi X là số lần xuất hiện sản phẩm loại 1 khi tiến hành kiểm tra 100 sản phẩm Đánh giá xác suất của biến cố (40 < X < 60) Đ/s: X B(100; 0,5)
Bài 5.4 Gieo một con xúc xắc cân đối đồng chất n lần một cách
độc lập Gọi X là số lần xuất hiện mặt 6 chấm Chứng minh rằng:
Bài 5.5 Giả sử tiền điện của một gia đình phải trả trong một tháng
là ĐLNN với trung bình 16 USD và độ lệch chuẩn 1 USD Sử dụng bất đẳng thức Trê-bư-sép, hãy xác định số M nhỏ nhất để với xác suất 0,99 số tiền điện phải trả trong một năm (12 tháng) không vượt quá M Đ/s: M = 226,64
Bài 5.6 Gieo một con xúc xắc 120 lần Tính xác suất để số lần
xuất hiện mặt 6 chấm nhỏ hơn 15 Biết rằng con xúc xắc cân đối đồng chất
Đ/s: 0,113
Trang 784
Chương 6
LÝ THUYẾT MẪU
6.1 KHÁI NIỆM VỀ PHƯƠNG PHÁP MẪU
Trong thực tế chúng ta thường phải nghiên cứu một tập hợp các phần tử đồng nhất theo một hay nhiều dấu hiệu định tính hay định lượng đặc trưng cho các phần tử đó Để nghiên cứu tập hợp các phần
tử này theo một dấu hiệu nhất định, đôi khi ta sử dụng phương pháp nghiên cứu toàn bộ, tức là thống kê toàn bộ tập hợp đó và phân tích từng phần tử theo dấu hiệu nghiên cứu
Ví dụ 1 Nghiên cứu dân số của một nước theo các dấu hiệu như
tuổi tác, trình độ văn hóa, địa bàn cư trú, cơ cấu nghề nghiệp, có thể tiến hành điều tra dân số và phân tích từng người theo các dấu hiệu trên từ đó tổng hợp thành dấu hiệu chung cho toàn bộ dân số của nước
đó
Tuy nhiên, trong thực tế việc áp dụng phương pháp nghiên cứu toàn bộ sẽ gặp phải những khó khăn chủ yếu sau: Nếu quy mô tập hợp quá lớn thì việc nghiên cứu toàn bộ sẽ đòi hỏi nhiều chi phí vật chất, thời gian và đôi khi dẫn tới trùng hoặc bỏ sót các phần tử của nó; Có khi trong quá trình nghiên cứu các đối tượng đó bị thay đổi hình dạng, hoặc bị phá hủy, chúng không còn giá trị sử dụng nữa, hoặc chưa có thể xác định được tất cả các đối tượng
Ví dụ 2 Kiểm tra chất lượng của một kho hàng có 106
sản phẩm,
ta không thể kiểm tra tất cả 106 sản phẩm; Để xác định tổng số người còn mù chữ ở Việt Nam, ta không thể điều tra toàn bộ dân số Việt Nam; Để tìm hiểu tâm lý của những người mắc bệnh truyền nhiễm HIV, ta không thể tìm hiểu hết những người mắc bệnh HIV, vì còn một bộ phận những người mắc bệnh đó ta chưa phát hiện ra
Vì thế, trong thực tế phương pháp nghiên cứu toàn bộ thường chỉ được áp dụng với các tập hợp có quy mô nhỏ Đối với đối tượng nghiên cứu có số phần tử lớn người ta áp dụng phương pháp nghiên cứu không toàn bộ, đặc biệt là phương pháp nghiên cứu chọn mẫu (gọi
là phương pháp mẫu) Phương pháp này chủ trương từ tập hợp nghiên
Trang 885
cứu chọn ra một số phần tử đại diện để nghiên cứu, khảo sát rồi từ đó trên cơ sở các phương pháp suy luận toán học người ta rút ra những kết luận về các tính chất cần thiết của một dấu hiệu hay một đặc điểm của tập tất cả các đối tượng nói chung
Việc thu thập, sắp xếp và trình bày các số liệu của tổng thể hoặc
một mẫu gọi là thống kê mô tả Còn việc sử dụng thông tin của mẫu để tiến hành các suy đoán, kết luận về tổng thể gọi là thống kê suy diễn
Ví dụ 3 Muốn khảo sát chiều cao trung bình của thanh niên Việt
Nam hiện nay có tăng lên so với trước đây hay không, ta phải đo chiều cao của tất cả các thanh niên Việt Nam Điều này tuy làm được nhưng
rõ ràng tốn rất nhiều thời gian, tiền bạc, công sức,… Do đó ta có thể khảo sát khoảng 1 triệu thanh niên và từ chiều cao trung bình của 1 triệu người này, ta suy ra chiều cao trung bình của toàn bộ thanh niên Việt Nam
6.2 TỔNG THỂ VÀ MẪU
Tập hợp có các phần tử là các đối tượng mang dấu hiệu X mà ta
cần nghiên cứu được gọi là tổng thể Số phần tử của tập hợp đó được gọi là kích thước của tổng thể, ký hiệu là N
Từ tổng thể ta chọn ra n phần tử thì n phần tử đó được gọi là một
mẫu có kích thước n (gọi là cỡ mẫu) Kích thước mẫu thường nhỏ hơn
rất nhiều so với kích thước của tổng thể Từ tổng thể ta có thể lấy ra nhiều mẫu khác nhau với cùng một kích thước n Tập hợp tất cả các
mẫu có thể lấy ra được từ tổng thể được gọi là không gian mẫu
Ví dụ 1 Ở ví vụ 3, tổng thể là tất cả các thanh niên Việt Nam, kích
thước mẫu là 1 triệu thanh niên Việt Nam
Ví dụ 2 Cần đánh giá chất lượng của nhà máy bia Hà Nội sản xuất
trong một tháng, ta không thể đem mở hết tất cả các chai bia để kiểm tra chất lượng, vì nếu làm như vậy thì không còn bia để bán mà chỉ
mở một số chai bia nào đó, đánh giá chất lượng trên những chai bia được mở này để đưa ra kết luận (mang tính tương đối) cho chất lượng bia của toàn nhà máy Số chai bia sản xuất trong một tháng là kích thước tổng thể, số chai bia được mở là kích thước mẫu
Trang 986
Thay vì nghiên cứu tất cả các phần tử có mặt trong tổng thể ta chuyển sang nghiên cứu một bộ phận của tổng thể là mẫu, vì vậy mẫu phải đại diện một cách khách quan nhất cho tổng thể Để đảm bảo yêu cầu trên người ta đưa ra các phương pháp chọn mẫu sau
6.3 CÁC PHƯƠNG PHÁP CHỌN MẪU
6.3.1 Phương pháp chọn mẫu có lặp là phương pháp ban đầu
lấy ngẫu nhiên một phần tử từ tổng thể và nghiên cứu, khảo sát phần
tử đó ghi nhận kết quả sau đó trả lại phần tử đó cho tổng thể rồi tiếp tục chọn phần tử thứ 2 từ tổng thể, nghiên cứu, khảo sát nó ghi nhận kết quả, rồi trả lại phần tử đó cho tổng thể, và cứ tiếp tục như thế cho đến khi chọn được phần tử thứ n
Cách chọn này có ưu điểm là các phần tử chọn ra là một kết quả của các phép thử độc lập, thuận lợi cho việc xét các điều kiện trong các định lý toán học, nhưng nó cũng có nhược điểm là các phần tử trong mẫu có thể lặp lại làm cho kích thước mẫu giảm và không thể áp dụng nếu trong trường hợp quá trình nghiên cứu phần tử chọn ra bị phá hủy cấu trúc
6.3.2 Phương pháp chọn mẫu không lặp Từ tập hợp cần nghiên
cứu, rút ngẫu nhiên 1 phần tử, ghi lại các đặc số cần thiết từ phần tử này và không trả phần tử đó về tập hợp ban đầu Tiếp tục lấy tiếp ngẫu nhiên lần sau
Ta nhận thấy rằng với kích thước n, số lượng các mẫu trong trường hợp lấy mẫu không lặp là n
N
A , số lượng các mẫu trong trường hợp lặp là Nn Khi N lớn hơn rất nhiều so với n thì n
N
A và Nn sai khác nhau không đáng kể vì vậy việc lấy mẫu có hoàn lại gần giống như việc lấy mẫu không hoàn lại
Ví dụ 3 Khi nghiên cứu về số cá trong một hồ thì tổng số cá trong
hồ là kích thước của tổng thể Từ hồ đó chọn ngẫu nhiên 10 cá thể cá thì được mẫu không hoàn lại kích thước 10 Nếu từ hồ đó chọn ngẫu nhiên 1 cá thể cá rồi thả xuống, sau đó tiếp tục chọn 1 cá thể khác, tiến hành 10 lần như thế ta được mẫu có hoàn lại kích thước 10
Trang 1087
6.4 MẪU NGẪU NHIÊN VÀ MẪU CỤ THỂ
Khi nghiên cứu về dấu hiệu X, X là ĐLNN tuân theo quy luật phân phối xác suất nào đó Giả sử ta tiến hành n phép thử (quan sát) độc lập để xác định n giá trị của mẫu Gọi Xi là ĐLNN ứng với giá trị
sẽ thu được ở phép thử thứ i (i 1,n ) Các ĐLNN Xi là độc lập với nhau và có cùng phân phối với X, sau khi thực hiện phép thử Xi nhận giá trị xi ( i 1, n )
6.4.1 Định nghĩa Một mẫu ngẫu nhiên có kích thước n là n đại
lượng ngẫu nhiên độc lập, có cùng phân phối xác suất với X, được ký hiệu là W = (X1, X2, , Xn)
Thực hiện một phép thử đối với W = (X1, X2, , Xn) ta sẽ thu được một mẫu cụ thể (x1, x2, , xn) Như vậy mẫu cụ thể là một giá trị
của mẫu ngẫu nhiên
6.4.2 Các ví dụ
Ví dụ 1 Khảo sát điểm thi môn Toán của một lớp Ta tiến hành
quan sát 5 sinh viên Khi đó dấu hiệu X cần nghiên cứu là điểm môn Toán của sinh viên, X là một ĐLNN Gọi Xi là điểm Toán của sinh viên thứ i (i = 1,…, 5), Xi là các ĐLNN có cùng phân phối với X
Khi đó W = (X1, X2, X3, X4, X5 ) là mẫu ngẫu nhiên có kích thước 5 Trong một lần quan sát mẫu ngẫu nhiên W, sinh viên thứ nhất được 5 điểm, sinh viên thứ hai được 7 điểm, sinh viên thứ ba được 4 điểm, sinh viên thứ tư được 6 điểm, sinh viên thứ năm được 5 điểm Khi đó w = (x1, x2, …, xn) = (5, 7, 4, 6, 5) là giá trị cụ thể (hay còn gọi
là một mẫu cụ thể) của mẫu ngẫu nhiên W = (X1, X2, X3, X4, X5 )
Trang 1188
Ví dụ 3 Khi nghiên cứu chiều cao của một cộng đồng người, gọi X
là ĐLNN chỉ chiều cao Ta chọn ngẫu nhiên 100 người, gọi Xi là
ĐLNN chỉ chiều cao của người thứ i (i 1,100 ) Xi là một ĐLNN, nó có
cùng phân phối với X Khi đó W = (X1, X2, , X100) là một mẫu ngẫu
nhiên có kích thước 100 Sau khi đo đạc rồi, ta sẽ xác định được các giá
thử mẫu ngẫu nhiên W ta được mẫu cụ thể w = (x1, x2, , xn), để khai
thác thông tin chứa đựng trong dãy số liệu này ta cần sắp xếp số liệu
nhằm dễ dàng nhận ra các đặc trưng của dãy số liệu đó
6.5.1 Sắp xếp theo bộ số tăng dần hoặc giảm dần
Trong trường hợp mẫu có kích thước n nhỏ, người ta thường sắp
xếp các giá trị trong mẫu theo một bộ số khắc có giá trị tăng dần từ
nhỏ đến lớn hay từ lớn đến nhỏ, dưới dạng (x1, x2, ., xn)
với x1 x2 xn hay x1 x2 xn
6.5.2 Sắp xếp theo bảng phân phối tần số, tần suất thực
nghiệm
6.5.2.1 Bảng phân phối tần số, tần suất thực nghiệm không chia lớp
Giả sử trong n giá trị của mẫu cụ thể w = (x1, x2, , xn) có k giá trị
phân biệt, không mất tính tổng quát ta giả thiết k giá trị đó là
x1< x2 < < xk, trong đó x1 có số lần lặp lại là n1, x2 có số lần lặp lại là
n2, , xk có số lần lặp lại là nk Số ni gọi là tần số của giá trị xi
Khi đó các số liệu của mẫu cụ thể được sắp xếp dưới dạng bảng
sau đây gọi là bảng phân phối tần số
Giá trị xi x1 x2 … xk
trong đó n1n2 nk n
Hay theo bảng
Trang 1289
Tần suất fi f1 f2 … fk trong đó i
i
n
n
gọi là tần suất của giá trị xi Bảng trên gọi
là bảng phân phân phối tần suất
Ví dụ 1 Khảo sát ngẫu nhiên thu nhập của 30 người trong một
công ty ta có số liệu (đơn vị: triệu đồng/tháng): 2; 3; 4; 2; 5; 4; 6; 3; 6; 6; 5; 7; 2; 4; 8; 9; 10; 8; 9; 8; 8; 7; 5; 6; 3; 3; 9; 5; 7; 10
Sắp xếp số liệu lại ta có bảng phân phối tần số:
6.5.2.2 Bảng phân phối tần số, tần suất thực nghiệm chia lớp
Trong trường hợp mẫu có nhiều phần tử, các giá trị của các phần
tử chênh lệch nhau không nhiều, để thuận tiện cho việc tính toán ta phân miền giá trị của mẫu thành k lớp (có thể chia đều hoặc không đều nhau): [a0, a1), [a1, a2), , [ak, ak+1) và trong các khoảng có các tần
số tương ứng là ni, i 1, k Khi đó mẫu được sắp xếp theo bảng sau:
Giá trị xi [a0, a1) [a1, a2) … [ak-1, ak)
gọi là bảng phân phối tần số phân lớp
Khi đó đối với mỗi khoảng, ta thay bởi 1 điểm đại diện, thông thường người ta lấy điểm giữa của khoảng
Từ đó ta có bảng rút gọn:
Giá trị xi x1 x2 … xk
Trang 13Ví dụ 2 Điều tra Glucoza trong máu ở 100 người, ta thu được kết
6.6.1 Hàm mẫu (thống kê) Hàm G = G(X1, X2, ., Xn) với
(X1, X2, , Xn) là một mẫu ngẫu nhiên gọi là một hàm mẫu hay một
Phân phối xác suất của thống kê G(X1, X2, , Xn) phụ thuộc vào
phân phối xác suất của ĐLNN X ở tổng thể
6.6.2 Trung bình mẫu, phương sai mẫu, phương sai mẫu điều chỉnh
6.6.1.1 Trung bình mẫu (Kỳ vọng mẫu)
Trang 14b Cách tính giá trị trung bình mẫu
Giả sử các số liệu của mẫu cụ thể (x1, x2, , xn) được sắp xếp dưới dạng bảng phân phối tần số:
6.6.1.2 Phương sai mẫu
a Định nghĩa Cho mẫu ngẫu nhiên W = (X1, X2, ., Xn) của ĐLNN X, khi đó thống kê n 2 n
là phương sai mẫu của X
Giả sử mẫu cụ thể (x1, x2, , xn) là một giá trị của mẫu ngẫu nhiên (X1, X2, , Xn), khi đó thống kê 2
Trang 156.6.1.3 Phương sai mẫu điều chỉnh
Cho mẫu ngẫu nhiên W = (X1, X2, ., Xn) của ĐLNN X, khi đó
S = S gọi là độ lệch tiêu chuẩn mẫu
Thống kê S S2 gọi là độ lệch tiêu chuẩn mẫu điều chỉnh
Ví dụ 1 Số xe hơi bán được trong 1 tuần ở mỗi đại lý trong 45 đại
lý, cho bởi bảng sau:
Số xe hơi bán được trong tuần (xi) 1 2 3 4 5 6
Số đại lý bán (ni) 15 12 9 5 3 1 Gọi X là số xe hơi bán được trong 1 tuần Tính số xe hơi bán được trung bình mẫu và phương sai mẫu
Trang 16Ví dụ 2 Xét kết quả điều tra Glucoza trong máu ở 100 người ở ví
dụ 2, mục 6.5 Gọi X là lượng Glocoza trong máu Tính lượng
Glucoza trung bình mẫu và bình phương độ lệch mẫu
xi ni xini x n2i i
72,5 16 1160.00 84100.00 87,5 34 2975.00 260312.50 102,5 33 3382.50 346706.25 117,5 9 1057.50 124256.25 132,5 8 1060.00 140450.00 Tổng 100 9635.00 955825.00
Giải: Trung bình mẫu là: 5 i i
6.7 LUẬT PHÂN PHỐI CỦA CÁC ĐẶC TRƯNG MẪU
Trên tổng thể , cho ĐLNN gốc X có kỳ vọng E(X) = và phương sai D(X) = 2 Cho mẫu ngẫu nhiên (X1, X2, , Xn), dựa vào
kỳ vọng và phương sai của các đặc trưng mẫu, dựa vào các tính chất của phân phối chuẩn, phân phối khi bình phương, phân phối Student
và dựa vào các định lý giới hạn, ta có thể suy ra phân phối của các đặc trưng mẫu sau đây:
6.7.1 Phân phối của phương sai mẫu điều chỉnh
Trang 1794
Định lý Nếu ĐLNN X có phân phối chuẩn N(, 2
) và (X1, X2, , Xn) là một mẫu ngẫu nhiên thì:
n
i 2
6.7.2 Phân phối của trung bình mẫu
Vì quy luật phân phối xác suất của X phụ thuộc vào kích thước
mẫu n của mẫu ngẫu nhiên (X1, X2, , Xn) và phương sai của tổng thể
D(X) = 2 đã biết hay chưa biết nên ta chia thành các trường hợp sau:
6.7.2.1 Trường hợp n > 30, phương sai 2 đã biết
Theo kết quả của định lý giới hạn trung tâm, khi kích thước mẫu
n > 30, trung bình mẫu X có thể xấp xỉ phân phối chuẩn
2N( , )n
Trang 1895
BÀI TẬP CHƯƠNG 6
Bài 6.1 Hãy tính trung bình mẫu, phương sai mẫu, độ lệch chuẩn
mẫu của các mẫu cụ thể chi ở bảng dưới đây:
Trang 1996
g x = 76,2; s2 = 18,56; s = 4,352
Bài 6.2 Cho 8 kết quả đo đạc về một ĐLNN X bởi cùng một máy
không có sai số hệ thống: 396, 378, 315, 420, 385, 401, 372, 383 Tính trung bình mẫu, phương sai mẫu và độ lệch tiêu chuẩn điều chỉnh Đ/s: x = 381,25; s2
= 826,438; s = 30,733
Bài 6.3 Đo chiều cao của 100 sinh viên ở cùng một trường đại học
người ta thu được bảng số liệu sau:
Chiều cao (cm) Số sinh viên
Bài 6.4 Các kết quả về việc đo độ bền các sợi chỉ ta thu được
bảng số liệu sau dưới đây:
Độ bền của sợi chỉ Số sợi chỉ
Trang 2097
Tính độ bền trung bình mẫu, phương sai mẫu và độ lệch chuẩn mẫu của mẫu nói trên
Đ/s: x = 195,2; s2 = 812,96 ; s = 28,513
Bài 6.5 Để xác định độ chính xác của một chiếc cân tạ không
có sai số hệ thống, người ta tiến hành cân 5 lần cân độc lập (cùng một vật), kết quả như sau: 94,1; 94,8; 96,0; 95,4; 95,2 (kg) Xác định trung bình mẫu, phương sai mẫu và độ lệch chuẩn mẫu của mẫu trên
Bài 6.6 Lấy ngẫu nhiên 100 thanh niên ở một tỉnh đem đo
chiều cao ta thu được các số liệu sau:
Chiều cao (cm) Số thanh niên (ni)
Bài 6.7 Để điều tra năng suất lúa của một huyện nào đó, ta
gặt ngẫu nhiên 365 điểm trồng lúa của huyện thu được các kết quả sau:
Năng suất
(tạ/ha) 25 30 33 34 35 36 37 39 40 Điểm gặt (ni) 6 13 38 74 106 85 30 10 3 Gọi X là năng suất lúa trên một ha canh tác Hãy xác định năng suất trung bình, độ phân tán của năng suất
Bài 6.8 Theo dõi doanh thu của 25 của hàng bán lẻ cùng một
mặt hàng thu được kết quả sau:
Trang 2299
Chương 7 BÀI TOÁN ƯỚC LƯỢNG THAM SỐ
7.1 KHÁI NIỆM ƯỚC LƯỢNG Khi nghiên cứu đặc tính X ở
mỗi phần tử của tổng thể, nếu xác định được quy luật xác suất của X
thì việc đưa ra đánh giá cũng như dự báo về sự biến động của tổng thể
liên quan đến đặc tính này sẽ chính xác và khách quan Tuy nhiên,
không phải lúc nào chúng ta cũng có thể xác định được quy luật xác
suất của X Trong một số trường hợp, chúng ta chỉ biết được dạng
toán học của hàm phân phối hoặc hàm mật độ của ĐLNN X mà chưa
biết các tham số có mặt trong chúng Vì vậy, để xác định quy luật xác
suất của X, trước hết ta phải đánh giá về các tham số này
Trên thực tế, các tham số của tổng thể như: kỳ vọng = E(X),
phương sai 2
= D(X), độ lêch chuẩn (X), tỷ lệ xác suất p là không biết, vì ta không thể đi khảo sát hết tất cả các phần tử của tổng thể
Tuy nhiên, nhiều bài toán chúng ta cần phải ước lượng chúng Việc
ước lượng các tham số đó dựa vào một mẫu thống kê (X1, X2, , Xn)
được gọi là Bài toán ước lượng tham số
Giả sử là một tham số nào đó của tổng thể ( có thể là kỳ vọng
= E(X), phương sai 2
= D(X), độ lêch chuẩn (X), tỷ lệ xác suất p ) Khi đó căn cứ trên mẫu (X1, X2, , Xn) ta cần xác định một đại
lượng gần đúng của , hay chỉ ra khoảng (a, b) nào đó mà
P(a b) , là một xác suất cho trước gọi là độ tin cậy,
đủ lớn ( 1)
Nếu chỉ ước lượng một giá trị gần đúng của thì gọi là ước
lượng điểm của , còn nếu tìm một khoảng (a, b) để P(a b) ,
thì (a, b) được gọi là ước lượng khoảng tin cậy của với độ tin cậy
7.2 HÀM ƯỚC LƯỢNG VÀ PHƯƠNG PHÁP ƯỚC LƯỢNG ĐIỂM
Do được tính dựa vào mẫu (X1, X2, , Xn) nên nó phải là một
giá trị của thống kê G(X1, X2, , Xn), thống kê này được gọi là hàm
ước lượng, khi đó
Trang 23100
= G(X1, X2, , Xn) sẽ được dùng để ước lượng Tất nhiên ước lượng của cần phải thỏa mãn một số tiêu chuẩn nào đó
Có nhiều hàm ước lượng = G(X1, X2, , Xn) của tham số khác nhau Tuy nhiên một hàm ước lượng được coi là tốt nhất nếu nó thỏa mãn các tiêu chuẩn được định nghĩa sau đây
7.2.1 Ước lượng không chệch
Thống kê G(X , X , , X )1 2 n được gọi là một ước lượng không chệch của tham số nếu E( )
Thống kê G(X , X , , X )1 2 n được gọi là một ước lượng chệch
của tham số nếu E( )
Ví dụ 1 Giả sử dấu hiệu X ở tổng thể là một ĐLNN có kỳ vọng
E(X) = , phương sai D(X) = 2 và (X ,X , ,X )1 2 n là một mẫu ngẫu
nhiên Khi đó ta có:
i) Thống kê
n i
Trang 24Ví dụ 2 1) Giả sử dấu hiệu X ở tổng thể là một ĐLNN có kỳ vọng
E(X) = , phương sai D(X) = 2 và (X ,X , ,X )1 2 n là một mẫu ngẫu nhiên Khi đó ta có, thống kê n i
Trang 25n i
n là ước lượng vững của p = p(A) Khẳng định này được suy ra từ Định lý Bernoulli
7.3 PHƯƠNG PHÁP ƯỚC LƯỢNG KHOẢNG
7.3.1 Mở đầu
Ước lượng điểm dù tốt nhất cũng chỉ cho ta một giá trị trong tập
vô hạn nên ta không biết được độ chính xác cũng như độ tin cậy của ước lượng, do đó không đánh giá được mức độ sai lầm khi dùng
+ Xác suất gọi là độ tin cậy của ước lượng
+ Xác suất = 1- gọi là mức ý nghĩa, nó đánh giá mức độ sai
lầm khi ước lượng
+ Khoảng (a, b) gọi là khoảng tin cậy (khoảng ước lượng)
+ b – a = 2 gọi là độ dài khoảng tin cậy
+ gọi là độ chính xác của ước lượng
Bây giờ ta xét cụ thể các bài toán tìm khoảng tin cậy cho tham số
như sau:
Trang 26103
7.3.2 Ước lượng khoảng tin cậy cho tỷ lệ của tổng thể
Tiến hành một dãy n phép thử độc lập có tần suất xuất hiện biến cố
A là fn =fn(A) = m
n Với độ tin cậy đã cho, hãy tìm khoảng tin cậy đối xứng (p1, p2) của p = P(A) chưa biết sao cho: P(p1 p p )2 Khi n đủ lớn thì thống kê fn N p,p(1 p)
tin cậy đối xứng cho tỷ lệ tổng thể p
Ví dụ 1 1) Trong đợt bầu cử tổng thống, người ta phỏng vấn ngẫu
nhiên 1600 cử tri thì được biết có 960 người sẽ bầu cho ứng viên A Với độ tin cậy 99% hãy tìm khoảng tin cậy cho tỷ lệ cử tri sẽ đi bỏ phiếu cho ứng viên A
Trang 27104
Giải Gọi B là biến cố cử tri sẽ đi bỏ phiếu cho ứng viên A;
p = p(B) là tỷ lệ cử tri sẽ đi bỏ phiếu cho ứng viên A
Trong mẫu cụ thể 1600 cử tri có 960 người bỏ phiếu cho ứng viên
A nên tỷ lệ mẫu là: f1600(B) = f = 960 0,6
1600 Với độ tin cậy = 99% = 0,99 0,005
Giải Gọi p là tỷ lệ hải cẩu có đánh dấu trên đảo
Trang 28Ví dụ 2 Khảo sát về thu nhập của 100 nhân viên làm việc trong
một công ty thu được kết quả sau:
Thu nhập (triệu đồng/tháng 1 2 3 4 5 6 7 8
Số người 2 5 8 12 17 16 24 16
Biết rằng thu nhập của các nhân viên là ĐLNN có độ lệch chuẩn
= 200 nghìn đồng Hãy ước lượng thu nhập trung bình của một nhân viên làm việc ở công ty này với độ tin cậy 95%
Giải Gọi là thu nhập trung bình của một nhân viên
Trang 29Ví dụ 3 Để xác định chiều cao trung bình của cây bạch đàn trong
khu rừng, ta tiến hành đo ngẫu nhiên 350 cây Kết quả thu đƣợc nhƣ sau: Khoảng
Giải: Gọi là chiều cao trung bình của cây bạch đàn trong khu rừng
Trang 30107
Vì n > 30 khá lớn nên ta có thể xấp xỉ S , trường hợp này ta chỉ thay bởi S Khi đó khoảng tin cậy của là:
7.3.3.4 Kích thước mẫu n 30, 2 chưa biết, X có phân phối chuẩn
Vì X có phân phối chuẩn nên Z X n X n 1 T(n 1)
SS
Vậy với mẫu cụ thể (x1, x2, , xn) thì khoảng tin cậy của kỳ vọng
= E(X) với độ tin cậy γ = 1 - là:
Trang 31Ví dụ 4 Xét ví dụ 3, với giả thiết độ lệch tiêu chuẩn chƣa biết,
X có phân phối chuẩn Tìm khoảng ƣớc lƣợng chiều cao trung bình của cây bạch đàn với độ tin cậy 95%
Ví dụ 5 Số liệu thống kê doanh số bán của một siêu thị trong một
số ngày cho ở bảng sau:
số bán của những ngày bán đắt hàng là ĐLNN có phân phối chuẩn)
Giải
a) Gọi là doanh số bán trung bình trong một ngày của siêu thị
Trang 32Vì n = 28 < 30, X là ĐLNN có phân phối chuẩn nên, khoảng tin
cậy doanh số bán trung bình của một ngày bán đắt hàng ở siêu thị này
Trên tổng thể , cho ĐLNN X có phân phối chuẩn N(, 2), với
phương sai của tổng thể D(X) = 2
chưa biết, kỳ vọng của tổng thể E(X) = có thể đã biết hoặc chưa biết Từ mẫu kích thước n (X1, X2, , Xn) và độ tin cậy γ = 1 – α cho trước, tìm khoảng tin cậy
Trang 33110
Để giải bài toán trên, ta xét hai trường hợp sau:
7.3.4.1 Trường hợp đã biết trung bình tổng thể = 0
Giả sử (X1, X2, , Xn) là mẫu ngẫu nhiên, khi đó ta có:
n
i 2
Vậy khoảng tin cậy của 2
với độ tin cậy = 1 - là:
tra từ bảng phân phối 2 với n bậc tự do
7.3.4.2 Trường hợp chưa biết trung bình tổng thể = 0
Tương tự như trên, ta có thống kê 2 2 2
Trang 34 tra từ bảng phân phối2 với n bậc tự do
Ví dụ 6 Để khảo sát chỉ tiêu X của một loại sản phẩm, người ta
quan sát một mẫu và có kết quả sau:
Trang 35112
BÀI TẬP CHƯƠNG 7
Bài 7.1 Hãy ước lượng tỷ lệ chính phẩm của một nhà máy bằng
khoảng tin cậy đối xứng với độ tin cậy 0,95 biết rằng kiểm tra 100 sản phẩm của nhà máy thì thấy có 10 phế phẩm
Đ/s: (0,841; 0,959)
Bài 7.2 Bằng khoảng tin cậy đối xứng hãy ước lượng tỷ lệ hạt nảy
mầm với độ tin cậy 95% trên cơ sở kết quả thực nghiệm: gieo 1000 hạt, có 860 hạt nảy mầm
Đ/s: (0,86; 0,882)
Bài 7.3 Mở thử 200 hộp của một kho đồ hộp, người ta thấy có 8
hộp bị biến chất Với độ tin cậy 0,97 hãy ước lượng khoảng tỷ lệ đồ hộp bị biến chất ở kho đó
Đ/s: (0,009; 0,07)
Bài 7.4 Trước ngày bầu cử khối trưởng của một khối dân cư, một
cuộc thăm dò dư luận đã được tiến hành Người ta chọn ngẫu nhiên
100 người để hỏi ý kiến thì có 60 người nói rằng họ sẽ bỏ phiếu cho ông A Tìm khoảng tin cậy cho tỷ lệ người bỏ phiếu cho ông A với độ tin cậy 90%
Đ/s: (0,52; 0,68)
Bài 7.5 Trong một mẫu ngẫu nhiên gồm 200 người dùng xe máy,
có 162 người dùng xe máy 100 phân khối trở lên Tìm khoảng tin cậy với mức tin cậy 95% cho tỷ lệ những người dùng xe lớn hơn 100 phân phối
Đ/s: (75,5%; 86,5%)
Bài 7.6 Điều tra năng suất lúa trên diện tích 100 ha trồng lúa của
một vùng, người ta thu được bảng số liệu sau:
Năng suất (tạ/ha) 41 44 45 46 48 52 54
Trang 36113
46 s 10,8
Bài 7.7 Đo chiều dài của 25 chi tiết máy do một máy sản xuất,
với phương sai 2
= 100 cm2, x100 cm Giả sử chiều dài tuân theo quy luật phân phối chuẩn Hãy tìm khoảng tin cậy của chiều dài của loại chi tiết đó với độ tin cậy 99%
Đ/s: (94,86; 105,14)
Bài 7.8 Để xác định trọng lượng trung bình của các bao bột
trong kho, người ta đem cân ngẫu nhiên 15 bao của kho đó và tìm
39,8 ; s 0, 414
x kg Hãy tìm khoảng ước lượng của trọng lượng trung bình của các bao bột trong kho với độ tin cậy là 99% Giả thiết rằng trọng lượng đóng bao của các bao bột là ĐLNN có phân phối chuẩn
Đ/s: (39,288; 40,312)
Bài 7.9 Cân thử 25 bao gạo, người ta tính được trọng lượng
trung bình của một bao gạo là x40 kg, độ lệch tiêu chuẩn điều chỉnh mẫu s = 5 kg Với độ tin cậy 95%, hãy tìm ước lượng khoảng cho trọng lượng trung bình của bao gạo, biết rằng trọng lượng của bao gạo là ĐLNN tuân theo quy luật phân phối chuẩn
Bài 7.10 Điểm trung bình môn XSTK của sinh viên trường
Đại học A là biến ngẫu nhiên có độ lệch chuẩn 0,26 điểm Khảo sát ngẫu nhiên 100 sinh viên trường này thấy điểm trung bình môn XSTK là 5,12 điểm Hãy ước lượng khoảng điểm trung bình môn XSTK của sinh viên trường A với độ tin cậy 98%?
Đ/s: (5,06 ; 5,18)
Bài 7.11 Để ước lượng chiều dài trung bình của các tấm vật
liệu do một nhà máy sản xuất, người ta tiến hành đo 5 tấm và thu được kết quả sau: 2,015; 2,025; 2,015; 2,020; 2,015 (mm) Hãy ước lượng chiều dày trung bình của các tấm vật liệu do nhà máy sản xuất với độ tin cậy 95% Biết rằng chiều dày của các tấm vật liệu là một ĐLNN tuân theo quy luật phân phối chuẩn
Đ/s: (2,012; 2,024)