Khái niệm về mẫu ngẫu nhiên, thống kê mô tả Trong thực tế, người ta thường phải nghiên cứu một tập hợp các phần tử đồng nhất theo một hay nhiều dấu hiệu định tính hoặc định lượng đặc t
Trang 1Chương 3: LÝ THUYẾT ƯỚC LƯỢNG
3.1 LÝ THUYẾT MẪU
3.1.1 Khái niệm về mẫu ngẫu nhiên, thống kê mô tả
Trong thực tế, người ta thường phải nghiên cứu một tập hợp các phần tử đồng nhất theo một hay nhiều dấu hiệu định tính hoặc định lượng đặc trưng cho các phần tử đó Chẳng hạn, một doanh nghiệp phải nghiên cứu tập hợp các khách hàng của nó thì dấu hiệu định tính có thể là mức độ hài lòng của khách hàng đối với sản phẩm hoặc dịch vụ của doanh nghiệp, còn dấu hiệu định lượng là nhu cầu của khách hàng về số lượng sản phẩm của doanh nghiệp
Để nghiên cứu tập hợp các phần tử này theo một dấu hiệu nhất định đôi khi người ta sử dụng phương pháp nghiên cứu toàn bộ, tức là thống kê toàn bộ tập hợp đó
và phân tích từng phần tử của nó theo dấu hiệu nghiên cứu Chẳng hạn để nghiên cứu dân số của một nước theo các dấu hiệu như tuổi tác, trình độ văn hoá địa bàn cư trú, cơ cấu nghề nghiệp có thể tiến hành tổng điều tra dân số và phân tích từng người theo các dấu hiệu trên, từ đó tổng hợp thành dấu hiệu chung cho toàn bộ dân số của nước đó Tuy nhiên trong thực tế phương pháp này gặp phải những khó khăn chủ yếu sau:
- Nếu quy mô của tập hợp quá lớn thì việc nghiên cứu toàn bộ sẽ đòi hỏi nhiều chi phí vật chất và thời gian
- Nhiều khi cũng do quy mô của tập hợp quá lớn nên có thể xảy ra trường hợp tính trùng hoặc bỏ sót các phần tử của nó
- Do quy mô nghiên cứu lớn mà trình độ tổ chức nghiên cứu lại hạn chế dẫn đến các sai sót trong quá trình thu thập thông tin ban đầu, hạn chế độ chính xác của kết quả phân tích
- Trong nhiều trường hợp không thể nắm được toàn bộ các phần tử của tập hợp cần nghiên cứu, do đó không thể tiến hành nghiên cứu toàn bộ được
Vì thế trong thực tế phương pháp nghiên cứu toàn bộ thường chỉ được áp dụng đối với các tập hợp có quy mô nhỏ, còn chủ yếu người ta áp dụng phương pháp nghiên cứu không toàn bộ, đặc biệt là phương pháp nghiên cứu chọn mẫu Phương pháp này chủ trương từ tập hợp cần nghiên cứu chọn ra một số phần tử (gọi là mẫu), phân tích các phần tử này và dựa vào đó mà suy ra các kết luận về tập hợp cần nghiên cứu Giả
Trang 2sử theo một phương pháp nào đó từ tổng thể lấy ra n phần tử tạo nên mẫu kích thước
n Nếu mẫu được chọn ra một cách ngẫu nhiên và xử lý bằng các phương pháp xác
suất thì vừa thu được các kết luận một cách nhanh chóng, đỡ tốn kém mà vẫn đảm bảo
độ chính xác cần thiết
Việc thu thập, sắp xếp và trình bày các số liệu của tổng thể hoặc một mẫu gọi là
thống kê mô tả Còn việc sử dụng thông tin của mẫu để tiến hành các suy đoán, kết
luận về tổng thể gọi là thống kê suy diễn
Giả sử mẫu kích thước N từ tổng thể nghiên cứu có dấu hiệu là biến ngẫu nhiên
X, được lập theo phương pháp chọn mẫu ngẫu nhiên đơn giản Với cách chọn mẫu này, mỗi lần chọn một phần tử của mẫu như làm một phép thử độc lập rút ngẫu nhiên một giá trị của X từ tập các giá trị của nó Rút ngẫu nhiên được hiểu là rút phù hợp với luật phân phối xác suất của X nghĩa là xác suất để giá trị được rút đó thuộc bộ phận nào đó, bằng xác suất của X thuộc bộ phận đó Vì vậy ta có thể coi thành phần thứ i trong mẫu là biến ngẫu nhiên Xi có cùng luật phân phối của X
Định nghĩa: Mẫu ngẫu nhiên kích thước n là tập hợp của n biến ngẫu nhiên độc
lập X 1 , X 2 , , X n được thành lập từ biến ngẫu nhiên gốc X trong tổng thể nghiên cứu và có cùng phân phối xác suất với X
Mẫu ngẫu nhiên thường được ký hiệu là:
W = (X1 , X2 , , Xn) Giả sử một giá trị của nó là: X1 = x1 , X2 = x2 , , Xn = xn Tập hợp n giá trị x1,
x2, , xn tạo thành một giá trị của mẫu ngẫu nhiên, hay còn gọi là một mẫu cụ thể,
ký hiệu: w = (x1 , x2 , , xn)
Như vậy, mẫu ngẫu nhiên là tập hợp của n biến ngẫu nhiên, còn mẫu cụ thể là tập hợp của n giá trị cụ thể quan sát được khi thực hiện một phép thử đối với mẫu ngẫu nhiên
Ví dụ 1: Khi nghiên cứu chiều cao của một cộng đồng người, gọi X là ĐLNN chỉ
chiều cao Chúng ta dự định đo chiều cao của 100 người được chọn ngẫu nhiên Trước khi chưa tiến hành chọn mẫu, ta chưa biết được người thứ nhất được chọn vào mẫu có chiều cao là bao nhiêu, nó đóng vai trò là một ĐLNN, ký hiệu X1, có cùng phân phối xác suất với X Tương tự, ta có chiều cao của người thứ 100 là X100 Khi đó bộ (X1,
Trang 3X2, ., X100) là một mẫu tổng quát có kích thước 100 Sau khi đo đạc ta sẽ xác định được các giá trị của Xi là xi, khi đó bộ số thực (x1, x2, , x100) là một mẫu cụ thể
3.1.2 Các phương pháp lấy mẫu
Có nhiều phương pháp chọn mẫu khác nhau, nhưng khó có thể nói rằng phương pháp nào là tốt nhất Tùy thuộc vào đặc điểm của từng tổng thể nghiên cứu mà mẫu có thể được chọn theo nhiều phương pháp khác nhau để đảm bảo yêu cầu về tính đại diện của mẫu Sau đây là một số phương pháp chọn mẫu chủ yếu thường được sử dụng để nghiên cứu các tổng thể kinh tế – xã hội
a) Chọn mẫu đơn giản
Là phương pháp chọn trực tiếp từ danh sách các phần tử đã được đánh số của tổng thể Từ tổng thể kích thước N người ta dùng cách rút thăm đơn giản ra n phần tử của mẫu theo một bảng số ngẫu nhiên nào đó Khi đó mỗi phần tử của đám đông đều có thể được chọn vào mẫu với cùng khả năng như nhau
Việc chọn mẫu kiểu này có 2 phương thức chọn: chọn có hoàn lại và chọn không hoàn lại Khi số phần tử N của tổng thể rất lớn so với kích thước mẫu n thì kết quả lấy mẫu theo 2 phương thức trên là sai lệch không đáng kể
Phương pháp này có ưu điểm là cho phép thu được một mẫu có tính đại diện cao, cho phép suy rộng kết quả của mẫu cho tổng thể với một sai số nhất định, song để vận dụng phải có được toàn bộ danh sách các phần tử của tổng thể nghiên cứu Mặt khác chi phí chọn mẫu sẽ khá lớn
b) Chọn mẫu phân nhóm
Trong chọn mẫu phân nhóm, trước hết ngàu ta phân chia tổng thể ra thành các nhóm có độ thuần nhất cao để chọn ra các phần tử đại diện cho từng nhóm Việc phân nhóm có hiệu quả khi tổng thể nghiên cứu không thuần nhất theo dấu hiệu nghiên cứu Sau khi đã phân nhóm thì kích thước mẫu được phân bổ cho mỗi nhóm theo một quy tắc nào đó, chẳng hạn tỷ lệ thuận với kích thước mỗi tổ
c) Chọn mẫu chùm
Trong một số trường hợp, để tiện cho việc nghiên cứu người ta muốn quy diện nghiên cứu gọn về một khu vực nhất định chứ không để cho các phần tử của mẫu phân tán quá rộng, chẳng hạn tập trung nghiên cứu khách hàng tại một địa phương nào đó Lúc đó mẫu được chọn theo chùm Chẳng hạn, chùm có thể là hộ gia đình có nhiều người, một làng có nhiều hộ gia đình Theo phương pháp này, trước tiên tổng thể điều tra được phân chia ra thành nhiều chùm theo nguyên tắc:
Trang 4- Mỗi phần tử của tổng thể chỉ được phân vào một chùm
- Mỗi chùm cố gắng chứa nhiều phần tử khác nhau về dấu hiệu nghiên cứu, sao cho nó có độ phân tán cao như của tổng thể
- Phân chia sao cho các chùm tương đối đồng đều nhau về quy mô
Các chùm được chọn một cách ngẫu nhiên và tất cả các phần tử của chùm đó đều được chọn vào mẫu
Phương pháp này có thể tiết kiệm chi phí và thời gian, nhưng sai số chọn mẫu cao hơn các phương pháp trên
d) Chọn mẫu có suy luận
Phương pháp chọn mẫu này dựa trên ý kiến của các chuyên gia về đối tượng nghiên cứu Nhược điểm của phương pháp này là khó đảm bảo tính khách quan
3.1.3 Bảng phân phối thực nghiệm
Giả sử từ tổng thể với biến ngẫu nhiên gốc X rút ra một mẫu cụ thể kích thước n, trong đó:
giá trị x1 xuất hiện n1 lần, x2 xuất hiện n2 lần, , xk xuất hiện nk lần
Các bảng mô tả số liệu sau đây được gọi là bảng phân phối thực nghiệm
Bảng phân phối tần số thực nghiệm:
xi x1 x2 xk
ni n1 n2 nk với n1 + n2 + + nk = n
Bảng phân phối tần suất thực nghiệm:
Trang 5Ví dụ 3: Điều tra thời gian đợi phục vụ của khách hàng tại một ngân hàng (đơn
vị: phút), người ta chọn ngẫu nhiên 10 người, kết quả thu được như sau: 9, 8, 10, 10,
Chú ý: Khi kích thước của mẫu lớn, các giá trị của mẫu khá gần nhau, người ta
chia các giá trị của mẫu thành các lớp và lập bảng phân phối thực nghiệm của mẫu lớp
Ví dụ 4: Đo chiều cao của 300 học sinh 12 tuổi, ta thu được bảng số liệu sau:
Lớp (chiều cao cm) Tần số ni Tần suất fi
122,5 – 127,5 33 0,110 127,5 – 132,5 74 0,247 132,5 – 137,5 93 0,310 137,5 – 142,5 64 0,213 142,5 – 147,5 21 0,070
Chú ý:
- Thông thường người ta phân chia số liệu thành từ 5 đến 15 lớp Nếu số liệu nhiều hơn có thể giúp phân tích tốt hơn, nhưng sự cải thiện không nhiều, nếu số lớp quá ít các thông tin có thể bị mất khi xử lý
- Giữa 2 lớp liền nhau [ai-1– ai] và [ai – ai+1] thì chúng ta quy ước phần tử ai đếm cho lớp [ai-1 – ai]
- Một bảng phân phối theo lớp có thể đưa về bảng phân phối thực nghiệm bằng
phép lấy trung bình cộng của mỗi lớp, tức là xi = ai 1 ai
2
Chẳng hạn với bảng số liệu phân lớp ở ví dụ 4, ta có bảng phân phối tần số thực nghiệm tương ứng:
Trang 6Giả sử biến ngẫu nhiên gốc X của tổng thể có EX = ; VX = 2 Do X1 , X2 , , Xn
là các biến ngẫu nhiên độc lập cùng phân phối như X, nên trung bình mẫu X cũng là
một biến ngẫu nhiên và:
n i
Chú ý: Không gây hiểu nhầm về mặt ý nghĩa X là biến ngẫu nhiên còn x là giá trị mà
biến ngẫu nhiên đó nhận, đôi khi ta vẫn dùng chung là X Khi đó X cũng vẫn có thể hiểu là giá trị trung bình mẫu của X
* Phương sai mẫu:
Trang 7Phương sai mẫu S2
cũng là biến ngẫu nhiên, ta có thể chỉ ra:
* Phương sai mẫu hiệu chỉnh:
- Vì giá trị trung bình của S2 không đúng bằng 2
do đó nhiều khi thay cho phương sai mẫu, ta dùng phương sai mẫu hiệu chỉnh, ký hiệu s2 để có Es2 = VX = 2
Nếu cho mẫu cụ thể ta sẽ tính được giá trị tỷ lệ mẫu cụ thể của F:
mfn
Trang 81) Cho biến ngẫu nhiên X có phân phối chuẩn N(, 2
) và (x1, x2, …, xn) là mẫu của X Khi đó đại lƣợng thống kê:
t = X
ns
Trang 9Chú ý: Nếu dữ liệu cho ở dạng mẫu lớp, ta chỉ có thể tính gần đúng các đặc trƣng mẫu
bằng cách thay lớp [ai-1 – ai] bằng một đại diện xi =
= 102,738
Trang 10b) Tính gián tiếp: Khi dữ liệu lớn phức tạp và cách đều nhau ta có thể biến đổi
để giảm độ phức tạp tính toán như sau:
Bước 1: Chọn giá trị x0 tuỳ ý thuộc vào mẫu (thường ở giữa mẫu)
ndnn
Trang 11, = 10,1333
n d n n
1 41 30
2
0 , )2(
= 0,05423
s2 =
1
n
Giải:
Bước 1: Chuyển số máy tính về chế độ thống kê
Trên Casio fx-500MS: ON MODE 2
Trên Casio fx-570MS: ON MODE MODE 1
Bước 2: Nhập số liệu (các thao tác trên 2 máy là như nhau)
Sau khi bấm phím ON MODE 2 trên Casio fx-500MS và ON MODE MODE 1 trên Casio fx-570MS (vào chương trình thống kê) và khai báo các số liệu cùng với tần số:
Bấm phím: 6 SHIFT ; 2 DT 7 SHIFT ; 4 DT
8 SHIFT ; 2 DT 9 SHIFT ; 1 DT 10 SHIFT ; 1 DT
Mỗi khi khai báo xong một số liệu cùng với tần số của nó, máy sẽ tự động đếm các số liệu được đưa vào Thí dụ, sau khi bấm phím 6 SHIFT ; 2 DT, màn hình sẽ hiện
n = 2 , tức là đã có 2 số liệu được khai báo (cùng bằng 6); Sau khi bấm phím tiếp 7 SHIFT ; 4 DT, màn hình sẽ hiện n = 6 , tức là đã có 6 số liệu được khai báo (hai số liệu cùng bằng 6 và bốn số liệu cùng bằng 7) Sau khi khai báo xong toàn bộ các số liệu, màn hình sẽ hiện n = 10 , nghĩa là: Tập hợp các số liệu gồm 10 giá trị
Tính độ dài mẫu: Bấm phím: SHIFT S-SUM 3 = (kết quả: n = 10) Chứng tỏ
kích thước mẫu bằng 10 (số các giá trị của mẫu là 10)
Trang 12Tính tổng số liệu: Bấm phím: SHIFT S-SUM 2 = (kết quả: ) tổng số liệu bằng 75
Tính tổng bình phương số liệu: Bấm phím: SHIFT S-SUM 1 = (kết quả: ) tổng bình phương số liệu bằng 577
Tính giá trị trung bình: Bấm phím: SHIFT S-VAR 1 = (kết quả: ) x = 7,5
Tính độ lệch chuẩn: Bấm phím: SHIFT S-VAR 2 = (kết quả: )
- Khi khai báo 6 SHIFT ; 2 DT, nghĩa là khai báo giá trị x1 = 6 có tần số là 2
- Nếu bấm phím thì màn hình hiện ra Freq5 = 1, nghĩa là tần số của số liệu thứ 5 (x = 10) là 1
- Bấm tiếp phím: Màn hình hiện ra x5 = 10, nghĩa là số liệu thứ 5 có giá trị là
10
Tương tự, sử dụng phím, ta có thể kiểm tra tất cả các dữ liệu được đưa vào
đã đúng hay chưa và chúng có tần số là bao nhiêu
- Có thể tham khảo phụ lục 2 đối với các loại máy tính khác
3.2 KHÁI NIỆM ƯỚC LƯỢNG ĐIỂM
3.2.1 Khái niệm ước lượng
Giả sử khi nghiên cứu ĐLNN X và biết được phân phối của X thuộc một họ phân phối nào đó (chẳng hạn biết X có phân phối chuẩn hoặc biết X có phân phối Poisson, nhưng lại không biết các tham số) Muốn xác định hoàn toàn phân phối của X ta phải xác định được các giá trị tham số của phân phối đó
Trong trường hợp chưa biết gì về phân phối của ĐLNN X thì việc biết được các giá trị đặc trưng của X cũng cho ta biết được nhiều thông tin Chính vì vậy, việc đi tìm
Trang 13các ƣớc lƣợng cho các tham số của phân phối hoặc ƣớc lƣợng cho các giá trị đặc trƣng của X là rất cần thiết
Giả sử mẫu ngẫu nhiên (X1 , X2 , , Xn) có tập giá trị (mẫu quan sát hay mẫu cụ thể)
là (x1 , x2 , , xn)
Định nghĩa: Một hàm của mẫu ngẫu nhiên:
T = T(X1 , X2 , , Xn)
xác định trên tập các giá trị của mẫu ngẫu nhiên đƣợc gọi là một thống kê
Nhƣ vậy mỗi thống kê cũng là một đại lƣợng ngẫu nhiên
Khi cho mẫu cụ thể (x1 , x2 , , xn) thì giá trị của T đƣợc xác định bởi:
T = T(x1 , x2 , , xn)
Ví dụ 1: X , S2 , s2 là những thống kê
Trên thực tế các tham số của tổng thể nhƣ: , 2, p là không biết, vì ta không thể nào
đi khảo sát hết tất cả các phần tử của tổng thể Tuy nhiên nhiều bài toán thực tế chúng
ta cần phải ƣớc lƣợng chúng Việc ƣớc lƣợng các tham số dựa trên một mẫu thống kê (X1 , X2 , , Xn) đƣợc gọi là bài toán ước lượng tham số
3.2.2 Ƣớc lƣợng điểm
Để xác định hoàn toàn phân phối của X, ta phải xác định đƣợc các giá trị của
mà phân phối đó nhận
Dựa vào các thông tin thu đƣợc từ một mẫu cụ thể (x1 , x2 , , xn) của X, ta tìm một thống kê $(x1 , x2 , , xn) "đủ tốt” để thay thế tham số chƣa biết (hay ƣớc lƣợng bằng $) đƣợc gọi là bài toán ước lượng điểm của
Ví dụ 2:
X có phân phỗi chuẩn N( , 2) nhƣng , 2
bằng bao nhiêu chƣa biết Ta cần ƣớc lƣợng tham số = (,2
Trang 14Ý nghĩa: Ta thấy E($ - ) = 0, tức là trung bình của độ lệch (sai số) giữa các ƣớc lƣợng với giá trị thật bằng 0
Ví dụ 4: Cân 100 sản phẩm của xí nghiệp ta có bảng
Theo nhận xét trên ta dự đoán (ƣớc lƣợng) trọng lƣợng trung bình của sản phẩm trong
xí nghiệp là = 502,8 (gr)
Trang 15- Trung bình mẫu X là ước lượng vững của trung bình tổng thể
- Phương sai mẫu hiệu chỉnh s2 là ước lượng vững của phương sai tổng thể
3.3 ƯỚC LƯỢNG KHOẢNG
3.3.1 Bài toán ước lượng khoảng
Giả sử cần ước lượng tham số của biến ngẫu nhiên gốc X Từ tổng thể lập mẫu ngẫu nhiên kích thước n:
W = (X1 , X2 , X3 , , Xn) với mẫu cụ thể là: w = (x1 , x2 , , xn)
Với xác suất 1 – cho trước, ta cần tìm các thống kê 1 và 2 sao cho:
P1 2 = 1 – trong đó:
Trang 16 γ = 1 – được gọi là độ tin cậy của ước lượng
được gọi là mức ý nghĩa, đánh giá mức độ sai lầm khi ước lượng
( 1 , 2) được gọi là khoảng tin cậy của ước lượng
2 = 2 - 1 được gọi là độ dài của ước lượng
được gọi là độ chính xác của ước lượng
Bài toán ước lượng khoảng với độ tin cậy 1 – còn được gọi là bài toán tìm
khoảng tin cậy với độ tin cậy 1 –
Để làm điều đó quy tắc chung như sau:
Đầu tiên tìm một thống kê GG(x , x , , x , )1 2 n sao cho phân phối của G xác định hoàn toàn (không chứa tham số nữa)
Khi đó với độ tin cậy 1 cho trước, ta tìm cặp giá trị 1 và 2 sao cho
3.3.2 Khoảng tin cậy cho kỳ vọng
Trước khi đi vào tìm khoảng tin cậy cho kỳ vọng tổng thể, ta nhắc lại kiến thức
Trang 17Giả sử X ~ N( , 2) nhưng chưa biết tham số EX = của nó
Muốn ước lượng kỳ vọng EX = , ta lập mẫu ngẫu nhiên (X1 , X2 , , Xn) được sinh từ biến ngẫu nhiên gốc X, có tập giá trị là (x1 , x2 , , xn)
Để xác định được khoảng tin cậy cho kỳ vọng EX = , ta cần xác định thống kê
1 và 2 sao cho:
P{θ1 < θ < θ2} = 1 – ( ở đây = )
Ta xét 2 trường hợp sau:
a) Bài toán 1: Phương sai VX = 2
của biến X đã biết
Để ước lượng khoảng cho kỳ vọng EX = với độ tin cậy 1 – , ta chọn thống kê:
Như vậy với độ tin cậy 1 cho trước ta sẽ có vô số cặp 1 và 2, tương ứng với vô
số khoảng tin cậy Ta xét một số trường hợp đặc biệt:
* Khoảng tin cậy đối xứng (ứng với 1 2
2
) là:
Trang 18( x - ; x + ) hoặc viết = x ± 𝜀 trong đó:
trong đó: u 1 , tra bảng Laplace uα = ?
hoặc dựng hàm trong Excel: uα = NORMSINV(1 - α)
* Khoảng tin cậy phải (ứng với 1 0, 2 ) là: ( x u
- Khoảng tin cậy cho kỳ vọng tổng thể: ( x - ; x + )
Tương tự như vậy đối với quy tắc tìm khoảng tin cậy trái và khoảng tin cậy phải cho
kỳ vọng
Ví dụ 1: Trọng lượng của một loại sản phẩm là biến ngẫu nhiên có phân phối
chuẩn với độ lệch tiêu chuẩn là 1 gam Cân thử 25 sản phẩm loại này, thu được kết quả sau:
Trọng lượng (gam) 18 19 20 21
Số sản phẩm tương ứng 3 5 15 2
Với độ tin cậy 95%, hãy ước lượng khoảng:
Trang 19a) Trọng lƣợng trung bình của 1 sản phẩm;
b) Trọng lƣợng trung bình tối thiểu của một sản phẩm
Giải:
Gọi là trọng lƣợng trung bình của sản phẩm, ta cần ƣớc lƣợng khoảng tin cậy của
Trọng lƣợng trung bình của mẫu 25 sản phẩm: x = 19,64
a) Khoảng tin cậy đối xứng cho trọng lượng trung bình sản phẩm
Với độ tin vậy 95% ta tìm đƣợc
Vậy trọng lƣợng trung bình của một sản phẩm khoảng từ 19,248 đến 20,032 gam
b) Khoảng tin cậy phải cho trọng lượng trung bình sản phẩm
Với độ tin vậy 95% ta tìm đƣợc u nhƣ sau:
b) Bài toán 2: Phương sai VX = 2
của biến X chưa biết
Trang 20Đầu tiên ta phải ước lượng 2
bằng phương sai mẫu hiệu chỉnh, sau đó chọn
P( t T t ) 1
Tương tự như bài toán 1, ta xét một số khoảng tin cậy đặc biệt:
* Khoảng tin cậy đối xứng là: ( x - ; x + ) hoặc viết = x ± 𝜀
trong đó:
=
2
s t
hoặc dùng hàm trong Excel: t= TINV(, n - 1)
* Khoảng tin cậy phải là: (x s .t
n
; )
Chú ý:
1) Nếu X không có phân phối chuẩn, thì cỡ mẫu phải lớn hơn 30
2) Nếu n > 30 thống kê T sẽ có phân phối tiệm cận chuẩn N(0; 1), do đó ta có thể thay
thế: tα = uα , tα/2 = uα/2
Quy tắc tìm khoảng tin cậy đối xứng cho kỳ vọng (2
chưa biết)
- Từ mẫu cụ thể tính x, s
Trang 21n
- Khoảng tin cậy cho kỳ vọng tổng thể: (x- ; x + )
Tương tự như vậy đối với quy tắc tìm khoảng tin cậy trái và khoảng tin cậy phải cho
kỳ vọng
Ví dụ 2: Ở một cửa hàng chế biến thủy sản, theo dõi lượng nước mắm bán ra
trong một số ngày, người ta ghi được bảng số liệu sau
Số lượng bán ra (lít)
a) biết phương sai 2
= 132,25;
b) chưa biết phương sai
Trang 22= 3,6429
Trang 23Khoảng tin cậy là: (x ; x ) 49,3404; 50,7397
Vậy với độ tin cậy 95% một bao xi măng bán trên thị trường có trọng lượng từ 49,3403 đến 50,7397 (kg)
Ví dụ 4: Đo đường kính của 20 trục máy do một máy tiện tự động sản xuất ra, ta
Giải:
Tổng thể là toàn bộ trục máy do máy tiện sản xuất
Ta cần ước lượng đường kính trung bình của tổng thể với độ tin cậy 95% và kích thước mẫu n ≤ 30, chưa biết phương sai
Từ dữ liệu mẫu, ta tính được:
X= 251,7 ; s = 7,2670
Trang 24Vì α = 0,05 tra bảng phân phối Student dòng 19, cột 0,975 ta được
Vậy: = 251,7 3,401 (mm)
c) Bài toán 3: tìm kích thước mẫu, độ tin cậy của ước lượng
Trường hợp 1: Xác định kích thước mẫu n tối thiểu để độ chính xác của ước lượng
2
s u
không vượt quá số 0 cho trước?
Có nghĩa ta cần xác định n sao cho:
2 0
- Do s lại phụ thuộc vào n, để khắc phục điều này ta lấy một mẫu sơ bộ (x 1 , x 2 , ,
x m ) với kích thước m > 30 nào đó và tính s theo mẫu đó Chúng ta có thể lấy
ngay mẫu mà trong đề bài đã cho
- Trong công thức xác định n trên, nếu đã biết thì ta thay độ lệch mẫu s bởi
Trường hợp 2: Cho biết độ chính xác của ước lượng và trung bình mẫu x Xác
định độ tin cậy của ước lượng
Từ công thức
2
s u
, ta suy ra:
2
nu
Trang 25Ví dụ 5: Trọng lượng của một hộp sữa do một dây chuyền tự động đóng gói
tuân theo luật phân phối chuẩn với độ lệch chuẩn là 10 (gr) Cần phải lấy mẫu kích thước n tối thiểu bằng bao nhiêu để với độ tin cậy 95% sai số của ước lượng không vượt quá 2 (gr)
Vậy cần chọn tối thiểu 97 hộp sữa
Ví dụ 6: Để nghiên cứu nhu cầu một loại mặt hàng ở một khu vực (đơn vị:
kg/tháng), người ta tiến hành khảo sát về nhu cầu mặt hàng này ở 400 hộ gia đình Kết quả khảo sát cho ở bảng sau:
Nhu cầu <1 1-2 2-3 3-4 4-5 5-6 6-7 7-8
Giả sử khu vực này có 4000 hộ
a) Ước lượng nhu cầu trung bình về mặt hàng này của toàn khu vực trong một năm với độ tin cậy 95%
b) Khi ước lượng nhu cầu trung bình về mặt hàng này của toàn khu vực trong một năm, nếu ta muốn độ tin cậy đạt được 99% và độ chính xác là 4,8 tấn thì cần khảo sát về nhu cầu này ở bao nhiêu hộ gia đình
Giải:
a) Gọi M là nhu cầu trung bình về mặt hàng này của toàn khu vực trong một năm,
là nhu cầu trung bình về mặt hàng này của một hộ trong một tháng
Trước hết ta tìm khoảng tin cậy của :
Trang 26Suy ra khoảng tin cậy cho M là:
Gọi m là số hộ gia đình cần khảo sát về nhu cầu của mặt hàng này, khi đó
1 0
Vậy số hộ cần khảo sát là 1381 hộ
Ví dụ 7: Sai số đo của một loại dụng cụ đo có phân phối chuẩn với độ lệch chuẩn
bằng 20 Cần phải tiến hành bao nhiêu phép đo độc lập để sai số phạm phải không vượt quá 5 với độ tin cậy 90%?
5 + 1 = 44
Cần tiến hành 44 phép đo độc lập
3.3.3 Khoảng tin cậy cho phương sai
Ta đã biết một đại lượng ngẫu nhiên Z ~2(n), với độ tin cậy 1 cho trước, tìm được giá trị phân vị 2
n( )
sao cho:
Trang 271 2( ; ) sao cho:
P( ) 1
Để giải bài toán trên, ta xét hai trường hợp sau:
a) Bài toán 1: Biết trước kỳ vọng của tổng thể
Giả sử (X1, X2, , Xn) là mẫu tổng quát từ X ~ 2
Trang 28- Với độ tin cậy 1 ta tìm các giá trị phân vị: 2n(12),2n( )2
Khi đó: khoảng tin cậy hai phía cho phương sai 2 của tổng thể là
Trang 29b) Bài toán 2: Kỳ vọng EX = chưa biết
Xây dựng khoảng tin cậy dựa trên các thống kê sau:
2 có phân phối khi bình phương (n-1) bậc tự do
Bằng cách xây dựng như trên, tra có quy tắc tìm khoảng ước lượng hai phía cho
phương sai trong trường hợp chưa biết kỳ vọng :
- Từ mẫu cụ thể (x1, x2, , xn) ta tính giá trị: 2
(n 1)s
- Với độ tin cậy 1 ta tìm các giá trị phân vị: 2n 1 (12),2n 1 ( )2
Khi đó: khoảng tin cậy hai phía cho phương sai 2 của tổng thể là
Ví dụ 8: Theo dõi số hàng bán được mỗi ngày ở một trung tâm thương mại, ta
được kết quả ghi ở bảng sau:
Số hàng bán được (kg/ngày) Số ngày
Trang 30Giải:
Ta lập bảng để tính s2
và thu đƣợc: s2 = 2058,333 Với độ tin vậy 95% thì:
Ví dụ 9: Cho khối lƣợng một loại sản phẩm tuân theo luật phân phối chuẩn
Cân thử từng sản phẩm của một mẫu ngẫu nhiên gồm 25 sản phẩm, kết quả thu đƣợc nhƣ sau:
Hay 0,1262 ; 0,391
Trang 31b) Sử dụng máy tính điện tử tính đƣợc: s = 0,4621688, s2
=0,2136 Với độ tin vậy 95% thì:
Ví dụ 10: Theo dõi số hàng bán đƣợc trong một ngày ở một cửa hàng, ta đƣợc
kết quả ghi ở bảng sau:
3.3.4 Khoảng tin cậy cho tỷ lệ
a) Bài toán tìm khoảng tin cậy
Giả sử tổng thể có N phần tử, trong đó có M phần tử mang dấu hiệu nghiên cứu (phần tử có tính chất A)
Trang 32được gọi là tần suất mẫu xuất hiện dấu hiệu cần nghiên cứu
Khi kích thước mẫu n khá lớn thì ta có thể xấp xỉ f p
Quy tắc: tìm khoảng ước lượng đối xứng cho tỷ lệ của tổng thể
- Từ mẫu cụ thể tính f =
n
m
Trang 33* Khoảng tin cậy phải: f 1 f
, với là độ chính xác của ước lượng
Ví dụ 11: Để ước lượng số hải cẩu trên một hòn đảo người ta đánh dấu cho
2000 con Sau một thời gian bắt lại 400 con thấy có 80 con có đánh dấu Hãy ước lượng số hải cẩu có trên đảo với độ tin cậy là 95%
8362 N 12438
Ví dụ 12: Trước ngày bầu cử tổng thống, người ta phỏng vấn ngẫu nhiên 1800 cử
tri thì thấy có 1180 người ủng hộ ứng cử viên A Với độ tin cậy 95%, hãy ước lượng tỷ
lệ cử tri ủng hộ ứng cử viên A bằng khoảng tin cậy đối xứng?
Trang 34Giải:
Tổng thể là toàn bộ số cử tri cả nước, các phần tử của tổng thể gồm hai loại: ủng hộ và không ủng hộ ứng cử viên A
Gọi p là tỷ lệ các phần tử ủng hộ ứng cử viên A của tổng thể
Với độ tin cậy 95%, ta cần ước lượng tỉ lệ p ?
Ta có mẫu gồm 1800 phần tử, trong đó có 1180 phần tử ủng hộ ứng cử viên A nên tỉ lệ mẫu là:
= 0,022
Do đó tỉ lệ tổng thể ủng hộ ứng cử viên A là:
p = 0,6556 0,022 hay 0,6336 p 0,6776
Ví dụ 13: Người ta bắt được 1500 con thú, đánh dấu rồi thả lại vào rừng Sau một
thời gian bắt lại 360 con thì thấy có 27 con bị đánh dấu Hãy ước lượng số thú trong rừng với độ tin cậy 99%
Giải:
Tổng thể là toàn bộ thú trong rừng Số phần tử của tổng thể là N chưa biết nhưng được chia thành hai loại: bị đánh dấu và không bị đánh dấu
Số phần tử bị đánh dấu của tổng thể là M = 1500 đã biết
Do đó để tìm N, ta ước lượng tỉ lệ p các phần tử bị đánh dấu của tổng thể với độ tin cậy 99%
Ta có số phần tử của mẫu là n = 360, trong đó số phần tử bị đánh dấu là k = 27
Trang 351108,0
1500 N
0392,01500
hay 13538 N 38265
Kết luận: với độ tin cậy 99% số thú hiện có trong rừng là từ 13538 đến 38265 con
b) Bài toán xác định kích thước mẫu, độ tin cậy của ước lượng
Bài toán 1: Xác định kích thước mẫu n tối thiểu để độ chính xác của ước lượng
2
f (1 f )u
n
không vượt quá số 0 cho trước?
Có nghĩa ta cần xác định n sao cho:
2 /2 2
0
f (1 f )
n u
Vậy n được xác định bằng công thức
2 /2 2
trong đó [.] là phần nguyên
Chú ý: Trong công thức trên f lại phụ thuộc vào n, để khắc phục điều này ta
thực hiện lấy mẫu sơ bộ nào đó với kích thước đủ lớn và tính f theo mẫu đó Chúng ta có thể lấy ngay mẫu mà trong bài đã cho
Bài toán 2: Cho biết độ chính xác của ước lượng và tỷ lệ mẫu f Xác định độ tin cậy của ước lượng?
Từ công thức:
Trang 36nu
f (1 f )
, suy ra độ tin cậy của ước lượng:
Ví dụ 14: Phòng cảnh sát giao thông muốn ước lượng tỷ lệ xe chở quá tải với độ
tin cậy 95% và sai số không vượt quá 5% thì cần phải kiểm tra tối thiểu bao nhiêu lượt
xe chạy trên đường Biết một mẫu điều tra sơ bộ kiểm tra 400 xe thấy có 40 xe chở quá tải
Như vậy số xe tối thiểu cần kiểm tra là 369 chiếc
Ví dụ 15: Ở một vùng, khi khám bệnh cho bệnh nhân, người ta thấy tỉ lệ mắc
bệnh tai mũi họng là 15% Để ước lượng xác suất mắc bệnh tai mũi họng của vùng đó với độ tin cậy 95% và sai số không vượt quá 2% thì cần khám tối thiểu bao nhiêu người ?
Giải:
Theo đề bài ta có:
- tỉ lệ mắc bệnh của mẫu ban đầu là f = 0,15
- độ tin cậy 1 – α = 95% nên uα/2 = 1,96
- sai số của ước lượng, hay độ chính xác là 0,02
Vậy mẫu cần tìm phải có số phần tử
02,0
)15,01(.15,0.96,1
+ 1 = 1225
Do đó, tối thiểu cần khám cho 1225 người
Trang 37Ví dụ 16: Lô trái cây của một chủ hàng được đóng thành từng sọt, mỗi sọt 100
trái Kiểm tra 50 sọt người ta thấy có 450 trái không đạt tiêu chuẩn
a) Với độ tin cậy 95%, hãy ước lượng tỉ lệ trái cây không đạt tiêu chuẩn của lô hàng đó?
b) Muốn ước lượng tỉ lệ trái cây không đạt tiêu chuẩn với độ chính xác 0,5% thì
độ tin cậy đạt được là bao nhiêu ?
c) Muốn ước lượng tỉ lệ trái cây không đạt tiêu chuẩn với độ tin cậy 99% và độ chính xác 1% thì cần kiểm tra bao nhiêu sọt ?
Giải:
a) Tổng thể là toàn bộ trái cây của lô hàng
Gọi p là tỉ lệ trái cây không đạt tiêu chuẩn của tổng thể
Ta cần ước lượng p với độ tin cậy 95%
Với độ tin cậy 1 – α = 0,95, tra bảng hàm số Laplace, ta tìm được uα/2 = 1,96
Từ đó, sai số của ước lượng:
= 1,96
5000
)09,01.(
09,
= 0,0079
tỉ lệ trái không đạt tiêu chuẩn của lô hàng là
p = 0,09 0,0079 hay
f
suy ra:
Trang 38uα/2 =
) f 1 ( f
= 1 – α = 2 (uα/2 ) - 1 = 2 (1,24) - 1= 2 * 0,8925 – 1 = 0,785
Kết luận: độ tin cậy đạt được là 78,5%
c) Ta cần tìm kích thước mẫu mới khi biết: độ tin cậy = 99%, độ chính xác = 1% và
tỉ lệ mẫu ban đầu f = 0,09
Khi đó uα/2 = 2,58 Do đó
01,0
91,0.09,0.58,2
+ 1 = 55
Trang 39a) Lập bảng phân phối tần số thực nghiệm, tần suất thực nghiệm
b) Tính trung bình mẫu, phương sai mẫu và phương sai mẫu hiệu chỉnh 3.2 Số liệu về thời gian đợi phục vụ của 30 khách hàng tại một ngân hàng (tính bằng phút) cho như sau:
4,6 9,8 5,6 7,7 4,0 6,5 2,9 4,4 4,0 5,7
10,9 4,5 1,4 2,4 8,6 4,7 6,7 7,8 9,2 4,2
5,2 5,0 5,8 3,2 4,3 8,4 7,2 3,4 6,5 2,2
a) Lập bảng phân phối tần số thực nghiệm lớp ghép
b) Tính trung bình mẫu, phương sai mẫu và phương sai mẫu hiệu chỉnh 3.3 Điều tra trọng lượng của một loại sản phẩm (đơn vị: gam), kết quả như sau:
Cân nặng 5 – 10 10 – 15 15 – 20 20 – 25 25 – 30 30 - 35
Số con 5 10 20 30 15 10 Những sản phẩm có trọng lượng lớn hơn 15 gam là loại 1
Tính trung bình mẫu, phương sai mẫu, phương sai mẫu hiệu chỉnh của các sản phẩm loại 1
3.4 Điểm thi môn Toán của sinh viên một lớp được ghi trong bảng sau:
Hãy tính các đặc trưng mẫu
3.5 Điều tra năng suất lúa của một vùng, ta có bảng số liệu sau
Năng suất lúa (tạ/ha) 41 44 45 46 48 52 54 Diện tích có năng suất lúa tương ứng (ha) 10 20 30 15 10 10 5 Hãy tính các đặc trưng mẫu
Trang 403.6 Để nghiên cứu nhu cầu mua gạo ở một thành phố, người ta tiến hành điều tra một số gia đình và ghi kết quả ở bảng sau đây
Nhu cầu (kg/tháng) Số gia đình Nhu cầu Số gia đình
b) Tính tỉ lệ mẫu có nhu cầu trên 60kg/tháng
3.7 Số liệu sau đây là số kĩ sư đến thực tập tại một công ty trong vòng một năm ở các xí nghiệp khác nhau
3.8 Để nghiên cứu tuổi thọ của một loại bóng đèn, người ta thắp thử 100 bóng và có