Giáo trình xác suất thống kê phần 2 đh sư phạm kỹ thuật nam định

Khái niệm về mẫu ngẫu nhiên, thống kê mô tả Trong thực tế, người ta thường phải nghiên cứu một tập hợp các phần tử đồng nhất theo một hay nhiều dấu hiệu định tính hoặc định lượng đặc t

Trang 1

Chương 3: LÝ THUYẾT ƯỚC LƯỢNG

3.1 LÝ THUYẾT MẪU

3.1.1 Khái niệm về mẫu ngẫu nhiên, thống kê mô tả

Trong thực tế, người ta thường phải nghiên cứu một tập hợp các phần tử đồng nhất theo một hay nhiều dấu hiệu định tính hoặc định lượng đặc trưng cho các phần tử đó Chẳng hạn, một doanh nghiệp phải nghiên cứu tập hợp các khách hàng của nó thì dấu hiệu định tính có thể là mức độ hài lòng của khách hàng đối với sản phẩm hoặc dịch vụ của doanh nghiệp, còn dấu hiệu định lượng là nhu cầu của khách hàng về số lượng sản phẩm của doanh nghiệp

Để nghiên cứu tập hợp các phần tử này theo một dấu hiệu nhất định đôi khi người ta sử dụng phương pháp nghiên cứu toàn bộ, tức là thống kê toàn bộ tập hợp đó

và phân tích từng phần tử của nó theo dấu hiệu nghiên cứu Chẳng hạn để nghiên cứu dân số của một nước theo các dấu hiệu như tuổi tác, trình độ văn hoá địa bàn cư trú, cơ cấu nghề nghiệp có thể tiến hành tổng điều tra dân số và phân tích từng người theo các dấu hiệu trên, từ đó tổng hợp thành dấu hiệu chung cho toàn bộ dân số của nước đó Tuy nhiên trong thực tế phương pháp này gặp phải những khó khăn chủ yếu sau:

- Nếu quy mô của tập hợp quá lớn thì việc nghiên cứu toàn bộ sẽ đòi hỏi nhiều chi phí vật chất và thời gian

- Nhiều khi cũng do quy mô của tập hợp quá lớn nên có thể xảy ra trường hợp tính trùng hoặc bỏ sót các phần tử của nó

- Do quy mô nghiên cứu lớn mà trình độ tổ chức nghiên cứu lại hạn chế dẫn đến các sai sót trong quá trình thu thập thông tin ban đầu, hạn chế độ chính xác của kết quả phân tích

- Trong nhiều trường hợp không thể nắm được toàn bộ các phần tử của tập hợp cần nghiên cứu, do đó không thể tiến hành nghiên cứu toàn bộ được

Vì thế trong thực tế phương pháp nghiên cứu toàn bộ thường chỉ được áp dụng đối với các tập hợp có quy mô nhỏ, còn chủ yếu người ta áp dụng phương pháp nghiên cứu không toàn bộ, đặc biệt là phương pháp nghiên cứu chọn mẫu Phương pháp này chủ trương từ tập hợp cần nghiên cứu chọn ra một số phần tử (gọi là mẫu), phân tích các phần tử này và dựa vào đó mà suy ra các kết luận về tập hợp cần nghiên cứu Giả

Trang 2

sử theo một phương pháp nào đó từ tổng thể lấy ra n phần tử tạo nên mẫu kích thước

n Nếu mẫu được chọn ra một cách ngẫu nhiên và xử lý bằng các phương pháp xác

suất thì vừa thu được các kết luận một cách nhanh chóng, đỡ tốn kém mà vẫn đảm bảo

độ chính xác cần thiết

Việc thu thập, sắp xếp và trình bày các số liệu của tổng thể hoặc một mẫu gọi là

thống kê mô tả Còn việc sử dụng thông tin của mẫu để tiến hành các suy đoán, kết

luận về tổng thể gọi là thống kê suy diễn

Giả sử mẫu kích thước N từ tổng thể nghiên cứu có dấu hiệu là biến ngẫu nhiên

X, được lập theo phương pháp chọn mẫu ngẫu nhiên đơn giản Với cách chọn mẫu này, mỗi lần chọn một phần tử của mẫu như làm một phép thử độc lập rút ngẫu nhiên một giá trị của X từ tập các giá trị của nó Rút ngẫu nhiên được hiểu là rút phù hợp với luật phân phối xác suất của X nghĩa là xác suất để giá trị được rút đó thuộc bộ phận nào đó, bằng xác suất của X thuộc bộ phận đó Vì vậy ta có thể coi thành phần thứ i trong mẫu là biến ngẫu nhiên Xi có cùng luật phân phối của X

Định nghĩa: Mẫu ngẫu nhiên kích thước n là tập hợp của n biến ngẫu nhiên độc

lập X 1 , X 2 , , X n được thành lập từ biến ngẫu nhiên gốc X trong tổng thể nghiên cứu và có cùng phân phối xác suất với X

Mẫu ngẫu nhiên thường được ký hiệu là:

W = (X1 , X2 , , Xn) Giả sử một giá trị của nó là: X1 = x1 , X2 = x2 , , Xn = xn Tập hợp n giá trị x1,

x2, , xn tạo thành một giá trị của mẫu ngẫu nhiên, hay còn gọi là một mẫu cụ thể,

ký hiệu: w = (x1 , x2 , , xn)

Như vậy, mẫu ngẫu nhiên là tập hợp của n biến ngẫu nhiên, còn mẫu cụ thể là tập hợp của n giá trị cụ thể quan sát được khi thực hiện một phép thử đối với mẫu ngẫu nhiên

Ví dụ 1: Khi nghiên cứu chiều cao của một cộng đồng người, gọi X là ĐLNN chỉ

chiều cao Chúng ta dự định đo chiều cao của 100 người được chọn ngẫu nhiên Trước khi chưa tiến hành chọn mẫu, ta chưa biết được người thứ nhất được chọn vào mẫu có chiều cao là bao nhiêu, nó đóng vai trò là một ĐLNN, ký hiệu X1, có cùng phân phối xác suất với X Tương tự, ta có chiều cao của người thứ 100 là X100 Khi đó bộ (X1,

Trang 3

X2, ., X100) là một mẫu tổng quát có kích thước 100 Sau khi đo đạc ta sẽ xác định được các giá trị của Xi là xi, khi đó bộ số thực (x1, x2, , x100) là một mẫu cụ thể

3.1.2 Các phương pháp lấy mẫu

Có nhiều phương pháp chọn mẫu khác nhau, nhưng khó có thể nói rằng phương pháp nào là tốt nhất Tùy thuộc vào đặc điểm của từng tổng thể nghiên cứu mà mẫu có thể được chọn theo nhiều phương pháp khác nhau để đảm bảo yêu cầu về tính đại diện của mẫu Sau đây là một số phương pháp chọn mẫu chủ yếu thường được sử dụng để nghiên cứu các tổng thể kinh tế – xã hội

a) Chọn mẫu đơn giản

Là phương pháp chọn trực tiếp từ danh sách các phần tử đã được đánh số của tổng thể Từ tổng thể kích thước N người ta dùng cách rút thăm đơn giản ra n phần tử của mẫu theo một bảng số ngẫu nhiên nào đó Khi đó mỗi phần tử của đám đông đều có thể được chọn vào mẫu với cùng khả năng như nhau

Việc chọn mẫu kiểu này có 2 phương thức chọn: chọn có hoàn lại và chọn không hoàn lại Khi số phần tử N của tổng thể rất lớn so với kích thước mẫu n thì kết quả lấy mẫu theo 2 phương thức trên là sai lệch không đáng kể

Phương pháp này có ưu điểm là cho phép thu được một mẫu có tính đại diện cao, cho phép suy rộng kết quả của mẫu cho tổng thể với một sai số nhất định, song để vận dụng phải có được toàn bộ danh sách các phần tử của tổng thể nghiên cứu Mặt khác chi phí chọn mẫu sẽ khá lớn

b) Chọn mẫu phân nhóm

Trong chọn mẫu phân nhóm, trước hết ngàu ta phân chia tổng thể ra thành các nhóm có độ thuần nhất cao để chọn ra các phần tử đại diện cho từng nhóm Việc phân nhóm có hiệu quả khi tổng thể nghiên cứu không thuần nhất theo dấu hiệu nghiên cứu Sau khi đã phân nhóm thì kích thước mẫu được phân bổ cho mỗi nhóm theo một quy tắc nào đó, chẳng hạn tỷ lệ thuận với kích thước mỗi tổ

c) Chọn mẫu chùm

Trong một số trường hợp, để tiện cho việc nghiên cứu người ta muốn quy diện nghiên cứu gọn về một khu vực nhất định chứ không để cho các phần tử của mẫu phân tán quá rộng, chẳng hạn tập trung nghiên cứu khách hàng tại một địa phương nào đó Lúc đó mẫu được chọn theo chùm Chẳng hạn, chùm có thể là hộ gia đình có nhiều người, một làng có nhiều hộ gia đình Theo phương pháp này, trước tiên tổng thể điều tra được phân chia ra thành nhiều chùm theo nguyên tắc:

Trang 4

- Mỗi phần tử của tổng thể chỉ được phân vào một chùm

- Mỗi chùm cố gắng chứa nhiều phần tử khác nhau về dấu hiệu nghiên cứu, sao cho nó có độ phân tán cao như của tổng thể

- Phân chia sao cho các chùm tương đối đồng đều nhau về quy mô

Các chùm được chọn một cách ngẫu nhiên và tất cả các phần tử của chùm đó đều được chọn vào mẫu

Phương pháp này có thể tiết kiệm chi phí và thời gian, nhưng sai số chọn mẫu cao hơn các phương pháp trên

d) Chọn mẫu có suy luận

Phương pháp chọn mẫu này dựa trên ý kiến của các chuyên gia về đối tượng nghiên cứu Nhược điểm của phương pháp này là khó đảm bảo tính khách quan

3.1.3 Bảng phân phối thực nghiệm

Giả sử từ tổng thể với biến ngẫu nhiên gốc X rút ra một mẫu cụ thể kích thước n, trong đó:

 giá trị x1 xuất hiện n1 lần, x2 xuất hiện n2 lần, , xk xuất hiện nk lần

Các bảng mô tả số liệu sau đây được gọi là bảng phân phối thực nghiệm

Bảng phân phối tần số thực nghiệm:

xi x1 x2 xk

ni n1 n2 nk với n1 + n2 + + nk = n

Bảng phân phối tần suất thực nghiệm:

Trang 5

Ví dụ 3: Điều tra thời gian đợi phục vụ của khách hàng tại một ngân hàng (đơn

vị: phút), người ta chọn ngẫu nhiên 10 người, kết quả thu được như sau: 9, 8, 10, 10,

Chú ý: Khi kích thước của mẫu lớn, các giá trị của mẫu khá gần nhau, người ta

chia các giá trị của mẫu thành các lớp và lập bảng phân phối thực nghiệm của mẫu lớp

Ví dụ 4: Đo chiều cao của 300 học sinh 12 tuổi, ta thu được bảng số liệu sau:

Lớp (chiều cao cm) Tần số ni Tần suất fi

122,5 – 127,5 33 0,110 127,5 – 132,5 74 0,247 132,5 – 137,5 93 0,310 137,5 – 142,5 64 0,213 142,5 – 147,5 21 0,070

Chú ý:

- Thông thường người ta phân chia số liệu thành từ 5 đến 15 lớp Nếu số liệu nhiều hơn có thể giúp phân tích tốt hơn, nhưng sự cải thiện không nhiều, nếu số lớp quá ít các thông tin có thể bị mất khi xử lý

- Giữa 2 lớp liền nhau [ai-1– ai] và [ai – ai+1] thì chúng ta quy ước phần tử ai đếm cho lớp [ai-1 – ai]

- Một bảng phân phối theo lớp có thể đưa về bảng phân phối thực nghiệm bằng

phép lấy trung bình cộng của mỗi lớp, tức là xi = ai 1 ai

2

Chẳng hạn với bảng số liệu phân lớp ở ví dụ 4, ta có bảng phân phối tần số thực nghiệm tương ứng:

Trang 6

Giả sử biến ngẫu nhiên gốc X của tổng thể có EX =  ; VX = 2 Do X1 , X2 , , Xn

là các biến ngẫu nhiên độc lập cùng phân phối như X, nên trung bình mẫu X cũng là

một biến ngẫu nhiên và:

n i

Chú ý: Không gây hiểu nhầm về mặt ý nghĩa X là biến ngẫu nhiên còn x là giá trị mà

biến ngẫu nhiên đó nhận, đôi khi ta vẫn dùng chung là X Khi đó X cũng vẫn có thể hiểu là giá trị trung bình mẫu của X

* Phương sai mẫu:

Trang 7

Phương sai mẫu S2

cũng là biến ngẫu nhiên, ta có thể chỉ ra:

* Phương sai mẫu hiệu chỉnh:

- Vì giá trị trung bình của S2 không đúng bằng 2

do đó nhiều khi thay cho phương sai mẫu, ta dùng phương sai mẫu hiệu chỉnh, ký hiệu s2 để có Es2 = VX = 2

Nếu cho mẫu cụ thể ta sẽ tính được giá trị tỷ lệ mẫu cụ thể của F:

mfn

Trang 8

1) Cho biến ngẫu nhiên X có phân phối chuẩn N(, 2

) và (x1, x2, …, xn) là mẫu của X Khi đó đại lƣợng thống kê:

t = X

ns

Trang 9

Chú ý: Nếu dữ liệu cho ở dạng mẫu lớp, ta chỉ có thể tính gần đúng các đặc trƣng mẫu

bằng cách thay lớp [ai-1 – ai] bằng một đại diện xi =

= 102,738

Trang 10

b) Tính gián tiếp: Khi dữ liệu lớn phức tạp và cách đều nhau ta có thể biến đổi

để giảm độ phức tạp tính toán như sau:

Bước 1: Chọn giá trị x0 tuỳ ý thuộc vào mẫu (thường ở giữa mẫu)

ndnn

Trang 11

, = 10,1333

n d n n

1 41 30

2

0 , )2(

= 0,05423

s2 =

1

 n

Giải:

Bước 1: Chuyển số máy tính về chế độ thống kê

 Trên Casio fx-500MS: ON MODE 2

 Trên Casio fx-570MS: ON MODE MODE 1

Bước 2: Nhập số liệu (các thao tác trên 2 máy là như nhau)

Sau khi bấm phím ON MODE 2 trên Casio fx-500MS và ON MODE MODE 1 trên Casio fx-570MS (vào chương trình thống kê) và khai báo các số liệu cùng với tần số:

Bấm phím: 6 SHIFT ; 2 DT 7 SHIFT ; 4 DT

8 SHIFT ; 2 DT 9 SHIFT ; 1 DT 10 SHIFT ; 1 DT

Mỗi khi khai báo xong một số liệu cùng với tần số của nó, máy sẽ tự động đếm các số liệu được đưa vào Thí dụ, sau khi bấm phím 6 SHIFT ; 2 DT, màn hình sẽ hiện

n = 2 , tức là đã có 2 số liệu được khai báo (cùng bằng 6); Sau khi bấm phím tiếp 7 SHIFT ; 4 DT, màn hình sẽ hiện n = 6 , tức là đã có 6 số liệu được khai báo (hai số liệu cùng bằng 6 và bốn số liệu cùng bằng 7) Sau khi khai báo xong toàn bộ các số liệu, màn hình sẽ hiện n = 10 , nghĩa là: Tập hợp các số liệu gồm 10 giá trị

Tính độ dài mẫu: Bấm phím: SHIFT S-SUM 3 = (kết quả: n = 10) Chứng tỏ

kích thước mẫu bằng 10 (số các giá trị của mẫu là 10)

Trang 12

Tính tổng số liệu: Bấm phím: SHIFT S-SUM 2 = (kết quả: )  tổng số liệu bằng 75

Tính tổng bình phương số liệu: Bấm phím: SHIFT S-SUM 1 = (kết quả: ) tổng bình phương số liệu bằng 577

Tính giá trị trung bình: Bấm phím: SHIFT S-VAR 1 = (kết quả: )  x = 7,5

Tính độ lệch chuẩn: Bấm phím: SHIFT S-VAR 2 = (kết quả: )

- Khi khai báo 6 SHIFT ; 2 DT, nghĩa là khai báo giá trị x1 = 6 có tần số là 2

- Nếu bấm phím thì màn hình hiện ra Freq5 = 1, nghĩa là tần số của số liệu thứ 5 (x = 10) là 1

- Bấm tiếp phím: Màn hình hiện ra x5 = 10, nghĩa là số liệu thứ 5 có giá trị là

10

Tương tự, sử dụng phím, ta có thể kiểm tra tất cả các dữ liệu được đưa vào

đã đúng hay chưa và chúng có tần số là bao nhiêu

- Có thể tham khảo phụ lục 2 đối với các loại máy tính khác

3.2 KHÁI NIỆM ƯỚC LƯỢNG ĐIỂM

3.2.1 Khái niệm ước lượng

Giả sử khi nghiên cứu ĐLNN X và biết được phân phối của X thuộc một họ phân phối nào đó (chẳng hạn biết X có phân phối chuẩn hoặc biết X có phân phối Poisson, nhưng lại không biết các tham số) Muốn xác định hoàn toàn phân phối của X ta phải xác định được các giá trị tham số của phân phối đó

Trong trường hợp chưa biết gì về phân phối của ĐLNN X thì việc biết được các giá trị đặc trưng của X cũng cho ta biết được nhiều thông tin Chính vì vậy, việc đi tìm

Trang 13

các ƣớc lƣợng cho các tham số của phân phối hoặc ƣớc lƣợng cho các giá trị đặc trƣng của X là rất cần thiết

Giả sử mẫu ngẫu nhiên (X1 , X2 , , Xn) có tập giá trị (mẫu quan sát hay mẫu cụ thể)

là (x1 , x2 , , xn)

Định nghĩa: Một hàm của mẫu ngẫu nhiên:

T = T(X1 , X2 , , Xn)

xác định trên tập các giá trị của mẫu ngẫu nhiên đƣợc gọi là một thống kê

Nhƣ vậy mỗi thống kê cũng là một đại lƣợng ngẫu nhiên

Khi cho mẫu cụ thể (x1 , x2 , , xn) thì giá trị của T đƣợc xác định bởi:

T = T(x1 , x2 , , xn)

Ví dụ 1: X , S2 , s2 là những thống kê

Trên thực tế các tham số của tổng thể nhƣ:  , 2, p là không biết, vì ta không thể nào

đi khảo sát hết tất cả các phần tử của tổng thể Tuy nhiên nhiều bài toán thực tế chúng

ta cần phải ƣớc lƣợng chúng Việc ƣớc lƣợng các tham số dựa trên một mẫu thống kê (X1 , X2 , , Xn) đƣợc gọi là bài toán ước lượng tham số

3.2.2 Ƣớc lƣợng điểm

Để xác định hoàn toàn phân phối của X, ta phải xác định đƣợc các giá trị của 

mà phân phối đó nhận

Dựa vào các thông tin thu đƣợc từ một mẫu cụ thể (x1 , x2 , , xn) của X, ta tìm một thống kê $(x1 , x2 , , xn) "đủ tốt” để thay thế tham số  chƣa biết (hay ƣớc lƣợng  bằng $) đƣợc gọi là bài toán ước lượng điểm của 

Ví dụ 2:

X có phân phỗi chuẩn N( , 2) nhƣng , 2

bằng bao nhiêu chƣa biết Ta cần ƣớc lƣợng tham số  = (,2

Trang 14

Ý nghĩa: Ta thấy E($ -  ) = 0, tức là trung bình của độ lệch (sai số) giữa các ƣớc lƣợng với giá trị thật bằng 0

Ví dụ 4: Cân 100 sản phẩm của xí nghiệp ta có bảng

Theo nhận xét trên ta dự đoán (ƣớc lƣợng) trọng lƣợng trung bình của sản phẩm trong

xí nghiệp là  = 502,8 (gr)

Trang 15

- Trung bình mẫu X là ước lượng vững của trung bình tổng thể 

- Phương sai mẫu hiệu chỉnh s2 là ước lượng vững của phương sai tổng thể

3.3 ƯỚC LƯỢNG KHOẢNG

3.3.1 Bài toán ước lượng khoảng

Giả sử cần ước lượng tham số  của biến ngẫu nhiên gốc X Từ tổng thể lập mẫu ngẫu nhiên kích thước n:

W = (X1 , X2 , X3 , , Xn) với mẫu cụ thể là: w = (x1 , x2 , , xn)

Với xác suất 1 –  cho trước, ta cần tìm các thống kê 1 và 2 sao cho:

P1   2 = 1 – trong đó:

Trang 16

 γ = 1 –  được gọi là độ tin cậy của ước lượng

  được gọi là mức ý nghĩa, đánh giá mức độ sai lầm khi ước lượng

 ( 1 , 2) được gọi là khoảng tin cậy của ước lượng

 2 = 2 - 1 được gọi là độ dài của ước lượng

  được gọi là độ chính xác của ước lượng

Bài toán ước lượng khoảng với độ tin cậy 1 –  còn được gọi là bài toán tìm

khoảng tin cậy với độ tin cậy 1 – 

Để làm điều đó quy tắc chung như sau:

Đầu tiên tìm một thống kê GG(x , x , , x , )1 2 n  sao cho phân phối của G xác định hoàn toàn (không chứa tham số  nữa)

Khi đó với độ tin cậy 1     cho trước, ta tìm cặp giá trị 1 và 2 sao cho

3.3.2 Khoảng tin cậy cho kỳ vọng

Trước khi đi vào tìm khoảng tin cậy cho kỳ vọng tổng thể, ta nhắc lại kiến thức

Trang 17

Giả sử X ~ N( , 2) nhưng chưa biết tham số EX =  của nó

Muốn ước lượng kỳ vọng EX = , ta lập mẫu ngẫu nhiên (X1 , X2 , , Xn) được sinh từ biến ngẫu nhiên gốc X, có tập giá trị là (x1 , x2 , , xn)

Để xác định được khoảng tin cậy cho kỳ vọng EX = , ta cần xác định thống kê

1 và 2 sao cho:

P{θ1 < θ < θ2} = 1 –  ( ở đây  =  )

Ta xét 2 trường hợp sau:

a) Bài toán 1: Phương sai VX = 2

của biến X đã biết

Để ước lượng khoảng cho kỳ vọng EX =  với độ tin cậy 1 – , ta chọn thống kê:

Như vậy với độ tin cậy 1   cho trước ta sẽ có vô số cặp 1 và 2, tương ứng với vô

số khoảng tin cậy Ta xét một số trường hợp đặc biệt:

* Khoảng tin cậy đối xứng (ứng với 1 2

2



    ) là:

Trang 18

( x -  ; x +  ) hoặc viết  = x ± 𝜀 trong đó:

trong đó:  u   1 , tra bảng Laplace  uα = ?

hoặc dựng hàm trong Excel: uα = NORMSINV(1 - α)

* Khoảng tin cậy phải (ứng với     1 0, 2 ) là: ( x  u

- Khoảng tin cậy cho kỳ vọng tổng thể: ( x -  ; x +  )

Tương tự như vậy đối với quy tắc tìm khoảng tin cậy trái và khoảng tin cậy phải cho

kỳ vọng

Ví dụ 1: Trọng lượng của một loại sản phẩm là biến ngẫu nhiên có phân phối

chuẩn với độ lệch tiêu chuẩn là 1 gam Cân thử 25 sản phẩm loại này, thu được kết quả sau:

Trọng lượng (gam) 18 19 20 21

Số sản phẩm tương ứng 3 5 15 2

Với độ tin cậy 95%, hãy ước lượng khoảng:

Trang 19

a) Trọng lƣợng trung bình của 1 sản phẩm;

b) Trọng lƣợng trung bình tối thiểu của một sản phẩm

Giải:

Gọi  là trọng lƣợng trung bình của sản phẩm, ta cần ƣớc lƣợng khoảng tin cậy của 

Trọng lƣợng trung bình của mẫu 25 sản phẩm: x = 19,64

a) Khoảng tin cậy đối xứng cho trọng lượng trung bình sản phẩm

Với độ tin vậy 95% ta tìm đƣợc

Vậy trọng lƣợng trung bình của một sản phẩm khoảng từ 19,248 đến 20,032 gam

b) Khoảng tin cậy phải cho trọng lượng trung bình sản phẩm

Với độ tin vậy 95% ta tìm đƣợc u nhƣ sau:

b) Bài toán 2: Phương sai VX = 2

của biến X chưa biết

Trang 20

Đầu tiên ta phải ước lượng 2

bằng phương sai mẫu hiệu chỉnh, sau đó chọn

P( t     T t )    1

Tương tự như bài toán 1, ta xét một số khoảng tin cậy đặc biệt:

* Khoảng tin cậy đối xứng là: ( x -  ; x +  ) hoặc viết  = x ± 𝜀

trong đó:

  =

2

s t

hoặc dùng hàm trong Excel: t= TINV(, n - 1)

* Khoảng tin cậy phải là: (x s .t

n 

 ; )

Chú ý:

1) Nếu X không có phân phối chuẩn, thì cỡ mẫu phải lớn hơn 30

2) Nếu n > 30 thống kê T sẽ có phân phối tiệm cận chuẩn N(0; 1), do đó ta có thể thay

thế: tα = uα , tα/2 = uα/2

Quy tắc tìm khoảng tin cậy đối xứng cho kỳ vọng (2

chưa biết)

- Từ mẫu cụ thể tính x, s

Trang 21

n 

 

- Khoảng tin cậy cho kỳ vọng tổng thể: (x-  ; x +  )

Tương tự như vậy đối với quy tắc tìm khoảng tin cậy trái và khoảng tin cậy phải cho

kỳ vọng

Ví dụ 2: Ở một cửa hàng chế biến thủy sản, theo dõi lượng nước mắm bán ra

trong một số ngày, người ta ghi được bảng số liệu sau

Số lượng bán ra (lít)

a) biết phương sai 2

= 132,25;

b) chưa biết phương sai

Trang 22

= 3,6429

Trang 23

Khoảng tin cậy là: (x    ; x ) 49,3404; 50,7397

Vậy với độ tin cậy 95% một bao xi măng bán trên thị trường có trọng lượng từ 49,3403 đến 50,7397 (kg)

Ví dụ 4: Đo đường kính của 20 trục máy do một máy tiện tự động sản xuất ra, ta

Giải:

Tổng thể là toàn bộ trục máy do máy tiện sản xuất

Ta cần ước lượng đường kính trung bình  của tổng thể với độ tin cậy 95% và kích thước mẫu n ≤ 30, chưa biết phương sai

Từ dữ liệu mẫu, ta tính được:

X= 251,7 ; s = 7,2670

Trang 24

Vì α = 0,05 tra bảng phân phối Student dòng 19, cột 0,975 ta được

Vậy:  = 251,7  3,401 (mm)

c) Bài toán 3: tìm kích thước mẫu, độ tin cậy của ước lượng

Trường hợp 1: Xác định kích thước mẫu n tối thiểu để độ chính xác của ước lượng

2

s u

 

không vượt quá số 0 cho trước?

Có nghĩa ta cần xác định n sao cho:

2 0

- Do s lại phụ thuộc vào n, để khắc phục điều này ta lấy một mẫu sơ bộ (x 1 , x 2 , ,

x m ) với kích thước m > 30 nào đó và tính s theo mẫu đó Chúng ta có thể lấy

ngay mẫu mà trong đề bài đã cho

- Trong công thức xác định n trên, nếu đã biết  thì ta thay độ lệch mẫu s bởi 

Trường hợp 2: Cho biết độ chính xác của ước lượng  và trung bình mẫu x Xác

định độ tin cậy của ước lượng

Từ công thức

2

s u

  , ta suy ra:

2

nu

Trang 25

Ví dụ 5: Trọng lượng của một hộp sữa do một dây chuyền tự động đóng gói

tuân theo luật phân phối chuẩn với độ lệch chuẩn là 10 (gr) Cần phải lấy mẫu kích thước n tối thiểu bằng bao nhiêu để với độ tin cậy 95% sai số của ước lượng không vượt quá 2 (gr)

Vậy cần chọn tối thiểu 97 hộp sữa

Ví dụ 6: Để nghiên cứu nhu cầu một loại mặt hàng ở một khu vực (đơn vị:

kg/tháng), người ta tiến hành khảo sát về nhu cầu mặt hàng này ở 400 hộ gia đình Kết quả khảo sát cho ở bảng sau:

Nhu cầu <1 1-2 2-3 3-4 4-5 5-6 6-7 7-8

Giả sử khu vực này có 4000 hộ

a) Ước lượng nhu cầu trung bình về mặt hàng này của toàn khu vực trong một năm với độ tin cậy 95%

b) Khi ước lượng nhu cầu trung bình về mặt hàng này của toàn khu vực trong một năm, nếu ta muốn độ tin cậy đạt được 99% và độ chính xác là 4,8 tấn thì cần khảo sát về nhu cầu này ở bao nhiêu hộ gia đình

Giải:

a) Gọi M là nhu cầu trung bình về mặt hàng này của toàn khu vực trong một năm, 

là nhu cầu trung bình về mặt hàng này của một hộ trong một tháng

Trước hết ta tìm khoảng tin cậy của :

Trang 26

Suy ra khoảng tin cậy cho M là:

Gọi m là số hộ gia đình cần khảo sát về nhu cầu của mặt hàng này, khi đó

1 0

Vậy số hộ cần khảo sát là 1381 hộ

Ví dụ 7: Sai số đo của một loại dụng cụ đo có phân phối chuẩn với độ lệch chuẩn

bằng 20 Cần phải tiến hành bao nhiêu phép đo độc lập để sai số phạm phải không vượt quá 5 với độ tin cậy 90%?

5 + 1 = 44

Cần tiến hành 44 phép đo độc lập

3.3.3 Khoảng tin cậy cho phương sai

Ta đã biết một đại lượng ngẫu nhiên Z ~2(n), với độ tin cậy 1  cho trước, tìm được giá trị phân vị 2

n( )

  sao cho:

Trang 27

1 2( ; ) sao cho:

P(       ) 1

Để giải bài toán trên, ta xét hai trường hợp sau:

a) Bài toán 1: Biết trước kỳ vọng  của tổng thể

Giả sử (X1, X2, , Xn) là mẫu tổng quát từ X ~  2

Trang 28

- Với độ tin cậy 1  ta tìm các giá trị phân vị: 2n(12),2n( )2

Khi đó: khoảng tin cậy hai phía cho phương sai 2 của tổng thể là

Trang 29

b) Bài toán 2: Kỳ vọng EX =  chưa biết

Xây dựng khoảng tin cậy dựa trên các thống kê sau:

 2 có phân phối khi bình phương (n-1) bậc tự do

Bằng cách xây dựng như trên, tra có quy tắc tìm khoảng ước lượng hai phía cho

phương sai trong trường hợp chưa biết kỳ vọng :

- Từ mẫu cụ thể (x1, x2, , xn) ta tính giá trị: 2

(n 1)s

- Với độ tin cậy 1  ta tìm các giá trị phân vị: 2n 1 (12),2n 1 ( )2

Khi đó: khoảng tin cậy hai phía cho phương sai 2 của tổng thể là

Ví dụ 8: Theo dõi số hàng bán được mỗi ngày ở một trung tâm thương mại, ta

được kết quả ghi ở bảng sau:

Số hàng bán được (kg/ngày) Số ngày

Trang 30

Giải:

Ta lập bảng để tính s2

và thu đƣợc: s2 = 2058,333 Với độ tin vậy 95% thì:

Ví dụ 9: Cho khối lƣợng một loại sản phẩm tuân theo luật phân phối chuẩn

Cân thử từng sản phẩm của một mẫu ngẫu nhiên gồm 25 sản phẩm, kết quả thu đƣợc nhƣ sau:

Hay 0,1262 ; 0,391

Trang 31

b) Sử dụng máy tính điện tử tính đƣợc: s = 0,4621688, s2

=0,2136 Với độ tin vậy 95% thì:

Ví dụ 10: Theo dõi số hàng bán đƣợc trong một ngày ở một cửa hàng, ta đƣợc

kết quả ghi ở bảng sau:

3.3.4 Khoảng tin cậy cho tỷ lệ

a) Bài toán tìm khoảng tin cậy

Giả sử tổng thể có N phần tử, trong đó có M phần tử mang dấu hiệu nghiên cứu (phần tử có tính chất A)

Trang 32

được gọi là tần suất mẫu xuất hiện dấu hiệu cần nghiên cứu

Khi kích thước mẫu n khá lớn thì ta có thể xấp xỉ f p

Quy tắc: tìm khoảng ước lượng đối xứng cho tỷ lệ của tổng thể

- Từ mẫu cụ thể tính f =

n

m

Trang 33

* Khoảng tin cậy phải: f 1 f 

  , với  là độ chính xác của ước lượng

Ví dụ 11: Để ước lượng số hải cẩu trên một hòn đảo người ta đánh dấu cho

2000 con Sau một thời gian bắt lại 400 con thấy có 80 con có đánh dấu Hãy ước lượng số hải cẩu có trên đảo với độ tin cậy là 95%

8362 N 12438

Ví dụ 12: Trước ngày bầu cử tổng thống, người ta phỏng vấn ngẫu nhiên 1800 cử

tri thì thấy có 1180 người ủng hộ ứng cử viên A Với độ tin cậy 95%, hãy ước lượng tỷ

lệ cử tri ủng hộ ứng cử viên A bằng khoảng tin cậy đối xứng?

Trang 34

Giải:

Tổng thể là toàn bộ số cử tri cả nước, các phần tử của tổng thể gồm hai loại: ủng hộ và không ủng hộ ứng cử viên A

Gọi p là tỷ lệ các phần tử ủng hộ ứng cử viên A của tổng thể

Với độ tin cậy 95%, ta cần ước lượng tỉ lệ p ?

Ta có mẫu gồm 1800 phần tử, trong đó có 1180 phần tử ủng hộ ứng cử viên A nên tỉ lệ mẫu là:

= 0,022

Do đó tỉ lệ tổng thể ủng hộ ứng cử viên A là:

p = 0,6556  0,022 hay 0,6336  p  0,6776

Ví dụ 13: Người ta bắt được 1500 con thú, đánh dấu rồi thả lại vào rừng Sau một

thời gian bắt lại 360 con thì thấy có 27 con bị đánh dấu Hãy ước lượng số thú trong rừng với độ tin cậy 99%

Giải:

Tổng thể là toàn bộ thú trong rừng Số phần tử của tổng thể là N chưa biết nhưng được chia thành hai loại: bị đánh dấu và không bị đánh dấu

Số phần tử bị đánh dấu của tổng thể là M = 1500 đã biết

Do đó để tìm N, ta ước lượng tỉ lệ p các phần tử bị đánh dấu của tổng thể với độ tin cậy 99%

Ta có số phần tử của mẫu là n = 360, trong đó số phần tử bị đánh dấu là k = 27

Trang 35

1108,0

1500  N 

0392,01500

hay 13538  N  38265

Kết luận: với độ tin cậy 99% số thú hiện có trong rừng là từ 13538 đến 38265 con

b) Bài toán xác định kích thước mẫu, độ tin cậy của ước lượng

Bài toán 1: Xác định kích thước mẫu n tối thiểu để độ chính xác của ước lượng

2

f (1 f )u

n





 

không vượt quá số 0 cho trước?

Có nghĩa ta cần xác định n sao cho:

2 /2 2

0

f (1 f )

n  u

Vậy n được xác định bằng công thức

2 /2 2

trong đó [.] là phần nguyên

Chú ý: Trong công thức trên f lại phụ thuộc vào n, để khắc phục điều này ta

thực hiện lấy mẫu sơ bộ nào đó với kích thước đủ lớn và tính f theo mẫu đó Chúng ta có thể lấy ngay mẫu mà trong bài đã cho

Bài toán 2: Cho biết độ chính xác của ước lượng  và tỷ lệ mẫu f Xác định độ tin cậy của ước lượng?

Từ công thức:

Trang 36

nu

f (1 f )

  

 , suy ra độ tin cậy của ước lượng:

Ví dụ 14: Phòng cảnh sát giao thông muốn ước lượng tỷ lệ xe chở quá tải với độ

tin cậy 95% và sai số không vượt quá 5% thì cần phải kiểm tra tối thiểu bao nhiêu lượt

xe chạy trên đường Biết một mẫu điều tra sơ bộ kiểm tra 400 xe thấy có 40 xe chở quá tải

Như vậy số xe tối thiểu cần kiểm tra là 369 chiếc

Ví dụ 15: Ở một vùng, khi khám bệnh cho bệnh nhân, người ta thấy tỉ lệ mắc

bệnh tai mũi họng là 15% Để ước lượng xác suất mắc bệnh tai mũi họng của vùng đó với độ tin cậy 95% và sai số không vượt quá 2% thì cần khám tối thiểu bao nhiêu người ?

Giải:

Theo đề bài ta có:

- tỉ lệ mắc bệnh của mẫu ban đầu là f = 0,15

- độ tin cậy 1 – α = 95% nên uα/2 = 1,96

- sai số của ước lượng, hay độ chính xác là  0,02

Vậy mẫu cần tìm phải có số phần tử

02,0

)15,01(.15,0.96,1

+ 1 = 1225

Do đó, tối thiểu cần khám cho 1225 người

Trang 37

Ví dụ 16: Lô trái cây của một chủ hàng được đóng thành từng sọt, mỗi sọt 100

trái Kiểm tra 50 sọt người ta thấy có 450 trái không đạt tiêu chuẩn

a) Với độ tin cậy 95%, hãy ước lượng tỉ lệ trái cây không đạt tiêu chuẩn của lô hàng đó?

b) Muốn ước lượng tỉ lệ trái cây không đạt tiêu chuẩn với độ chính xác 0,5% thì

độ tin cậy đạt được là bao nhiêu ?

c) Muốn ước lượng tỉ lệ trái cây không đạt tiêu chuẩn với độ tin cậy 99% và độ chính xác 1% thì cần kiểm tra bao nhiêu sọt ?

Giải:

a) Tổng thể là toàn bộ trái cây của lô hàng

Gọi p là tỉ lệ trái cây không đạt tiêu chuẩn của tổng thể

Ta cần ước lượng p với độ tin cậy 95%

Với độ tin cậy 1 – α = 0,95, tra bảng hàm số Laplace, ta tìm được uα/2 = 1,96

Từ đó, sai số của ước lượng:

 = 1,96

5000

)09,01.(

09,

= 0,0079

 tỉ lệ trái không đạt tiêu chuẩn của lô hàng là

p = 0,09  0,0079 hay

f 

suy ra:

Trang 38

uα/2 = 

) f 1 ( f

 = 1 – α = 2  (uα/2 ) - 1 = 2  (1,24) - 1= 2 * 0,8925 – 1 = 0,785

Kết luận: độ tin cậy đạt được là 78,5%

c) Ta cần tìm kích thước mẫu mới khi biết: độ tin cậy  = 99%, độ chính xác  = 1% và

tỉ lệ mẫu ban đầu f = 0,09

Khi đó uα/2 = 2,58 Do đó

01,0

91,0.09,0.58,2

+ 1 = 55

Trang 39

a) Lập bảng phân phối tần số thực nghiệm, tần suất thực nghiệm

b) Tính trung bình mẫu, phương sai mẫu và phương sai mẫu hiệu chỉnh 3.2 Số liệu về thời gian đợi phục vụ của 30 khách hàng tại một ngân hàng (tính bằng phút) cho như sau:

4,6 9,8 5,6 7,7 4,0 6,5 2,9 4,4 4,0 5,7

10,9 4,5 1,4 2,4 8,6 4,7 6,7 7,8 9,2 4,2

5,2 5,0 5,8 3,2 4,3 8,4 7,2 3,4 6,5 2,2

a) Lập bảng phân phối tần số thực nghiệm lớp ghép

b) Tính trung bình mẫu, phương sai mẫu và phương sai mẫu hiệu chỉnh 3.3 Điều tra trọng lượng của một loại sản phẩm (đơn vị: gam), kết quả như sau:

Cân nặng 5 – 10 10 – 15 15 – 20 20 – 25 25 – 30 30 - 35

Số con 5 10 20 30 15 10 Những sản phẩm có trọng lượng lớn hơn 15 gam là loại 1

Tính trung bình mẫu, phương sai mẫu, phương sai mẫu hiệu chỉnh của các sản phẩm loại 1

3.4 Điểm thi môn Toán của sinh viên một lớp được ghi trong bảng sau:

Hãy tính các đặc trưng mẫu

3.5 Điều tra năng suất lúa của một vùng, ta có bảng số liệu sau

Năng suất lúa (tạ/ha) 41 44 45 46 48 52 54 Diện tích có năng suất lúa tương ứng (ha) 10 20 30 15 10 10 5 Hãy tính các đặc trưng mẫu

Trang 40

3.6 Để nghiên cứu nhu cầu mua gạo ở một thành phố, người ta tiến hành điều tra một số gia đình và ghi kết quả ở bảng sau đây

Nhu cầu (kg/tháng) Số gia đình Nhu cầu Số gia đình

b) Tính tỉ lệ mẫu có nhu cầu trên 60kg/tháng

3.7 Số liệu sau đây là số kĩ sư đến thực tập tại một công ty trong vòng một năm ở các xí nghiệp khác nhau

3.8 Để nghiên cứu tuổi thọ của một loại bóng đèn, người ta thắp thử 100 bóng và có

Tiêu đề	Giáo Trình Xác Suất Thống Kê Phần 2
Trường học	Đại Học Sư Phạm Kỹ Thuật Nam Định
Thể loại	Giáo Trình

Định dạng
Số trang	96
Dung lượng	1,85 MB