1. Trang chủ
  2. » Luận Văn - Báo Cáo

Giáo trình xác suất thống kê phần 2 đh sư phạm kỹ thuật nam định

96 11 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Giáo Trình Xác Suất Thống Kê Phần 2
Trường học Đại Học Sư Phạm Kỹ Thuật Nam Định
Thể loại Giáo Trình
Định dạng
Số trang 96
Dung lượng 1,85 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Khái niệm về mẫu ngẫu nhiên, thống kê mô tả Trong thực tế, người ta thường phải nghiên cứu một tập hợp các phần tử đồng nhất theo một hay nhiều dấu hiệu định tính hoặc định lượng đặc t

Trang 1

Chương 3: LÝ THUYẾT ƯỚC LƯỢNG

3.1 LÝ THUYẾT MẪU

3.1.1 Khái niệm về mẫu ngẫu nhiên, thống kê mô tả

Trong thực tế, người ta thường phải nghiên cứu một tập hợp các phần tử đồng nhất theo một hay nhiều dấu hiệu định tính hoặc định lượng đặc trưng cho các phần tử đó Chẳng hạn, một doanh nghiệp phải nghiên cứu tập hợp các khách hàng của nó thì dấu hiệu định tính có thể là mức độ hài lòng của khách hàng đối với sản phẩm hoặc dịch vụ của doanh nghiệp, còn dấu hiệu định lượng là nhu cầu của khách hàng về số lượng sản phẩm của doanh nghiệp

Để nghiên cứu tập hợp các phần tử này theo một dấu hiệu nhất định đôi khi người ta sử dụng phương pháp nghiên cứu toàn bộ, tức là thống kê toàn bộ tập hợp đó

và phân tích từng phần tử của nó theo dấu hiệu nghiên cứu Chẳng hạn để nghiên cứu dân số của một nước theo các dấu hiệu như tuổi tác, trình độ văn hoá địa bàn cư trú, cơ cấu nghề nghiệp có thể tiến hành tổng điều tra dân số và phân tích từng người theo các dấu hiệu trên, từ đó tổng hợp thành dấu hiệu chung cho toàn bộ dân số của nước đó Tuy nhiên trong thực tế phương pháp này gặp phải những khó khăn chủ yếu sau:

- Nếu quy mô của tập hợp quá lớn thì việc nghiên cứu toàn bộ sẽ đòi hỏi nhiều chi phí vật chất và thời gian

- Nhiều khi cũng do quy mô của tập hợp quá lớn nên có thể xảy ra trường hợp tính trùng hoặc bỏ sót các phần tử của nó

- Do quy mô nghiên cứu lớn mà trình độ tổ chức nghiên cứu lại hạn chế dẫn đến các sai sót trong quá trình thu thập thông tin ban đầu, hạn chế độ chính xác của kết quả phân tích

- Trong nhiều trường hợp không thể nắm được toàn bộ các phần tử của tập hợp cần nghiên cứu, do đó không thể tiến hành nghiên cứu toàn bộ được

Vì thế trong thực tế phương pháp nghiên cứu toàn bộ thường chỉ được áp dụng đối với các tập hợp có quy mô nhỏ, còn chủ yếu người ta áp dụng phương pháp nghiên cứu không toàn bộ, đặc biệt là phương pháp nghiên cứu chọn mẫu Phương pháp này chủ trương từ tập hợp cần nghiên cứu chọn ra một số phần tử (gọi là mẫu), phân tích các phần tử này và dựa vào đó mà suy ra các kết luận về tập hợp cần nghiên cứu Giả

Trang 2

sử theo một phương pháp nào đó từ tổng thể lấy ra n phần tử tạo nên mẫu kích thước

n Nếu mẫu được chọn ra một cách ngẫu nhiên và xử lý bằng các phương pháp xác

suất thì vừa thu được các kết luận một cách nhanh chóng, đỡ tốn kém mà vẫn đảm bảo

độ chính xác cần thiết

Việc thu thập, sắp xếp và trình bày các số liệu của tổng thể hoặc một mẫu gọi là

thống kê mô tả Còn việc sử dụng thông tin của mẫu để tiến hành các suy đoán, kết

luận về tổng thể gọi là thống kê suy diễn

Giả sử mẫu kích thước N từ tổng thể nghiên cứu có dấu hiệu là biến ngẫu nhiên

X, được lập theo phương pháp chọn mẫu ngẫu nhiên đơn giản Với cách chọn mẫu này, mỗi lần chọn một phần tử của mẫu như làm một phép thử độc lập rút ngẫu nhiên một giá trị của X từ tập các giá trị của nó Rút ngẫu nhiên được hiểu là rút phù hợp với luật phân phối xác suất của X nghĩa là xác suất để giá trị được rút đó thuộc bộ phận nào đó, bằng xác suất của X thuộc bộ phận đó Vì vậy ta có thể coi thành phần thứ i trong mẫu là biến ngẫu nhiên Xi có cùng luật phân phối của X

Định nghĩa: Mẫu ngẫu nhiên kích thước n là tập hợp của n biến ngẫu nhiên độc

lập X 1 , X 2 , , X n được thành lập từ biến ngẫu nhiên gốc X trong tổng thể nghiên cứu và có cùng phân phối xác suất với X

Mẫu ngẫu nhiên thường được ký hiệu là:

W = (X1 , X2 , , Xn) Giả sử một giá trị của nó là: X1 = x1 , X2 = x2 , , Xn = xn Tập hợp n giá trị x1,

x2, , xn tạo thành một giá trị của mẫu ngẫu nhiên, hay còn gọi là một mẫu cụ thể,

ký hiệu: w = (x1 , x2 , , xn)

Như vậy, mẫu ngẫu nhiên là tập hợp của n biến ngẫu nhiên, còn mẫu cụ thể là tập hợp của n giá trị cụ thể quan sát được khi thực hiện một phép thử đối với mẫu ngẫu nhiên

Ví dụ 1: Khi nghiên cứu chiều cao của một cộng đồng người, gọi X là ĐLNN chỉ

chiều cao Chúng ta dự định đo chiều cao của 100 người được chọn ngẫu nhiên Trước khi chưa tiến hành chọn mẫu, ta chưa biết được người thứ nhất được chọn vào mẫu có chiều cao là bao nhiêu, nó đóng vai trò là một ĐLNN, ký hiệu X1, có cùng phân phối xác suất với X Tương tự, ta có chiều cao của người thứ 100 là X100 Khi đó bộ (X1,

Trang 3

X2, ., X100) là một mẫu tổng quát có kích thước 100 Sau khi đo đạc ta sẽ xác định được các giá trị của Xi là xi, khi đó bộ số thực (x1, x2, , x100) là một mẫu cụ thể

3.1.2 Các phương pháp lấy mẫu

Có nhiều phương pháp chọn mẫu khác nhau, nhưng khó có thể nói rằng phương pháp nào là tốt nhất Tùy thuộc vào đặc điểm của từng tổng thể nghiên cứu mà mẫu có thể được chọn theo nhiều phương pháp khác nhau để đảm bảo yêu cầu về tính đại diện của mẫu Sau đây là một số phương pháp chọn mẫu chủ yếu thường được sử dụng để nghiên cứu các tổng thể kinh tế – xã hội

a) Chọn mẫu đơn giản

Là phương pháp chọn trực tiếp từ danh sách các phần tử đã được đánh số của tổng thể Từ tổng thể kích thước N người ta dùng cách rút thăm đơn giản ra n phần tử của mẫu theo một bảng số ngẫu nhiên nào đó Khi đó mỗi phần tử của đám đông đều có thể được chọn vào mẫu với cùng khả năng như nhau

Việc chọn mẫu kiểu này có 2 phương thức chọn: chọn có hoàn lại và chọn không hoàn lại Khi số phần tử N của tổng thể rất lớn so với kích thước mẫu n thì kết quả lấy mẫu theo 2 phương thức trên là sai lệch không đáng kể

Phương pháp này có ưu điểm là cho phép thu được một mẫu có tính đại diện cao, cho phép suy rộng kết quả của mẫu cho tổng thể với một sai số nhất định, song để vận dụng phải có được toàn bộ danh sách các phần tử của tổng thể nghiên cứu Mặt khác chi phí chọn mẫu sẽ khá lớn

b) Chọn mẫu phân nhóm

Trong chọn mẫu phân nhóm, trước hết ngàu ta phân chia tổng thể ra thành các nhóm có độ thuần nhất cao để chọn ra các phần tử đại diện cho từng nhóm Việc phân nhóm có hiệu quả khi tổng thể nghiên cứu không thuần nhất theo dấu hiệu nghiên cứu Sau khi đã phân nhóm thì kích thước mẫu được phân bổ cho mỗi nhóm theo một quy tắc nào đó, chẳng hạn tỷ lệ thuận với kích thước mỗi tổ

c) Chọn mẫu chùm

Trong một số trường hợp, để tiện cho việc nghiên cứu người ta muốn quy diện nghiên cứu gọn về một khu vực nhất định chứ không để cho các phần tử của mẫu phân tán quá rộng, chẳng hạn tập trung nghiên cứu khách hàng tại một địa phương nào đó Lúc đó mẫu được chọn theo chùm Chẳng hạn, chùm có thể là hộ gia đình có nhiều người, một làng có nhiều hộ gia đình Theo phương pháp này, trước tiên tổng thể điều tra được phân chia ra thành nhiều chùm theo nguyên tắc:

Trang 4

- Mỗi phần tử của tổng thể chỉ được phân vào một chùm

- Mỗi chùm cố gắng chứa nhiều phần tử khác nhau về dấu hiệu nghiên cứu, sao cho nó có độ phân tán cao như của tổng thể

- Phân chia sao cho các chùm tương đối đồng đều nhau về quy mô

Các chùm được chọn một cách ngẫu nhiên và tất cả các phần tử của chùm đó đều được chọn vào mẫu

Phương pháp này có thể tiết kiệm chi phí và thời gian, nhưng sai số chọn mẫu cao hơn các phương pháp trên

d) Chọn mẫu có suy luận

Phương pháp chọn mẫu này dựa trên ý kiến của các chuyên gia về đối tượng nghiên cứu Nhược điểm của phương pháp này là khó đảm bảo tính khách quan

3.1.3 Bảng phân phối thực nghiệm

Giả sử từ tổng thể với biến ngẫu nhiên gốc X rút ra một mẫu cụ thể kích thước n, trong đó:

 giá trị x1 xuất hiện n1 lần, x2 xuất hiện n2 lần, , xk xuất hiện nk lần

Các bảng mô tả số liệu sau đây được gọi là bảng phân phối thực nghiệm

Bảng phân phối tần số thực nghiệm:

xi x1 x2 xk

ni n1 n2 nk với n1 + n2 + + nk = n

Bảng phân phối tần suất thực nghiệm:

Trang 5

Ví dụ 3: Điều tra thời gian đợi phục vụ của khách hàng tại một ngân hàng (đơn

vị: phút), người ta chọn ngẫu nhiên 10 người, kết quả thu được như sau: 9, 8, 10, 10,

Chú ý: Khi kích thước của mẫu lớn, các giá trị của mẫu khá gần nhau, người ta

chia các giá trị của mẫu thành các lớp và lập bảng phân phối thực nghiệm của mẫu lớp

Ví dụ 4: Đo chiều cao của 300 học sinh 12 tuổi, ta thu được bảng số liệu sau:

Lớp (chiều cao cm) Tần số ni Tần suất fi

122,5 – 127,5 33 0,110 127,5 – 132,5 74 0,247 132,5 – 137,5 93 0,310 137,5 – 142,5 64 0,213 142,5 – 147,5 21 0,070

Chú ý:

- Thông thường người ta phân chia số liệu thành từ 5 đến 15 lớp Nếu số liệu nhiều hơn có thể giúp phân tích tốt hơn, nhưng sự cải thiện không nhiều, nếu số lớp quá ít các thông tin có thể bị mất khi xử lý

- Giữa 2 lớp liền nhau [ai-1– ai] và [ai – ai+1] thì chúng ta quy ước phần tử ai đếm cho lớp [ai-1 – ai]

- Một bảng phân phối theo lớp có thể đưa về bảng phân phối thực nghiệm bằng

phép lấy trung bình cộng của mỗi lớp, tức là xi = ai 1 ai

2

Chẳng hạn với bảng số liệu phân lớp ở ví dụ 4, ta có bảng phân phối tần số thực nghiệm tương ứng:

Trang 6

Giả sử biến ngẫu nhiên gốc X của tổng thể có EX =  ; VX = 2 Do X1 , X2 , , Xn

là các biến ngẫu nhiên độc lập cùng phân phối như X, nên trung bình mẫu X cũng là

một biến ngẫu nhiên và:

n i

Chú ý: Không gây hiểu nhầm về mặt ý nghĩa X là biến ngẫu nhiên còn x là giá trị mà

biến ngẫu nhiên đó nhận, đôi khi ta vẫn dùng chung là X Khi đó X cũng vẫn có thể hiểu là giá trị trung bình mẫu của X

* Phương sai mẫu:

Trang 7

Phương sai mẫu S2

cũng là biến ngẫu nhiên, ta có thể chỉ ra:

* Phương sai mẫu hiệu chỉnh:

- Vì giá trị trung bình của S2 không đúng bằng 2

do đó nhiều khi thay cho phương sai mẫu, ta dùng phương sai mẫu hiệu chỉnh, ký hiệu s2 để có Es2 = VX = 2

Nếu cho mẫu cụ thể ta sẽ tính được giá trị tỷ lệ mẫu cụ thể của F:

mfn

Trang 8

1) Cho biến ngẫu nhiên X có phân phối chuẩn N(, 2

) và (x1, x2, …, xn) là mẫu của X Khi đó đại lƣợng thống kê:

t = X

ns

Trang 9

Chú ý: Nếu dữ liệu cho ở dạng mẫu lớp, ta chỉ có thể tính gần đúng các đặc trƣng mẫu

bằng cách thay lớp [ai-1 – ai] bằng một đại diện xi =

= 102,738

Trang 10

b) Tính gián tiếp: Khi dữ liệu lớn phức tạp và cách đều nhau ta có thể biến đổi

để giảm độ phức tạp tính toán như sau:

Bước 1: Chọn giá trị x0 tuỳ ý thuộc vào mẫu (thường ở giữa mẫu)

ndnn

Trang 11

, = 10,1333

n d n n

1 41 30

2

0 , )2(

= 0,05423

s2 =

1

 n

Giải:

Bước 1: Chuyển số máy tính về chế độ thống kê

 Trên Casio fx-500MS: ON MODE 2

 Trên Casio fx-570MS: ON MODE MODE 1

Bước 2: Nhập số liệu (các thao tác trên 2 máy là như nhau)

Sau khi bấm phím ON MODE 2 trên Casio fx-500MS và ON MODE MODE 1 trên Casio fx-570MS (vào chương trình thống kê) và khai báo các số liệu cùng với tần số:

Bấm phím: 6 SHIFT ; 2 DT 7 SHIFT ; 4 DT

8 SHIFT ; 2 DT 9 SHIFT ; 1 DT 10 SHIFT ; 1 DT

Mỗi khi khai báo xong một số liệu cùng với tần số của nó, máy sẽ tự động đếm các số liệu được đưa vào Thí dụ, sau khi bấm phím 6 SHIFT ; 2 DT, màn hình sẽ hiện

n = 2 , tức là đã có 2 số liệu được khai báo (cùng bằng 6); Sau khi bấm phím tiếp 7 SHIFT ; 4 DT, màn hình sẽ hiện n = 6 , tức là đã có 6 số liệu được khai báo (hai số liệu cùng bằng 6 và bốn số liệu cùng bằng 7) Sau khi khai báo xong toàn bộ các số liệu, màn hình sẽ hiện n = 10 , nghĩa là: Tập hợp các số liệu gồm 10 giá trị

Tính độ dài mẫu: Bấm phím: SHIFT S-SUM 3 = (kết quả: n = 10) Chứng tỏ

kích thước mẫu bằng 10 (số các giá trị của mẫu là 10)

Trang 12

Tính tổng số liệu: Bấm phím: SHIFT S-SUM 2 = (kết quả: )  tổng số liệu bằng 75

Tính tổng bình phương số liệu: Bấm phím: SHIFT S-SUM 1 = (kết quả: ) tổng bình phương số liệu bằng 577

Tính giá trị trung bình: Bấm phím: SHIFT S-VAR 1 = (kết quả: )  x = 7,5

Tính độ lệch chuẩn: Bấm phím: SHIFT S-VAR 2 = (kết quả: )

- Khi khai báo 6 SHIFT ; 2 DT, nghĩa là khai báo giá trị x1 = 6 có tần số là 2

- Nếu bấm phím thì màn hình hiện ra Freq5 = 1, nghĩa là tần số của số liệu thứ 5 (x = 10) là 1

- Bấm tiếp phím: Màn hình hiện ra x5 = 10, nghĩa là số liệu thứ 5 có giá trị là

10

Tương tự, sử dụng phím, ta có thể kiểm tra tất cả các dữ liệu được đưa vào

đã đúng hay chưa và chúng có tần số là bao nhiêu

- Có thể tham khảo phụ lục 2 đối với các loại máy tính khác

3.2 KHÁI NIỆM ƯỚC LƯỢNG ĐIỂM

3.2.1 Khái niệm ước lượng

Giả sử khi nghiên cứu ĐLNN X và biết được phân phối của X thuộc một họ phân phối nào đó (chẳng hạn biết X có phân phối chuẩn hoặc biết X có phân phối Poisson, nhưng lại không biết các tham số) Muốn xác định hoàn toàn phân phối của X ta phải xác định được các giá trị tham số của phân phối đó

Trong trường hợp chưa biết gì về phân phối của ĐLNN X thì việc biết được các giá trị đặc trưng của X cũng cho ta biết được nhiều thông tin Chính vì vậy, việc đi tìm

Trang 13

các ƣớc lƣợng cho các tham số của phân phối hoặc ƣớc lƣợng cho các giá trị đặc trƣng của X là rất cần thiết

Giả sử mẫu ngẫu nhiên (X1 , X2 , , Xn) có tập giá trị (mẫu quan sát hay mẫu cụ thể)

là (x1 , x2 , , xn)

Định nghĩa: Một hàm của mẫu ngẫu nhiên:

T = T(X1 , X2 , , Xn)

xác định trên tập các giá trị của mẫu ngẫu nhiên đƣợc gọi là một thống kê

Nhƣ vậy mỗi thống kê cũng là một đại lƣợng ngẫu nhiên

Khi cho mẫu cụ thể (x1 , x2 , , xn) thì giá trị của T đƣợc xác định bởi:

T = T(x1 , x2 , , xn)

Ví dụ 1: X , S2 , s2 là những thống kê

Trên thực tế các tham số của tổng thể nhƣ:  , 2, p là không biết, vì ta không thể nào

đi khảo sát hết tất cả các phần tử của tổng thể Tuy nhiên nhiều bài toán thực tế chúng

ta cần phải ƣớc lƣợng chúng Việc ƣớc lƣợng các tham số dựa trên một mẫu thống kê (X1 , X2 , , Xn) đƣợc gọi là bài toán ước lượng tham số

3.2.2 Ƣớc lƣợng điểm

Để xác định hoàn toàn phân phối của X, ta phải xác định đƣợc các giá trị của 

mà phân phối đó nhận

Dựa vào các thông tin thu đƣợc từ một mẫu cụ thể (x1 , x2 , , xn) của X, ta tìm một thống kê $(x1 , x2 , , xn) "đủ tốt” để thay thế tham số  chƣa biết (hay ƣớc lƣợng  bằng $) đƣợc gọi là bài toán ước lượng điểm của

Ví dụ 2:

X có phân phỗi chuẩn N( , 2) nhƣng , 2

bằng bao nhiêu chƣa biết Ta cần ƣớc lƣợng tham số  = (,2

Trang 14

Ý nghĩa: Ta thấy E($ -  ) = 0, tức là trung bình của độ lệch (sai số) giữa các ƣớc lƣợng với giá trị thật bằng 0

Ví dụ 4: Cân 100 sản phẩm của xí nghiệp ta có bảng

Theo nhận xét trên ta dự đoán (ƣớc lƣợng) trọng lƣợng trung bình của sản phẩm trong

xí nghiệp là  = 502,8 (gr)

Trang 15

- Trung bình mẫu X là ước lượng vững của trung bình tổng thể 

- Phương sai mẫu hiệu chỉnh s2 là ước lượng vững của phương sai tổng thể

3.3 ƯỚC LƯỢNG KHOẢNG

3.3.1 Bài toán ước lượng khoảng

Giả sử cần ước lượng tham số  của biến ngẫu nhiên gốc X Từ tổng thể lập mẫu ngẫu nhiên kích thước n:

W = (X1 , X2 , X3 , , Xn) với mẫu cụ thể là: w = (x1 , x2 , , xn)

Với xác suất 1 –  cho trước, ta cần tìm các thống kê 1 và 2 sao cho:

P1   2 = 1 – trong đó:

Trang 16

 γ = 1 –  được gọi là độ tin cậy của ước lượng

  được gọi là mức ý nghĩa, đánh giá mức độ sai lầm khi ước lượng

 ( 1 , 2) được gọi là khoảng tin cậy của ước lượng

 2 = 2 - 1 được gọi là độ dài của ước lượng

  được gọi là độ chính xác của ước lượng

Bài toán ước lượng khoảng với độ tin cậy 1 –  còn được gọi là bài toán tìm

khoảng tin cậy với độ tin cậy 1 –

Để làm điều đó quy tắc chung như sau:

Đầu tiên tìm một thống kê GG(x , x , , x , )1 2 n  sao cho phân phối của G xác định hoàn toàn (không chứa tham số  nữa)

Khi đó với độ tin cậy 1     cho trước, ta tìm cặp giá trị 1 và 2 sao cho

3.3.2 Khoảng tin cậy cho kỳ vọng

Trước khi đi vào tìm khoảng tin cậy cho kỳ vọng tổng thể, ta nhắc lại kiến thức

Trang 17

Giả sử X ~ N( , 2) nhưng chưa biết tham số EX =  của nó

Muốn ước lượng kỳ vọng EX = , ta lập mẫu ngẫu nhiên (X1 , X2 , , Xn) được sinh từ biến ngẫu nhiên gốc X, có tập giá trị là (x1 , x2 , , xn)

Để xác định được khoảng tin cậy cho kỳ vọng EX = , ta cần xác định thống kê

1 và 2 sao cho:

P{θ1 < θ < θ2} = 1 –  ( ở đây  =  )

Ta xét 2 trường hợp sau:

a) Bài toán 1: Phương sai VX = 2

của biến X đã biết

Để ước lượng khoảng cho kỳ vọng EX =  với độ tin cậy 1 – , ta chọn thống kê:

Như vậy với độ tin cậy 1   cho trước ta sẽ có vô số cặp 1 và 2, tương ứng với vô

số khoảng tin cậy Ta xét một số trường hợp đặc biệt:

* Khoảng tin cậy đối xứng (ứng với 1 2

2

    ) là:

Trang 18

( x - ; x +  ) hoặc viết  = x ± 𝜀 trong đó:

trong đó:  u   1 , tra bảng Laplace  uα = ?

hoặc dựng hàm trong Excel: uα = NORMSINV(1 - α)

* Khoảng tin cậy phải (ứng với     1 0, 2 ) là: ( xu

- Khoảng tin cậy cho kỳ vọng tổng thể: ( x - ; x +  )

Tương tự như vậy đối với quy tắc tìm khoảng tin cậy trái và khoảng tin cậy phải cho

kỳ vọng

Ví dụ 1: Trọng lượng của một loại sản phẩm là biến ngẫu nhiên có phân phối

chuẩn với độ lệch tiêu chuẩn là 1 gam Cân thử 25 sản phẩm loại này, thu được kết quả sau:

Trọng lượng (gam) 18 19 20 21

Số sản phẩm tương ứng 3 5 15 2

Với độ tin cậy 95%, hãy ước lượng khoảng:

Trang 19

a) Trọng lƣợng trung bình của 1 sản phẩm;

b) Trọng lƣợng trung bình tối thiểu của một sản phẩm

Giải:

Gọi  là trọng lƣợng trung bình của sản phẩm, ta cần ƣớc lƣợng khoảng tin cậy của 

Trọng lƣợng trung bình của mẫu 25 sản phẩm: x = 19,64

a) Khoảng tin cậy đối xứng cho trọng lượng trung bình sản phẩm

Với độ tin vậy 95% ta tìm đƣợc

Vậy trọng lƣợng trung bình của một sản phẩm khoảng từ 19,248 đến 20,032 gam

b) Khoảng tin cậy phải cho trọng lượng trung bình sản phẩm

Với độ tin vậy 95% ta tìm đƣợc u nhƣ sau:

b) Bài toán 2: Phương sai VX = 2

của biến X chưa biết

Trang 20

Đầu tiên ta phải ước lượng 2

bằng phương sai mẫu hiệu chỉnh, sau đó chọn

P( t     T t )    1

Tương tự như bài toán 1, ta xét một số khoảng tin cậy đặc biệt:

* Khoảng tin cậy đối xứng là: ( x - ; x +  ) hoặc viết  = x ± 𝜀

trong đó:

  =

2

s t

hoặc dùng hàm trong Excel: t= TINV(, n - 1)

* Khoảng tin cậy phải là: (x s .t

n 

 ; )

Chú ý:

1) Nếu X không có phân phối chuẩn, thì cỡ mẫu phải lớn hơn 30

2) Nếu n > 30 thống kê T sẽ có phân phối tiệm cận chuẩn N(0; 1), do đó ta có thể thay

thế: tα = uα , tα/2 = uα/2

Quy tắc tìm khoảng tin cậy đối xứng cho kỳ vọng (2

chưa biết)

- Từ mẫu cụ thể tính x, s

Trang 21

n 

 

- Khoảng tin cậy cho kỳ vọng tổng thể: (x-  ; x +  )

Tương tự như vậy đối với quy tắc tìm khoảng tin cậy trái và khoảng tin cậy phải cho

kỳ vọng

Ví dụ 2: Ở một cửa hàng chế biến thủy sản, theo dõi lượng nước mắm bán ra

trong một số ngày, người ta ghi được bảng số liệu sau

Số lượng bán ra (lít)

a) biết phương sai 2

= 132,25;

b) chưa biết phương sai

Trang 22

= 3,6429

Trang 23

Khoảng tin cậy là: (x    ; x ) 49,3404; 50,7397

Vậy với độ tin cậy 95% một bao xi măng bán trên thị trường có trọng lượng từ 49,3403 đến 50,7397 (kg)

Ví dụ 4: Đo đường kính của 20 trục máy do một máy tiện tự động sản xuất ra, ta

Giải:

Tổng thể là toàn bộ trục máy do máy tiện sản xuất

Ta cần ước lượng đường kính trung bình  của tổng thể với độ tin cậy 95% và kích thước mẫu n ≤ 30, chưa biết phương sai

Từ dữ liệu mẫu, ta tính được:

X= 251,7 ; s = 7,2670

Trang 24

Vì α = 0,05 tra bảng phân phối Student dòng 19, cột 0,975 ta được

Vậy:  = 251,7  3,401 (mm)

c) Bài toán 3: tìm kích thước mẫu, độ tin cậy của ước lượng

Trường hợp 1: Xác định kích thước mẫu n tối thiểu để độ chính xác của ước lượng

2

s u

 

không vượt quá số 0 cho trước?

Có nghĩa ta cần xác định n sao cho:

2 0

- Do s lại phụ thuộc vào n, để khắc phục điều này ta lấy một mẫu sơ bộ (x 1 , x 2 , ,

x m ) với kích thước m > 30 nào đó và tính s theo mẫu đó Chúng ta có thể lấy

ngay mẫu mà trong đề bài đã cho

- Trong công thức xác định n trên, nếu đã biết thì ta thay độ lệch mẫu s bởi

Trường hợp 2: Cho biết độ chính xác của ước lượng và trung bình mẫu x Xác

định độ tin cậy của ước lượng

Từ công thức

2

s u

  , ta suy ra:

2

nu

Trang 25

Ví dụ 5: Trọng lượng của một hộp sữa do một dây chuyền tự động đóng gói

tuân theo luật phân phối chuẩn với độ lệch chuẩn là 10 (gr) Cần phải lấy mẫu kích thước n tối thiểu bằng bao nhiêu để với độ tin cậy 95% sai số của ước lượng không vượt quá 2 (gr)

Vậy cần chọn tối thiểu 97 hộp sữa

Ví dụ 6: Để nghiên cứu nhu cầu một loại mặt hàng ở một khu vực (đơn vị:

kg/tháng), người ta tiến hành khảo sát về nhu cầu mặt hàng này ở 400 hộ gia đình Kết quả khảo sát cho ở bảng sau:

Nhu cầu <1 1-2 2-3 3-4 4-5 5-6 6-7 7-8

Giả sử khu vực này có 4000 hộ

a) Ước lượng nhu cầu trung bình về mặt hàng này của toàn khu vực trong một năm với độ tin cậy 95%

b) Khi ước lượng nhu cầu trung bình về mặt hàng này của toàn khu vực trong một năm, nếu ta muốn độ tin cậy đạt được 99% và độ chính xác là 4,8 tấn thì cần khảo sát về nhu cầu này ở bao nhiêu hộ gia đình

Giải:

a) Gọi M là nhu cầu trung bình về mặt hàng này của toàn khu vực trong một năm,

là nhu cầu trung bình về mặt hàng này của một hộ trong một tháng

Trước hết ta tìm khoảng tin cậy của :

Trang 26

Suy ra khoảng tin cậy cho M là:

Gọi m là số hộ gia đình cần khảo sát về nhu cầu của mặt hàng này, khi đó

1 0

Vậy số hộ cần khảo sát là 1381 hộ

Ví dụ 7: Sai số đo của một loại dụng cụ đo có phân phối chuẩn với độ lệch chuẩn

bằng 20 Cần phải tiến hành bao nhiêu phép đo độc lập để sai số phạm phải không vượt quá 5 với độ tin cậy 90%?

5 + 1 = 44

Cần tiến hành 44 phép đo độc lập

3.3.3 Khoảng tin cậy cho phương sai

Ta đã biết một đại lượng ngẫu nhiên Z ~2(n), với độ tin cậy 1  cho trước, tìm được giá trị phân vị 2

n( )

  sao cho:

Trang 27

1 2( ; ) sao cho:

P(       ) 1

Để giải bài toán trên, ta xét hai trường hợp sau:

a) Bài toán 1: Biết trước kỳ vọng của tổng thể

Giả sử (X1, X2, , Xn) là mẫu tổng quát từ X ~  2

Trang 28

- Với độ tin cậy 1  ta tìm các giá trị phân vị: 2n(12),2n( )2

Khi đó: khoảng tin cậy hai phía cho phương sai 2 của tổng thể là

Trang 29

b) Bài toán 2: Kỳ vọng EX = chưa biết

Xây dựng khoảng tin cậy dựa trên các thống kê sau:

 2 có phân phối khi bình phương (n-1) bậc tự do

Bằng cách xây dựng như trên, tra có quy tắc tìm khoảng ước lượng hai phía cho

phương sai trong trường hợp chưa biết kỳ vọng :

- Từ mẫu cụ thể (x1, x2, , xn) ta tính giá trị: 2

(n 1)s

- Với độ tin cậy 1  ta tìm các giá trị phân vị: 2n 1 (12),2n 1 ( )2

Khi đó: khoảng tin cậy hai phía cho phương sai 2 của tổng thể là

Ví dụ 8: Theo dõi số hàng bán được mỗi ngày ở một trung tâm thương mại, ta

được kết quả ghi ở bảng sau:

Số hàng bán được (kg/ngày) Số ngày

Trang 30

Giải:

Ta lập bảng để tính s2

và thu đƣợc: s2 = 2058,333 Với độ tin vậy 95% thì:

Ví dụ 9: Cho khối lƣợng một loại sản phẩm tuân theo luật phân phối chuẩn

Cân thử từng sản phẩm của một mẫu ngẫu nhiên gồm 25 sản phẩm, kết quả thu đƣợc nhƣ sau:

Hay 0,1262 ; 0,391

Trang 31

b) Sử dụng máy tính điện tử tính đƣợc: s = 0,4621688, s2

=0,2136 Với độ tin vậy 95% thì:

Ví dụ 10: Theo dõi số hàng bán đƣợc trong một ngày ở một cửa hàng, ta đƣợc

kết quả ghi ở bảng sau:

3.3.4 Khoảng tin cậy cho tỷ lệ

a) Bài toán tìm khoảng tin cậy

Giả sử tổng thể có N phần tử, trong đó có M phần tử mang dấu hiệu nghiên cứu (phần tử có tính chất A)

Trang 32

được gọi là tần suất mẫu xuất hiện dấu hiệu cần nghiên cứu

Khi kích thước mẫu n khá lớn thì ta có thể xấp xỉ f p

Quy tắc: tìm khoảng ước lượng đối xứng cho tỷ lệ của tổng thể

- Từ mẫu cụ thể tính f =

n

m

Trang 33

* Khoảng tin cậy phải: f 1 f 

  , với  là độ chính xác của ước lượng

Ví dụ 11: Để ước lượng số hải cẩu trên một hòn đảo người ta đánh dấu cho

2000 con Sau một thời gian bắt lại 400 con thấy có 80 con có đánh dấu Hãy ước lượng số hải cẩu có trên đảo với độ tin cậy là 95%

8362 N 12438

Ví dụ 12: Trước ngày bầu cử tổng thống, người ta phỏng vấn ngẫu nhiên 1800 cử

tri thì thấy có 1180 người ủng hộ ứng cử viên A Với độ tin cậy 95%, hãy ước lượng tỷ

lệ cử tri ủng hộ ứng cử viên A bằng khoảng tin cậy đối xứng?

Trang 34

Giải:

Tổng thể là toàn bộ số cử tri cả nước, các phần tử của tổng thể gồm hai loại: ủng hộ và không ủng hộ ứng cử viên A

Gọi p là tỷ lệ các phần tử ủng hộ ứng cử viên A của tổng thể

Với độ tin cậy 95%, ta cần ước lượng tỉ lệ p ?

Ta có mẫu gồm 1800 phần tử, trong đó có 1180 phần tử ủng hộ ứng cử viên A nên tỉ lệ mẫu là:

= 0,022

Do đó tỉ lệ tổng thể ủng hộ ứng cử viên A là:

p = 0,6556  0,022 hay 0,6336  p  0,6776

Ví dụ 13: Người ta bắt được 1500 con thú, đánh dấu rồi thả lại vào rừng Sau một

thời gian bắt lại 360 con thì thấy có 27 con bị đánh dấu Hãy ước lượng số thú trong rừng với độ tin cậy 99%

Giải:

Tổng thể là toàn bộ thú trong rừng Số phần tử của tổng thể là N chưa biết nhưng được chia thành hai loại: bị đánh dấu và không bị đánh dấu

Số phần tử bị đánh dấu của tổng thể là M = 1500 đã biết

Do đó để tìm N, ta ước lượng tỉ lệ p các phần tử bị đánh dấu của tổng thể với độ tin cậy 99%

Ta có số phần tử của mẫu là n = 360, trong đó số phần tử bị đánh dấu là k = 27

Trang 35

1108,0

1500  N 

0392,01500

hay 13538  N  38265

Kết luận: với độ tin cậy 99% số thú hiện có trong rừng là từ 13538 đến 38265 con

b) Bài toán xác định kích thước mẫu, độ tin cậy của ước lượng

Bài toán 1: Xác định kích thước mẫu n tối thiểu để độ chính xác của ước lượng

2

f (1 f )u

n

 

không vượt quá số 0 cho trước?

Có nghĩa ta cần xác định n sao cho:

2 /2 2

0

f (1 f )

n  u

Vậy n được xác định bằng công thức

2 /2 2

trong đó [.] là phần nguyên

Chú ý: Trong công thức trên f lại phụ thuộc vào n, để khắc phục điều này ta

thực hiện lấy mẫu sơ bộ nào đó với kích thước đủ lớn và tính f theo mẫu đó Chúng ta có thể lấy ngay mẫu mà trong bài đã cho

Bài toán 2: Cho biết độ chính xác của ước lượng  và tỷ lệ mẫu f Xác định độ tin cậy của ước lượng?

Từ công thức:

Trang 36

nu

f (1 f )

  

 , suy ra độ tin cậy của ước lượng:

Ví dụ 14: Phòng cảnh sát giao thông muốn ước lượng tỷ lệ xe chở quá tải với độ

tin cậy 95% và sai số không vượt quá 5% thì cần phải kiểm tra tối thiểu bao nhiêu lượt

xe chạy trên đường Biết một mẫu điều tra sơ bộ kiểm tra 400 xe thấy có 40 xe chở quá tải

Như vậy số xe tối thiểu cần kiểm tra là 369 chiếc

Ví dụ 15: Ở một vùng, khi khám bệnh cho bệnh nhân, người ta thấy tỉ lệ mắc

bệnh tai mũi họng là 15% Để ước lượng xác suất mắc bệnh tai mũi họng của vùng đó với độ tin cậy 95% và sai số không vượt quá 2% thì cần khám tối thiểu bao nhiêu người ?

Giải:

Theo đề bài ta có:

- tỉ lệ mắc bệnh của mẫu ban đầu là f = 0,15

- độ tin cậy 1 – α = 95% nên uα/2 = 1,96

- sai số của ước lượng, hay độ chính xác là  0,02

Vậy mẫu cần tìm phải có số phần tử

02,0

)15,01(.15,0.96,1

+ 1 = 1225

Do đó, tối thiểu cần khám cho 1225 người

Trang 37

Ví dụ 16: Lô trái cây của một chủ hàng được đóng thành từng sọt, mỗi sọt 100

trái Kiểm tra 50 sọt người ta thấy có 450 trái không đạt tiêu chuẩn

a) Với độ tin cậy 95%, hãy ước lượng tỉ lệ trái cây không đạt tiêu chuẩn của lô hàng đó?

b) Muốn ước lượng tỉ lệ trái cây không đạt tiêu chuẩn với độ chính xác 0,5% thì

độ tin cậy đạt được là bao nhiêu ?

c) Muốn ước lượng tỉ lệ trái cây không đạt tiêu chuẩn với độ tin cậy 99% và độ chính xác 1% thì cần kiểm tra bao nhiêu sọt ?

Giải:

a) Tổng thể là toàn bộ trái cây của lô hàng

Gọi p là tỉ lệ trái cây không đạt tiêu chuẩn của tổng thể

Ta cần ước lượng p với độ tin cậy 95%

Với độ tin cậy 1 – α = 0,95, tra bảng hàm số Laplace, ta tìm được uα/2 = 1,96

Từ đó, sai số của ước lượng:

 = 1,96

5000

)09,01.(

09,

= 0,0079

 tỉ lệ trái không đạt tiêu chuẩn của lô hàng là

p = 0,09  0,0079 hay

f 

suy ra:

Trang 38

uα/2 = 

) f 1 ( f

 = 1 – α = 2  (uα/2 ) - 1 = 2  (1,24) - 1= 2 * 0,8925 – 1 = 0,785

Kết luận: độ tin cậy đạt được là 78,5%

c) Ta cần tìm kích thước mẫu mới khi biết: độ tin cậy  = 99%, độ chính xác  = 1% và

tỉ lệ mẫu ban đầu f = 0,09

Khi đó uα/2 = 2,58 Do đó

01,0

91,0.09,0.58,2

+ 1 = 55

Trang 39

a) Lập bảng phân phối tần số thực nghiệm, tần suất thực nghiệm

b) Tính trung bình mẫu, phương sai mẫu và phương sai mẫu hiệu chỉnh 3.2 Số liệu về thời gian đợi phục vụ của 30 khách hàng tại một ngân hàng (tính bằng phút) cho như sau:

4,6 9,8 5,6 7,7 4,0 6,5 2,9 4,4 4,0 5,7

10,9 4,5 1,4 2,4 8,6 4,7 6,7 7,8 9,2 4,2

5,2 5,0 5,8 3,2 4,3 8,4 7,2 3,4 6,5 2,2

a) Lập bảng phân phối tần số thực nghiệm lớp ghép

b) Tính trung bình mẫu, phương sai mẫu và phương sai mẫu hiệu chỉnh 3.3 Điều tra trọng lượng của một loại sản phẩm (đơn vị: gam), kết quả như sau:

Cân nặng 5 – 10 10 – 15 15 – 20 20 – 25 25 – 30 30 - 35

Số con 5 10 20 30 15 10 Những sản phẩm có trọng lượng lớn hơn 15 gam là loại 1

Tính trung bình mẫu, phương sai mẫu, phương sai mẫu hiệu chỉnh của các sản phẩm loại 1

3.4 Điểm thi môn Toán của sinh viên một lớp được ghi trong bảng sau:

Hãy tính các đặc trưng mẫu

3.5 Điều tra năng suất lúa của một vùng, ta có bảng số liệu sau

Năng suất lúa (tạ/ha) 41 44 45 46 48 52 54 Diện tích có năng suất lúa tương ứng (ha) 10 20 30 15 10 10 5 Hãy tính các đặc trưng mẫu

Trang 40

3.6 Để nghiên cứu nhu cầu mua gạo ở một thành phố, người ta tiến hành điều tra một số gia đình và ghi kết quả ở bảng sau đây

Nhu cầu (kg/tháng) Số gia đình Nhu cầu Số gia đình

b) Tính tỉ lệ mẫu có nhu cầu trên 60kg/tháng

3.7 Số liệu sau đây là số kĩ sư đến thực tập tại một công ty trong vòng một năm ở các xí nghiệp khác nhau

3.8 Để nghiên cứu tuổi thọ của một loại bóng đèn, người ta thắp thử 100 bóng và có

Ngày đăng: 28/06/2021, 20:18

🧩 Sản phẩm bạn có thể quan tâm