1. Trang chủ
  2. » Giáo Dục - Đào Tạo

phương pháp thống kê toán học đậu xuân thoan

33 497 2

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 33
Dung lượng 2,31 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

MẪU NGẪU NHIÊN 1.1 Khái niệm về mẫu ngẫu nhiên: Giả sử ta cần xem xét một đặc điểm hay một tính chất T, trên tất cả các phần tử củamột tập hợp X.. Trong trườnghợp này, ta phải chọn ra mộ

Trang 1

PHƯƠNG PHÁP THỐNG KÊ TOÁN HỌC

1 MẪU NGẪU NHIÊN

1.1 Khái niệm về mẫu ngẫu nhiên:

Giả sử ta cần xem xét một đặc điểm hay một tính chất T, trên tất cả các phần tử củamột tập hợp X Có hai khả năng ta giải quyết:

Một là, số lượng phần tử N của X là hữu hạn và khá bé, ta có thể thực hiện phép thử

để nghiên cứu trên toàn bộ N phần tử, việc nghiên cứu diễn ra bình thường

Hai là, số lượng phần tử N của X hữu hạn nhưng rất lớn, hoặc số lượng phần tử của

X là vô hạn, ta không thể thực hiện phép thử trên tất cả các phần tử của X Trong trườnghợp này, ta phải chọn ra một bộ phận để nghiên cứu ta gọi la tập hợp mẫu, từ việcnghiên cứu trên nhiều tập hợp mẫu ta khái quát và quy nạp cho tất cả các phần tử của X

- Tập hợp tổng quát:

Tập hợp X bao gồm các đối tượng (hay gọi là phần tử) có bản chất nào đó, mà tađang cần nghiên cứu một tính chất T trên tất cả các phần tử của X Ta gọi X là tập hợptổng quát

…, n một cách ngẫu nhiên thì ta coi Xi như là một biến ngẫu nhiên, khi đó bộ (X1, X2,

X3, … , Xn ) được gọi là mẫu ngẫu nhiên cỡ n

Mẫu ngẫu nhiên cỡ n là một dãy n biến ngẫu nhiên độc lập (X 1 , X 2 , X 3 , … , X n ) có cùng phân phối xác suất.

Trong quá trình nghiên cứu, chỉ lấy một mẫu ra nghiên cứu có kết quả, mà đem kếtquả đó kết luận phủ lên tất cả các phần tử của tập tổng quát thì nhiều khi không đảmbảo độ chính xác khoa học Vì vậy người ta thường dùng nhiều mẫu để xem xét nghiêncứu, hy vọng ta có khái niệm về không gian mẫu sau đây

- Không gian mẫu:

Tập hợp tất cả các mẫu ngẫu nhiên rút ra từ tập hợp tổng quát để nghiên cứu gọi làkhông gian mẫu Ta dùng ký hiệu ΩM để chỉ không gian mẫu

1.2 Phương pháp chọn mẫu:

Việc chọn mẫu phải đảm bảo tính “tiêu biểu”, tính “đại diện”, bộc lộ được “đặctrưng” của tất cả các phần tử của tập tổng quát X cần nghiên cứu Thông thường người

ta dùng các phương pháp chọn mẫu sau đây

a/ Chon mẫu ngẫu nhiên đơn giản hoàn lại:

Giả sử tập X có N phần tử, ta làm N cái thăm ghi chỉ số của mỗi phần tử, bỏ vào hộpkín và bốc ngẫu nhiên một cách vô tư lần thứ nhất ra một thăm, gọi phần tử ứng vớithăm đó là X1 Sau đó bỏ thăm trở lại hộp và bốc lần thứ hai được phần tử X2 Tiếp tụcnhư vậy đến lần thứ n ta có phần tử Xn Sau n lần chọn ta có mẫu (X1, X2, X3, … , Xn)

cỡ n Chú ý rằng nếu N phần tử của X đồng khả năng thì xác suất lấy được mỗi phần tửbằng

N

1

Trang 2

b/ Chọn ngẫu nhiên đơn giản không hoàn lại:

Cách chọn bằng hộp thăm như trường hợp trên, chỉ khác một điều là khi bốc được thăm nào ta bỏ ra ngoài luôn chứ không trả lại hộp nữa Chú ý rằng nếu N phần tử của

X đồng khả năng thì xác suất lấy được mỗi phần tử khác nhau, phần tử thứ nhất có xác suất bằng

N

1

[tức là P (X1) =

N

1 ], phần tử thứ hai có xác suất bằng

1

1

N [tức là P(X2)

=

1

1

N ], … , xác suất phần tử thứ n là

n

N

1 [tức là P (Xn) =

n

N

1 ]

Mẫu chọn được (X1, X2, X3, … , Xn) cỡ n là mẫu không hoàn lại

c/ Chọn mẫu theo phương pháp cơ học:

Tập tổng quát X có vô hạn phần tử, việc chọn như trên là rất khó khăn, bằng phương pháp cơ học ta chia ngẫu nhiên tập X ra thành m tập con phân biệt (có thể dùng máy phân tán tập X không phụ thuộc chủ quan người nghiên cứu), gọi các tập con là A1, A2,

A3, … , Am Trong mỗi tập Ai , i=1, 2, 3, … , m ta chọn mầu ngầu nhiên đơn giản

(Xi1, Xi2, … , Xin ), i=1,2,3, … , m cỡ mẫu n

Tổ hợp các mẫu bộ phận ta có mẫu





mn m3

m2 m1

2n 23

22 21

1n 13

12 11

X

X X X

X

X X X X

X X X là một ma trận cấp m.n d/ Chọn mẫu theo một đặc trưng ( hay điển hình ): Ta phân chia tập tổng quát X dựa vào một đặc trưng nào đó, thành m tập con phân biệt A1, A2, A3, … , Am Trong mỗi tập Ai , i=1,2,3, … , m ta chọn mầu ngầu nhiên đơn giản (Xi1, Xi2, … , Xin ), i=1,2,3, … , m cỡ mẫu n Tổ hợp các mẫu bộ phận ta có mẫu             mn m3 m2 m1 2n 23 22 21 1n 13 12 11 X

X X X

X

X X X X

X X X là một ma trận cấp m.n e/ Chọn mẫu theo tính chất dãy (sê ry): Ta phân chia tập tổng quát X dựa vào tính chất phân dãy nào đó, thành m dãy phân biệt {A1}, {A2}, {A3}, … , {Am} Trong mỗi dãy {Ai} , i=1,2,3, … , m ta chọn mầu ngầu nhiên đơn giản (Xi1, Xi2, … , Xin ) , i=1,2,3, … , m cỡ mẫu n Tổ hợp các mẫu bộ phận ta có mẫu             mn m3 m2 m1 2n 23 22 21 1n 13 12 11 X

X X X

X

X X X X X

X

X

là một ma trận cấp m.n

1.3 Mã hóa bằng số cho mẫu và ghi số liệu mẫu:

- Khi đã chọn được mẫu ngẫu nhiên (X1, X2, X3, … , Xn ), hay mẫu ngẫu nhiên (Xi1, Xi2,

… , Xin ) , i=1,2,3, … , m Ta xem các Xi hay các Xi j , i=1,2,3, … , m, j=1,2,3, … , n như là những biến ngẫu nhiên, mã hóa bằng những giá trị bằng số thực mà nó nhận, ta

ký hiệu giá trị của Xi = xi và Xi j = xi j Từ nay về sau nói cho mẫu ngẫu nhiên kể như cho giá trị mẫu bằng các số thực

- Việc ghi chép số liệu mẫu có thể trình bày theo nhiều cách khác nhau, tùy theo đặc điểm công việc nghiên cứu, có một số cách ghi chép sau đây

Trang 3

a/ Ghi số liệu thành một dãy số, ma trận số:

+ Đối với mẫu (X1, X2, X3, … , Xn ), ta ghi số liệu thành dãy số (x1, x2, x3, … , xn ) Khi cần thiết phân biệt, ta sắp theo thứ tự từ nhỏ đến lớn hoặc từ lớn đến nhỏ Chẳng hạn

xk1 < xk2 < … < xkn là việc sắp từ nhỏ đến lớn

+ Đối với mẫu mẫu





mn m3

m2 m1

2n 23

22 21

1n 13

12 11

X

X X X

X

X X X X

X X X , ta ghi số liệu thành bảng số dạng một ma trận số gồm m hàng n cột             mn m3 m2 m1 2n 23 22 21 1n 13 12 11 x

x x x

x

x x x x

x x x , biến ngẫu nhiên Xij nhận giá trị xij Nhiều khi người ta không thể hiện rõ ma trận, nhưng số liệu được ghi thành bảng theo hàng - cột, ta đọc hiểu được và xem như một ma trận vậy b/ Ghi số liệu theo dạng bảng tần số, tần suất: - Ta lập bảng số liệu ở dạng bảng tần số, với x1 < x2 < … < xn , tần số tương ứng là t1, t2, t3, … , tn thì ghi chép theo bảng tần số như sau Giá trị xi x1 x2 x3 ……… xn Tần số ti t1 t2 t3 ……… tn - Từ bảng tần số ta lập bảng số liệu ghi kết hợp biểu thị tần suất như sau Giá trị khác nhau của các xi Tần số ti Tần suất Wi = n t i Tổng dồn tần suất ∑W i x1 x2 x3 xn t1 t2 t3 tn W1 =

n t1 W2 = n t2 W3 = n t3 ………

Wn = n t n W1 W1 + W2 W1 + W2 + W3 ………

∑ = n i i W 1 = 1 Tổng n = ∑ = n i i t 1 1 Ví dụ 1: Cho mẫu ngẫu nhiên nhận các giá trị là dãy số 3 3 2 1 1 5 5 6 6 6 8 9 4 6 6 7 5 7 3 3 Sắp xếp các giá trị từ nhỏ đến lớn:

Có hai lần nhận giá trị 1, Có một lần nhận giá trị 2, Có bốn lần nhận giá trị 3

Có một lần nhận giá trị 4, Có ba lần nhận giá trị 5, Có năm lần nhận giá trị 6

Có hai lần nhận giá trị 7, Có một lần nhận giá trị 8, Có một lần nhận giá trị 9

Trang 4

Bảng tần số là

Các giá trị xi 1 2 3 4 5 6 7 8 9Tần số ni 2 1 4 1 3 5 2 1 1

413 5211

20

2 = 0,1000

20

1 = 0, 0500

20

4 = 0,2000

20

1 = 0, 0500

20

3 = 0,1500

20

1 = 0, 0500

20

1 = 0, 0500

0,10000,15000,35000,40000,5500

0,80000,90000,95001,000

c/ Ghi số liệu ở dạng bảng số phân lớp (hay gọi là sự phân tổ thống kê)

Khi mẫu nhận giá trị khá đều với biên độ từ giá trị này đến giá trị khác khá hẹp, ta chiatập giá trị ra từng khoảng (xa, xb ) độ dài khoảng bằng h = (b – a) Thông thường người

ta chia theo công thức Sturges, tức là chia tập giá trị mẫu thành những khoảng có độ dài h bằng nhau, số khoảng chia tối ưu là 1+3,322.lg n và khoảng h =

nlg322,3

1+

Max x x

trong đó n là kích thước mẫu Lập bảng thể hiện như sau

Khoảng li = xi+1 -xi

i = 1,2,3,… , n Tần số n

i (sốgiá trị trongkhoảng)

nn

W1

W2

W3 …………

Wn

W1

W1 + W2

W1 + W2 + W3 ……… ∑

n = ∑

=

n i i

t

1

1

Trang 5

d/ Ghi số liệu dưới dạng biểu đồ, đồ thị:

Người ta dùng biểu đồ quạt, biểu đồ cột hình chữ nhật, biểu đồ ven để ghi lại số liệucủa mẫu Ngoài ra còn dùng đồ thị biểu diễn số liệu mẫu, mô tả đồ thị thực nghiệm củabiến ngẫu nhiên đang xét

2 HÀM PHÂN PHỐI VÀ CÁC ĐẶC TRƯNG

2.1 Hàm phân phối mẫu:

- Cho biến ngẫu nhiên X có phân phối F (x), thông thường khó xác định chính xác hàm

F nên người ta thường xét hàm F với một tham số θ ta viết F (x, θ ), ta cũng nói luôn

là X có phân phối F (x, θ )

Bây giờ cho mẫu ngẫu nhiên (x1, x2, x3,… , xn ) cỡ mẫu n, từ phân phối F (x, θ )

Ta gọi hàm phân phối mẫu (hay hàm phân phối thực nghiệm) là tỉ số F n (x) =

n

m

,

xR, trong đó m là số các số x i < x và n là kích thước mẫu.

- Tính chất của hàm phân phối mẫu:

T/c 1: 0 ≤ F n(x) ≤1, với mọi giá trị x∈R.

n

Lim =

T/c 5: Hàm phân phối mẫu F n(x) là hàm liên tục bên trái

Ví dụ 2: Cho mẫu quan sát của một biến ngẫu nhiên X như sau

Giá trị xi 2 5 7 8 Tần số ni 10 3 2 4

Hãy lập hàm phân phối mẫu, vẽ đồ thị của hàm phân phối mẫu

Giải:

Cỡ mẫu n = 10 + 3 + 2 + 4 = 19, biến ngẫu nhiên X nhận 4 giá trị là 2, 5, 7, 8

Hàm phân phối mẫu F n(x) =

<

=++

<

=+

<

8

119

42310

87

19

1519

2310

7x5 khi 19

1319

310

5x2 khi 1910

2 xkhi 0

khix

x khi

x

1

Trang 6

Nếu mẫu cho ở bảng tần số với các số x k 1 < x k 2 < … < x k m , chỉ số (km ) ≤ n

k

k t x

x

1 2

Nếu mẫu cho ở bảng tần số với các số x k 1 < x k 2 < … < x k m , chỉ số (km ) ≤ n

1 i i )(x k t k

=

ở đây tổng các tần số t k 1 + t k 2 + t k 3 + … + t k m = n

b/ Phương sai của mẫu.

Cho mẫu (x1, x2, x3…, xn ) cỡ n của biến ngẫu nhiên X có phân phối F (x, θ )

=

n k

=

n k

)(

=

n k

x là phương sai hiệu chỉnh của mẫu ngẫu nhiên

Ta có phương sai hiệu chỉnh S*2

c/ Mô men gốc bậc v, mô men trung tâm bậc v.

Cho mẫu (x1, x2, x3,…, xn ) cỡ n của biến ngẫu nhiên X có phân phối F (x, θ )

Cho mẫu (x1, x2, x3,…, xn ) cỡ n của biến ngẫu nhiên X có phân phối F (x, θ )

Ta sắp xếp các giá trị của mẫu theo thứ tự tăng dần x k 1 < x k 2 < … < x k m , chỉ số

Trang 7

- Nếu chỉ số n là chẵn tức là n = 2q , khi đó các giá trị xq-1 , xq , xq+1 chen vào trong dãy

số x k 1 < x k 2 < … < x k m , tức là có x k 1 < x k 2 < < xq-1 < xq < xq+1 < … < x k m Từ đâygiá trị trung vị xMe=

Cho mẫu (x1, x2, x3,…, xn ) cỡ n của biến ngẫu nhiên X có phân phối F (x, θ )

Ta biểu thị mẫu theobảng tần số với các số x k 1 < x k 2 < … < x k m , chỉ số (km ) ≤ n

) / i= 1, 2, 3, … , m, đạt tại điểm x k v thì giá trị xMod = x k v

Ví dụ 3: Cho mẫu quan sát của một biến ngẫu nhiên X như sau

Giá trị xi 2 5 7 8

Tầnsố ni 10 3 2 4

Tính trung bình mẫu X , phương sai mẫu S2

X , độ lệch chuẩn SX , trung vị, mod

19

1 469 ≈

19 6,5093 = 6,8709 Độ lệch chuẩn SX = 2

X

S = 6,5093 = 2,5513

Số trung vị mẫu ứng với giá trị thứ 10 trong mẫu, theo thứ tự đó (đếm theo hàng tần số

từ 1 đến 10) là x = 2 nên xMe = 2

Mốt của mẫu đạt tại giá trị có tần suất lớn nhất đó là x = 2, nên xMod = 2

Ví dụ 4: Chọn ngẫu nhiên 30 chi tiết máy của cùng một loại sản phẩm, đo độ dài của

chúng thu được số liệu sau: 39, 43, 41, 41, 40, 41, 43, 42, 41, 39, 40, 42, 44, 42, 42, 41,

41, 42, 43, 40, 41, 41, 42, 43, 39, 40, 41, 39, 40, 42

a/ Tìm các số đặc trưng của mẫu

b/ Lập bảng phân phối thực nghiệm

c/ Lập hàm phân phối xác suất

Trang 8

=

30 1 (6084+8000+15129+12348+7396+1936) = 30 1 50893 = 1696,4333333… S2 X = X2 - (X )2 = 1696,3333 – (41,17)2 = 1696,3333 – 1694,9689 = 1,3644 Độ lệch chuẩn là SX = 1,3644 = 1,1680753… ≈ 1,1681 Trung vị mẫu: xMe = 2 1 (x15 + x16) = 2 1 (41 + 41) = 41 (giá trị thứ 15 và thứ 16 trên bảng tần số đều bằng 41) Mốt của mẫu: xMod = 41 (vì tại giá trị 41 tần số cao nhất, nên tần suất lớn nhất) b/ Bảng phân phối thực nghiệm: xi 39 40 41 42 43 44

P (X=xi)

30 4

30 5

30 9

30 7

30 4

30 1 c/ Hàm phân phối mẫu: Từ câu b/ ta rút ngay hàm phân phối mẫu như sau F30 (x) =                     > = = + + + + + ≤ < = + + + + ≤ < = = + + + ≤ < = = + + ≤ < = = + ≤ < ≤ 44

1 30 30 30 1 30 4 30 7 30 9 30 5 30 4 44 43

30 29 30 4 30 7 30 9 30 5 30 4 43 42

6 5 30 25 30 7 30 9 30 5 30 4 42 41

15 9 30 18 30 9 30 5 30 4 41 40

10 3 30 9 30 5 30 4 40 39

30 4 39

0 x khi x khi x khi x khi x khi x khi x khi Ví dụ 5: Kiểm tra độ dài các chi tiết máy có số liệu cho ở bảng sau Độ dài mm 20-30, >30-40, >40-50, >50-60, >60-70, >70-80, >80-90, >90-100,>100 Số chi tiết 3 8 30 45 20 25 17 9 3

a/ Tính các đặc trưng X , S2 X , SX b/ Lập bảng phân phối thực nghiệm Giải: Số liệu cho ở khoảng, ta chuyển về bảng số liệu thu gọn bằng cách lấy giá trị trung bình của mỗi khoảng như sau Độ dài m m 25 35 45 55 65 75 85 95 105

Số chi tiết 3 8 30 45 20 25 17 9 3 a/ Cỡ mẫu n = 3+8+30+45+20+25+17+9+3 = 160

X =

160

1

(25.3+35.8+45.30+55.45+65.20+75.25+85.17+95.9+105.3) = 62,31

Trang 9

X =

160

1

(252.3+352.8+452.30+552.45+652.20+752.25+852.17+952.9+1052.3)= =

160 1

.670600 = 4191,25

S2

X = X2 - (X )2 = 4191,25 – (62,31)2 = 4191,25 – 3882,54 = 308,71

S*2

X =

1

n

n

S2

X = 159

160 308,7 = 310,65

Độ lệch chuẩn là SX = 308,71 = 17,5701

b/ Bảng phân phối thực nghiệm:

Giá trị xi 25 35 45 55 65 75 85 95 105

P(X=xi) 3/160 8/160 30/160 45/160 20/160 25/160 17/160 9/160 3/160 2.3 Hệ số tương quan của hai mẫu Trong thực tế nhiều khi ta nghiên cứu cùng một lúc hai hoặc nhiều biến ngẫu nhiên, mà các biến ngẫu nhiên ấy được xét trên cùng một đối tượng, có thể giữa chúng có một sự tương quan nhau Đối với hai biến ngẫu nhiên X và Y, có các số trung bình mẫuX , Y và các phương sai mẫu S2 X, S2 Y thì hệ số tương quan là số rXY = Y X S S 1 (XY - X Y) Ví dụ 6: Cho mẫu của cặp biến ngẫu nhiên (X,Y) theo số liệu là X 0 1 1 3 3 4

Y 3 3 4 4 5 5

Tìm hệ số tương quan rXY? Giải: Cỡ mẫu n = 6, để tính các đặc trưng của mẫu ta lập bảng sau X 0 1 1 3 3 4

Y 3 3 4 4 5 5

X.Y 0 3 4 12 15 20

X2 0 1 1 9 9 16

Y2 9 9 16 16 25 25

X = 6 1 (0+1+1+3+3+4) = 6 1 12 = 2, Y= 6 1 (3+3+4+4+5+5) = 6 1 24 = 4 2 X = 6 1 (02+12+12+32+32+42) = 6 1 (0+1+1+9+9+16) = 6 1 36 = 6 2 Y = 6 1 (32+32+42+42+52+52) = 6 1 (9+9+16+16+25+25) = 6 1 100 = 16,666666… XY = 6 1 (0+3+4+12+15+20) = 6 1 54 = 9 S2 X = X2 - ( X )2 = 6 – 22 = 6 – 4 = 2 ⇒ SX = 2 S2 Y = Y2 - (Y)2 = 6 1 100 - 42 = 6 4 = 3 2 ⇒ SY = 3 2 = 3 2 ⇒ Y X S S 1 = 2 3 Cuối cùng rXY = 2 3 ( 9 – 2 4 ) = 2 3 = 2 1 1,73205080756… = 0,86602540378… Ví dụ 7: Cho mẫu của cặp (X,Y) như sau, tính hệ số tương quan rXY X 1 2 3

Trang 10

3

11118

112224

149

114472Tổng theo

Giá trị của Y Tần số ni(Y) ni(Y) Y Giá trị của

Y2 ni(Y) Y22

3

4

101010

203040

4916

4090160Tổng theo

1.2.8 = 161.3.3 = 91.4.0 = 02.2.2 = 82.3.7 = 422.4.2 = 163.2.0 = 03.3.0 = 03.4.8 = 96

S2

X =X2 - ( X )2 =

30

1 127 - (

30

1 57)2 = (

30

1)2 (30.127 – 57.57) =

900

561 =0,623333…

Trang 11

Y =Y2 - (Y )2 =

30

1 290 – (

30

1 90 )2 = (

30

1)2 ( 290.30 – 90.90) =

3

2900

187(3

2

.187

1630

16.2.561

3

900 = = = 0,82734370 ≈ 0,83

3 ƯỚC LƯỢNG KHOẢNG TRONG THỐNG KÊ

3.1 Định nghĩa:

Trong thực tế độ chính xác việc lấy mẫu đạt mức độ nào đó, tùy thuộc vào khả năng

và trình độ người nghiên cứu

Cho mẫu (x1, x2, x3, … , xn ) cỡ n của biến ngẫu nhiên X có phân phối F (x, θ ),tham số θ Ta tìm khoảng (a, b) để xác suất rơi của tham số θ vào khoảng đó đạt một

độ chính xác hay còn gọi là độ tin cậy (1 - α ) cho trước.

Khoảng (a, b) được gọi là khoảng ước lượng của tham số θ với độ tin cậy (1 - α)

nếu có P (a < θ < b ) = (1 - α )

Dựa vào định nghĩa này ta tìm khoảng ước lượng của các tham số trong phân phốichuẩn, phân phối nhị thức

3.2 Khoảng ước lượng của kỳ vọng a trong phân phối chuẩn N(a, σ2 )

Biến ngẫu nhiên X có phân phối chuẩn dạng tổng quát N(a, σ 2 ) nếu hàm mật độcủa nó có dạng f (x) =

2 2

( - a)

2

12

x

e σπσ

( Ta tính được số a là kỳ vọng, σ 2 là phươngsai của X )

Đặc biệt khi kỳ vọng a = 0 và độ lệch chuẩn σ = 1 thì ta có phân phối N(0, 1) và

Cho mẫu (x1, x2, x3,…, xn ) cỡ n của biến ngẫu nhiên X có phân phối chuẩn

- Nếu biết trước phương sai σ 2 của biến ngẫu nhiên X, thì khoảng ước lượng kỳ vọng

a với độ tin cậy (1 - α ) là (X - xα

Trang 12

Với cỡ mẫu n <30 thì tα tra ở bảng phân phối Student (n – 1) bậc tự do mứcα bảng

tiêu chuẩn 2 phía Nhắc lại S*2

X =

1

n

n

S2

X ⇒ S*X =

1

n

n

SX để tính theo công thức trên

Ví dụ 8: Đo chiều cao của 100 sinh viên nam trong khóa học ta được:

- Chiều cao trung bình của họ là X = 163,28 cm

- Độ lệch mẫu S = 8,25 cm

Hãy tìm khoảng ước lượng chiều cao trung bình với độ tin cậy a/ 90% , b/ 95%

Giải:

Gọi X = (chiều cao nam sinh viên trong khóa học), cỡ mẫu n = 100 khá lớn nên ta dùng S*X thay cho σ .

Tính giá trị S*X =

99

100 8,25 = 1,00503781525 8,25 = 8,29156197581 ≈ 8,2916 cm

a/ Độ tin cậy (1 - α ) = 90% = 0,90 ⇒1

2

α

− = 0,95, tra bảng có F(1,65) = 0,9505 nên ta lấy tα = xα = 1,65 Tính riêng 1,65

10

2916 , 8

= 1,368114 ≈ 1,37 Khoảng ước lượng là

(163,28 – 1,65

10

2916 , 8

; 163,28 + 1,65

10

2916 , 8

) hay là ( 161,91 ; 164,65) b/ Độ tin cậy (1 - α ) = 95% = 0,95 ⇒1

2

α

− = 0,975, tra bảng có F(1,96) = 0,975 nên ta

lấy tα = xα = 1,96 Tính riêng 1,96

10

2916 , 8

= 1,6251536 ≈ 1,63 Khoảng ước lượng là

(163,28 – 1,96

10

2916 , 8

; 163,28 + 1,96

10

2916 , 8

) hay là (161,65 ; 164,91)

Để ý rằng độ tin cậy càng cao thì khoảng ước lượng càng mở rộng

Ví dụ 9: Đo độ chịu lực của 200 mẫu bê tông người ta thu được số liệu sau

Độ chịu lực X (kG/cm2) Số mẫu bê tông ni

190 - 200

200 - 210

210 - 220

220 - 230

230 - 240

240 - 250 10

26

56

64

30

14

Hãy ước lượng độ chịu lực trung bình của mẫu bê tông với độ tin cậy 95% Giải: Ta đặt xi = 2 1 (ai + bi) cho mỗi khoảng của X, i = 1,2,3,4,5,6 ta có bảng số liệu thu gọn Giá trị xi 195 205 215 225 235 245

Tần số ni 10 26 56 64 30 14

X =

200

1

(195.10+205.26+215.56+225.64+235.30+245.14) = 221 kG/cm2

Trang 13

=

n k

(221 – 1,713; 221 + 1,713) hay là (219,287; 222,713)

3.3 Khoảng ước lượng của phương sai σ2 trong phân phối chuẩn N(a, σ 2 )

Khoảng ước lượng của phương sai σ 2 với độ tin cậy (1 - α) là

t

S

) Trong dó giá trị t1 và t2 tra trong bảng phân phối Khi bình phương với ( n – 1) bậc tự dosao cho P (T > t1) = 1 -

Ví dụ 10: Người ta đo một đại lượng không đổi 25 lần bằng dụng cụ đo không có sai

số hệ thống, sai số đo trung bình bằng 0 Giả sử sai số trên tuân theo luật chuẩn vàphương sai mẫu hiệu chỉnh tính được là 0,5 Hãy tìm khoảng ước lượng cho phương saicủa sai số đo với độ tin cậy 95%

Giải:

Gọi X = (sai số của phép đo), theo bài ra X ~ N(0, σ 2) Mẫu thu được có trung bình

X = 0, cỡ mẫu n = 25, phương sai S*2

5,0.24

; 24.0,5

12 ) hay là (0,3; 1)

3.4 Khoảng ước lượng của xác suất p trong phân phối nhị thức tham số (n , p)

Biến ngẫu nhiên X có phân phối nhị thức với tham số (n, p) nếu phân phối xác suất của

nó có dạng P (X = k) = Ck pk q(n – k) / k = 0,1,2,3, … , n và q = 1 – p

(Người ta tính được kỳ vọng EX = n.p và phương sai DX = n.p.q)

Cho mẫu (x1, x2, x3,…, xn ) cỡ n của biến ngẫu nhiên X có phân phối nhị thức

Khoảng ước lượng của xác suất p với độ tin cậy (1 - α ) là:

(p - xα

n

)1( p

p − 

< p < p + xα

n

)1( p

Trang 14

Độ chịu lực X (kG/cm2) Số mẫu bê tông ni

190 - 200

200 - 210

210 - 220

220 - 230

230 - 240

240 - 250 10

26

56

64

30

14

Bê tông có độ chịu lực lớn hơn 220 kG/cm2 được xếp loại 1, hãy ước lượng xác suất p của bê tông loại 1 với độ tin cậy 95% Giải: (1 - α ) = 95% = 0,95 ⇒1 2 α − = 0,975, tra bảng có F(1,96) = 0,975 nên ta lấy xα = 1,96 Tần số bê tông loại 1 trong mẫu là 64+30+14 = 108 ⇒ p = 200 108 = 0,54 α x n ) 1 ( p p −  = 1,96 200 46 , 0 54 , 0 96 , 1 200 ) 54 , 0 1 ( 54 , 0 = − = 0,06907435… ≈ 0,069 Khoảng ước lượng là (0,54 – 0,069 ; 0,54 + 0,069) = (0,471 ; 0, 609) = (47,1% ; 60,9%) Ý nghĩa: Tỷ lệ bê tông đạt loại 1 từ 47,1% đến 60,9% Ví dụ 12: Bài kiểm tra của 40 sinh viên lớp giáo dục thể chất cho bảng sau Điểm kiểm tra xi 3 4 5 6 7 8 9

Số sinh viên ni 5 2 18 7 4 2 2

Điểm đạt từ 7 trở lên là điểm khá giỏi, ước lượng tỷ lệ p sinh viên có điểm khá giỏi với

độ tin cậy 99%

Giải:

Độ tin cậy (1 - α ) = 99% = 0,99 ⇒1

2

α

− = 0,995, tra bảng có F(2,58) = 0,9951 nên ta lấyxα = 2,58 Tần số sinh viên đạt điểm khá là 4+2+2 = 8 ⇒ p=

40

8 = 0,2

α

x

n

)

1

( p

p −  =

40

8 , 0 2 , 0 58 ,

2 = 0,0632455532 ≈ 0,063 Khoảng ước lượng là ( 0,2 – 0,063 ; 0,2 + 0,063) = ( 0,137 ; 0,263) = (13,7% ; 26,3% )

Ý nghĩa : Tỷ lệ sinh viên đạt điểm khá giỏi từ 13,7% đến 26,3%

4 KIỂM ĐỊNH GIẢ THIẾT TRONG THỐNG KÊ

4.1 Dạng bài toán:

- Một phát biểu về phân phối của biếu ngẫu nhiên X gọi là giả thiết, một phát biểu về phân phối của biến ngẫu nhiên X khác với giả thiết gọi là đối thiết

- Một giả thiết cho phép xác định chỉ một phân phối của biến ngẫu nhiên X gọi là giả thiết đơn, ngược lại xác định nhiều phân phối gọi là giả thiết hợp

Một đối thiết cho phép xác định chỉ một phân phối của biến ngẫu nhiên X gọi là đối thiết đơn, ngược lại xác định nhiều phân phối gọi là đối thiết hợp

Người ta thường ký hiệu giả thiết bằng chữ H, đối thiết bằng chữ K

Trang 15

- Nội dung của bài toán kiểm định giả thiết là: Căn cứ vào mẫu để lựa chọn một tronghai quyết định, chấp nhận giả thiết H hoặc bác bỏ giả thiết H Khi quyết định có hai sailầm thường gặp, sai lầm một là H đúng nhưng bị bác bỏ, sai lầm hai là H sai mà vẫnchấp nhận Trong thực tế cuộc sống mắc sai lầm hai hậu quả nghiêm trọng hơn sai lầmmột.

- Số α ∈ (0, 1) hay 0 < α < 1 được chọn làm mức ý nghĩa trong quyết định, tùy vào

giá trị α không gian mẫu ΩM được chia làm hai miền: Miền tiêu chuẩn W bác bỏ giảthiết H , còn lại miền (ΩM \ W) = W là miền chấp nhận giả thiết H

Dạng kiểm định hai phía (x ∈ W) ⇔ Zα > c

- Thông thường người ta phát biểu bài toán kiểm định ở dạng:

Kiểm định giả thiết H, với đối thiết K, mức ý nghĩa α

Việc giải quyết bài toán, ta tính giá trịZα theo mẫu và so sánh với giá trị c, rút ra khẳngđịnh bác bỏ hoặc chấp nhận giả thiết H

4.2 Kiểm định giá trị kỳ vọng a trong phân phối chuẩn N(a, σ 2 )

Trong phân phối chuẩn số thực c > 0 được chọn là số xαhoặc sốtα

- Bài toán kiểm định 2 phía H: a = a0 với K: a ≠ a0 mứcα

* Nếu phương sai σ 2 đã biết, tính giá trị Zα = Xa0 2

Số xα tra trong bảng phân phối chuẩn N(0,1) sao cho F (xα) = 1 -

2

α

* Nếu phương sai σ 2 chưa biết ta thay σ 2 bằng giá trị S*2

X của mẫu, tính giá trị Zα

- Bài toán kiểm định 1 phía

* Nếu phương sai σ 2 đã biết, tùy theo trung bình mẫu X ta lập bài toán tương ứng, cụthể là:

Xu hướng X < a0 , kiểm định H : a = a0 với K : a < a0 mức α

Tính Zα = (a0 -X )

σ

n , có kết luận: Zα >xαthì H bị bác bỏ,Zα <xα thì H được chấpnhận Số xα tra trong bảng phân phối chuẩn N(0,1) sao cho F (xα) = 1 - α

Xu hướng X > a0 , kiểm định H: a = a0 với K: a > a0 mứcα

Trang 16

TínhZα = (X - a0)

σ

n

, có kết luận: Zα >xαthì H bị bác bỏ, Zα <xα thì H được chấpnhận Số xαtra trong bảng phân phối chuẩn N(0,1) sao cho F (xα) = 1 - α

* Nếu phương sai σ 2 chưa biết ta thay σ 2 bằng giá trị S*2

X của mẫu, tùy theo trungbình mẫu X ta lập bài toán tương ứng, cụ thể là:

Xu hướng X < a0, kiểm định H: a = a0 với K: a < a0 mứcα

Số tα tùy theo cỡ mẫu: Khi cỡ mẫu n > 30 lấy tα=xα và xα tra trong bảng phân phốichuẩn N(0,1) sao cho F (xα) = 1 - α Khi cỡ mẫu n < 30 lấy tα tra trong bảng phânphối Student với (n – 1) bậc tự do mức α (bảng tiêu chuẩn 1 phía)

Xu hướng X > a0, kiểm định H: a = a0 với K: a > a0 Tính Zα = (X - a0)

X

S

n

* , có kếtluận: Zα > tα thì H bị bác bỏ, Zα < tα thì H được chấp nhận

Số tα tùy theo cỡ mẫu: Khi cỡ mẫu n > 30 lấy tα=xα và xα tra trong bảng phân phốichuẩn N(0,1) sao cho F (xα) = 1 - α Khi cỡ mẫu n < 30 lấy tα tra trong bảng phânphối Student với (n – 1) bậc tự do mức α (bảng tiêu chuẩn 1 phía)

- Chú ý:

Bài toán kiểm định 2 phía có liên quan đến bài toán ước lượng, cụ thể ước lượng trungbình X với độ tin cậy (1 - α ) ta được khoảng (a, b), tương đương việc kiểm định khiα

Z < tα

Kiểm định 1 phía được xem như là trường hợp đặc biệt của kiểm định 2 phía

Ví dụ 13: Mức quy định cho mỗi gói bánh đóng gói tự động là 225 gam Kiểm tra ngẫu

nhiên 81 gói thấy khối lượng trung bình là 210 gam, với độ lệch mẫu 36 gam Với mức

ý nghĩa α = 0,01, hãy cho kết luận về tình hình sản xuất ?

4.3 Kiểm định xác suất p trong phân phối nhị thức:

Trong phân phối nhị thức số thực c > 0 được chọn là sốxα, nội dung bài toán là:

Trong một lần thử có hai kết quả A vàA với xác suất P (A) = p, cho phép thử lặp lại nlần với cùng điều kiện như nhau Giả sử biến cố A xuất hiện k lần trong n lần thử, kiểmđịnh xác suất p là xác nhận quan hệ giữa p và số p0 cho trước, có hai trường hợp

- Bài toán kiểm định 2 phía H: p = p0 với K: p ≠ p0 mứcα

Ngày đăng: 17/06/2015, 19:56

HÌNH ẢNH LIÊN QUAN

Bảng tần số là - phương pháp thống kê toán học đậu xuân thoan
Bảng t ần số là (Trang 4)
Đồ thị của hàm F (x) dạng bậc thang: - phương pháp thống kê toán học đậu xuân thoan
th ị của hàm F (x) dạng bậc thang: (Trang 5)
Bảng 1.     Giá trị hàm phân phối F(x) =  ∫ u du - phương pháp thống kê toán học đậu xuân thoan
Bảng 1. Giá trị hàm phân phối F(x) = ∫ u du (Trang 23)
Bảng 2.  Phân phối Student - phương pháp thống kê toán học đậu xuân thoan
Bảng 2. Phân phối Student (Trang 29)
Bảng 3.  Phân phối khi bình phương với k = n – 1 bậc tự do - phương pháp thống kê toán học đậu xuân thoan
Bảng 3. Phân phối khi bình phương với k = n – 1 bậc tự do (Trang 31)

TỪ KHÓA LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w