1. Trang chủ
  2. » Thể loại khác

CHUONG 7 (Kiem dinh gia thiet) - Bo sung 1.2

14 111 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 14
Dung lượng 725,56 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

CHƯƠNG 7: KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ Phần bổ sung 2 PHẦN II: KIỂM PHI THAM SỐ KIỂM ĐỊNH TÍNH ĐỘC LẬP Một phần tử của đám đông có thể có các dấu hiệu định lượng.. Một phần tử của đám

Trang 1

CHƯƠNG 7:

KIỂM ĐỊNH GIẢ THIẾT

THỐNG KÊ Phần bổ sung

2

PHẦN II: KIỂM PHI THAM SỐ KIỂM ĐỊNH TÍNH ĐỘC LẬP Một phần tử của đám đông có thể có các dấu hiệu định lượng VD con người có: chiều cao, trọng lượng Một phần tử của đám đông còn có dấu hiệu định tính VD con người có: màu tóc, màu mắt

Ta khảo sát 3 trường hợp:

* Tính độc lập của 2 dấu hiệu định tính

* Tính độc lập của 1 dấu hiệu định tính và 1 dấu hiệu định lượng

* Tính độc lập của 2 dấu hiệu định lượng

3

I KIỂM ĐỊNH TÍNH ĐỘC LẬP CỦA 2 DẤU HIỆU ĐỊNH TÍNH

Ta có bảng liên hợp các dấu hiệu sau:

B

A B1 B2 …… Bk Tổng

A1 n11 n12 n1k n10

A2 n21 n22 n2k n20

Ar nr1 nr2 nrk nr0

Tổng n01 n02 … n0k n

 k

j ijn

in0 1 , n0j ki ij1n , n ri1 in0j ojk1n : cỡ mẫu 4

Giả thiết H0: Hai dấu hiệu A và B độc lập

H1: Hai dấu hiệu A và B không độc lập

nij : tần số quan sát

i j ni ijn j

n

0

0

2 (

2

  2 (k 1)(r  1) Quy tắc quyết định:

2 > 2 (k 1)(r  : bác bỏ H1) 0

Trang 2

H ÌNH MINH HỌA QUY TẮC QUYẾT ĐỊNH

VD5: Để nghiên cứu xem quy mô của một công ty có ảnh hưởng đến hiệu quả quảng cáo đối với khách hàng hay không, người ta tiến hành phỏng vấn 356 khách hàng và thu được kết quả sau:

Hiệu quả QC Quy mô CT Mạnh Vừa phải Yếu Tổng

Nhỏ 20 52 32 104

Vừa 53 47 28 128

Lớn 67 32 25 124 Tổng 140 131 85 356

Với mức ý nghĩa 5%, có thể cho rằng quy mô của công ty có ảnh hưởng đến hiệu quả của quảng cáo đối với khách hàng hay không?

7

Giải

H 0 : Quy mô không ảnh hưởng hiệu quả quảng cáo

H 1 : Quy mô có ảnh hưởng hiệu quả quảng cáo





1 124

*

85252 124

*

131322 124

*

140672 128

*

85282

128

*

131472 128

*

140532 104

*

85322 104

*

131522 104

*

140202 356 2

= 29,638

 2 > 2 (3 1)(3 1) 2 (4) 9,4877

Tức quy mô công ty có ảnh hưởng đến hiệu quả của

II KIỂM ĐỊNH TÍNH ĐỘC LẬP CỦA 1 DẤU HIỆU ĐỊNH TÍNH VÀ 1 DẤU HIỆU ĐỊNH LƯỢNG

Tiêu chuẩn phù hợp 2 nói trên còn có thể áp dụng để kiểm định tính độc lập của 1 dấu hiệu định tính A và 1 dấu hiệu định lượng X Khi đó ta cần chia miền giá trị của X thành k khoảng B1, B2, Bk , và nếu cá thể có số đo xj rơi vào khoảng Bj thì ta xem cá thể đó có dấu hiệu Bj

Trang 3

VD6: Một con cua biển có thể có màu vỏ là xanh, hoặc

hồng Số vạch trên vỏ của nó có thể là 0, 1, 2, 3, 4, 5 Ở đây

dấu hiệu A (màu vỏ) là dấu hiệu định tính, còn số vạch trên

vỏ X là dấu hiệu định lượng (hay X là ĐLNN rời rạc)

Xét ngẫu nhiên 169 con cua biển, ta thu được:

Số vạch Màu vỏ 0 1 hoặc 2 3 hoặc 4 5 Tổng

Hồng 14 14 16 10 54 Tổng 49 33 52 35 169

Giải

H0: hai dấu hiệu A và X độc lập

H1: hai dấu hiệu A và X không độc lập

* 2169(4935*1152 3319*1152  3510*254 )1 ,213

*  = 0,05 , r=2 , k=4  20,05(2 1)(4 1)  0,052 (3) 7,8147

* Ta có 2 0,052 (3) : chấp nhận H0

11

III KIỂM ĐỊNH TÍNH ĐỘC LẬP CỦA 2 DẤU

HIỆU ĐỊNH LƯỢNG

Tương tự như vậy, ta có thể dùng tiêu chuẩn 2 nói

trên để kiểm tra tính độc lập của 2 ĐLNN X và Y

(lưu ý rằng nếu X và Y không tương quan: RXY = 0 thì

chưa chắc X,Y độc lập Ta phải kiểm tra mới khẳng

định được) Muốn vậy, ta chia miền giá trị của X

thành k khoảng B1 , B2, Bk còn miền giá trị của Y

thành r khoảng A1, A2, Ar Nếu cá thể có số đo (y,x)

VD7: Giả sử X và Y (pound) tương ứng là số đo huyết áp và trọng lượng của trẻ em 14 tuổi Lấy 1 mẫu ngẫu nhiên gồm 200 trẻ, ta có:

H áp

T lượng

X  99 99<X110 110<X120 X > 120 Tổng

Y >102 6 48 50 50 154

Với : 1 pound = 0,454 kg Với  =1%, xét xem: X,Y có độc lập

Trang 4

Giải

H 0 : hai dấu hiệu X và Y độc lập

H 1 : hai dấu hiệu X và Y không độc lập

 = 0,01 , r= 2 , k= 4

 20,01(2 1)(4 1)    0,012 (3) 11,345 

53 , 22 ) 1 154

*

55502

46

*

68202 46

*

16102 ( 200

Ta có 2   0,0 12 (3) : bác bỏ H 0

Vậy giữa huyết áp và trọng lượng

có sự phụ thuộc lẫn nhau

14

PHẦN 2 KIỂM ĐỊNH PHI THAM SỐ KIỂM ĐỊNH QUY LUẬT PHÂN PHỐI TIÊU CHUẨN K.PEARSON ( TIÊU CHUẨN  2 )

 Trong thực tế ta thường gặp vấn đề là ta phải kiểm tra xem một đại lượng ngẫu nhiên đang xét có một quy luật phân phối nào đó không Ví dụ như chiều cao của một loại cây có quy luật phân phối chuẩn không? Số sản phẩm tốt trong 1 hộp có quy luật phân phối nhị thức không? Số người đến siêu thị trong 1 ngày có quy luật phân phối Poisson không?

15

Cho bảng tần số quan sát của ĐLNN X

(rời rạc: dạng điểm, liên tục: dạng khoảng):

Tần số n1 n2 nk

n = n1 + n2 +…+ nk : cỡ mẫu

Lập giả thiết

1 X là ĐLNN rời rạc

pi = P(X= xi) : theo quy luật A

Ta xét X có quy luật phân phối nhị thức, hoặc Poisson

2 X là ĐLNN liên tục

pi = P(xi-1 < X < xi) hoặc pi = P(xi < X < xi+1)

Ta xét X có quy luật chuẩn

Trang 5

i

np i np i

n

k i

2 1

  2 k r 1

   (tra bảng) 

r = số tham số chưa xác định của quy luật X

k là số điểm (khoảng) chia các giá trị của X

Quy tắc quyết định:

  

H ÌNH MINH HỌA QUY TẮC QUYẾT ĐỊNH

18

19

CÁC QUY LUẬT PHÂN PHỐI

CƠ BẢN CẦN KIỂM ĐỊNH

1 Nhị thức

X ~ B(n,p)

n và p biết  r = 0

n biết, p chưa biết  r = 1

n và p chưa biết  r = 2 Nếu p chưa biết, thay bằng f

2 Poisson

X ~ P( )

 biết  r = 0

 chưa biết  r = 1 Nếu  chưa biết, thay bằng x

20

CÁC QUY LUẬT PHÂN PHỐI CƠ BẢN CẦN KIỂM ĐỊNH

3 Chuẩn

X ~ N( , 2)

 và 2 biết  r = 0

 biết, 2 chưa biết  r = 1

 chưa biết, 2 biết  r = 1

 và 2 chưa biết  r = 2 Nếu  chưa biết, thay bằng x Nếu 2 chưa biết, thay bằng s2 (hoặc 2 ˆs )

Trang 6

Lưu ý:

Điều kiện để áp dụng tiêu chuẩn phù hợp

2

 theo K.Pearson là:

Các tần số quan sát ni  5

Nếu các ni quá nhỏ thì phải ghép các giá

trị hay các khoảng giá trị của mẫu lại để

tăng ni lên Cách ghép lớp không duy nhất,

nên ta phải trình bày ra cho người đọc biết

22

VD8:

Quan sát 1 đối tượng trong 100 ngày Gọi X là số lần xuất hiện của đối tượng trong 1 ngày, ta có:

Số ngày 5 10 19 29 21 6 9 0 0 1 0 Với = 5%, hãy xét xem X~B(10 ; 0,3) ?

23

Giải:

H0: X có quy luật phân phối nhị thức B(10; 0,3)

H1: X không có quy luật phân phối nhị thức B(10; 0,3) Trước hết, ta thu ngọn mẫu để cho thỏa ni không quá nhỏ: ni  5

X 0 1 2 3 4 5  6

Ta lập bảng sau:

i

np inp i

n 2



 

0

1

2

3

4

5

 6

5

10

19

29

21

6

10

0,0282 0,1211 0,2335 0,2668 0,2001 0,1029 0,0474

2,82 12,11 23,35 26,68 20,01 10,29 4,74

1,6852 0,3676 0,8104 0,2017 0,0490 1,7885 5,8370 Tổng n=100 1 10,7394

Trang 7

Nếu giả thiết H0 đúng, ta tính được các xs:

pi = P(X=xi) = Cxi ( 0 3, ) xi ( 0 7, ) 10  xi

xi= 0,1,2, ,6

p1 = P(X=0) = C 10 0 ( 0 3, ) 0 ( 0 , 7 ) 10  ,0 0282

Vậy 2 = 10,7394

k= 7, r= 0, = 0,05   0,05 2 (7 1) 12,5916  

0,0 5

Lưu ý:

Để cho tổng các xác suất phải bằng 1 thì

pk cuối cùng tính bằng 1-(p1+ +pk-1)

VD:

Để 

7 1

i pi = 1 thì p7 = 1– 

6 1

i pi = 0,0474

27

VD9: Dân gian lưu truyền rằng: loại thức ăn AA

làm tăng khả năng sinh con trai Người ta cho 1

nhóm phụ nữ dùng thức ăn AA, rồi xem xét 80

trường hợp có 3 con trong thời gian dùng loại

thức ăn AA đó Kết quả cho trong bảng sau:

X: số bé trai 3 2 1 0

ni: số phụ nữ 14 36 24 6 Với = 5%, kiểm định xem liệu loại thức ăn AA

có tác dụng đến việc sinh con trai không? 28

Giải:

H0 : loại thức ăn AA không làm tăng khả năng sinh con trai

Nếu H0 đúng thì số bé trai trong gia đình có 3 con là 1 ĐLNN có qluật nhị thức với n= 3, p= ½

Gọi X là số con trai trong 1 gia đình có 3 con H0 : X~B(3, ½)

Đặt : Bk = bc trong 3 đứa trẻ có k đứa là con trai

Trang 8

Ta lập bảng sau:

xi ni pi npi

i npi np

in 2



3

2

1

0

14

36

24

6

1/8 3/8 3/8 1/8

10

30

30

10

1,6 1,2 1,2 1,6

p1 = P(B0) =

8 3

3 2

1 1 3

) 1

( 2

, 8 1

3 2

1 0







C B P p C

8 1

3 2

1 3 3

) 3

( 4

,

83

3 2

1 2 3

) 2

(







C B p p C

B P p Vậy 2 = 5,6

= 0,05 , k= 4 , r= 0

 2 (k r  1) 0,052 (3) 7,8147

2

0,05

  : chấp nhận H0

Vậy thức ăn AA không ảnh hưởng đến giới tính

31

VD10: Sản phẩm được sản xuất ra trên một

dây chuyền tự động, được đóng gói một cách

ngẫu nhiên theo quy cách: 3 sản phẩm/hộp

Tiến hành kiểm tra 200 hộp ta được kết quả:

Số sp loại I có trong hộp 0 1 2 3

hộp là đại lượng ngẫu nhiên có quy luật phân

Giải:

Gọi X là số sp loại I có trong một hộp

XB(3, p)

Ta xấp xỉ p bằng:

74 , 0 200

*

3 * 110 3 * 70

2 14

*

 f

H0: X  B(3 ; 0,74)

2 = 18,8755 > 2  0,02 (4 1 1)   = 7,8241 : bác bỏ H0

Trang 9

Ta lập bảng sau:

i

np inp

in 2

0

1

2

3

6

14

110

70

0,017576 0,150072 0,427128 0,405224

3,5152 30,0144 85,4256 81,0448

1,75644 8,5446 7,06932 1,50519

34

VD11: Một nhà máy sản xuất máy in nói rằng:

số lỗi in trong 1 cuốn sách dày 300 trang của máy in là 1 ĐLNN có quy luật phân phối Poisson với tham số = 4,7 Kiểm tra 300 trang sách in của 50 máy in cùng loại, ta thu được:

Số lỗi 0 1 2 3 4 5 6 7 8  9 Số máy 1 1 8 6 13 10 5 5 1 0 Với mức ý nghĩa 1%, hỏi lời tuyên bố của nhà sản xuất có đúng không?

35

Giải:

Gọi X = số lỗi trong 300 trang in

H0: X ~ P(4,7)

P1 = P(X 2)

= e-4,7 ((407,!)0( ,47!1)1(427,!)2) ,01523

P2 = P(X=3) = e-4,7

!3(47,)3 = 0,1574

P3= P(X=4) = e-4,7

!4)4

7, 4

( = 0,1849

36

P4 = P(X=5) = e-4,7

!

57)5

, 4 ( = 0,1738

P5 = P(X=6) = e-4,7

!

67)6

, 4

P6 = P(X  7) = 1– 6 ( ) 0,1954

k

 = 0,01 , k = 6, r = 0   0 ,0 12 ( 5 ) 1 5 , 0 8 6 3

2 = 4,8468 < 2 (5 )

0 ,0 1

 : chấp nhận H0 Tin lời tuyên bố trên

Trang 10

Ta lập bảng:

x i n i p i np i

i

np inp i

n 2

 2

3

4

5

6

7

10

6

13

10

5

6

0,1523 0,1574 0,1849 0,1738 0,1362 0,1954

7,6150 7,8692 9,2463 8,6915 6,8083 9,7697

0,7470 0,4440 1,5239 0,1970 0,4803 1,4546

Lưu ý:

Nếu đề không cho  = 4,7 thì ta làm như sau:

24 ,4 ) 6

* 7 5

* 6 10

* 5 13

* 4 6

* 3 10

* 2 (

50 1

6 1

1

i i n n x

Thay  bằng x = 4,24 Xem X~P(4,24)

39

VD12: Quan sát chiều cao của 120 cây khuynh diệp ở

1 năm tuổi, ta được bảng số liệu:

Chiều cao 50-80 80-100 100-110 110-120 120-130 Số cây 10 9 13 14 21

Chiều cao (cm) 130-140 140-150 150-160 160-170

Với mức ý nghĩa 5%, hãy kiểm định giả thiết:

Giải:

X = chiều cao của cây khuynh diệp (cm)

H0 : X có phân phối chuẩn N( , 2)

ix in n

+115*14+125*21+135*15+145*12 +155*13 + 165*13] = 124,875

Trang 11

1

1

1 (1963675 120(124,875) )2

120 1 776,6649

s  n n x n xi i 

8687 , 27 6649

,

s

H0: X~N(124,875 ; (27,8687)2 )

 = 0,05, k = 9, r = 2

i

np inp i

n 2

( – , 80) (80, 100) (100, 10) (110, 120) (120, 130) (130, 140) (140, 150) (150, 160) (160, +  )

10

9

13

14

21

15

12

13

13

0,0537 0,1330 0,1114 0,1344 0,1389 0,1340 0,1105 0,0803 0,1038

6,444 15,96 13,368 16,128 16,668 16,08 13,26 9,636 12,456

12,6451 48,4416 0,1354 4,5284 18,7662 1,1664 1,5876 11,3165 0,2959

1,9623 3,0352 0,0101 0,2808 1,1259 0,0725 0,1197 1,1744 0,0238

43

p1 = P(X< 80) = 0,5+  

8687 ,

27124 ,875

= 0,5  (1,61) = 0,5-0,4463 = 0,0537

p2 = P(80<X<100)

8687 ,

27 124 ,875

8687 ,

27124 ,875

80

= (0,89)+(1,61) = – 0,3133+0,4463

= 0,1330

p3 = P (100<X<110) = –(0,53)+(0,89)

= –0,0675 + 0,2019 = 0,1344

= 0,0714 + 0,0675 = 0,1389

= 0,2054 – 0,0714 = 0,1340

Trang 12

p7 = P (140 < X < 150 ) = (0,90) - (0,54)

= 0,3159 – 0,2054 = 0,1105

p8 = P (150 < X < 160 ) = (1,26) - (0,90)

= 0,3962 – 0,3159 = 0,0803

p9 = P (X>160 ) = 0,5 - (1,26)

= 0,5 – 0,3962 = 0,1038

Lưu ý:

* Nếu đề cho trước  = 25 thì r = 1 P(xi< X < xi+1)

=  ( i x  1  25 124 , 875 )   ( ix  124 25 , 875 )

* Nếu đề cho trước = 120, = 25 thì r= 0 P( xi < X < xi+1)

=  ( i x  1 25  120 )   ( x i  25 120 )

47

VD13: Gạo đủ tiêu chuẩn xuất khẩu nếu thỏa

mãn các yêu cầu sau:

Tỷ lệ hạt nguyên  90% , tỷ lệ hạt vỡ  6% ,

tỷ lệ tấm  4%

Kiểm tra 1000 hạt gạo của 1 lô gạo, người ta

thấy có: 870 hạt nguyên, 70 hạt vỡ, 60 hạt

tấm Hỏi lô gạo có đủ tiêu chuẩn xuất khẩu

Giải:

hạt vỡ, hạt tấm tương ứng là 90%, 6%, 4%

Lô gạo không đủ tiêu chuẩn xuất khẩu

Trang 13

i i npi

hạt nguyên hạt vỡ hạt tấm

870

70

60

0,90 0,06 0,04

900

60

40

1 1,667

10

VD14:

Sản phẩm do một nhà máy sản xuất được đĩng thành từng hộp Mỗi hộp cĩ 12 sản phẩm gồm 2 loại: loại A và loại B

Theo báo cáo của nhà máy thì tỷ lệ hộp cĩ

12 sản phẩm loại A là 60% Tỷ lệ hộp cĩ

11 sản phẩm loại A là 25% Tỷ lệ hộp cĩ

10 sản phẩm loại A là 10% Tỷ lệ hộp cĩ

số sản phẩm loại A dưới 10 là 5%

51

VD14 (tt):

Chọn ngẫu nhiên 1000 hộp do nhà máy này

sản xuất thì thấy cĩ 585 hộp cĩ 12 sản phẩm

loại A; 256 hộp cĩ 11 sản phẩm loại A; 97

hộp cĩ 10 sản phẩm loại A ; 52 hộp cĩ 9 sản

phẩm loại A và 10 hộp cĩ 8 sản phẩm loại A

Cĩ thể chấp nhận báo cáo của nhà máy hay

Giải:

H0: Tỷ lệ hộp cĩ 12 sp loại A là 0,6 ;

Tỷ lệ hộp cĩ 11 sp loại A là 0,25 ;

Tỷ lệ hộp cĩ 10 sp loại A là 0,1 ;

Tỷ lệ hộp cĩ số sp loại A dưới 10 là 0,05

H1: Phủ định của Ho

2 < 2(0,05 ; 4-1) = 7,815 : chấp nhận H0

Trang 14

Thành phần hộp

ni pi npi n np 2

npi

12 splA

11 splA

10 splA

< 10 splA

585

256

97

62

0,60 0,25 0,10 0,05 Tổng n= 1000 1 2 = 3,489

Mời ghé thăm trang web:

54

 https://sites.google.com/a/ueh.edu.vn/phamtricao/

 https://sites.google.com/site/phamtricao/

Ngày đăng: 09/12/2017, 08:57

TỪ KHÓA LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w