1. Trang chủ
  2. » Luận Văn - Báo Cáo

các phương pháp kiểm định tham số

95 533 4

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 95
Dung lượng 0,91 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

2 1.2.1 Kiểm định giả thiết về trị trung bình của biến ngẫu nhiên có phân phối chuẩn ..... Kiểm định giả thiết thống kê được coi là một bài toán có ý nghĩa lớn và quan trọng của thống kê

Trang 1

TRƯỜNG ĐẠI HỌC CẦN THƠ KHOA KHOA HỌC TỰ NHIÊN

BỘ MÔN TOÁN

-—²– -

LUẬN VĂN TỐT NGHIỆP

CÁC PHƯƠNG PHÁP KIỂM ĐỊNH THAM SỐ

GIÁO VIÊN HƯỚNG DẪN

ThS DƯƠNG THỊ TUYỀN

BỘ MÔN TOÁN – KHOA KHTN

SINH VIÊN THỰC HIỆN

PHAN THỊ CHINH MSSV: 1107511 NGÀNH: TOÁN ỨNG DỤNG

CẦN THƠ 11/2013

Trang 2

LỜI CẢM ƠN

Lời đầu tiên, em xin gởi lời cảm ơn chân thành đến Th.S Dương Thị Tuyền Cảm

ơn sự hướng dẫn nhiệt tình và tận tâm của Cô trong suốt thời gian thực hiện luận văn

Em cũng xin gửi lời cám ơn đến những người Thầy, Cô, đặc biệt là các thầy, cô trong Bộ môn Toán - Khoa Khoa Học Tự Nhiên đã truyền đạt cho em những kiến thức nền tảng vô cùng quý báu, đã luôn tạo mọi điều kiện thuận lợi để em hoàn thành tốt khóa học

Cuối cùng là lời cám ơn sâu sắc đến gia đình, bạn bè và người thân đã hết lòng quan tâm, động viên và giúp đỡ em hoàn thành chương trình học tập

Em xin kính chúc quý Thầy, Cô luôn dồi giàu sức khỏe, luôn thành công trong công việc và trong cuộc sống

Trân trọng!

Cần Thơ, ngày 30 tháng 11 năm 2013

Sinh viên

Phan Thị Chinh

Trang 3

MỤC LỤC

Trang

PHẦN MỞ ĐẦU iv

CHƯƠNG 1: KIỂM ĐỊNH THAM SỐ THỐNG KÊ 1

1.1 Sơ lược về bài toán kiểm định giả thiết thống kê 1

1.1.1 Đặt vấn đề 1

1.1.2 Phương pháp kiểm định 1

1.1.3 Sai lầm loại một và sai lầm loại hai 2

1.2 Kiểm định trị trung bình tổng thể 2

1.2.1 Kiểm định giả thiết về trị trung bình của biến ngẫu nhiên có phân phối chuẩn 2

1.2.1.1 Bài toán 2

1.2.1.2 Các bước thực hành 3

1.2.1.3 Ví dụ 4

1.2.2 Kiểm định so sánh hai trung bình 6

1.2.2.1 Bài toán 6

1.2.2.2 Các bước thực hành 6

1.2.2.3 Các ví dụ 8

1.2.2.4 Kiểm định sự bằng nhau của hai trung bình bằng phương pháp so sánh cặp đôi (mẫu phối hợp từng cặp) 11

1.3 Kiểm định tỷ lệ 15

1.3.1 Kiểm định giả thiết về tỷ lệ tổng thể 15

1.3.1.1 Bài toán 15

1.3.1.2 Các bước thực hành 15

1.3.1.3 Ví dụ 16

1.3.2 Kiểm định so sánh hai tỷ lệ 17

1.3.2.1 Bài toán 17

1.3.2.2 Các bước thực hành 17

1.3.2.3 Ví dụ 18

1.3.3 Kiểm định giả thiết về nhiều tỷ lệ 19

1.3.3.1 Bài toán 19

1.3.3.2 Các bước tiến hành 19

1.3.3.3 Ví dụ 20

1.4 Kiểm định phương sai 21

1.4.1 Kiểm định giả thiết về phương sai của biến ngẫu nhiên có phân phối chuẩn 21

1.4.1.1 Bài toán 21

1.4.1.2 Các bước thực hành 22

1.4.1.3 Ví dụ 22

1.4.2 Kiểm định so sánh hai phương sai 23

Trang 4

1.4.2.1 Bài toán 23

1.4.2.2 Các bước thực hiện 23

1.4.2.3 Ví dụ 25

1.4.3 Kiểm định K phương sai của K biến ngẫu nhiên có phân phối chuẩn 25

1.4.3.1 Bài toán 25

1.4.3.2 Các bước thực hành 26

1.4.3.3 Ví dụ 27

CHƯƠNG 2: PHÂN TÍCH PHƯƠNG SAI 29

2.1 Phân tích phương sai một nhân tố 29

2.1.1 Bài toán 29

2.1.2 Các bước thực hiện 29

2.1.3 Ví dụ 31

2.2 Phân tích phương sai hai nhân tố 32

2.2.1 Trường hợp hai nhân tố tác động riêng lẽ 33

2.2.2 Trường hợp hai nhân tố tác động tổng hợp 38

CHƯƠNG 3: THỰC HIỆN KIỂM ĐỊNH TRÊN SPSS 46

3.1 Kiểm định trung bình tổng thể 46

3.1.1 Kiểm định giả thiết về trung bình của một tổng thể 46

3.1.2 Kiểm định giả thiết về sự bằng nhau của hai trung bình tổng thể 47

3.1.2.1 Kiểm định giả thiết về sự bằng nhau của hai trung bình tổng thể - trường hợp mẫu độc lập 47

3.1.2.2 Kiểm định giả thiết về sự bằng nhau của hai trung bình tổng thể - trường hợp mẫu phụ thuộc hay phối hợp từng cặp 50

3.2 Kiểm định tỷ lệ 53

3.2.1 Kiểm định tỷ lệ của một tổng thể 53

3.2.2 Kiểm định về sự bằng nhau của hai tỷ lệ tổng thể 55

3.2.3 Kiểm định nhiều tỷ lệ tổng thể 57

3.3 Phân tích phương sai 60

3.3.1 Phân tích phương sai một yếu tố (One-Way Anova) 60

3.3.2 Phân tích phương sai hai yếu tố (Two-Way Anova) 67

KẾT LUẬN 79

TÀI LIỆU THAM KHẢO 80

PHỤ LỤC 81

Trang 5

PHẦN MỞ ĐẦU

Thống kê là hệ thống các phương pháp dùng để thu thập, xử lý và phân tích các

số liệu thống kê nhằm rút ra các kết luận khoa học và thực tiễn Chính vì thế mà thống

kê đóng một vai trò cực kỳ quan trọng và không thể thiếu trong các nghiên cứu khoa học và trong cuộc sống ngày nay

Kiểm định giả thiết thống kê được coi là một bài toán có ý nghĩa lớn và quan trọng của thống kê toán học với đa dạng các bài toán liên quan tới dấu hiệu nghiên cứu trong tổng thể Trong đó, kiểm định tham số thống kê giải quyết nhanh nhiều bài toán liên quan đến tham số tổng thể hay dạng phân phối xác suất của tổng thể

Bên cạnh đó, phân tích phương sai cũng là một kỹ thuật phân tích thống kê khá nhạy bén Phân tích phương sai được sử dụng để kiểm định giả thiết về giá trị bình khi

có từ 3 nhóm trở lên Kỹ thuật này dựa trên mức độ biến thiên trong nội bộ các nhóm

và biến thiên giữa các trung bình nhóm

Hiện nay, với sự phát triển mạnh mẽ của khoa học máy tính, có rất nhiều phần mềm phục vụ cho việc phân tích và xử lí số liệu thống kê Trong đó nổi bật là phần mềm SPSS với ưu điểm là phần mềm chuyên nghiệp, xử lí nhanh và dễ sử dụng Vì thế, SPSS đã lôi cuốn nhiều người sử dụng

Bắt đầu từ việc muốn hiểu rõ hơn về các phương pháp kiểm định tham số thống

kê, về thủ tục phân tích phương sai, về ứng dụng của SPSS, em chọn đề tài: “Một số phương pháp kiểm định tham số”

Luận văn được viết theo quan điểm thực hành, chú trọng việc áp dụng các phương pháp kiểm định tham số thống kê, phân tích phương sai trong nghiên cứu, trong thực tiễn hơn là trình bày dưới dạng thuần túy toán học Mỗi phương pháp kiểm định đều được minh họa bằng nhiều ví dụ cụ thể ở các lĩnh vực thức tế khác nhau

v Nội dung của luận văn gồm có 3 chương:

Chương 1: Kiểm định tham số thống kê

Giới thiệu về bài toán kiểm định giả thiết thống kê, các loại kiểm định tham số thống kê: kiểm định trung bình, kiểm định tỷ lệ và kiểm định phương sai của biến ngẫu nhiên và cho ví dụ cụ thể trong từng trường hợp

Chương 2: Phân tích phương sai

Giới thiệu và tóm tắt quá trình phân tích phương sai một yếu tố, phân tích phương sai hai yếu tố, cho ví dụ minh họa

Trang 6

Chương 3: Thực hiện trên phần mềm SPSS

Đưa ra các ví dụ về bài toán kiểm định tham số thống kê và phân tích phương sai, trình bày cách thực hiện trên phần mềm SPSS, phân tích kết quả, so sánh với phương pháp truyền thống và đưa ra kết luận

Phần kết luận: Trình bày những nhận xét khái quát về đề tài

Vì thời gian có hạn và kiến thức bản thân còn nhiều hạn chế nên luận văn còn có nhiều sai sót Em rất mong nhận được sự đóng góp, chỉ dẫn của quý thầy cô và các bạn

để luận văn được hoàn thiện hơn

Trang 7

CHƯƠNG 1: KIỂM ĐỊNH THAM SỐ THỐNG KÊ

1.1 Sơ lược về bài toán kiểm định giả thiết thống kê

Hoặc: q q> 0 Hoặc: q q< 0 Hoặc: q q¹ 0

Giả thiết thống kê đưa ra ở trên có thể đúng hoặc sai và làm như thế nào để biết chính xác điều này Vì vậy cần kiểm định để xác định giả thiết đúng hay sai Kiểm định này được gọi là kiểm định giả thiết tham số thống kê và thực hiện dựa trên thông tin thực nghiệm của mẫu để kết luận

G được gọi là tiêu chuẩn kiểm định

Thực hiện một phép thử đối với mẫu ngẫu nhiên W = (X1, X2, …, Xn) thu được một mẫu cụ thể w = (x1, x2, …, xn) và qua đó tính được một giá trị cụ thể của tiêu chuẩn kiểm định G:

Gqs = f(x1, x2, …, xn,q0) Giá trị này được gọi là giá trị quan sát của kiểm định

Với một xác suất khá bé bằng a cho trước, ta có thể tìm được một miền Watương ứng sao cho P G( ÎW /a H0)= Giá trị a được gọi là mức ý nghĩa của kiểm a

định và miền Wa được gọi là miền bác bỏ của giả thiết H0 với mức ý nghĩa a

Quy tắt kiểm định giả thiết thống kê:

- Nếu G qsÎWa thì bác bỏ giả thiết H0 và chấp nhận đối thiết H1, tức là giả thiết sai và đối thiết đúng

Trang 8

- Nếu G qsÏWa thì chấp giả thiết H0 và bác bỏ đối thiết H1, tức là giả thiết đúng

và đối thiết sai

1.1.3 Sai lầm loại một và sai lầm loại hai

Với quy tắt kiểm định như trên, ta có thể mắc hai loại sai lầm:

§ Sai lầm loại 1: Bác bỏ giả thiết H0 trong khi H0 đúng

§ Sai lầm loại 2: Chấp nhận giả thiết H0 trong khi H0 sai

Quan hệ giữa việc kiểm định giả thiết và các loại sai lầm có thể mô tả trong bảng sau:

H0 sai Kết luận đúng

xác suất 1 -a

Sai lầm loại 2 xác suất b

Ta thấy sai lầm loại 1 và sai lầm loại 2 là mâu thuẫn với nhau, tức là với một mẫu kích thước n xác định thì không thể cùng một lúc giảm xác suất mắc hai loại sai lầm trên được Khi ta giảm a đi thì đồng thời sẽ làm tăng b và ngược lại

Thông thường, người ta đặt ra trước mức xác suất mắc sai lầm loại 1 là a và xây dựng một quy tắt kiểm định sao cho xác suất mắc sai lầm loại 2 ( b ) là nhỏ nhất Với

a là mức ý nghĩa của kiểm định

1.2 Kiểm định trị trung bình tổng thể

1.2.1 Kiểm định giả thiết về trị trung bình của biến ngẫu nhiên có phân phối chuẩn

1.2.1.1 Bài toán

Tổng thể được đặc trưng bởi đại lượng ngẫu nhiên X có trung bình m=E X( )

chưa biết Giả sử ta có mẫu gồm n giá trị quan sát độc lập (X1, X2, …, Xn) được chọn ngẫu nhiên từ tổng thể Gọi m s, , X2 và S 2 lần lượt là trung bình và phương sai của tổng thể và của mẫu, và x s, 2tương ứng là các giá trị trung bình và phương sai cụ thể của mẫu

Với mức ý nghĩa a cho trước, cần kiểm định các cặp giả thiết và đối thiết sau:

::

H H

m m

m m

H H

m m

m m

î

(m là số cho trước) 0

Trang 9

a

- tra trong bảng phân vị chuẩn)

Bước 4: Kết luận

+ Nếu u WÎ a: Bác bỏ giả thiết, chấp nhận đối thiết

+ Nếu u WÏ a: Chấp nhận giả thiết, bác bỏ đối thiết

v Trường hợp 2: Khi chưa biết phương sai Var X( )=s2 và n ³30

Trang 10

Bước 4: Kết luận

+ Nếu u WÎ a: Bác bỏ giả thiết, chấp nhận đối thiết

+ Nếu u WÏ a: Chấp nhận giả thiết, bác bỏ đối thiết

v Trường hợp 3: Khi chưa biết phương sai Var X( )=s2 và n <30, X có phân phối chuẩn

Ở trường hợp này, các bước thực hiện giống như trương hợp 2, chỉ khác ở bước tìm miền bác bỏ Cụ thể miền bác bỏ được tìm như sau:

Ví dụ 1.1: Thông qua một mẫu gồm 100 gia đình người ta thu được kết quả là chi tiêu

trung bình hàng tháng của các gia đình đó là 2,455 triệu đồng với độ lệch chuẩn mẫu là 0,3 triệu đồng Với mức ý nghĩa 0,05 có thể cho rằng chi tiêu trung bình hàng tháng của các gia đình ít hơn 2,25 triệu đồng hay không? Giả thiết mức chi tiêu hàng tháng

có phân phối chuẩn

mm

Trang 11

Ví dụ 1.2: Bột mỳ được đóng gói bằng máy tự động có trọng lượng đóng bao theo quy

định là 16 kg và độ lệch chuẩn là 1,2 kg Lấy ngẫu nhiên 25 bao bột mì để kiểm tra tìm được trọng lượng đóng gói trung bình của chúng là 15,6 kg Với mức ý nghĩa 5% cần dừng máy để điều chỉnh bao không?

mm

ngẫu nhiên phân phối chuẩn có trung bình là 50 lít Do đường được tu sửa lại, người ta cho rằng mức hao phí xăng trung bình đã giảm xuống Quan sát 26 chuyến xe chạy trên đường AB ta thu được số liệu sau:

Mức hao phí xăng (lít) Số chuyến xe 48.5 – 49.0

49.0 – 49.5 49.5 – 50.0 50.0 – 50.5 50.5 – 51.5

Giải

Gọi m là mức hao phí xăng trung bình của xe ôtô

Từ mẫu trên ta tính được: x =49.558,s =0.584

Trang 12

· Đặt giả thiết cho bài toán:

0 1

H H

mm

1.2.2 Kiểm định so sánh hai trung bình

H H

H H

X Y lần lượt là trung bình của mẫu 1 và mẫu 2

n1,n2 lần lượt là số phần tử của mẫu 1 và mẫu 2

Trang 13

-Bước 2: Tính giá trị quan sát

x y u

u

a

- tra trong bảng phân vị chuẩn)

Bước 4: Kết luận

+ Nếu u WÎ a: Bác bỏ giả thiết, chấp nhận đối thiết

+ Nếu u WÏ a: Chấp nhận giả thiết, bác bỏ đối thiết

trong công thức tính giá trị quan sát Cụ thể giá trị quan sát được xác định như sau:

x y u

-=+

Trang 14

Bước 2: Tính giá trị quan sát

x y u

+ Nếu u WÎ a: Bác bỏ giả thiết, chấp nhận đối thiết

+ Nếu u WÏ a: Chấp nhận giả thiết, bác bỏ đối thiết

1.2.2.3 Các ví dụ

Ví dụ 1.4 : Trồng cùng một loại giống trên hai thửa ruộng như nhau và bón hai loại

phân khác nhau Đến ngày thu hoạch ta có kết quả như sau:

Thửa thứ nhất lấy mẫu 1000 bông lúa thấy số hạt trung bình là x1=70 hạt và độ lệch chuẩn mẫu s1=10 Thửa thứ hai lấy mẫu 500 bông lúa thấy số hạt trung bình của mỗi bông là x2 =72 và s2 =20

Hỏi sự khác nhau giữa x1 và x2 là ngẫu nhiên hay bản chất Hãy kết luận với mức ý nghĩa a =0.05

ïí

¹ïî

Trang 15

Ví dụ 1.5: Thành tích chạy 100m (giây) của 2 nhóm nữ sinh viên thi đậu vào chuyên

ngành đại học Sư phạm TDTT khóa 30 và khóa 31 được cho như sau:

Bảng 1.1: Thành tích chạy 100m của 2 nhóm nữ sinh viên

16.3 16.5 18.4 16.9 16.4 16.8 17.4 15.5

17.0 18.0 18.0 17.8 16.8 17.0 14.9

17.0 16.0 17.9 17.2 17.0 18.0 16.2 17.4 18.3

17.8 17.1 16.3 17.8 19.0 16.8 17.3 18.0

::

H H

Trang 16

-§ Ta thấy u WÏ a nên ta không thể bác bỏ giả thiết H0 với mức ý nghĩa 0,01 Vậy

có thể nói thành tích chạy 100m (giây) trung bình của hai nhóm nữ sinh khóa 30 và 31 bằng nhau hay ý kiến trên là không đúng

Ví dụ 1.6: Có số liệu về 60 tờ séc ở thành phố Alphaville và 100 tờ séc ở thành phố

Betaville như sau:

Bảng 1.2: Bảng số liệu về số tờ séc ở hai thành phố Alphaville và Betaville

Thành phố Số tiền Thành phố Số tiền Thành phố Số tiền Thành phố Số tiền Thành phố Số tiền Alphaville 5777.09 Alphaville 3389.32 Betaville 5277.02 Betaville 867.84 Betaville 8474.79 Alphaville 7084.28 Alphaville 3790.81 Betaville 8466.76 Betaville 7681.87 Betaville 3085.16 Alphaville 8835.02 Alphaville 1947.26 Betaville 6139.15 Betaville 3497.02 Betaville 5367.51 Alphaville 7991.03 Alphaville 8717.98 Betaville 6148.06 Betaville 2787.2 Betaville 4436.18 Alphaville 5973.38 Alphaville 6709.22 Betaville 5091.6 Betaville 2564.88 Betaville 3199.03 Alphaville 4610.17 Alphaville 6363.45 Betaville 6413.81 Betaville 5755.03 Betaville 2259.1 Alphaville 3412.3 Alphaville 6877.04 Betaville 4347.14 Betaville 6072.04 Betaville 4260.72 Alphaville 3432.09 Alphaville 5324.94 Betaville 4382.56 Betaville 6333.22 Betaville 2666.77 Alphaville 5742.21 Alphaville 8725.03 Betaville 1662.87 Betaville 2845.85 Betaville 2956.85 Alphaville 3738.43 Alphaville 8260.05 Betaville 3934.55 Betaville 2989.74 Betaville 5390.57 Alphaville 6962.54 Alphaville 9236.12 Betaville 3193.24 Betaville 5508.15 Betaville 2250.45 Alphaville 3786.4 Alphaville 8120.87 Betaville 7325.73 Betaville 10610.63 Betaville 9031.56 Alphaville 9224.84 Alphaville 5599.97 Betaville 9197.8 Betaville 7147.34 Betaville 6223.58 Alphaville 6204.26 Alphaville 8455.03 Betaville 6453.58 Betaville 5681.7 Betaville 7368.8 Alphaville 4234.49 Alphaville 4556.03 Betaville 6436.26 Betaville 5146.53 Betaville 5549.03 Alphaville 4679.02 Alphaville 5217.34 Betaville 7610.27 Betaville 7317.2 Betaville 4677.99 Alphaville 5450.01 Alphaville 6594.01 Betaville 1766.05 Betaville 1170.19 Betaville 7243.39 Alphaville 3523.68 Alphaville 4882.65 Betaville 5328.59 Betaville 7719.83 Betaville 2526.81 Alphaville 7965.06 Alphaville 6674.81 Betaville 4510.68 Betaville 613.97 Betaville 4864.92 Alphaville 3831.61 Alphaville 7293.22 Betaville 8057.88 Betaville 3721.19 Betaville 7688.37 Alphaville 6941.38 Alphaville 5028.87 Betaville 5962.47 Betaville 5549.84 Betaville 6036.61

Trang 17

Alphaville 5098.01 Alphaville 4270.85 Betaville 4256.96 Betaville 1504.88 Betaville 6328.62 Alphaville 5500.95 Alphaville 5099.8 Betaville 5796.46 Betaville 4562.56 Betaville 5332.64 Alphaville 7442.07 Betaville 3863.02 Betaville 4762.7 Betaville 3737.22 Betaville 1466.56 Alphaville 6322.64 Betaville 10649.82 Betaville 5222.84 Betaville 3795.45 Betaville 6678.37 Alphaville 6419.44 Betaville 6699.12 Betaville 2470.49 Betaville 4473.34 Betaville 1987.66 Alphaville 5959.78 Betaville 3958.07 Betaville 2009.22 Betaville 2536 Betaville 5495.28 Alphaville 2272.12 Alphaville 10744.41 Betaville 6355.62 Betaville 1319.92 Betaville 8177.78 Alphaville 3516.99 Betaville 4708.66 Betaville 2085.26 Betaville 4740.31 Betaville 5838.95 Alphaville 8370.71 Betaville 3086.25 Betaville 2066.4 Betaville 9626.76 Betaville 6714.95 Alphaville 2836.04 Betaville 975.23 Betaville 5706.3 Betaville 1446.65 Betaville 4021.06 Alphaville 6757.57 Betaville 6687.69 Betaville 4898.64 Betaville 4607.03 Betaville 5174.74

Với mức ý nghĩa 1%, hãy kiểm định xem ý kiến sau đúng hay sai: “Giá trị trung bình của các tờ séc ở hai thành phố Alphaville và Betaville là như nhau”

H H

1.2.2.4 Kiểm định sự bằng nhau của hai trung bình bằng phương pháp so sánh

cặp đôi (mẫu phối hợp từng cặp)

Ở phần này ta xét việc kiểm định hai trung bình khi hai mẫu điều tra có cùng kích thước n, trong đó các giá trị của mẫu phụ thuộc tương ứng với nhau theo từng cặp

Trang 18

a Bài toán

Giả sử ta có hai tổng thể nghiên cứu trong đó các biến ngẫu nhiên X1 và X2 cùng phân phối chuẩn với các phương sai chưa biết Với mức ý nghĩa a phải kiểm định giả thiết thống kê:

Trang 19

+ Nếu u WÎ a: Bác bỏ giả thiết, chấp nhận đối thiết

+ Nếu u WÏ a: Chấp nhận giả thiết, bác bỏ đối thiết

c Ví dụ

Ví dụ 1.7: Thành tích chạy 100m của mẫu gồm 46 nam sinh viên chuyên ngành sư phạm TDTT trường Đại Học Cần Thơ khi thi vào trường và thành tích sau một năm tập luyện được cho trong bảng sau:

Bảng 1.3: Thành tích chạy 100m của mẫu gồm 46 sinh viên

STT Thi ĐH Sau 1 năm STT Thi ĐH Sau 1 năm

Trang 20

Với mức ý nghĩa 5%, hãy so sánh thành tích trung bình của các nam sinh viên khi thi và sau một năm tập luyện tại trường Đại Học Cần Thơ?

Giải

Gọi x và A x là thành tích chạy 100m của nam sinh viên khi thi vào trường và B

sau một năm tập luyện tại trường

D i =x A-x B là hiệu số giữa thành tích chạy trung bình của các nam sinh viên khi thi vào trường và sau một năm tập luyện

H H

mm

î

Trang 21

-í - ï

<

ï î

Trang 22

Bước 2: Tính giá trị quan sát

u

a

- tra trong bảng phân vị chuẩn)

Bước 4: Kết luận

+ Nếu u WÎ a: Bác bỏ giả thiết, chấp nhận đối thiết

+ Nếu u WÏ a: Chấp nhận giả thiết, bác bỏ đối thiết

1.3.1.3 Ví dụ

Ví dụ 1.8: Tỷ lệ phế phẩm do một máy tự động sản xuất là 5% Kiểm tra ngẫu nhiên

300 sản phẩm thấy có 24 sản phẩm lầ phế phẩm Từ đó có ý kiến cho rằng tỷ lệ phế phẩm do máy đó sản xuất có chiều hướng tăng lên Hãy kết luận ý kiến nêu trên với mức ý nghĩa a =0.05

Trang 23

· Miền quan sát với mức ý nghĩa a=0.05

2 1 0:

:

p p H

p p H

>

=

Dạng 2:

2 1 1

2 1 0:

:

p p H

p p H

<

=

Dạng 3 :

2 1 1

2 1 0:

:

p p H

p p H

¹

=

Xét hai mẫu có kích thước n 1 , n 2 từ tổng thể thứ nhất, thứ hai Gọi f 1 , f 2 là tỷ lệ

phần tử có tính chất A trong hai mẫu tương ứng Khi đó, tỷ lệ phần tử có tính chất A

của chung hai mẫu là 1 1 2 2

n f n f f

Trang 24

a

- tra trong bảng phân vị chuẩn)

Bước 4: Kết luận

+ Nếu u WÎ a: Bác bỏ giả thiết, chấp nhận đối thiết

+ Nếu u WÏ a: Chấp nhận giả thiết, bác bỏ đối thiết

1.3.2.3 Ví dụ

Ví dụ 1.9: Hiện trạng học sinh bỏ học hiện là vấn đề đang được đặc biệt quan tâm

trong ngành giáo dục nước ta, nhất là ở nông thôn Tại hai trường trung học ở hai vùng nông thôn A và B trong năm học 2009-2010 có các số liệu thống kê sau:

2 1 0:

:

p p H

p p H

Trang 25

· Miền quan sát với mức ý nghĩa a=0.05

( ; 1 ) ( ; 1.645)

Wa = -¥ -u-a = ¥

-· Kết luận: u WÎ a nên ta bác bỏ giả thiết Vậy ta có cơ sở để cho rằng tình trạng

bỏ học ở trường B là nghiệm trọng hơn ở trường A

1.3.3 Kiểm định giả thiết về nhiều tỷ lệ

1.3.3.1 Bài toán

Giả sử có k tổng thể nghiên cứu đặc trưng bởi các biến ngẫu nhiên X 1 , X 2 , …, X k

Gọi p = p(A) là tỷ lệ phần tử A và p 1 , p 2 , …, p k là k giá trị tương ứng của p ở các tổng

thể Với mức ý nghĩa a cho trước hãy kiểm định giả thiết và đối thiết sau:

H p = p = = p

H $ ¹i j p ¹ p i j= k (Có ít nhất hai giá trị khác nhau)

Dựa trên k mẫu ngẫu nhiên độc lập kích thước tương ứng là n1, n2, …, nk và số

lần xuất hiện phần tử A trên k tổng thể lần lượt là m1, m2, …, mk, hãy kiểm định xem giả thiết đúng hay đối thiết đúng

1.3.3.2 Các bước tiến hành

2 2

-Nếu H0 đúng thì c2sẽ phân phối khi bình phương với (k – 1) bậc tự do

Bước 2: Tính giá trị quan sát

2 2

Trang 26

Giá trị ca2(k-1) được tra từ bảng Khi - bình phương với mức xác suất a và bậc

tự do k – 1

Bước 4: Kết luận

+ Nếu c2ÎWa: Bác bỏ giả thiết, chấp nhận đối thiết

+ Nếu c2ÏWa: Chấp nhận giả thiết, bác bỏ đối thiết

1.3.3.3 Ví dụ

Ví dụ 1.10: Để xác định thời vụ phun thuốc diệt sâu có lợi nhất, tổ bảo vệ cây trồng đã

theo dõi các lứa sâu trong từng tháng và đếm số sâu non mới nở bắt được Kết quả cho như sau:

Bảng 1.5: Bảng số sâu non mới nở

2 1

Trang 27

ð Kết luận: Vì c2ÎWa nên ta bác bỏ giả thiết Vậy tỷ lệ sâu non mới nở trong 5 tháng trên là khác nhau

Do đó ta sẽ so sánh tỷ lệ sâu non mới nở trong tháng 3 và tháng 4:

· Giả thiết và đối thiết:

::

· Kết luận: Ta chấp nhận p3 > p4 Vậy tháng 3 có tỷ lệ sâu non mới nở cao nhất

1.4 Kiểm định phương sai

1.4.1 Kiểm định giả thiết về phương sai của biến ngẫu nhiên có phân phối chuẩn 1.4.1.1 Bài toán

Tổng thể được đặc trưng bởi đại lượng ngẫu nhiên X ~ ( ,N m s2), s chưa biết 2

Dựa trên mẫu gồm n quan sát độc lập (X 1 , X 2 , …, X n ), phương sai mẫu hiệu chỉnh là S 2, hãy kiểm định các giả thiết, đối thiết sau:

H H

ï í

H H

ï í

¹ ïî

( 2

0

s là một số cho trước) với mức ý nghĩa a cho trước

Trang 28

1.4.1.2 Các bước thực hành

2 2

2 0

-= phân phối Khi - bình phương với n – 1 bậc tự do

Bước 2: Tính giá trị quan sát

2 0

+ Nếu c2ÎWa: Bác bỏ giả thiết, chấp nhận đối thiết

+ Nếu c2ÏWa: Chấp nhận giả thiết, bác bỏ đối thiết

1.4.1.3 Ví dụ

Ví dụ 1.11: Nếu máy móc hoạt động bình thường thì trọng lượng sản phẩm tuân theo

quy luật chuẩn với độ lệch chuẩn 1 kg Có thể coi máy móc còn hoạt động tốt hay không nếu cân thử 30 sản phẩm ta thấy độ lệch chuẩn mẫu tăng lên tới 1.1 kg Yêu cầu kết luận với mức ý nghĩa a=0.01

H H

ss

2

30 1 1.21

35.091

c

s

-

Trang 29

· Miền quan sát với mức ý nghĩa a =0.01

H H

ï í

H H

ï í

¹ ïî

S

S

ss

S F S

= sẽ phân phối Fisher với bậc tự do là ( , )n n 1 2

Bước 2: Tính giá trị quan sát

2 1 2 2

s F s

= nếu s1>s2

2 1 2 2

s F s

Trang 30

Bước 4: Kết luận

+ Nếu F WÎ a: Bác bỏ giả thiết, chấp nhận đối thiết

+ Nếu F WÏ a: Chấp nhận giả thiết, bác bỏ đối thiết

v Trường hợp 2: Hai trung bình m m1, 2 chưa biết

= F F F((((((( 11111-1,1111 22222

-Nếu H0 đúng thì

2 1 2 2

S F S

= và có phân phối Fisher với bậc tự do là (n1-1,n2-2)

Bước 1: Tính giá trị quan sát

2 1 2 2

s F s

= nếu s1>s2

2 1 2 2

s F s

+ Nếu F WÎ a: Bác bỏ giả thiết, chấp nhận đối thiết

+ Nếu F WÏ a: Chấp nhận giả thiết, bác bỏ đối thiết

Trang 31

1.4.2.3 Ví dụ

vốn Để quyết định xem nên đầu tư vào ngành nào, một người đã thu thập số liệu về hai ngành kinh tế và thu được kết quả sau:

Vậy với mức ý nghĩa 0.05 có thể cho rằng rủi ro đầu tư ở ngành B cao hơn ngành

A hay không? Giả thiết tỷ lệ thu hồi vốn là biến ngẫu nhiên phân phối chuẩn

H H

1611.11 1.44

s F s

· Miền quan sát với mức ý nghĩa a =0.05

( ; 0.95(10,15)) ( ; 0.05(15,10)) ( ; 2.85)

· Kết luận: F WÏ a nên ta chấp nhận giả thiết Vậy ta chưa có cơ sở để cho rằng rủi

ro đầu tư ở ngành B cao hơn ngành A

1.4.3 Kiểm định K phương sai của K biến ngẫu nhiên có phân phối chuẩn

1.4.3.1 Bài toán

Giả sử có k tổng thể nghiên cứu, trong đó các biến ngẫu nhiên X1, X2, …, Xk có cùng phân phối chuẩn Từ các tổng thể rút ra k mẫu độc lập kích thước n1, n2, …, nk và các phương sai điều chỉnh của mẫu tương ứng S S12, , ,22 S k2

Với độ tin cậy 1- cho trước, hãy kiểm định cặp giả thiết, đối thiết sau: a

Trang 32

Ø Nếu các kích thước mẫu n n1, , , 2 ¼ n k khác nhau

Trong trường hợp này chúng ta sẽ sử dụng thống kê Bartlett làm tiêu chuẩn kiểm định Cụ thể:

V B C

=Với:

+ Nếu B WÎ a: Bác bỏ giả thiết, chấp nhận đối thiết

+ Nếu B WÏ a: Chấp nhận giả thiết, bác bỏ đối thiết

Trang 33

Ø Nếu các kích thước mẫu n1=n2=¼=n k =n

Trong trường hợp này ta có thể sử dụng kiểm định Bartlett ở trên, tuy nhiên do phân phối xác suất của của tiêu chuẩn Bartlett chỉ là xấp xỉ nên kết quả kiểm định không thật đáng tin cậy Nên với trường hợp kích thước mẫu bằng nhau ta dùng tiêu chuẩn kiểm định Cochran sẽ cho kết quả tin cậy hơn

+ Nếu G WÎ a: Bác bỏ giả thiết, chấp nhận đối thiết

+ Nếu G WÏ a: Chấp nhận giả thiết, bác bỏ đối thiết

Trang 34

· Ta có:

1.11345

i i

i h s s

V B C

được các phương sai mẫu tương ứng là 2,12; 2,32; 2,24; 2,33 Với mức ý nghĩa 5% hãy kiểm định giả thiết về sự bằng nhau của các phương sai tổng thể?

Giải

Thực hiện các bước tương tự như ví dụ 1.13 ta có:

· Giả thiết và đối thiết

H $ ¹i j s ¹s j= (Có ít nhất hai phương sai khác nhau)

· Giá trị quan sát với thống kê Cochran

Trang 35

CHƯƠNG 2: PHÂN TÍCH PHƯƠNG SAI

2.1 Phân tích phương sai một nhân tố

2.1.1 Bài toán

Giả sử ta quan tâm đến nhân tố X nào đó Nhân tố X có thể xem xét ở k mức độ khác nhau Gọi X i là hiệu quả tác động của nhân tố X ở mức i đối với cá thể ( i = 1,2, ,k ) Trong đó X i là đại lượng ngẫu nhiên có phân phối chuẩn

T T

1

Trung bình x1 x2 … x k

j

i i

n k ji

Ta cần kiểm tra giả thiết: H0:m1=m2= = mk đúng hay sai

Trang 36

=-

· Tính trung bình của bình phương sai số:

SSE MSE

n k

=-

Bước 3: Tính giá trị quan sát:

MSF F

+ Nếu F WÎ a: Bác bỏ giả thiết, chấp nhận đối thiết

+ Nếu F WÏ a: Chấp nhận giả thiết, bác bỏ đối thiết

F Các bước thực hiện trên thông thường được thể hiện bởi bảng tổng kết phân tích Anova sau:

Trang 37

Bảng 2.2: Bảng tóm tắt kết quả phân tích ANOVA một nhân tố

2.1.3 Ví dụ

sau trên các xe chạy thí nghiệm:

Giải Gọi m m m mA, B, C, D lần lượt là số km trung bình đi được/lít của 4 loại xe A, B, C, D

· Đặt giả thiết cho bài toán

SSF MSF

Giá trị kiểm định

1

SSF MSF

k

=

F MSE

=

n k

=-

Trang 38

SSE MSE

F Ta thấy các loại xe đều có mức tiệu thụ xăng khác với các loại xe còn lại Loại xe

C có mức tiêu thụ xăng ít hơn nhiều so với các loại xe A và D Loại xe A thì ngược lại

so với loại xe C, có mức tiêu thụ xăng cao hơn so với các loại khác Loại xe B và loại

xe C có mức tiêu thụ xăng gần như nhau, đều tiết kiệm xăng

F Mức tiêu thục xăng của các loại xe khác nhau có thể được giải thích là do mỗi loại xe được thiết kế theo các tiêu chí khác nhau để phù hợp với nhu cầu đa dạng của người tiêu dùng: tính thời trang, tính tiết kiệm xăng, tính bền của xe,…

2.2 Phân tích phương sai hai nhân tố

Trên thực tế một biến lượng chịu tác động không chỉ một nhân tố mà có hai hay nhiều nhân tố Chẳng hạn năng suất cây trồng chịu ảnh hưởng của của nhân tố giống, nhân tố đất, phương pháp canh tác, … Kết quả học tập của sinh viên chịu ảnh hưởng không những bởi nhân tố giảng viên mà còn bởi nhân tố sỉ số lớp học, …

Trong phần này ta sẽ trình bày kỹ thuật phân tích phương sai hai nhân tố nhằm phát hiện ảnh hưởng của mỗi nhân tố cũng như tác động qua lại của hai nhân tố đó đến biến lượng đang xét

Trang 39

Giả sử chúng ta xét biến ngẫu nhiên X có phân phối chuẩn và quan tâm tới hai nhân tố A và B Nhân tố A được xem xét ở các mức A1, A2, …, Ar, và nhân tố B được xem xét ở các mức B1, B2, …, Bc Chúng ta xét hai trường hợp phân tích phương sai hai nhân tố như sau:

2.2.1 Trường hợp hai nhân tố tác động riêng lẽ

Trong mô hình này chúng ta đã giả thiết rằng A và B cùng tác động lên X, nhưng một cách riêng lẽ Tức là giữa A và B không có mối quan hệ cùng tác động lên X Gọi Xij là đại lượng ngẫu nhiên đo lường hiệu quả việc tác động của mức Ai và

Bj lên cá thể Với mô hình loại này ta có bảng số liệu phân tích phương sai hai nhân tố như sau:

Bảng 2.4: Bảng minh họa phân tích phương sai hai nhân tố tác động riêng lẽ

Từ bảng ta nhận thấy có n = cr nhóm, trong mỗi nhóm chỉ có một quan sát Nếu trong một nhóm có nhiều quan sát ta lấy trị trung bình của nhóm đó làm đại diện

n

ij 1

c

j i

x x

r i j

x x

Trang 40

( )

2 2 2

1 1

T T

T T

SSF MSF

r

=-

· Trung bình bình phương sai số của nhân tố B

1

B B

SSF MSF

c

=-

· Trung bình bình phương của sai số ngẫu nhiên

( 1)( 1)

SSE MSE

=

-v Các bước thực hành

Bước 1: Đặt các giả thiết

§ HA0:”Các mức A1, A2, …, Ar có hiệu quả trung bình như nhau khi tác động lên X”

§ HB0:”Các mức B1, B2, …, Bc có hiệu quả trung bình như nhau khi tác động lên X”

2

1 1

r c ij

r i A

c j B

j

=

Ngày đăng: 18/09/2015, 13:09

HÌNH ẢNH LIÊN QUAN

Hình 3.1: Biểu đồ thể hiện số tiền trên các tờ séc ở Alphaville và Betaville - các phương pháp kiểm định tham số
Hình 3.1 Biểu đồ thể hiện số tiền trên các tờ séc ở Alphaville và Betaville (Trang 55)
Hình 3.2: Biểu đồ tần số thể hiện các chênh lệch - các phương pháp kiểm định tham số
Hình 3.2 Biểu đồ tần số thể hiện các chênh lệch (Trang 58)
Hình 3.3: Biểu đồ thể hiện thành tích chạy 100m của 7 nhóm nữ sinh viên - các phương pháp kiểm định tham số
Hình 3.3 Biểu đồ thể hiện thành tích chạy 100m của 7 nhóm nữ sinh viên (Trang 68)
Hình 3.4: Biểu đồ thể hiện mức tiêu thụ xăng của các loại xe - các phương pháp kiểm định tham số
Hình 3.4 Biểu đồ thể hiện mức tiêu thụ xăng của các loại xe (Trang 72)
Bảng thứ hai thể hiện kết quả của phân tích Anova hai yếu  tố. Với hai giá trị Sig. - các phương pháp kiểm định tham số
Bảng th ứ hai thể hiện kết quả của phân tích Anova hai yếu tố. Với hai giá trị Sig (Trang 82)
Hình 3.7: Đồ thị biểu diễn ảnh hưởng tương tác của thời gian làm thêm và “ mức - các phương pháp kiểm định tham số
Hình 3.7 Đồ thị biểu diễn ảnh hưởng tương tác của thời gian làm thêm và “ mức (Trang 84)
Bảng các giá trị phân vị Chi bình phương  c g 2 ;n - các phương pháp kiểm định tham số
Bảng c ác giá trị phân vị Chi bình phương c g 2 ;n (Trang 87)
Bảng các giá trị phân vị chuẩn - các phương pháp kiểm định tham số
Bảng c ác giá trị phân vị chuẩn (Trang 88)
Bảng phân phối F với  a = 0.01 - các phương pháp kiểm định tham số
Bảng ph ân phối F với a = 0.01 (Trang 90)
Bảng phân phối F với  a = 0.01 - các phương pháp kiểm định tham số
Bảng ph ân phối F với a = 0.01 (Trang 91)
Bảng phân phối F với  a = 0.05 - các phương pháp kiểm định tham số
Bảng ph ân phối F với a = 0.05 (Trang 92)
Bảng phân phối F với  a = 0.05 - các phương pháp kiểm định tham số
Bảng ph ân phối F với a = 0.05 (Trang 93)
Bảng giá trị tới hạn của phân phối Cochran - các phương pháp kiểm định tham số
Bảng gi á trị tới hạn của phân phối Cochran (Trang 94)
Bảng các giá trị phân vị Student - các phương pháp kiểm định tham số
Bảng c ác giá trị phân vị Student (Trang 95)

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w