2 1.2.1 Kiểm định giả thiết về trị trung bình của biến ngẫu nhiên có phân phối chuẩn ..... Kiểm định giả thiết thống kê được coi là một bài toán có ý nghĩa lớn và quan trọng của thống kê
Trang 1TRƯỜNG ĐẠI HỌC CẦN THƠ KHOA KHOA HỌC TỰ NHIÊN
BỘ MÔN TOÁN
-² -
LUẬN VĂN TỐT NGHIỆP
CÁC PHƯƠNG PHÁP KIỂM ĐỊNH THAM SỐ
GIÁO VIÊN HƯỚNG DẪN
ThS DƯƠNG THỊ TUYỀN
BỘ MÔN TOÁN – KHOA KHTN
SINH VIÊN THỰC HIỆN
PHAN THỊ CHINH MSSV: 1107511 NGÀNH: TOÁN ỨNG DỤNG
CẦN THƠ 11/2013
Trang 2LỜI CẢM ƠN
Lời đầu tiên, em xin gởi lời cảm ơn chân thành đến Th.S Dương Thị Tuyền Cảm
ơn sự hướng dẫn nhiệt tình và tận tâm của Cô trong suốt thời gian thực hiện luận văn
Em cũng xin gửi lời cám ơn đến những người Thầy, Cô, đặc biệt là các thầy, cô trong Bộ môn Toán - Khoa Khoa Học Tự Nhiên đã truyền đạt cho em những kiến thức nền tảng vô cùng quý báu, đã luôn tạo mọi điều kiện thuận lợi để em hoàn thành tốt khóa học
Cuối cùng là lời cám ơn sâu sắc đến gia đình, bạn bè và người thân đã hết lòng quan tâm, động viên và giúp đỡ em hoàn thành chương trình học tập
Em xin kính chúc quý Thầy, Cô luôn dồi giàu sức khỏe, luôn thành công trong công việc và trong cuộc sống
Trân trọng!
Cần Thơ, ngày 30 tháng 11 năm 2013
Sinh viên
Phan Thị Chinh
Trang 3MỤC LỤC
Trang
PHẦN MỞ ĐẦU iv
CHƯƠNG 1: KIỂM ĐỊNH THAM SỐ THỐNG KÊ 1
1.1 Sơ lược về bài toán kiểm định giả thiết thống kê 1
1.1.1 Đặt vấn đề 1
1.1.2 Phương pháp kiểm định 1
1.1.3 Sai lầm loại một và sai lầm loại hai 2
1.2 Kiểm định trị trung bình tổng thể 2
1.2.1 Kiểm định giả thiết về trị trung bình của biến ngẫu nhiên có phân phối chuẩn 2
1.2.1.1 Bài toán 2
1.2.1.2 Các bước thực hành 3
1.2.1.3 Ví dụ 4
1.2.2 Kiểm định so sánh hai trung bình 6
1.2.2.1 Bài toán 6
1.2.2.2 Các bước thực hành 6
1.2.2.3 Các ví dụ 8
1.2.2.4 Kiểm định sự bằng nhau của hai trung bình bằng phương pháp so sánh cặp đôi (mẫu phối hợp từng cặp) 11
1.3 Kiểm định tỷ lệ 15
1.3.1 Kiểm định giả thiết về tỷ lệ tổng thể 15
1.3.1.1 Bài toán 15
1.3.1.2 Các bước thực hành 15
1.3.1.3 Ví dụ 16
1.3.2 Kiểm định so sánh hai tỷ lệ 17
1.3.2.1 Bài toán 17
1.3.2.2 Các bước thực hành 17
1.3.2.3 Ví dụ 18
1.3.3 Kiểm định giả thiết về nhiều tỷ lệ 19
1.3.3.1 Bài toán 19
1.3.3.2 Các bước tiến hành 19
1.3.3.3 Ví dụ 20
1.4 Kiểm định phương sai 21
1.4.1 Kiểm định giả thiết về phương sai của biến ngẫu nhiên có phân phối chuẩn 21
1.4.1.1 Bài toán 21
1.4.1.2 Các bước thực hành 22
1.4.1.3 Ví dụ 22
1.4.2 Kiểm định so sánh hai phương sai 23
Trang 41.4.2.1 Bài toán 23
1.4.2.2 Các bước thực hiện 23
1.4.2.3 Ví dụ 25
1.4.3 Kiểm định K phương sai của K biến ngẫu nhiên có phân phối chuẩn 25
1.4.3.1 Bài toán 25
1.4.3.2 Các bước thực hành 26
1.4.3.3 Ví dụ 27
CHƯƠNG 2: PHÂN TÍCH PHƯƠNG SAI 29
2.1 Phân tích phương sai một nhân tố 29
2.1.1 Bài toán 29
2.1.2 Các bước thực hiện 29
2.1.3 Ví dụ 31
2.2 Phân tích phương sai hai nhân tố 32
2.2.1 Trường hợp hai nhân tố tác động riêng lẽ 33
2.2.2 Trường hợp hai nhân tố tác động tổng hợp 38
CHƯƠNG 3: THỰC HIỆN KIỂM ĐỊNH TRÊN SPSS 46
3.1 Kiểm định trung bình tổng thể 46
3.1.1 Kiểm định giả thiết về trung bình của một tổng thể 46
3.1.2 Kiểm định giả thiết về sự bằng nhau của hai trung bình tổng thể 47
3.1.2.1 Kiểm định giả thiết về sự bằng nhau của hai trung bình tổng thể - trường hợp mẫu độc lập 47
3.1.2.2 Kiểm định giả thiết về sự bằng nhau của hai trung bình tổng thể - trường hợp mẫu phụ thuộc hay phối hợp từng cặp 50
3.2 Kiểm định tỷ lệ 53
3.2.1 Kiểm định tỷ lệ của một tổng thể 53
3.2.2 Kiểm định về sự bằng nhau của hai tỷ lệ tổng thể 55
3.2.3 Kiểm định nhiều tỷ lệ tổng thể 57
3.3 Phân tích phương sai 60
3.3.1 Phân tích phương sai một yếu tố (One-Way Anova) 60
3.3.2 Phân tích phương sai hai yếu tố (Two-Way Anova) 67
KẾT LUẬN 79
TÀI LIỆU THAM KHẢO 80
PHỤ LỤC 81
Trang 5PHẦN MỞ ĐẦU
Thống kê là hệ thống các phương pháp dùng để thu thập, xử lý và phân tích các
số liệu thống kê nhằm rút ra các kết luận khoa học và thực tiễn Chính vì thế mà thống
kê đóng một vai trò cực kỳ quan trọng và không thể thiếu trong các nghiên cứu khoa học và trong cuộc sống ngày nay
Kiểm định giả thiết thống kê được coi là một bài toán có ý nghĩa lớn và quan trọng của thống kê toán học với đa dạng các bài toán liên quan tới dấu hiệu nghiên cứu trong tổng thể Trong đó, kiểm định tham số thống kê giải quyết nhanh nhiều bài toán liên quan đến tham số tổng thể hay dạng phân phối xác suất của tổng thể
Bên cạnh đó, phân tích phương sai cũng là một kỹ thuật phân tích thống kê khá nhạy bén Phân tích phương sai được sử dụng để kiểm định giả thiết về giá trị bình khi
có từ 3 nhóm trở lên Kỹ thuật này dựa trên mức độ biến thiên trong nội bộ các nhóm
và biến thiên giữa các trung bình nhóm
Hiện nay, với sự phát triển mạnh mẽ của khoa học máy tính, có rất nhiều phần mềm phục vụ cho việc phân tích và xử lí số liệu thống kê Trong đó nổi bật là phần mềm SPSS với ưu điểm là phần mềm chuyên nghiệp, xử lí nhanh và dễ sử dụng Vì thế, SPSS đã lôi cuốn nhiều người sử dụng
Bắt đầu từ việc muốn hiểu rõ hơn về các phương pháp kiểm định tham số thống
kê, về thủ tục phân tích phương sai, về ứng dụng của SPSS, em chọn đề tài: “Một số phương pháp kiểm định tham số”
Luận văn được viết theo quan điểm thực hành, chú trọng việc áp dụng các phương pháp kiểm định tham số thống kê, phân tích phương sai trong nghiên cứu, trong thực tiễn hơn là trình bày dưới dạng thuần túy toán học Mỗi phương pháp kiểm định đều được minh họa bằng nhiều ví dụ cụ thể ở các lĩnh vực thức tế khác nhau
v Nội dung của luận văn gồm có 3 chương:
Chương 1: Kiểm định tham số thống kê
Giới thiệu về bài toán kiểm định giả thiết thống kê, các loại kiểm định tham số thống kê: kiểm định trung bình, kiểm định tỷ lệ và kiểm định phương sai của biến ngẫu nhiên và cho ví dụ cụ thể trong từng trường hợp
Chương 2: Phân tích phương sai
Giới thiệu và tóm tắt quá trình phân tích phương sai một yếu tố, phân tích phương sai hai yếu tố, cho ví dụ minh họa
Trang 6Chương 3: Thực hiện trên phần mềm SPSS
Đưa ra các ví dụ về bài toán kiểm định tham số thống kê và phân tích phương sai, trình bày cách thực hiện trên phần mềm SPSS, phân tích kết quả, so sánh với phương pháp truyền thống và đưa ra kết luận
Phần kết luận: Trình bày những nhận xét khái quát về đề tài
Vì thời gian có hạn và kiến thức bản thân còn nhiều hạn chế nên luận văn còn có nhiều sai sót Em rất mong nhận được sự đóng góp, chỉ dẫn của quý thầy cô và các bạn
để luận văn được hoàn thiện hơn
Trang 7CHƯƠNG 1: KIỂM ĐỊNH THAM SỐ THỐNG KÊ
1.1 Sơ lược về bài toán kiểm định giả thiết thống kê
Hoặc: q q> 0 Hoặc: q q< 0 Hoặc: q q¹ 0
Giả thiết thống kê đưa ra ở trên có thể đúng hoặc sai và làm như thế nào để biết chính xác điều này Vì vậy cần kiểm định để xác định giả thiết đúng hay sai Kiểm định này được gọi là kiểm định giả thiết tham số thống kê và thực hiện dựa trên thông tin thực nghiệm của mẫu để kết luận
G được gọi là tiêu chuẩn kiểm định
Thực hiện một phép thử đối với mẫu ngẫu nhiên W = (X1, X2, …, Xn) thu được một mẫu cụ thể w = (x1, x2, …, xn) và qua đó tính được một giá trị cụ thể của tiêu chuẩn kiểm định G:
Gqs = f(x1, x2, …, xn,q0) Giá trị này được gọi là giá trị quan sát của kiểm định
Với một xác suất khá bé bằng a cho trước, ta có thể tìm được một miền Watương ứng sao cho P G( ÎW /a H0)= Giá trị a được gọi là mức ý nghĩa của kiểm a
định và miền Wa được gọi là miền bác bỏ của giả thiết H0 với mức ý nghĩa a
Quy tắt kiểm định giả thiết thống kê:
- Nếu G qsÎWa thì bác bỏ giả thiết H0 và chấp nhận đối thiết H1, tức là giả thiết sai và đối thiết đúng
Trang 8- Nếu G qsÏWa thì chấp giả thiết H0 và bác bỏ đối thiết H1, tức là giả thiết đúng
và đối thiết sai
1.1.3 Sai lầm loại một và sai lầm loại hai
Với quy tắt kiểm định như trên, ta có thể mắc hai loại sai lầm:
§ Sai lầm loại 1: Bác bỏ giả thiết H0 trong khi H0 đúng
§ Sai lầm loại 2: Chấp nhận giả thiết H0 trong khi H0 sai
Quan hệ giữa việc kiểm định giả thiết và các loại sai lầm có thể mô tả trong bảng sau:
H0 sai Kết luận đúng
xác suất 1 -a
Sai lầm loại 2 xác suất b
Ta thấy sai lầm loại 1 và sai lầm loại 2 là mâu thuẫn với nhau, tức là với một mẫu kích thước n xác định thì không thể cùng một lúc giảm xác suất mắc hai loại sai lầm trên được Khi ta giảm a đi thì đồng thời sẽ làm tăng b và ngược lại
Thông thường, người ta đặt ra trước mức xác suất mắc sai lầm loại 1 là a và xây dựng một quy tắt kiểm định sao cho xác suất mắc sai lầm loại 2 ( b ) là nhỏ nhất Với
a là mức ý nghĩa của kiểm định
1.2 Kiểm định trị trung bình tổng thể
1.2.1 Kiểm định giả thiết về trị trung bình của biến ngẫu nhiên có phân phối chuẩn
1.2.1.1 Bài toán
Tổng thể được đặc trưng bởi đại lượng ngẫu nhiên X có trung bình m=E X( )
chưa biết Giả sử ta có mẫu gồm n giá trị quan sát độc lập (X1, X2, …, Xn) được chọn ngẫu nhiên từ tổng thể Gọi m s, , X2 và S 2 lần lượt là trung bình và phương sai của tổng thể và của mẫu, và x s, 2tương ứng là các giá trị trung bình và phương sai cụ thể của mẫu
Với mức ý nghĩa a cho trước, cần kiểm định các cặp giả thiết và đối thiết sau:
::
H H
m m
m m
=ì
H H
m m
m m
=ì
î
(m là số cho trước) 0
Trang 9a
- tra trong bảng phân vị chuẩn)
Bước 4: Kết luận
+ Nếu u WÎ a: Bác bỏ giả thiết, chấp nhận đối thiết
+ Nếu u WÏ a: Chấp nhận giả thiết, bác bỏ đối thiết
v Trường hợp 2: Khi chưa biết phương sai Var X( )=s2 và n ³30
Trang 10Bước 4: Kết luận
+ Nếu u WÎ a: Bác bỏ giả thiết, chấp nhận đối thiết
+ Nếu u WÏ a: Chấp nhận giả thiết, bác bỏ đối thiết
v Trường hợp 3: Khi chưa biết phương sai Var X( )=s2 và n <30, X có phân phối chuẩn
Ở trường hợp này, các bước thực hiện giống như trương hợp 2, chỉ khác ở bước tìm miền bác bỏ Cụ thể miền bác bỏ được tìm như sau:
Ví dụ 1.1: Thông qua một mẫu gồm 100 gia đình người ta thu được kết quả là chi tiêu
trung bình hàng tháng của các gia đình đó là 2,455 triệu đồng với độ lệch chuẩn mẫu là 0,3 triệu đồng Với mức ý nghĩa 0,05 có thể cho rằng chi tiêu trung bình hàng tháng của các gia đình ít hơn 2,25 triệu đồng hay không? Giả thiết mức chi tiêu hàng tháng
có phân phối chuẩn
mm
=ì
Trang 11Ví dụ 1.2: Bột mỳ được đóng gói bằng máy tự động có trọng lượng đóng bao theo quy
định là 16 kg và độ lệch chuẩn là 1,2 kg Lấy ngẫu nhiên 25 bao bột mì để kiểm tra tìm được trọng lượng đóng gói trung bình của chúng là 15,6 kg Với mức ý nghĩa 5% cần dừng máy để điều chỉnh bao không?
mm
=ì
ngẫu nhiên phân phối chuẩn có trung bình là 50 lít Do đường được tu sửa lại, người ta cho rằng mức hao phí xăng trung bình đã giảm xuống Quan sát 26 chuyến xe chạy trên đường AB ta thu được số liệu sau:
Mức hao phí xăng (lít) Số chuyến xe 48.5 – 49.0
49.0 – 49.5 49.5 – 50.0 50.0 – 50.5 50.5 – 51.5
Giải
Gọi m là mức hao phí xăng trung bình của xe ôtô
Từ mẫu trên ta tính được: x =49.558,s =0.584
Trang 12· Đặt giả thiết cho bài toán:
0 1
H H
mm
1.2.2 Kiểm định so sánh hai trung bình
H H
=ì
H H
=ì
X Y lần lượt là trung bình của mẫu 1 và mẫu 2
n1,n2 lần lượt là số phần tử của mẫu 1 và mẫu 2
Trang 13-Bước 2: Tính giá trị quan sát
x y u
u
a
- tra trong bảng phân vị chuẩn)
Bước 4: Kết luận
+ Nếu u WÎ a: Bác bỏ giả thiết, chấp nhận đối thiết
+ Nếu u WÏ a: Chấp nhận giả thiết, bác bỏ đối thiết
trong công thức tính giá trị quan sát Cụ thể giá trị quan sát được xác định như sau:
x y u
-=+
Trang 14Bước 2: Tính giá trị quan sát
x y u
+ Nếu u WÎ a: Bác bỏ giả thiết, chấp nhận đối thiết
+ Nếu u WÏ a: Chấp nhận giả thiết, bác bỏ đối thiết
1.2.2.3 Các ví dụ
Ví dụ 1.4 : Trồng cùng một loại giống trên hai thửa ruộng như nhau và bón hai loại
phân khác nhau Đến ngày thu hoạch ta có kết quả như sau:
Thửa thứ nhất lấy mẫu 1000 bông lúa thấy số hạt trung bình là x1=70 hạt và độ lệch chuẩn mẫu s1=10 Thửa thứ hai lấy mẫu 500 bông lúa thấy số hạt trung bình của mỗi bông là x2 =72 và s2 =20
Hỏi sự khác nhau giữa x1 và x2 là ngẫu nhiên hay bản chất Hãy kết luận với mức ý nghĩa a =0.05
ïí
¹ïî
Trang 15Ví dụ 1.5: Thành tích chạy 100m (giây) của 2 nhóm nữ sinh viên thi đậu vào chuyên
ngành đại học Sư phạm TDTT khóa 30 và khóa 31 được cho như sau:
Bảng 1.1: Thành tích chạy 100m của 2 nhóm nữ sinh viên
16.3 16.5 18.4 16.9 16.4 16.8 17.4 15.5
17.0 18.0 18.0 17.8 16.8 17.0 14.9
17.0 16.0 17.9 17.2 17.0 18.0 16.2 17.4 18.3
17.8 17.1 16.3 17.8 19.0 16.8 17.3 18.0
::
H H
Trang 16-§ Ta thấy u WÏ a nên ta không thể bác bỏ giả thiết H0 với mức ý nghĩa 0,01 Vậy
có thể nói thành tích chạy 100m (giây) trung bình của hai nhóm nữ sinh khóa 30 và 31 bằng nhau hay ý kiến trên là không đúng
Ví dụ 1.6: Có số liệu về 60 tờ séc ở thành phố Alphaville và 100 tờ séc ở thành phố
Betaville như sau:
Bảng 1.2: Bảng số liệu về số tờ séc ở hai thành phố Alphaville và Betaville
Thành phố Số tiền Thành phố Số tiền Thành phố Số tiền Thành phố Số tiền Thành phố Số tiền Alphaville 5777.09 Alphaville 3389.32 Betaville 5277.02 Betaville 867.84 Betaville 8474.79 Alphaville 7084.28 Alphaville 3790.81 Betaville 8466.76 Betaville 7681.87 Betaville 3085.16 Alphaville 8835.02 Alphaville 1947.26 Betaville 6139.15 Betaville 3497.02 Betaville 5367.51 Alphaville 7991.03 Alphaville 8717.98 Betaville 6148.06 Betaville 2787.2 Betaville 4436.18 Alphaville 5973.38 Alphaville 6709.22 Betaville 5091.6 Betaville 2564.88 Betaville 3199.03 Alphaville 4610.17 Alphaville 6363.45 Betaville 6413.81 Betaville 5755.03 Betaville 2259.1 Alphaville 3412.3 Alphaville 6877.04 Betaville 4347.14 Betaville 6072.04 Betaville 4260.72 Alphaville 3432.09 Alphaville 5324.94 Betaville 4382.56 Betaville 6333.22 Betaville 2666.77 Alphaville 5742.21 Alphaville 8725.03 Betaville 1662.87 Betaville 2845.85 Betaville 2956.85 Alphaville 3738.43 Alphaville 8260.05 Betaville 3934.55 Betaville 2989.74 Betaville 5390.57 Alphaville 6962.54 Alphaville 9236.12 Betaville 3193.24 Betaville 5508.15 Betaville 2250.45 Alphaville 3786.4 Alphaville 8120.87 Betaville 7325.73 Betaville 10610.63 Betaville 9031.56 Alphaville 9224.84 Alphaville 5599.97 Betaville 9197.8 Betaville 7147.34 Betaville 6223.58 Alphaville 6204.26 Alphaville 8455.03 Betaville 6453.58 Betaville 5681.7 Betaville 7368.8 Alphaville 4234.49 Alphaville 4556.03 Betaville 6436.26 Betaville 5146.53 Betaville 5549.03 Alphaville 4679.02 Alphaville 5217.34 Betaville 7610.27 Betaville 7317.2 Betaville 4677.99 Alphaville 5450.01 Alphaville 6594.01 Betaville 1766.05 Betaville 1170.19 Betaville 7243.39 Alphaville 3523.68 Alphaville 4882.65 Betaville 5328.59 Betaville 7719.83 Betaville 2526.81 Alphaville 7965.06 Alphaville 6674.81 Betaville 4510.68 Betaville 613.97 Betaville 4864.92 Alphaville 3831.61 Alphaville 7293.22 Betaville 8057.88 Betaville 3721.19 Betaville 7688.37 Alphaville 6941.38 Alphaville 5028.87 Betaville 5962.47 Betaville 5549.84 Betaville 6036.61
Trang 17Alphaville 5098.01 Alphaville 4270.85 Betaville 4256.96 Betaville 1504.88 Betaville 6328.62 Alphaville 5500.95 Alphaville 5099.8 Betaville 5796.46 Betaville 4562.56 Betaville 5332.64 Alphaville 7442.07 Betaville 3863.02 Betaville 4762.7 Betaville 3737.22 Betaville 1466.56 Alphaville 6322.64 Betaville 10649.82 Betaville 5222.84 Betaville 3795.45 Betaville 6678.37 Alphaville 6419.44 Betaville 6699.12 Betaville 2470.49 Betaville 4473.34 Betaville 1987.66 Alphaville 5959.78 Betaville 3958.07 Betaville 2009.22 Betaville 2536 Betaville 5495.28 Alphaville 2272.12 Alphaville 10744.41 Betaville 6355.62 Betaville 1319.92 Betaville 8177.78 Alphaville 3516.99 Betaville 4708.66 Betaville 2085.26 Betaville 4740.31 Betaville 5838.95 Alphaville 8370.71 Betaville 3086.25 Betaville 2066.4 Betaville 9626.76 Betaville 6714.95 Alphaville 2836.04 Betaville 975.23 Betaville 5706.3 Betaville 1446.65 Betaville 4021.06 Alphaville 6757.57 Betaville 6687.69 Betaville 4898.64 Betaville 4607.03 Betaville 5174.74
Với mức ý nghĩa 1%, hãy kiểm định xem ý kiến sau đúng hay sai: “Giá trị trung bình của các tờ séc ở hai thành phố Alphaville và Betaville là như nhau”
H H
1.2.2.4 Kiểm định sự bằng nhau của hai trung bình bằng phương pháp so sánh
cặp đôi (mẫu phối hợp từng cặp)
Ở phần này ta xét việc kiểm định hai trung bình khi hai mẫu điều tra có cùng kích thước n, trong đó các giá trị của mẫu phụ thuộc tương ứng với nhau theo từng cặp
Trang 18a Bài toán
Giả sử ta có hai tổng thể nghiên cứu trong đó các biến ngẫu nhiên X1 và X2 cùng phân phối chuẩn với các phương sai chưa biết Với mức ý nghĩa a phải kiểm định giả thiết thống kê:
Trang 19+ Nếu u WÎ a: Bác bỏ giả thiết, chấp nhận đối thiết
+ Nếu u WÏ a: Chấp nhận giả thiết, bác bỏ đối thiết
c Ví dụ
Ví dụ 1.7: Thành tích chạy 100m của mẫu gồm 46 nam sinh viên chuyên ngành sư phạm TDTT trường Đại Học Cần Thơ khi thi vào trường và thành tích sau một năm tập luyện được cho trong bảng sau:
Bảng 1.3: Thành tích chạy 100m của mẫu gồm 46 sinh viên
STT Thi ĐH Sau 1 năm STT Thi ĐH Sau 1 năm
Trang 20Với mức ý nghĩa 5%, hãy so sánh thành tích trung bình của các nam sinh viên khi thi và sau một năm tập luyện tại trường Đại Học Cần Thơ?
Giải
Gọi x và A x là thành tích chạy 100m của nam sinh viên khi thi vào trường và B
sau một năm tập luyện tại trường
Và D i =x A-x B là hiệu số giữa thành tích chạy trung bình của các nam sinh viên khi thi vào trường và sau một năm tập luyện
H H
mm
=ì
î
Trang 21=ì
=ì
=ì
-í - ï
<
ï î
Trang 22Bước 2: Tính giá trị quan sát
u
a
- tra trong bảng phân vị chuẩn)
Bước 4: Kết luận
+ Nếu u WÎ a: Bác bỏ giả thiết, chấp nhận đối thiết
+ Nếu u WÏ a: Chấp nhận giả thiết, bác bỏ đối thiết
1.3.1.3 Ví dụ
Ví dụ 1.8: Tỷ lệ phế phẩm do một máy tự động sản xuất là 5% Kiểm tra ngẫu nhiên
300 sản phẩm thấy có 24 sản phẩm lầ phế phẩm Từ đó có ý kiến cho rằng tỷ lệ phế phẩm do máy đó sản xuất có chiều hướng tăng lên Hãy kết luận ý kiến nêu trên với mức ý nghĩa a =0.05
Trang 23· Miền quan sát với mức ý nghĩa a=0.05
2 1 0:
:
p p H
p p H
>
=
Dạng 2:
2 1 1
2 1 0:
:
p p H
p p H
<
=
Dạng 3 :
2 1 1
2 1 0:
:
p p H
p p H
¹
=
Xét hai mẫu có kích thước n 1 , n 2 từ tổng thể thứ nhất, thứ hai Gọi f 1 , f 2 là tỷ lệ
phần tử có tính chất A trong hai mẫu tương ứng Khi đó, tỷ lệ phần tử có tính chất A
của chung hai mẫu là 1 1 2 2
n f n f f
Trang 24a
- tra trong bảng phân vị chuẩn)
Bước 4: Kết luận
+ Nếu u WÎ a: Bác bỏ giả thiết, chấp nhận đối thiết
+ Nếu u WÏ a: Chấp nhận giả thiết, bác bỏ đối thiết
1.3.2.3 Ví dụ
Ví dụ 1.9: Hiện trạng học sinh bỏ học hiện là vấn đề đang được đặc biệt quan tâm
trong ngành giáo dục nước ta, nhất là ở nông thôn Tại hai trường trung học ở hai vùng nông thôn A và B trong năm học 2009-2010 có các số liệu thống kê sau:
2 1 0:
:
p p H
p p H
Trang 25· Miền quan sát với mức ý nghĩa a=0.05
( ; 1 ) ( ; 1.645)
Wa = -¥ -u-a = ¥
-· Kết luận: u WÎ a nên ta bác bỏ giả thiết Vậy ta có cơ sở để cho rằng tình trạng
bỏ học ở trường B là nghiệm trọng hơn ở trường A
1.3.3 Kiểm định giả thiết về nhiều tỷ lệ
1.3.3.1 Bài toán
Giả sử có k tổng thể nghiên cứu đặc trưng bởi các biến ngẫu nhiên X 1 , X 2 , …, X k
Gọi p = p(A) là tỷ lệ phần tử A và p 1 , p 2 , …, p k là k giá trị tương ứng của p ở các tổng
thể Với mức ý nghĩa a cho trước hãy kiểm định giả thiết và đối thiết sau:
H p = p = = p
H $ ¹i j p ¹ p i j= k (Có ít nhất hai giá trị khác nhau)
Dựa trên k mẫu ngẫu nhiên độc lập kích thước tương ứng là n1, n2, …, nk và số
lần xuất hiện phần tử A trên k tổng thể lần lượt là m1, m2, …, mk, hãy kiểm định xem giả thiết đúng hay đối thiết đúng
1.3.3.2 Các bước tiến hành
2 2
-Nếu H0 đúng thì c2sẽ phân phối khi bình phương với (k – 1) bậc tự do
Bước 2: Tính giá trị quan sát
2 2
Trang 26Giá trị ca2(k-1) được tra từ bảng Khi - bình phương với mức xác suất a và bậc
tự do k – 1
Bước 4: Kết luận
+ Nếu c2ÎWa: Bác bỏ giả thiết, chấp nhận đối thiết
+ Nếu c2ÏWa: Chấp nhận giả thiết, bác bỏ đối thiết
1.3.3.3 Ví dụ
Ví dụ 1.10: Để xác định thời vụ phun thuốc diệt sâu có lợi nhất, tổ bảo vệ cây trồng đã
theo dõi các lứa sâu trong từng tháng và đếm số sâu non mới nở bắt được Kết quả cho như sau:
Bảng 1.5: Bảng số sâu non mới nở
2 1
Trang 27ð Kết luận: Vì c2ÎWa nên ta bác bỏ giả thiết Vậy tỷ lệ sâu non mới nở trong 5 tháng trên là khác nhau
Do đó ta sẽ so sánh tỷ lệ sâu non mới nở trong tháng 3 và tháng 4:
· Giả thiết và đối thiết:
::
· Kết luận: Ta chấp nhận p3 > p4 Vậy tháng 3 có tỷ lệ sâu non mới nở cao nhất
1.4 Kiểm định phương sai
1.4.1 Kiểm định giả thiết về phương sai của biến ngẫu nhiên có phân phối chuẩn 1.4.1.1 Bài toán
Tổng thể được đặc trưng bởi đại lượng ngẫu nhiên X ~ ( ,N m s2), s chưa biết 2
Dựa trên mẫu gồm n quan sát độc lập (X 1 , X 2 , …, X n ), phương sai mẫu hiệu chỉnh là S 2, hãy kiểm định các giả thiết, đối thiết sau:
H H
ï í
H H
ï í
¹ ïî
( 2
0
s là một số cho trước) với mức ý nghĩa a cho trước
Trang 281.4.1.2 Các bước thực hành
2 2
2 0
-= phân phối Khi - bình phương với n – 1 bậc tự do
Bước 2: Tính giá trị quan sát
2 0
+ Nếu c2ÎWa: Bác bỏ giả thiết, chấp nhận đối thiết
+ Nếu c2ÏWa: Chấp nhận giả thiết, bác bỏ đối thiết
1.4.1.3 Ví dụ
Ví dụ 1.11: Nếu máy móc hoạt động bình thường thì trọng lượng sản phẩm tuân theo
quy luật chuẩn với độ lệch chuẩn 1 kg Có thể coi máy móc còn hoạt động tốt hay không nếu cân thử 30 sản phẩm ta thấy độ lệch chuẩn mẫu tăng lên tới 1.1 kg Yêu cầu kết luận với mức ý nghĩa a=0.01
H H
ss
2
30 1 1.21
35.091
c
s
-
Trang 29· Miền quan sát với mức ý nghĩa a =0.01
H H
ï í
H H
ï í
¹ ïî
S
S
ss
S F S
= sẽ phân phối Fisher với bậc tự do là ( , )n n 1 2
Bước 2: Tính giá trị quan sát
2 1 2 2
s F s
= nếu s1>s2
2 1 2 2
s F s
Trang 30Bước 4: Kết luận
+ Nếu F WÎ a: Bác bỏ giả thiết, chấp nhận đối thiết
+ Nếu F WÏ a: Chấp nhận giả thiết, bác bỏ đối thiết
v Trường hợp 2: Hai trung bình m m1, 2 chưa biết
= F F F((((((( 11111-1,1111 22222
-Nếu H0 đúng thì
2 1 2 2
S F S
= và có phân phối Fisher với bậc tự do là (n1-1,n2-2)
Bước 1: Tính giá trị quan sát
2 1 2 2
s F s
= nếu s1>s2
2 1 2 2
s F s
+ Nếu F WÎ a: Bác bỏ giả thiết, chấp nhận đối thiết
+ Nếu F WÏ a: Chấp nhận giả thiết, bác bỏ đối thiết
Trang 311.4.2.3 Ví dụ
vốn Để quyết định xem nên đầu tư vào ngành nào, một người đã thu thập số liệu về hai ngành kinh tế và thu được kết quả sau:
Vậy với mức ý nghĩa 0.05 có thể cho rằng rủi ro đầu tư ở ngành B cao hơn ngành
A hay không? Giả thiết tỷ lệ thu hồi vốn là biến ngẫu nhiên phân phối chuẩn
H H
1611.11 1.44
s F s
· Miền quan sát với mức ý nghĩa a =0.05
( ; 0.95(10,15)) ( ; 0.05(15,10)) ( ; 2.85)
· Kết luận: F WÏ a nên ta chấp nhận giả thiết Vậy ta chưa có cơ sở để cho rằng rủi
ro đầu tư ở ngành B cao hơn ngành A
1.4.3 Kiểm định K phương sai của K biến ngẫu nhiên có phân phối chuẩn
1.4.3.1 Bài toán
Giả sử có k tổng thể nghiên cứu, trong đó các biến ngẫu nhiên X1, X2, …, Xk có cùng phân phối chuẩn Từ các tổng thể rút ra k mẫu độc lập kích thước n1, n2, …, nk và các phương sai điều chỉnh của mẫu tương ứng S S12, , ,22 S k2
Với độ tin cậy 1- cho trước, hãy kiểm định cặp giả thiết, đối thiết sau: a
Trang 32Ø Nếu các kích thước mẫu n n1, , , 2 ¼ n k khác nhau
Trong trường hợp này chúng ta sẽ sử dụng thống kê Bartlett làm tiêu chuẩn kiểm định Cụ thể:
V B C
=Với:
+ Nếu B WÎ a: Bác bỏ giả thiết, chấp nhận đối thiết
+ Nếu B WÏ a: Chấp nhận giả thiết, bác bỏ đối thiết
Trang 33Ø Nếu các kích thước mẫu n1=n2=¼=n k =n
Trong trường hợp này ta có thể sử dụng kiểm định Bartlett ở trên, tuy nhiên do phân phối xác suất của của tiêu chuẩn Bartlett chỉ là xấp xỉ nên kết quả kiểm định không thật đáng tin cậy Nên với trường hợp kích thước mẫu bằng nhau ta dùng tiêu chuẩn kiểm định Cochran sẽ cho kết quả tin cậy hơn
+ Nếu G WÎ a: Bác bỏ giả thiết, chấp nhận đối thiết
+ Nếu G WÏ a: Chấp nhận giả thiết, bác bỏ đối thiết
Trang 34· Ta có:
1.11345
i i
i h s s
V B C
được các phương sai mẫu tương ứng là 2,12; 2,32; 2,24; 2,33 Với mức ý nghĩa 5% hãy kiểm định giả thiết về sự bằng nhau của các phương sai tổng thể?
Giải
Thực hiện các bước tương tự như ví dụ 1.13 ta có:
· Giả thiết và đối thiết
H $ ¹i j s ¹s j= (Có ít nhất hai phương sai khác nhau)
· Giá trị quan sát với thống kê Cochran
Trang 35CHƯƠNG 2: PHÂN TÍCH PHƯƠNG SAI
2.1 Phân tích phương sai một nhân tố
2.1.1 Bài toán
Giả sử ta quan tâm đến nhân tố X nào đó Nhân tố X có thể xem xét ở k mức độ khác nhau Gọi X i là hiệu quả tác động của nhân tố X ở mức i đối với cá thể ( i = 1,2, ,k ) Trong đó X i là đại lượng ngẫu nhiên có phân phối chuẩn
T T
1
Trung bình x1 x2 … x k
j
i i
n k ji
Ta cần kiểm tra giả thiết: H0:m1=m2= = mk đúng hay sai
Trang 36=-
· Tính trung bình của bình phương sai số:
SSE MSE
n k
=-
Bước 3: Tính giá trị quan sát:
MSF F
+ Nếu F WÎ a: Bác bỏ giả thiết, chấp nhận đối thiết
+ Nếu F WÏ a: Chấp nhận giả thiết, bác bỏ đối thiết
F Các bước thực hiện trên thông thường được thể hiện bởi bảng tổng kết phân tích Anova sau:
Trang 37Bảng 2.2: Bảng tóm tắt kết quả phân tích ANOVA một nhân tố
2.1.3 Ví dụ
sau trên các xe chạy thí nghiệm:
Giải Gọi m m m mA, B, C, D lần lượt là số km trung bình đi được/lít của 4 loại xe A, B, C, D
· Đặt giả thiết cho bài toán
SSF MSF
Giá trị kiểm định
1
SSF MSF
k
=
F MSE
=
n k
=-
Trang 38SSE MSE
F Ta thấy các loại xe đều có mức tiệu thụ xăng khác với các loại xe còn lại Loại xe
C có mức tiêu thụ xăng ít hơn nhiều so với các loại xe A và D Loại xe A thì ngược lại
so với loại xe C, có mức tiêu thụ xăng cao hơn so với các loại khác Loại xe B và loại
xe C có mức tiêu thụ xăng gần như nhau, đều tiết kiệm xăng
F Mức tiêu thục xăng của các loại xe khác nhau có thể được giải thích là do mỗi loại xe được thiết kế theo các tiêu chí khác nhau để phù hợp với nhu cầu đa dạng của người tiêu dùng: tính thời trang, tính tiết kiệm xăng, tính bền của xe,…
2.2 Phân tích phương sai hai nhân tố
Trên thực tế một biến lượng chịu tác động không chỉ một nhân tố mà có hai hay nhiều nhân tố Chẳng hạn năng suất cây trồng chịu ảnh hưởng của của nhân tố giống, nhân tố đất, phương pháp canh tác, … Kết quả học tập của sinh viên chịu ảnh hưởng không những bởi nhân tố giảng viên mà còn bởi nhân tố sỉ số lớp học, …
Trong phần này ta sẽ trình bày kỹ thuật phân tích phương sai hai nhân tố nhằm phát hiện ảnh hưởng của mỗi nhân tố cũng như tác động qua lại của hai nhân tố đó đến biến lượng đang xét
Trang 39Giả sử chúng ta xét biến ngẫu nhiên X có phân phối chuẩn và quan tâm tới hai nhân tố A và B Nhân tố A được xem xét ở các mức A1, A2, …, Ar, và nhân tố B được xem xét ở các mức B1, B2, …, Bc Chúng ta xét hai trường hợp phân tích phương sai hai nhân tố như sau:
2.2.1 Trường hợp hai nhân tố tác động riêng lẽ
Trong mô hình này chúng ta đã giả thiết rằng A và B cùng tác động lên X, nhưng một cách riêng lẽ Tức là giữa A và B không có mối quan hệ cùng tác động lên X Gọi Xij là đại lượng ngẫu nhiên đo lường hiệu quả việc tác động của mức Ai và
Bj lên cá thể Với mô hình loại này ta có bảng số liệu phân tích phương sai hai nhân tố như sau:
Bảng 2.4: Bảng minh họa phân tích phương sai hai nhân tố tác động riêng lẽ
Từ bảng ta nhận thấy có n = cr nhóm, trong mỗi nhóm chỉ có một quan sát Nếu trong một nhóm có nhiều quan sát ta lấy trị trung bình của nhóm đó làm đại diện
n
ij 1
c
j i
x x
r i j
x x
Trang 40( )
2 2 2
1 1
T T
T T
SSF MSF
r
=-
· Trung bình bình phương sai số của nhân tố B
1
B B
SSF MSF
c
=-
· Trung bình bình phương của sai số ngẫu nhiên
( 1)( 1)
SSE MSE
=
-v Các bước thực hành
Bước 1: Đặt các giả thiết
§ HA0:”Các mức A1, A2, …, Ar có hiệu quả trung bình như nhau khi tác động lên X”
§ HB0:”Các mức B1, B2, …, Bc có hiệu quả trung bình như nhau khi tác động lên X”
2
1 1
r c ij
r i A
c j B
j
=