Bài giảng Thống kê cho khoa học xã hội - Bài 4: Kiểm định phi tham số được biên soạn bao gồm các nội dung về kiểm định Mann-Whitney; kiểm định dấu và kiểm định tổng hạng có dấu Wilconxon; kiểm định Khi bình phương.
Trang 1GIỚI THIỆU MÔN HỌC
1
THỐNG KÊ CHO KHOA HỌC XÃ HỘI
Giảng viên: ThS Nguyễn Thị Xuân Mai
Trang 2BÀI 4 KIỂM ĐỊNH PHI THAM SỐ
Giảng viên: ThS Nguyễn Thị Xuân Mai
Trang 3MỤC TIÊU BÀI HỌC
• Trình bày phương pháp kiểm định Mann-Whitney
khi so sánh hai mẫu độc lập với các biến thứ bậc
• Trình bày phương pháp kiểm định dấu và kiểm định
tổng hạng có dấu Wilconxon khi so sánh hai mẫu
phụ thuộc với các biến thứ bậc
• Trình bày phương pháp kiểm định Khi bình phương
để thấy sự phù hợp
3
• Áp dụng phương pháp Khi bình phương để kiểm định mối liên hệ giữa hai tiêu thứcđược trình bày qua bảng chéo
• Dựa vào phương pháp Khi bình phương để tính toán các tham số đo lường mối liên
hệ giữa các biến định danh: Lambda, Hệ số Phi, Cramer’s V
Trang 4CÁC KIẾN THỨC CẦN CÓ
Kiến thức chung về kinh tế - xã hội
Trang 5HƯỚNG DẪN HỌC
• Đọc tài liệu tham khảo
• Thảo luận với giáo viên và các sinh viên khác về
những vấn đề chưa hiểu rõ
• Trả lời các câu hỏi của bài học
• Đọc và tìm hiểu thêm về các phương pháp kiểm
định phi tham số
5
Trang 6CẤU TRÚC NỘI DUNG
Kiểm định dấu và kiểm định tổng hạng có dấu Wilconxon
Trang 7KIỂM ĐỊNH PHI THAM SỐ
Có xu hướng sử dụng ít thông tin hơn kiểm định tham số
Khả năng tìm ra được sự sai biệt kém, không mạnh như các phép kiểm định cótham số (T student, phân tích phương sai…), đồng thời khó mở rộng để giảiquyết các mô hình kinh tế phức tạp
7
Trang 84.1 KIỂM ĐỊNH MANN-WHITNEY
• Kiểm định Mann-Whitney U là một trong những kiểm định dựa trên xếp hạng Cácquan sát sẽ được xếp hạng từ giá trị nhỏ nhất tới lớn nhất và sau đó thứ hạng sẽđược sử dụng thay cho các giá trị thực trong tính toán
• Kiểm định Mann-Whitney U dùng để kiểm định liệu có tồn tại sự khác biệt giữa haitổng thể, với điều kiện:
Tổng thể không có phân phối chuẩn;
Dữ liệu ít nhất phải có thang đo thứ bậc;
Hai mẫu được chọn ngẫu nhiên độc lập với nhau
• Giả thuyết cần kiểm định:
H0: Phân phối của hai tổng thể là giống hệt nhau (μ1= μ2)
Lưu ý: kiểm định Mann-Whitney U giống kiểm định tổng hạng Wilconxon.
Trang 94.1 KIỂM ĐỊNH MANN-WHITNEY
9
Trang 104.1 KIỂM ĐỊNH MANN-WHITNEY
Trang 114.1 KIỂM ĐỊNH MANN-WHITNEY (tiếp theo)
• Trường hợp tạo mẫu lớn: n1, n2 > 10
Kết hợp hai mẫu ngẫu nhiên và xếp hạng tất cả các quan sát từ nhỏ nhất tới lớnnhất Những giá trị bằng nhau sẽ nhận hạng trung bình của các hạng liên tiếp
Tính tổng các thứ hạng riêng cho từng mẫu, giá trị nào lớn hơn, ký hiệu là R1
Giá trị của thống kê U:
Tiêu chuẩn kiểm định là thống kê z có phân phối xấp xỉ chuẩn:
n n
U U
Trang 124.1 KIỂM ĐỊNH MANN-WHITNEY (tiếp theo)
Ví dụ: Để kiểm tra xem liệu hai phương pháp học ngoại ngữ mới có hiệu quả như nhau
không, ta thu thập một cách ngẫu nhiên điểm số của 15 người mỗi nhóm Với số liệunày, liệu có thể kết luận phương pháp thứ hai hiệu quả hơn không?
Phương pháp 1: 65, 57, 74, 43, 39, 88, 62, 69, 70, 72, 59, 60, 80, 83, 50
Phương pháp 2: 85, 87, 92, 98, 90, 88, 75, 72, 60, 93, 88, 89, 96, 73, 62
• Kết hợp hai mẫu lại với nhau và xếp hạng theo thứ tự từ nhỏ đến lớn
• Dễ dàng thấy rằng phương pháp 2 có tổng xếp hạng cao hơn phương pháp 1, vậy
R =6.5+8.5+13.5+15+16+17+20+21+23+23+25+26+27+28+29+30=312.5
Trang 134.1 KIỂM ĐỊNH MANN-WHITNEY (tiếp theo)
• Giá trị của thống kê U là:
• Trung bình của U:
• Độ lệch tiêu chuẩn của U:
• Tiêu chuẩn kiểm định z:
Trang 144.2 KIỂM ĐỊNH DẤU VÀ KIỂM ĐỊNH TỔNG HẠNG CÓ DẤU WILCONXON
4.2.1 Kiểm định dấu
4.2.2 Kiểm định tổnghạng có dấu Wilconxon
Trang 154.2.1 KIỂM ĐỊNH DẤU
• Kiểm định dấu dùng để kiểm định về giá trị trung vị của một tổng thể
Bài toán: Để kiểm định xem liệu giá trị trung vị có bằng một giá trị cho trước nào
đó (M), ta lấy một mẫu và so sánh các giá trị đó với giá trị trung vị phỏngđoán trên
Giả thuyết cần kiểm định: H0: Giá trị của số trung vị = M
Nếu số liệu có giá trị lớn hơn M, nhận dấu dương Nếu số liệu có giá trị nhỏhơn M, nhận dấu âm Nếu số liệu bằng M, nhận kết quả 0, loại khỏinghiên cứu
Số dấu âm và số dấu dương sẽ được so sánh với nhau Nếu số dấu âm và sốdấu dương bằng nhau, giả thuyết H0 là đúng
Trường hợp mẫu nhỏ, n < 20
Tiêu chuẩn kiểm định là số dấu âm hoặc số dấu dương mà có giá trị nhỏ hơn
Tra bảng giá trị tới hạn của kiểm định dấu với cỡ mẫu là tổng số dấu âm và sốdấu dương và mức ý nghĩa α
Bác bỏ H0 nếu tiêu chuẩn kiểm định nhỏ hơn giá trị tới hạn tra bảng
15
Trang 164.2.1 KIỂM ĐỊNH DẤU
Ví dụ: Có ý kiến cho rằng, giá trị trung vị về năng suất lao động của Doanh nghiệp A là
40 triệu đồng/tháng Một mẫu ngẫu nhiên gồm 20 lao động được chọn ra để nghiêncứu, cho thấy, có 15 người có năng suất lao động nhỏ hơn 40 triệu đồng/tháng, 3 người
có suất lao động lớn hơn 40 triệu đồng/tháng và 2 người có năng suất lao động bằng 40triệu đồng/tháng
• Giả thuyết: H0: Me= 40 H1: Me ≠ 40
• Số dấu âm là 15, số dấu dương là 3 Tiêu chuẩn kiểm định là min (15,3)=3
• Giá trị tới hạn ở mức 0,05 cho kiểm định hai phía với n = 18 là 4 → Bác bỏ H0
Trang 174.2.1 KIỂM ĐỊNH DẤU (tiếp theo)
Trường hợp mẫu lớn, n 20
Khi mẫu lớn tiêu chuẩn kiểm định có phân phối xấp xỉ chuẩn, được tính như sau:
Trong đó: X = min (số dấu dương, số dấu âm)
n: qui mô mẫu
Ví dụ: Theo một báo cáo, tuổi trung vị của người dân địa phương A là 36,4 Một nhànghiên cứu đã lựa chọn 50 người dân và thấy có 21 người nhiều hơn 36,4 tuổi Vớimức ý nghĩa 0,05, liệu có thể khẳng định tuổi trung vị thấp nhất là 36,4 không?
Giả thuyết cần kiểm định: H0: Me 36,4 H1: Me < 36,4
Có 21 người nhiều hơn 36,4 tuổi Vậy có 29 người nhỏ hơn hoặc bằng 36,4 tuổi
Vậy giá trị X = min(21,29) = 21
Tiêu chuẩn kiểm định:
Tra bảng tìm giá trị tới hạn với n = 50 và = 0,05 cho kiểm định phía trái, giá trịtới hạn là -1,65
Vì z = -0,99 > -1,65, chưa đủ cơ sở bác bỏ H0
Không có đủ bằng chứng để bác bỏ ý kiến trên (tuổi trung vị thấp nhất là 36,4)
2/ 2
n X
Trang 184.2.1 KIỂM ĐỊNH DẤU (tiếp theo)
• Kiểm định dấu dùng để kiểm định giả thuyết với hai mẫu tương đồng từng cặp
• Bài toán: để kiểm tra trung bình của mẫu khi so sánh hai mẫu phụ thuộc, chẳng hạnnhư kiểm định trước – sau
• Ví dụ: Một nghiên cứu cho rằng, nếu những người đi bơi có đeo nút bịt tai thì số lầnnhiễm trùng tai sẽ giảm xuống Một mẫu gồm 10 người được lựa chọn để ghi lại sốlần nhiễm trùng tai trong 4 tháng Trong 2 tháng đầu, họ không dùng nút bịt tai, 2tháng sau có dùng nút bịt tai Vào đầu của chu kỳ 2 tháng sau, mỗi người sẽ đượckiểm tra để chắc chắn là không bị nhiễm trùng tai
Trang 194.2.1 KIỂM ĐỊNH DẤU (tiếp theo)
Số dấu âm là 2, số dấu dương là 7
Tiêu chuẩn kiểm định là min(2,7) = 2
Tra bảng với n = 2+7 = 9, α = 0,05 cho
kiểm định một phía, giá trị tới hạn là 1
Do 2 > 1, bác bỏ H0
Nghiên cứu trên là có cơ sở, sử dụng nút
bịt tai sẽ làm giảm bệnh nhiễm trùng tai
STT Trước Sau chênh lệch Dấu của
Trang 20-4.2.1 KIỂM ĐỊNH DẤU (tiếp theo)
• Trường hợp mẫu lớn, n > 20
Tính chênh lệch giữa hai mẫu để xác định số dấu âm, số dấu dương
Tương tự như với trường hợp kiểm định số trung vị, tiêu chuẩn kiểm định cóphân phối chuẩn và được tính theo công thức:
Trong đó: X = min(số dấu dương, số dấu âm); n: qui mô mẫu
So sánh với giá trị tới hạn tra ở bảng để kết luận
22
n X
z
n
Trang 214.2.2 KIỂM ĐỊNH TỔNG HẠNG CÓ DẤU WILCONXON
• Kiểm định tổng hạng có dấu Wilconxon được sử dụng nhằm so sánh hai tổng thể vớiđiều kiện:
Số liệu định lượng nhưng giả thuyết về phân phối chuẩn của μ1 - μ2 bị vi phạm
Hai mẫu tương đồng từng cặp (phụ thuộc)
Tính tổng hạng của các chênh lệch dương, ký hiệu là T+ và tổng hạng của cácchênh lệch âm, ký hiệu là T-
21
Trang 224.2.2 KIỂM ĐỊNH TỔNG HẠNG CÓ DẤU WILCONXON
Bác bỏ H0 khi: T ≤ giá trị tới hạn
Giá trị tới hạn được xác định từ bảng giá trị tới hạn của kiểm định tổng hạng códấu khi biết qui mô n và mức ý nghĩa α
Trang 234.2.2 KIỂM ĐỊNH TỔNG HẠNG CÓ DẤU WILCONXON
23
Ví dụ: Nhằm đánh giá hai phương pháp sản xuất mới có hiệu quả như nhau không, một
mẫu gồm 11 công nhân được lựa chọn, mỗi công nhân sẽ thực hiện một nhiệm vụ sản xuất
có sử dụng từng phương pháp mới này, thời gian thực hiện được tính theo phút Phươngpháp sản xuất mà mỗi công nhân sử dụng đầu tiên cũng được lựa chọn ngẫu nhiên Vậy 2phương pháp này xét về mặt thời gian hoàn thành nhiệm vụ có như nhau không?
• Tính chênh lệch về thời gian thực hiện nhiệm vụ bằng 2 phương pháp Sự chênhlệch dương trong thực hiện nhiệm vụ cho thấy phương pháp 1 cần nhiều thời gianhơn, sự chênh lệch âm lại cho thấy phương pháp 2 cần nhiều thời gian hơn
• Xếp hạng giá trị tuyệt đối của chênh lệch
• Tổng hạng của các chênh lệch dương là: T+ = 49,5
• Tổng hạng của các chênh lệch âm là: T- = 5,5
• H0: μ1 = μ2: Tiêu chuẩn kiểm định là T = min(T+,T-) = 5,5
• Giá trị tới hạn tra bảng với n = 10 (có chênh lệch khác 0), α = 0,05 là: 8, bác bỏ H0
• H0: μ1 ≤ μ2, Tiêu chuẩn kiểm định là T- = 5,5, Giá trị tới hạn cho kiểm định một phíavới n = 10, α = 0,05, là 11, bác bỏ H0
• H0: μ1 ≥ μ2 Tiêu chuẩn kiểm định là T+ = 49,5, giá trị tới hạn cho kiểm định một phíavới n = 10, α = 0,05, là 11, chấp nhận H0
• Vậy 2 phương pháp này là khác nhau và phương pháp 1 có thời gian hoàn thànhnhiệm vụ cao hơn phương pháp 2
Trang 244.2.2 KIỂM ĐỊNH TỔNG HẠNG CÓ DẤU WILCONXON (tiếp theo)
STT
Thời gian thực hiện (phút)
Chênh lệch
Giá trị tuyệt đối của chênh lệch
Xếp hạng
Xếp hạng có dấu dương
Trang 254.2.2 KIỂM ĐỊNH TỔNG HẠNG CÓ DẤU WILCONXON (tiếp theo)
25
Trang 264.3 KIỂM ĐỊNH KHI BÌNH PHƯƠNG
4.3.1 Kiểm định Khi bìnhphương về sự phù hợp
4.3.3 Đo lường mối liên hệgiữa các biến định danh
4.3.2 Kiểm định Khi bìnhphương so sánh hai mẫu độclập với các biến định danh
Trang 274.3.1 KIỂM ĐỊNH KHI BÌNH PHƯƠNG VỀ SỰ PHÙ HỢP
• Sử dụng với biến định danh
Bài toán:
Ví dụ 1: Để đáp ứng yêu cầu của khách hàng, nhà sản xuất giầy thể thao
có thể muốn biết liệu khách hàng có thích một sản phẩm cụ thể;
Ví dụ 2: Một dịch vụ cấp cứu có thể muốn biết liệu họ có nhận được nhiềucuộc gọi hơn vào một giờ nhất định trong ngày để bố trí nhân lực chophù hợp
Câu hỏi: liệu có một khác biệt đáng kể nào đó, hay một sở thích nào đó?Phân phối của tổng thể và giá trị thực tế phù hợp với nhau ở mức nào?
Cách giải quyết: chọn ngẫu nhiên một mẫu và thu thập thông tin
Khi đó, giá trị thu được từ mẫu (tức các giá trị thực tế) được gọi là giá trị
quan sát, ký hiệu là O.
Giá trị thu được từ tính toán (nếu như không có khác biệt hay sở thích)
được gọi là giá trị mong muốn, ký hiệu là E.
Giá trị quan sát và giá trị mong muốn thường khác nhau do sai số chọnmẫu, vì thế nó sẽ thay đổi từ mẫu này sang mẫu khác
27
Trang 284.3.1 KIỂM ĐỊNH KHI BÌNH PHƯƠNG VỀ SỰ PHÙ HỢP
Trang 294.3.1 KIỂM ĐỊNH KHI BÌNH PHƯƠNG VỀ SỰ PHÙ HỢP (tiếp theo)
• Ví dụ: Một nhà phân tích thị trường muốn biết liệu các khách hàng có sở thích khác
nhau với 5 loại nước ép hoa quả hay không Một mẫu gồm 100 người đã cho biếtlựa chọn của mình như sau:
• Giả thuyết cần kiểm định là:
H0: khách hàng không có sự khác biệt về sở thích với mỗi loại nước ép
H1: khách hàng có sự khác biệt về sở thích với mỗi loại nước ép
• Nếu không có sự khác biệt, mỗi loại nước ép trên sẽ có số lượng người thích nhưnhau Khi đó, mỗi nhóm sẽ có 100/5 = 20 người, đây chính là giá trị mong muốn
• Tiêu chuẩn kiểm định được tính:
• Với mức ý nghĩa 0,05 và bậc tự do k-1 = 4 (có 5 loại nước ép hoa quả tức k = 5), trabảng tìm được giá trị tới hạn là 9,488
• , bác bỏ H0, vậy có sự khác biệt về sở thích với các loại nước ép
Trang 304.3.1 KIỂM ĐỊNH KHI BÌNH PHƯƠNG VỀ SỰ PHÙ HỢP (tiếp theo)
Trang 314.3.2 KIỂM ĐỊNH KHI BÌNH PHƯƠNG SO SÁNH HAI MẪU ĐỘC LẬP VỚI CÁC BIẾN ĐỊNH DANH (tiếp theo)
31
Trang 324.3.2 KIỂM ĐỊNH KHI BÌNH PHƯƠNG SO SÁNH HAI MẪU ĐỘC LẬP VỚI CÁC BIẾN ĐỊNH DANH (tiếp theo)
Trang 334.3.3 ĐO LƯỜNG MỐI LIÊN HỆ GIỮA CÁC BIẾN ĐỊNH DANH
• được thiết lập để xác định có hay không một mối liên hệ giữa hai biến, nhưng nókhông chỉ ra được cường độ của mối liên hệ đó, hay nói cách khác là nó không chỉ
ra được mức độ thay đổi của một biến khi giá trị của một biến khác thay đổi
• Ngoài ra, giá trị của không đưa ra một chỉ dẫn đáng tin cậy về cường độ của mốiliên hệ giữa hai biến do còn phụ thuộc vào quy mô của bảng chéo (dòng, cột)
• Để giải quyết vấn đề này, thống kê Khi bình phương được điều chỉnh để tính đến sựkhác biệt về kích thước mẫu và kích thước của bảng
• Hệ số Phi, Hệ số Contigency và Cramer’s V được dùng để đo lường mối liên hệ giữacác biến định danh
• Các hệ số này nhận giá trị trong khoảng (0,1) Giá trị càng gần 0, mối liên hệ cànglỏng lẻo Giá trị càng gần 1, mối quan hệ càng chặt chẽ
Trang 344.3.3 ĐO LƯỜNG MỐI LIÊN HỆ GIỮA CÁC BIẾN ĐỊNH DANH
Trang 354.3.3 ĐO LƯỜNG MỐI LIÊN HỆ GIỮA CÁC BIẾN ĐỊNH DANH
35
Trang 364.3.3 ĐO LƯỜNG MỐI LIÊN HỆ GIỮA CÁC BIẾN ĐỊNH DANH (tiếp theo)
• Ví dụ: Để xác định thị trường mục tiêu tốt hơn, một nhà nghiên cứu thị trường đã
tiến hành khảo sát trên 669 người được chọn ngẫu nhiên Mỗi người trong số đóđược yêu cầu chọn 1 trong 4 đặc tính thể hiện rõ nhất hình ảnh riêng của bản thânmình khi lái xe Bốn tính cách bao gồm: phòng vệ, hung hăng, hưởng thụ và uy tín.Những người tham gia khảo sát cũng được chia thành 3 nhóm tuổi: trẻ, trung niên,già Mục tiêu của nghiên cứu nhằm đánh giá xem liệu có mối liên hệ nào đó giữanhóm tuổi của mỗi người với hình ảnh của họ khi lái xe không
• Qua tính toán, xác định được giá trị của thống kê Khi bình phương:
• Nếu số liệu trên được biểu diễn bằng một bảng chéo, có dạng 34
• Để đánh giá mối liên hệ giữa nhóm tuổi và hình ảnh của họ khi lái xe, sử dụng hệ sốCramer’s V
Trang 37TÓM LƯỢC CUỐI BÀI
37
Trong bài học này, chúng ta đã nghiên cứu các nội dung chính sau:
• Ưu nhược điểm của kiểm định phi tham số;
• Kiểm định Mann-Whitney;
• Kiểm định dấu;
• Kiểm định tổng hạng có dấu Wilconxon;
• Kiểm định khi bình phương;
• Đo lường mối quan hệ giữa các biến định danh