Phân tích phương sai một yếu tố VD: Thời gian tự học của sinh viên ảnh hưởng đến kết quả học tập Một yếu tố nguyên nhân định tính => một yếu tố kết quả định... Trường hợp k tổng thể có
Trang 1Cô Trần Hà Q uyên
Trang 4Nhóm tuổi ? Số lượng “bạn tình”
Trang 6Nhóm máu ? Tỷ lệ mang thai
Trang 7Màu da ? Chỉ số “ Ai-Kiu”
Trang 8ứng dụng
Phân tích phương sai ANOVA để làm gì ???
Trang 10O A B
AB
Trang 11• Các chuyên gia đến từ trường ĐH Albert Einstein ngành dược tại New York và ĐH Yale đã thực hiện cuộc nghiên cứu này.
• Họ tiến hành theo dõi sức khỏe và kiểm tra 560 tình nguyện viên.
Trang 12có tỉ lệ sụt giảm trứng cao
gấp đôi những người mang
nhóm máu khác
có khả năng mang thai cao hơn
do nhóm máu này có một loại protein đặc biệt bao phủ tế bào trứng là A antigen.
cũng có loại protein tương
tự trong khi nhóm máu O lại không có.
Trang 15GIỚI THIỆU
Trang 16Phân tích phương sai một yếu tố
VD: Thời gian tự học của sinh viên ảnh hưởng đến kết quả học tập
Một yếu tố nguyên nhân (định tính) => một yếu tố kết quả (định
Trang 17Trường hợp k tổng thể có phân phối chuẩn và phương sai bằng nhau
n2 ,…, nk quan sát từ k tổng thể.
Các tổng thể có phân phối chuẩn
Các phương sai tổng thể bằng nhau
Các quan sát được lấy mẫu độc lập
Trang 18Trường hợp k tổng thể có phân phối chuẩn và phương sai bằng nhau
Trang 20j ij i
ni
k
Trường hợp k tổng thể có phân phối chuẩn và phương sai bằng nhau
Trang 21 Bước 2: Tính tổng các chênh lệch bình phương
Không phải do yếu tố nguyên nhân đang nghiên cứu
Trường hợp k tổng thể có phân phối chuẩn và phương sai bằng nhau
Trang 221
x x
n j
j −
∑
=
2 2 1
(
2
x x
n j
k i
n j
Trang 23 SSG ( Tổng các chênh lệch bình phương giữa các nhóm )
Phản ánh phần biến thiên của yếu tố kết quả do ảnh hưởng của yếu tố nguyên nhân đang nghiên cứu
SSG =
2 1
) x x
( n
k i
Trang 24 SST ( Tổng các chênh lệch bình phương toàn bộ )
Phản ánh phần biến thiên của yếu tố kết quả do ảnh hưởng của tất cả các nguyên nhân
(
k i
n j
Trang 25 Bước 3: Tính phương sai
Tổng chênh lệch bình phương chia cho bậc tự do
MSW =
MSG =
k n
Trường hợp k tổng thể có phân phối chuẩn và phương sai bằng nhau
Trang 26 Bước 4: Kiểm định giả thuyết
Trang 27Bảng kết quả tổng quát
Source of Variation Sum of squares (SS) Degree of Freedom
(df) Mean squares (MS)
F ratio
MSW
MSG
F =
k n
SSW MSW
−
=
Trường hợp k tổng thể có phân phối chuẩn và phương sai bằng nhau
Trang 28Bảng kết quả tổng quát
Nguồn biến thiên Tổng chênh lệch
bình phương (SS) Bậc tự do (df) Phương sai (MS)
Tỉ số F
MSW
MSG
F =
k n
SSW MSW
−
=
Trường hợp k tổng thể có phân phối chuẩn và phương sai bằng nhau
Trang 29 Ví dụ: Một nghiên cứu xem xét ảnh hưởng của mức độ tự học đến kết quả học tập của sinh viên Cuộc khảo sát với cỡ mẫu 63 sinh viên được thực hiện.
Có 21 sinh viên thời gian tự học ít, dưới 9h/tuần 21 sinh viên có thời gian tự học trung bình, 9 - 18h/tuần Còn lại 21 sinh viên tự học nhiều, trên 18h/tuần.
Trường hợp k tổng thể có phân phối chuẩn và phương sai bằng nhau
Trang 30Nhóm 1 (TG tự
học ít)
Nhóm 2 (TG tự học TB)
Nhóm 3 (TG tự học nhiều)
Nhóm 2( TG tự học TB)
Nhóm 3 (TG tự học nhiều)
Trang 31 Kiểm định giả thuyết:
H0 : Thời gian tự học không ảnh hưởng đến kết quả học tập của sinh viên
HAY LÀ
H0 : μ1 = μ2 = μ3
H1: Thời gian tự học có ảnh hưởng đến kết quả học tập của sinh viên
Trường hợp k tổng thể có phân phối chuẩn và phương sai bằng nhau
Trang 32Ý nghĩa công thức và logic tính toán
H0 đúng: thời gian tự học ảnh hưởng như nhau đến kết quả học tập
Điểm trung bình trong nội bộ nhóm phân tán
MSW MSG
Trang 33Ý nghĩa công thức và logic tính toán
H0 sai: thời gian tự học có ảnh hưởng đến kết quả học tập
Điểm trung bình trong nội bộ nhóm ít phân tán, đồng đều
SSW nhỏ => MSW nhỏ
SSG lớn => MSG lớn
F = lớn
MSW MSG
Trang 3421 21
8 6 21 4
6 21 7
* ,
*
+ +
+ +
=
Trang 35Bước 2
Tổng các chênh lệch bình phương:
34 3 5,7)
(5,3 5,7)
(6,1 5,7)
(6,2 5,7)
(5,8
-21) (n
22
22
1
211
11
1
,
) x x
( SS
n j
j
= +
+ +
(7,2 6,4)
(6,6 6,4)
(7,2 6,8)
(5,8 6,8)
(6,8 21
-6,3) -
(6,4 21
6,3) -
21(5,7 SSG
3) (k
22
2
21
,
) x x
( n
SSG k
i
i i
= +
7 56
3 34
=
⇒ SSW , , ,
Trang 36Bước 3
Tính các phương sai:
51
6 1
3
02
13 1
233
0 3
63 14
,
, k
SSG MSG
, k
n
SSW MSW
Trang 37Bước 4
Tính tỉ số F:
94
27 233
0
51
6
,
, MSW
MSG
• F(k-1;n-k);α= F(3-1;63-3);0,05=3,15
• F = 27,94 > 3,15 :bác bỏ H0
• => Với độ tin cậy 95%, điểm trung bình của 3 nhóm sinh viên có thời gian
tự học khác nhau là khác nhau Do đó, thời gian tự học có ảnh hưởng đến kết quả học tập của sinh viên
Trang 38PHÂN TÍCH SÂU ANOVA
Trang 39PHÂN TÍCH SÂU ANOVA
Phương pháp Tukey (kiểm định HSD)
Nội dung: so sánh từng cặp trung bình nhóm ở mức ý nghĩa α nào đó
cho tất cả các cặp kiểm định, để phát hiện ra những nhóm khác nhau.
Trang 40Các bước thực hiện.
Bước 1: xác định số cặp trung bình nhóm cần phải thực hiện
kiểm định, đặt các giả thuyết H0.
Nếu có k nhóm thì số lượng cặp cần so sánh là: tổ hợp chập 2 của k nhóm =
C k
2
Trang 42Các bước thực hiện
Bước 3: Tính độ lệch tuyệt đối giữa các cặp trung bình mẫu:
Bước 4: So sánh độ lệch tuyệt đối giữa các cặp trung bình mẫu với giới hạn T,
từ đó kết luận bác bỏ hay chấp nhận giả thiết Ho :
Tiêu chuẩn để quyết định bác bỏ giả thiết Ho là độ lệch tuyệt đối giữa các cặp trung bình mẫu lớn hơn hay bằng T giới hạn
Trang 44 Độ lệch tuyệt đối các cặp trung bình mẫu:
Trang 45Ví dụ.
Giá trị giới hạn Tukey: T= qα,k,n-k qα,k,n-k = q0.05,3,60 = 3.4.
T=3.4 x = 0.36
Trang 46 Vì = 0.7 > T= 0.36 nên bác bỏ giả thuyết Ho => trung bình tổng thể µ1
Trang 47 Mặt khác: vì < <
=> µ1 < µ2 < µ3
Kết luận: Điểm trung bình học tập của các nhóm sinh viên có thời gian tự học khác nhau là
khác nhau Cụ thể, điểm trung bình của nhóm có thời gian tự học nhiều cao hơn hẳn hai nhóm kia và ngược lại Như vậy thời gian tự học có ảnh hưởng đến kết quả học tập
Trang 48Ước lượng về chênh lệch giữa hai trung bình nhóm có khác biệt:
µ1 - µ2 = ( - ) ± tn-k,α/2
Trang 50
Cám ơn cô và các bạn đã lắng nghe !