PHÂN TÍCH PHƯƠNG SAIPhương pháp kiểm định sẽ được mở rộng trong trường hợp so sánh trung bình của nhiều tổng thể, được xây dựng trong việc xem xét các biến thiên phương sai của các giá t
Trang 1Chương VI PHÂN TÍCH PHƯƠNG SAI
Phương pháp kiểm định sẽ được mở rộng trong trường hợp so sánh trung bình của nhiều tổng
thể, được xây dựng trong việc xem xét các biến thiên (phương sai) của các giá trị trong nội bộ nhóm Do vậy, phương pháp kiểm định giả thuyết về sự bằng nhau của trung bình nhiều tổng thể
được gọi chung là phương pháp phân tích phương sai ANOVA
1 Phân tích phương sai một yếu tố
Phân tích phương sai một yếu tố được sử dụng trong trường hợp chỉ có yếu tố nào đó được xem
xét nhằm xác định ảnh hưởng của nó đến một yếu tố khác.
Yếu tố được xem xét ảnh hưởng sẽ được dùng để phân loại các quan sát thành các nhóm khác nhau
Ví dụ: Một nghiên cứu được thực hiện nhằm xét xem phải chăng yếu tố thu nhập có ảnh hưởng
đến số tiền chi mua thực phẩm hàng tháng của các gia đình Như vậy, dựa vào mức thu nhập, các gia đình sẽ được chia thành các nhóm khác nhau, ghi nhận số tiền chi mua thực phẩm hàng
tháng, và so sánh số tiền chi mua thực phẩm hàng tháng trung bình theo các mức thu nhập khác nhau này
Nếu yếu tố thu nhập không ảnh hưởng thì trung bình của số tiền chi mua thực phẩm bằng nhau của tất cả các nhóm
Hay ngược lại, yếu tố thu nhập thực sự có ảnh hưởng, số tiền chi mua thực phẩm hàng tháng
trung bình của các gia đình có các mức thu nhập khác nhau sẽ không bằng nhau
Tổng quát:
( , , … , có thể khác nhau về kích thước)
Gọi , , … , là các trung bình tổng thể;
là quan sát thứ của nhóm thứ
Nhóm
…
…
…
…
…
Với giả định các tổng thể phân phối chuẩn, có phương sai bằng nhau, các sai số là độc lập với nhau, phân tích phương sai một yếu tố thực hiện như sau:
Trang 2B1 Tính giá trị trung bình cho từng nhóm;
̅ chung cho tất cả các nhóm
Trong đó = ∑
là sự biến thiên giữa các nhóm;
là tổng bình phương các chênh lệch giữa từng quan sát với trung bình tất cả các quan sát;
là sự biến thiên trong nội bộ nhóm
= − ; = 1, 2, … ,
=
là tổng bình phương các chênh lệch giữa từng quan sát với trung bình của nhóm mà quan sát thuộc về
thể hiện sự biến thiên do các yếu tố khác, không do yếu tố nghiên cứu (yếu tố dùng để phân chia các nhóm)
thể hiện sự biến thiên do sự khác nhau giữa các nhóm, tức là biến thiên do yếu tố nghiên cứu (yếu tố dùng để phân chia các nhóm)
Công thức này chính là cơ sở của phương pháp phân tích phương sai một yếu tố:
Biến thiên của các quan sát so với giá trị trung bình là tổng cộng của biển thiên được giải thích
B3 Tính các ước lượng cho phương sai chung của tổng thể
Trang 3Nếu giả thuyết đúng, ta có hai giá trị ước lượng cho phương sai chung của tổng thể.
Do đó, tỷ số và có thể dùng làm căn cứ để kết luận về giả thuyết
Nếu đúng, nghĩa là trung bình của tổng thể bằng nhau, thì tỷ số sẽ gần với giá trị 1
Ngược lại, khi trung bình của tổng thể không bằng nhau thì lớn hơn thì tỷ
Bảng phân tích phương sai thường được phân tích bằng máy tính với các phần mềm thông dụng
như Excel, SPSS, Eview dưới dạng bảng sau:
(bậc
tự do)
Sum of Squares (tổng các chênh lệch bình
phương)
Mean Squares (trung bình các chênh lệch bình
phương -phương sai)
Ratio (giá trị kiểm
định )
F Prob
của kiểm
định ) Between Groups
(giữa các nhóm)
− 1
, , >
Within Groups
(trong nội bộ nhóm)
−
= −
lớn hơn hay nhỏ hơn?
Ở đây ta đề cập đến phương pháp Tukey so sánh từng cặp trung bình tổng thể với nhau
2 So sánh từng cặp trung bình tổng thể: kiểm định Tukey
thể như sau:
: ≠ (1,2); :: =≠ (1,3); … ; :: ≠ ( − 1, )=
Trang 4Tiêu chuẩn so sánh
= , , Trong đó , , là giá trị tra bảng phân phối ở mức ý nghĩa ;
= min{ ; ; … ; }
3 Phân tích phương sai với mẫu ngẫu nhiên theo khối
Đối với phương pháp phân tích phương sai ở trên đánh giá sự khác nhau giữa trung bình của
hoàn toàn được chọn một cách ngẫu nhiên độc lập từ tổng thể
theo khối)
Khi đó ta có tất cả = ô giá trị quan sát; vì mỗi ô chỉ có 1 giá trị quan sát nên ta sẽ có giá
trị quan sát
1
2
…
…
…
…
… Phân tích phương sai với nhóm, khối được thực hiện như sau:
cột)
Trang 5B2 Tính các đại lượng
thể hiện sự biến thiên do khác biệt giữa các nhóm xét theo yếu tố nghiên cứu
thể hiện sự biến thiên do khác biệt giữa các khối
thể hiện sự biến thiên do các yếu tố khác không nghiên cứu, không thể giải thích bởi các nhóm hay các khối
Khi đó ta có = + + Đây chính là cơ sở phân tích phương sai hai yếu tố (khối được xem như là yếu tố thứ hai, nhưng với giả định là không có sự tương tác giữa các nhóm và
khối, nghĩa là sự khác nhau giữa các nhóm được giả định không đổi ở tất cả các khối)
B3 Tính các đại lượng trung bình
Quy tắc quyết định: Bác bỏ : = = = ở mức ý nghĩa nếu
> ,( )( ), ; trong đó ,( )( ), có phân phối Fisher với( − 1) bậc tự do của
tự do của mẫu số)
Trang 6Biến thiên Tổng các chênh
lệch bình
phương
bình phương (phương sai)
Giá trị kiểm định
= ( − 1)( − 1)
Giống như trong trường hợp phân tích phương sai một yếu tố, ở đây ta cũng có thể dùng kiểm
định Tukey để xác định từng cặp trung bình tổng thể khác nhau Ta tính các giá trị so sánh
= , ,( )( )