- Thực chất của phân tích phương sai là tiến hành một kiểm định TK từ dữ liệu mẫu Chúng ta đề cập đến mô hình phân tích phương sai một yếu tố Một chiều - tức là phân tích dựa trên
Trang 1Chöông 9
PHÂN TÍCH PHƯƠNG SAI
Trang 2- Mục tiêu của phân tích phương sai
là tìm hiểu và khẳng định mối quan hệ(tác động ) giữa các nhân tố.
- Thực chất của phân tích phương
sai là tiến hành một kiểm định TK
từ dữ liệu mẫu
Chúng ta đề cập đến mô hình
phân tích phương sai một yếu tố
( Một chiều )- tức là phân tích dựa
trên ảnh hưởng của 1 nhân tố
Trang 39.1.1-Trường hợp k tổng thể được giả
định có phân phối chuẩn và có
phương sai bằng nhau
Giả sử chúng ta muốn so sánh
trung bình của k tổng thể có phân
phối chuẩn và có phương sai bằng
nhau dựa trên k mẫu gồm n 1 ,n 2 ,
…,n k. quan sát được chọn ngẫu nhiên độc lập từ k tổng thể Nếu trung
bình của các tổng thể được ký hiệu là:
μ 1 , μ 2 , …, μ k
Th ì mô hình phân tích phương sai một yếu tố:
Trang 4Giả thuyết TK
H 0 : μ 1 = μ 2 = …= μ k
H 1 : Không phải μ 1 = μ 2 = …=
μ k
Các bước tiến hành kiểm định:
Bước 1: Tính các trung bình mẫu :
TB của các mẫu con
Và trung bình chung của mẫu lớn
n :
( X X , , , X k )
X
Trang 6Tính số trung bình mẫu con thứ i:
Trung bình chung của mẫu lớn :
X n X
ij
i j k
i i
X X
Trang 7Bước 2 : Tính tổng các độ lệch bình phương trong từng nhóm riêng biệt
Trang 8Tổng các bình phương trong nội bộ nhóm (SSW-Sum of Squares
within group):
SSW = SS 1 + SS 2 + … + SS k hay :
Trang 9SSW - thể hiện biến thiên của yếu tố kết quả do ảnh hưởng của các yếu tố khác , không do yếu
tố nghiên cứu, tức yếu tố dùng
để phân chia các nhóm
Trang 10Tiếp theo tính tổng bình phương các độ lệch giữa các nhóm
( SSG- Sum of Squares
between-group).
SSG thể hiện sự biến thiên do sự khác nhau giữa các nhóm, tức biến thiên yếu tố kết quả do yếu tố
nghiên cứu (Yếu tố dùng để phân
Trang 11Tính tổng bình phương các chênh lệch giữa từng quan sát với trung bình của tất cả các quan sát (SST-Total Sum of Squares): SST = SSW + SSG
Hoặc:
Phản ánh biến thiên của yếu tố kết
quả do ảnh hưởng tất cả nguyên
nhân
(gồm yếu tố nghiên cứu và yếu tố
không nghiên cứu).
Trang 12Bước 3 : Ước lượng phương sai :
- Ước lượng phương sai nội bộ các
n k
=
−
Trang 13- Ước lượng phương giữa các nhóm: ( Mean Squares)
k – 1 -> Bậc tự do tương ứng
1
SSG MSG
k
=
−
Trang 14 Như vậy ta có 2 giá trị ước lượng cho phương sai chung cuả k tổng thể, tỉ số giữa MSG và MSW có thể dùng làm căn
cứ để kết luận về giả thuyết H 0 .
Nếu H 0 đúng, nghĩa là trung bình của
k tổng thể bằng nhau, thì tỉ số MSG/MSW sẽ gần với giá trị 1
Ngược lại, khi các trung bình k tổng thể không bằng nhau, thì MSG/MSW sẽ lớn hơn 1.
Mức độ lớn hơn bao nhiêu để bác bỏ
H 0 , ta thực hiện kiểm định.
Trang 15Bước 4: Tính giá trị kiểm định F:
trung bình của k tổng thể khác nhau
thì bằng nhau, với mức ý nghĩa α, nếu :
k bậc tự do tương ứng ở tử số và mẫu
số. ,,,
MSG F
Trang 16Kết quả phân tích phương sai được trình bày dưới hình thức bảng:
Mean Squares ( MS )
n-k
Trang 17Ví dụ : Một Cty bán loại xà phòng giống nhau trong 3 mẫu bao bì khác nhau với giá bán như nhau Doanh số bán trong 5 tháng được cho trong bảng dưới đây
Mẫu bao bì 1 Mẫu bao bì 2 Mẫu bao bì 3
87 83 79 81
78 81 79 82
90 91 84 82
Trang 18Giả định doanh số bán theo các mẫu bao bì có phân phối chuẩn
và có phương sai bằng nhau.
1 Thiết lập bảng phân tích phương sai.
2 Kiểm định ở mức ý nghĩa 0,05 giả thuyết H0 cho rằng doanh số bán trung bình của tổng thể thì bằng nhau cho cả 3 mẫu bao bì khác nhau
Trang 20SST = (87-83) 2 +( 83-83) 2 + 83) 2
65
3 1
MSW MSG
MSG F
MSW
Trang 21Bảng kết quả ANOVA một yếu tố
Nguồn Tổng
bình phương
Bậc tự do df
Mean Squares Tỷ số F
Giữa các
nhóm SSG = 130 K - 1 = 2 MSG = 65 F = 7,09 Nội bộ
nhóm SSW = 110 15- 3 =12 n –k = MSW = 9,17
Total SST 14
Trang 22Tra bảng F với mức ý nghĩa 0,05 ;
ta có:
F k-1,n-k,α = F 2,12,0,05 = 3,88
Vì F=7,09 > 3,88 cho phép ta bác
bỏ giả thuyết H 0 cho rằng doanh
số bán trung bình của 3 mẫu bao
bì khác nhau thì bằng nhau với mức ý nghĩa 0,05
Trang 239.1.2 Phân tích sâu ANOVA
phương sai kết thúc
bình của các tổng thể bằng nhau Vì vậy cần phân tích sâu: Trung bình của những tổng thể nào thì khác nhau, tổng thể nào
có trung bình lớn hơn, hoặc nhỏ hơn.
Có nhiều phương pháp để tiếp tục phân tích sâu Ở đây chỉ giới thiệu phương pháp
Trang 24Trước tiên, lập giả thuyết so sánh từng cặp trung bình tổng thể với nhau: H 0 : μ 1 = μ 2 ; H 1 : μ 1 ≠ μ 2
H 0 : μ 2 = μ 3 ; H 1 : μ 2 ≠ μ 3
v.v
Với K tổng thể thì số cặp trung
bình cần so sánh được tính theo công thức :
Trang 25Tính tiêu chuẩn so sánh Tukey:
Với q α là giá trị của bảng phân phối q
(Studentized range distribution) ở mức ý nghĩa α, với bậc tự do k và n-k (Trong trường hợp các n i khác nhau, ta sẽ dùng giá trị n i nhỏ
Trang 26 Tính giá trị kiểm định : Giá trị
kiểm định D là giá trị tuyệt đối
của chênh lệch giữa 2 trung bình mẫu, ví dụ:
Qui tắc quyết định : Bác bỏ H 0 ở mức ý nghĩa α, nếu D ≥ T
Trang 27N ếu phân tích ANOVA bác bỏ giả thuyết H 0 cho rằng trung bình K tổng thể bằng nhau, thì với phương pháp Tukey ta sẽ tìm được ít nhất một cặp trung bình tổng thể khác nhau (ANOVA và Tukey được thực hiện ở cùng ý nghĩa α)
Trang 29Như vậy điều kiện bác bỏ giả thuyết H 0 chỉ có trung bình tổng thể μ 2 và μ 3 vì:
D 2 = 7 > 5,1
Trang 309.1.3- Trường hợp k tổng thể
con cĩ phân phối bất kỳ
TRONG TRƯỜNG HỢP NÀY TA CÓ THỂ
CHUYỂN ĐỔI DỮ LIỆU YẾU TỐ KẾT
QUẢ TỪ DẠNG ĐỊNH LƯỢNG VỀ DẠNG
ĐỊNH TÍNH (DỮ LIỆU THỨ BẬC) VÀ ÁP DỤNG MỘT KIỂM ĐỊNH PHI THAM SỐ
PHÙ HỢP LÀ KRUSKAL - WALLIS GIẢ SỬ RẰNG CHÚNG TA CÓ CÁC MẪU NGẪU
NHIÊN ĐỘC LẬP GỒM n 1 , n 2 , n k QUAN SÁT TỪ k TỔNG THỂ CÓ PHÂN PHỐI BẤT KỲ TA SỬ DỤNG KIỂM ĐỊNH
KRUSKAL –WALLIS BẰNG CÁCH XẾP HẠNG CÁC QUAN SÁT MẪU
Trang 31Cách chuyển dữ liệu:
MẶC DÙ SỐ QUAN SÁT CỦA
k MẪU LÀ KHÁC NHAU NHƯNG KHI XẾP HẠNG THÌ ĐƯỢC SẮP XẾP
MỘT CÁCH LIÊN TỤC TỪ NHỎ ĐẾN LỚN, NẾU GIÁ TRỊ QUAN
SÁT TRÙNG NHAU THÌ HẠNG
GIỐNG NHAU BẰNG CÁCH DÙNG SỐ TRUNG BÌNH CỘNG CÁC HẠNG CỦA CHÚNG ĐỂ CHIA ĐỀU.
Trang 32ĐẶT n = n 1 + n 2 + + n k LÀ TỔNG
R 1 , R 2 , , R K LÀ TỔNG CỦA CÁC HẠNG Ở TỪNG MẪU ĐƯỢC XẾP THEO THỨ
TỰ CỦA K MẪU
KIỂM ĐỊNH GIẢ THUYẾT Ở MỨC
Ý NGHĨA α CHO TRƯỜNG HỢP NÀY
LÀ:
H0: µ 1 =µ 2 =…=µ k TRUNG BÌNH CỦA K TỔNG
H1:Khơng phải µ 1 =µ 2 =…=µ k
Trang 33i 3 ( n 1 ) n
R )
1 n
( n 12
2
, 1
k− α χ
Trang 34KHI GIẢ THUYẾT H o BỊ BAC BỎ TA DÙNG PHƯƠNG PHÁP SO SÁNH TƯƠNG TỰ
NHƯ PHƯƠNG PHÁP TUKEY TRONG PHẦN
TRƯỚC.
TÓM TẮT CÁC BƯỚC THỰC HIỆN:
BƯỚC 1: TRƯỚC HẾT CHÚNG TA
TÍNH HẠNG TRUNG BÌNH CHO TỪNG NHÓM MUỐN SO SÁNH THEO
CÔNG THỨC TỔNG QUÁT SAU:
i
i i
n R R
Trang 35BƯỚC 2: TIẾP THEO CHÚNG TA TÍNH
CHÊNH LỆCH VỀ HẠNG TRUNG BÌNH
GIỮA 2 NHÓM CẦN SO SÁNH
D ĐƯỢC COI NHƯ GIÁ TRỊ ĐỂ KIỂM ĐỊNH GIẢ THUYẾT VỀ SỰ
BẰNG NHAU CỦA TRUNG BÌNH HAI
TỔNG THỂ i VÀ j ĐANG SO SÁNH.
BƯỚC 3: TÍNH GIÁ TRỊ GIỚI HẠN CK THEO CÔNG THỨC:
j i
2
, 1 k
1 n
1 12
) 1 n
(
n ) (
C
2
, 1
k− α
χ
Trang 36Kết luận:
BƯỚC 4: NGUYÊN TẮC QUYẾT ĐỊNH:
BÁC BỎ GIẢ THUYẾT H0 VỀ SỰ
BẰNG NHAU CỦA HAI TRUNG BÌNH TỔNG THỂ KHI
D > CK