Phạm vi áp dụng Tiêu chuẩn này quy định các mô hình và phương pháp phân tích phương sai một nhân tố và hai nhân tố, các phương pháp kiểm nghiệm giả thuyết thống kê và kết luận thống kê v
Trang 1Công ty luật Minh Khuê www.luatminhkhue.vn
TIÊU CHUẨN QUỐC GIA TCVN 4551 : 2009
THỐNG KÊ ỨNG DỤNG - PHÂN TÍCH PHƯƠNG SAI
Applied statistics - Analysis of variances
Lời nói đầu
TCVN 4551 : 2009 thay thế cho TCVN 4551-1988;
TCVN 4551 : 2009 do Ban kỹ thuật tiêu chuẩn quốc gia TCVN/TC 69 Ứng dụng các phương pháp
thống kê biên soạn, Tổng cục Tiêu chuẩn Đo lường Chất lượng đề nghị, Bộ Khoa học và Công nghệ
công bố
THỐNG KÊ ỨNG DỤNG - PHÂN TÍCH PHƯƠNG SAI
Applied statistics - Analysis of variances
1 Phạm vi áp dụng
Tiêu chuẩn này quy định các mô hình và phương pháp phân tích phương sai một nhân tố và hai nhân
tố, các phương pháp kiểm nghiệm giả thuyết thống kê và kết luận thống kê về sự thuần nhất của sản phẩm nhằm phân loại các sản phẩm không thuần nhất
2 Khái niệm chung
2.1 Phân tích phương sai là một tập hợp các phương pháp thống kê nhằm kiểm nghiệm giả thuyết về
sự bằng nhau của các giá trị trung bình của một đại lượng nào đó trên cơ sở so sánh các giá trị trung
bình của nó trong k mẫu ngẫu nhiên độc lập rút từ k tổng thể.
2.2 Đặc trưng cơ bản của phân tích phương sai là: k tổng thể chịu tác động bởi nhân tố A, ở tổng thể
thứ j (j = 1, 2, k) A nhận giá trị không đổi A j
2.2.1 Giá trị A j được gọi là mức của nhân tố A và thường là giá trị định tính.
Số mức khác nhau của nhân tố A là hữu hạn.
Hai tổng thể khác nhau ứng với hai mức khác nhau của nhân tố A.
2.2.2 Nhân tố A có thể là đơn (một chiều) hay bội (nhiều chiều) dưới dạng tổ hợp của một số nhân tố
đơn, tức là A = B x C x x G Tùy theo số chiều của nhân tố mà ta có phân tích phương sai một
nhân tố, hai nhân tố, ba nhân tố
Hai nhân tố A và B là có tương tác (ký hiệu A x B) nếu như trong bố trí thí nghiệm có mọi tổ hợp có
thể có của các mức của hai nhân tố
Tiêu chuẩn này chỉ đề cập đến mô hình phân tích phương sai một nhân tố hay hai nhân tố có tương tác
2.3 Đại lượng Y đo được trong các mẫu rút từ các tổng thể là biến ngẫu nhiên một chiều, các giá trị
quan trắc về đại lượng Y được đo với cùng một độ chính xác.
2.4 Các số liệu để tiến hành phân tích phương sai được biểu diễn dưới dạng Bảng 1.
Trang 2Công ty luật Minh Khuê www.luatminhkhue.vn
2.5 Các giá trị Y i1 , Y i2, trong mỗi một cột ứng với một mẫu và là độc lập với nhau (i = 1, 2, ….,
k).
2.6 Các phương pháp xử lý số liệu trong Bảng 1 phụ thuộc vào phân bố của Y.
2.6.1 Các phương pháp phân tích phương sai tham số (xem Điều 3) đòi hỏi giả thuyết Y có phân bố
Giả thuyết này có nghĩa là các mức A j của nhân tố A không có ảnh hưởng gì đến các giá trị trung bình
trong các tổng thể riêng biệt, nói khác đi các giá trị trung bình đó bằng nhau
H 1 là đối thuyết của H 0 nếu H 1 đúng thì nhân tố A có ảnh hưởng đến Y.
Khi bác bỏ H 0, phải tiến hành thêm phân tích phụ nhằm phát hiện ảnh hưởng của nhân tố A đến các
3 Phương pháp phân tích phương sai tham số
3.1 Phân tích phương sai một nhân tố
3.1.1 Mô hình phân tích phương sai một nhân tố
Nhân tố A có k mức A 1 , A 2 , … A k tương ứng với k tổng thể Mô hình có dạng sau:
trong đó: là giá trị trung bình chung của Y;
i là hiệu quả của mức A i đối với Y;
e ij là sai số ngẫu nhiên ứng với giá trị quan trắc;
Y ij với i = 1 … k; j = 1… n i
3.1.1.1 Điều kiện áp dụng của mô hình: các e ij là độc lập, có phân bố chuẩn với trung bình bằng 0
3.1.1.2 Phát biểu giả thuyết:
tức là các mức của nhân tố A có ảnh hưởng đến các trung bình của Y.
3.1.2 Các bước tiến hành khi phân tích phương sai một nhân tố
3.1.2.1 Kiểm nghiệm sự bằng nhau của các phương sai
3.1.2.1.1 Dùng quy tắc Bartlett nếu k > 2
1) Tính các giá trị
Trang 3Công ty luật Minh Khuê www.luatminhkhue.vn
i = 1, 2, …, k (6)2) Đặt
(7)3) Tính các giá trị
(8)(9)4) Tính thống kê
(10)trong đó
3.1.2.1.2 Nếu k = 2, dùng quy tắc Fisher để so sánh hai phương sai Nếu hai phương sai bằng nhau,
có thể dùng quy tắc Student để so sánh hai giá trị trung bình
3.1.2.2 Kiểm nghiệm các giả thuyết H 0
3.1.2.2.1 Trường hợp các phương sai bằng nhau
Sau khi đã khẳng định giả thuyết H 0 ' về sự bằng nhau của các phương sai, việc kiểm nghiệm giả
thuyết H 0 được tiến hành như sau:
1) Tính tổng và trung bình ứng với từng tổng thể:
với i = 1, 2, …, k
(12)Sau đó tính tổng chung và trung bình chung:
Trang 4Công ty luật Minh Khuê www.luatminhkhue.vn
Nếu F > F1- (1, 2) thì bác bỏ H 0 Điều này có nghĩa là nhân tố A thực dư có ảnh hưởng đến Y Tiếp
tục dùng các phương pháp so sánh đồng thời (xem 3.3) để tách ra những tổng thể thuần nhất
3.1.2.2.2 Trường hợp các phương sai không bằng nhau:
(22)2) Tính thống kê Welch:
Trang 5Công ty luật Minh Khuê www.luatminhkhue.vn
5) Với F, 1, và 2 tính được, thực hiện tiếp các bước 4 và 5 của trường hợp các phương sai bằng nhau (3.1.2.2.1)
3.2 Phân tích phương sai hai nhân tố
3.2.1 Cách trình bày số liệu
Nhân tố A x B là bội (xem 2.2.2) gồm hai nhân tố đơn A và B.
A có k mức là A1, A2, A k
B có m mức là B 1 , B 2 , B m
n giá trị của Y ứng với mức (A i , B j ) được ký hiệu là Y ij1 , Y ij2 , Y ijn
Các giá trị của Y để tiến hành phân tích phương sai được trình bày trong Bảng 3.
- trung bình chung của đại lượng Y
i - hiệu quả của mức A i của nhân tố A đối với các giá trị của Y
i - hiệu quả của mức B j của nhân tố B đối với các giá trị của Y
()ij - hiệu quả hỗn hợp của mức (A i , B j ) đối với các giá trị của Y
e ijℓ - sai số ngẫu nhiên của quan sát Y ijℓ
3.2.3.2 Các điều kiện áp dụng
Trang 6Công ty luật Minh Khuê www.luatminhkhue.vn
1) Các e ijℓ là độc lập, có phân bố chuẩn với trung bình 0 và phương sai như nhau
2) Các nhân tố A và B có thể có hiệu quả âm hoặc dương đối với Y nhưng phải thỏa mãn hệ thức:
=0
với mọi i
với mọi j
3.2.3.3 Phát biểu giả thuyết
Các giả thuyết được xem xét theo thứ tự sau:
1) Kiểm nghiệm sự tương tác giữa các nhân tố A và B
H0,AxB : ()ij = 0 với mọi i = 1, 2, k và j = 1, 2 … , m
H1,AxB: không phải mọi ()ij = 0
2) Nếu giả thuyết H0,AxB đúng tức là không có sự tương tác giữa A và B, cần kiểm nghiệm
a) Ảnh hưởng của nhân tố A đến các giá trị của Y Cụ thể:
H0,A: 1 = 2 = = k = 0
tức là các mức của A không ảnh hưởng đến các giá trị của Y.
H1,A: không phải tất cả các 1, 2, , k bằng 0
b) Ảnh hưởng của nhân tố B đến các giá trị của Y:
H 0,B: 1 = 2 = … = m = 0
tức là các mức của B không ảnh hưởng đến các giá trị trung bình của Y.
H1,B: không phải tất cả các 1, 2, , k đều bằng 0
3.2.4 Các bước tiến hành khi phân tích phương sai hai nhân tố
3.2.4.1 Kiểm nghiệm giả thuyết về sự bằng nhau của các phương sai của Y ứng với mọi tổng thể nhờ
quy tắc Bartlett
- Đánh số lại các mẫu trong Bảng 3 bằng chỉ số i = 1, 2, K = k x m theo thứ tự từ trái sang phải và từ
trên xuống
- Bên trong từng mẫu, đánh số các quan sát theo hai chỉ số Yij , trong đó j = 1, 2, n.
- Áp dụng quy tắc Bartlett (3.1.2.1.1) cho các mẫu vừa được thành lập, trong đó ni = n với mọi i = 1, 2, K.
- Nếu giả thuyết về sự bằng nhau của các phương sai được chấp nhận thì chuyển sang 3.2.4.2
- Nếu bác bỏ giả thuyết trên thì chuyển sang 3.2.4.3
3.2.4.2 Kiểm nghiệm điều kiện ứng dụng
1) Tính các tổng:
với mọi i = 1, 2 …, k; j = 1, 2 …., m (27)
với mọi i = 1, 2 …, k (28)
với mọi j = 1, 2, …, m (29)Tổng chung
Trang 7Công ty luật Minh Khuê www.luatminhkhue.vn
(30)2) Tính các tổng bình phương:
(32)(33)(34)
(36)3) Tính các trung bình bình phương
MSdư = SSdư (37)4) Tính các tỷ số F:
(38)5) Viết các đại lượng vừa tính thành bảng phân tích phương sai hai nhân tố như sau:
Bảng 4
Nguồn biến động Tổng bình phương Bậc tự do Trung bình bình phương Tỷ số F
Tương tác A x B SS AXB (k - 1)(m - 1) MS AXB F AXB
-3.2.4.2.1 Kiểm nghiệm giả thuyết H0,AXB
1) Chọn mức ý nghĩa Đặt 1 = (k - 1)(m - 1), 2 = N - km và tra Bảng 5 để tìm phân vị F1-(1, 2).2) So sánh tỷ số FAXB tính được với giá trị F1-(1, 2)
- Nếu F AxB < F1 - (1, 2) thì chấp nhận giả thuyết H0,AxB, sau đó kiểm định giả thuyết H 0,A và H 0,B (xem 3.2.4.2.2 và 3.2.4.2.3)
- Nếu F AxB > F1 - (1, 2) thì bác bỏ H0,AxB và kết luận là các tổ hợp của nhân tố AxB có ảnh hưởng đến
các giá trị trung bình
với i = 1, 2, …, k; j = 1, 2, …, m
Trang 8Công ty luật Minh Khuê www.luatminhkhue.vn
Tiếp đó chuyển sang so sánh đồng thời (xem 3.3) để tách ra những nhóm tổng thể thuần nhất
3.2.4.2.2 Kiểm nghiệm giả thuyết H 0,A
1) Đặt 1 = k - 1, 2 = N - km và xác định phân vị F 1-(1, 2) theo Bảng 5 với mức ý nghĩa
2) So sánh trị số F A tính được với giá trị tra bảng F 1-(1, 2)
- Nếu F A ≤ F 1-(1, 2): chấp nhận giả thuyết H 0,A theo 3.2.3.3.2
- Nếu F A > F 1-(1, 2): bác bỏ H 0,A và suy ra kết luận các mức của nhân tố A là có ảnh hưởng đến các
giá trị trung bình
với i = 1, 2, … k
Để tách các mẫu thuần nhất theo Y, ta phải thực hiện so sánh đồng thời (3.3).
3.2.4.2.3 Kiểm nghiệm giả thuyết H 0,B
1) Đặt 1 = m - 1, 2 = N - km và tra Bảng 5 để tìm phân vị F 1-(1, 2) ứng với mức ý nghĩa
2) So sánh F B tính được với giá trị tra bảng F 1-(1, 2)
- Nếu F B ≤ F 1-(1, 2) ta chấp nhận H 0,B nhờ 3.2.3.3.3
- Nếu F B > F 1-(1, 2) ta bác bỏ H 0,B và kết luận các mức của nhân tố B có ảnh hưởng đến các giá trị
trung bình
với j = 1, 2, … m
Để phát hiện các mẫu thuần nhất theo Y cần phải thực hiện phép so sánh đồng thời (3.3).
3.2.4.3 Nếu giả thuyết về sự bằng nhau của các phương sai bị bác bỏ, phân tích phương sai hai
nhân tố được chuyển thành phép phân tích phương sai một nhân tố với các phương sai không bằng
nhau (3.1.2.2.2) với số mức K = kmn.
3.3 So sánh đồng thời
3.3.1 Trường hợp các phương sai bằng nhau
Phương pháp Student - Newman - Keuls
Cần thực hiện các bước như sau:
1) Sắp xếp các trung bình mẫu , theo thứ tự tăng dần và đánh số lại các tổng thể theo chỉ
số của dãy mới thu được:
Ở đây:
cho trường hợp phân tích một nhân tố (ℓ = 1, 2, …, k);
cho trường hợp phân tích hai nhân tố có tương tác (ℓ = 1, 2, …, K = k x m);
cho trường hợp phân tích hai nhân tố theo nhân tố A (ℓ = 1, 2, …, K = k);
cho trường hợp phân tích hai nhân tố theo nhân tố B (ℓ = 1, 2, …., K = m).
2) Tính đại lượng:
(39)trong đó:
(40)
với n ℓ là số quan sát trong nhóm thứ ℓ
Trang 9Công ty luật Minh Khuê www.luatminhkhue.vn
Ở đây:
n ℓ = n i trong trường hợp phân tích một nhân tố;
n ℓ = n trong trường hợp phân tích hai nhân tố có tương tác;
n ℓ = n x m trong trường hợp phân tích hai nhân tố theo nhân tố A;
n ℓ = k x n trong trường hợp phân tích hai nhân tố theo nhân tố B.
3) Với mức ý nghĩa (thường = 0,1; = 0,05; = 0,01), tra Bảng 6 để tìm R (,3,4) phân vị trên của phân bố của độ rộng đã được Student hóa trong đó 3 = 2, 3, …, k; 4 là số bậc tự do của tổng các bình phương dư
I M = max {i, SR(M,i) ≥ R( , M - i + 1, 4 )} (42)
tức I M là chỉ số i lớn nhất sao cho thống kê SR(M,i) vượt qua phân vị R (, M - i + 1, 4)
Các tổng thể còn lại với các chỉ số lớn hơn I M cho ta:
2, I M cho đến khi phát hiện đầy đủ tất cả các nhóm thuần nhất
CHÚ THÍCH: Quy tắc này được thực hiện với các nhóm tổng thể thuần nhất và rời nhau
3.3.2 Trường hợp phương sai không bằng nhau
Quy tắc Dunnett so sánh các cặp trung bình có thể có:
1) Chọn mức ý nghĩa ( = 0,10; = 0,05 hay = 0,01) Tra Bảng 6 với i = 1, 2 …, k để tìm phân vị trên R (a, k, n i - 1)
Trang 10Công ty luật Minh Khuê www.luatminhkhue.vn
4) Nếu g ij < 0 và > 0 thì kết luận nhóm có chỉ số i không khác nhóm có chỉ số j Xét tiếp cặp chỉ số mới (i, j) và lặp lại mọi thủ tục như đối với cặp (i, j).
CHÚ THÍCH: Quy tắc trên được thực hiện với các nhóm tổng thể thuần nhất và rời nhau
4 Các phương pháp phân tích phương sai phi tham số
Mọi eij là độc lập và được lấy ra từ cùng một tổng thể
4.2.2 Phát biểu giả thuyết
nếu n i chẵn (47a)
nếu n i lẻ (47b)2) Tính giá trị tuyệt đối của các hiệu số:
với mọi i = 1, …, k; j = 1, …, n i (48)3) Tính các trung bình:
i = 1, 2, …, k (49)
(50)trong đó:
4) Tính giá trị của thống kê Brovvn - Forsythe:
(51)
5) Đặt 1 = k - 1, 2 = N - k Với mức ý nghĩa , tra bảng để tìm điểm phân vị F1- (1, 2) của phân bố
F.
Trang 11Công ty luật Minh Khuê www.luatminhkhue.vn
6) So sánh giá trị W0 vừa tính với F1- (1, 2)
- Nếu W 0 ≤ F1- (1, 2) ta chấp nhận giả thuyết về tính thuần nhất của eij và chuyển sang 4.2.3.2
- Nếu W 0 > F1- (1, 2) ta kết luận điều kiện áp dụng của 4.2.1 không được thỏa mãn
4.2.3.2 Quy tắc Kruskal - Wallis để kiểm nghiệm giả thuyết cơ bản
1) Sắp xếp tất cả quan sát (Bảng 1) theo thứ tự tăng dần:
Nếu có hai (hay nhiều) quan sát có giá trị trùng nhau thì gán cho chúng cùng một hạng bằng tổng các
chỉ số đó chia cho các quan sát trùng nhau Ví dụ nếu Y(7) = Y(8) = Y(9) thì chúng đều được gán hạng
2) Ký hiệu r ij là hạng của quan sát Y ij trong cách sắp xếp hạng trên
3) Với i = 1, 2, …, k, đặt:
; (53)4) Tính thống kê:
(54a)nếu các quan sát không trùng nhau, hoặc thống kê:
(54b)
nếu có các quan sát trùng nhau
trong đó: g - số nhóm các quan sát trùng nhau;
t j - số các hạng giống nhau trong nhóm thứ j.
5) Chọn mức ý nghĩa ( = 0,1; 0,05 hay 0,01)
- Nếu k = 3 (có 3 tổng thể cần so sánh) và với cỡ mẫu nhỏ (mỗi một trong các số n 1 , n 2 , n 3 không vượt
quá 5) Ta dùng Bảng 7 để xác định phân vị h,k (n 1 , n 2 , n 3)
Đặt h 2 = h, k (n 1 , n 2 , n 3) và chuyển sang 6)
CHÚ THÍCH: Bảng 7 cho các giá trị tới hạn h, n (n 1 , n 2 , n 3 ) cho trường hợp n 1 ≤ n 2 ≤ n 3 Nếu thứ tự này
không được thực hiện, cần phải đánh số lại các mẫu sao cho n 1 ≤ n 2 ≤ n 3 Việc đánh số lại các mẫu
không ảnh hưởng đến h.
- Nếu cỡ mẫu lớn, tra phân vị của phân bố 2 với k - 1 bậc tự do Đặt
6) So sánh giá trị tính được h (hay h') với giá trị tới hạn h
- Nếu h ≤ h chấp nhận giả thuyết H 0 về sự không sai khác giữa các tổng thể
- Nếu h > h: bác bỏ H 0 và suy ra kết luận các mức của nhân tố A có ảnh hưởng đến các giá trị trung bình của Y.
4.3 So sánh đồng thời
Các bước cụ thể như sau:
- Sắp xếp các giá trị R i theo thứ tự tăng dần:
và đánh số lại các tổng thể theo thứ tự hạng của chúng
Trang 12Công ty luật Minh Khuê www.luatminhkhue.vn
- Nếu mọi cỡ mẫu bằng nhau, tức là n1 = n2 = = n k = n thì chuyển sang 4.3.1 Trường hợp ngược lại
chuyển sang 4.3.2
4.3.1 Trường hợp các cỡ mẫu bằng nhau
4.3.1.1 Quy tắc Kruskal - Wallis (khi cỡ mẫu nhỏ)
1) Chọn mức ý nghĩa Với k, n và , tra Bảng 8 để tìm giá trị tới hạn y (, k, n) Đặt M = k.
3) Sau khi tách nhóm các tổng thể thuần nhất I M + 1, I M + 2, …, M, tiếp tục so sánh các hiệu
, i = 1, 2, …, I M - 1 với giá trị tới hạn y ( , k, n) Đặt M = I M và chuyển sang thuật toán ở 2) cho đến khi phát hiện đầy đủ mọi nhóm các tổng thể thuần nhất
4.3.1.2 Quy tắc tiệm cận (trường hợp các mẫu lớn)
Nếu cỡ mẫu vượt ra khỏi giới hạn của Bảng 8 thì phải dùng phương pháp tiệm cận
1) Với mức ý nghĩa đã chọn và với số nhóm k, cần tính q (k) nhờ Bảng 9.
2) Xác định giá trị tới hạn:
(58)3) Tiếp tục các bước 2 và 3 giống như trường hợp 4.3.1.1
4.3.2 Trường hợp cỡ mẫu không bằng nhau
3) So sánh hiệu số R(M.) - R(i.) với các giá trị tới hạn Y M,i với mọi i = 1, 2, …, M - 1 Giả sử:
I M = max {i: R (M.) - R (i.) ≥ Y M,i} (61)
I M là chỉ số của tổng thể sao cho với các tổng thể tiếp đó bắt đầu thực hiện các bất đẳng thức ngược:
(i = 1, 2, …, M - I M ) (62)
Từ đó suy ra, các tổng thể với các chỉ số I M + 1, I M + 2, …, M là không khác nhau theo Y.
4) Sau khi tách nhóm những tổng thể không khác nhau với các chỉ số I M+1 , I M+2 , , M, đặt M = l M rồi
Trang 13Công ty luật Minh Khuê www.luatminhkhue.vn
tiếp tục các bước 2) và 3) của điều này cho các tổng thể còn lại cho đến khi tách được hoàn toàn các
Bảng 5 - Phân vị của phân bố F
P {F > F1- (1, 2)} = 1) = 0,05; 1 - = 0,95
Trang 14Công ty luật Minh Khuê www.luatminhkhue.vn
Trang 15Công ty luật Minh Khuê www.luatminhkhue.vn
Trang 16Công ty luật Minh Khuê www.luatminhkhue.vn
Trang 17Công ty luật Minh Khuê www.luatminhkhue.vn