Phân tích phương sai, Kiểm định sự bằng nhau của 2 phương sai, So sánh trung bình 2 mẫu
Trang 1Bài giảng tin ứng dụng
• Gv: Trần Trung Hiếu
• Bộ môn CNPM – Khoa CNTT – ĐH Nông Nghiệp Hà Nội
• Email: tthieu@hua.edu.vn
• Website: http://ccd.hua.edu.vn/tthieu
Trang 2CHƯƠNG IV: PHÂN TÍCH PHƯƠNG SAI, SO SÁNH VÀ
KIỂM ĐỊNH
Nội dung:
Phân tích phương sai
Kiểm định sự bằng nhau của 2 phương sai
So sánh trung bình 2 mẫu
Trang 3Phân tích phương sai
• Ví dụ
• Công cụ chủ yếu để phân tích số liệu khi theo
dõi ảnh hưởng của các mức nhân tố khác nhau tới kết quả hay ảnh hưởng tương tác của các nhân tố tới kết quả
Trang 41.1 Phân tích phương sai một nhân tố
• Được sử dụng để phân tích số liệu khi theo dõi ảnh hưởng của các mức nhân tố tới
• Dữ liệu có thể bố trí dưới dạng cột hay hàng
• Dữ liệu ứng với mỗi mức nhân tố có thể khác nhau
• Sử dụng công cụ Anova: Single Factor
• Phân tích kết quả
• Nếu F thực nghiệm > F lý thuyết (Fcrit) thì các mức nhân tố có tác động khác nhau tới kết quả (chấp nhận H1) Cần so sánh các công thức để rút ra công thức nào tốt nhất
Trang 5So sánh các trung bình dùng chỉ số LSD
• Sử dụng trong trường hợp kết luận các mức nhân tố có tác động
khác nhau tới kết quả
• Sử dụng để chỉ rõ tác động khác nhau của các mức nhân tố tới
kết quả là ntn: xếp thứ tự về sự tác động của các mức nhân tố tới kết quả
• Nếu cần so sánh trung bình CT Ti (với ri lần lặp) với trung bình
CT Tj (với rj lần lặp) có thể tính thêm chỉ số
LSD = tα,f f * SQRT(s2(1/ ri + 1/ rj )
t α,f f = TINV(α,f f) với α = 1 – p; f = df & within groups
s 2 = MS within groups: Phương sai chung
r i ,f r j : số lần lặp lại dữ liệu đối với các mức nhân tố i,f j
Trang 6Phân tích phương sai hai nhân tố
1 Ví dụ: Điều tra về chiều dài của cây, hai nhân tố xét đến là phân
bón và nhiệt độ
2 Xảy ra hai trường hợp:
Nhân tố A và B không tương tác, biến động gây nên bởi tác động
Bài toán 3: Xét riêng tác động đồng thời của (A,B)
» H0: Tác động đồng thời của 2 nhân tố không có tác động đáng kể tới kết
Trang 7Phân tích phương sai hai nhân tố không
tương tác
1 Không xét đến tác động đồng thời của hai nhân tố A, B
2 Cần giải quyết bài toán 1, bài toán 2
Trang 8Phân tích phương sai hai nhân tố tương tác
1 Xét đến cả tác động đồng thời của 2 nhân tố A, B
2 Cần giải quyết 3 bài toán về phân tích phương sai
» Xét giá trị F tn và F lt tương ứng với tác động đồng thời của hai nhân tố (interaction), nếu Ftn > Flt thì chấp nhận H1, tác động đồng thời là đáng kể tới kết quả, ngược lại chấp nhận H0
Trang 92 Kiểm định sự bằng nhau của hai
phương sai
Kiểm định hai phía
» H0: δ12 = δ22 (phương sai của biến X bằng phương sai của biến Y))
Trang 10Phân tích kết quả
Trong Excel, sử dụng công cụ F-Test Two Sample
for Variances để kiểm định một phía
Trang 113 So sánh trung bình 2 mẫu
• Với X, Y) là 2 DLNN độc lập, có phân phối chuẩn N(mX;
σ2X), N(mY); σ2Y)) ta có thể gặp các bài toán về kiểm định giả thuyết giá trị trung bình của 2 mẫu như sau:
Giả thuyết H0: mX = mY)+dĐối thuyết H1: mX ≠ mY)+d
Giả thuyết H0: mX = mY)+dĐối thuyết H1: mX > mY)+d
hoặc
Giả thuyết H0: mX = mY)+dĐối thuyết H1: mX < mY)+d
* Khi giá trị sai khác d=0 ta có bài toán kiểm định sự bằng nhau của 2 giá trị trung bình
Trang 123 So sánh trung bình 2 mẫu
Các trường hợp:
1 Lấy mẫu độc lập
TH biết phương sai σ2X, σ2Y)
TH không biết phương sai
» Kích thước mẫu lớn (nX>=30; nY)>=30)
» Kích thước mẫu nhỏ
• Hai phương sai bằng nhau
• Hai phương sai khác nhau
dữ liệu của 2 mẫu được lấy ngẫu nhiên, 2 mẫu là độc lập với nhau
dữ liệu của 2 mẫu lấy theo từng cặp
tương ứng
Trang 133 So sánh trung bình 2 mẫu
1 So sánh TB 2 mẫu độc lập khi biết phương sai
σ2X, σ2Y)
Qui tắc kiểm định trong xác suất
» Xét đại lượng Z=(Xtb-Y)tb-(mX-mY))-d)/sqrt(σ2X/nX+ σ2Y)/nY)) có
phân phối chuẩn tắc
» Nếu giả thuyết H0 đúng thì Z=(Xtb-Y)tb-d)/sqrt(σ2X/nX+ σ2Y)/nY))
có phân phối chuẩn tắc khi đó ta có bảng quy tắc kiểm định sau:
* Trường hợp này được trình bày chi tiết, các trường hợp khác tương tự
Sử dụng khi trong một tình huống nào đó ta đã biết
một tổng thể sau một thời gian chưa lâu, nên phương sai chưa thay đổi, do đó lấy phương sai
của lần điều tra trước để tính toán)
Trang 14bỏ H0 là:
+Nếu Z>Zα quyết định bác bỏ H0+Nếu Z<=Zα quyết định chấp nhận H0
Ta có: P(Z<-Zα)=α từ đây có quy tắc bác
bỏ H0 là:
+Nếu Z<-Zα quyết định bác bỏ H0
+Nếu Z>=-Zα quyết định chấp nhận H0
Trang 153 So sánh trung bình 2 mẫu
1 So sánh TB 2 mẫu độc lập khi biết
phương sai σ2X, σ2Y)
Ví dụ:
» So sánh giá trị trung bình của số cừu mắc bệnh
trong 8 nhóm tiêm phòng và 8 nhóm đối chứng Mẫu được lấy độc lập, biết phương sai tương ứng là 22, 18.
» Các bước thực hiện trong Excel:
Trang 16Tool Data Analysis, chọn công cụ phân tích: z-Test: Two Sample for Means
Trang 17Phương sai của biến 1
Phương sai của biến 2
Nếu có nhãn thì chọn
Nơi để kết quả
Trang 18Kết quả
Giả thiết sự khác nhau
của hai trung bình (d)
Trang 191 So sánh TB 2 mẫu độc lập khi biết
» Nếu Ztn> Zmột phía (z critical one-tail) thì bác bỏ H0 và ngược lại
Nếu Ztn<0 ta có bài toán kiểm định
H 0 : m X = m Y) +d
H 1 : m X < m Y) +d
» Nếu Ztn<-Zmột phía (z critical one-tail) thì bác bỏ H0 và ngược lại
Trang 20Vì z<0 nên ta xét bài toán kiểm
định với đối thuyết H1: mX<mY)
Ta có z=-2.068<-zmột phía=-1.644
nên bác bỏ H0, chấp nhận H1
(mX<mY))
Trang 21Thực hành
1 Sinh viên thực hành ví dụ vừa rồi với dữ
σ2Y)=18):
Trang 223 So sánh trung bình 2 mẫu
2 So sánh trung bình 2 mẫu độc lập trường hợp
không biết phương sai và kích thước mẫu lớn lớn (nX>=30, nY)>=30)
Xét đại lượng Z=(Xtb-Y)tb-(mX-mY))-d)/sqrt( s2X/nX+
s2Y)/nY)) có phân phối xấp xỉ phân phối chuẩn tắc
(trong đó s2X, s2Y) là các giá trị xấp xỉ của phương sai σ2X, σ 2Y) có thể tính được bằng hàm
VAR)
s2X bởi σ2X, s2Y) bởi σ2Y) và sử dụng công cụ z-Test:
two sample for means ta có thể giải quyết bài toán
Trang 233 So sánh trung bình 2 mẫu
3 So sánh trung bình 2 mẫu độc lập trường hợp không
biết phương sai và kích thước mẫu nhỏ (nX<30 và
nY)<30)
Để giải quyết bài toán này ta cần có giả thiết về sự bằng nhau
hay khác nhau của 2 phương sai σ2X, σ2Y)
Nếu đề bài chưa cho biết thông tin đó, cần kiểm định thêm
một giả thuyết phụ về sự bằng nhau hay khác nhau của 2 phương sai σ2X, σ2Y) đã học ở bài trước (sử dụng công cụ F- Test: Two-Sample for Variances)
» Nếu σ2X = σ2Y) ta giải quyết bài toán sử dụng công cụ phân tích
» Nếu σ2X ≠ σ2Y) ta giải quyết bài toán sử dụng công cụ phân tích
Trang 24Ví dụ 1: t-Test: Two-Sample Assuming Equal Variances
(giả thiết đề bài cho hoặc sau khi kiểm định có kết quả 2 phương sai bằng nhau)
Trang 25Ví dụ 1: Kết quả
Trung bình
Phương sai
Số quan sát
Giả thiết sự khác nhau
của hai trung bình
t thực nghiệm
P một phía và hai phía
t lý thuyết (tới hạn) một
phía và hai phía
Phương sai chung
Bậc tự do = n1 + n2 -2
Trung bình
Trang 26t-Test: Two-Sample Assuming Equal Variances
1 Căn cứ để kết luận
Kiểm định 2 phía
ngược lại
» Trong ví dụ 1: |ttn|=1.5187<thai phía=2.009 nên chấp nhận H0
(mX=mY)) Giá trị Phai phía> α là phù hợp với kết luận trên
Kiểm định một phía
H 0 : m X = m Y) +d
H1: mX > mY)+d
• Nếu ttn> tmột phía (t critical one-tail) thì bác bỏ H0 và ngược lại
H : m = m +d
Trang 27Ví dụ 2: t-Test: Two-Sample Assuming Unequal Variances
(giả thiết đề bài cho hoặc sau khi kiểm định có kết quả 2 phương sai không bằng nhau)
Trang 28Ví dụ 2: Kết quả
Trang 29t-Test: Two-Sample Assuming Unequal Variances
1 Căn cứ để kết luận (giống trường hợp 2 phương sai bằng nhau, chỉ
khác ở giá trị t tn do khác về công thức tính)
Kiểm định 2 phía
» Nếu |ttn|> thai phía (t Critical two-tail) quyết định bác bỏ H0 và ngược lại
» Trong ví dụ 2: |ttn|=1.7133<thai phía=2.009 nên chấp nhận H0
(mX=mY)) Giá trị Phai phía> α là phù hợp với kết luận trên
Kiểm định một phía
» Nếu ttn>0 ta có bài toán kiểm định
H 0 : m X = m Y) +d
H 1 : m X > m Y) +d
• Nếu ttn> tmột phía (t critical one-tail) thì bác bỏ H0 và ngược lại
» Nếu ttn<0 ta có bài toán kiểm định
H 0 : m X = m Y) +d
H 1 : m X < m Y) +d
• Nếu ttn<-tmột phía (t critical one-tail) thì bác bỏ H0 và ngược lại
Trang 303 So sánh trung bình 2 mẫu
3 So sánh trung bình 2 mẫu được lấy theo
cặp
Ví dụ:
Trang 31Vào Tools/Data Analysis
Trang 32Hiện ra của sổ
Miền của biến 1, kể cả
hàng đầu của mẫu quan
sát
Miền của biến 2
Giả thiết về hiệu hai
trung bình của hai tổng
thể H0: m1 = m2 thì ghi
0 Nếu H0: m1 = m2 + d
thì ghi d
Nếu có nhãn thì chọn
Trang 33Kết quả
Trang 34t-Test: Paired Two Sample for Means
1 Căn cứ để kết luận (giống trường hợp so sánh trung bình 2 mẫu độc lập có
kích thước mẫu nhỏ)
Kiểm định 2 phía
» Nếu |ttn|> thai phía (t Critical two-tail) quyết định bác bỏ H0 và ngược lại
» Trong ví dụ trên: |ttn|=3.3105>thai phía=2.3646 nên chấp nhận H1
(mX≠mY)) Giá trị Phai phía<α là phù hợp với kết luận trên
Kiểm định một phía
» Nếu ttn>0 ta có bài toán kiểm định
H 0 : m X = m Y) +d
H1: mX > mY)+d
• Nếu ttn> tmột phía (t critical one-tail) thì bác bỏ H0 và ngược lại
• Trong ví dụ trên: ttn>0 và ttn> tmột phía=1.8945 nên chấp nhận H1 (mX > mY)) Giá trị P một phía <α là phù hợp với kết luận trên
» Nếu ttn<0 ta có bài toán kiểm định