19 2.2.2 Phân tích hiệp phương sai đơn biến hai nhân tố không tương tác và một biến covariate .... 27 2.2.3 Phân tích hiệp phương sai đơn biến hai nhân tố tương tác và một biến covariate
Trang 1TRƯỜNG ĐẠI HỌC CẦN THƠ KHOA KHOA HỌC TỰ NHIÊN
BỘ MÔN TOÁN
LUẬN VĂN TỐT NGHIỆP ĐẠI HỌC
PHÂN TÍCH HIỆP PHƯƠNG SAI
VÀ ỨNG DỤNG
Giáo viên hướng dẫn Sinh viên thực hiện
Bộ môn Toán-Khoa KHTN Ngành: Toán Ứng Dụng K36
Cần Thơ-12/2013
Trang 2TRƯỜNG ĐẠI HỌC CẦN THƠ KHOA KHOA HỌC TỰ NHIÊN
BỘ MÔN TOÁN
- -
LUẬN VĂN TỐT NGHIỆP ĐẠI HỌC
PHÂN TÍCH HIỆP PHƯƠNG SAI
VÀ ỨNG DỤNG
Giáo viên hướng dẫn Sinh viên thực hiện
Bộ môn Toán-Khoa KHTN Ngành: Toán Ứng Dụng K36
Cần Thơ-12/2013
Trang 3MỤC LỤC
Trang LỜI CẢM ƠN iii
DANH MỤC CÁC BẢNG iv
PHẦN MỞ ĐẦU 1
Chương 1 PHÂN TÍCH PHƯƠNG SAI 3
1.1 GIỚI THIỆU 3
1.2 PHÂN TÍCH PHƯƠNG SAI ĐƠN BIẾN 3
1.2.1 Phân tích phương sai đơn biến một nhân tố 3
1.2.2 Phân tích phương sai đơn biến hai nhân tố không tương tác 5
1.2.3 Phân phương sai đơn biến hai nhân tố tương tác 8
1.3 PHÂN TÍCH PHƯƠNG SAI ĐA BIẾN 11
1.3.1 Phân tích phương sai đa biến một nhân tố 11
1.3.2 Phân tích phương sai đa biến hai nhân tố 14
Chương 2 PHÂN TÍCH HIỆP PHƯƠNG SAI 18
2.1 GIỚI THIỆU 18
2.2 PHÂN TÍCH HIỆP PHƯƠNG SAI ĐƠN BIẾN 19
2.2.1 Phân tích hiệp phương sai đơn biến một nhân tố với một biến covariate 19
2.2.2 Phân tích hiệp phương sai đơn biến hai nhân tố không tương tác và một biến covariate 27
2.2.3 Phân tích hiệp phương sai đơn biến hai nhân tố tương tác và một biến covariate 31
2.3 PHÂN TÍCH HIỆP PHƯƠNG SAI ĐA BIẾN 41
2.3.1 Phân tích hiệp phương sai đa biến một nhân tố với q biến Covariates 41
Trang 42.3.2 Phân tích hiệp phương sai đa biến hai nhân tố 45
Chương 3 ỨNG DỤNG 51
3.1 GIỚI THIỆU 51
3.2 ỨNG DỤNG TRONG NÔNG NGHIỆP 52
3.2.1 Bài toán 1 52
3.2.2 Giải quyết bài toán 1 52
3.3 ỨNG DỤNG TRONG KINH TẾ 54
3.3.1 Bài toán 2 54
3.3.2 Giải quyết bài toán 2 54
3.4 ỨNG DỤNG TRONG Y HỌC 56
3.4.1 Bài toán 3 56
3.4.2 Giải quyết bài toán 3 57
3.5 ỨNG DỤNG TRONG GIÁO DỤC 59
3.5.1 Bài toán 4 59
3.5.2 Giải quyết bài toán 4 59
KẾT LUẬN VÀ ĐỊNH HƯỚNG NGHIÊN CỨU 63
TÀI LIỆU THAM KHẢO 64
PHỤ LỤC 65
Trang 5
LỜI CẢM ƠN - -
Qua thời gian dài học tập tại trường Đại học Cần Thơ, Em đã được trang bị những kiến thức bổ ích và quý báu từ quý Thầy Cô và bạn bè
Em xin bầy tỏ lòng biết ơn và kính trọng nhất đến thầy Võ Văn Tài, người
đã trực tiếp hướng dẫn, chỉ bảo và động viên Em trong suốt quá trình thực hiện đề tài
Bên cạnh đó, Em xin gởi lời cảm ơn đến toàn thể quý Thầy Cô của bộ môn Toán-Khoa Khoa học Tự nhiên Em xin gởi lời cảm ơn đến thầy Trần Phước Lộc,
Cố vấn học tập và các bạn sinh viên ngành Toán Ứng dụng đã trợ giúp rất nhiều trong việc hoàn thành đề tài này
Em xin cảm ơn hội đồng bảo vệ luận văn đã xem xét và điều chỉnh những sai sót cũng như đóng góp ý kiến về những mặt còn hạn chế để đề tài được hoàn thiện hơn
Dù đã có nhiều cố gắng cùng với sự hướng dẫn tận tình của Thầy hướng dẫn, song do trình độ còn hạn chế nên khó tránh khỏi sai sót Rất mong nhận được sự thông cảm và góp ý từ Thầy Cô và các bạn
Cần Thơ, ngày 2 tháng 12 năm 2013
Trang 6DANH MỤC CÁC BẢNG
Bảng 1.1 Bảng dữ liệu phân tích ANOVA một nhân tố 4
Bảng 1.2 Bảng tóm tắt phân tích ANOVA một nhân tố 5
Bảng 1.3 Bảng dữ liệu phân tích ANOVA hai nhân tố không tương tác 6
Bảng 1.4 Bảng tóm tắt phân tích ANOVA hai nhân tố không tương tác 8
Bảng 1.5 Bảng dữ liệu phân tích ANOVA hai nhân tố tương tác 8
Bảng 1.6 Bảng tóm tắt phân tích ANOVA hai nhân tố tương tác 11
Bảng 1.7 Bảng dữ liệu phân tích MANOVA một nhân tố 12
Bảng 1.8 Bảng tóm tắt phân tích MANOVA một nhân tố 14
Bảng 1.9 Bảng dữ liệu phân tích MANOVA hai nhân tố 15
Bảng 1.10 Bảng tóm tắt kết quả phân tích MANOVA hai nhân tố 17
Bảng 2.1 Bảng dữ liệu phân tích ANCOVA một nhân tố 19
Bảng 2.2 Chiều cao và cân nặng trẻ em được phân theo giới tính 24
Bảng 2.3 Bảng số liệu phân tích ANCOVA hai nhân tố không tương tác 27
Bảng 2.4 Bảng số liệu phân tích ANCOVA hai nhân tố tương tác 31
Bảng 2.5 Bảng số liệu về năng suất lúa 37
Bảng 2.6 Bảng dữ liệu phân tích MANCOVA hai nhân tố 45
Bảng 3.1 Bảng kiểm định giá trị phương sai sai số 52
Bảng 3.2 Bảng kiểm định giả thiết H01 ,H02 trong ANCOVA 52
Bảng 3.3 Bảng kiểm định H03 sự tương tác giữa nhân tố và biến Covariate 53
Bảng 3.4 Bảng kiểm định giả thiết trong phân tích ANOVA 53
Trang 7Bảng 3.5 Bảng kiểm định bằng nhau của ma trận hiệp phương sai 54
Bảng 3.6 Bảng kiểm định giả thiết phân tích MANCOVA một nhân tố 54
Bảng 3.7 Bảng kiểm định của nhân tố với biến x 1 55
Bảng 3.8 Bảng kiểm định của nhân tố với biến x 2 56
Bảng 3.9 Bảng kiểm định phương sai sai số 57
Bảng 3.10 Bảng kiểm định giả thiết H01,H02 trong phân tích MANCOVA 57
Bảng 3.11 Bảng kiểm định ảnh hưởng tương tác giữa nhóm và x 1 58
Bảng 3.12 Bảng kiểm định ảnh hưởng tương tác giữa nhóm và x 2 58
Bảng 3.13 Bảng kiểm định sự bằng nhau của ma trận hiệp phương sai 60 Bảng 3.14 Bảng kiểm định các giả thiết thống kê MANCOVA 60
Bảng 3.15 Bảng kiểm định sự tương tác giữa giới tính và độ tuổi 61
Bảng 3.16 Bảng kiểm định sự tương tác giữa năm và độ tuổi 61
Bảng 3.17 Bảng kiểm định tương tác giữa nhân tố năm, giới tính và tuổi 62
Trang 8PHẦN MỞ ĐẦU
I GIỚI THIỆU
Trong phân tích và xử lý số liệu, ta thường quan tâm đến mô hình phân tích hồi qui và phân tích phương sai Trong đó phân tích phương sai được xem như một công cụ để thực hiện việc so sánh trung bình của hai hay nhiều tổng thể dựa trên giá trị trung bình của mẫu quan sát Các tính toán trong phân tích phương sai liên quan đến sự phân chia tổng phương sai tổng thể thành các thành phần phương sai bên trong nhóm và phương sai giữa các nhóm Thành phần bên trong nhóm cho ta ước lượng phương sai sai số, trong khi các thành phần giữa các nhóm ước lượng phương sai do ảnh hưởng của các nhân tố đang xét Tỷ số phương sai giữa các nhóm với phương sai bên trong nhóm cho ta một kiểm nghiệm đối với giả thiết cho rằng tất cả các trung bình đều bằng nhau Trái lại, phân tích hồi qui chủ yếu được sử dụng để tìm mối quan hệ giữa các biến, chúng
ta có thể ước lượng hình thức mối quan hệ giữa một biến đáp ứng và một biến độc lập
Phân tích hiệp phương sai là sự kết hợp cả hai phương pháp trên Phương pháp này được R.A.Fisher sử dụng lần đầu tiên trong bài báo nghiên cứu (1932), Ông xem đây là một kỹ thuật “kết hợp những ưu điểm và dung hòa các yêu cầu của hai phương thức được áp dụng rộng rãi và được biết dưới tên là hồi qui và phân tích phương sai”
Phân tích hiệp phương sai là một hướng nghiên cứu mới trong nhiều lĩnh vực do nó là sự mở rộng của mô hình phân tích phương sai Mục tiêu chính của phân tích hiệp phương sai là đạt được độ chính xác bởi giảm tổng bình phương sai số và mục tiêu thứ hai là giảm tác động của các nhân tố mà người thực hiện thí nghiệm không kiểm soát được Từ đó, việc nghiên cứu ảnh hưởng của các nhân tố đến biến đáp ứng chính xác hơn
II BỐ CỤC LUẬN VĂN
Bố cục luận văn gồm phần mở đầu, phần nội dung, phần kết luận, phần tài liệu tham khảo và phần phụ lục Phần nội dung luận văn gồm 3 chương:
Chương 1 Phân Tích Phương Sai
Trình bày một số mô hình phân tích phương sai thông dụng như phân tích phương sai một nhân tố, phân tích phương sai hai nhân tố,… Đây cũng là cở sở cho việc hình thành phương pháp phân tích hiệp phương sai
Trang 9Chương 2 Phân tích hiệp phương sai
Trình bày cở sở lý thuyết của các mô hình phân tích hiệp phương sai như phân tích hiệp phương sai đơn biến, phân tích hiệp phương sai đa biến,… Bên cạnh đó còn trình bày một vài ví dụ được thực hiện thủ công dựa trên cở sở lý thuyết đã trình bày
Chương 3 Ứng dụng
Dựa vào những mô hình đã phân tích ở chương 2, chương này đưa ra một
số ứng dụng của phân tích hiệp phương sai dựa trên số liệu thực tế trong các lĩnh vực như giáo dục, nông nghiệp, y học và kinh tế
Trang 10Nhân tố được hiểu là các yếu tố, điều kiện khách quan (thời tiết, khí hậu, thiên tai,…) hoặc chủ quan (phương pháp thí nghiệm, giống cây trồng,…) có tác động trực tiếp đến sự biến động của biến ngẫu nhiên mà ta nghiên cứu
Quan điểm của phân tích phương sai là việc khai triển phương sai của biến
ngẫu nhiên (X) thành tổng của những phương sai của những biến ngẫu nhiên
thành phần độc lập, mà mỗi cái trong chúng đặc trưng cho sự ảnh hưởng của yếu
tố này hay yếu tố khác hoặc tác dụng chung giữa chúng So sánh những phương sai này cho phép ta đánh giá sự tồn tại ảnh hưởng của các yếu tố đó với biến ngẫu
Trang 11a) Mô hình
Giả sử xét mẫu ngẫu nhiên đƣợc tạo bởi một yếu tố A tác động gồm m mức
đƣợc cho bởi bảng sau:
Bảng 1.1 Bảng dữ liệu phân tích ANOVA một nhân tố
1 n i
i
j i
i j
m i i
X X
Trang 122
1
m
i i i
i
n m
SSE MSE
Trung bình bình phương
Giá trị quan sát
Giữa các mẫu (nhân tố)
2
1
( )
m
i i i
Chú ý: Để thực hiện được phân tích phương sai một nhân tố, ta cần quan tâm
một số điều kiện sau:
+ ijcó phân phối chuẩn 2
N , + Các nhóm so sánh phải được được chọn một cách ngẫu nhiên và độc lập, + Các nhóm so sánh phải có phân phối chuẩn hoặc cỡ mẫu đủ lớn,
+ Phương sai các nhóm so sánh phải đồng nhất
Trang 131.2.2 Phân tích phương sai đơn biến hai nhân tố không tương tác
Phương pháp phân tích phương sai hai nhân tố là phương pháp ước tính sự ảnh hưởng của hai nhân tố thay vì một nhân tố như trước đó
a) Mô hình
Giả sử ta có biến ngẫu nhiên X ij có phân phối chuẩn chịu sự ảnh hưởng
của nhân tố A có m mức ( i 1,m ) và nhân tố C có n mức ( j 1,n) Cụ thể ta có bảng số liệu sau:
Bảng 1.3 Bảng dữ liệu phân tích ANOVA hai nhân tố không tương tác
Giả thiết rằng A và C cùng tác động lên X nhưng theo một cách riêng rẽ Ta có
mô hình ANOVA 2 nhân tố không tương tác như sau:
Trang 14 : Tổng bình phương chung, SST phản ánh biến thiên
của biến đáp ứng do chịu ảnh hưởng của tất cả các nhân tố
: Sai số ngẫu nhiên SSE phản ánh biến
thiên của biến đáp ứng do chịu ảnh hưởng của các nhân tố không nghiên cứu
Khi đó SST SSA SSC SSE
* Giá trị quan sát cho H là0A 1
A A
MSF m F
MSF n F
F là phân vị Fisher với mức ý nghĩa và bậc tự do
(m1),(m1)(n1)
Bác bỏ giả thiết H nếu0C F C F(n1),(m1)(n1)
Trang 15MSF m F
MSF n F
Giả sử có hai yếu tố A, C tác động Yếu tố A có m mức tác động, yếu tố C có
n mức tác động và giả sử mỗi ô (i,j) chịu tác động bởi AC có số quan sát nhƣ i j
nhau Với X ijk i1, ;m j1, ;n k 1,l là quan sát thứ k trên hàng i và cột j
Giả sử cácX có phân phối chuẩn ijk 2
Trang 161 l
ij ijk i
Trang 171 i j i ijk
Khi đóSST SSA SSA SSAE SSE
* Giá trị quan sát cho H là0A ( 1)
( 1)
A
SSA m F
m
, (m1): Bậc tự do của A,
Trang 18
1
C
SSC MSF
F và F(n1),(mn l(1) có phân vị Fisher với mức ý nghĩa và bậc tự do lần lượt là ( m 1), mn l ( 1) và ( n 1), mn l ( 1)
Bác bỏ giả thiết H0AC nếu FAC F(m1)(n1),mn l(1) Trong đó (m1)(n 1),mn l( 1)
F có phân vị Fisher với mức ý nghĩa và bậc tự do
( m 1)( n 1), mn l ( 1)
Bảng 1.6 Bảng tóm tắt phân tích ANOVA hai nhân tố tương tác
Nguồn biến động Tổng bình phương Độ tự do Giá trị quan sát F
( 1)
A
SSA m F
Trang 19 biến ngẫu nhiên độc lập Trong đó Xij ~ Np( , ) i , ( i 1, ; m j 1, ) ni Ta có bảng dữ liệu sau:
Bảng 1.7 Bảng dữ liệu phân tích MANOVA một nhân tố
ijp
X X X
Trang 20H H
trong nội bộ mẫu Ma trận E có độ tự do là N-m
* Giá trị quan sát choH0là E
Trang 21 Định lý kiểm định tỷ số hợp lý của thống kê Wilk
Nếu Y iij ( 1,2, , ; k j 1,2, , ) n là các quan sát độc lập từ Np( , ) i thì tỷ số hợp lý cho thống kê kiểm định H0 1 2 m có thể được biểu diễn:
T
i n
Bảng 1.8 Bảng tóm tắt phân tích MANOVA một nhân tố
Nguồn biến động phương và tích chéo Ma trận tổng bình Độ tự do Giá trị quan sát
E B
1.3.2 Phân tích phương sai đa biến hai nhân tố
Phân tích phương sai đa biến hai nhân tố là phân tích ảnh hưởng của hai nhân tố nguyên nhân ảnh hưởng đến nhiều kết quả
a) Mô hình
Tương tự như phân tích ANOVA hai nhân tố, ta giả sử biến đáp ứngXijchịu
ảnh hưởng bởi hai nhân tố A và C Nhân tố A được xem xét ở các mức
1, 2, , m
A A A và nhân tố C được xem xét ở các mức C C1, 2, , Cn
Trang 22Bảng 1.9 Bảng dữ liệu phân tích MANOVA hai nhân tố
ij
k k k
kp
X X X
i 1, m j ; 1, ; n k 1, l : Véc tơ ngẫu nhiên có phân phối
chuẩn p chiều, độc lập và có cùng ma trận hiệp phương sai
1 2
i i i ip
Trang 23m m
0
n n
Trang 24Ta có bảng tóm tắt kết quả phân tích MANOVA hai nhân tố nhƣ sau:
Bảng 1.10 Bảng tóm tắt kết quả phân tích MANOVA hai nhân tố
Nguồn biến động
Trang 25Trong giới hạn của một biến đáp ứng và một biến Covariate, phân tích hiệp phương sai sẽ thành công nếu thỏa mãn 3 giả thiết sau:
i) Biến đáp ứng có mối quan hệ tuyến tính đến biến Covariate(s)
Nếu giữ giả định này, một phần sai số trong mô hình là dự đoán được và có thể được loại bỏ để giảm phương sai sai số Giả định này, ta có thể kiểm tra bởi giả thiết H0: 0, trong đó là hệ số dốc từ mô hình hồi qui của biến đáp ứng trên biến Covariate(s) Phân tích hiệp phương sai sẽ luôn cho sai số nhỏ hơn phân tích phương sai
ii) Các nhóm có hệ số dốc bằng nhau
Chúng ta có thể kiểm tra giả định này bằng giả thiết:
Trong đói có hệ số dốc trong nhóm thứ i Nếu giả định này được giữ, nghĩa là
các đường thẳng hồi qui trong mỗi nhóm là song song nhau Hay nói cách khác, nhân tố và biến Covariate không có ảnh hưởng tương tác nhau
iii) Biến Covariate X cố định và độc lập với các nhóm mức của nhân tố
Nếu biến Covariate được đo trước khi thử nghiệm, sự độc lập của các nhóm mức và biến Covariate được thỏa mãn theo định nghĩa Tuy nhiên, nếu biến Covariate được đo sau thử nghiệm, sự độc lập của các nhóm mức Covariate nên được kiểm định Để kiểm tra giả thiết này, ta có thể sử chạy ANOVA sử dụng
biến Covariate X là biến đáp ứng Với giả thiết là không có sự khác biệt đáng kể trong X giữa các nhóm mức và ta mong đợi để tìm thấy không có sự khác biệt
đáng kể để có thể thực hiện một phân tích hiệp phương sai tiêu chuẩn
Trang 262.2 PHÂN TÍCH HIỆP PHƯƠNG SAI ĐƠN BIẾN (ANCOVA) 2.2.1 Phân tích hiệp phương sai đơn biến một nhân tố với một biến Covariate a) Mô hình
Giả sử ta có biến đáp ứng chịu ảnh hưởng của nhân tố A Nhân tố A được
xem xét ở các mứcA A1, 2, ,A với cỡ mẫu tương ứng k n n1, 2, ,n và k
1
k i i
k
kn Y
Phân tích tương tự mô hình hồi qui, mô hình ANCOVA một nhân tố với một biến Covariate có dạng:
X là biến Covariate được quan sát trên cùng một đơn vị mẫu như ij Y , ij
là hệ số dốc chung của mối quan hệ tuyến tính giữa X và ij Y , ij
ij là sai số ngẫu nhiên và ij ~N(0,2) Tham số i (i1, 2, , )k được xem như hằng số hồi qui cho k nhóm
Biểu thức (2.1) có thể được viết lại như sau:
Y X Khi đó phân tích hiệp phương sai được xem như phân tích ANOVA với biến mới
là YijXij
b) Các bước thực hiện
Trang 27* Chọn giả thiết và đối thiết:
Khi đó tổng bình phương trong nội bộ mẫu của Y đã điều chỉnh:
( )
2 ˆ
Trang 28i j
Ta có tổng bình phương chung trong Y đã điều chỉnh:
SST
Xét mô hình hồi quy tuyến tính: Yij 0 1Xijij (2.5)
Mô hình (2.1) được gọi là mô hình đầy đủ còn mô hình (2.5) được gọi là mô hình giảm thu được từ mô hình (2.1) bằng cách bỏ qua tác động nhân tố
i j n k
n k
n k
i j n k
Trang 29n k n
k
i j
n k
Chú ý: Ta không tính
(adj)
Y SSB tương tự như
(adj)
Y SSE và
(adj)
Y SST trong (2.3), (2.4)
mà ta sử dụng phương pháp tiếp cận mô hình đầy đủ và mô hình giảm Cụ thể
(adj)
Y
SSB được tính bằng phép trừ, bởi vì chúng ta không có các giá trị của biến Covariate X giống nhau cho mỗi mẫu, và thiết kế do đó không cân bằng (thậm chí nếu n của các mẫu là bằng nhau) Nếu i
(adj)
Y SSB được tính toán tương tự như (2.3), (2.4) thì
(adj)
Y SST bởi vì thiếu cân bằng gây
ra bởi các biến Covariate X
Bên cạnh đó, ta cần ƣớc lƣợng hệ số dốc riêng cho mỗi mẫu, sau đó so sánh với
hệ số dốc chung
Đặt
2 ij
i Xi
SPE SS
SSE
Trang 30- Sự khác biệt giữa tổng của các tổng bình phương do hệ số dốc i khác nhau trong mỗi mẫu và tổng bình phương do hệ số dốc của tất cả các mẫu,
- Tổng bình phương sai số của biến Y đã điều chỉnh cho k đường hồi qui với các
hệ số dốc khác nhau trong các mẫu,
* Giá trị quan sát cho H là 01 ( )
Y Y
SSB k F
adj
X Y
SPE SSE F
Bác bỏ H nếu 03 F03 F(k1,N2 )k Trong đó (k 1,N 2 )k
F có phân vị Fisher với mức ý nghĩa và bậc tự do (k1,N2 )k
Chú ý: Khi thực hành ta có thể kiểm định giả thiết H trước, để xem xét mối 02quan hệ giữa X và Y Nếu giả thiết H không bị bác bỏ thì phân tích ANCOVA 02phải dùng lại, bởi vì bài toán phân tích ANCOVA trở thành bài toán phân tích ANOVA Tiếp theo, ta kiểm định giả thiết H để kiểm tra sự tương tác giữa các 03
Trang 31nhân tố và các biến Covariate X Ta mong đợi rằng, giả thiết H không bị bác 03
bỏ để thực hiện một phân tích ANCOVA tiêu chuẩn Cuối cùng, ta trở lại bài toán phân tích ANOVA trên biến đáp ứng đã được điều chỉnh cùng giá trị của biến Covariate cho các nhóm thông qua kiểm định giả thiết H 01
Ví dụ 2.1 Một nghiên cứu về dinh dưỡng đưa ra các số liệu để phân tích sự ảnh
hưởng của giới tính đến chiều cao của trẻ trong khoảng 11 đến 12 tháng tuổi Dữ liệu thu thập một cách ngẫu nhiên gồm chiều cao và cân nặng của trẻ được lấy
từ 2 nhóm giới tính nam và nữ Sự khác nhau của hai nhóm này có thể là do ảnh hưởng của giới tính khác nhau tác động đến trẻ Trong phân tích này, chiều cao
là biến đáp ứng và giới tính là yếu tố nguy cơ được quan tâm
Số liệu được cho trong bảng dưới đây
Bảng 2.2 Chiều cao và cân nặng trẻ em đƣợc phân theo giới tính
Trang 32SSB k F
Tuy nhiên, trước khi kết luận chúng ta nên xem xét còn có yếu tố nào khác
không Một biến thu hút sự chú ý đó là biến cân nặng (X)
Ta có thể thấy rằng, chiều cao của bé trai lớn hơn chiều cao của bé gái khoảng 1.266(cm), trong khi cân nặng của bé gái lớn hơn bé trai khoảng 0.605(kg)
Vì hai nhóm này khác nhau về cân nặng, mà cân nặng có liên hệ với chiều cao nên chúng ta không thể phát biểu hay so sánh chiều cao của hai nhóm giới tính
mà không thực hiện việc điều chỉnh cho cân nặng Do đó việc so sánh về chiều cao chỉ có thể khách quan khi cân nặng giữa hai nhóm giới tính tương đương nhau Để đảm bảo tính khách quan cho so sánh ta tiến hành phân tích số liệu bằng phương pháp phân tích hiệp phương sai
Mô hình ANCOVA giả định mối quan hệ giữa X và Y là một đường thẳng và hệ
số dốc của hai nhóm trong mối quan hệ này không khác nhau
Để xem xét sự phát triển chiều cao của trẻ có liên quan đến độ tuổi hay không, ta tiến hành kiểm định hệ số
* Kiểm định giả thiết H02: 0
30.192
X
SPE SSE
Trang 33SPE SSE F
F =4.3248 nên bác bỏ giả thiết H Nghĩa là có một sự phụ 02
thuộc mạnh mẽ giữa chiều cao và cân nặng Cân nặng là một biến Covariate hữu ích trong phân tích này
* Kiểm định giả thiết H03:1 2
không ảnh hưởng tương tác nhau
* Kiểm định giả thiết 1
H
Để so sánh sự ảnh hưởng thật sự của giới tính đến chiều cao của trẻ, không quan tâm đến sự khác biệt về cân nặng giữa các nhóm Trung bình chiều cao giữa các nhóm nên được điều chỉnh để chúng có cùng độ cân nặng ban đầu
Các điều chỉnh tổng bình phương được xác định như sau:
Trang 34Y Y
SSB k F
tính có ảnh hưởng đến chiều cao của trẻ em
2.2.2 Phân tích hiệp phương sai đơn biến hai nhân tố không tương tác và một biến Covariate
a) Mô hình
Giả sử biến đáp ứng Y chịu ảnh hưởng bởi hai nhân tố A (có m mức) và ij
nhân tố C (có n mức) Số liệu thí nghiệm có dạng:
Bảng 2.3 Bảng số liệu phân tích ANCOVA hai nhân tố không tương tác
Trang 35Ta xét các tổng bình phương và tích chéo giữa X và Y
Trang 36Y A
Y
SSA m F
Y C
Y
SSC n F
X Y
SPE SSE F
F trên ta cần chú ý rằng, m đường thằng hồi qui ứng với m
mức tác động của nhân tố A là song song nhau
Trang 37i AXi
SPE SS
Trang 38Bác bỏ giả thiết H nếu 02 F02 F1,(m1)(n 1) 1 Trong đó 1,(m 1)(n 1) 1
F có phân vị Fisher với mức ý nghĩa và bậc tự do
1,(m1)(n 1) 1 Bác bỏ giả thiết H nếu 03A F03AF(m1),(m1)(n 1) m Trong đó (m 1),(m1)(n 1) m
F có phân vị Fisher với mức ý nghĩa và bậc tự
do(m1),(m1)(n 1) m
Bác bỏ giả thiết 03C
H nếu 03C (n 1),(m1)(n 1) n
F F Trong đó (n 1),(m1)(n 1) m
F có phân vị Fisher với mức ý nghĩa và bậc tự
11
n
X X
X
111 112
11
n
Y Y
Y
121 122
12
n
X X
X
121 122
12
n
Y Y
cn
X X
cn
Y Y
Y
A 2
211 212
21
n
X X
X
211 212
21
n
Y Y
Y
221 222
22
n
X X
X
221 222
22
n
Y Y
cn
X X
cn
Y Y
Y
A a
11 12
1
a a
a n
X X
X
11 12
1
a a
a n
Y Y
Y
21 22
2
a a
a n
X X
X
21 22
2
a a
a n
Y Y
Y
1 2
ac ac
acn
X X
X
1 2
ac ac
acn
Y Y
Y
Giả sử các quan sát đều có phân phối chuẩn với kỳ vọng chƣa biết và
Trang 39phương sai bằng 2 Mô hình phân tích ANCOVA có dạng:
Y X (i1, ;a j1, ;c k 1,n) Trong đó
c AC
ac
H H H
n
: Trung bình các phần tử ở dòng i cột j của Y,