Mục đích • Bố trí thí nghiệm experimental design là lập kế hoạch về các bước cần tiến hành để thu thập số liệu cho vấn đề đang nghiên cứu.. • Thí nghiệm thực nghiệm: can thiệp vào nghi
Trang 1Phân tích Phương sai
5 Các bước tiến hành thí nghiệm
1 Mục đích
• Bố trí thí nghiệm (experimental design) là
lập kế hoạch về các bước cần tiến hành để thu
thập số liệu cho vấn đề đang nghiên cứu
• Mục đích để có những kết luận chính xác với
chi phí thấp nhất
2 Các loại thí nghiệm
• Thí nghiệm quan sát: chỉ quan sát các đói
tượng thí nghiệm, ghi nhận các dữ liệu liên quan đến các đặc điểm nghiên cứu
• Thí nghiệm thực nghiệm: can thiệp vào
nghiên cứu bằng cách bố trí các công thức thí nghiệm khác nhau lên đối tượng → tiến hành quan sát ảnh hưởng của các công thức lên đối tượng nghiên cứu
3 Các khái niệm
1 Nhân tố (Factor)
• Nhân tố là biến độc lập cần nghiên cứu, có thể
là biến định lượng hoặc định tính, biến liên tục
hoặc gián đoạn
• Thí dụ: nghiên cứu ảnh hưởng của các loại
thức ăn (nhân tố A) và giới tính (nhân tố B)
Trang 2Các khái niệm
3 Nghiệm thức (Treatment)
• Một tổ hợp các mức của các nhân tố được gọi
là một nghiệm thức
• Thí dụ nghiên cứu ảnh hưởng của protein và
thức ăn lên sản lượng sữa bò
4 Đơn vị thí nghiệm (Experimental Unit)
• Một đơn vị thí nghiệm là một đơn vị nghiên cứu trong thí nghiệm, hoặc cụ thể hơn đó là đơn vị nhỏ nhất mà một nghiệm thức được ứng dụng
• Thí dụ: đơn vị thí nghiệm có thể là 1 con gà, một đàn heo, một ruộng lúa…
Các khái niệm
5 Dữ liệu (Data)
• Nếu đơn vị thí nghiệm là một cá thể thì sau khi
cân, đo ta được một dữ liệu (data) hay một
quan sát (observation)
• Nếu đơn vị là một nhóm gồm nhiều cá thể thì
có thể cân, đo chung cho cả nhóm hoặc lấy
một số cá thể nhất định trong nhóm để cân, đo
sau đó suy ra một dữ liệu chung cho đơn vị thí
• Một nghiệm thức phải được lặp lại nhiều hơn 1
đơn vị thí nghiệm Điều này cho phép so sánh ảnh
hưởng của nghiệm thức với các mức biến thiên
sinh học của các đơn vị thí nghiệm
• Số nghiệm thức càng tăng thì sai số chuẩn càng
nhỏ và độ chính xác của thí nghiệm càng cao
• Số lần lặp lại không có giới hạn nhưng cần phải
cân bằng giữa độ chính xác và chi phí thí nghiệm
Các nguyên tắc cơ bản
2 Ngẫu nhiên hóa (Randomization)
• Mẫu phải được chọn sao cho tất cả các đơn vị thí nghiệm được bố trí ngẫu nhiên vào các nghiệm thức
• Điều này giúp tránh được các những sai sót do chủ quan của người làm thí nghiệm cũng như biến động của các yếu tố sinh học, môi trường…
Trang 3Các nguyên tắc cơ bản
2 Ngẫu nhiên hóa (Randomization)
• Để thực hiện việc ngẫu nhiên hoá, có thể dùng
5 Các bước tiến hành thí nghiệm
• Một thí nghiệm thường được tiến hành theo các bước:
– Đặt vấn đề – Phát biểu giả thuyết – Mô tả bố trí thí nghiệm – Thực hiện thí nghiệm (thu thập dữ liệu) – Phân tích số liệu thu thập được từ thí nghiệm – Giải thích kết quả.
CÁC KIỂU BỐ TRÍ THÍ NGHIỆM PHỔ BIẾN
• Bố trí ngẫu nhiên hoàn toàn (CRD)
• Bố trí khối ngẫu nhiên đầy đủ (RCBD)
• Bố trí ô vuông La tinh
1 Bố trí ngẫu nhiên hoàn toàn
1 Bố trí ngẫu nhiên hoàn toàn
1 Đặt tên cho các cột C1, C2, C3 lần lượt là
‘UNIT’, ‘RANDOM’, ‘GROUP’
Trang 4Áp dụng Minitab
2 Calc > Make Patterned Data > Arbitrary
Set of Numbers…
Store pattern data in: UNIT
Arbitrary set of numbers: 1:15
OK
Trang 5Áp dụng Minitab
4 Calc > Make Patterned Data > Arbitrary
Set of Numbers…
Store pattern data in: GROUP
Arbitrary set of numbers: 1:3
List each value: 5 times
5 Data > Unstack Columns …
Unstack the data in : RANDOM
Using subscripts in : GROUP
After last column in use
OK
• Đặt tên các cột C4, C5, C6 lần lượt là
‘TREAT A’, ‘TREAT B’, ‘TREAT C’
Áp dụng Minitab
Trang 61 Bố trí ngẫu nhiên hoàn toàn
2 Bố trí khối ngẫu nhiên đầy đủ
Nguyên tắc:
• Các đơn vị thí nghiệm được tập hợp thành từng khối (block) sao cho mỗi khối có đầy đủ tất cả các nghiệm thức
• Trong mỗi khối các đơn vị thí nghiệm có tính chất đồng đều
• Như vậy:
– số đơn vị thí nghiệm trong mỗi khối = số nghiệm thức.
– số khối = số lần lặp lại.
2 Bố trí khối ngẫu nhiên đầy đủ
2 Bố trí khối ngẫu nhiên đầy đủ
• Mỗi hàng và mỗi cột là một khối đầy đủ chứa tất cả các nghiệm thức
• Được dùng khi khảo sát nhân tố có hai hướng biến động khác nhau
• Số đơn vị thí nghiệm = (số nghiệm thức)2
Trang 7PHÂN TÍCH PHƯƠNG SAI (ANOVA)
• Một nhân tố (One-way ANOVA)
• Hai nhân tố (Two-way ANOVA)
– Không lặp lại – Có lặp lại
ANOVA – MỘT NHÂN TỐ
Các bước tiến hành:
1 Kiểm tra các điều kiện cần phải thỏa trước
khi tiến hành phân tích
Khẩu phần 1 Khẩu phần 2 Khẩu phần 3 Khẩu phần 4
Bước 1 Kiểm tra các điều kiện
1 Dữ liệu phải có phân bố chuẩn
Kiểm tra phân bố chuẩn
• Stat > Basic Statistics > Display Descriptive Statistic…
Trang 8Kiểm tra phân bố chuẩn
KP4 KP3
KP2 KP1
• Stat > ANOVA > Test for Equal Variances…
– Bartlett's Test (normal distribution) – P > 0.05 các phương sai giống nhau
Độ lêch chuẩn lớn nhất
= 34.9 = 1.53 < 2
Độ lêch chuẩn nhỏ nhất 22.9
Kiểm tra phương sai
Bước 2 Đặt giả thuyết
• H 0 : m1= m2= m3 = m4
• H 1: có ít nhất hai trong số các trung bình là bằng nhau
Bước 3 Tiến hành phân tích phương sai
Kết quả thí nghiệm được khái quát hóa:
Nhân tố thí nghiệm A Nghiệm thức 1 Nghiệm thức 2 Nghiệm thức 3 Nghiệm thức t
Xtn t
Bước 3 Tiến hành phân tích phương sai
Dữ liệu được mô hình hóa:
Dữ liệu quan sát = Trung bình mẫu + Sai số
Xij = mi + eij
trong đó
i = số nhóm mẫu = số nghiệm thức = 1, 2, 3, , t
j = cở mẫu = số lần lặp lại = 1, 2, , ni
Trang 9Bước 3 Tiến hành phân tích phương sai
Qui trình phân tích:
• Có hai nguồn biến động trong các dữ liệu:
(1) Sai khác giữa bốn khẩu phần ăn(variation
between group), còn gọi là ảnh hưởng của
nghiệm thức (treatment effect)
(2) Sai khác trong mỗi khẩu phần ăn (variation
within group), liên quan tới những biến động
ngẫu nhiên của môi trường, sai số thí nghiệm
Bước 3 Tiến hành phân tích phương sai
• Các biến động của dữ liệu được tính như sau:
Bước 3 Tiến hành phân tích phương sai
Tính các tổng bình phương:
• Tổng bình phương chung:
• Tổng bình phương NT: SST =
• Tổng bình phương sai số: SSE =
Source of variation Sum of Square degree of freedom Mean square F ratio
SST MST 1
t
MST MSE
Trang 10Chuyển dữ liệu thành Stacked Data
Chuyển dữ liệu thành Stacked Data
Tiến hành phân tích
Tiến hành phân tích
Dựa vào giá trị P:
• Nếu P < 0.05 bác bỏ H0 có ít nhất 2 trung bình mẫu khác nhau
Trang 11So sánh các nghiệm thức
• Giả sử rằng qua phân tích ANOVA ta phát hiện
được trung bình của các nghiệm thức khác biệt
có ý nghĩa (bác bỏ giả thuyết H0)
• Câu hỏi tiếp theo là những nghiệm thức nào có
trung bình khác nhau?
• Hai phương pháp phổ biến nhất để so sánh
trung bình của các nghiệm thức:
– Kiểm định Tukey (Tukey’s test)
– Kiểm định Fisher (Fisher’s test)
Kiểm đinh Tukey
• So sánh trung bình của các cặp nhân tố bằng cách dùng tỉ lệ sai lầm của nhóm (family error rate) để kiểm soát tỉ lệ sai lầm loại I
• Dùng khoảng tin cậy này để xác định xem có sự sai khác giữa các trung bình hay không:
– Nếu khoảng tin cậy không có chứa giá trị 0 thì trung bình giữa hai nhóm khác biệt có ý nghĩa về
Trang 12Diet 2 Diet 1
a
Tăng trọng theo khẩu phần
ANOVA – HAI NHÂN TỐ KHÔNG LẶP
• Thí dụ 1: So sánh độ ẩm đất (%) dưới tác động của 3 phương pháp tưới tiêu
1 2 3 4 5 6 7 8 9 10
7.6 9.3 11.8 12.4 13.5 12.9 7.1 10.8 10.3 9.4
9.1 5.8 5.9 9.8 9.3 11.9 3.6 7.9 8 8.4
8.2 10.1 10.2 12.6 12.6 13.1 8.9 7.8 11.8 8.6
Trang 13ANOVA – HAI NHÂN TỐ KHÔNG LẶP
D÷ liÖu Trung b×nh T¸c dông T¸c dông cña Sai sè
quan s¸t mÉu cña khèi nghiÖm thøc ngÉu nhiªn
ANOVA – HAI NHÂN TỐ KHÔNG LẶP
• Bảng ANOVA
Nguồn biến động
Tổng Bình phương (SS)
Độ tự do
Trung bình Bình phương (MS)
F tính
Khối Nghiệm thức Sai số
SSB SST SSE
b - 1
t - 1 (b - 1)(t - 1)
MSB=SSB/(b - 1) MST=SST/(t - 1) MSE=SSE/(b -1)(t-1)
MSB/MSE MST/MSE
Tổng SSTO bt - 1
Áp dụng Minitab
• Nhập liệu:
Địa điểm Phương pháp Độ ẩm
Trang 14ANOVA – HAI NHÂN TỐ KHÔNG LẶP
• Thí dụ 2: Số lượng tế bào lympho trong 5 lứa
chuột có và không tiêm thuốc
Drug Litter 1 Litter 2 Litter 3 Litter 4 Litter 5
6.9 5.9 6.2 5.7
5.6 5.1 5.0 5.2
6.4 5.8 6.2 5.3
Áp dụng Minitab
• Nhập liệu:
Trang 16Kết quả
0.5 0.4 0.3 0.2 0.1 0.0 -0.1 -0.2
Phân tích dữ liệu với bố trí hình vuông LT
• Thí dụ: Một thí nghiệm được bố trí nhằm khảo sát sản lượng lúa mì khi bón bằng các loại phân bón khác nhau:
A = không có phân bón (đối chứng)
B = phân N (liều lượng 1)
C = phân N (liều lượng 2 gấp đôi)
D = cyanamide
E = cyanamide + dicyanadiomide
Phân tích dữ liệu với bố trí hình vuông LT
• Kết quả: sản lượng thu được (lb/plot)
Nguồn biến động Tổng bình phương Độ tự do Trung bình bình phương Hàng
Cột Nghiệm thức Sai số
SSR SSC SST SSE
t – 1
t – 1
t – 1 (t – 1)(t – 2)
MSR MSC MST MSE
Trang 173
Trang 18• Thí dụ 1: Lượng thức ăn được chim tiêu thụ.
Giới tính (r = 2)
Khẩu phần ăn (c = 2) Diet 1 Diet 2 Trung bình hàng R
♂ 70.9 67.9 69.9
59.2 53.8
47 Trung bình nhóm phụ Y 69.57 53.33 61.45
♀ 65.7 59.4 67.7
50.8 50.5 50.5 Trung bình nhóm phụ Y 64.27 50.6 57.43 Trung bình cột C 66.92 51.97
Trang 19ANOVA – HAI NHÂN TỐ CÓ LẶP
• Mô hình hóa:
Xijk = mi + ai + bj + aibj + eijk
ANOVA – HAI NHÂN TỐ CÓ LẶP
• Bảng ANOVA:
Nguồn biến động SS df MS Giữa các cột (khẩu phần)
Giữa các hàng (giới tính) Tương tác (GT x KP) Sai số
SSC SSR SSI SSE
(c - 1) (r - 1) (c - 1)(r - 1)
cr (n - 1)
SSR/(c - 1) SSC/(r - 1) SSI/(c - 1)(r - 1) SSE/cr(n - 1) Tổng SSTO crn - 1 SST/(crn - 1)
Áp dụng Minitab
• Nhập liệu:
Trang 20• Thí dụ 2: thí nghiệm được tiến hành nhằm so sánh ảnh hưởng của pH đất và sự bổ sung Ca lên sự gia tăng đường kính của thân cây cam
Sau 2 năm, đường kính thân cây được ghi nhận như trong bảng sau:
Trang 21ANOVA – HAI NHÂN TỐ CÓ LẶP
Kết quả phân tích phương sai
• Four seedlings of each species were floodedfor one day and four were used as controls
The concentration of adenosine triphosphate(ATP) in the roots of each plant was measured
The data (nmol ATP per mg tissue) are shown
in the table
• A nutritionist wants to study the percentage ofprotein content in bread made from three newtypes of flours and baked at three differenttemperatures She would like to bake threeloaves of bread from each of the nine flour –temperature combinations for a total of 27loaves from which the percentage of proteinwould be determined However, she is onlyable to bake nine loaves on any given day
Trang 2218/11/2011 Thống kê Sinh học - Bùi Tấn Anh 127