Bước 3 :Ta chọn Tabulor options để mở bảng ô màu vàng mũi tên đang chỉ ở hình 12 Comparisons of means bảng phân tích giá trị trung bình và bảng Comparisons of Standard Deviations bảng ph
Trang 1HƯỠNG DẪN GIẢI BÀI TẬP 3
1 Định dạng cột (định danh cột): 3
2 Trong phần mềm này có hai cách nhập dữ liệu 4
a Data columns 4
b Data code columns 5
HƯỚNG DẪN GIẢI BÀI TẬP 6
I SO SÁNH 2 MẪU 6
BÀI 1 6
Bài 2 12
BÀI 3: 15
II THÍ NGHIỆM MỘT YẾU TỐ 16
2.1 Mẫu hoàn toàn ngẫu nhiên 1 yếu tố (completely Randomized Design _CRD) 16
Bài 11 16
Bài 12: 20
2.2 Mẫu khối hoàn toàn ngẫu nhiên 1 yếu tố 22
Bài 51: 22
Bài 52 26
Bài 69 28
Bài 70: 31
Bài 71: 32
III THÍ NGHIỆM 2 YẾU TỐ 34
3.1 Mẫu hoàn toàn ngẫu nhiên 2 yếu tố (Completely Randomized Design-CRD) 35
Bài 76: 35
Bài 78: 41
3.2 Mẫu khối hoàn toàn ngẫu nhiên 2 yếu tố (RCBD) 43
Bài 86: 43
Bài 87 57
3.3 kiểu bình phương Latin 2 yếu tố ( Latin square Design – LS) 59
Bài 96 59
Trang 2BÀI 97 60
IV PHÂN TÍCH TƯƠNG QUAN HỒI QUY 64
Bài 98 Dạng hồi quy đơn giản chỉ có tương quan của X và Y 64
Tài liệu tham khảo 71
Trang 3BÀI TẬP QUY HOẠCH THỰC NGHIỆM
HƯỠNG DẪN GIẢI BÀI TẬP
Trong nhiều thời gian học tập chúng ta có gắng học tập để hoàn thành môn học một cách tốt nhất có thể Để giúp các bạn ôn tập tốt hơn câu lạc bộ Biotech “Biotech club” xin giới thiệu
với các bạn một tập tài liệu ôn tập khá đầy đủ về thực hành tin học ứng dụng trong công
nghệ sinh học Với bộ tài liệu này sẽ giúp các bạn ôn tập tốt hơn
Để vào nội dung chính chúng tôi xin giới thiệu sơ qua về phần mền Statgraphics plus Một phần mềm khá thông dụng trong thống kê sinh học
Để các bạn làm tốt các bài tập có hai điều các bạn cần nhớ là: Định dạng cột(định nghĩa cột)
và Cách nhập dữ liệu Với các bước phân tích thì các bạn có thể biết nhưng cái quan trọng hơn nhưng nhiều người thường quên quan tâm là cách nhập dữ liệu
1 Định dạng cột (định danh cột):
Sau khi khởi động Statgraphics plus Ta ấn chuột trái vào col_1, sau đó ấn phím phải chuột được như bảng sau:
Hình 1: Định dạng cột (định nghĩa cột)
Trang 4Chọn MODIFY COLUMN…(như hình 1)
Hình 2: Định nghĩa dạng cột
Sau khi định dạng cột xong ta nhập dữ liệu như excel
2 Trong phần mềm này có hai cách nhập dữ liệu
a Data columns (đây là cách nhấp dữ liệu tương tự như trong excel)
Xem hình sau: (dữ liệu bài tập 1)
Trang 5Hình 4: Chọn kiểu dữ liệu nhập vào chọn kiểu character (kiểu chuỗi)
Với giống xoài (A, B) nên định dạng cột phải chọn character (CHECK THEO MŨI TÊN CHỈ) như hình 4 Thay vì mặc định là kiểu Numeric (số)
Độ Brix định dạng tương tự nhưng chọn kiểu số: (CHECK THEO MŨI TÊN CHỈ)
Hình 5: Chọn kiểu dữ liệu nhập vào chọn kiểu numeric (kiểu số)
Tiếp nhấn OK, và nhập dữ liệu vào
Trang 6Xem hình 6
Hình 6: Nhập theo kiểu Data code columns (dữ liệu bài 1)
Giống A lặp lại 10 lần; giống B lặp lại 7
Trang 7Hình 8: Cách lưu dữ liệu và kết quả
- Lưu dữ liệu: File save save Data File (hoặc shift +f12)
- Lưu kết quả : File save save StaFilio (hoặc shift +f11)
- Lưu đồ thị: File save save StaGallery (hình ảnh)
Để so sánh xem độ Brix trong hai mẫu nước quả Hỏi đã đầy đủ chứng cứ cho thấy sự khác biệt độ Brix giữa hai sản phẩm này chưa?
Lệnh so sánh như sau:
Hình 9: Các bước so sánh trung bình 2 mẫu
- Bước 1: Vào compare two sample two-sample comparison
Hiện cửa sổ Two sample comparison (bảng so sánh 2 đối tượng):
Trang 8Hình 10: Hộp thoại Two-Sample comparison
- Bước 2 : chọn 2 đối tượng cần so sánh chọn mẫu A vào simple 1 (hoặc ngược lại) mẫu B
vào simple 2 Bằng cách Nháp chuột vào đối tượng A nhấp mũi tên phía dưới chữ sample 1; chọn đối tượng còn lại nhấp chuột vào mũ tên thứ 2 phía dưới sample 2 Xem hình 11
Hình 11 : chọn đối tượng so sánh
Nhấn OK
Ta nhận được bảng kết quả như hình 12 : Analysis Summary
Trang 9Hình 12 : Bảng Analysis Summary
Bước 3 :Ta chọn Tabulor options để mở bảng (ô màu vàng mũi tên đang chỉ ở hình 12)
Comparisons of means (bảng phân tích giá trị trung bình) và bảng Comparisons of Standard Deviations (bảng phân tích phương sai) Bằng cách check vào ô vuông nhỏ phía
trước Như hình sau Nhấp OK
Hình 13 : Bảng công cụ phân tích
Đối với những bài so sánh 2 đối tượng kiểu này hoặc nhiều hơn Chúng ta chỉ quan tâm đến
bảng Comparison of Standard Deviations (bảng phân tích phương sai) và bảng Comparisons
of means (bảng phân tích giá trị trung bình)
Ta được bảng phân tích như trên hình 14
Trang 10Hình 14 : Các bảng phân tích
Để mở rộng cửa sổ qua tâm ta double click vào của sổ đó
Trong trình tự phân tích chúng ta cần quan tâm đến bảng Comparisons of Standard
Deviations
Mở rộng bảng Comparisons of Standard Deviations (double click)
Để so sánh các phương sai
Chúng ta cần quan tâm đến P-value Nếu P-value> mức ý nghĩa α ( mặc định α=0.05) chấp
nhận Ho (chấp nhận giải thiết sigma1 = sigma2) Ngược lại Nếu Nếu P-value< mức ý nghĩa α bác bỏ H0 Tức sigma1 ≠ sigma2 (có thể lớn hơn hoặc nhỏ hơn)
Trong bài này chúng ta chỉ quan tâm đến việc bằng hay không bằng của sigma1 và sigma2 Sau khi phân tích ta nhận được bảng Comparisons of Standard Deviations như 15
Trang 11Hình 16: Bảng Comparisons of means
Theo đề bài chúng ta cần biết là trung bình hai mẫu có khác nhau không
Bước 4: Ta xét bảng phân tích thấy P-value =0,00152785 < α=0.05 bác bỏ giải thiết
Tức mean1 ≠ mean2
Trong phần này chúng ta cần lưu ý Tại sao chúng ta chọn P-value =0,00152785 mà không
chọn các giá trị khác
- Để giải thích cho điều này chúng ta cần xem xét 2 việc Một là sigma1 và sigma2 bằng
nhau hay khác nhau Nếu bằng (sigma1 = sigma2) trong đối thiết mean1 và mean2 ta chọn
P-value của dòng trên (dòng chứa « assuming equal variances » (tạm dịch phương sai bằng nhau) Ngược lại (sigma1 ≠ sigma2) chọn P-value của dòng dưới, dòng chứa “not assuming equal variances »(tạm dịch 2 phương sai khác nhau) Và cũng so sánh với mức ý nghĩa α như trên
Trang 12- Còn nếu bài so sánh thì cần quan tâm đến 2 đối thiết (2) và (3) Còn yêu cầu giống hay khác như trong bài 1 này thì chúng ta chỉ quan tâm đến giải thiết và đối thiết (1) Tức chỉ xem
là giống nhau hay khác nhau Không đề cập đến việc nhỏ hơn hay lớn hợn Còn để biết như thế nào ta làm tiếp bài 2 để hiểu hơn
Sau khi phân tích ta cần biết lưu dữ liệu để thầy(cô) có cơ sở đánh giá phân tích của chúng
ta
Trước hết là trình bày kết quả
Copy kết quả cần trình bày paste vào Untibled comment (bên góc dưới màng hình có dòng chữ “Enter a description of your StatFolio here”(tạm dịch: nhập kết quả mô tả vào đây, nhớ rằng trong ô này có chữ “StatFolio” )
Trình bày kết quả như hình sau:
Hình 17: Bảng kết quả (trình bày kết quả như hình trên)
Từ các bảng phân tích chúng ta lấy ra những thông tin cần cho việc trả lời các câu hỏi của
đề bài yêu cầu phân tích
Sau đó lưu lại kết quả cùng một thư mục với nơi lưu dữ liệu, theo các bước sau:
- Lưu kết quả : File save save StaFilio (hoặc shift +f11)
Bài 2 có nhập dữ liệu vào trong cùng bảng của bài 1(nếu theo yêu cầu của giáo viên)
Sau khi nhập dữ liệu ta có bảng sau:
Trang 13Hình 18: Bảng dữ liệu bài 2 (nhập theo kiểu Data columns)
1 Định cột như bảng, sau khi nhập dữ liệu vào: File save save Data File (hoặc shift
+f12)
2 Tiến hành phân tích như bài 1 Trong khi so sánh chúng ta sẽ chú ý đến việc lớn hơn
hay nhỏ hơn của 2 giá trị trung bình (mean1 > hoặc < mean2) Ta quan tâm đến giả thiết (2)
và (3) trong bảng ANOVA Để chọn P-value nào ta cần phân tích bảng phương sai
Phân tích phương sai:
Trang 14Hình 19: Bảng phân tích phương sai
Với P-value =0,635314 > 0,05 sigma 1 = sigma 2
Ta đi so sánh 2 giá trị trung bình Chọn P-value nào nhỏ hơn ta lấy
Trang 16Hình 22 Bảng dữ liệu bài 3 (kiểu Data columns)
- Phân tích kết quả: nhƣ bài 2
- Kết quả trình bày nhƣ sau
Hình 23: Trình bày kết quả bài 3
II THÍ NGHIỆM MỘT YẾU TỐ
2.1 Mẫu hoàn toàn ngẫu nhiên 1 yếu tố (completely Randomized Design _CRD).(chỉ có 2
Trang 17Hình 25: Các bước phân tích
- CHỌN CÁC ĐỐI TƯỢNG PHÂN TÍCH: Dependent Variable (biến phụ thuộc)(kết quả); Factor là yếu tố thí nghiệm Click chuột vào chọn DINH MUC SO CHE nhấn chọn như trên hình bên dưới Click OK
Hình 26: Chọn đối tượng phân tích
- Vào Tabulor options (ô nhỏ màu vàng) để mở bảng ANOVA
Hình 27: Mở bảng ANOVA
Tabular Options
Trang 18- Check chọn nhƣ trên hình 28
Hình 28: Mở bảng ANOVA OK
- Dựa vào bảng ANOVA để chúng ta đánh giá là có sự khác biệt không về định mức sơ chế của các loại kích cỡ cá Đƣợc bảng nhƣ sau:
Hình 29: Bảng ANOVA của bài 11
Trong bảng phân tích này (ANOVA ta quan tâm đến giá trị P-value = 0,0099<0,05 Kết luận các kích cỡ các khác nhau có định mức sơ chế không giống nhau
Tiếp tục trả lời câu hỏi là ảnh hưởng như thế nào?
- Dùng bảng Multiple Range Tests
Vào Tabular Options để mở
Trang 19Hình 30: Mở bảng Multiple Range Tests OK
Hình 31: Bảng Multiple Range Tests và các bảng phân tích khác
Double click vào cửa sổ Multiple Range Tests để mở rộng ra
Đọc kết quả dựa vào bảng này.(khác nhƣ thế nào, căn cứ vào bài toán mà ta kết luận)
Hình 32: Cửa sổ Multiple Range Tests mở rộng ra
Trang 20Từ bảng xếp hạng trên cho ta thấy: Kích cỡ cá B và C có mức sơ chế như nhau( các chữ x nằm trên một hàng); 2 loại này có Định mức sơ chế cao hơn Kích cỡ cá A với mức ý nghĩa 95% Để có định mức sơ chết tốt (càng nhỏ càng tốt) ta chọn kích cơ cá A là thích hợp nhất
ít hau phí trong quá trình chế biến
- Trình bày kết quả như sau: copy ANOVA và bảng Multiple Range Tests paste vào ô cửa sổ Untibled Comment
Hình 33: Trình bày kết quả
Chú ý: Với việc phận tích bài toán có bảng Multiple Range Tests chỉ sử dụng bảng này
cho những trường hợp có sự khác biệt trong bảng ANOVA, còn không có sự khác biệt
với giá trị P-value nào đó hơn 0,05 thì ta kết luận luôn không cần dùng bảng Multiple Range Tests, như thế là thừa
Sau khi nhập dữ liệu xong ta lưu lại một lần, sau khi phân tích kết quả xong ta lưu thêm một lần nữa, để trình bày trong cùng một bảng dữ liệu ta lưu lần đầu với tên và kết quả
cùng một thư mục, cùng một tên Các lần sau chỉ lưu lại không cần đặt tên (lưu chèn lên)
Bài 12:
- Nhập dữ liệu như sau(tương tự bài 11): có 2 cột, LẶP LẠI 5 LẦN TỔNG KẾT QUẢ (HÀNG) LÀ 25
Trang 21Hình 34: Dữ liệu bài 12(kiểu data code columns)
Nhập nhƣ bảng trên ta nhập dữ liệu theo hàng ngàng của bảng kết quả đề bài
Hoặc ta nhập dữ liệu nhƣ bảng sau: theo dàng dọc của bảng kết quả đề bài
Hình 35: Dữ liệu bài 12 (kiểu data code columns)
Trang 22Mỗi một thời gian nấu lập lại 5 lần,
Lưu dữ liệu
- Phân tích như bài 11, chúng ta cũng cần 2 bảng chính là bảng ANOVA và Bảng Multiple Range Tests
Từ bảng ANOVA
Hình 36: Bảng ANOVA của bài 11
Cho ta thấy P-value = 0,1890>0,05 thời gian nấu không ảnh hưởng đến hàm lượng vitamin C trong thức ăn (không cần mở bảng Multiple Range Tests là gì)
Trang 23Hình 38: Dữ liệu bài 51(cách 1)
HOẶC BẰNG CÁCH
Hình 39: Dữ liệu bài 51 (cách 2) NHƯNG VỚI CÁCH NÀO ĐI NỮA THÌ CHÚNG TA CẦN PHẢI CHÚ Ý ĐẾ DỮ LIỆU CỦA MÌNH TRƯỚC KHI PHÂN TÍCH Và lưu ý trong dãy dữ liệu lúc nào cũng có yếu
tố lặp lại liên tục và 1 yếu tố luân phiên lặp lại cuối cùng mới tới kết quả
LƯU DỮ LIỆU
- Phân tích dữ liệu:
Bước 1: Vào Compare Analysis of Variance Multifactor ANOVA OK
Hình 40: Các bước phân tích
Trang 24Bước 2: Từ hộp thoại ta chọn các yếu tố tương tự bài 11, 12 Chỉ khác là nhiều yếu tố vào
một Factor (chính và nhiễu) Nhu hình sau:
Hình 41: Chọn đối tượng phân tích
Với ĐỘ CỨNG BÁNH là biến phụ thuộc (DEPENDENT VARIABLE) OK
Bước 3: vào Tabular Options(ô màu vàng nhỏ) mở bảng ANOVA ra (như các bài trên)
Trang 25Hình 43: Bảng ANOVA của Độ Cứng Bánh bài 51
Ta được kết quả rút ra từ bảng phân tích phương sai này:
P-value của Loại đầu đo = 0,0004<0,05 có sự khác biệt giữa các đầu đo đến độ cứng của bánh ( chúng ta chỉ quan tâm đến yếu tố chính không quan tâm đến yếu tố nhiễu) Lưu ý
để đọc giá trị P-value của một vài phần mềm Statgraphics plus ta cần nhớ là giá trị này làm tròn đến 4 chữ số sau dấu thập phân Và so với 3 kí tự “alu” của chữ P-value phía trên giá trị số
Trong phần này chúng ta còn có thể kết luận thêm Vị trí của bánh cũng ảnh hưởng đến độ cứng của bánh với P-value =0,000<0,05
Tiếp tới ta mở bảng Multiple Range Tests.(chỉ quan tâm đến yếu tố chính) Vào ô màu vàng nhỏ check chọn như trên hình 44 OK
Hình 44: Mở Bảng Multiple Range Tests
Để mặc định hiện ra yếu tố thí nghiệm chúng ta để ý trong bước 1, chọn các yếu cho vào ô Factor thì yếu tố thí nghiệm để phái trên yếu tố nhiễu Như hình trong bước 1
Ta được bảng kết quả sau Mở rộng của sổ Multiple Range Tests bằng cách double click vào ô cửa sổ đó
Trang 26Hình 45: Bảng Multiple Range Tests
Từ bảng xếp hạng cho ta kết luận sau:
Các loại dầu đo A,B,C cho kết quả như nhau Cả 3 loài đầu đo này khác với lới đầu đo D loại đầu đo D là cho kết quả độ cứng lớn nhất
- Trình bày kết quả:
Hình 46: Trình bày kết quả
Lưu kết quả
Bài 52
Trang 27Hình 47: Dữ liệu bài 52
Lưu dữ liệu
- Phân tích dữ liệu, mở bảng ANOVA và Multiple Range Tests như bài 51 Mật độ giống
là yếu tố chính, Và ô Factor còn năng suất là biến phụ thuộc và ô Dependent Variable
Kết quả:
Bảng ANOVA:
Hình 48 : Bảng ANOVA
Trang 28Kết luận: P-value của mật độ giống (yếu tố chính) =0,1128 > 0,05 Mật độ giống không ảnh hưởng đến năng suất giống lúa IR
Không cần mở bảng Multiple Range Tests làm gì nữa
Trong bài này tôi xin nói thêm về cách nhập dữ liệu theo LS
Để nhập dữ liệu, Trong bảng dữ liệu phải có 1 yếu tố lặp lại liên tục, tiếp là cột lặp lại luân phiên, cột thứ yếu tố chính điền theo thứ tự trong bảng đề đề bài
Lặp lại luân phiên
Trang 29Hình 51: Cách nhập dữ liệu tiếp theo
LOẠI ĐẦU ĐO được từ trái sang phải từ trên xuống dưới (theo bài này)
Dữ liệu nhập xong có dạng:
Hình 52: Dữ liệu bài 69
Lưu dữ liệu
- Phân tích tương tự như việc phân tích của các bài 51, 52
Bước 1: Vào Compare Analysis of Variance Multifactor ANOVA OK
Hình 53: Các bước phân tích
Trang 30Bước 2: Chọn các yếu tố phân tích như hộp thoại sau:
Hình 54: Chọn đối tượng cần phân tích
Nhớ để yếu tố chính nằm trên các yếu tố khác Như hình trên OK
Bước 3: Vào Tabular Options (ô màu vàng nhỏ)
Chọn ANOVA table OK
Hình 55: Mở bảng ANOVA
Ta được bảng sau:
Hình 56: Bảng ANOVA
Bước 4: Xem xét giá trị P-value của yếu tố chính (loại đầu đo)
Kết luận: P-value của A (A:Loai đầu đo) = 0,1227> 0,05 các loại đầu do khác nhau đều cho kết quả như nhau (các loại đầu dò không ảnh hưởng đến độ cứng của bánh).(chú ý khi
Trang 31Hình 57: Trình bày kết quả
Lưu kết quả
Bài 70:
- Nhập dữ liệu tương tự bài 69, 71 Cũng có 4 cột: cột đầu là tháng thí nghiệm (liên tục), cột
2 là lồng kinh(luân phiên), cột 3 là mức độ ô nhiễm(theo bảng dữ liệu), sự phát triển của cây
Trang 32Hình 59: Bảng ANOVA
- Yếu tố chính là mức ô nhiễm: P-value = 0,8056 > 0,05 các mức ô nhiễm khác nhau không ảnh hưởng đến sự phát triển của cây Tức sực phát triển của cây không phụ thuộc vào ảnh hưởng của các mức ô nhiễm khác nhau (không cần khảo sát bảng multiple Range tests)
- Trình bày kết luận:
Hình 60 Trình bày kết quả
Lưu kết quả
Bài 71: nhập dữ liệu tương tự như bài 69, cũng có 4 cột: cột tuần, cột con bò thứ n(n1-4),
khẩu phần ăn, lượng sữa
Nếu lấy tuần là cột lặp lại liên tục thì con bò thứ n là sẽ lặp lại luân phiên, khẩu phần ăn sẽ điền theo bảng dữ liệu
Sau khi điền dữ liệu ta có bảng dữ liệu tương tự như sau:
Trang 33Hình 61: Dữ liệu bài 71
Lưu dữ liệu
- Phân tích tương tự câu 69, chọn kết quả như hộp thoại sau: và OK (yếu tố chính để ở trên)
Hình 62: chọn đối tượng phân tích
- Phân tích mở bảng ANOVA
Kết quả như sau:
Trang 34Hình 63: Bảng ANOVA
P-value của A (khau phan an)= 0,0003 < 0,05 sản lượng sữa chịu ảnh hưởng của các loại khẩu phần ăn Các khẩu phần ăn trong thí nghiệm ảnh hưởng đến sản lượng sữa của bò
Để xem sự ảnh hưởng đó như thế nào ta mở tiếp bảng Multiple Range Tests
Hình 64: Bảng Multiple Range Tests
Kết luận có 3 nhóm (A, B, và CD) ảnh hưởng đến sản lượng sữa của các khẩu phần ăn Trong đó khuẩn phần ăn C, D ảnh hưởng lớn đến sản lượng sữa Sản lượng sữa theo khẩu phần ăn C,D là sản lượng tốt hơn các loại khẩu phần khác