1. Trang chủ
  2. » Giáo án - Bài giảng

Chương 5 Thống kê sinh học

22 1,2K 3
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 22
Dung lượng 1,86 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Mục đích • Bố trí thí nghiệm experimental design là lập kế hoạch về các bước cần tiến hành để thu thập số liệu cho vấn đề đang nghiên cứu.. • Thí nghiệm thực nghiệm: can thiệp vào nghi

Trang 1

Phân tích Phương sai

5 Các bước tiến hành thí nghiệm

1 Mục đích

• Bố trí thí nghiệm (experimental design) là

lập kế hoạch về các bước cần tiến hành để thu

thập số liệu cho vấn đề đang nghiên cứu

• Mục đích để có những kết luận chính xác với

chi phí thấp nhất

2 Các loại thí nghiệm

• Thí nghiệm quan sát: chỉ quan sát các đói

tượng thí nghiệm, ghi nhận các dữ liệu liên quan đến các đặc điểm nghiên cứu

• Thí nghiệm thực nghiệm: can thiệp vào

nghiên cứu bằng cách bố trí các công thức thí nghiệm khác nhau lên đối tượng → tiến hành quan sát ảnh hưởng của các công thức lên đối tượng nghiên cứu

3 Các khái niệm

1 Nhân tố (Factor)

• Nhân tố là biến độc lập cần nghiên cứu, có thể

là biến định lượng hoặc định tính, biến liên tục

hoặc gián đoạn

• Thí dụ: nghiên cứu ảnh hưởng của các loại

thức ăn (nhân tố A) và giới tính (nhân tố B)

Trang 2

Các khái niệm

3 Nghiệm thức (Treatment)

• Một tổ hợp các mức của các nhân tố được gọi

là một nghiệm thức

• Thí dụ nghiên cứu ảnh hưởng của protein và

thức ăn lên sản lượng sữa bò

4 Đơn vị thí nghiệm (Experimental Unit)

• Một đơn vị thí nghiệm là một đơn vị nghiên cứu trong thí nghiệm, hoặc cụ thể hơn đó là đơn vị nhỏ nhất mà một nghiệm thức được ứng dụng

• Thí dụ: đơn vị thí nghiệm có thể là 1 con gà, một đàn heo, một ruộng lúa…

Các khái niệm

5 Dữ liệu (Data)

• Nếu đơn vị thí nghiệm là một cá thể thì sau khi

cân, đo ta được một dữ liệu (data) hay một

quan sát (observation)

• Nếu đơn vị là một nhóm gồm nhiều cá thể thì

có thể cân, đo chung cho cả nhóm hoặc lấy

một số cá thể nhất định trong nhóm để cân, đo

sau đó suy ra một dữ liệu chung cho đơn vị thí

• Một nghiệm thức phải được lặp lại nhiều hơn 1

đơn vị thí nghiệm Điều này cho phép so sánh ảnh

hưởng của nghiệm thức với các mức biến thiên

sinh học của các đơn vị thí nghiệm

• Số nghiệm thức càng tăng thì sai số chuẩn càng

nhỏ và độ chính xác của thí nghiệm càng cao

• Số lần lặp lại không có giới hạn nhưng cần phải

cân bằng giữa độ chính xác và chi phí thí nghiệm

Các nguyên tắc cơ bản

2 Ngẫu nhiên hóa (Randomization)

• Mẫu phải được chọn sao cho tất cả các đơn vị thí nghiệm được bố trí ngẫu nhiên vào các nghiệm thức

• Điều này giúp tránh được các những sai sót do chủ quan của người làm thí nghiệm cũng như biến động của các yếu tố sinh học, môi trường…

Trang 3

Các nguyên tắc cơ bản

2 Ngẫu nhiên hóa (Randomization)

• Để thực hiện việc ngẫu nhiên hoá, có thể dùng

5 Các bước tiến hành thí nghiệm

• Một thí nghiệm thường được tiến hành theo các bước:

– Đặt vấn đề – Phát biểu giả thuyết – Mô tả bố trí thí nghiệm – Thực hiện thí nghiệm (thu thập dữ liệu) – Phân tích số liệu thu thập được từ thí nghiệm – Giải thích kết quả.

CÁC KIỂU BỐ TRÍ THÍ NGHIỆM PHỔ BIẾN

• Bố trí ngẫu nhiên hoàn toàn (CRD)

• Bố trí khối ngẫu nhiên đầy đủ (RCBD)

• Bố trí ô vuông La tinh

1 Bố trí ngẫu nhiên hoàn toàn

1 Bố trí ngẫu nhiên hoàn toàn

1 Đặt tên cho các cột C1, C2, C3 lần lượt là

‘UNIT’, ‘RANDOM’, ‘GROUP’

Trang 4

Áp dụng Minitab

2 Calc > Make Patterned Data > Arbitrary

Set of Numbers…

Store pattern data in: UNIT

Arbitrary set of numbers: 1:15

OK

Trang 5

Áp dụng Minitab

4 Calc > Make Patterned Data > Arbitrary

Set of Numbers…

Store pattern data in: GROUP

Arbitrary set of numbers: 1:3

List each value: 5 times

5 Data > Unstack Columns …

Unstack the data in : RANDOM

Using subscripts in : GROUP

After last column in use

OK

• Đặt tên các cột C4, C5, C6 lần lượt là

‘TREAT A’, ‘TREAT B’, ‘TREAT C’

Áp dụng Minitab

Trang 6

1 Bố trí ngẫu nhiên hoàn toàn

2 Bố trí khối ngẫu nhiên đầy đủ

Nguyên tắc:

• Các đơn vị thí nghiệm được tập hợp thành từng khối (block) sao cho mỗi khối có đầy đủ tất cả các nghiệm thức

• Trong mỗi khối các đơn vị thí nghiệm có tính chất đồng đều

• Như vậy:

– số đơn vị thí nghiệm trong mỗi khối = số nghiệm thức.

– số khối = số lần lặp lại.

2 Bố trí khối ngẫu nhiên đầy đủ

2 Bố trí khối ngẫu nhiên đầy đủ

• Mỗi hàng và mỗi cột là một khối đầy đủ chứa tất cả các nghiệm thức

• Được dùng khi khảo sát nhân tố có hai hướng biến động khác nhau

• Số đơn vị thí nghiệm = (số nghiệm thức)2

Trang 7

PHÂN TÍCH PHƯƠNG SAI (ANOVA)

• Một nhân tố (One-way ANOVA)

• Hai nhân tố (Two-way ANOVA)

– Không lặp lại – Có lặp lại

ANOVA – MỘT NHÂN TỐ

Các bước tiến hành:

1 Kiểm tra các điều kiện cần phải thỏa trước

khi tiến hành phân tích

Khẩu phần 1 Khẩu phần 2 Khẩu phần 3 Khẩu phần 4

Bước 1 Kiểm tra các điều kiện

1 Dữ liệu phải có phân bố chuẩn

Kiểm tra phân bố chuẩn

• Stat > Basic Statistics > Display Descriptive Statistic…

Trang 8

Kiểm tra phân bố chuẩn

KP4 KP3

KP2 KP1

• Stat > ANOVA > Test for Equal Variances…

– Bartlett's Test (normal distribution) – P > 0.05  các phương sai giống nhau

Độ lêch chuẩn lớn nhất

= 34.9 = 1.53 < 2

Độ lêch chuẩn nhỏ nhất 22.9

Kiểm tra phương sai

Bước 2 Đặt giả thuyết

• H 0 : m1= m2= m3 = m4

• H 1: có ít nhất hai trong số các trung bình là bằng nhau

Bước 3 Tiến hành phân tích phương sai

Kết quả thí nghiệm được khái quát hóa:

Nhân tố thí nghiệm A Nghiệm thức 1 Nghiệm thức 2 Nghiệm thức 3 Nghiệm thức t

Xtn t

Bước 3 Tiến hành phân tích phương sai

Dữ liệu được mô hình hóa:

Dữ liệu quan sát = Trung bình mẫu + Sai số

Xij = mi + eij

trong đó

i = số nhóm mẫu = số nghiệm thức = 1, 2, 3, , t

j = cở mẫu = số lần lặp lại = 1, 2, , ni

Trang 9

Bước 3 Tiến hành phân tích phương sai

Qui trình phân tích:

• Có hai nguồn biến động trong các dữ liệu:

(1) Sai khác giữa bốn khẩu phần ăn(variation

between group), còn gọi là ảnh hưởng của

nghiệm thức (treatment effect)

(2) Sai khác trong mỗi khẩu phần ăn (variation

within group), liên quan tới những biến động

ngẫu nhiên của môi trường, sai số thí nghiệm

Bước 3 Tiến hành phân tích phương sai

• Các biến động của dữ liệu được tính như sau:

Bước 3 Tiến hành phân tích phương sai

Tính các tổng bình phương:

• Tổng bình phương chung:

• Tổng bình phương NT: SST =

• Tổng bình phương sai số: SSE =

Source of variation Sum of Square degree of freedom Mean square F ratio

 SST MST 1

t

MST MSE

Trang 10

Chuyển dữ liệu thành Stacked Data

Chuyển dữ liệu thành Stacked Data

Tiến hành phân tích

Tiến hành phân tích

Dựa vào giá trị P:

• Nếu P < 0.05  bác bỏ H0 có ít nhất 2 trung bình mẫu khác nhau

Trang 11

So sánh các nghiệm thức

• Giả sử rằng qua phân tích ANOVA ta phát hiện

được trung bình của các nghiệm thức khác biệt

có ý nghĩa (bác bỏ giả thuyết H0)

• Câu hỏi tiếp theo là những nghiệm thức nào có

trung bình khác nhau?

• Hai phương pháp phổ biến nhất để so sánh

trung bình của các nghiệm thức:

– Kiểm định Tukey (Tukey’s test)

– Kiểm định Fisher (Fisher’s test)

Kiểm đinh Tukey

• So sánh trung bình của các cặp nhân tố bằng cách dùng tỉ lệ sai lầm của nhóm (family error rate) để kiểm soát tỉ lệ sai lầm loại I

• Dùng khoảng tin cậy này để xác định xem có sự sai khác giữa các trung bình hay không:

– Nếu khoảng tin cậy không có chứa giá trị 0 thì trung bình giữa hai nhóm khác biệt có ý nghĩa về

Trang 12

Diet 2 Diet 1

a

Tăng trọng theo khẩu phần

ANOVA – HAI NHÂN TỐ KHÔNG LẶP

• Thí dụ 1: So sánh độ ẩm đất (%) dưới tác động của 3 phương pháp tưới tiêu

1 2 3 4 5 6 7 8 9 10

7.6 9.3 11.8 12.4 13.5 12.9 7.1 10.8 10.3 9.4

9.1 5.8 5.9 9.8 9.3 11.9 3.6 7.9 8 8.4

8.2 10.1 10.2 12.6 12.6 13.1 8.9 7.8 11.8 8.6

Trang 13

ANOVA – HAI NHÂN TỐ KHÔNG LẶP

D÷ liÖu Trung b×nh T¸c dông T¸c dông cña Sai sè

quan s¸t mÉu cña khèi nghiÖm thøc ngÉu nhiªn

ANOVA – HAI NHÂN TỐ KHÔNG LẶP

• Bảng ANOVA

Nguồn biến động

Tổng Bình phương (SS)

Độ tự do

Trung bình Bình phương (MS)

F tính

Khối Nghiệm thức Sai số

SSB SST SSE

b - 1

t - 1 (b - 1)(t - 1)

MSB=SSB/(b - 1) MST=SST/(t - 1) MSE=SSE/(b -1)(t-1)

MSB/MSE MST/MSE

Tổng SSTO bt - 1

Áp dụng Minitab

• Nhập liệu:

Địa điểm Phương pháp Độ ẩm

Trang 14

ANOVA – HAI NHÂN TỐ KHÔNG LẶP

• Thí dụ 2: Số lượng tế bào lympho trong 5 lứa

chuột có và không tiêm thuốc

Drug Litter 1 Litter 2 Litter 3 Litter 4 Litter 5

6.9 5.9 6.2 5.7

5.6 5.1 5.0 5.2

6.4 5.8 6.2 5.3

Áp dụng Minitab

• Nhập liệu:

Trang 16

Kết quả

0.5 0.4 0.3 0.2 0.1 0.0 -0.1 -0.2

Phân tích dữ liệu với bố trí hình vuông LT

• Thí dụ: Một thí nghiệm được bố trí nhằm khảo sát sản lượng lúa mì khi bón bằng các loại phân bón khác nhau:

A = không có phân bón (đối chứng)

B = phân N (liều lượng 1)

C = phân N (liều lượng 2 gấp đôi)

D = cyanamide

E = cyanamide + dicyanadiomide

Phân tích dữ liệu với bố trí hình vuông LT

• Kết quả: sản lượng thu được (lb/plot)

Nguồn biến động Tổng bình phương Độ tự do Trung bình bình phương Hàng

Cột Nghiệm thức Sai số

SSR SSC SST SSE

t – 1

t – 1

t – 1 (t – 1)(t – 2)

MSR MSC MST MSE

Trang 17

3

Trang 18

• Thí dụ 1: Lượng thức ăn được chim tiêu thụ.

Giới tính (r = 2)

Khẩu phần ăn (c = 2) Diet 1 Diet 2 Trung bình hàng R

♂ 70.9 67.9 69.9

59.2 53.8

47 Trung bình nhóm phụ Y 69.57 53.33 61.45

♀ 65.7 59.4 67.7

50.8 50.5 50.5 Trung bình nhóm phụ Y 64.27 50.6 57.43 Trung bình cột C 66.92 51.97

Trang 19

ANOVA – HAI NHÂN TỐ CÓ LẶP

• Mô hình hóa:

Xijk = mi + ai + bj + aibj + eijk

ANOVA – HAI NHÂN TỐ CÓ LẶP

• Bảng ANOVA:

Nguồn biến động SS df MS Giữa các cột (khẩu phần)

Giữa các hàng (giới tính) Tương tác (GT x KP) Sai số

SSC SSR SSI SSE

(c - 1) (r - 1) (c - 1)(r - 1)

cr (n - 1)

SSR/(c - 1) SSC/(r - 1) SSI/(c - 1)(r - 1) SSE/cr(n - 1) Tổng SSTO crn - 1 SST/(crn - 1)

Áp dụng Minitab

• Nhập liệu:

Trang 20

• Thí dụ 2: thí nghiệm được tiến hành nhằm so sánh ảnh hưởng của pH đất và sự bổ sung Ca lên sự gia tăng đường kính của thân cây cam

Sau 2 năm, đường kính thân cây được ghi nhận như trong bảng sau:

Trang 21

ANOVA – HAI NHÂN TỐ CÓ LẶP

Kết quả phân tích phương sai

• Four seedlings of each species were floodedfor one day and four were used as controls

The concentration of adenosine triphosphate(ATP) in the roots of each plant was measured

The data (nmol ATP per mg tissue) are shown

in the table

• A nutritionist wants to study the percentage ofprotein content in bread made from three newtypes of flours and baked at three differenttemperatures She would like to bake threeloaves of bread from each of the nine flour –temperature combinations for a total of 27loaves from which the percentage of proteinwould be determined However, she is onlyable to bake nine loaves on any given day

Trang 22

18/11/2011 Thống kê Sinh học - Bùi Tấn Anh 127

Ngày đăng: 06/10/2016, 23:32

TỪ KHÓA LIÊN QUAN

w