Data Analysis Using R Introduction to the R language Data Analysis Using R 4 Design of experiments Tuan V Nguyen Garvan Institute of Medical Research, Sydney, Australia Overview • Terminology • Princi[.]
Trang 1Data Analysis Using R:
4 Design of experiments
Tuan V Nguyen Garvan Institute of Medical Research,
Sydney, Australia
Trang 2• Terminology
• Principles of experimental design
• Single-factor design
• Two-factor design
• Randomization
Trang 3• Đơn vị nghiên cứu (experimental unit)
– Đối tượng nghiên cứu
• Yếu tố can thiệp (factors)
• Mức độ can thiệp (treatment levels)
• Nhóm (block)
• Tiêu chí (response variable)
Trang 4Một ví dụ về thí nghiệm cảm quan
• 30 khách hàng: nam và nữ, tuổi 20-50
• Thử 3 loại cà phê: A, B, C
• Nhóm I, II, III
– Nhóm I: 10 người thử A và B
– Nhóm II: 10 người thử B và C
– Nhóm III: 10 người thử A và C
• Vị đắng được đo bằng likert scale
• Đơn vị nghiên cứu:
• Yếu tố can thiệp:
• Nhóm:
• Tiêu chí:
Trang 5Ba nguyên tắc của một thí nghiệm
• Ngẫu nhiên hóa (randomization)
– Đảm bảo tính hợp lí của nghiên cứu và phân tích thống
kê, quân bình hóa các yếu tố can thiệp
• Lặp lại nhiều lần (replication)
– Đảm bảo khoa học tính
• Phân nhóm (blocking)
– Giảm độ dao động trong từng nhóm
Trang 6Những yếu tố cần quan tâm
• Hiệu ứng placebo
– 35% các thuốc có hiệu quả là do hiệu ứng placebo
• Hiệu ứng Hawthorne
– Quen thuộc với sản phẩm
• Bảo mật
– Giữ kín danh tính tình nguyện viên
– Khách quan trong đánh giá (blinding)
Trang 7Nguyên lí thí nghiệm: một ví dụ
• Nghiên cứu:
– Sinh tố C cho điều trị cảm cúm
– 50 đối tượng tình nguyện
– Nên thiết kế như thế nào ?
• Phương án 1
– Cho 50 người uống sinh tố C trong vòng 6 tháng
– Ghi nhận số lần cảm cúm
– Kết quả: tần số cảm cúm trung bình là 1.4 lần / đối tượng
• Phương án 2
– Chia 50 người thành 2 nhóm nam và nữ
– Cả hai nhóm được điều trị bằng sinh tố C trong vòng 6 tháng – Tần số cảm cúm trung bình trong nhóm nam là 1.4 lần / đối tượng, còn nhóm nữ tần số này là 1.9 lần / đối tượng
Trang 8Nguyên lí thí nghiệm: một ví dụ
• Phương án 3
– Ngẫu nhiên chia thành 2 nhóm và điều trịi 6 tháng:
• 25 người nhóm sinh tố C
• 25 người nhóm placebo – Kết quả: tần số cảm cúm trung bình trong nhóm 1 là 1.4 lần / đối tượng, còn nhóm placebo là 1.9 lần / đối tượng
50 người
Nhóm 1
Nhóm 2
Sinh tố C
Giả dược
Trang 9Nguyên lí thí nghiệm: một ví dụ
• Phương án 4
– Sản xuất 50 hộp thuốc sinh tố C, và 50 hộp giả dược sinh tố C – Ngẫu nhiên chia thành 2 nhóm 50 người thành 2 nhóm
• 25 người nhóm sinh tố C
• 25 người nhóm placebo
– Tần số cảm cúm trung bình trong nhóm 1 là 1.4 lần / đối tượng, còn nhóm đối chứng là 1.4 lần / đối tượng
50 người
Nam
Nữ
Sinh tố C
Giả dýợc
So sánh tần
số cảm cúm
Sinh tố C
Giả dýợc
So sánh tần
số cảm cúm
Trang 10Thí nghiệm với một yếu tố (single-factor designs)
• Nghiên cứu ảnh hưởng của phân bón đến sự tăng trưởng của lúa
• Ba liều lượng urê được sử dụng (thấp, trung bình, và cao)
• Chọn 6 địa điểm (A, B, C, D, E, và F)
• Mỗi địa điểm có 3 mảnh đất để thí nghiệm (1, 2, 3)
Trang 11Completely randomized design Địa điểm Mảnh đất 1 Mảnh đất 2 Mảnh đất 3
Trang 12Randomized block design
Địa điểm Mảnh đất 1 Mảnh đất 2 Mảnh đất 3
Trang 13Incomplete block design
Địa điểm Mảnh đất 1 Mảnh đất 2
Trang 14Two-factor designs: CRD
Ảnh hưởng của nhiệt độ (thấp và cao), vật liệu (A và B), và phương pháp sản xuất (cơ khí và hóa chất) đến độ mạnh của giấy
Nhóm can thiệp Nhiệt độ Vật liệu Phương pháp
Trang 15Two-factor designs: Factorial design
Ảnh hưởng của nhiệt độ (thấp và cao), vật liệu (A và B), và phương pháp sản xuất (cơ khí và hóa chất) đến độ mạnh của giấy
Trang 16Latin square design
So sánh hiệu suất của (đo bằng cây số - km - trên mỗi lít) 4 loại dầu (A,
B, C và D) Công ti có được 4 tài xế và 4 loại xe
Trang 17Phương pháp ngẫu nhiên hóa
• Trước hết, chúng ta lập danh sách 8 đối tượng:
T1 T1 T1 T2 T2 T3 T3 T3
• Dùng hàm sample để chọn ngẫu nhiên (sample(1:8) có chức năng tạo ra một dãy số ngẫu nhiên từ 1 đến 8):
> sample(1:8)
[1] 7 2 5 4 1 8 6 3
• Nhập hai dãy số với nhau, chúng ta có:
T1 T1 T1 T2 T2 T3 T3 T3
7 2 5 4 1 8 6 3
n=3 n=2 n=3