BÁO CÁO BÀI TẬP LỚN Nhóm 7Để thực hiện phương pháp phân tích phương sai ba yếu tố, ta cần lần lượt ìm được các giá trị thống kê cho từng nhân tố F A , F B , F C.. Trong đó, ta cần tính đ
Trang 1ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC BÁCH KHOA TP.HỒ CHÍ MINH
Trang 2BÁO CÁO BÀI TẬP LỚN Nhóm 7
Để thực hiện phương pháp phân tích phương sai ba yếu tố, ta cần lần lượt ìm được các giá trị thống kê cho từng nhân tố F A , F B , F C Trong đó, ta cần tính được các giá trị sau: Tổng bình phương chung và tổng bình phương nhân tố (Sum of Squares)
MSE ; F C=MS F C
Với Y ijk : Các giá trị được cho trong bảng
Trang 3T .j : Giá trị ứng với yếu tố B j
T k : Giá trị ứng với yếu tố C k
r : Số lượng mức độ khảo sát của mỗi nhân tố (ở đây r=4) Với các giá trị thống kê tim được, ta lần lượt so sánh với giá trị F 0,05 (3.6) để kiểm định các giả thuyết:
H 0 : “Các giá trị trung bình bằng nhau”.
H 1 : “Có ít nhất 2 giá trị trung bình khác nhau”.
o Nếu F A <F 0,05 (3,6)i Chấp nhân giả thuyết H 0 cho yếu tố A
o Nếu F B <F 0,05 (3,6)i Chấp nhân giả thuyết H 0 cho yếu tố B
o Nếu F C <F 0,05 (3,6)i Chấp nhân giả thuyết H 0 cho yếu tố C
Bước 1: Nhập dữ liệu vào bảng tính:
Bước 2: Thiết lập các biểu thức và tính các giá trị thống kê
1 Tính các giá trị Ti , T.j , T k và T
Các giá trị Ti
Chọn ô B7 và chọn biểu thức=SUM(B2:E2) Chọn ô C7 và nhập biểu thức=SUM(B3:E3) Chọn ô D7 và nhập biểu thức=SUM(B4:E4) Chọn ô E7 và nhập biểu thức=SUM(B4:E4)
Trang 4BÁO CÁO BÀI TẬP LỚN Nhóm 7
Các giá trị T.j.
Chọn ô B8 và nhập biểu thức=SUM(B2:B5) Dùng con trỏ kéo ký tự điền từ ô B8 đến ô E8
Các giá trị T k Chọn ô B9 và nhập biểu thức=SUM(B2,C5,D4,E3) Chọn ô C9 và nhập biểu thức=SUM(B3,C2,D5,E4) Chọn ô D9 và nhập biểu thức=SUM(B4,C3,D2,E5) Chọn ô E9 và nhập biểu thức=SUM(B5,C4,D3,E2)
Giá trị SST Chọn ô I11 và nhập biểu thức=G11-G10/POWER(4,2)
Giá trị SSE Chọn ô I10 và nhập biểu thức=I11-SUM(I7:I9)
Trang 54 Tính các giá trị MSR.MSC.MSF và MSE
Giá trị SST Chọn ô K7 và nhập biểu thức=I7/(4-1) Dùng con trỏ kéo ký tự điền từ ô K7 đến ô K9
Chọn ô K10 và nhập biểu thức=I/((4-1)*(4-2))
5 Tính các giá trị G và F:
Chọn ô M7 và nhập biểu thức=K7/0.3958 Dùng con trỏ kéo ký tự điền từ ô M7 đến M9.
Kết quả và biện luận:
(Tra bảng Fisher để được giá trị F 0,05 (3,6))
Trang 6BÁO CÁO BÀI TẬP LỚN Nhóm 7
Phần B: Ví dụ 4.2 trang 216 SBT XSTK 2012 (N.Đ.Huy):
C kết hợp với 3 khoảng thời gian là 15,30 và 60 phút để thực hiện một phản ứng tổng hợp.các hiệu xuất của phản ứng(%) được trình bày trong bảng sau:
Thời gian (phút)
X1
Nhiệt độ ( 0
C) X2
Hiệu xuất (%) Y
Bài làm:
Nhận định bài toán: Bài toán yêu cầu cho biết yếu tố nhiệt độ hoặc thời gian có lien
quan tuyến tính với hiệu suất của phản ứng tổng hợp hay không i Giải quyết bài toán
bằng phương pháp hồi quy tuyến tính đa tham số.
Trong phương trình hồi quy tuyến tính đa tham số ,biến số phụ thuộc Y có liên quan đến k biến số độc lập X i (i=1,2,…k) thay vì chỉ có một như trong hồi quy tuyến tính đơn giản.
Tổng số bình phương
Bình phương trung bình
Giá trị thống kê
Trang 7-Trong trắc nghiệm t
H 0 : β i=0 Các hệ số hồi quy không có ý nghĩa
H 0 : β i ≠ 0 Có ít nhất vài hệ số hồi quy có ý nghĩa Bậc tự do của giá trị t: γ =N-k-1
t=¿B i – β i∨ ¿
√S n2¿ ; S n2= S2
∑(X i− ´X)2-Trong trắc nghiệm F:
H 0 : β i=0 Phương trình hồi quy không thích hợp
H 0 : β i ≠ 0 Phương trình hồi quy thích hợp với ít nhất vài β i Bậc tự do của giá trị F: v 1 =1; v 2 =N-k-1
Bước 1: Nhập dử liệu vào bản tính
Dữ liệu nhất thiết phải được nhập theo cột.
Trang 8BÁO CÁO BÀI TẬP LỚN Nhóm 7
Bước 2: Sử dụng Regression
- Nhấn lần lượt đơn lệnh Data i Data Analysis
- Chọn chương trình Regression trong hộp thoại Data Analysis rồi nhấp OK
- Trong hộp thoại Regression ,làn lượt ấn các chi tiết:
Trang 9- Các giá trị đầu ra cho bảng sau:
Trang 10BÁO CÁO BÀI TẬP LỚN Nhóm 7
Trang 11Phương trình hồi quy: Y^X1=f(X1 )
Vậy cả hai hệ số 2.73(B 0 ) và 0.04(B 1 ) của phương trình hồi quy Y^X1=2.73+0.04X 1
đều không có ý nghĩa thống kê Nói cách khác phương trình hồi quy này không thích hợp.
Kết luận: Yếu tố thời gian không có liên quan tuyến tính với hiệu suất của phản
Trang 12BÁO CÁO BÀI TẬP LỚN Nhóm 7
=2-Kết luận: Yếu tố nhiệt độ có liên quan tuyến tính với hiệu xuất của phản ứng tổng
Trang 13o t 0 =11.528> t 0.05 =2.365(hay P v 2 =2.260*10 -5 <α=0.05)
Trang 14BÁO CÁO BÀI TẬP LỚN Nhóm 7
=-Kết luận: Hiệu xuất của phản ứng tổng hợp có liên quan tuyến tính với cả hai yếu tố
là thời gian và nhiệt độ.
Sự tuyến tính của phương trình Y^X1, X2= -12.70+0.04X 1 +0.13X 2 có thể được trình bày trên biểu đồ phân tán (scatterplots):
trỏ tự điền từ ô E2 đến ô E10.
Chọn ô E2 i vào Insert i Scatteri Scatter with only Markers BIỂU ĐỒ:
Kết luận: Hiệu xuất của phản ứng tổng hợp có liên quan tuyến tính với cả hai yếu tố
là thời gian và nhiệt độ.
Trang 15Nếu muốn dự đoán hiệu xuất bằng phương trình hồi quy
^
Y X1, X2= -12.70+0.04X 1 +0.13X 2 , chỉ cần chọn một ô, ví dụ như B31, sau đó nhập hàm
=B28+B29*50+B30*115 và được kết quả như sau:
(thời gian) và 115 là giá trị của X 2 (nhiệt độ)
Trang 16BÁO CÁO BÀI TẬP LỚN Nhóm 7
Bài 2: Một nhà nông học tiến hành việc kiểm định hiệu quả của ba loại phân này
trên các cây cà chua và theo dõi số quả cà chua mọc trên mỗi cây Kết quả thu được như sau:
Loại phân
24 18 27 28
21 26 32 25
16 22 19 17 Với mức ý nghĩa = 5%, hay so sánh số quả cà chua mọc trung bình khi bón
ba loại phân A, B, C nói trên
Trang 172 Mở Data Analysis chọn Anova: Single Factor
3 Nhập vào hộp thoại Anova: Single Factor
Input Range: phạm vi đầu vào (ô A2 ô C6)
Grouped By: nhóm dữ liệu theo hàng hoặc cột (chọn cột)
Labels in first column: nhãn ở cột đầu tiên (chọn)
Alpha: giá trị α (0,05)
Output Range: phạm vi dữ liệu xuất ra (ô Ạ9)
Trang 18BÁO CÁO BÀI TẬP LỚN Nhóm 7
Ta nhận được bảng kết quả:
Biện luận: F = 3.8556562174 < F0.05 = 4.256494729 => chấp nhận giả thiết H0.
Kết luận: số quả cà chua mọc trung bình khi bón ba loại phân A, B, C nói trên nói
trên là như nhau.
Trang 19Bài 3: Bảng sau đây cho ta số liệu về màu tóc của 422 người:
Màu tóc Nam Nữ Đen
Hung Nâu Vàng
56 37 84 19
32 66 90 38 Với mức ý nghĩa 3%, nhận định xem số liệu có mối quan hệ giữa màu tóc và giới tính hay không.
0,01=11,34
Vì Tqs> χ2
0,01=11,34 nên bác bỏ giả thiết H0 tức là màu tóc và giới tính không
có mối quan hệ với nhau
Trang 20BÁO CÁO BÀI TẬP LỚN Nhóm 7
0,01 ) Nếu P(Tqs<χ2
0,01 )> α chấp nhận giả thiết H0
Nếu ngược lại thì bác bỏ giả thiết H0
b) Quá trình giải thuật:
Nhập dữ liệu vào bảng:
Nhập thêm các dòng tổng hàng, tổng cột:
Tính tổng hàng, tổng cột:
Chọn ô để nhập giá trị tổng sau đó dùng cú pháp sau:
=SUM(trị bảng dò) sau đó Enter
Trang 21 Tiếp theo tính các tần số lí thuyết
Sử dụng công thức:
Tần số lý thuyết = (tổng hàng * tổng cột)/tổng cộng
Trang 22BÁO CÁO BÀI TẬP LỚN Nhóm 7
Gọi hàm CHITEST tính giá trị P
Nhấp vào Insert chọn Insert Fuction chọn Chitest nhấn Ok
Xuất hiện hộp thoại Fuction Agruments:
- Nhập các giá trị tần số quan sát vào mục Actual_range
- Nhập các giá trị tần số lí thuyết vào mục Expected_range -> Ok
KẾT QUẢ:
Biện luận: P(X > χ2) = 0.000246775 < α = 0.01 bác bỏ giả thuyết
H0
P=0.000246775
Trang 24BÁO CÁO BÀI TẬP LỚN Nhóm 7
Bài 4: Tiến hành thăm dò ba nhóm xã hội khác nhau: công nhân, nông dân, trí
thức Kết quả cuộc thăm dò như sau:
Tầng lớp
Ý kiến
Công nhân Nông dân Trí thức Tổng số Tăng 100 300 20 420 Như cũ 200 400 30 630 Giảm 50 80 5 135 Không ý
kiến
30 70 5 105 Tổng số 380 850 60 1290
Với mức ý nghĩa = 2%, có sự khác nhau về ý kiến trong các tầng lớp xã hội trên hay không?
Trang 25Giá trị 2 theo biểu thức
Xác suất P ( 2) với bậc tự do DF = (r – 1)(c – 1); trong đó r là số hàng và
c là số cột trong bảng ngẫu nhiên (contingency table).
Nếu P ( 2)>α => Chấp nhận giả thuyết H0 và ngược lại.
Bài toán này dựa trên cơ sở lý thuyết “Kiểm định tính độc lập” (Đã được trình bày trong Sách giáo khoa trang 112) chúng tôi xin nhắc lại cách ngắn gọn như sau.
Cho X và Y là hai dấu hiệu trên cùng một tổng thể Từ một mẫu kích thước n
ta có số liệu :
Y1 Y2 Yh ni X1 N11 N12 N1h N1 X2 N21 N22 N2h N2
Trang 26BÁO CÁO BÀI TẬP LỚN Nhóm 7
Mj (j = 1,h) – số lần Y nhận yj Ni,j (i = 1,k ; j = 1,h) – số lần đồng thời X nhận xi và Y nhận yj Kiểm định giả thiết H : X và Y độc lập với mức ý nghĩa α.
Phương pháp giải
Tìm 2 2 k 1 h 1
từ trong bảng phân vị 2 Tính thống kê
ij 2
2 0
Thực hiện bài toán trên Excel:
Yêu cầu bài toán thực chất là kiểm định tính độc lập giữa ý kiến và các tầng lớp xã hội Từ số liệu bài toán ta có bảng số liệu sau:
Bước 1: Nhập giá trị vào bảng:
Trang 28BÁO CÁO BÀI TẬP LỚN Nhóm 7
Bước 2: Tính các tần số lý thuyết
Tần số lý thuyết = (tổng hàng * tổng cột) / tổng cộng.
Trang 29Bước 3: Tính xác xuất P(χ > χ2)
Chọn ô C14 nhập giá trị biểu thức =CHITEST(B2:D5,B9:D12)
Ta có giá trị xác suất là 0.06118 >0.02 Chấp nhận giả thiết H.
Kết luận: Có sự giống nhau về ý kiến trong các tầng lớp xã hội.
Trang 30BÁO CÁO BÀI TẬP LỚN Nhóm 7
Bài 5: Với mức ý nghĩa = 2%,Hãy phân tích vai trò ngành nghề (chính, phụ)
trong hoạt động kinh tế của các hộ gia đình ở một vùng nông thôn trên cơ sở bảng số liệu về thu nhập trung bình của một hộ tương ứng với các ngành nghề nói trên như sau:
Nghề chính Nghề phụ
(1) (2) (3) (4) Trồng lúa (1)
Trồng cây ăn quả (2) Chăn nuôi (3)
Dịch vụ (4)
3.5 5.6 4.1 7.2
7.4 4.1 2.5 3.2
8.0 6.1 1.8 2.2
3.5 9.6 2.1 1.5
Bài giải
Dạng bài : Kiểm định trung bình hai yếu tố (không lặp).
Sự phân tích này nhằm đánh giá sự ành hưởng của hai yếu tố trên các giá trị quan sát Yij (i = 1, 2, … r: yếu tố A; j = 1, 2, … c: yếu tố B).
Mô hình
Yếu tố A Yếu tố B Tổng
cộng
Trung bình
Trang 31Bảng ANOVA
Nguồn
sai số Bậc tự do Tổng số bình phương
Bình phương trung bình
Giá trị thống kê Yếu tố
H0: µ1= µ2=…µk ( Các giá trị trung bình bằng nhau )
H1: µ1≠ µ2 ( Ít nhất có hai giá trị trung bình khác nhau)
Trang 32BÁO CÁO BÀI TẬP LỚN Nhóm 7
Bước 1: Nhập dữ liệu vào bảng:
Bước 2:
Nhấn lần lượt đơn lệnh Tools và lệnh Data Analysis.
Chọn trương trình Anova: Two trong hộp thoại Data Analysis rồi nhấn nút OK.
Trong hộp thoại Anova: Two-Factor Without Replication lần lượt ấn định
Phạm vi đầu vào (Input range)
Nhãn dữ liệu (Labels in Fisrt Row/Column)
Ngưỡng tin cậy (Alpha)
Phạm vi đầu ra (Output range)
Trang 33 Kết luận:
Từ giá trị trong bảng Anova:
FR= 1,9966 < Fα= 5,5097=> Chấp nhân giả thiết H0 (nghề chính)
FC= 0,1106 < Fα= 5,097 => Chấp nhân giả thiết H0 (nghề phụ)
Trang 34BÁO CÁO BÀI TẬP LỚN Nhóm 7
Vậy nghề chính và nghề phụ đều có vai trò quan trọng đối với thu nhập của một hộ gia đình