Ví dụ 3.4: Hiệu suất phần trăm % của một phản ứng hóa học được nghiên cứu theo ba yếu tố: pHA, nhiệt độ B và chất xúc tác C được trình bày trong bảng sau: Hãy đánh giá về ảnh hưởng của c
Trang 1Bài 1 Trình bày lại ví dụ 3.4 trang 161 và ví dụ 4.2 trang 171 Giáo Trình XSTK 2009
Ví dụ 3.4:
Hiệu suất phần trăm (%) của một phản ứng hóa học được nghiên cứu theo ba yếu tố:
pH(A), nhiệt độ (B) và chất xúc tác (C) được trình bày trong bảng sau:
Hãy đánh giá về ảnh hưởng của các yếu tố trên hiệu suất phản ứng?
BÀI GIẢI:
Dạng bài: Phân tích phương sai 3 yếu tố
Áp dụng : EXCEL 2003
Nhập dữ liệu vào bảng tính:
* Thiết lập các biểu thức và tính các giá trị thống kê
Trang 2- Các giá trị Ti
Chọn ô B7 nhập biểu thức =SUM(B2:E2)
Chọn ô C7 nhập biểu thức =SUM(B3:E3)
Chọn ô D7 nhập biểu thức =SUM(B4:E4)
Chọn ô E7 nhập biểu thức =SUM(B5:E5)
- Các giá trị T.j.
Chọn ô B8 và nhập biểu thức =SUM(B2:B5)
Dùng con trỏ kéo kí hiệu tự điền ô B8 đến ô E8
- Các giá trị T k
Chọn ô B9 và nhập biểu thức =SUM(B2,C5,D4,E3)
Chọn ô C9 và nhập biểu thức =SUM(B3,C2,D4,E4)
Chọn ô D9 và nhập biểu thức =SUM(B4,C3,D4,E5)
Chọn ô E9 và nhập biểu thức =SUM(B5,C4,D4,E2)
- Giá trị T…
Chọn ô B10 và nhập biểu thức =SUM(B2:E5)
* Tính các giá trị G. và G.
- Các giá trị G. và G.
Chọn ô G7 và nhập biểu thức =SUMSQ(B7:E7)
Dùng con trỏ kéo ký hiệu tự điền từ ô G7 đến ô G9
- Giá trị G.
Chọn ô G10 và nhập biểu thức =POWER(B10,2)
- Giá trị G.
Chọn ô G11 và nhập biểu thức =SUMSQ(B2:E5)
* Tính các giá trị SSR, SSC, SSF và SSE
- Các giá trị SSR.SSC và SSF
Chọn ô I7 và nhập biểu thức =G7/4-39601/POWER(4,2)
Dùng con trỏ kéo kí hiệu tự điền từ ô I7 đến ô I9
- Giá trị SST
Chọn ô I11 va nhập biểu thức = G11-G10/POWER(4,2)
-Giá trị MSE
Chọn ô K10 và nhập biểu thức =I10/((4-1)*(4-2))
*Tính các giá trị G và F.
Chọn ô M7 và nhập biểu thức =K7/0.3958
Dùng con trỏ kéo kí hiệu tự điềm từ ô M7 đến ô M9
Kết quả và biện luận:
Trang 3FR = 3.1055 < F0.05(3.6) = 4.76 → Chấp nhận H0(pH)
FC = 11.9454 > F0.05(3.6) = 4.76 → Bác bỏ H0(nhiệt độ)
FR = 30.05 >F0.05(3.6) = 4.76 → Bác bỏ H0(chất xúc tác)
Vậy chỉ có nhiệt độ và xúc tác gây ảnh hưởng đến hiệu suất
Ví dụ 4.2:
Người ta đã dùng ba mức nhiệt độ gồm 105, 120 và 1350C kết hợp với 3 khoảng thời
gian là 15,30 và 60 phút để thực hiện một phản ứng tổng hợp Các hiệu suất của phản
ứng (%) được trình bày trong bảng sau:
Thời gian ( phút)
X1
Nhiệt độ (0C)
X2
Hiệu suất(%) Y
Hãy cho biết yếu tố nhiệt độ và thời gian / hoặc yếu tố thời gian có liên quan tuyến
tính với hiệu suất của phản ứng tổng hợp ? Nếu có thì điều kiện nhiệt độ 1150C trong
vòng 50 phút thì hiệu suất phản ứng sẽ là bao nhiêu?
BÀI GIẢI:
Nhập dữ liệu vào bảng tính
Dữ liệu nhất thiết phải được nhập theo cột:
Chọn Tools và lệnh Data Analysis
Trang 4Chọn chương trình Regression trong hộp thoại Data Analysis rồi nhấp OK.
Trong hộp thoại Regression, lần lượt ấn định các chi tiết:
- Phạm vi của biến số Y (Input Y Range)
- Phạm vi của biến số X (Input X Range)
- Nhãn dữ liệu (Labels)
- Mức tin cậy (Confidence Level)
- Tọa độ đầu ra (Output Range)
- Và một số tùy chọn khác như đường hồi quy (Line Fit Plots), biểu thức sai số
(Residuals Plots) …
Yếu tố thời gian
Trong hộp thoại Regression , lần lượt ấn định các chi tiết như sau :
Kết quả :
Phương trình hồi quy ŶX1 = f(X1)
Trang 5ŶX1 = 2,73 + 0.04X1 (R2 = 0,21 ; S = 1,81)
t0 = 2,19 < t0.05 = 2.365 ( hay P2
V = 0,071 > α = 0,05)
→ Chấp nhận giả thuyết H0.
t1 = 1,38 < t0,05 = 2.365 ( hay PV = 0,209 > α = 0,05)
→ Chấp nhận giả thuyết H0.
F = 1,905 < F3
0,05 = 5,590 ( hay FS4 = 0,209 > α = 0,05)
→ Chấp nhận giả thuyết H0.
Vậy cả hai hệ số 2,73(B0) và 0,04(B1) của phương trình hồi quy ŶX1 = 2,73 + 0,04X1
điều không có ý nghĩa thống kê Nói cách khác phương trình hồi quy này không thích
hợp
Kết luận: Yếu tố thời gian không có liên quan tuyến tính với hiệu suất của phản ứng
tổng hợp
Yếu tố nhiệt độ:
Trong hộp thoại Regression , lần lượt ấn định các chi tiết như sau :
Trang 6Kết quả :
Phương trình hồi quy ŶX2 = f(X2)
ŶX2 = -11,14 + 0,13X2 (R2 = 0,76 ; S = 0,99)
t0 = 3,418 > t0.05 = 2.365 ( hay P2
V = 0,011 < α = 0,05)
→ Bác bỏ giả thuyết H0.
t2 = 4,757 > t0,05 = 2.365 ( hay PV = 0,00206 < α = 0,05)
→ Bác bỏ giả thuyết H0.
F = 22,631 > F0,05 = 5,590 ( hay FS = 0,00206 < α = 0,05)
→ Bác bỏ giả thuyết H0.
Vậy cả hai hệ số -11,14(B0) và 0,13(B2) của phương trình hồi quy ŶX2 = -11,14 +
0,13X2 điều có ý nghĩa thống kê Nói cách khác phương trình hồi quy này thích hợp
Trang 7Kết luận: Yếu tố nhiệt độ có liên quan tuyến tính với hiệu suất của phản ứng tổng
hợp
Cả hai yếu tố thời gian và nhiệt độ
Trong hộp thoại Regression , lần lượt ấn định các chi tiết như sau :
Kết quả :
Phương trình hồi quy ŶX1,X2 = f(X1,X2)
ŶX1,X2 = -12,70 + 0.04X1 +0,13X2 (R2 = 0,97 ; S = 0,33)
t0 = 11,58 > t0.05 = 2.365 ( hay PV = 2,260.10-5 < α = 0,05)
→ Bác bỏ giả thuyết H0.
t1 = 7,583 > t0,05 = 2.365 ( hay PV = 0,00027 < α = 0,05)
→ Bác bỏ giả thuyết H0.
t2 = 14,328 > t0,05 = 2.365 ( hay PV = 7,223.10-6 < α = 0,05)
→ Bác bỏ giả thuyết H0.
F = 131,392 > F0,05 = 5,140 ( hay FS = 1,112.10-5 < α = 0,05)
→ Bác bỏ giả thuyết H0.
Trang 8Vậy cả hai hệ số -12,70(B0), 0,04(B1) và 0,13(B2) của phương trình hồi quy
ŶX1.X2 = -12,70 + 0,04X1 +0,13X2 điều có ý nghĩa thống kê Nói cách khác phương
trình hồi quy này thích hợp
Kết luận: Hiệu suất của phản ứng tổng hợp có liên quan tuyến tính với cả hai yếu tố
là thời gian và nhiệt độ
Muốn dự đoán hiệu suất của phản ứng bằng phương trình hồi quy
ŶX1,X2 = -12,70 + 0,04X1 +0,13X2 , bạn chỉ cẩn chọn một ô , ví dụ B106 ,sau đó nhập
hàm (=B102 + B103*50 + B104 *115) và được kết quả như sau:
Ghi chú : B102 là tọa độ của B0, B103 là tọa độ của B1, B104 là tọa độ của B2, 50
là giá trị của X1
(thời gian) và 115
là giá trị của X2
(nhiệt độ )
Bài 2 Số kilomet đi được nhờ 1 lít xăng của 4 loại xe ô tô A,B,C,D được ghi lại như sau
trên các xe chạy thí nghiệm :
Loại A: 25, 23,20,27,20
Loại B: 28,31,27,28,26
Loại C: 32,33,30,28,32
Loại D: 24,24,23,27,22
Với mức ý nghĩa 5% , hãy so sánh mức tiêu thụ xăng của 4 loại xe nói trên.
BÀI GIẢI:
1.Cơ sở lý thuyết :
a Dạng bài toán: Phân tích phương sai một nhân tố
b Khái niệm thống kê và giả thuyết bài toán:
Giả sử ta có k ĐLNN có phân bố chuẩn X 1 , X 2 , … X k , trong đó X i : N ( i, i2).
Các giá trị trung bình i và phương sai 2
i
đều chưa biết tuy nhiên chúng ta giả thiết rằng các phương sai bằng nhau:
2
1
= 2
2
= … = 2
k
Chúng ta muốn kiểm định xem liệu các giá trị trung bình i này có như nhau hay
không:
1
= 2 = … = k
Trong thống kê các vấn đề trên thường được xem xét dưới góc độ sau đây:
Giả sử chúng ta quan tâm đến một nhân tố X (factor) nào đó Nhân tố X có thể
xem xét ở k mức khác nhau Ký hiệu Xi là hiệu quả của việc tác động nhân tố X ở
Trang 9mức I đối với cá thể Như vậy i là hiệu quả trung bình của nhân tố X ở mức i.
Chúng ta muốn biết khi cho nhân tố X thay đổi các mức khác nhau thì điều đó có ảnh
hưởng hay không tới hiệu quả trung bình
Ta có bảng số liệu sau :
Các mức nhân tố
n=
k
i
n
1 1
T =
k
i k
T
1
K
x n
Ta đưa ra một số kí hiệu sau đây:
1
i
n ji j
i i
x T
x
Trung bình chung ở đó:
j
n k ij
x x
T x
Với :
n = n1 + n2 + … + nk
T = T1 + T2 + … + T3
Tổng bình phương chung Kí hiệu là SST được tính theo công thức sau:
k
n
i
n
i
n
i i
SST
1
2 1
2 1
1
2 1
k j
n
j
n
i xij x
1 1
2
Có thể chứng minh rằng:
n
T x n
T x L x x
SST
j ij n
i ik n
i ik n
i ij
, 2 2
1
2 1
2 1
2 2
1
+ Tổng bình phương do nhân tố kí hiệu là SSF được tính theo công thức sau:
n
T L n
T n
T i
n
SSF
k k k
i
2
2 2 1
2 1 1
2
+ Tổng bình phương do sai số kí
hiệu là SSE được tính theo công thức:
Trang 10
k
k ij
k k n
i ik n
i i n
i
i
n
i
n
i
n
i
n
T L n
T x n
T x L n
T x n
T
x
k ik
L i
i
SSE
k
k
x x x
x x
x
2 1
2 1 2 2
1
2 2
2 2 1
2 2 1
2
1
1
2
1
1
2 1
2 1
2
2 1
1 1
2 2 1
1
Từ công thức
trên ta thấy: SST = SSF+SSE
Trung bình bình phương của nhân tố, kí hiệu là MSF được tính bởi công thức:
1
SSF MSF
k
k – 1 được gọi là bậc tự do của nhân tố.
Trung bình bình phương của sai số, kí hiệu là MSE được tính bởi công thức:
SSE MSE
n k
n – k được gọi là bậc tự do của sai số.
Tỉ số F được tính bởi công thức:
F=
MSE MSF
Các kết quả nói trên được trình bày trong bảng sau đây gọi là ANOVA.
Bảng ANOVA
Nguồn Tổng bình phương Bậc tự do Trung bình bình phương Tỷ số F
Người ta chứng minh được rằng nếu giả thuyết H0 đúng thì tỉ số F sẽ có phân
bố Fisher với bậc tự do là (k – 1,n – k)
Thành thử giả thuyết Ho sẽ bị bác bỏ ở mức ý nghĩa của phân bố Fisher với
bậc tự do là (k – 1,n – k) k – 1 được gọi là bậc tự do ở mẫu số
Giả thuyết : H0 : μ1= μ2 =…= μk : “ Các giá trị trung bình bằng nhau”
Bảng ANOVA được tiến hành theo trình tự sau đây:
Bước 1: Tính SSF
Bứớc 2: Tính SST
Bước 3: Tính SSE=SST – SSF
Bứoc 4: Tính MSF=SSF/(K – 1)
Bước 5: Tính MSE=SSE/(N – K)
Bước 6: Tính F=MSF/MSE
Bước 7: Tra bảng phân bố F để tìm c rồi so sánh với F và rút ra kết luận:
Nếu F > Fα thì bác bỏ giả thuyết H0 và ngược lại
2.Áp dụng MS Excel :
a Nhập dữ liệu vào bảng tính :
Trang 11b Nhấp lần lượt Data tab và Data Analysis tab.
c Chọn chương trình Anova: Single Factor trong hộp thoại Data Analysis rồi
nhấp nút OK
d Trong hộp thoại Anova: Single Factor lần lượt xác định:
- Phạm vi đầu vào (Input Range)
- Cách sắp xếp theo hàng hay cột (Group by)
- Nhãn dữ liệu (Label in First Row/Column)
Trang 12e Được kết quả như sau :
Biện luận :
F = 13.3333 > F0,05 = 3.2389
→ Bác bỏ giả thuyết H0
Vậy mức tiêu thụ xăng của 4 loại xe khác nhau
Bài 3 Hãy tiến hành phân tích phương sai với các số liệu sau
Mẫu thứ nhất : 22 19 13 19 23 15 16 18 20 20
Mẫu thứ hai: 27 25 22 27 19 23 21 28 23 25 27
Mẫu thứ ba : 20 18 21 21 16 17 20 18 17 19 18
Mẫu thứ tư : 18 16 24 19 22 22 24
BÀI GIẢI:
Trang 131 Cơ sở lý thuyết : Dạng bài toán phân tích phương sai một nhân tố có cơ sở lý
thuyết như bài 2
2.Áp dụng MS Excel :
a.Nhập dữ liệu vào bảng:
b Nhấp lần lượt Data tab và Data Analysis tab
c Chọn chương trình Anova: Single Factor trong hộp thoại Data Analysis rồi
nhấp nút OK
d Trong hộp thoại Anova: Single Factor lần lượt xác định:
- Phạm vi đầu vào (Input Range)
- Cách sắp xếp theo hàng hay cột (Group by)
- Nhãn dữ liệu (Label in First Row/Column)
- Phạm vi đầu ra (Output Range)
Trang 14e Kết quả:
F = 10.68 > F0.05 (3.35) = 2.87
Bác bỏ giả thuyết H0
Vậy trung bình các mẫu khác nhau
Bài 4 Người ta tiến hành đo mực nước sông tại một số địa điểm thuộc tỉnh X trong cùng 1
ngày (số lần đo không giống nhau) và thu được bảng số liệu sau đây:
1
2
3
4
5
6
7
5,5 5,6 5,8 5,9 6,0 6,7 7,2
4,9 5,1 6,5 5,4 6,1
4,6 4,8 5,8 5,1 6,2 7,1
4,5 6,2 4,8 4,8 6,5 6,8 Mực nước sông trung bình/ ngày của các điểm nói trên có thật sự khác nhau không?
BÀI GIẢI:
1 Cơ sở lý thuyết : Dạng bài toán phân tích phương sai một nhân tố có cơ sở lý
thuyết như bài 2
2.Áp dụng MS Excel :
Trang 15a.Nhập dữ liệu vào bảng:
b Nhấp lần lượt Data tab và Data Analysis tab
c Chọn chương trình Anova: Single Factor trong hộp thoại Data Analysis rồi
nhấp nút OK
d Trong hộp thoại Anova: Single Factor lần lượt xác định:
- Phạm vi đầu vào (Input Range)
- Cách sắp xếp theo hàng hay cột (Group by)
- Nhãn dữ liệu (Label in First
Row/Column)
- Phạm vi đầu ra (Output
Range)
e Được kết quả như sau :
Trang 16Biện luận :
F = 0,5988 < F0,05 = 3.09839
→ Chấp nhận giả thuyết H0
Vậy mực nước sông trung bình của các điểm là như nhau
Bài 5 So sánh chi phí cho 3 loại dịch vụ ở 3 thành phố khác nhau bằng phương pháp phân
tích phương sai trên cơ sở bảng số liệu sau đây:
I II III
61 58 68
52 51 64
69 61 79 Các con số trong ô là chi phí trung bình cho 1 lần dịch vụ (đơn vị:1000đ)
BÀI GIẢI:
1 Cơ sở lý thuyết :
a Dạng bài toán : Phân tích phương sai 2 nhân tố không liên quan
b Khái niệm thống kê và giả thiết bài toán :
Sự phân tích này nhằm đánh giá sự ảnh hưởng của hai yếu tố trên các giá trị quan
sát Yij ( i = 1.2…r : yếu tố A; j = 1.2…c : yếu tố B)
Mô hình
Yếu tố A
Yếu tố B
Tổng cộng Trung bình
1
2
…
r
Y11
Y21
…
Yr1
Y12
Y22
…
Yr2
…
…
…
…
Y1c
Y2c
…
Yrc
Y1
Y2
…
Yr
1
Y
2
Y
…
r
Y
Tổng cộng
Trung bình YT..11
T.2 2
Y
…
… YT..cc
T
Y
Trang 17Bảng ANOVA
Nguồn sai
số
Bậc tự do Tổng số bình phương Bình phương
trung bình
Giá trị thống kê
Yếu tố A
(hàng)
(r-1)
r
i
i rc
T c
T SSB
1
2
2
) 1 (
r
SSB MSB
MSE
MSB
F R
Yếu tố B
(cột)
Sai số
(c-1) (r-1)(c-1)
c j
j
rc
T r
T SSB
1
2
2
SSE = SST – (SSF + SSB)
) 1 (
c
SSF MSF
) 1 (
r
SSB MSB
MSE
MSF
F C
Tổng cộng (rc-1)
r
i
c
j ij
r
T Y SST
1 1
2
2
Trắc nghiệm
Giả thiết:
H 0: 1 2 k “ Các giá trị trung bình bằng nhau”
H 1: i j “ Ít nhất có hai giá trị trung bình khác nhau”
Giá trị thống kê:
MSE
MSB
F R và
MSE
MSF
F C
Biện luận :
Nếu F R F a[b 1 , (k 1 )(b 1 )] chấp nhận H0 (yếu tố A)
Nếu F C F a[k 1 , (k 1 )(b 1 )] chấp nhận H0 (yếu tố B)
2 Áp dụng MS Excel :
a.Nhập các số liệu vào bảng
b Nhấp lần lượt Data tab và Data Analysis tab
c Chọn chương trình Anova : Two-Factor Without Replication trong hộp thoại Data
Analysis rồinhấp nút OK
d Trong hộp thoại Anova: Single Factor lần lượt xác định:
Trang 18- Phạm vi đầu vào (Input Range)
- Cách sắp xếp theo hàng hay cột (Group by)
- Nhãn dữ liệu (Label in First Row/Column)
- Phạm vi đầu ra (Output Range)
e Được kết quả như sau :
Biện luận :
FR = 24,91589 > F0,05 = 6.944272 → Bác bỏ giả thuyết H0( Thành phố)
FC = 24,91589 > F0,05 = 6.944272 → Bác bỏ giả thuyết H0( Loại dịch vụ)
Vậy chi phí cho 3 loại dich vụ ở 3 thành phố khác nhau không chịu ảnh hưởng của
thành phố hay loại dịch vụ nên chúng giống nhau