ĐH Bách Khoa TP HCM XÁC SUẤT THỐNG KÊ PGS TS Nguyễn Đình Huy Câu 1 Trình bày lại ví dụ 3 4 trang 207 và ví dụ 4 2 trang 216 Sách BT XSTK 2012 (N Đ HUY) Ví dụ 3 4 Hiệu suất phần trăm (%) của một[.]
Trang 1Câu 1.Trình bày l i ví d 3.4 trang 207 và ví d 4.2 trang 216 Sách BT ạ ụ ụ XSTK 2012 (N.Đ.HUY).
Ví dụ 3.4: Hiệu suất phần trăm (%) của một phản ứng hóa học được nghiên cứu theo 3 yếu tố pH (A), nhiệt độ (B) và chất xúc tác (C) được trình bày trong bảng sau:
Hãy đánh giá về ảnh hưởng của các yếu tố trên hiệu suất phản ứng ?
Yếu tố
BÀI LÀM 1/ Cơ sở lí thuyết:
Nhận xét: Đây là bài toán Phân tích phương sai ba yếu tố:
- Sự phân tích này được dùng để đánh giá về sự ảnh hưởng của 3 yếu tố
trên các giá trị quan sát G (yếu tố A:i=1,2 r, yếu tố B: j=1,2 r, yếu tố C: k=1,2 r)
- Mô hình: khi nghiên cứu ảnh hưởng của 2 yếu tố, mỗi yếu tố có n mức thì người ta dùng mô hình hình vuông latin n¿n Ví dụ:
- Mô hình vuông latin 3 yếu tố được trình bày như sau:
Yếu tố C (T k : vd T 1 = Y111+Y421+Y331+Y241)
Yếu
tố
A
Yếu tố B
Trang 2Bảng ANOVA
Nguồn sai
số Bậc tự do Tổng số bình phươg Bình phương trung bình Giá trị thống kê Yếu tố A
i=1
r Ti .
2
r −T
2
r2
MSR=
SSR
Yếu tố B
i=1
r T j.
2
r −T
2
r2
MSC=
SSC
Yếu tố C r-1
SSF=
∑i=1 r T k
2
r −T
2
r2
MSF=
SSF
Sai số (r-1)(r-2) SSE=SST-(SSF+SSR+SSC)
MSE=
SSE
(r−1)(r−2)
Tổng cộng (r2-1)
SST=
∑∑∑Yijk
2
−T .
2
r2
Trắc nghiệm:
*Giả thiết:
H0: μ1 =μ2= …μk ⇔ “Các giá trị trung bình bằng nhau”
H1: μi ≠μj ⇔“Có ít nhất 2 giá trị trung bình khác nhau”
*Giá trị thống kê: ˙Gvà˙G
*Biện luận:
Nếu ˙G (chấp nhận H0 (yếu tố A) ) Nếu ˙G (chấp nhận H0 (yếu tố B) ) Nếu ˙G (chấp nhận H0 (yếu tố C) )
2/ Áp dụng Excel:
Thiết lập bảng tính như sau (Hình 1.1):
Hình 1.1
Trang 3Tính các giá trị Ti (tổng theo hàng từ B đến E)
Chọn ơ B7 và nhập vào biểu thức =SUM(B2:E2)
Chọn ơ C7 và nhập vào biểu thức =SUM(B3:E3)
Chọn ơ D7 và nhập vào biểu thức =SUM(B4:E4)
Chọn ơ E7 và nhập vào biểu thức =SUM(B5:E5)
Tính các giá trị T.j.(tổng theo cột từ hàng thứ 2 đến hàng thứ 5)
Chọn ơ B8 và nhập vào biểu thức =SUM(B2:B5)
Dùng con trỏ kéo kí hiệu điền từ ơ B8 đến ơ E8
Tính các giá trịT k
Chọn ơ B9 và nhập biểu thức =SUM(B2,C5,D4,E3)
Chọn ơ C9 và nhập biểu thức =SUM(B3,C2,D5,E4)
Chọn ơ D9 và nhập biểu thức =SUM(B4,C3,D2,E5)
Chọn ơ E9 và nhập biểu thức =SUM(B5,C4,D3,E2)
Tính giá trịT (tổng các phần tử trong bảng)
Chọn ơ B10 và nhập biểu thức =SUM(B2:E5)
*Tính các giá trị˙G và˙G
- Các giá trị˙G và ˙G
Chọn ơ G7 và nhập biểu thức =SUMSQ(B7:E7)
Dùng con trỏ kéo kí hiệu điền từ ơ G7 đến ơ G9
- Giá trị˙G
Chọn ơ G10 và nhập biểu thức =POWER(B10,2)
- Giá trị˙G
Chọn ơ G11 và nhập biểu thức =SUMSQ(B2:E5)
*Tính các giá trị SSR,SSC,SSF,SST và SSE
- Các giá trị SSR,SSC và SSF
Chọn ơ I7 và nhập vào biểu thức =G7/4-39601/POWER(4,2)
Dùng con trỏ kéo kí hiệu điền từ ơ I7 đên ơ I9
-Giá trị SST
Chọn ơ I11 và nhập biểu thức =G11-G10/POWER(4,2)
-Giá trị SSE
Chọn ơ I10 và nhập biểu thức =I11-SUM(I7:I9)
*Tính các giá trị MSR,MSC,MSF và MSE
-Các giá trị MSR,MSC và MSF
-Giá trị SST
Chọn ơ K7 và nhập biểu thức =I7/(4-1)
Dùng con trỏ kéo kí hiệu điền từ ơ M7 đến ơ M9
-Giá trị MSE
Chọn ơ K10 và nhập biểu thức =I10/((4-1)*(4-2))
*Tính các giá trị˙G và F
Chọn ơ M7 và nhập vào biểu thức =K7/0.3958
Dùng con trỏ kéo kí hiệu điền từ ơ M7 đến ơ M9
Kết quả và biện luận
Trang 4FR=3.10 <F0.05(3.6)= 4.76 =>chấp nhận H0(pH)
FC=11.95>F0.05(3.6) = 4.76 =>bác bỏ H0(nhiệt độ)
F =30.05 >F0.05(3.6) = 4.76 =>bác bỏ H0(chất xúc tác)
Vậy chỉ có nhiệt độ và chất xúc tác ảnh hưởng đến hiệu suất
Ví dụ 4.2 : Người ta dùng ba mức nhiệt độ gồm 105, 120, 135 o C kết hợp với ba khoảng thời gian là 15, 30, 60 phút để thực hiện một phản ứng tổng hợp Các hiệu suất của các phản ứng (%) được trình bày trong bảng sau :
Thời gian (phút) Nhiệt độ ( o C) Hiệu suất (%)
Hãy cho biết yếu tố nhiệt độ và thời gian/hoặc yếu tố thời gian có liên quan tuyến tính với hiệu suất của phản ứng tổng hợp?Nếu có thì với điều kiện nhiệt
độ 115 o C trong vòng 50 phút, hiệu suất phản ứng sẽ là bao nhiêu?
BÀI LÀM 1/Cơ sở lí thuyết:
Nhận xét: Đây là dạng bài Hồi quy tuyến tính đa tham số.
Trong phương trình hồi quy tuyến tính đa tham số, biến số phụ thuộc Y có liên quan đến k biến số độc lập Xi (i =1,2,…k) thay vì chỉ có một như trong hồi quy tuyến tính đơn giản
Phương trình tổng quát:
Ŷ X1, X2, , X k= B 0 + B 1 X 1 + B 2 X 2 + … + B k X k
Phương trình hồi quy đa tham số có thể được trình bày dưới dạng ma trận:
Trang 5N
k k
Bảng ANOVA
Nguồn sai
số Bậc tự do Tổng số bình phương Bình phương trung bình thống kê Giá trị
Sai số N – k – 1 SSE MSE = SSE/( N – k – 1)
Tồng cộng N – 1 SST=SSR + SSE
Giá trị thống kê:
Giá trị R-bình phương:
Giá trị R2 được hiệu chỉnh (Adjusted R Square)
R2 =SSR SST=( N – k –1)+kF (R kF 3≥ 0.81 là tốt nhất)
Giá trị R2 được hiệu chỉnh (Adjusted R Square)
R2
ii =(N−1)R2−k
(N – k –1) = R2 – k (1−R
2)
(N – k –1) (R2
ii sẽ trở nên âm hay không xác định nếu R2 hay N nhỏ)
Độ lệch chuẩn:
(N – k – 1)(S ≤0.30 là khá tốt)
Trang 6Trắc nghiệm thống kê:
Tương tự hồi quy đơn giản, song cần chú ý:
- Trong trắc nghiệm t
H0 : βi = 0 “Các hệ số hồi quy ko có ý nghĩa”
H0 : βi ≠ 0 “Có ít nhất vài hệ số hồi quy có ý nghĩa”
Bậc tự do của giá trị t: γ = N – k – 1
t = |B i −β i|
√S n2 ; S n2= S2
∑(X i − X )2
- Trong trắc nghiệm F
H0 : βi = 0 “Phương trình hồi quy không thích hợp”
H0 : βi ≠ 0 “Phương trình hồi quy thích hợp” với ít nhất vài Bi Bậc tự do của giá trị F: Ʋ1 = 1, Ʋ2 = N – k – 1
2/ Áp dụng Excel:
Nhập bảng dữ liệu vào bảng tính:
Dữ liệu bắt buộc phải được nhập theo cột (Hình 1.2):
Hình 1.2
Sử dụng “Regression”:
Vào Data-> Data Analysis.Chọn mục Regression.Chọn OK.(Hình 1.3)
Trang 7Hình 1.3
a/Trong hộp thoại Regression, lần lượt ấn định các chi tiết: (Hình 1.4)
Phạm vi của biến số Y (Input Y Range): $C$1:$C$10
Phạm vi của biến số X (Input X Range): $A$1:$A$10
Nhãn dữ liệu (Labels)
Mức tin cậy (Confidence Level): chọn mức 95%
Tọa độ đầu ra (Output Range): $A$14
Và một số tùy chọn khác như đường hồi quy (Line Fit Plots), biểu thức sai số (Residuals Plots)…
Hình 1.4
Trang 8Phương trình hồi quy: Ŷ X1=ƒ¿)
Ŷ X1= 2.7367 +0.04454X1 (R2=0.2139, S=1.8112); N=9; k=1
Hình 1.5
t0= t Stat(Intercept)= 2.129 < t0,05(7)=2.365 (hay P value=0.0708 >α=0.05)
Chấp nhận giả thiết H0
t1= t Stat(X1) = 1.3802<t0,05(7)=2.365 (hay P value=0.2099>α=0.05)
Chấp nhận giả thiết H0
F=1.9049<F0,05(1.7)=5.59 (hay FS=0.2099>α=0.05)
Chấp nhận giả thiết H0
Vậy cả hai hệ số 2.37(B0) và 0.04(B1) của phương trình hồi quy Ŷ X1= 2.73 +
này không thích hợp
Kết luận: Yếu tố thời gian không có liên quan tuyến tính với hiệu suất phản ứng
tổng hợp
Trang 9b/Trong hộp thoại Regression, lần lượt ấn định các chi tiết: (Hình 1.6)
Phạm vi của biến số Y (Input Y Range): $C$1:$C$10
Phạm vi của biến số X (Input X Range): $B$1:$B$10
Nhãn dữ liệu (Labels)
Mức tin cậy (Confidence Level): chọn mức 95%
Tọa độ đầu ra (Output Range): $A$45
Và một số tùy chọn khác như đường hồi quy (Line Fit Plots), biểu thức sai số (Residuals Plots)…
Hình 1.6
Trang 10Phương trình hồi quy: Ŷ X2=ƒ¿)
Ŷ X2= -11.1411 +0.12856X2 (R2=0.7638; S=0.9929);N=9; k=1
Hình 1.7
t0= t Stat(Intercept) =3.4178 > t0,05(7)=2.365 (hay P value=0.0112 < α=0.05)
Bác bỏ giả thiết H0
t2= t Stat(X1) =4.7572 >t0,05(7)=2.365 (hay P value=0.0021 < α=0.05)
Bác bỏ giả thiết H0
F=22.6309 > F0,05(1.7)=5.59 (hay FS=0.0021 <α=0.05)
Bác bỏ giả thiết H0
thống kê Nói cách khác, phương trình hồi quy này thích hợp
Kết luận: Yếu tố nhiệt độ có liên quan tuyến tính với hiệu suất phản ứng tổng hợp.
Trang 11c/Trong hộp thoại Regression, lần lượt ấn định các chi tiết: (Hình 1.8)
Phạm vi của biến số Y (Input Y Range): $C$1:$C$10
Pham vi của biến số X (Input X Range): $A$1:$B$10
Nhãn dữ liệu (Labels)
Mức tin cậy (Confidence Level): chọn mức 95%
Tọa độ đầu ra (Output Range): $A$76
Và một số tùy chọn khác như đường hồi quy (Line Fit Plots), biểu thức sai số (Residuals Plots)…
Hình 1.8
Phương trình hồi quy: Ŷ X 1, X2=ƒ¿)
Ŷ X 1, X2 = -12.7 + 0.0445X1 + 0.1286X2 (R2=0.9777; S=0.3297); N=9; k=2
Trang 12Hình 1.9
t0= t Stat(Intercept) =1.1016 > t0,05(6)=2.447 (hay P value=0.000026 < α=0.05)
Bác bỏ giả thiết H0
t1= t Stat(X1) = 7.5827 >t0,05(6)=2.447 (hay P value=0.0002736 < α=0.05)
Bác bỏ giả thiết H0
t2= t Stat(X2) = 14.3278 >t0,05(6)=2.447 (hay P value=0.000007 < α=0.05)
Bác bỏ giả thiết H0
F=131.3921> F0,05(1.6)=5.99 (hay FS =0.0021 <α=0.05)
Bác bỏ giả thiết H0
Vậy các hệ số của phương trình hồi quy Ŷ X 1, X2 = -12.7 + 0.0445X 1 + 0.1286X2đều có
ý nghĩa thống kê Nói cách khác, phương trình hồi quy này thích hợp
Kết luận:Hiệu suất phản ứng tổng hợp có liên quan tuyến tính với cả hai yếu tố là
nhiệt độ và thời gian
Dự đoán hiệu suất phản ứng tại t =115oC và thời gian là 50phút
Tại ô B94, nhập = B91 + B92*50 + B93*115
Kết quả dự đoán hiệu suất phản ứng là 4.310873016