1. Trang chủ
  2. » Công Nghệ Thông Tin

Câu 1 XÁC SUẤT THỐNG KÊ

12 2 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Câu 1 xác suất thống kê
Tác giả Nguyễn Đình Huy
Trường học Đại Học Bách Khoa TP.HCM
Chuyên ngành Xác Suất Thống Kê
Thể loại Bài làm
Năm xuất bản 2012
Thành phố Thành phố Hồ Chí Minh
Định dạng
Số trang 12
Dung lượng 403,63 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

ĐH Bách Khoa TP HCM XÁC SUẤT THỐNG KÊ PGS TS Nguyễn Đình Huy Câu 1 Trình bày lại ví dụ 3 4 trang 207 và ví dụ 4 2 trang 216 Sách BT XSTK 2012 (N Đ HUY) Ví dụ 3 4 Hiệu suất phần trăm (%) của một[.]

Trang 1

Câu 1.Trình bày l i ví d 3.4 trang 207 và ví d 4.2 trang 216 Sách BT ạ ụ ụ XSTK 2012 (N.Đ.HUY).

Ví dụ 3.4: Hiệu suất phần trăm (%) của một phản ứng hóa học được nghiên cứu theo 3 yếu tố pH (A), nhiệt độ (B) và chất xúc tác (C) được trình bày trong bảng sau:

Hãy đánh giá về ảnh hưởng của các yếu tố trên hiệu suất phản ứng ?

Yếu tố

BÀI LÀM 1/ Cơ sở lí thuyết:

Nhận xét: Đây là bài toán Phân tích phương sai ba yếu tố:

- Sự phân tích này được dùng để đánh giá về sự ảnh hưởng của 3 yếu tố

trên các giá trị quan sát G (yếu tố A:i=1,2 r, yếu tố B: j=1,2 r, yếu tố C: k=1,2 r)

- Mô hình: khi nghiên cứu ảnh hưởng của 2 yếu tố, mỗi yếu tố có n mức thì người ta dùng mô hình hình vuông latin n¿n Ví dụ:

- Mô hình vuông latin 3 yếu tố được trình bày như sau:

Yếu tố C (T k : vd T 1 = Y111+Y421+Y331+Y241)

Yếu

tố

A

Yếu tố B

Trang 2

Bảng ANOVA

Nguồn sai

số Bậc tự do Tổng số bình phươg Bình phương trung bình Giá trị thống kê Yếu tố A

i=1

r Ti .

2

rT

2

r2

MSR=

SSR

Yếu tố B

i=1

r T j.

2

rT

2

r2

MSC=

SSC

Yếu tố C r-1

SSF=

i=1 r T k

2

rT

2

r2

MSF=

SSF

Sai số (r-1)(r-2) SSE=SST-(SSF+SSR+SSC)

MSE=

SSE

(r−1)(r−2)

Tổng cộng (r2-1)

SST=

∑∑∑Yijk

2

T .

2

r2

Trắc nghiệm:

*Giả thiết:

H0: μ1 =μ2= …μk ⇔ “Các giá trị trung bình bằng nhau”

H1: μi ≠μj ⇔“Có ít nhất 2 giá trị trung bình khác nhau”

*Giá trị thống kê: ˙G˙G

*Biện luận:

Nếu ˙G (chấp nhận H0 (yếu tố A) ) Nếu ˙G (chấp nhận H0 (yếu tố B) ) Nếu ˙G (chấp nhận H0 (yếu tố C) )

2/ Áp dụng Excel:

Thiết lập bảng tính như sau (Hình 1.1):

Hình 1.1

Trang 3

Tính các giá trị Ti (tổng theo hàng từ B đến E)

Chọn ơ B7 và nhập vào biểu thức =SUM(B2:E2)

Chọn ơ C7 và nhập vào biểu thức =SUM(B3:E3)

Chọn ơ D7 và nhập vào biểu thức =SUM(B4:E4)

Chọn ơ E7 và nhập vào biểu thức =SUM(B5:E5)

Tính các giá trị T.j.(tổng theo cột từ hàng thứ 2 đến hàng thứ 5)

Chọn ơ B8 và nhập vào biểu thức =SUM(B2:B5)

Dùng con trỏ kéo kí hiệu điền từ ơ B8 đến ơ E8

Tính các giá trịT k

Chọn ơ B9 và nhập biểu thức =SUM(B2,C5,D4,E3)

Chọn ơ C9 và nhập biểu thức =SUM(B3,C2,D5,E4)

Chọn ơ D9 và nhập biểu thức =SUM(B4,C3,D2,E5)

Chọn ơ E9 và nhập biểu thức =SUM(B5,C4,D3,E2)

Tính giá trịT (tổng các phần tử trong bảng)

Chọn ơ B10 và nhập biểu thức =SUM(B2:E5)

*Tính các giá trị˙G˙G

- Các giá trị˙G˙G

Chọn ơ G7 và nhập biểu thức =SUMSQ(B7:E7)

Dùng con trỏ kéo kí hiệu điền từ ơ G7 đến ơ G9

- Giá trị˙G

Chọn ơ G10 và nhập biểu thức =POWER(B10,2)

- Giá trị˙G

Chọn ơ G11 và nhập biểu thức =SUMSQ(B2:E5)

*Tính các giá trị SSR,SSC,SSF,SST và SSE

- Các giá trị SSR,SSC và SSF

Chọn ơ I7 và nhập vào biểu thức =G7/4-39601/POWER(4,2)

Dùng con trỏ kéo kí hiệu điền từ ơ I7 đên ơ I9

-Giá trị SST

Chọn ơ I11 và nhập biểu thức =G11-G10/POWER(4,2)

-Giá trị SSE

Chọn ơ I10 và nhập biểu thức =I11-SUM(I7:I9)

*Tính các giá trị MSR,MSC,MSF và MSE

-Các giá trị MSR,MSC và MSF

-Giá trị SST

Chọn ơ K7 và nhập biểu thức =I7/(4-1)

Dùng con trỏ kéo kí hiệu điền từ ơ M7 đến ơ M9

-Giá trị MSE

Chọn ơ K10 và nhập biểu thức =I10/((4-1)*(4-2))

*Tính các giá trị˙G và F

Chọn ơ M7 và nhập vào biểu thức =K7/0.3958

Dùng con trỏ kéo kí hiệu điền từ ơ M7 đến ơ M9

Kết quả và biện luận

Trang 4

FR=3.10 <F0.05(3.6)= 4.76 =>chấp nhận H0(pH)

FC=11.95>F0.05(3.6) = 4.76 =>bác bỏ H0(nhiệt độ)

F =30.05 >F0.05(3.6) = 4.76 =>bác bỏ H0(chất xúc tác)

Vậy chỉ có nhiệt độ và chất xúc tác ảnh hưởng đến hiệu suất

Ví dụ 4.2 : Người ta dùng ba mức nhiệt độ gồm 105, 120, 135 o C kết hợp với ba khoảng thời gian là 15, 30, 60 phút để thực hiện một phản ứng tổng hợp Các hiệu suất của các phản ứng (%) được trình bày trong bảng sau :

Thời gian (phút) Nhiệt độ ( o C) Hiệu suất (%)

Hãy cho biết yếu tố nhiệt độ và thời gian/hoặc yếu tố thời gian có liên quan tuyến tính với hiệu suất của phản ứng tổng hợp?Nếu có thì với điều kiện nhiệt

độ 115 o C trong vòng 50 phút, hiệu suất phản ứng sẽ là bao nhiêu?

BÀI LÀM 1/Cơ sở lí thuyết:

Nhận xét: Đây là dạng bài Hồi quy tuyến tính đa tham số.

Trong phương trình hồi quy tuyến tính đa tham số, biến số phụ thuộc Y có liên quan đến k biến số độc lập Xi (i =1,2,…k) thay vì chỉ có một như trong hồi quy tuyến tính đơn giản

Phương trình tổng quát:

Ŷ X1, X2, , X k= B 0 + B 1 X 1 + B 2 X 2 + … + B k X k

Phương trình hồi quy đa tham số có thể được trình bày dưới dạng ma trận:

Trang 5

N

k k

Bảng ANOVA

Nguồn sai

số Bậc tự do Tổng số bình phương Bình phương trung bình thống kê Giá trị

Sai số N – k – 1 SSE MSE = SSE/( N – k – 1)

Tồng cộng N – 1 SST=SSR + SSE

Giá trị thống kê:

Giá trị R-bình phương:

Giá trị R2 được hiệu chỉnh (Adjusted R Square)

R2 =SSR SST=( N – k –1)+kF (R kF 3 0.81 là tốt nhất)

Giá trị R2 được hiệu chỉnh (Adjusted R Square)

R2

ii =(N−1)R2−k

(N – k –1) = R2 – k (1−R

2)

(N – k –1) (R2

ii sẽ trở nên âm hay không xác định nếu R2 hay N nhỏ)

Độ lệch chuẩn:

(N – k – 1)(S 0.30 là khá tốt)

Trang 6

Trắc nghiệm thống kê:

Tương tự hồi quy đơn giản, song cần chú ý:

- Trong trắc nghiệm t

H0 : βi = 0 “Các hệ số hồi quy ko có ý nghĩa”

H0 : βi 0 “Có ít nhất vài hệ số hồi quy có ý nghĩa”

Bậc tự do của giá trị t: γ = N – k – 1

t = |B i −β i|

S n2 ; S n2= S2

(X i − X )2

- Trong trắc nghiệm F

H0 : βi = 0 “Phương trình hồi quy không thích hợp”

H0 : βi 0 “Phương trình hồi quy thích hợp” với ít nhất vài Bi Bậc tự do của giá trị F: Ʋ1 = 1, Ʋ2 = N – k – 1

2/ Áp dụng Excel:

Nhập bảng dữ liệu vào bảng tính:

Dữ liệu bắt buộc phải được nhập theo cột (Hình 1.2):

Hình 1.2

Sử dụng “Regression”:

Vào Data-> Data Analysis.Chọn mục Regression.Chọn OK.(Hình 1.3)

Trang 7

Hình 1.3

a/Trong hộp thoại Regression, lần lượt ấn định các chi tiết: (Hình 1.4)

 Phạm vi của biến số Y (Input Y Range): $C$1:$C$10

 Phạm vi của biến số X (Input X Range): $A$1:$A$10

 Nhãn dữ liệu (Labels)

 Mức tin cậy (Confidence Level): chọn mức 95%

 Tọa độ đầu ra (Output Range): $A$14

 Và một số tùy chọn khác như đường hồi quy (Line Fit Plots), biểu thức sai số (Residuals Plots)…

Hình 1.4

Trang 8

Phương trình hồi quy: Ŷ X1¿)

Ŷ X1= 2.7367 +0.04454X1 (R2=0.2139, S=1.8112); N=9; k=1

Hình 1.5

t0= t Stat(Intercept)= 2.129 < t0,05(7)=2.365 (hay P value=0.0708 >α=0.05)

 Chấp nhận giả thiết H0

t1= t Stat(X1) = 1.3802<t0,05(7)=2.365 (hay P value=0.2099>α=0.05)

 Chấp nhận giả thiết H0

F=1.9049<F0,05(1.7)=5.59 (hay FS=0.2099>α=0.05)

 Chấp nhận giả thiết H0

Vậy cả hai hệ số 2.37(B0) và 0.04(B1) của phương trình hồi quy Ŷ X1= 2.73 +

này không thích hợp

Kết luận: Yếu tố thời gian không có liên quan tuyến tính với hiệu suất phản ứng

tổng hợp

Trang 9

b/Trong hộp thoại Regression, lần lượt ấn định các chi tiết: (Hình 1.6)

 Phạm vi của biến số Y (Input Y Range): $C$1:$C$10

 Phạm vi của biến số X (Input X Range): $B$1:$B$10

 Nhãn dữ liệu (Labels)

 Mức tin cậy (Confidence Level): chọn mức 95%

 Tọa độ đầu ra (Output Range): $A$45

 Và một số tùy chọn khác như đường hồi quy (Line Fit Plots), biểu thức sai số (Residuals Plots)…

Hình 1.6

Trang 10

Phương trình hồi quy: Ŷ X2¿)

Ŷ X2= -11.1411 +0.12856X2 (R2=0.7638; S=0.9929);N=9; k=1

Hình 1.7

t0= t Stat(Intercept) =3.4178 > t0,05(7)=2.365 (hay P value=0.0112 < α=0.05)

 Bác bỏ giả thiết H0

t2= t Stat(X1) =4.7572 >t0,05(7)=2.365 (hay P value=0.0021 < α=0.05)

 Bác bỏ giả thiết H0

F=22.6309 > F0,05(1.7)=5.59 (hay FS=0.0021 <α=0.05)

 Bác bỏ giả thiết H0

thống kê Nói cách khác, phương trình hồi quy này thích hợp

Kết luận: Yếu tố nhiệt độ có liên quan tuyến tính với hiệu suất phản ứng tổng hợp.

Trang 11

c/Trong hộp thoại Regression, lần lượt ấn định các chi tiết: (Hình 1.8)

 Phạm vi của biến số Y (Input Y Range): $C$1:$C$10

 Pham vi của biến số X (Input X Range): $A$1:$B$10

 Nhãn dữ liệu (Labels)

 Mức tin cậy (Confidence Level): chọn mức 95%

 Tọa độ đầu ra (Output Range): $A$76

 Và một số tùy chọn khác như đường hồi quy (Line Fit Plots), biểu thức sai số (Residuals Plots)…

Hình 1.8

Phương trình hồi quy: Ŷ X 1, X2¿)

Ŷ X 1, X2 = -12.7 + 0.0445X1 + 0.1286X2 (R2=0.9777; S=0.3297); N=9; k=2

Trang 12

Hình 1.9

t0= t Stat(Intercept) =1.1016 > t0,05(6)=2.447 (hay P value=0.000026 < α=0.05)

 Bác bỏ giả thiết H0

t1= t Stat(X1) = 7.5827 >t0,05(6)=2.447 (hay P value=0.0002736 < α=0.05)

 Bác bỏ giả thiết H0

t2= t Stat(X2) = 14.3278 >t0,05(6)=2.447 (hay P value=0.000007 < α=0.05)

 Bác bỏ giả thiết H0

F=131.3921> F0,05(1.6)=5.99 (hay FS =0.0021 <α=0.05)

 Bác bỏ giả thiết H0

Vậy các hệ số của phương trình hồi quy Ŷ X 1, X2 = -12.7 + 0.0445X 1 + 0.1286X2đều có

ý nghĩa thống kê Nói cách khác, phương trình hồi quy này thích hợp

Kết luận:Hiệu suất phản ứng tổng hợp có liên quan tuyến tính với cả hai yếu tố là

nhiệt độ và thời gian

Dự đoán hiệu suất phản ứng tại t =115oC và thời gian là 50phút

Tại ô B94, nhập = B91 + B92*50 + B93*115

Kết quả dự đoán hiệu suất phản ứng là 4.310873016

Ngày đăng: 15/04/2023, 12:52

w