Câu 1Ví dụ 3.4: Hiệu suất phần trăm % của một phản ứng hóa học được nghiên cứu theo 3 yếu tố: pH A, nhiệt độ B và chất xúc tác C được trình bày trong bảng sau: Bài toán phân tích phươn
Trang 1BÁO CÁO BÀI
Trang 2Câu 1
Ví dụ 3.4: Hiệu suất phần trăm (%) của một phản ứng hóa học được nghiên
cứu theo 3 yếu tố: pH (A), nhiệt độ (B) và chất xúc tác (C) được trình bày trong bảng sau:
Bài toán phân tích phương sai 3 yếu tố
1) C s lý thuy t: ơ sở lý thuyết: ở lý thuyết: ết:
Khi phân tích phương sai ba yếu tố ta thường dung mô hình vuông La tinh có dạng như sau:
Trang 3Giá trị thống kê Yếu tố
Sai số (r-1)(r-2) SSE = SST – (SSF + SSR +SSC) MSE =SSE
Ta tiến hành phân tích phương sai ba yếu tố trên và dựa trên bảng ANOVA
để kết luận ảnh hưởng của các yếu tố đến hiệu suất của phản ứng
Trang 4Nhập dữ liệu vào bảng như sau:
Tính các giá trị Ti… T.j. T k và T
- Các giá trị T i
Chọn ô B7 và nhập biểu thức =SUM(B2:E2) Chọn ô C7 và nhập biểu thức =SUM(B3:E3) Chọn ô D7 và nhập biểu thức =SUM(B4:E4) Chọn ô E7 và nhập biểu thức =SUM(B5:E5)
- Các giá trị T.j.
Chọn ô B8 và nhập biểu thức =SUM(B2:B5) Dùng con trỏ kéo kí hiệu tự điền từ ô B8 đến E8
- Các giá trị T k
Chọn ô B9 và nhập biểu thức =SUM(B2,C5,D4,E3) Chọn ô C9 và nhập biểu thức =SUM(B3,C2,D5,E4) Chọn ô D9 và nhập biểu thức =SUM(B4,C3,D2,E5) Chọn ô E9 và nhập biểu thức =SUM(B5,C4,D3,E2)
- Giá trị T…
Chọn ô B10 và nhập biểu thức =SUM(B5,C4,D3,E2)
Tính các giá trị G´và G´
- Các giá trị G´ và G´
Trang 5Chọn ô G7 và nhập biểu thức =SUMSQ(B7:E7) Dùng con trỏ kéo kí hiệu tự điền từ ô G7 đến ô G9
- Giá trị SST
Chọn ô I11 và nhập biểu thức =G11-G10/POWER(4,2)
- Giá trị SSE
Chọn ô I10 và nhập biểu thức =I11-SUM(I7:I9)
Tính các giá trị MSR, MSC, MSF, và MSE
- Các giá trị MSR, MSC và MSF
Chọn ô K7 và nhập biểu thức =I7/(4-1) Dùng con trỏ kéo kí hiệu tự điền từ ô K7 đến ô K9
- Giá trị MSE
Chọn ô K10 và nhập biểu thức =I10/((4-1)*(4-2))
Tính giá trị G và F
Chọn ô M7 và nhập biểu thức =K7/0.3958 Dùng con trỏ kéo kí hiệu tự điền từ ô M7 đến ô M9
Trang 6Ví dụ 4.2: Người ta dung ba mức nhiệt độ gồm 105, 120 và 135 C kết hợp với ba khoảng thời gian là 15, 30 và 60 phút để thực hiện một phản ứng tổng hợp Các hiệu suất của phản ứng (%) được trình bày trong bảng sau đây:
- Nh n đ nh ận định ịnh
Hồi quy tuyến tính đa tham số
1) C s lý thuy t: ơ sở lý thuyết: ở lý thuyết: ết:
Phương trình tổng quát cho biến phụ thuộc Y có liên quan đến k biến số
độc lập Xi (i=1,2, ,k):
^
Y X1,X2,…, X k= ¿B0 + B1X1 + B2X2 + … + BkXk
Trang 7Giá trị thống kê
Sai số N - k - 1 SSE MSE = SSE / (N - k- 1)
R ii2 sẽ trở nên âm hay không xác định nếu R 2 hay N nhỏ
Độ lệch chuẩn:
S=√ SSN
(N −k −1) (S ≤ 0.30 là khá tốt) Trắc nghiệm thống kê:
Trang 9Sử dụng Regression: Data -> Data Analysis
Trong cửa sổ Data Analysis chọn Regression:
Hồi quy theo Thời gian (X 1 ):
Các thông số:
- Input Y Range: Phạm vi biến số Y
- Input X Range: Phạm vi biến số X
- Labels: Dữ liệu bao gồm nhãn
- Confidence Level: Mức tin cậy (chọn 95%)
- Output options: Chọn New Worksheet Ply (Xuất kết quả ở sheet Thời
gian)
Trang 10Kết quả:
Trang 11Phương trình hồi quy:
Nên chấp nhận giả thiết H0
F = 1.9049 < F0.053 = 5.590 (tra bảng VIII với n1 = 1 và n2 = 7) hay F S4 = 0.2100 > α = 0.05
Nên chấp nhận giả thiết H0.Vậy phương trình hồi quy trên không có ý nghĩa thống kê
Kết luận: Yếu tố thời gian không có liên quan tính tuyến với hiệu suất của
phản ứng tổng hợp
Hồi quy theo Nhiệt độ (X 2 ):
Các thông số ở cửa sổ Regression như Hồi quy theo X 1 , trừ Input X
Range là $B$1:$B$10
Trang 13Các thông số ở cửa sổ Regression như Hồi quy theo X 1 , trừ Input X
Nên bác bỏ giả thiết H0
F = 131.3921 > F0.05 = 5.140 (tra bảng VII với n1 = 2 và n2 = 6) hay FS =0.0021 < α = 0.05
Trang 14 Nên bác bỏ giả thiết H0.Vậy phương trình hồi quy trên có ý nghĩa thống kê.
Kết luận: Hiệu suất phản ứng có liên quan tính tuyến với cả hai yếu tố là
thời gian và nhiệt độ
Dữ liệu với hàm hồi quy Y = -12.7000 + 0.0445X 1 + 0.1286X 2:
Vẽ biểu đồ: chọn ô
C2,
vào Insert -> Scatter -> Scatter with only Maker
Sự tính tuyến của phương trình hồi quy Y X1, X2 = -12.7000 + 0.0445X 1 +
0.1286X 2 có thể được trình bày trên biểu đồ phân tán:
Trang 15Dự đoán hiệu suất của phản ứng bằng phương trình hồi quy tại nhiệt thời gian(X1) 50 phút, nhiệt độ (X2) 115oC:
Hàm l ượng dự đoán (Y’) ng th c nghi m (Y) ự đoán (Y’) ệm (Y)
Công thức ô E3:
=B1+B2*E1+B3*E2
Kết quả: 4.3109
Trang 16Câu 2
Một nghiên cứu được tiến hành ở thành phố công nghiệp X để xác định tỷ lệ những người đi làm bằng xe máy, xe đạp và buýt Việc điều tra được tiến hành trên hai nhóm Kết quả như sau:
Kiểm tra cơ cấu sử dụng phương tiện giao thông đi làm trong nhóm công nhân nam và nữ bằng phương pháp so sánh tỉ số
1) C s lý thuy t : ơ sở lý thuyết: ở lý thuyết: ết:
- Đối với một số bài toán có hai hay nhiều kết quả, ta thường phải so sánh hai hay nhiều tỉ số với nhau (thực nghiệm với lý thuyết, thực nghiệm với thực
nghiệm…) Phép trắc nghiệm khi bình phương không chỉ cho phép ta so sánh hai
mà là nhiều tỉ số ( hay tỉ lệ hoặc xác suất một cách tiện lợi )
- χ2 là phân phối về xác suất không có tính đối xứng và có gián trị ≥0 , bà toán với N lần thử nghiệm mỗi lần thử nghiệm có k kết quả và mỗi kết quả mang một xác suất thực nghiệm P i ( i= 1,2,3…,k ) Nếu gọi P i ,0 là các giá trị lý thuyết tươngứng với P i thì các tần số lý thuyết E i = NP i ,0 Điều kiện trắc nghiệm χ2 một cách thành công là các tần số ký thuyết E i ≥ 5
Trang 17Giả thiết :
H0 : P1=P1,0 , P2=P2,0 , …P k , 0 “Các giá trị trung bình bằng nhau”Các giá trị trung bình bằng nhau”
H1 : “Các giá trị trung bình bằng nhau” Có ít nhất 2 giá tri trung bình bằng nhau “Các giá trị trung bình bằng nhau”
Nếu χ2>χ2α => Bác bỏ giả thiết H0 ( DF= k-1 )
Trong chương trình MS-EXCEL có hàm số CHITEST để tính
- Giả thiết H0 : “Các giá trị trung bình bằng nhau” Cơcấu sử dụng phương tiện giao thông của công nhân nam
và công nhân nữ giống nhau ”
Trang 18Chọn B8 nhập công thức =B$4*$E2/$E$4, dùng con trỏ kéo nút tự điền từ ô
B8 đến ô D9 hoặc nhấn tổ hợp phím ctrl + enter
Ta được bảng sau :
Áp dụng hàm CHITEST:
Chọn A11 và nhập biểu thức =CHITEST(B2:D3,B8:D9)
Ta sẽ có được kết quả của P( X> χ¿¿ 2) ¿
Kết luận:
P( X> χ¿¿ 2) ¿= 0.0022 < α = 0.05 => Bác bỏ giả thuyết Ho
Cơ cấu sử dụng các phương tiện giao thông đi làm trong 2 nhóm công nhân nam và nữ khác nhau
Trang 19Tương đối Không
A B C D E
220 130 84 156 122
121 207 54 95 164
63 75 24 43 73
Với mức ý nghĩa = 3%, kiểm định xem mức độ thỏa mãn cuộc sống có phân
bố giống nhau trong 5 thành phố trên hay không?
Bài toán kiểm định mức độ thỏa mãn cuộc sống tại năm thành phố bằng phươngpháp so sánh tỉ số
1) C s lý thuy t ơ sở lý thuyết: ở lý thuyết: ết: :
Đối với một thí nghiệm có hai kết quả (binomial experiment) – thí dụ, đối với một thuốc được kê đơn: có hay không - bạn thường so sánh hai tỉ số với nhau (thực nghiệm với lí thuyết hay thực nghiệm với thực nghiệm) Song đối với một thí nghiệm có nhiều kết quả (multinomial experiment)-thí dụ, bác sĩđánh giá tình trạng của các bệnh nhân được điều trị bởi thuốc trong một khoảng thời gian - bạn cần so sánh nhiều tỉ số Trắc nghiệm “Các giá trị trung bình bằng nhau”khi” bình phương (X2) cho phép bạn so sánh không những hai mà còn nhiều tỉ số (hay tỉ lệ hoặc xác suất) một cách tiện lợi X2 là phân phối về xác suất, không có tính đối xứng và
Trang 20chỉ có giá trị ≥ 0 Giả sử bạn có một công trình nghiên cứu với N thử nghiệm độc lập, mỗi thử nghiệm có k kết quả và mỗi kết quả mang một các xác suất thựcnghiệm là Pi(i = 1, 2, …k) Nếu gọi Pi,0 là các giá trị lí thuyết tương ứng với Pi thì các tần số lí thuyết sẽ là
Ei = NP i ,0 Điều kiện để áp dụng trắc nghiệm X2một cách thành công là các tần số lí thuyết Ei phải ≥ 5
Giả thuyết
H0: P1=P1,0, P2=P2,0, … , P k , 0 “Các giá trị trung bình bằng nhau”Các cặp P i và P i ,0 giống nhau”
H1 : “Các giá trị trung bình bằng nhau” Ít nhất có một cặp P i và P i ,0 khác nhau”
O i - các tần số thực nghiệm (observed frequency)
E i - các tần số lý thuyết (expected frequency)
Biện luận:
Nếu χ2>χ2α => bác bỏ giả thiết H0
Giá trị χ2 tính theo biểu thức:
O i - các tần số thực nghiệm của ô thuộc hàng i cột j
E i - các tần số lý thuyết của ô thuộc hàng i cột j, r là số hàng và c là số cột
Xác xuất P( X> χ2) với bậc tự do DF = (r - 1)(c - 1); trong đó r là số hàng và c là
số cột trong bảng VI
Nếu P( X> χ¿¿2)> α¿ => Chấp nhận giả thiết H0 và ngược lại
Trang 212) Bài làm
Ta cần đi kiểm định giả thiết:
Ho: mức độ thỏa mãn cuộc sống phân bố giống nhau trong 5 thành phố trên
Nhập dữ liệu vào bảng và tính tổng:
Trang 22Tính các tần số lý thuyết:
Tần số lý thuyết = ( tổng hàng * tổng cột ) / tổng cộng
Chọn ô B10 nhậpcôngthức=(B$8*$E3/$E$8), sau đó kéo nút tự điền từ B10 đến D14 hoặc nhấn tổ hợp phim ctrl + enter, ta sẽ được kết quả.
Trang 23Áp dụng hàm CHITEST:
Chọn ô E15 và nhập biểu thức=CHITEST(B3:D7;B10:D14)
Ta sẽ có được kết quả củaP( X> χ¿¿ 2) ¿
Kết luận :
P( X> χ¿¿ 2)=3.5299∗10 −13
¿ < 0.03 bác bỏ giả thiết Ho Vậy mức độ thỏa mãn cuộc sống có phân bố khác nhau trong 5 thành phố trên
Trang 24Câu 4
Sau đây là số liệu về số lượng một loại báo ngày bán được ở 5 quận nội thành:
Thứ haiThứ baThứ tưThứ nămThứ sáuThứ bảy
222125242830
181825241922
222225181528
181819202225
181920222525Lượng báo bán được ở 5 quận có khác nhau thực sự không? Chọn = 2%.Lượng báo bán ra có chịu tác động của các yếu tố ngày trong tuần không?
- Nh n đ nh ận định ịnh
Bài toán phân tích phương sai 2 yếu tố không lặp
1) C s lí thuy t: ơ sở lý thuyết: ở lý thuyết: ết:
Phân tích phương sai hai yếu tố không lặp:
Sự phân tích này nhằm đánh giá sự ảnh hưởng của hai yếu tố trên các giá trị quan sát Yij (i=1,2…r: yếu tố A; j=1,2…c: yếu tố B)
Trang 25Bình phương trung bình
Giá trị thống kê Yếu tố A
H0: μ1=μ2=…μ k “Các giá trị trung bình bằng nhau”Các giá trị trung bình bằng nhau”
H1: μ1≠ μ2 “Các giá trị trung bình bằng nhau”Ít nhất có hai giá trị trung bình khác nhau”
Trang 26Giá trị thống kê:
F R=MSB MSE và F C=MSF
MSE
Biện luận:
Nếu F R<F a[b−1,(k −1) (b−1 )] => Chấp nhận H0 (yếu tố A)Nếu F C<F a[b−1, (k−1) (b−1)] => Chấp nhận H0 (yếu tố B)
2) Bài làm
Áp dụng “Anova: Two-Factor Without Replication”
Vào Data -> Data Analysis Chọn mục Anova: Two-Factor Without
Replication Chọn OK.
Trang 27Trong hộp thoại Anova: Two-Factor Without Replication lần lượt ấn định
các chi tiết:
Phạm vi đầu vào (Input Range): $A$2:$F$8
Nhãn dữ liệu (Labels in First Row/Column)
Ngưỡng tin cậy (Alpha): 0.02 (mức ý nghĩa = 2%)
Nhấn OK Ta được bảng sau:
Trang 28Kết luận:
FR = 3,5672 > F0.02 = 3,4817 =>không chấp nhận giả thiết H0(thứ)
→ Vậy lượng báo bán ra có sự khác nhau theo thứ
FC = 2,4748< F0.02 = 3,7313=> chấp nhận giả thiết H0 (quận)
→ Vậy lượng báo bán ra theo quận không có sự khác nhau
Trang 29Câu 5
Theo dõi ngẫu nhiên giá thuê nhà tại 5 thành phố (với điều kiện thuê nhà như nhau) thu được các số liệu sau:
Thành phốA
900
1200
850 132
0
1400
1150975
Thành phốB
625
640 775 100
0
0Thành phố
C
415
0Thành phố
D
410
Thành phốE
340
Hãy tìm P-value để kiểm định xem có sự khác biệt về giá thuê nhà ở 5 thành phố nói trên hay không
-Nh n đ nh ận định ịnh
Bài toán phân tích phương sai một yếu tố
1) C s lí thuy t: ơ sở lý thuyết: ở lý thuyết: ết:
Phân tích phương sai một yếu tố
Sự phân tích này nhằm đánh giá sự ảnh hưởng của một yếu tố trên các giá trị quan sát Yi (i=1,2,…,k)
Trang 30Tổng số bình phương
Bình phương trung bình
Giá trị thống kê Yếu tố
Giả thuyết:
H0: μ1=μ2=…μ k “Các giá trị trung bình bằng nhau”Các giá trị trung bình bằng nhau”
H1: μ1≠ μ2 “Các giá trị trung bình bằng nhau”Ít nhất có hai giá trị trung bình khác nhau”
Giá trị thống kê:
F= MSF MSE
Biện luận:
Nếu F R<F a(k −1, N −k ) => Chấp nhận giả thiết H0
Trang 312) Bài làm:
Nhận xét: Đây là bài toán phân tích phương sai một yếu tố
Giả thiết H 0 : không có sự khác biệt về giá thuê nhà ở 5 thành phố
Nhập bảng số liệu như hình dưới:
Vào Data /Data analysis, chọn Anova: Single Factor rồi bấm OK
Trên màng hình sẽ hiện lên hộp thoại của Anova: Single Factor
Ta nhập các thông số như hình dưới
Phạm vi của biến số Y(Input Range): ta kéo chuột từ ô A1 tới ô I5
Alpha: 0.05
Group by: Rows
Xuất kết quả (Output options): kích vào New Worksheet Ply
Trang 32Ta được kết quả như sau:
Trang 33Kết Luận
P-Value = 6.46E-10 < Alpha=0.05
F= 28.08985 > F0.05 =2.6787
Suy ra: Không chấp nhận giả thuyết Ho
Vậy có sự khác biệt về giá thuê nhà giữa 5 thành phố