Lượng sữa của các con bò này được thống kê trong bảng sau đây: 1.3.. Sự phân tích này được dùng để đánh giá về sự ảnh hưởng của ba yếu tố trên các giá trị quan sát.. Các hiệu suất của ph
Trang 1TRƯỜNG ĐẠI HỌC BÁCH KHOA KHOA KHOA HỌC ỨNG DỤNG
Trang 2MỤC LỤC
1 ĐỀ BÀI TẬP – ĐỀ SỐ 5 3
2 PHÂN TÍCH BÀI TOÁN – GIẢI TOÁN TRÊN EXCEL 6
2.1 Trình bày lại ví dụ 10 trang 172 và ví dụ 12 trang 181 Sách GT XSTK 2015 (N.Đ.HUY) 6
2.1.1 Ví dụ 10 trang 172 6
2.1.2 Ví dụ 12 trang 181 9
2.2 Bài tập 2 15
2.3 Bài tập 3 19
2.4 Bài tập 4 25
2.5 Bài tập 5 28
Trang 31 ĐỀ BÀI TẬP – ĐỀ SỐ 5
1.1 Trình bày lại ví dụ 10 trang 172 và ví dụ 12 trang 181 Sách GT XSTK
2015 (N.Đ.HUY)
1.1.1 Ví dụ 10/172: Hiệu suất phần trăm (%) của một phản ứng hóa học
được nghiên cứu theo 3 yếu tố: pH (A), nhiệt độ (B) và chất xúc tác (C) được trình bày trong bảng sau:
Thời gian (phút) X1 Thời gian (C) X2 Hiệu suất (%) Y
Trang 41.2 Một nông trường nuôi bò nuôi ba giống bò sữa A, B, C Lượng sữa của các
con bò này được thống kê trong bảng sau đây:
1.3 Hãy phân tích tình hình kinh doanh của một số ngành nghề ở quận 4 quận
nội thành trên cơ sở số liệu về doanh thu của một số cửa hàng như sau: Ngành nghề kinh
Điện lạnh
Vật liệu xây dựng
Dịch vụ tin học
2.5:2.7:2.0:3.0 0.6:10.4 1.2:1.0:9.8:1.8
3.1:3.5:2.7 15.0 2.0:2.2:1.8
2.0:2.4 9.5:9.3:9.1 1.2:1.3:1.2
5.0:5.4 19.5:17.5 5.0:4.8:5.2
1.4 Một nhóm gồm 105 nhà doanh nghiệp Mỹ được phân loại căn cứ theo thu
nhập hàng năm và tuổi của họ Kết quả thu được như sau:
Tuổi
Thu nhập Dưới
Trang 51.5 Sau đây là số liệu về số lượng một loại báo ngày bán được ở 5 quận nội
thành:
Thứ hai Thứ ba Thứ tư Thứ năm Thứ sáu Thứ bảy
Trang 62 PHÂN TÍCH BÀI TOÁN – GIẢI TOÁN TRÊN EXCEL
2.1 Trình bày lại ví dụ 10 trang 172 và ví dụ 12 trang 181 Sách GT XSTK 2015 (N.Đ.HUY)
2.1.1 Ví dụ 10/172: Hiệu suất phần trăm (%) của một phản ứng hóa học được nghiên cứu theo 3 yếu tố: pH (A), nhiệt độ (B) và chất xúc tác (C) được trình bày trong bảng sau:
B
A1 C1 9 C2 14 C3 16 C4 12 A2 C2 12 C3 15 C4 12 C1 10 A3 C3 13 C4 14 C1 11 C2 14 A4 C4 10 C1 11 C2 13 C3 13 Hãy đánh giá về ảnh hưởng của các yếu tố trên hiệu suất phản ứng?
BÀI LÀM PHƯƠNG PHÁP: Phân tích phương sai để đánh giá 3 yếu tố
Sự phân tích này được dùng để đánh giá về sự ảnh hưởng của ba yếu tố trên các giá trị quan sát
G(i= 1,2…r: yếu tố A; j=1,2…r: yếu tố B; k= 1,2…r: yếu tố C)
MÔ HÌNH: Khi nghiên cứu ảnh hưởng của các yếu tố, mỗi yếu tố có n mức, thì người
ta dung mô hình vuông la tinh nxn Ví dụ như mô hình vuông la tinh 4x4:
Mô hình vuông la tinh ba yếu tố được trình bày như sau:
Trang 7BẢNG ANOVA:
Trắc nghiệm:
Giả thiệt:
o Ho: µ1=µ2=…=µk ↔ Các giá trị trung bình bằng nhau
o H1: µi ≠ µj ↔ Có ít nhất hai giá trị trung bình bằng nhau
Giá trị thông kê: FR, FR, F
Biện luận
o Nếu FR<Fα(r-1)(r-2) → Chấp nhận Ho đối với yếu tố A
o Nếu FR<Fα(r-1)(r-2) → Chấp nhận Ho đối với yếu tố A
o Nếu FR<Fα(r-1)(r-2) → Chấp nhận Ho đối với yếu tố A
Trang 8 Dùng con trỏ kéo kí tự điền từ ô B8 đến ô E5
Dùng con trỏ kéo kí hiệu tự điềntừ ô G7 và ô G9
o Giá trị Ġ : Chọn ô G10 và nhập biểu thức =POWER(B10,2)
o Giá trị Ġ : Chọn ô G11 và nhập biểu thức =SUMSQ(B2:E5)
Tình các giá trị SSR, SSC, SSF, SST và SSE
o Các giá trị SSR, SSC và SSF biểu thức
Chọn ô I7 và nhâp biểu thức =G7/4-39601/POWER(4,2)
Dùng con trỏ kéo kí hiệu tự điền từ ô I7 và ô I9
o Các giá trị SST: Chọn ô I11 và nhập biểu thức =G11-G10/POWER(4,2)
o Các giá trị SSE: Chọn ô I10 và nhập biểu thức =I11- SUM(I7:I9)
Tính các giá trị MSR, MSC, MSF và MSE
o Các giá trị MSR, MSC và MSF
Chọn ô K7 và nhâp biểu thức =I7/(4-1)
Dùng con trỏ kéo kí hiệu điền từ ô K7 đến ô K9
o Giá trị MSE: Chọn ô K10 và nhâp biểu thức =I10/((4-1)*(4-2))
Trang 9Câu 2.2 Ví dụ 12/181: Người ta đã dùng ba mức nhiệt độ gồm 105, 120 và 135C kết hợp với ba khoảng thời gian là 12, 30 và 60 phút, để thực hiện mộ phản ứng tổng hợp Các hiệu suất của phản ứng (%) được trình bày trong bảng sau đây:
Thời gian (phút) X1 Thời gian (C) X2 Hiệu suất (%) Y
BÀI LÀM Phương pháp: Hồi quy tuyền tính đa tham số
Trong phương tình hồi quy tuyền tính đa tham số, biến số phụ thuộc Y có liên quan đến
k biến số độc lập Xi (i=1,2,…,k) thay vì chỉ có một như trong quy hồi quy tuyến tinh đơn giản
Giá trị thống
kê Hồi quy K SSR MSR=SSR/k F=MSR/MSE Sai số N-K-1 SSE MSE=SSS/(N-
K-1) Tổng cộng N-1 SST=SSR+SSE
Giá trị tống kê:
- Giá trị R-bình phương:
Trang 10- Độ lệch chuẩn
- Trắc nghiệm thông kê
o Giá trị thông kê: F
o Trắc nghiệm t:
H0 βi = 0 ↔ Các hệ số hồi quy không có ý nghĩa
H1 βi ≠ ↔ Có ít nhất vài hệ số hồi quy có ý nghĩa
o Trác nghiệm F:
H0 βi = 0 ↔ Phuơng trình hồi quy không thích hợp
H1 βi ≠ ↔ Phương trình hồi quy thích hợp với ít nhất vài hệ số Bi
Trang 11Trong hộp Regression, lần lượt ấn định các chi tiết :
o Phạm vị của biến X (Input X Range): $A$1:$A$10
o Phạm vị của biến Y (Input Y Range): $C$1:$C$10
o Nhãn dữ liệu (Labels)
o Mức tin cậy (Confidence Level)
o Đường hồi quy (Line Fit Plots), biểu thức sai số (Residuals)
Nhấn OK ta có bảng sau:
Trang 12 Phương trình hồi quy: ŶX1=f(X1)
Trang 13 Phương trình hồi quy: ŶX2=f(X2)
Vậy cả hai hệ số -11.14 (B0) và 0.13(B1) của phương trình hồi quy
ŶX2=-11.14+0.13X2 đều có ý nghĩa thống kê Hay phương trình hồi quy thích hợp
Kết luận: yếu tố nhiệt độ có liên quan tuyến tính với hiệu suất của phản ứng
tổng hợp
Cả 2 yếu tố nhiệt độ và thởi gian:
Trang 14 Phương trình hồi quy: ŶX1, X2=f(X1, X2)
ŶX1, X2= -12.7+ 0.04X1+ 0.13X2
T0 11.528 > t0.05=2.365
Bác bỏ giả thiết Ho
T1=7.583> t0.05=2.365
Trang 15 Bác bỏ giả thiết Ho
T2=14.328> t0.05=2.365
Bác bỏ giả thiết Ho F=131.395> F0.05=5.51
Chấp nhận giả thiết Ho Vậy cà hai hệ số -12.7 (Bo); 0.04(B1) và 0.13(B2) của phương trình hồi quy ŶX1, X2= -
12.7+ 0.04X1+ 0.13X2 đều có ý nghĩa thống kê Hay phương trình hồi quy thích hợp
Kết luận: Hiêu suất của phản ứng tổng hợp có liên quan tuyến tính với cả hai
yếu tố là nhiệt độ và thơi gian
Dự đoán hiệu suất của phản ứng tại nhiệt độ 115 o C và 50 phút:
Chọn ô B21 và nhập công thức: B1 7+B18*50+B19*115 được kết quả là:
4.310873
Bài 2: Một nông trường nuôi bò nuôn ba giống bò sữa A, B,C Lượng sữa của các
con bò được thống kê trong bảng sau đây:
Với mức ý nghĩa 𝜶 = 𝟎, 𝟎𝟓, hãy nhận định xem có phải ba giống bò này có
phân bố tỉ lệ như nhau về phương diện sữa hay không?
BÀI LÀM
Nhận xét: Đây là bài toán kiểm định giả thuyết vể tỷ lệ
Giải thuyết H 0: Tỷ lệ sữa của ba giống bò này có phân phân bố tỉ lệ như nhau
Trang 16GIẢI BÀI TOÁN BẰNG EXCEL
Nhập giá trị vào bảng tính:
Tính tổng các số:
Tổng hàng: Chọn E3, nhập =SUM(B3:D3), rồi Enter, dùng con trỏ kéo nút
tự điều khiển từ điền từ E4 đến E5
Tổng cột: Chọn B6, nhập =SUM(B3:B5), rồi Enter, dùng con trỏ kéo nút
Trang 18Bài 3 Với mức ý nghĩa 1%, Hãy phân tích tình hình kinh doanh của 1 số ngành nghề ở quận 4 quận nội thành trên cơ sở số liệu về doanh thu của 1 số cửa hàng như sau:
3.1:3.5:1.7 15.0 2.0:2.2:1.8
2.0:2.4 9.5:9.3:9.1 1.2:1.3:1.2
5.0:5.4 19.5:17.5 5.0:4.8:5.2
BÀI LÀM
Phương pháp: Phân tích phương sai 2 yếu tố ( có lặp)
Cơ sở lý thuyết:Trên thực một biến lượng chịu tác động không chỉ một
nhân tố mà có thể hai (hay nhiều nhân tố) Chẳng hạn năng suất cây trồng chịu ảnh hưởng của nhân tố giống và của nhân tố đất Kết quả học tập của một sinh viên chịu ảnh hưởng không những bởi nhân tố giảng viên mà còn bởi nhân tố sĩ số của lớp học
Trong mục này ta sẽ trình bày một cách vắn tắt kỹ thuật phân tích phương sai hai nhân tố nhằm phát hiện ảnh hưởng của mỗi nhân tố cũng như tác động qua lại của hai nhân tố đó đến biến lượng đang xét
Giả sử chúng ta quan tâm tới nhân tố A và B Nhân tố A được xem xét ở các mức
A1, A2, Ar, và nhân tố B được xem xét ở các nước B1, B2, Bc
Gọi Xjk là ĐLNN đo lường hiệu quả việc tác động của mức Aj và Bk lên cá thể Giả sử x1jk, x2jk, , xnjk là mẫu kích thước njk rút ra từ tập hợp chính các giá trị của Xjk Ta gọi đó là mẫu (j, k) Ta đưa ra một số ký hiệu sau:
xjk: trung bình của mẫu (j, k)
Trang 19Ta có bảng sau đây ghi các kết quả tính toán trên:
A
Trung bình dòng Aj
+ Tổng bình phương do sai số, ký hiệu là SSE, được tính theo công thức
+ Tổng bình phương do tương tác (Sum of Squares for Interaction) ký hiệu là SSI, được tính theo công thức
Trang 20+ Trung bình bình phương của nhân tố B, ký hiệu là MSFB’ được tính bởi công thức
B B
c – 1 gọi là bậc tự do của B bằng số mức của B trừ 1
+ Trung bình bình phương của sai số, ký hiệu là MSE, được tính bởi
n – cr gọi là bậc tự do của sai số
+ Trung bình bình phương của tương tác, ký hiệu là MSI, được tính bởi
M SF F
M SE
Tương tự tỷ số F cho nhân tố B, FB được tính bởi
B B
M SF F
M SE
Với mức ý nghĩa đã cho ta ký hiệu f (u, v) là phân vị mức của phân bố Fisher với bậc tự do (u, v)
Ta có quy tắc quyết định như sau:
+ Nếu FA> f (r – 1, n – cr) thì ta bác bỏ giả thiết
:
A
o
H “Các mức A1, Ar có hiệu quả trung bình như nhau”
+ Nếu FB> f (c – 1, n – cr) thì ta bác bỏ giả thiết:
Trang 21Trên thực hành tính toán chúng ta thực hiện như sau:
Giả sử Tjk là tổng các giá trị trong mẫu (j, k) Ký hiệu
jo 2
j 1 A
T T SSF
ok 2
k 1 B
T T SSF
Trang 22Giả thuyết:
-HA (yếu tố ngành nghề): doanh thu không phụ thuộc vào ngành nghề
-HB (yếu tố quận): doanh thu không phụ thuộc vào quận
-HAB(sự tương tác giữa 2 yếu tố): doanh thu giữ các ngành nghề và các quận không có liên quan tới nhau
Nhập dữ liệu vào bảng tính:
Áp dụng: “Anova: Two-Factor With Replication”
Vào Data -> Data Analysis Chọn mục Anova: Two-Factor With Replication
Chọn OK
Trong hộp thoại Anova: Two-Factor With Replication lần lượt ấn định các chi
tiết:
Trang 23 Phạm vi đầu vào (Input Range): $A$9:$E$21
Số hàng mỗi mẫu (Rows per sample): 4
Ngưỡng tin cậy (Alpha): 0.01 (mức ý nghĩa = 1%)
Phạm vi đầu ra (Output Range): $A$23
Nhấn OK Ta được bảng sau:
Trang 24Kết quả và biện luận:
Chấp nhận giả thuyết Ho (ngành nghề và địa điểm kinh doanh)
KẾT LUẬN: Vì vậy doanh thu cửa hàng trên phụ thuộc vào ngành nghề và địa
điểm kinh doanh, giữa ngành nghề kinh doanh và địa điểm kinh doanh có sự tương tác lẫn nhau
Trang 25Bài 4: Một nhóm gồm 105 nhà doanh nghiệp Mỹ được phân loại căn cứ theo thu nhập hằng năm và tuổi của họ.Kết quả thu được như sau:
Tuổi
Thu nhập Dưới
Từ 40 đến 54 18 19 8 Trên 54 11 12 17
Với mức ý nghĩa 1%, kiểm định giả thuyết cho rằng tuổi và mức thu nhậo không
có quan hệ với nhau
BÀI LÀM
Nhận xét: Đây là bài toán phân tích tính độc lập
Giả thiết: Mức thu nhập hàng năm và tuổi của các doanh nghiệp Mỹ không có
quan hệ với nhau
Thực hiện bài toán bằng MS-Excel
Trang 26 Tính tần số lý thuyết:
o Tần số lý thuyết = (Tổng hàm *Tổng cột)/Tổng cộng
o Chọn ô B8 nhập hàm =(B6*$E$3)/$E$6 rồi kéo hàm qua các ô C8,D8
o Chọn ô B9 nhập hàm =(B6*$E$4)/$E$6 rồi kéo hàm qua các ô C9,D9
o Chọn ô B10 nhập hàm =(B6*$E$5)/$E$6 rồi kéo hàm qua các ô C10, D10
Trang 27 Tính xác xuất P(X > χ2):
Chọn ô B11 nhập hàm =CHITEST(B3:D5, B8:D10)
Thu được giá trị của P(X > χ2)= 0.1438
Biện luận: Do P(X > χ2)= 0.1438 > 0.01 nên chấp nhận H0
Kết luận: Vậy mức thu nhập hang năm và tuổi của các doanh nghiệp Mỹ
không có quan hệ với nhau
Trang 28Bài 5 Sau đây là số liệu về số lượng một loại báo ngày bán được ở 5 quận nội thành:
Lượng báo bán được ở 5 quận có khác nhau thực sự không? Chọn = 2% Lượng báo bán ra có chịu tác động của các yếu tố ngày trong tuần không?
Trung bình yếu tố cột bằng nhau
Trung bình yếu tố hàng bằng nhau
Không có sự tương tác giữa yếu tố cột và hàng
Trang 302 Sử dụng bảng ANOVA: Two-factor without replication
Đối với Excel 2010 cần thực hiện các bước sau để mở hộp thoại Data
Analysis:
File > Options > Add-Ins > Analysis ToolPak > Go > Analysis
ToolPak > Ok
Hộp thoại Data Analysis sẽ xuất hiện trong Data
3 Thao tác trên hộp thoại Data Analysis
Trang 31Khi đó sẽ xuât hiện bảng giá trị như sau :
Kết luận:
- Rows: F =3.56723 > F0.02 =3.48166 => Bác bỏ giả thiết H0
- Columns: F=2.47479 < F0.02 =3.73125 => Chấp nhận giả thiết H0
=> Vậy chỉ có yếu tố ngày ảnh hưởng đến số lượng báo bán ra
Lượng báo bán ra ở năm quận không khác nhau