Hiệu suất phần trăm % của một phản ứng hóa học được nghiên cứu theo 3 yếu tố: pH A, nhiệt độ B và chất xúc tác C được trình bày trong bảng sau:... + Giả thiết H0: Các giá trị trung bình
Trang 1KHOA ĐIỆN – ĐIỆN TỬ
BÁO CÁO BÀI TẬP LỚN XÁC SUẤT – THỐNG KÊ
Giảng viên hướng dẫn: PGS.TS Nguyễn Đình Huy Sinh viên thực hiện: Lê Sỹ Hậu
MSSV: 41201040
Lớp: DD12LT03
Nhóm 4
TP Hồ Chí Minh, ngày 9/5/2012
Trang 3Nhóm 4 Trang 3
1
Ví dụ 3.4 (Trang 207 – SBT) Hiệu suất phần trăm (%) của một phản ứng hóa học
được nghiên cứu theo 3 yếu tố: pH (A), nhiệt độ (B) và chất xúc tác (C) được trình bày trong bảng sau:
Trang 4Giá trị thống kê
r i R
r
R R
E
MS F
r j C
r
C C
E
MS F
r k F
r
F F
E
MS F
SS
Sai số r1r2 SS E SS T SS F SS R SS C 1 2
E E
SS MS
+ Giả thiết H: Các giá trị trung bình bằng nhau
+ Giả thiết H0: Các giá trị trung bình khác nhau
Trang 5Nhóm 4 Trang 5
II Áp dụng
Giả thiết
+ Giả thiết H(pH): Độ pH không ảnh hưởng đến hiệu suất phản ứng
+ Giả thiết H(nhiệt độ): Nhiệt độ không ảnh hưởng đến hiệu suất phản ứng
+ Giả thiết H(xúc tác): Chất xúc tác không ảnh hưởng đến hiệu suất phản ứng
Trang 7Vậy chỉ có nhiệt độ và chất xúc tác ảnh hưởng đến hiệu suất của phản ứng
Ví dụ 4.2(Trang 216 - SBT) Người ta đã dùng ba mức nhiệt độ gồm 1050C, 1200C và
1350C kết hợp với ba khoảng thời gian là 15 phút, 30 phút và 60 phút để thực hiện một phản ứng tổng hợp Các hiệu suất phản ứng (%) được trình bày trong bảng sau đây:
Thời gian (phút) Nhiệt độ (0C)
Hiệu suất (%)
Trang 8Nhóm 4 Trang 8
I Cơ sở lý thuyết
Trong phương trình hồi quy tuyến tính đa tham số, biến số phụ thuộc Y có liên quan
k biến số độc lập 𝑋𝑖 (𝑖=1,2,,…𝑘) thay vì chỉ có một như trong hồi quy tuyến tính đơn giản
Giá trị thống
kê Hồi
Trang 9Nhóm 4 Trang 9
+ H: 𝛽𝑖=0 “Hệ số hồi quy không có ý nghĩa”
+ H0: 𝛽𝑖≠0 “Hệ số hồi quy có ý nghĩa”
2
n
i
S S
+ H: 𝛽𝑖=0 “Phương trình hồi quy không thích hợp”
+ H0: 𝛽𝑖≠0 “Phương trình hồi quy thích hợp”
Giá trị thống kê
E
MS F
Trang 11Nhóm 4 Trang 11
Hình 1.6 - Regression
Bấm OK ta được kết quả như Hình 1.7
(Trang kế)
Trang 12Vậy phương trình hồi quy này không thích hợp, yếu tố thời gian không liên
quan tuyến tính với hiệu suất phản ứng
Trang 18Nhóm 4 Trang 18
2 Để so sánh chi phí quảng cáo trên bốn tờ báo khác nhau (với các điều kiện quảng cáo
như nhau), người ta đã lấy mẫu 7 lần quảng cáo trên mỗi tờ báo và thu được các kết quả sau (đơn vị: ngàn đồng):
Báo A 57 65 50 45 70 62 48 Báo B 72 81 64 55 90 38 75 Báo C 35 42 58 59 46 60 61 Báo D 73 85 92 68 82 94 66
Hãy tìm P-value để kiểm định xem có sự khác biệt về chi phí quảng cáo giữa các tờ báo nói trên hay không
I Cơ sở lý thuyết
Phân tích phương sai một yếu tố
Sự phân tích này nhằm đánh giá sự ảnh hưởng của một yếu tố trên các giá trị quan sát Yi (i = 1,2, ,k)
Mô hình
Yếu tố thí nghiệm
…
… Tổng cộng
Trung bình ̅ ̅̅̅
…
T ̅
Trang 19Nhóm 4 Trang 19
Bảng ANOVA
Giả thiết
- H: Các giá trị trung bình bằng nhau
- H0:Có ít nhất có hai giá trị trung bình khác nhau
+ Giả thiết H: Chi phí quảng cáo giữ các tờ báo là như nhau
+ Giả thiết H0: Chi phí quảng cáo giữ các tờ báo là khác nhau
Giá trị thống kê
SS MS
k
E E
SS MS
n k
Tr E
MS F MS
Tổng cộng nk 1 ij
1 1
k n T
Trang 20Nhóm 4 Trang 20
Hình 2.1 - Bảng số liệu
2 Sử dụng “Anova: Single Factor”
Vào Data, chọn Data Analysis, chọn Anova: Single Factor, rồi bấm OK
Hình 2.3 – Data Analysis
Trong hộp thoại Anova: Single Factor, nhập các thông số như Hình 2.3
- Input Range: $A$1:$H$4
- Alpha: 0,05
- Group by: Rows
- Output options: tích vào New Worksheet Ply
Hình 2.3 (Trang kế)
Trang 21Nhóm 4 Trang 21
Hình 2.3 – Anova: Single Factor
Ta được kết quả như như Hình 2.4
Hình 2.4 – Bảng kết quả
Trang 23Nhóm 4 Trang 23
3 Trong một thí nghiệm khoa học, người ta nghiên cứu độ dày của lớp mạ kền khi
dùng ba loại bể mạ khác nhau Sau một thời gian mạ, người ta đo độ dày của lớp mạ nhận được ở các bể như sau:
Trang 242( ) (h 1)(k 1)
P Biện luận
- Nếu 2
0
2( ) (h 1)(k 1)
hoặc 2
0
2( ) (h 1)(k 1)
P thì X và Y độc lập với nhau
II Áp dụng
Giả thiết H: Độ dày lớp mạ phụ thuộc vào loại bể mạ đang dùng
Giả thiết H0: Độ dày lớp mạ không phụ thuộc vào loại bể mạ đang dùng
1 Nhập bảng số liệu như Hình 3.1
Hình 3.1 – Bảng số liệu
2 Ta tính các tổng như Hình 3.2
(Trang kế)
Trang 25P
Trang 26Nhóm 4 Trang 26
Hình 3.4 – Giá trị 2
0
2( ) (h 1)(k 1)
P = 8,67391E-06 < 0, 05Bác bỏ giả thiết H0
Vậy, độ dày lớp mạ kền phụ thuộc vào bể mạ được dùng
Trang 27Nhóm 4 Trang 27
4 Với mức ý nghĩa 3%, hãy phân tích vai trò ngành nghề (chính, phụ) trong hoạt động kinh tế của các hộ gia đình ở một vùng nông thôn trên cơ sở bảng số liệu về thu nhập trung bình của một hộ tương ứng với các ngành nghề như sau:
Nghề chính Nghề phụ
(1) (2) (3) (4) Trồng lúa (1)
Trồng cây ăn quả (2)
Chăn nuôi (3) Dịch vụ (4)
3.5 5.6 4.1 7.2
7.4 4.1 2.5 3.2
8.0 6.1 1.8 2.2
3.5 9.6 2.1 1.5
I Cơ sở lý thuyết
Đây là dạng toán so sánh phương sai hai yếu tố không lặp
Sự phân tích này nhằm đánh giá sự ảnh hưởng của hai yếu tố trên các giá trị quan sát
Yij (i=1,2,…,r: yếu tố A; j=1,2,…,c: yếu tố B)
…
Trang 28
Nhóm 4 Trang 28
Giả thiết
+ Giả thiết H: Các giá trị trung bình bằng nhau
+ Giả thiết H0: Các giá trị trung bình khác nhau
+ Giả thiết H(hàng): các ngành, nghề chính đều có vai trò ngang nhau
+ Giả thiết H0(hàng): các ngành, nghề chính có vai trò khác nhau
+ Giả thiết H(cột): các ngành, nghề phụ đều có vai trò ngang nhau
+ Giả thiết H0(cột): các ngành, nghề phụ có vai trò khác nhau
Nguồn sai
số Bậc tự do Tổng số bình phương
Bình phương trung bình Giá trị thống kê Yếu tố A
i
T T SS
SS MS
r
R R
E
MS F
SS MS
Trang 29Nhóm 4 Trang 29
1 Nhập bảng số liệu như Hình 4.1
Hình 4.1 – Bảng số liệu
2 Áp dụng Anova: Two-Factor Without Replication
Chọn các thông số cho hộp thoại Anova: Two-Factor Without Replication như
Hình 4.2
Hình 4.2 – Anova: Two-Factor Without Replication
Bấm OK ta được kết quả như Hình 4.3
(Trang kế)
Trang 31Nhóm 4 Trang 31
5 Hàm lượng Saponin (mg) của cùng một loại dược liệu được thu hái trong hai mùa
khô và mưa, trong mỗi mùa lấy mẫu ba lần: đầu, giữa và cuối, và từ ba miền: bắc, trung
và nam, và được tóm tắt như bảng sau:
Mùa Thời điểm
Miền Nam Trung Bắc Mùa khô
Đầu mùa 2.4 2.1 3.2 Giữa mùa 2.4 2.2 3.2 Cuối mùa 2.5 2.2 3.4 Mùa mưa
Đầu mùa 2.5 2.2 3.4 Giữa mùa 2.5 2.3 3.5 Cuối mùa 2.6 2.3 3.5
Hãy cho biết hàm lượng Saponin có khác nhau theo mùa hay miền không Nếu có thì hai yếu tố mùa và miền có sự tương tác với nhau hay không
I Cơ sở lý thuyết
Đây là bài toán phân tích phương sai hai yếu tố có lặp
Tương tự phân tích phương sai hai yếu tố không lặp, chỉ là mỗi mức (𝐴1, 𝐵1) có lặp lại
k lần thí nghiệm,mỗi hàng sẽ biểu thị một bản sao của dữ liệu và ở đầu ra sẽ thêm một đại lượng tương tác F1 giữa hai yếu tố A và B
II Áp dụng
Giả thiết
+ H(mùa): Hàm lượng Saponin là như nhau theo mùa
+ H(miền): Hàm lượng Saponin là như nhau theo miền
+ H(mùa-miền): Hai yếu tố mùa và miền không có sự tương tác với nhau
1 Nhập bảng dữ liệu như Hình 5.1
(Trang kế)
Trang 32Nhóm 4 Trang 32
Hình 5.1 – Bảng dữ liệu
2 Áp dụng Aova: Two-Factor With Replication
Ta chọn các thông số tại hộp thoại Aova: Two-Factor With Replication như Hình
Trang 33Nhóm 4 Trang 33
Hình 5.3 – Bảng kết quả Biện luận
+ F R 16F0,05 4, 7472 Bác bỏ giả thiết H(mùa)
+ F C 434, 7778F0,05 3,8853 Bác bỏ giả thiết H(miền)
+ F Interaction 1 F0,053,8853 Chấp nhận giả thiết H(mùa-miền)
Vậy chúng ta chắc chắn 95% rằng hàm lượng Saponin trong dược liệu được khảo sát khác nhau theo mùa và khác nhau theo miền, và không có sự tương tác giữa hai yếu tố mùa và miền trên hàm lượng ấy