Đề bài : Hiệu suất phần trăm % của một phản ứng hóa học được nghiên cứu theo 3 yếu tố: pH A, nhiệt độ B và chất xúc tác C được trình bày trong bảng sau: Hãy đánh giá về ảnh hưởng của các
Trang 1ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍNH MINH
TRƯỜNG ĐẠI HỌC BÁCH KHOA
………⁂………
BÁO CÁO BÀI TẬP LỚN
MÔN XÁC SUẤT THỐNG KÊ
Sinh viên : Trần Thị Ngọc Phượng MSSV : 1914789
Nhóm 7 - Lớp: L15
Trang 2MỤC LỤC
CÂU 1A: 3
1 Đề bài : 3
2 Dạng bài: Phân tích phương sai 3 yếu tố 3
3 Cơ sở lý thuyết: 3
4 Giải toán bằng phần mềm IBM SPSS 4
CÂU 1B: 8
1 Đề bài: 8
2 Dạng bài: hồi quy tuyến tính đa tham số 9
3 Cơ sở lí thuyết: 9
4.Giải toán bằng phần mềm IBM SPSS 10
CÂU 2: 19
1 Đề bài: 19
2 Dạng bài: Phân tích phương sai 1 yếu tố 19
3 Cơ sở lý thuyết: 19
4 Giải bài toán bằng phần mềm EXCEL 19
CÂU 3: 20
1 Đề bài: 20
2 Dạng bài: Kiểm định tính độc lập 21
3 Cơ sở lý thuyết: 21
4 Giải toán bằng phần mềm EXCEL 21
CÂU 4: 24
1 Đề bài: 24
2 Dạng bài: Kiểm định về phân bố 25
3 Cơ sở lý thuyết: 25
4 Giải toán bằng phần mềm EXCEL 25
CÂU 5 28
1 Đề bài: 28
2 Dạng bài: Phân tích phương sai 2 yếu tố không lặp 28
3 Cơ sở lý thuyết: 28
4 Giải toán bằng phần mềm EXCEL 28
2
Trang 3BÀI TẬP LỚN SỐ 7:
CÂU 1A:
1 Đề bài :
Hiệu suất phần trăm (%) của một phản ứng hóa học được nghiên cứu theo 3 yếu tố:
pH (A), nhiệt độ (B) và chất xúc tác (C) được trình bày trong bảng sau:
Hãy đánh giá về ảnh hưởng của các yếu tố trên hiệu suất phản ứng
2 Dạng bài: Phân tích phương sai 3 yếu tố
3 Cơ sở lý thuyết:
- Sự phân tích này được dùng để đánh giá về sự ảnh hưởng của 2 yếu tố trên các giá trị
quan sát G (i=1, 2, ….r: yếu tố A; j=1, 2, ….r: yếu tố B; k=1, 2, ….r: yếu tố C)
- Mô hình:
Khi nghiên cứu ảnh hưởng của hai yếu tố, mỗi yếu tố có n mức, thì người ta dùng mô
hình vuông la tinh n x m Ví dụ mô hình vuông la tinh 4 x 4.
Trang 4⬄ “Các giá trị trung bình bằng nhau”
⬄ “Có ít nhất hai giá trị trung bình khác nhau”
4 Giải toán bằng phần mềm IBM SPSS
Bước 1: Đặt giả thiết:
H1: Hiệu suất phản ứng trung bình của các phản ứng không phụ thuộc vào pH (Yếu tố pHkhông ảnh hưởng đến hiệu suất phản ứng trung bình)
: Tồn tại 2 pH có hiệu suất phản ứng trung bình khác nhau
H2: Hiệu suất phản ứng trung bình của các phản ứng không phụ thuộc vào nhiệt độ (Yếu
tố nhiệt độ không ảnh hưởng đến hiệu suất phản ứng trung bình)
: Tồn tại 2 nhiệt độ có hiệu suất phản ứng trung bình khác nhau
Trang 54
Trang 6H3: Hiệu suất phản ứng trung bình của các phản ứng không phụ thuộc vào chất xúc tác (Yếu tố chất xúc tác không ảnh hưởng đến hiệu suất phản ứng trung bình).
: Tồn tại 2 chất xúc tác có hiệu suất phản ứng trung bình khác nhau
Bước 2: Khai báo biến dữ liệu trong cửa sổ Varible view:
Bước 3: Nhập số liệu vào cửa sổ Data view:
Bước 4: Chọn Analyze → General Linear Model → Univariate
5
Trang 7Bước 5: Đưa biến Hieusuatphanung vào khung Dependent Variable; đưa các biến pH, Nhietdo và Chatxuctac vào khung Fixed Factor(s).
Trang 8Bước 6: Chọn Model → Build terms → đưa các biến pH, Nhietdo và Chatxuctac vào
khung Model → Continue
Bước 7: Chọn Options, nhập mức ý nghĩa ở ô Significance level = 0,05 → Continue.
Bước 8: Kết quả và biện luận.
7
Trang 9- Dò bảng phân phối Fischer ở mức ý nghĩa 5% với bậc tự do [ 2)]=(3;6) ta được F 0,05 (3;6)=4,76 ( dò bảng VIII trang 201 Giáo trình với n 1 =3,
(r-1);(r-1)(r-n 2 =6)
- Bảng Test of Between-Subjects Effects cho ta kết quả:F0,05(3;6)=4,76
Bước 9: Kết luận:
- Yếu tố pH không ảnh hưởng đến hiệu suất phản ứng trung bình
- Tồn tại 2 nhiệt độ có hiệu suất phản ứng trung bình khác nhau
- Tồn tại 2 chất xúc tác có hiệu suất phản ứng trung bình khác nhau
CÂU 1B:
1 Đề bài:
Người ta đã dùng ba mức nhiệt độ gồm 105, 120, 135℃ kết hợp với bakhoảng thời gian là 15, 30 và 60 phút để thực hiện một phản ứng tổnghợp Các hiệu suất của phản ứng (%) được trình bày trong bảng sauđây:
Thời gian (phút) X1 Nhiệt độ (℃) X2 Hiệu suất (%) Y
Trang 1060 135 7.26
Hãy cho biết yếu tố nhiệt độ và/hoặc yếu tố thời gian có liên quantuyến tính với hiệu suất của phản ứng tổng hợp? Nếu có thì điển kiệnnhiệt độ 115℃ trong vòng 50 phút thì hiệu suất phản ứng sẽ là baonhiêu?
2 Dạng bài: hồi quy tuyến tính đa tham số
3 Cơ sở lí thuyết:
Chúng ta xem xét mối liên hệ tuyến tính giữa một biến phụ thuộc Y vàcác biến độc lập Xi (i = 1, 2, k) Đồ thị phân tán giữa các biến là mộtgợi ý cho chúng ta loại hàm số toán học thích hợp để mô tả và tóm tắtcác dữ liệu quan sát
Giá R2được hiệu chỉnh( Adjusted R Square)
Giá trị được R2 hiệu chỉnh (Adjusted R Square)
(R2ii sẽ trở nên âm hay không xác định nếu R2 hay N nhỏ )
Độ lệch chuẩn:
(S≤ 0,30 là khá tốt)
Trắc nghiệm thống kê:
Đối với một phương trình hồi quy YX=B0 +BX, ý nghĩa thống kê của các hệ
số Bi (B0 hay B) được đánh giá bằng trắc nghiệm t (phân phối Student) trong
khi tính chất thích hợp của phương trình YX=f(X) được đánh giá bằng trắcnghiệm F (phân bố Fischer)
Trắc nghiệm t:
- Giả thiết:
“Các hệ số hồi quy không có ý nghĩa”
Trang 119
Trang 12“Có ít nhất vài hệ số hồi quy có ý nghĩa”
“Phương trình hồi quy không thích hợp”
“Phương trình hồi quy thích hợp” với ít nhất vài Bi
Giá trị thống kê: F=
Phân bố Fischer v1=k, v2= N k
Nếu F< Fα(k, N−k−1) →Chấp nhận giả thiết H0
4.Giải toán bằng phần mềm IBM SPSS
Bước 1: Đặt giả thiết:
H: “Hệ số tự do và hệ số góc không có ý nghĩa thống kê”
: “Hệ số tự do và hệ số góc có ý nghĩa thống kê”
H0: “Phương trình hồi quy không thích hợp”
: “Phương trình hồi quy là thích hợp”
Bước 2: Khai báo biến dữ liệu trong cửa sổ Variable View.
10
Trang 13Bước 3: Nhập số liệu vào cửa sổ Data View:
Bước 4: Chọn Analyze → Regression → Linear Regression
Bước 5: Hộp thoại Linear Regression hiện lên, nếu:
+ Tìm phương trình YX1=f(X1), ta đưa biến phụ thuộc Y vào ô Dependent, biến độc lập
X1, vào ô Independent(s).
Trang 14+ Tìm phương trình YX2=f(X2), ta đưa biến phụ thuộc Y vào ô Dependent, biến độc lập
X2, vào ô Independent(s).
+ Tìm phương trình , ta đưa biến phụ thuộc Y vào ô Dependent, biến
độc lập X1, X2 vào ô Independent(s).
12
Trang 15Bước 6: Chọn Statistics → click chọn R squared change và Descriptives…
→Continue Với mức ý nghãi mặc định là 0,05 chọn OK
Bước 7: Vẽ đồ thị: trong cửa sổ Output chọn Graphs → Legacy Dialogs
→ Scatter/Dot → Simple Scatter →Define
Trang 16Bước 8: Chọn biến tương ứng hai trục X, Y→OK
14
Trang 17B ước 9: Kết quả và biện luận:
*Phương trình hồi quy: :YX1=f(X1)
Trang 18Dựa vào bảng Coefficientsa, cột B ta xác định được các hệ số : B0=2,73 và B1=0,045Suy ra phương trình hồi quy:
Dò bảng phân phối Fischer ở mức ý nghĩa 5% với bậc tự do (1; N-k-1) = (1; 7) (N = 9 và
k = 1 là số biến độc lập), ta được F0.05(1;7) = 5,59
Dò bảng phân phối Student ở mức ý nghĩa 5% với bậc tự do (N-k-1) = 7 (N = 9 và k = 1
là số biến độc lập), ta được t0.025 = 2,365
t0 = 2,129 < t0,025 = 2,365 (Hay Sig = 0,071 > = 0,05) → Chấp nhận giả thiết H
t1 =1,381 < t0,025 = 2,365 (Hay Sig = 0,21 > = 0,05) → Chấp nhận giả thiết H F
= 1,908 < F0,05 = 5,59 (Hay Sig = 0,21 > = 0,05) → Chấp nhận giả thiết H0
Kết luận:
- Vậy các hệ số 2,37(B0); 0,045(B1) của phương trình hồi quy YX1=2,73+0,045X1 đều không có ý nghĩa thống kê
- Phương trình hồi quy không thích hợp
- Yếu tố thời gian không có liên quan tuyến tính với hiệu suất của phản ứng tổng hợp
*Phương trình hồi quy: YX2=f(X2)
16
Trang 19Dò bảng phân phối Student ở mức ý nghĩa 5% với bậc tự do (N-k-1) = 7 (N = 9 và k = 1
là số biến độc lập), ta được t0.025 = 2,365
t0 = 3,415 > t0,025 = 2,365 (Hay Sig.= 0,011 < = 0,05) → Bác bỏ giả thiết H
t1 =4,754 > t0,025 = 2,365 (Hay Sig.= 0,002 < = 0,05) → Bác bỏ giả thiết H
F = 22,598 > F0,05 = 5,59 (Hay Sig.= 0,002 < = 0,05) → Bác bỏ giả thiết H0
Kết luận:
- Vậy các hệ số -11,14 (B0); 0,13 (B2) của phương trình hồi quy
Trang 20YX2 = -11,14 + 0,13X2 đều có ý nghĩa thống kê.
- Phương trình hồi quy này thích hợp
- Yếu tố nhiêt độ có liên quan tuyến tính với hiệu suất của phản ứng tổng hợp
*Phương trình hồi quy:
Dựa vào bảng Coefficientsa, cột B ta xác định được các hệ số:B0= -12,7 và B1= 0,045 vàSuy ra phương trình hồi quy:
Dò bảng phân phối Fischer ở mức ý nghĩa 5% với bậc tự do (2; N-k-1) = (2; 6) (N = 9 và
k = 2 là số biến độc lập), ta được F0.05(2;6) = 5,14
Dò bảng phân phối Student ở mức ý nghĩa 5% với bậc tự do (N-k-1) = 6 (N = 9 và k = 2
là số biến độc lập), ta được t0.025 = 2,447
t0 = 11,519 > t0,025 = 2,447 (Hay Sig.= 0,000026 < = 0,05) → Bác bỏ giả thiết H
t1 = 7,582 > t0,025 = 2,447 (Hay Sig = 0,000274 < = 0,05) → Bác bỏ giả thiết H
t2 = 14,328 > t0,025 = 2,447 (Hay Sig = 0,000007 < = 0,05) → Bác bỏ giả thiết H
F = 131,204 > F0,05 = 5,14 (Hay Sig.= 0,000011 < = 0,05) → Bác bỏ giả thiết Ho
Trang 21- Hiệu suất suất của phản ứng tổng hợp có liên quan tuyến tính với cả hai yếu tố là nhiệt độ và thời gian.
- Hiệu suất phản ứng trong điều kiện nhiệt độ 115℃ trong vòng 50 phút là:
CÂU 2:
1 Đề bài:
Một nhà nông học tiến hành việc kiểm định hiệu quả của ba loại phân này trên các cây cà chua và theo dõi số quả cà chua mọc trên mỗi cây, kết quả thu được như sau:
4 Giải bài toán bằng phần mềm EXCEL Bước 1: Đặt giả thiết:
H0: Số quả cà chua mọc trung bình khi bón 3 loại phân A, B, C là bằng nhau
H1: Tồn tại 2 loại phân khi bón có số quả cà chua mọc trung bình khác nhau
Bước 2: Nhập bảng số liệu:
Bước 3: Chọn Data → Data Analysis → Anova: Single – Factor
Trang 2219
Trang 23Bước 4: Input range: quét vùng số liệu, Grouped By: Rows, Anpha: 0,05, chọn labels in
first Column, Ouput range: chọn địa chỉ ô cần xuất dữ liệu → OK
Bước 5: Kết quả và biện luận.
F = 3,8557 < Fcrit = 4,2565 (hay P-value = 0,0617 > = 0,05) → Chấp nhận giả thiết H 0
Bước 6: Kết luận: - Số quả cà chua mọc trung bình khi bón 3 loại phân A, B, C là
Trang 24Với mức ý nghĩa 3%, nhận định xem số liệu có mối quan hệ giữa màu tóc và giới tính hay không?
2 Dạng bài: Kiểm định tính độc lập
3 Cơ sở lý thuyết:
4 Giải toán bằng phần mềm EXCEL Bước 1: Đặt giả thiết:
H0: Màu tóc và giới tính độc lập với nhau
H1: Màu tóc và giới tính phụ thuộc nhau
Bước 2: Nhập bảng số liệu:
Bước 3: Tính tổng hàng, tổng cột:
Quét bảng số liệu dư 1 hàng 1 cột:
Vào Formulas → chọn Autosum
Kết quả:
Bước 3: Lập bảng tần số lý thuyết:
21
Trang 25Tần số lý thuyết được tính theo công thức:
Trang 26Gõ CHITEST vào thanh tìm kiếm hàm → Go
Chọn hàm CHITEST → OK
23
Trang 27Actual_Range: quét vùng số liệu đề bài, Expected_Range: quét vùng tần số lý thuyết → OK
Bước 5: Kết quả và biện luận:
p-value = 0,0002 < α=0,03 → Bác bỏ giả thiết H 0
Bước 6: Kết luận: - Màu tóc và giới tính có mối quan hệ với nhau.
Trang 282 Dạng bài: Kiểm định về phân bố
3 Cơ sở lý thuyết:
4 Giải toán bằng phần mềm EXCEL Bước 1: Đặt giả thiết:
H0: Phân bố tỷ lệ về các ý kiến giữa các tầng lớp là như nhau
H1: Tồn tại 2 tầng lớp có phân bố tỷ lệ về các ý kiến là khác nhau
Bước 2: Nhập bảng số liệu:
Bước 3: Lập bảng tần số lý thuyết:
ổ ộ × ổ ℎà
Tần số lý thuyết được tính theo công thức: TSLT= ổ ộ
Quét 12 ô có chứa các giá trị tần số lý thuyết cần tìm:
Sử dụng tổ hợp phím F2 + (Ctrl Enter)
25
Trang 29Kết quả:
Bước 4: Tính P – Value:
Vào Formulas → chọn Insert Function
Gõ CHITEST vào thanh tìm kiếm hàm → Go
Trang 30Chọn hàm CHITEST → OK
Actual_Range: quét vùng số liệu đề bài, Expected_Range: quét vùng tần số lý thuyết
→ OK
Bước 5: Kết quả và biện luận
Bước 6: Kết luận: - Không có sự khác nhau về ý kiến trong các tầng lớp xã hội
trên
27
Trang 31CÂU 5
1 Đề bài:
Với mức ý nghĩa 2%, hãy phân tích vai trò ngành nghề (chính, phụ) trong hoạt động kinh
tế của các hộ gia đình ở một vùng nông thôn trên cơ sở bảng số liệu về thu nhập trungbình của mỗi hộ trong vùng với các ngành nghề trên như sau:
4 Giải toán bằng phần mềm EXCEL
Bước 1: Đặt giả thiết:
H1: Thu nhập trung bình của các hộ trong vùng không phụ thuộc vào nghề chính
: Tồn tại 2 nghề chính có thu nhập trung bình của các hộ trong vùng khác nhau
H2: Thu nhập trung bình của các hộ trong vùng không phụ thuộc vào nghề phụ
: Tồn tại 2 nghề phụ có thu nhập trung bình của các hộ trong vùng khác nhau
Bước 2: Nhập bảng số liệu
Bước 3: Chọn Data → Data Analysis → Anova: Two-Factor Without Replication
Trang 32Bước 4: Input range: quét vùng số liệu, chọn Labels, Anpha: 0,02, Ouput range: chọn địa
chỉ ô cần xuất dữ liệu → OK
Bước 5: Kết quả và biện luận:
FRows = 1,9966 < Fcrit = 5,5097→ Chấp nhận giả thiết H 1
FColumns = 0,1106 < Fcrit = 5,5097→ Chấp nhận giả thiết H 2
Bước 6: Kết luận:
- Thu nhập trung bình của các hộ trong vùng không phụ thuộc vào nghề chính
- Thu nhập trung bình của các hộ trong vùng không phụ thuộc vào nghề phụ
29