H 1: Có ít nhất hai giá trị trung bình của ba yếu tố pH A, nhiệt độ B và chất xúc tác C khác nhau.. Ta tiến hành phân tích phương sai ba yếu tố trên và dựa trên bảng ANOVA để kết luận ản
Trang 1BÁO CÁO BÀI TẬP LỚN MÔN XÁC SUẤT THỐNG KÊ
HỌC KỲ HÈ 2012
Mục lục:
Bài 1:
Ví dụ 3.4: 02
Ví dụ 4.2: 04
Bài 2: 11
Bài 3: 13
Bài 4: 16
Bài 5: 20
Trang 2Bài 1: Trình bài lại ví dụ 3.4 trang 207 và ví dụ 4.2 trang 216 sách bài tập Xác suất thống kê 2012
(Nguyễn Đình Huy)
Ví dụ 3.4: Hiệu suất phần trăm (%) của một phản ứng hóa học được nghiên cứu theo 3 yếu tố: pH
(A), nhiệt độ (B) và chất xúc tác (C) được trình bày trong bảng sau:
H 0: Các giá trị trung bình của ba yếu tố pH (A), nhiệt độ (B) và chất xúc tác (C) bằng nhau
H 1: Có ít nhất hai giá trị trung bình của ba yếu tố pH (A), nhiệt độ (B) và chất xúc tác (C) khác nhau
Ta tiến hành phân tích phương sai ba yếu tố trên và dựa trên bảng ANOVA để kết luận ảnh hưởng
của các yếu tố đến hiệu suất của phản ứng
Trang 3Yếu tố C r - 1 SSF = MSF = SSF / (r - 1) F = MSF / SSE
Tổng
Giải toán trên Excel:
Nhập dữ liệu vào bảng như sau:
Trang 4Dùng con trỏ kéo kí hiệu tự điền từ ô M7 đến ô M9
Kết quả và biện luận:
FR = 3,1 < F0.05(3.6) =4,76 => Chấp nhận H0 (pH)
Fc = 11,95 < F0.05(3.6) =4,76 => Bác bỏ H0 (Nhiệt độ)
F = 30,05 < F0.05(3.6) =4,76 => Bác bỏ H0 (Chất xúc tác)
Vậy chỉ có nhiệt độ và chất xúc tác gây ảnh hưởng tới hiệu suất.
Ví dụ 4.2: Người ta dung ba mức nhiệt độ gồm 105, 120 và 135 oC kết hợp với ba khoảng thời gian là
15, 30 và 60 phút để thực hiện một phản ứng tổng hợp Các hiệu suất của phản ứng (%) được trình bày trong bảng sau đây:
Trang 5Hãy cho biết yếu tố nhiệt độ hoặc yếu tố thời gian có liên quan tính tuyến với hiệu suất của phản ứng tổng hợp? Nếu có thì điều kiện nhiệt độ 115 o C trong vòng 50 phút thì hiệu suất phản ứng sẽ là bao nhiêu?
Bài làm:
H 0: Phương trình hồi quy không thích hợp
H 1: Phương trình hồi quy thích hợp
Ta tìm phương trình hồi quy tính tuyến đa tham số để chỉ ra sự phụ thuộc hoặc không phụ thuộc giữa yếu tố thời gian (X1) và nhiệt độ (X2) với hiếu suất phản ứng tổng hợp (Y)
Phương trình tổng quát cho biến phụ thuộc Y có liên quan đến k biến số độc lập Xi (i=1,2, ,k):
B0 + B1X1 + B2X2 + … + BkXkBảng ANOVA:
Nguồn sai
Giá trị R 2 được hiệu chỉnh (Adjusted R Square)
Trang 6Sử dụng Regression: Data -> Data Analysis
Trong cửa sổ Data Analysis chọn Regression:
Trang 7Hồi quy theo Thời gian (X1):
Các thông số:
- Input Y Range: Phạm vi biến số Y
- Input X Range: Phạm vi biến số X
- Labels: Dữ liệu bao gồm nhãn
- Confidence Level: Mức tin cậy (chọn 95%)
- Output options: Chọn New Worksheet Ply (Xuất kết quả ở sheet Thời gian)
Kết quả:
Trang 8Phương trình hồi quy:
Y X1 = f(X 1 ) = 2.7667 + 0.0445X 1 với R2 = 0.2139 và S = 1.8112
t0 = 2.1290 < t0.05 = 2.365 (tra bảng VII với n = 7, α = 0.025) hay = 0.0708 > α = 0.05
t1 = 1.3802 < t0.05 = 2.365 hay PV = 0.2100 > α = 0.05
F = 1.9049 < = 5.590 (tra bảng VIII với n1 = 1 và n2 = 7) hay = 0.2100 > α = 0.05
Vậy phương trình hồi quy trên không có ý nghĩa thống kê
Kết luận: Yếu tố thời gian không có liên quan tính tuyến với hiệu suất của phản ứng tổng hợp.
Hồi quy theo Nhiệt độ (X2):
Kết quả:
Trang 9Phương trình hồi quy:
Vậy phương trình hồi quy trên có ý nghĩa thống kê
Kết luận: Yếu tố nhiệt độ có liên quan tính tuyến với hiệu suất của phản ứng tổng hợp.
Hồi quy theo Thời gian (X1) và Nhiệt độ (X2):
Kết quả:
Trang 10Phương trình hồi quy:
Y X1, X2 = f(X 1 ,X 2 ) = -12.7000 + 0.0445X 1 + 0.1286X 2 với R2 = 0.9777 và S = 0.3297t0 = 11.5283 > t0.05 = 2.365 hay = 2.5607E-05 < α = 0.05
t1 = 7.5827 > t0.05 = 2.365 hay PV = 0.0003 < α = 0.05
t2 = 14.3278 > t0.05 = 2.365 hay PV = 7.2338E-6 < α = 0.05
F = 131.3921 > F0.05 = 5.140 (tra bảng VII với n1 = 2 và n2 = 6) hay FS = 0.0021 < α = 0.05
Vậy phương trình hồi quy trên có ý nghĩa thống kê
Kết luận: Hiệu suất phản ứng có liên quan tính tuyến với cả hai yếu tố là thời gian và nhiệt độ.
Trang 11Vẽ biểu đồ: chọn ô C2, vào Insert -> Scatter -> Scatter with only Maker
Sự tính tuyến của phương trình hồi quy Y X1, X2 = -12.7000 + 0.0445X 1 + 0.1286X 2 có thể được trình
bày trên biểu đồ phân tán:
Dự đoán hiệu suất của phản ứng bằng phương trình hồi quy tại nhiệt thời gian (X1) 50 phút, nhiệt độ
Trang 12Bài 2: Một nghiên cứu được tiến hành ở thành phố công nghiệp X để xác định tỷ lệ
những người đi làm bằng xe máy, xe đạp và buýt Việc điều tra được tiến hành trên hai nhóm Kết quả như sau:
O i - các tần số thực nghiệm (observed frequency)
E i - các tần số lý thuyết (expected frequency)
Biện luận:
Giá trị tính theo biểu thức:
O i - các tần số thực nghiệm của ô thuộc hàng i cột j
E i - các tần số lý thuyết của ô thuộc hàng i cột j, r là số hàng và c là số cột
trong bảng VI
Trang 15Cơ cấu sử dụng các phương tiện giao thông đi làm trong 2 nhóm công nhân nam và nữ khác nhau.
Bài 3: Một cuộc điều tra xã hội học được tiến hành ở 5 thành phố A, B, C, D, E yêu cầu những người
được hỏi diễn tả mức độ thỏa mãn của mình đối với thành phối mà họ đang sống Kết quả được cho nhưsau:
A B C D E
220 130 84 156 122
121 207 54 95 164
63 75 24 43 73
Với mức ý nghĩa = 3%, kiểm định xem mức độ thỏa mãn cuộc sống có phân bố giống nhau trong 5 thành phốtrên hay không?
Bài làm:
Dạng bài: kiểm tra tính độc lập, sử dụng MS Excel để giải
Sử dụng Excel
B1 Khởi động chương trình Excel
B2 Nhập bảng dữ liệu vào chương trình
B3 Thêm dòng tổng cột và dòng tổng hàng
B4 Tính tổng cột và tổng hàng
Trang 17Kết quả ta được:
Trang 18B7 Nhấp chọn ô C17
Gọi hàm CHITEST để tính giá trị P Nhập giá trị Actual_range: C4:E8 Nhập giá trị Expectd_range: C12:E16
Kết quả ta được:
Kết quả: P= 3.5299E-13
Biện luận:
Trang 19Kết luận:
Mức độ thỏa mãn cuộc sống phân bố khác nhau trong 5 thành phố trên
Trang 20Bài 4: Sau đây là số liệu về số lượng một loại báo ngày bán được ở 5 quận nội thành:
Thứ haiThứ baThứ tưThứ nămThứ sáuThứ bảy
222125242830
181825241922
222225181528
181819202225
181920222525Lượng báo bán được ở 5 quận có khác nhau thực sự không? Chọn = 2% Lượng báo bán ra cóchịu tác động của các yếu tố ngày trong tuần không?
Bài làm:
Cơ sở lí thuyết:
Phân tích phương sai hai yếu tố không lặp:
Sự phân tích này nhằm đánh giá sự ảnh hưởng của hai yếu tố trên các giá trị quan sát Yij (i=1,2…r: yếu tố A; j=1,2…c: yếu tố B)
Trang 21MSB =
Giả thuyết:
“Các giá trị trung bình bằng nhau”Các giá trị trung bình bằng nhau”
“Các giá trị trung bình bằng nhau”Ít nhất có hai giá trị trung bình khác nhau”
Giá trị thống kê:
Biện luận:
Giải toán trên Excel:
Áp dụng “Anova: Two-Factor Without Replication”
Vào Data -> Data Analysis Chọn mục Anova: Two-Factor Without Replication Chọn OK.
Trang 22Trong hộp thoại Anova: Two-Factor Without Replication lần lượt ấn định các chi tiết:
Nhấn OK Ta được bảng sau:
Trang 23Kết quả và biện luận:
FR = 3,5672 > F0.02 = 3,4817 =>không chấp nhận giả thiết H0(thứ)
→ Vậy lượng báo bán ra có sự khác nhau theo thứ.
FC = 2,4748< F0.02 = 3,7313=> chấp nhận giả thiết H0 (quận)
→ Vậy lượng báo bán ra theo quận không có sự khác nhau.
Trang 24Bài 5: Theo dõi ngẫu nhiên giá thuê nhà tại 5 thành phố (với điều kiện thuê nhà như nhau) thu được các
Nhận xét: Đây là bài toán phân tích phương sai một yếu tố
Giả thiết H 0 : không có sự khác biệt về giá thuê nhà ở 5 thành phố
Cơ sở lí thuyết:
Phân tích phương sai một yếu tố
Sự phân tích này nhằm đánh giá sự ảnh hưởng của một yếu tố trên các giá trị quan sát Yi (i=1,2,…,k)
MSF =
MSB =
=
Trang 25Giả thuyết:
“Các giá trị trung bình bằng nhau”Các giá trị trung bình bằng nhau”
“Các giá trị trung bình bằng nhau”Ít nhất có hai giá trị trung bình khác nhau”
Giá trị thống kê:
Biện luận:
Giải toán trên Excel:
Nhập bảng số liệu như hình dưới:
Vào Data /Data analysis, chọn Anova: Single Factor rồi bấm OK
Trên màng hình sẽ hiện lên hộp thoại của Anova: Single Factor
Ta nhập các thông số như hình dưới
Alpha: 0.05
Group by: Rows
Trang 26Ta được kết quả như sau:
Kết Quả Và Biện Luận
P-Value = 6.46E-10 < Alpha=0.05
F=28.0899> F0.05 = 2.6787
Suy ra: Không chấp nhận giả thuyết Ho