DẠNG BÁO CÁO XÁC SUẤT NHÓM 10 B1 a) Dạng Kiểm định giá trị trung bình; Phương pháp Phân tích phương sai 3 yêu tố b) Dạng Phân tích tương quan và hồi quy tuyến tính; Phương pháp Hồi quy tuyến tính đa t[.]
Trang 1DẠNG BÁO CÁO XÁC SUẤT NHÓM 10 B1 a) Dạng: Kiểm định giá trị trung bình;
Phương pháp: Phân tích - phương sai - 3 yêu tố b) Dạng: Phân tích tương quan và hồi quy tuyến tính;
Phương pháp: Hồi quy tuyến tính đa tham số.
B2 Dạng: Phân tích tương quan và hồi quy tuyến tính; Phương pháp: Hồi quy tuyến tính.
B3 Dạng: Kiểm định so sánh - 2 tỷ lệ;
Phương pháp: So sánh tỷ số.
B4 Dạng: Kiểm định tính độc lập;
Phương pháp: Kiểm định tính độc lập.
B5 Dạng: Kiểm định giá trị Trung bình;
Phương pháp: Phân tích - phương sai - 2 yếu tố - có lặp.
Trang 21 Đề bài:
Hiệu suất phần trăm (%) của một phản ứng hóa học được nghiên cứu theo ba yếu tố: pH (A), nhiệt độ (B) và chất xúc tác (C) được trình bày trong bảng sau
2 Yêu cầu Hãy đánh giá về ảnh hưởng của các yếu tố trên đến hiệu suất phản ứng?
3 Dạng bài: Kiểm định giá trị trung bình
4 Phương pháp giải: Phân tích phương sai 3 yếu tố (A, B, C)
Giả thiết:
H0: μ1 = μ2 = = μk ↔ Các giá trị trung bình bằng nhau
Giá trị thống kê: FR, FC, F
Biện luận:
Nếu F R < F α [r-1, (r-1)(r-2)] → Chấp nhận H0 đối với yếu tố A
Nếu F C < F α [r-1, (r-1)(r-2)] → Chấp nhận H0 đối với yếu tố B
Nếu F < F α [r-1, (r-1)(r-2)] → Chấp nhận H0 đối với yếu tố C
5 Excel
Tính các giá trị Ti , T.j , T k, T…
Tính SUMSQTi , SUMSQT.j , SUMSQT k , SQT và SUMSOYijk (Tổng từng số bình phương)
Tính các giá trị SSR, SSC, SSF, SST và SSE (Tổng số bình phương)
Tính các giá trị MSR, MSC, MSF và MSE (Bình phương trung bình)
Tính các giá trị FR, FC và F (Giá trị thống kê)
6 Kết quả:
So sánh các giá trị và kết luận :
FR=3.10 < F0.05(3,6) = 4.76 => chấp nhận H0 (pH)
FC=11.95 > F0.05(3,6) = 4.76 => bác bỏ H0 (nhiệt độ)
F=30.05 > F0.05(3,6) = 4.76 => bác bỏ H0 (chất xúc tác)
Kết luận chỉ có nhiệt độ và chất xúc tác gây ảnh hưởng đến hiệu suất phản ứng
Trang 3Bài 1b
1 Đề bài:
Người ta dùng ba mức nhiệt độ gồm 105, 120 và 135°C kết hợp với ba khoảng thời gian là 15, 30 và 60 phút để thực hiện một phản ứng tổng hợp Các hiệu suất của phản ứng (%) được trình bày trong bảng sau:
2 Yêu cầu:
Hãy cho biết yếu tố nhiệt độ và thời gian/hoặc yếu tố thời gian có liên quan tuyến tính với hiệu suất của phản ứng tổng hợp?
Nếu có thì điều kiện nhiệt độ 115°C trong vòng 50 phút thì hiệu suất phản ứng sẽ là bao nhiêu?
3 Dạng bài: Phân tích tương quan và hồi quy tuyến tính;
4 Phương pháp giải :Hồi quy tuyến tính đa tham số
Giá trị thống kê: F
Trắc nghiệm t:
H0: βi = 0 ↔ Các hệ số hồi quy không có ý nghĩa
t <t α (N-k-1) → Chấp nhận H 0
Trắc nghiệm F
H0: βi = 0 ↔ Phương trình hồi quy không thích hợp
F <F α (1, N-k-1) → Chấp nhận H 0
5 Excel
Áp dụng Regression
Nhấn lần lượt đơn lệnh Tools và lệnh Data Analysis
Chọn chương trình Regression trong hộp thoại Data Analysis rồi nhấp OK
Phạm vi của biến số Y (input Y range)
Phạm vi của biến số X (input X range)
Nhãn dữ liệu (Labels)
Mức tin cậy (Confidence level)
Tọa độ đầu ra(Output range)
Trang 4(1) Phương trình hồi quy : Ŷx1=f(X1)
Ŷx 1 =2.73+0.04X 1 (R2=0.21, S=1.81)
t 0 = 2.129 < t 0.05 = 2.365 (hay P v =0.071> α=0.05) =>Chấp nhận giả thiết H 0
t1= 1.38 < t0.05 = 2.365 (hay Pv =0.209> α=0.05) =>Chấp nhận giả thiết H0
F= 1.95 < F0.05 = 5.590 (hay Fs=0.209 > α=0.05) =>Chấp nhận giả thiết H0
Vậy cả hai hệ số 2.73(B0) và 0.04(B1) của phương trình hồi quy Ŷx1=2.73+0.04X1
đều không có ý nghĩa thống kê
Nói cách khác phương trình hồi quy này không thích hợp
Kết luận 1: Yếu tố Thời gian không có liên quan tuyến tính với hiệu suất của phản ứng tổng hợp.
(2) Phương trình hồi quy : Ŷx2=f(X2)
Ŷx 2 = -11.141 +0.129X 2(R2=0.76, S=0.99)
t0=3.418> t0.05=2.365(hay Pv =0.011>α=0.05) =>Bác bỏ giả thiết H0
t1= 4.757>t0.05=2.365(hay Pv =0.00206<α=0.05) =>Bác bỏ giả thiết H0
F=22.631>F=5.590(hay Fs=0.00206<α=0.05) =>Bác bỏ giả thiết H0
Vậy cả hai hệ số -11.141 (B0) và 0.129 (B1) của phương trình hồi quy Ŷx2=-11.141 +0.129X2 đều có ý nghĩa thống kê.
Nói cách khác phương trình hồi quy này thích hợp
Kết luận 2: Yếu tố nhiệt độ có liên quan tuyến tính với hiệu suất của phản ứng tổng hợp.
(3) Phương trình hồi quy: Ŷx1, x2=f(X1, X2)
Ŷx 1 , x 2 =-12.70+0.04X 1 +0.13X 2 (R2=0.97; S=0.33)
t0=11.528 > t0.05=2.365 (hay Pv =2.260*10 -5 >α=0.05) => Bác bỏ giả thiết H0
t1= 7.583 > t0.05=2.365 (hay Pv =0.00027<α=0.05) => Bác bỏ giả thiết H0
t2= 14.328 > t0.05=2.365 (hay Pv =7.233*10 -6 <α=0.05) => Bác bỏ giả thiết H0
F=131.392 > F=5.140 (hay Fs=1.112*10 -5 <α=0.05) => Bác bỏ giả thiết H0
Vậy cả hai hệ số -12.70 (B0), 0.04(B1) và 0.13(B1) của phương trình hồi quy
Ŷx1,x2 =-12.7 +0.04X1+0.13X2 đều có ý nghĩa thống kê.
Nói cách khác, phương trình hồi quy này thích hợp
Kết luận 3: Hiệu suất của phản ứng tổng hợp có liên quan tuyến tính với cả hai yếu tố là thời gian và nhiệt độ.
Dự đoán hiệu suất bằng phương trình hồi quy Y=-12.70+0.04X1+0.13X2
Với: 50 là giá trị của X1 thời gian) và 115 là giá trị của X2 (nhiệt độ)
Kết luận 4 hiệu suất phản ứng theo dự đoán ở 115°C trong vòng 50 phút là 4.3109%.
Trang 5Bài 2:
1 Đề bài.
Bảng sau đây cho ta một mẫu gồm 11 quan sát (x i , y i ) từ tập hợp chính các giá trị của cặp ĐLNN (X,Y):
2 Yêu cầu:
a) Tìm đường hồi quy của Y đối với X.
b) Tính sai số tiêu chuẩn của đường hồi quy
c) Tính tỷ số F để kiểm định sự đúng đắn của giả thiết: Có hồi quy tuyến tính của Y theo X.
3 Dạng bài: Phân tích tương quan và hồi quy tuyến tính;
4 Phương pháp :Phân tích hồi quy tuyến tính
Kiểm định hệ số a, b:
Giả thuyết Ho: Hệ số quy hồi không có ý nghĩa (= 0)
Trắc nghiệm : chấp nhận Ho
Kiểm định phương trình hồi quy:
Giả thuyết Ho: “Phương trình hồi quy tuyến tính không phù hợp”
Trắc nghiệm : chấp nhận Ho
5 Excel Chọn Data/Data Analysis/ Regression
Bước 1: Nhâp bảng số liệu
Bước 2: Chọn Data/Data Analysis/ Regression
6 Kết quả + biện luận
a) Đường quy hồi tuyến tính của Y đối với X là: Y= 1.547892 X- 1.73948
b) Sai số tiêu chuẩn của đường hồi quy SY.X= 0.28965
c) Tỷ số F = 12.6267 Với mức ý nghĩa a=0.05,
Ta thấy F=12.6367 > 5.12 (bảng Fisher [1, 9])
Pv=0.006169 < 0.05 Bác bỏ giả thiết Ho
Vậy cả hai hệ số -1.73948(Bo) và 1.547892(B1) của pt hồi quy Y= 1.547892 X- 1.73948 có ý nghĩa Nói một cách khác, phương trình hồi quy này thích hợp
Trang 6Bài 3:
1 Đề bài.
Bảng sau đây cho ta phân bố thu nhập của 2 nhóm tuổi: Nhóm từ 40 – 50 tuổi và nhóm từ 50 – 60 tuổi trong số
các công nhân lành nghề ở Thụy Điển năm 1930.
2 Yêu cầu: Có sự khác nhau về phân bố thu nhập giữa hai nhóm tuổi này trong số các công nhân lành nghề hay không? Mức ý nghĩa = 2%.
3 Dạng toán: Kiểm định so sánh - 2 tỷ lệ;
4 Phương pháp: So sánh tỷ số.
5 Bài làm excel
Bước 1: Lập giả thiết H 0:
Phân bố thu nhập giữa hai nhóm tuổi này trong số các công nhân lành nghề là như nhau
Bước 2: Tính tổng hàng và tổng cột.
Bước 3: Tính tần số lý thuyết
Bước 4: Dùng hàm CHITEST để tính.
6 Kết quả
P = 0.511582
Vì giá trị P > α = 2% => Chấp nhận giả thuyết H0
Kết luận: Phân bố thu nhập giữa hai nhóm tuổi này trong số các công nhân lành nghề là như nhau
Trang 7BÀI 4
1 Đề bài.
Một nhóm gồm 105 nhà doanh nghiệp Mỹ được phân loại căn cứ theo thu nhập hằng năm và tuổi thọ của họ Kết quả
thu được như hình sau:
Tuổi
Thu nhập Dưới 100 000 $ Từ 100 000 $ đến399 599 $ Trên 400 000 $
2 Yêu cầu: Với mức ý nghĩa 1%, kiểm định giả thiết cho rằng tuổi và mức thu nhập có quan hệ với nhau hay
không?
3 Dạng: Kiểm định tính độc lập;
4 Phương pháp: Kiểm định tính độc lập.
5 Bài làm excel
Bước 1: Lập giả thiết H 0 : Tuổi và thu nhập khôn g phụ thuộc nhau.
Bước 2: Tính tổng hàng và tổng cột.
Bước 3: Tính tần số lý thuyết Tần số = (tổng hàng * tổng cột) / tổng cộng
Bước 4: Dùng hàm CHITEST để tính
Nhấn vào Tab Fomulas chọn Insert Function chọn CHITEST rồi nhấn OK
6 Kết quả
Ta được P = 0.14376
Vì giá trị P > α = 1% => Chấp nhận giả thuyết H0, tuổi và thu nhập không phụ thuộc nhau.
Kết luận: Tuổi và thu nhập không phụ thuộc nhau.
Trang 81 Đề bài + yêu cầu
Với mức ý nghĩa 1%, Hãy phân tích tình hình kinh doanh của một số ngành nghề ở 4 quận nội thành trên sơ sở
số liệu về doanh thu của một số cửa hàng như sau:
Kiểm định giá trị Trung bình;
4 Phương pháp: Phân tích - phương sai - 2 yếu tố - có lặp.
5 Excel
Bước 1: Giả thuyết Ho:
-HA (yếu tố ngành nghề): doanh thu không phụ thuộc vào ngành nghề.
-HB (yếu tố quận): doanh thu không phụ thuộc vào quận.
-HAB(sự tương tác giữa 2 yếu tố): doanh thu giữa các ngành nghề và các quận không có liên quan tới nhau Bước 2: Áp dụng: “Anova: Two-Factor With Replication”
Vào Data -> Data Analysis Chọn mục Anova: Two-Factor With Replication Chọn OK
Phạm vi đầu vào (Input Range): $A$3:$E$15
Số hàng mỗi mẫu (Rows per sample): 4
Ngưỡng tin cậy (Alpha): 0.01 (mức ý nghĩa = 1%)
Phạm vi đầu ra (Output Range): $A$17
Biện luận: ( n: hàng, m: cột, r: số giá trị trong mỗi ô)
a Nếu F A <Fα [n-1 ; nm(r-1)] thì chấp nhận yếu tố A (hàng)
b Nếu F B < Fα [m-1 ; nm(r-1)] thì chấp nhận yếu tố B (cột) Nếu FAB <Fα [(n-1)(m-1) ; nm(r-1)] thì không có sự tương tác giữa A và B
6 Kết quả và biện luận:
Yếu tố hàng (mẫu): FR = 2.8929 < F0.01 = 5.2479 => Chấp nhận giả thiết H0
→ Tình hình kinh doanh giữa các ngành nghề là như nhau
Yếu tốc cột: FC = 0.8189 < F0.01 = 4,3771 => Chấp nhận giả thiết H0
→Tình hình kinh doanh giữa các quận là như nhau
Ảnh hưởng: F = 0.6498 < F0.01 = 3.3507 => Chấp nhận giả thiết H0
→ Không có sự tương tác giữa khu vực kinh doanh (quận) và ngành nghề kinh doanh
Ngành nghề kinh
Điện lạnh
Vật liệu xây dựng
Dịch vụ tin học
2.5:2.7:2.0:3.0 0.6:10.4 1.2:1.0:9.8:1.8
3.1:3.5:2.7 15.0 2.0:2.2:1.8
2.0:2.4 9.5:9.3:9.1 1.2:1.3:1.2
5.0:5.4 19.5:17.5 5.0:4.8:5.2
Trang 9 Kết luận : Vậy tình hình kinh doanh là như nhau không những giữa các ngành nghề mà còn giữa các quận Ngoài
ra, không có sự tương tác giữa hai yếu tố ngành nghề kinh doanh và địa điểm kinh doanh (quận).