Sử dụng chương trình “ Regression” trong thẻ Data => Data Analysis Chọn OK hộp thoại Regression xuất hiện Trong hộp Regression,lần lượt ấn định các chi tiết - Phạm vi của biến số Y Inp
Trang 1ĐẠI HỌ TRƯ
BÁO CÁO
XÁC SU
ỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH ƯỜNG ĐẠI HỌC BÁCH KHOA TP.HCM oOo
BÁO CÁO BÀI TẬP LỚN MÔN
XÁC SUẤT THỐNG KÊ
GVHD: Nguyễn Đ
SVTH:
Nhóm : 8
TP HỒ CHÍ MINH - 8/2012
CHÍ MINH
N MÔN
NG KÊ
n Đình Huy
Trang 2Mô hình vuông latinh 3 yếu tố được trình bày như sau:
Yếu tố C (T k ví dụ: T 1 = Y111 + Y421 + Y331 + Y241)
Trang 3Trắc nghiệm
Giả thiết:
H0: µ1 = µ2 = ….= µk Các giá trị trung bình bằng nhau
H1: µj ≠ µk Có ít nhất hai giá trị trung bình khác nhau
Thiết lập bảng tính như sau:
Tính các giá trị Ti (tổng theo hàng từ B đến E)
Trang 5Chọn ô K10 và nhập biểu thức =I10/((4-1)*(4-2))
Tính các giá trị và F
Chọn ô M7 và nhập biểu thức =K7/0.3958
Dùng con trỏ kéo kí hiệu tự điền từ ô M7 đến ô M9
Kết luận và Biện luận:
Hãy cho biết yếu tố nhiệt độ và thời gian / hoặc yếu tố thời gian có liên quan tuyến tính với hiệu suất của phản ứng tổng hợp? Nếu có thì điều kiện nhiệt độ 1500C trong vòng
50 phút thì hiệu suất phản ứng là bao nhiêu?
Giải
Áp dụng MS EXCEL
Nhập dữ liệu vào bảng tính ta được như sau:
Thời gian(ph) X1 nhiệt độ( độ C) X2
Trang 6Sử dụng chương trình “ Regression” trong thẻ Data => Data Analysis
Chọn OK hộp thoại Regression xuất hiện
Trong hộp Regression,lần lượt ấn định các chi tiết
- Phạm vi của biến số Y (Input Y Range)
- Phạm vi của biến số X (Input Y Range)
- Nhãn dữ liệu (Labels)
- Mức tin cậy (Confidence Level)
- Tọa độ đầu ra (Output Range)
- Và một số tùy chọn khác như đường hồi quy (Line Fit Plots), biểu thức sai số (Residuals Plots)…
1 Phương trình hồi quy tương ứng X 1
Kiểm định giả thiết H o: thời gian không liên quan tuyến tính với hiệu suất của
phản ứng tổng hợp
Trang 7Phương trình hồi quy
Trang 8thống kê Do vậy phương trình hồi quy này không thích hợp
Kết luận: Vậy yếu tố thời gian không liên quan tuyến tính với hiệu suất của phản ứng
tổng hợp
2 Phương trình hồi quy tương ứng X 2
Kiểm định giả thiết H o: nhiệt độ không liên quan tuyến tính với hiệu suất của
phản ứng tổng hợp
Ta có kết quả:
Trang 9Phương trình hồi quy
Vậy yếu tố nhiệt độ liên quan tuyến tính với hiệu suất của phản ứng tổng hợp
3 Phương trình hồi quy tương ứng X 1 ,X 2
Kiểm định giả thiết H o: thời gian và nhiệt độ không liên quan tuyến tính với hiệu suất của
phản ứng tổng hợp
Trang 11
Phương trình hồi quy
Vậy các hệ số -12.7(B0) , 0.04(B1) và 0.1286(B0) của phương trình hồi quy (3) đều có ý
nghĩa thống kê Vậy phương trình này là phù hợp
Kết luận: thời gian và nhiệt độ có liên quan tuyến tính với hiệu suất của phản ứng tổng
hợp
Sự tuyến tính của phương trình Y x x 1, 2= −12.70 0.04 1 0.1286 2+ x + x
Dự đoán hiệu suất phản ứng bằng phương trình hồi quy (3) ta làm như sau
Hiệu suất dự đoán = B 0 + B 1 *50 + B 2 *115
Với B0, B1, B2 là hệ số phương trình hồi quy (3)
Trang 12Kết quả thu được như sau:
Coefficients
Standard Error t Stat
a) Tìm đường hồi quy của Y đối với X
b) Tính sai số tiêu chuẩn của đường hồi quy
c) Tính tỷ số F để kiểm định giả thiết có hồi quy tuyến tính giữa Y với X
Nhận xét :Đây là bài toán phân tích hồi quy
tuyến tính
Giả thiết :
H0 : βi = 0 “Phương trình hồi quy không thích hợp”
H0 : βi ≠ 0 “Phương trình hồi quy thích hợp”
Trang 13Thực hiện bài toán bằng Excel
Thiết lập bảng tính Regression:
Nhập dữ liệu vào bảng tính :
Sau đó vào Data /Data analysis, chọn Regression
Trong hộp thoại Regression lần lượt ấn định:
• Phạm vi đầu vào: Input Y Range, quét vùng(B3:B23)
Input X Range, quét vùng(A3:A23)
• Chọn Labels (thêm nhãn dữ liệu)
• Phạm vi đầura: Output Range, chọn ô D3
• Chọn Line Fit Plots trong Residuals để vẽ đường hồi quy
Sau đó nhấn OK ta có kết quả :
Trang 14Kết luận :
Đường hồi quy của Y đốivới X là : Y=1.67689X+1.045276
Sai số tiêu chuẩn của đường hồi quy : 2,22
Ta thấy: F = 24,3 > c = 4,41
(tra bảng phân tố Fisher với bậc tự do (1,18) ở mức 0,05)
Vậy: có hồi quy tuyến tính giữa Y với X
Có hồi quy tuyến tính giữa đường kính và chiều cao
BÀI 3
Một công ty muốn mở rộng việc bán sản phẩm sang 3 thị trường nước ngoài Để đánh giá xem thị phần mà công ty có thể chiếm lĩnh được tại ba thị trường đó so với các đối thủ cạnh tranh có khác nhau hay không người ta đã thủ nghiệm thị trường bằng cách bán thử sản phẩm cho 150 khách hàng tiềm năng tại mỗi thị trường và thu được kết quả sau:
X
X Line Fit Plot
Y Predicted Y
Trang 15Oi j : các tần số thực nghiệm của ô thuộc hàng thứ I cột j
Ei j : các tần số lý thuyết của ô thuộc hàng thứ I cột j; r là số hàng; c là số cột
• Xác suất P(X > 2) với bậc tự do DF= (r-1) (c-1) Nếu P(X > ) ⇒ chấp nhận giả thiết Ho và ngược lại
THỰC HIỆN BÀI TOÁN BẰNG EXCEL Nhập giá trị vào bảng tính:
Trang 16Tính tổng các số:
• Tổng hàng: Chọn F3, nhập =SUM(B3:D3), rồi Enter, dùng con trỏ kéo nút tự
điều khiển từ điền từ F3 đến F6
• Tổng cột: Chọn B8, nhập =SUM(B3:B6), rồi Enter, dùng con trỏ kéo nút tự
Trang 17• Áp dụng hàm số CHITEST tính giá trị
Chọn B17, nhập =CHITEST(B3:D6,B12:D15), rồi Enter
Hoặc chọn Formulas → Insert Function → chitest → OK
Xuất hiện hộp thoại Function Agruments
• Nhập các giá trị tần số quan sát vào mục Actual_range
• Nhập các giá trị tần số lí thuyết vào mục Expected_range Chọn OK
Ta được P = 0.00044854 0.05 nên bác bỏ giả thuyết
Kết luận: Như vậy cơ cấu 3 thị trường trên là không giống nhau
BÀI 4
4.Người ta tiến hành đo mực nước sông tại một số địa điểm thuộc tỉnh X trong cùng
một ngày (số lần đo không giống nhau) và thu được bảng số liệu sau đây:
4,9 5,1 6,5 5,4 6,1
4,6 4,8 5,8 5,1 6,2 7,1
4,5 6,2 4,8 4,8 6,5 6,8
Với mức ý nghĩa ααα = 2%.Mực nước sông trung bình/ngày của các điểm nói trên có thực sự khác nhau không?
Trang 18BÀI GIẢI I.Cở sở lý thuyết:
a.Dạng bài toán : Phân tích phương sai 1 yếu tố
b.Khái niệm thống kê và giả thuyết bài toán:
Sự phân tích phương sai 1 yếu tố là đánh giá sự ảnh hưởng của một yếu tố (nhân tạo hay tự nhiên) nào đó trên các giá trị quan sát , Yi ,(i=1,2,…,k)
Y
T.2
2
T SSF
1
2
2
) 1 ( −
=
k
SSF MSF
2
2
Trắc nghiệm
Giả thiết:
H 0: µ1 =µ2 = µk ⇔ “ Các giá trị trung bình bằng nhau”
H 1: µi ≠ µj ⇔ “ Ít nhất có hai giá trị trung bình khác nhau”
Trang 19Ta gỉa thiết:
Mực nước sông trung bình/ngày của các điểm đã đo là như nhau
THỰC HIỆN BÀI TOÁN BẰNG EXEL Nhập bảng số liệu:
Nhấp vào lệnh Data va lệnh Data Analysis
Chọn chương trình Anova:Single Factor trong hộp thoại Data Analysis rồi nhấn OK
Trong hộp Anova:Single Factor lần lượt ấn định:
Phạm vi đầu vào (Input Range):ta kéo từ B2 đến E9
Cách sắp xếp theo hàng hay cột (Group By):Chọn Columns
Nhấn dữ liệu (Labels in Fisrt row/column)
Phạm vi đầu ra (Output Range):Chọn A12
Trang 211 Cơ sở lý thuyết :
a Dạng bài toán : Phân tích phương sai 2 nhân tố không liên quan
b Khái niệm thống kê và giả thiết bài toán :
Sự phân tích này nhằm đánh giá sự ảnh hưởng của hai yếu tố trên các giá trị quan sát Yij
Y
T.2 2
T SSB
1
2
2
) 1 ( −
=
r
SSB MSB
jrc
T r
T SSB
1
2
2
)1( −
=
c
SSF MSF
=
r
SSB MSB
SST
2
2
Trang 22Trắc nghiệm
• Giả thiết:
H 0: µ1 =µ2 = µk ⇔ “ Các giá trị trung bình bằng nhau”
H 1: µi ≠µj ⇔ “ Ít nhất có hai giá trị trung bình khác nhau”
a.Nhập các số liệu vào bảng
b Nhấp lần lượt Data tab và Data Analysis tab
c Chọn chương trình Anova : Two-Factor Without Replication trong hộp thoại Data Analysis rồinhấp nút OK
d Trong hộp thoại Anova: Single Factor lần lượt xác định:
- Phạm vi đầu vào (Input Range)
- Cách sắp xếp theo hàng hay cột (Group by)
- Nhãn dữ liệu (Label in First Row/Column)
- Phạm vi đầu ra (Output Range)
Trang 23e Được kết quả như sau :
Biện luận :
FR = 24,91589 > F0,05 = 6.944272 → Bác bỏ giả thuyết H0( Thành phố)
FC = 24,7477 > F0,05 = 6.944272 → Bác bỏ giả thuyết H0( Loại dịch vụ)
Vậy chi phí cho 3 loại dich vụ ở 3 thành phố khác nhau không chịu ảnh hưởng của thành phố hay loại dịch vụ nên chúng giống nhau