Báo cáo bài tập lớn môn xác suất thống kê.Có trình bày rõ ràng từng bước tính toán.Có các lệnh excel cụ thể, hướng dẫn thực hiện từng bước cho ra kết quả.Trong tài liệu có đính kèm thêm file excel để hiện thực từng bước tính toán trong báo cáo
Trang 1Mục lục
Mục lục 0
Câu 1 1
Câu 2 3
Câu 3 6
Câu 4 14
Trang 2Câu 1 Một hãng sản xuất ôtô tiến hành một nghiêm cứu nhằm xác định xem có sự khác nhau giữa tỷ lệ
đàn ông và đàn bà trong việc chọn mua các loại ôtô của hãng hay không Kết quả thu được như sau:
Với mức ý nghĩa 5% ,ta cần phải đưa ra kết luận gì?
Bài giải:
Dạng bài: so sánh tỉ số
Cơ sở lý thuyết:
- Đối với một thí nghiệm có nhiều kết quả (ở bài này là thí nghiệm nghiên cứu nhằm xác định xem
sự khác nhau giữa tỉ lệ đàn ông và đàn bà trong việc chọn mua các loại ô tô) cần so sánh nhiều tỉ số
- Trắc nghiệm χ2 cho phép ta so sánh không những hai mà còn nhiều tỉ số (hay tỉ lệ, xác suất) một
cách tiện lợi
Giả thiết H0: phân bố chọn mua các loại ôtô A, B, C giữa phụ nữ và nam giới là như nhau
Thực hiện bài toán bằng Excel:
1 Nhập dữ liệu vào bảng tính:
2 Tính các tổng số:
Tổng hàng: chọn ô E2 và nhập biểu thức = SUM(B2:D2)
+ Dùng con trỏ kéo nút tự điền từ ô E2-> E3
Tổng cột: chọn ô B4 và nhập biểu thức =SUM(B2:B3)
+ Dùng con trỏ kéo nút tự điền từ ô B4->D4
Tổng cộng: chọn ô E5 và nhập biểu thức =SUM(E2:E3)
Trang 33 Tính các tần số lý thuyết:
Tần số lý thuyết = (tổng cột x tổng hàng) / tổng cộng
Phụ nữ mua ôtô loại A: chọn ô B8 và nhập biểu thức = B4*$E$2/$E$5
+ Dùng con trỏ kéo nút tự điền từ ô B8 -> D8, ta được tỷ lệ phụ nữ mua ôtô loại B, loại C
Nam giới mua ôtô lại A: chọn ô B8 và nhập biểu thức = B4*$E$3/$E$5
+ Dùng con trỏ kéo nút tự điền từ ô B9 -> D9, ta được tỷ lệ nam giới mua ôtô loại B, loại C
4 Áp dụng hàm số CHITEST:
Chọn ô B10 và nhập vào =CHITEST(B2:D3,B8:D9)
Ta sẽ có được kết quả của P X( 2) : 0.582092714
Biện luận: giá trị P = 0.582092714 > α = 0.05=> chấp nhận giả thiết H0
Kết luận: phân bố chọn mua các loại ôtô A, B, C giữa phụ nữ và nam giới là như nhau
Trang 4Câu 2 Một nhà nông học tiến hành việc kiểm định hiệu quả của ba loại phân trên các cây cà chua và theo
dõi số quả cà chua mọc trên mỗi cây Kết quả thu được như sau:
Với mức ý nghĩa α=5%, hãy so sánh số quả cà chua mọc trung bình khi bón ba loại phân A,B,C nói trên
Bài giải:
Dạng bài: phân tích phương sai 1 nhân tố
Cơ sớ lý thuyết:
-Phép phân tích phương sai được dùng trong các trắc nghiệm để so sánh các giá trị trung bình của hai hay nhiều mẫu từ các phân bố
-Mục đích của sự phân tích phương sai một yếu tố là đánh giá sự ảnh hưởng của một yếu tố (nhân tạo hay tự nhiên) nào đó trên các giá trị quan sát, Yi, (I = 1,2, …, k)
Giả thiết H0: số quả cà chua mọc trung bình khi bón ba loại phân A, B, C là như nhau
Thực hiện bài toán bằng Excel:
1 Nhập dữ liệu vào bảng tính:
Loại phân
24
18
27
28
21
26
32
25
16
22
19
17
Trang 52 Mở Data Analysis chọn Anova Single Factor
3 Nhập vào hộp thoại Anova Single Factor
Input Range: phạm vi đầu vào (ô A2 ô C6)
Grouped By: nhóm dữ liệu theo hàng hoặc cột (chọn cột)
Labels in first column: nhãn ở cột đầu tiên (chọn)
Alpha: giá trị α (0,05)
Output Range: phạm vi dữ liệu xuất ra (ô Ạ9)
Trang 6
4 Ta nhận được bảng kết quả:
Biện luận: F = 3.8556562174 < F0.05 = 4.256494729 => chấp nhận giả thiết H0
Kết luận: số quả cà chua mọc trung bình khi bón ba loại phân A, B, C nói trên nói trên là như nhau
Trang 7Câu 3.Tính tỷ số tương quan của Y đối với X, hệ số tương quan và hệ số xác định của tập số liệu sau đây
Với mức ý nghĩa α= 5%, có kết luận gì về mối tương quan giữa X và Y (Có phi tuyến không ? Có tuyến tính không ?) Tìm đường hồi quy của Y đối với X
Bài giải:
Dạng bài: phân tích tương quan và hồi quy
Thực hiện bài toán bằng Excel:
Phân tích tương quan tuyến tính
Giả thiết H0: X, Y không có tương quan tuyến tính
1 Nhập dữ liệu vào bảng tính:
X 210 90 240 50 240 270 130 270 90 240 130 170 50 170 210
Y 255 115 255 35 275 315 135 355 135 295 175 235 75 195 235
Trang 82 Mở Data Analysis chọn Correlation
3 Nhập vào hộp thoại Correlation
Input Range: phạm vi đầu vào (ô A1 B16)
Grouped By: nhóm dữ liệu theo hàng hoặc cột (chọn cột)
Labels in first column: nhãn ở cột đầu tiên (chọn)
Output Range: phạm vi dữ liệu xuất ra (ô D1)
Trang 94 Ta nhận được bảng kết quả:
Biện luận:
Từ bảng kết quả, ta tìm được hệ số tương quan r (X/Y) = 0.974355761;
hệ số xác định r² = 0.949369149
Giá trị
2
2 1
r n T
r
= 15.6128296
c= 2.16037 (c là phân vị mức α /2= 0.025 của phân bố Student với n-2=13 bậc tự do)
|T| < c nên bác bỏ giả thiết H0
Kết luận: vậy X và Y có tương quan tuyến tính
Phân tích tương quan phi tuyến
Giả thiết H0: X, Y không có tương quan phi tuyến
Trang 101 Nhập dữ liệu vào bảng tính sau khi đã sắp xếp lại
2 Mở Data Analysis chọn Anova Single Factor
3 Nhập vào hộp thoại Anova Single Factor
Input Range: phạm vi đầu vào (ô B1 ô H4)
rouped By: nhóm dữ liệu theo hàng hoặc cột (chọn cột)
Labels in first row: nhãn ở cột đầu tiên (chọn)
Alpha: giá trị α (0,05)
Output Range: phạm vi dữ liệu xuất ra (ô A6)
Trang 114 Ta nhận được bảng kết quả:
Biện luận:
SSF = 114693,3333; SST = 119093,3333
Tỷ số tương quan : 2
/
Y X
=SSF/SST = 0,9630541872
Giá trị
/ 2 /
Y X
Y X
r n k F
k
c = 3.6875 (c là phân vị mức α =0,05 của phân bố Fisher bậc tự do (k-2,n-k)=(5,8))
F < c nên chấp nhận giả thiết H0
Kết luận: vậy X và Y không có tương quan phi tuyến
Trang 12 Phân tích hồi quy
1 Nhập dữ liệu vào bảng tính theo cột dọc:
2 Mở Data Analysis chọn Regression
Trang 133 Nhập vào hộp thoại Regression
Input Y Range: phạm vi đầu vào (ô B1 ô B16)
Input X Range: phạm vi đầu vào (ô A1 ô A16)
Labels: nhãn (chọn)
Line Fit Plots: vẽ đồ thị (chọn)
Output Range: phạm vi dữ liệu xuất ra (ô D1)
4 Ta nhận được bảng kết quả:
Kết luận: phương trình đường hồi quy của Y đối với X: Y= 1.169300226X+ 6.106094808
Trang 15Câu 4 Hãy phân tích vai trò ngành nghề (chính, phụ) trong hoạt động kinh tế của các hộ gia đình ở một
vùng nông thôn trên cơ sở bảng số liệu về thu nhập của một số hộ tương ứng với các ngành nghề nói trên như sau (mức ý nghĩa 5%)
Trồng lúa (1) 3.5:3.4:4.0 7.4:7.6:7.1 8.3:8.1:8.0 3.5:3.4:3.7
Trồng cây ăn quả (2) 5.6:5.2:5.8 4.1:4.4:3.9 6.1:6.4:5.8 9.6:9.7:9.2
Chăn nuôi (3) 4.1:4.4:3.8 2.5:2.5:2.7 1.8:1.6:1.4 2.1:2.3:2.0
Dịch vụ (4) 7.2:7.0:7.7 3.2:3.5:3.1 2.2:2.6:2.3 1.5:1.7:1.4
Bài giải:
Dạng bài: phân tích phương sai hai yếu tố có lặp
Giả thiết : HA : thu nhập không phụ thuộc vào nghề chính
HB : thu nhập không phụ thuộc vào nghề phụ
HAB : nghề chính và nghề phụ không có liên quan đến nhau.
Thực hiện bài toán bằng Excel:
1 Nhập dữ liệu vào bảng tính:
Trang 162 Mở Data Analysis và chọn Two Factor With Replication
3 Nhập vào hộp thoại Anova: Two-Facror With Replication
Input Range : (ô A2 ô E14)
Rows per sample : 3
Alpha: 0.05
Output Range : (A16)
Trang 174 Ta nhận được bản kết quả
Trang 18Biện luận:
FA = 602.7073171; F0.05 = 2,90112
FA > F0.05 bác bỏ yếu tố HA thu nhập phụ thuộc vào nghề chính
FB = 35.55284553; F0.05 = 2.90112
FB > F0 05 bác bỏ yếu tố HB thu nhập phụ thuộc vào nghề phụ
FAB = 301,7487418; F0.05 = 2.188766
FAB > F0.05 bác bỏ yếu tố HAB có sự tương tác năng suất giữa nghề chính và nghề phụ
Kết luận:
Thu nhập phụ thuộc vào nghề chính
Thu nhập phụ thuộc vào nghề phụ
Có sự tương tác giữa nghề chính và nghề phụ