-Tạo Bin ranger- Sau đó chọn Data → Data analysis → Histogram => OK - Excel cho ta số liệu - Ta tiếp tục chọn cột tần số sau đó vào Insert => Column => chọn biểu đồ phù hợp... - Cuối cùn
Trang 1Đại học quốc gia Thành phố Hồ Chí Minh Trường Đại học Bách Khoa Thành phố Hồ Chí Minh
Khoa Khoa học Ứng dụng
Bộ môn Toán Ứng Dụng - Môn Xác Suất Thống Kê
BÁO CÁO BÀI TẬP LỚN
ĐỀ 8
Giảng viên hướng dẫn: Nguyễn Kiều Dung
Trang 2 BÀI 1:
1/ Bảng định lượng (A) : chúng em lấy số liệu đo đường trong máu sau khi ăn 2h
của 50 (n = 50) người ( đơn vị: mmol/l)
Trang 3-Tạo Bin ranger
- Sau đó chọn Data → Data analysis → Histogram => OK
- Excel cho ta số liệu
- Ta tiếp tục chọn cột tần số sau đó vào Insert => Column => chọn biểu đồ phù hợp
Trang 4- Tiếp theo chọn cột tần suất vào insert => line => chọn biểu đồ phù hợp
- Để vẻ biểu đồ mật độ (A) ta thêm vào cột tần số số 0 ở đầu và cuối
Trang 5- Cuối cùng chọn Insert => line => biểu đồ phù hợp
3/ Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát với độ tin cậy 95% với dữ liệu (A).
- Trước tiên ta đưa dữ liệu về dạng cột trong Excel
- Sau đó chọn Data => Data analysis => Descriptive Statistics
Trang 6- Nhấn OK
Trang 7Số liệu được lấy từ 150 bệnh nhân mắc bệnh tiểu đường tại một phòng khám, khảo sát trên cơ sở tuổi tác của các bệnh nhân:
Để tính % ta nhập vào ô B3 như sau: =(B2/$F$2)*100 , rồi sau đó coppy cho các ô còn lại
a/ Biểu đồ phân bố tần số:
b/ Biểu đồ tích lũy tần số:
Trang 8c /Biểu đồ mật độ:
- Có sự khác biệt với dữ liệu định lượng (A) là không cần có số 0 ở cột tần số
Trang 95/ Dữ kiện (B):
- Đặt giả thuyết:
Trang 10(a;b)
Tần số thực tế
Giá trị thuộc miền bác bỏ Ws => Loại giả thuyết H0, chấp nhận giả thuyết H1
=> Mẫu không có phân phối chuẩn
Trang 11+ Gọi a1 là điểm trung bình của loại hạt trước khi kiểm định
a2 là điểm trung bình của loại hạt sau khi kiểm định
+ Đặt giả thiết kiểm định H0 :a1 = a2
Giả thiết đối H1: a1 ≠a2
+ Tìm miền bác bỏ :
Ta nhận thấy, với mỗi loại trước hoặc sau kiểm định có 10 người thực hiện khảo sát: n = 10 < 30, không có phương sai cho cả hai mẫu => Thực hiện tra bảng Student để tìm ra miền bác bỏ
Trang 12- Trong Excel, Zqs là t Stat, còn
t α
phía và t Critcial one-tail đối với kiểm định 1 phía
- Ta sẽ bác bỏ H0 và chấp nhận H1 khi và chỉ khi xảy ra một trong 3 trường hợp sauđây:
+ Đối với kiểm định 2 phía: t Stat < - Critical two-tail hoặc t Stat > Criticaltwo-tail
+ Đối với kiểm định 1 phía bên trái: t Stat < - Critical one-tail
+ Đối với kiểm định 1 phía bên phải: t Stat > Critical one-tail
2 Các bước thực hiện
- Nhập dự liệu của 2 loại hạt giống vào Excel
- Chọn Data > Data Analysis > t-Test: Paired Two Sample for Means
- Nhập dữ liệu trước cải tiến vào mục Variable 1 Range và sau cải tiến vàoVariable 2 Range
- Nhập mức ý nghĩa vào khung Alpha
- Hạt loại thứ 1:
+ Gọi a1, a2 lần lượt là điểm trung bình của hạt loại 1 và hạt loại 2
+ Giả thiết kiểm định: a0 = a1 (điểm số trung bình trước và sau cải tiến là nhưnhau)
+ Giả thiết đối: a0 ≠ a1 (điểm số trung bình và sau cải tiến là khác nhau)
Trang 13+ Miền bác bỏ : W α=(−∞;−1,7176)∪(1,7176;+∞)
+ Zqs = t Stat = -0,2873
cải tiến hạt giống chưa hiệu quả
+ Giá trị P cần tìm 0,7804
- Hạt loại 2:
+ Gọi k1 và k2 lần lượt là điểm trung bình của hạt giống loại 2 trước và sau khicải tiến
+ Đặt giả thiết kiểm định H0: k1 = k2 ( Việc cải tiến là chưa hiệu quả)
+ Đặt giả thiết đối H1: k1 ≠ k2 (Việc cải tiến hiệu quả hơn)
Trang 14+ Miền bác bỏ :
W α=(−∞;−2,1504)∪(2,1504;+∞)
+ Zqs = t Stat = -2,3434
→ Zqs thuộc Wα
nhau, việc cải tiến hạt giống là hiểu quả
+ Giá trị P cần tìm: 0,0438
BÀI 3:
1 Cơ sở lý thuyết
hưởng đến hiện tượng nghiên cứu (hàm lượng saponin)
NHIỀU QUAN SÁT
Các bước thực hiện:
Trang 15 Có ba giả thuyết Ho trong trường hợp phân tích phương sai hai tổng thể nhiều quan sát trong một ô tương ứng với
ba tỉ số F (F1,F2 và F3)
giữa các mùa là giống nhau
giữa các miền là giống nhau
giữa các mùa và miền
o
Trang 16Mùa mưa
BắcTrung
Miền
6.67.2
Trang 17saponin giữa các mùa là giống nhau.
giữa khác miền là khác nhau
và miền không có sự tương tác
Vậy hàm lượng saponin giống nhau theo mùa, khác nhau theo miền và không
có sự tương tác giữa 2 yếu tố mùa và miền
3 Dùng EXCEL
Chọn File => Options => Add-ins => Go => Analysis Toolpak => Ok
Trang 18 Chọn Data Analysis => Anova:Two – Factor with Replication => Ok
Trang 19 BÀI 4:
Bài toán kiểm định độc lập
1 Cơ sở lý thuyết
- Xét một mẫu kích thước n của BNN định tính 2 chiều (X,Y) X nhận các giá trị
X1, X2,…, XR Y nhận các giá trị Y1, Y2,…, YK Với mức ý nghĩa ta kiểm định X,
Y có độc lập hay không
Y
Tổng hàng
- Giả thuyết kiểm định H0 : X, Y độc lập
Trang 202 2
;
ij qs
Nếu qs2 W : chấp nhận giả thuyết H1
Nếu qs2 W: chấp nhận giả thuyết H0
VD: Nghiên cứu vitamin có trong thức ăn của bố mẹ (X) có ảnh hưởng hay không đối với giới tính của con cái (Y), ta có kết quả như sau:
Trang 21→ Vậy vitamin có trong thức ăn của bố mẹ không ảnh hưởng đến giới tính của concái.
Trang 22Tính giá trị P(X 2) : Chọn ô B10 và nhập biểu thức =CHITEST(B2:C3,B7:C8)
Trang 232 Sử dụng Excel cho ví dụ cụ thể :
a Một nghiên cứu được thực hiện bởi một nhà bán lẻ cho thấy mối liên
hệ giữa chi phí tiếp thị hằng tuần và doanh thu
Trang 24- Để tính hệ số tương quan ta chọn Data → Data analysis → Regression, xuất hiện bảng, ta khai báo như sau:
o Input Y Range: Doanh thu ($)
o Input X Range: Chi phí tiếp thị ($)
- Kết quả thu được sẽ hiển thị trong bảng SUMMARY OUTPUT
+ Hệ số tương quan giữa X và Y : Multiple R = 0.634837268
Trang 25 Ta thấy giá trị ghi là Intercept chính là A, giá trị ghi ‘X Variable 1’
chính là giá trị B Vậy đường hồi quy tuyến tính sẽ có dạng là: y = 3.221x + 343.706
+ Nếu ta click chọn ô ‘Line Fit Plots’ trong bảng Regression, sẽ thu được
đồ thị biểu diễn đường hồi quy tuyến tính như hình trên Đường màu cam chính là đường hồi quy tuyến tính của Y theo X, những điểm màu xanh chính là tọa độ của các điểm x , Yi x i
trong bảng số liệu
+ Để tính được sai số chuẩn của ước lượng bằng Excel, ta cũng sử dụng bảng Regression để tính, ta được:
Trang 26Sai số chuẩn của ước lượng chính là ‘Standard Error’ và bằng 50.2257
b Một cuộc khảo sát được thực hiện để kiểm tra cách thức dự đoán thời gian nấu ăn (y ) dựa vào các yếu tố như độ rộng của lò nướng ( x1 ) và nhiệt độ của ống khói (x2 )
Trang 27- Để tìm các hệ số hồi qui tuyến tính mẫu ta chọn Data → Data analysis → Regression, xuất hiện bảng, ta khai báo như sau:
o Input Y Range: Thời gian nấu ăn
o Input X Range: Độ rộng lò nướng và nhiệt độ ống khói
Trang 29Mùa Nắng Mùa Mưa Giao Mùa
nhau là như nhau
Trang 30SSE=SS1 + SS2 + SS3 = 449.2381 + 315.2381 + 1245.238 = 2009.714
Bước 3: Tính các phương sai
Phương sai trong nội bộ nhóm :
MSE= n−k SSE== 33.49524
Phương sai trong các nhóm :
MSA= n−k SSE = =1704.571
Bước 4: Tính tỉ số F
Trang 31Tra bảng phân phối hàm F với mức nghĩa α=0.05 tại các bậc tử do n-k và k-1 , bảng không có nên ta tra bằng excel như sau:
Kết quả F(k-1;n-k;α) = F(3-1;63-3;0.05)= 3.1504
Vì F=50.88996 > 3.1504 -> bác bỏ H0 , chấp nhận H1
Vậy với độ tin cậy 95% thì thời gian hoàn thành 1 căn nhà cấp 4 của 21 nhà thầu ở 3 nhóm thời tiết khác nhau là khác nhau Ta có thể kết luận thời tiết ảnh hưởng đến thời gian xây nhà Sau đây là cách giải excel , để đối chiếu kết quả với cách làm bằng tay ở trên
Giải bằng Excel
Bước 1: Nhập dữ liệu:
Trang 32Chọn Data/Data Analysis/Anova Single Factor và làm theo hướng dẫn
Trang 33Và đây là kết quả, trùng khớp làm thủ công:
~~~~~~~~~~~~~~~~~~~~HẾT~~~~~~~~~~~~~~~~~~~~