BÀI LÀM A DẠNG BÀI _ Đây là dạng bài tìm khoảng ước lượng của giá trị trung bình và phân tích phương sai một yếu tố của hai mẫu khác phương sai.. _ Từ đó ta có thể tính được ε= Tαα× s √
Trang 1BÀI 1
Một nông trường nuôi bò nuôn ba giống bò sữa A, B,C Lượng sữa của các con bò được thống kê trong bảng sau đây
A B C
92 53 75
37 15 19
46 19 12 Với mức ý nghĩa α=0,05, hãy nhận định xem có phải ba giống bò này có phân bố tỉ lệ như nhau về phương diện sữa hay không?
BÀI LÀM
A) DẠNG BÀI
_ Đây là bài toán kiểm định giả thuyết vể tỷ lệ
B) PHƯƠNG PHÁP GIẢI
_ Ta tính các giá trị tổng hang, tổng cột và tổng cộng
_ Từ đó ta tính ra được xác suất P(X > χ2)
_ So sánh P(X > χ2)với α=0,05 ta sẽ kết luận được về phân bố tỉ lệ về phương diện sữa của cả ba giống bò
C) CÔNG CỤ GIẢI
_ Ta sử dụng công cụ Autosum của Excel để tính tổng hang tổng cột và tổng cộng
_ Ta sử dụng hàm CHITEST để tính giá trị xác suất P(X > χ2)
D) CÁC BƯỚC THỰC HIỆN
Đặt giả thiết:
Trang 2_ H0 : Các giống bò có tỉ lệ giống nhau về phương diện sữa.
_ H1 : Các giống bò có tỉ lệ khác nhau về phương diện sữa
Nhập giá trị vào bảng tính:
Tính tổng hàng, tổng cột và tổng cộng
_ Ta quét từ ô B5 đến ô E8
_ Nhấn vào công cụ Autosum trên thanh công cụ
_ Ta được bảng sau :
Tính các tần số lý thuyết: (tổng hàng*tổng cột)/tổng cộng
_ Chọn B13: nhập =E5*$B$8/$E$8, rồi nhấn Enter, dùng con trỏ quét từ ô B13 đến B15
_ Chọn C13: nhập =E5*$C$8/$E$8, rồi Enter, dùng con trỏ quét từ C13 đến C15
_ Chọn D13: nhập =E5*$D$8/$E$8, rồi Enter, dùng con trỏ quét từ D13 đến D15
Trang 3_ Áp dụng hàm CHITEST tính giá trị P( X> χ2)
_ Chọn B16, nhập =CHITEST(B5:D7;B13:D15) rồi Enter Ta được giá trị P( X> χ2)
E) KẾT LUẬN.
_ Biện luận: P(X > χ2)=0,02251515<0.05nên bác bỏ giả thuyết H0
_ Kết luận: Ba giống bò này có tỉ lệ khác nhau về phương diện sữa
BÀI 2
Điều tra ý kiến của 6 nhân viên chính phủ về mức độ làm phát trong năm tới thu được các giá trị 4,2% 5,1% 3,9% 4,7% 4,9% 5,8% Trong khí đó hỏi ý kiến của 6 nhà kinh tế đang làm việc tại các công ty cùng một vấn đề trên thì ta nhận được các kết quả là: 5,7% 6,1% 5,2% 4,9% 4,6% và 5,5% Với độ tin
Trang 4cậy 95% hãy ước lượng mức lạm phát do các nhà kinh tế trong hai khu vực kinh tế trên dự báo VỚi mực ý nghĩa 5% hãy cho ý kiến về sự khác biệt của các dự đoán trên Giả thiết mức lạm phát là biến ngẫu nhiên phân phối chuẩn
BÀI LÀM
A) DẠNG BÀI
_ Đây là dạng bài tìm khoảng ước lượng của giá trị trung bình và phân tích phương sai một yếu tố của hai mẫu khác phương sai
B) PHƯƠNG PHÁP GIẢI
_ Ta tìm độ lệch chuẩn và trung bình của hai mẫu
_ Tra bảng phân phối Student để được giá trị Tα
_ Từ đó ta có thể tính được ε= Tαα× s
√n
C) CÔNG CỤ GIẢI
_Ta sử dụng công cụ bảng Despritive Statistic để tính các độ lệch chuẩn và trung bình của hai mẫu đã cho ở đề bài
_ Ta dùng hàm TINV để tra phân phối Student tìm Tα
_ Ta sử dụng công cụ bảng t-test : two samples assuming unequal variances
D) CÁC BƯỚC THỰC HIỆN
1) Tìm khoảng ước lượng của mức lạm phát.
Ta nhập giá trị hai mẫu vào bảng tính
Trang 5 Ước lượng mức lạm phát.
_ Ta vào Data chọn Despritive Statistic
_ Trong bảng hiện ra ta điền các giá trị như sau:
Input range: Quét từ ô A3 đến ô B9
Group by: collums
Tích vào Label in first row
Output range: ta chọn ô A15
Tích vào summary statistic và confident level
Trang 6_ Ta được các giá trị trong bảng sau:
_ Để tính Tα tại ô I16 và I17 ta điền vào: =TINV(G16;H16-1)
_ Ta tính giá trị ԑ: tại ô K16 ta điền vào =I16*J16/SQRT(6) Ta quét xuống tương tự cho ô I17
2) Kiểm định sự khác biệt của các dự đoán.
Ta vào Data/ t-test : two samples assuming unequal variances
Trang 7 Ta điền vào bảng t-test như sau :
Từ đó ta được bảng t-test kết quả :
Giá trị thống kê nằm ở :
Trang 8Kết luận :
_ Do tSTAT < tCRIT nên chấp nhận giả thiết H0
_ Vậy dự đoán về mức lạm phát có sự giống nhau
BÀI 3
Tính tỷ số tương quan của Y đối với X, hệ số tương quan và hệ số xác định của tập số liệu sau đây Với mức ý nghĩa α=5 %, có kết luận gì về mối tương quan giữa X và Y (Có phi tuyến không? Có tuyến tính không ? ) Tìm đường hồi quy của Y đối với X
50
130
210
240
90
210
75 235 235 195 115 295
90 90 270 130 50 270
135 175 115 255 15 75
50 240 170 270 210 50
35 235 295 135 315 55
170 210 270 170 170 90
355 275 95 335 315 155 BÀI LÀM
A) DẠNG BÀI
_ Nhận xét: Đây là bài toán phân tích tương quan tuyến tình và phi tuyến, tìm đường hồi quy tuyến tính của X và Y
B) CÔNG CỤ GIẢI
_ Ta sử dụng công cụ Data Analysis / Correlation để phân tích tương quan tuyến tính
_ Ta sử dụng công cụ Data Analysis/ Anova: single factor để phân tích tương quan phi tuyến
Trang 9_ Ta sử dụng công cụ Data Analysis / Regression để tìm phương trình đượng hồi quy của X và Y
C) CÁC BƯỚC THỰC HIỆN.
1 Phân tích tương quan tuyến tính
Giả thuyết H0: X và Y không có quan hệ tương quan tuyến tính
Giả thuyết H1: X và Y không có quan hệ tương quan tuyến tính
Nhập bảng giá trị:
Vào Data/Data analysis, chọn Correlation:
Trang 10 Trên màn hình xuất hiện hộp thoại Correlation, ta nhập vào như hình
sau:
Input Range: ta kéo từ ô A3 đến ô B27
Grouped By: chọn Comlumns
Tích vào Label in First Row
Output Range: ta chọn ô D6
Ta được kết quả như sau:
Trang 11 Ta tìm được:
Hệ số tương quan: r =0,342484725
Hệ số xác định : r2=0,117295787
Ta có: Tα = r√n−2
√1−r2=1,709798561
Mà : c=2,074
(c là phân vị mức α2=0,025 của phân bố Student với n-2=22 bậc tự do)
Vì |Tα|<c nên chưa có cơ sở bác bỏ giả thuyết H0 Vậy: Chưa kết luận được X và Y có tương quan tuyến tính
2) Phân tích tương quan phi tuyến.
Ta sửa lại bảng số liệu theo dạng sau:
Ta đặt giả thiết:
_Giả thiết H0: X và Y không tương quan phi tuyến
Trang 12_ Giả thiết H1: X và Y tương quan phi tuyến.
Vào Data/Data analysic, chọn Anova: Single Factor, Nhấn OK.
Trong hội thoại Anova: Single Factor, ta điền các giá trị như hình sau:
Input Range: ta kéo từ ô A4 đến ô H8
Grouped By: chọn Columns
Tích vào Labels in first row
Nhập 0.05 vào Alpha
Output Range: ta chọn ô A12
Ta được kết quả như sau:
Trang 13 Rút ra được từ bảng Anova:
SSF = 237383,3 SST = 248383,3 Tính được: η Y / X2
=SSF SSTα=0,9557136088
=> Tỷ sô tương quan: η Y / X=0,9776060601
Suy ra: η Y / X2 −r2=0,8603102731≠ 0
Ta có: F=(η¿¿Y / X
2
−r2
)(n−k )
)(k−2) =81,588847428¿
Mà c=2,68
(c là phân vị mức α=0,05 của phân bố Fisher bậc tự do (k-2,n-k)=(5,21))
Vì: F>c nên không chấp nhận giả thuyết H0
Vậy X và Y có tương quan phi tuyến.
3) Tìm đường hồi quy của X và Y
Giả thuyết H0: X và Y hồi quy tuyến tính
Ta nhập bản giá trị
Trang 14 Vào Data/Data Analysic, chọn Regression.
Trong hội thoại Regression ta nhập vào các giá trị như hình sau:
Input Y Range: ta chọn từ ô B3 đến ô B27
Input X Range: ta chọn từ ô A3 đến ô A27
Tích vào Labels
Tích vào mục Line Fit Plots
Output Range: chọn ô D6 Nhấ OK
Trang 15Ta được kết quả như sau.
Kết luận: Đường hồi quy của Y đối với X là:
Y =0,454159 X+115,3658
Trang 160 50 100 150 200 250 300
0
100
200
300
400
X Line Fit Plot
Y Predicted Y
X
BÀI 4
Theo dõi số học sinh đến lớp muộn của 4 trường PTTH người ta thu được về
số lượng học sinh trung bình đến lớp muộn của các trường đó như sau:
Ngày trong
tuần
Trường PTTH
Thứ hai Thứ tư Thứ sáu Thứ bảy
5 4 4 4
4 5 3 4
5 3 4 3
7 2 5 2 Bạn có nhận xét gì về số lượng học sinh đến lớp muộn của trường Chọn
α=10 %
BÀI LÀM
A) DẠNG BÀI
_ Đây là bài toán phân tích phương sai hai yếu tố không lặp
B) PHƯƠNG PHÁP GIẢI
Sự phân tích này nhằm đánh giá sự ảnh hưởng của hai yếu tố trên các giá trị quan sát Yij (i=1,2…r: yếu tố A; j=1,2…c: yếu tố B)
Giả thuyế t:
Trang 17H0: μ1=μ2=…μ k “Các giá trị trung bình bằng nhau”Các giá trị trung bình bằng nhau”
H1: μ1≠ μ2 “Các giá trị trung bình bằng nhau”Ít nhất có hai giá trị trung bình khác nhau”
Giá trị thống kê :
F R=MSB MSE và F C=MSF
MSE
Biện luận :
Nếu F R<F a[b−1,(k −1) (b−1 )] => Chấp nhận H0 (yếu tố A) Nếu F C<F a[b−1, (k−1) (b−1)] => Chấp nhận H0 (yếu tố B)
C) CÔNG CỤ GIẢI
_ Ta sử dụng công cụ bảng Anova: two factor without replication
D) CÁC BƯỚC THỰC HIỆN
Ta đặt giả thuyết:
_ H01: yếu tố ngày không ảnh hưởng đến số lượng học sinh trung bình đến lớp muộn của các trường đó
_ H02: yếu tố trường khác không ảnh hưởng đến số lượng học sinh trung bình đến lớp muộn của các trường đó
Nhập bảng số liệu vào excel
Vào Data/Data analysis, chọn Anova: Two-Factor Without Replication,
bấm OK
Trang 18 Trên màn hình sẽ hiện lên hộp thoại của Anova: Two-Factor Without
Replication như hình dưới:
Ta nhập các thông số như hình bên dưới:
Input Range: ta quét từ ô B5 tới ô E8
Ta tích vào Labels
Vào mục Alpha và đổi thành 0,01
Output Range: ta chọn A11
Ta được kết quả như sau:
Trang 19E) KẾT LUẬN
Biện luận
Ta thấy: F R=2.035714286<F0.1=2.812863=> Chấp nhận H01
F c=0.107142857< F0.1=2.812863 => Chấp nhận H02.
Vậy cả 2 yếu tố ngày trong tuần và trường khác đều không ảnh hưởng
đến số lượng học sinh trung đi đến lớp muộn