1. Trang chủ
  2. » Luận Văn - Báo Cáo

Bài tập lớn môn xác suất thống kê

20 196 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 20
Dung lượng 460,84 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

BÀI LÀM A DẠNG BÀI _ Đây là dạng bài tìm khoảng ước lượng của giá trị trung bình và phân tích phương sai một yếu tố của hai mẫu khác phương sai.. _ Từ đó ta có thể tính được ε= Tαα× s √

Trang 1

BÀI 1

Một nông trường nuôi bò nuôn ba giống bò sữa A, B,C Lượng sữa của các con bò được thống kê trong bảng sau đây

A B C

92 53 75

37 15 19

46 19 12 Với mức ý nghĩa α=0,05, hãy nhận định xem có phải ba giống bò này có phân bố tỉ lệ như nhau về phương diện sữa hay không?

BÀI LÀM

A) DẠNG BÀI

_ Đây là bài toán kiểm định giả thuyết vể tỷ lệ

B) PHƯƠNG PHÁP GIẢI

_ Ta tính các giá trị tổng hang, tổng cột và tổng cộng

_ Từ đó ta tính ra được xác suất P(X > χ2)

_ So sánh P(X > χ2)với α=0,05 ta sẽ kết luận được về phân bố tỉ lệ về phương diện sữa của cả ba giống bò

C) CÔNG CỤ GIẢI

_ Ta sử dụng công cụ Autosum của Excel để tính tổng hang tổng cột và tổng cộng

_ Ta sử dụng hàm CHITEST để tính giá trị xác suất P(X > χ2)

D) CÁC BƯỚC THỰC HIỆN

 Đặt giả thiết:

Trang 2

_ H0 : Các giống bò có tỉ lệ giống nhau về phương diện sữa.

_ H1 : Các giống bò có tỉ lệ khác nhau về phương diện sữa

 Nhập giá trị vào bảng tính:

 Tính tổng hàng, tổng cột và tổng cộng

_ Ta quét từ ô B5 đến ô E8

_ Nhấn vào công cụ Autosum trên thanh công cụ

_ Ta được bảng sau :

 Tính các tần số lý thuyết: (tổng hàng*tổng cột)/tổng cộng

_ Chọn B13: nhập =E5*$B$8/$E$8, rồi nhấn Enter, dùng con trỏ quét từ ô B13 đến B15

_ Chọn C13: nhập =E5*$C$8/$E$8, rồi Enter, dùng con trỏ quét từ C13 đến C15

_ Chọn D13: nhập =E5*$D$8/$E$8, rồi Enter, dùng con trỏ quét từ D13 đến D15

Trang 3

_ Áp dụng hàm CHITEST tính giá trị P( X> χ2)

_ Chọn B16, nhập =CHITEST(B5:D7;B13:D15) rồi Enter Ta được giá trị P( X> χ2)

E) KẾT LUẬN.

_ Biện luận: P(X > χ2)=0,02251515<0.05nên bác bỏ giả thuyết H0

_ Kết luận: Ba giống bò này có tỉ lệ khác nhau về phương diện sữa

BÀI 2

Điều tra ý kiến của 6 nhân viên chính phủ về mức độ làm phát trong năm tới thu được các giá trị 4,2% 5,1% 3,9% 4,7% 4,9% 5,8% Trong khí đó hỏi ý kiến của 6 nhà kinh tế đang làm việc tại các công ty cùng một vấn đề trên thì ta nhận được các kết quả là: 5,7% 6,1% 5,2% 4,9% 4,6% và 5,5% Với độ tin

Trang 4

cậy 95% hãy ước lượng mức lạm phát do các nhà kinh tế trong hai khu vực kinh tế trên dự báo VỚi mực ý nghĩa 5% hãy cho ý kiến về sự khác biệt của các dự đoán trên Giả thiết mức lạm phát là biến ngẫu nhiên phân phối chuẩn

BÀI LÀM

A) DẠNG BÀI

_ Đây là dạng bài tìm khoảng ước lượng của giá trị trung bình và phân tích phương sai một yếu tố của hai mẫu khác phương sai

B) PHƯƠNG PHÁP GIẢI

_ Ta tìm độ lệch chuẩn và trung bình của hai mẫu

_ Tra bảng phân phối Student để được giá trị Tα

_ Từ đó ta có thể tính được ε= Tαα× s

n

C) CÔNG CỤ GIẢI

_Ta sử dụng công cụ bảng Despritive Statistic để tính các độ lệch chuẩn và trung bình của hai mẫu đã cho ở đề bài

_ Ta dùng hàm TINV để tra phân phối Student tìm Tα

_ Ta sử dụng công cụ bảng t-test : two samples assuming unequal variances

D) CÁC BƯỚC THỰC HIỆN

1) Tìm khoảng ước lượng của mức lạm phát.

 Ta nhập giá trị hai mẫu vào bảng tính

Trang 5

 Ước lượng mức lạm phát.

_ Ta vào Data chọn Despritive Statistic

_ Trong bảng hiện ra ta điền các giá trị như sau:

 Input range: Quét từ ô A3 đến ô B9

 Group by: collums

 Tích vào Label in first row

 Output range: ta chọn ô A15

 Tích vào summary statistic và confident level

Trang 6

_ Ta được các giá trị trong bảng sau:

_ Để tính Tα tại ô I16 và I17 ta điền vào: =TINV(G16;H16-1)

_ Ta tính giá trị ԑ: tại ô K16 ta điền vào =I16*J16/SQRT(6) Ta quét xuống tương tự cho ô I17

2) Kiểm định sự khác biệt của các dự đoán.

 Ta vào Data/ t-test : two samples assuming unequal variances

Trang 7

 Ta điền vào bảng t-test như sau :

 Từ đó ta được bảng t-test kết quả :

 Giá trị thống kê nằm ở :

Trang 8

Kết luận :

_ Do tSTAT < tCRIT nên chấp nhận giả thiết H0

_ Vậy dự đoán về mức lạm phát có sự giống nhau

BÀI 3

Tính tỷ số tương quan của Y đối với X, hệ số tương quan và hệ số xác định của tập số liệu sau đây Với mức ý nghĩa α=5 %, có kết luận gì về mối tương quan giữa X và Y (Có phi tuyến không? Có tuyến tính không ? ) Tìm đường hồi quy của Y đối với X

50

130

210

240

90

210

75 235 235 195 115 295

90 90 270 130 50 270

135 175 115 255 15 75

50 240 170 270 210 50

35 235 295 135 315 55

170 210 270 170 170 90

355 275 95 335 315 155 BÀI LÀM

A) DẠNG BÀI

_ Nhận xét: Đây là bài toán phân tích tương quan tuyến tình và phi tuyến, tìm đường hồi quy tuyến tính của X và Y

B) CÔNG CỤ GIẢI

_ Ta sử dụng công cụ Data Analysis / Correlation để phân tích tương quan tuyến tính

_ Ta sử dụng công cụ Data Analysis/ Anova: single factor để phân tích tương quan phi tuyến

Trang 9

_ Ta sử dụng công cụ Data Analysis / Regression để tìm phương trình đượng hồi quy của X và Y

C) CÁC BƯỚC THỰC HIỆN.

1 Phân tích tương quan tuyến tính

 Giả thuyết H0: X và Y không có quan hệ tương quan tuyến tính

 Giả thuyết H1: X và Y không có quan hệ tương quan tuyến tính

 Nhập bảng giá trị:

 Vào Data/Data analysis, chọn Correlation:

Trang 10

 Trên màn hình xuất hiện hộp thoại Correlation, ta nhập vào như hình

sau:

 Input Range: ta kéo từ ô A3 đến ô B27

 Grouped By: chọn Comlumns

 Tích vào Label in First Row

 Output Range: ta chọn ô D6

Ta được kết quả như sau:

Trang 11

 Ta tìm được:

 Hệ số tương quan: r =0,342484725

 Hệ số xác định : r2=0,117295787

Ta có: Tα = rn−2

1−r2=1,709798561

Mà : c=2,074

(c là phân vị mức α2=0,025 của phân bố Student với n-2=22 bậc tự do)

Vì ||<c nên chưa có cơ sở bác bỏ giả thuyết H0 Vậy: Chưa kết luận được X và Y có tương quan tuyến tính

2) Phân tích tương quan phi tuyến.

 Ta sửa lại bảng số liệu theo dạng sau:

 Ta đặt giả thiết:

_Giả thiết H0: X và Y không tương quan phi tuyến

Trang 12

_ Giả thiết H1: X và Y tương quan phi tuyến.

 Vào Data/Data analysic, chọn Anova: Single Factor, Nhấn OK.

 Trong hội thoại Anova: Single Factor, ta điền các giá trị như hình sau:

 Input Range: ta kéo từ ô A4 đến ô H8

 Grouped By: chọn Columns

 Tích vào Labels in first row

 Nhập 0.05 vào Alpha

 Output Range: ta chọn ô A12

 Ta được kết quả như sau:

Trang 13

 Rút ra được từ bảng Anova:

SSF = 237383,3 SST = 248383,3 Tính được: η Y / X2

=SSF SSTα=0,9557136088

=> Tỷ sô tương quan: η Y / X=0,9776060601

Suy ra: η Y / X2 −r2=0,8603102731≠ 0

Ta có: F=(η¿¿Y / X

2

r2

)(n−k )

)(k−2) =81,588847428¿

c=2,68

(c là phân vị mức α=0,05 của phân bố Fisher bậc tự do (k-2,n-k)=(5,21))

Vì: F>c nên không chấp nhận giả thuyết H0

Vậy X và Y có tương quan phi tuyến.

3) Tìm đường hồi quy của X và Y

 Giả thuyết H0: X và Y hồi quy tuyến tính

 Ta nhập bản giá trị

Trang 14

 Vào Data/Data Analysic, chọn Regression.

 Trong hội thoại Regression ta nhập vào các giá trị như hình sau:

 Input Y Range: ta chọn từ ô B3 đến ô B27

 Input X Range: ta chọn từ ô A3 đến ô A27

 Tích vào Labels

 Tích vào mục Line Fit Plots

 Output Range: chọn ô D6 Nhấ OK

Trang 15

Ta được kết quả như sau.

 Kết luận: Đường hồi quy của Y đối với X là:

Y =0,454159 X+115,3658

Trang 16

0 50 100 150 200 250 300

0

100

200

300

400

X Line Fit Plot

Y Predicted Y

X

BÀI 4

Theo dõi số học sinh đến lớp muộn của 4 trường PTTH người ta thu được về

số lượng học sinh trung bình đến lớp muộn của các trường đó như sau:

Ngày trong

tuần

Trường PTTH

Thứ hai Thứ tư Thứ sáu Thứ bảy

5 4 4 4

4 5 3 4

5 3 4 3

7 2 5 2 Bạn có nhận xét gì về số lượng học sinh đến lớp muộn của trường Chọn

α=10 %

BÀI LÀM

A) DẠNG BÀI

_ Đây là bài toán phân tích phương sai hai yếu tố không lặp

B) PHƯƠNG PHÁP GIẢI

Sự phân tích này nhằm đánh giá sự ảnh hưởng của hai yếu tố trên các giá trị quan sát Yij (i=1,2…r: yếu tố A; j=1,2…c: yếu tố B)

 Giả thuyế t:

Trang 17

H0: μ1=μ2=…μ k “Các giá trị trung bình bằng nhau”Các giá trị trung bình bằng nhau”

H1: μ1≠ μ2  “Các giá trị trung bình bằng nhau”Ít nhất có hai giá trị trung bình khác nhau”

 Giá trị thống kê :

F R=MSB MSE và F C=MSF

MSE

 Biện luận :

Nếu F R<F a[b−1,(k −1) (b−1 )] => Chấp nhận H0 (yếu tố A) Nếu F C<F a[b−1, (k−1) (b−1)] => Chấp nhận H0 (yếu tố B)

C) CÔNG CỤ GIẢI

_ Ta sử dụng công cụ bảng Anova: two factor without replication

D) CÁC BƯỚC THỰC HIỆN

 Ta đặt giả thuyết:

_ H01: yếu tố ngày không ảnh hưởng đến số lượng học sinh trung bình đến lớp muộn của các trường đó

_ H02: yếu tố trường khác không ảnh hưởng đến số lượng học sinh trung bình đến lớp muộn của các trường đó

 Nhập bảng số liệu vào excel

Vào Data/Data analysis, chọn Anova: Two-Factor Without Replication,

bấm OK

Trang 18

 Trên màn hình sẽ hiện lên hộp thoại của Anova: Two-Factor Without

Replication như hình dưới:

 Ta nhập các thông số như hình bên dưới:

 Input Range: ta quét từ ô B5 tới ô E8

 Ta tích vào Labels

 Vào mục Alpha và đổi thành 0,01

 Output Range: ta chọn A11

 Ta được kết quả như sau:

Trang 19

E) KẾT LUẬN

 Biện luận

Ta thấy: F R=2.035714286<F0.1=2.812863=> Chấp nhận H01

F c=0.107142857< F0.1=2.812863 => Chấp nhận H02.

 Vậy cả 2 yếu tố ngày trong tuần và trường khác đều không ảnh hưởng

đến số lượng học sinh trung đi đến lớp muộn

Ngày đăng: 25/02/2019, 22:29

TỪ KHÓA LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w