1. Trang chủ
  2. » Giáo Dục - Đào Tạo

báo cáo bài tập lớn môn xác suất thống kê

34 607 3

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 34
Dung lượng 0,9 MB
File đính kèm Bao cao_final.rar (890 KB)

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

BÁO CÁO BÀI TẬP LỚN Nhóm 7Để thực hiện phương pháp phân tích phương sai ba yếu tố, ta cần lần lượt ìm được các giá trị thống kê cho từng nhân tố F A , F B , F C.. Trong đó, ta cần tính đ

Trang 1

ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH

TRƯỜNG ĐẠI HỌC BÁCH KHOA TP.HỒ CHÍ MINH

Trang 2

BÁO CÁO BÀI TẬP LỚN Nhóm 7

Để thực hiện phương pháp phân tích phương sai ba yếu tố, ta cần lần lượt ìm được các giá trị thống kê cho từng nhân tố F A , F B , F C Trong đó, ta cần tính được các giá trị sau: Tổng bình phương chung và tổng bình phương nhân tố (Sum of Squares)

MSE ; F C=MS F C

Với Y ijk : Các giá trị được cho trong bảng

Trang 3

T .j : Giá trị ứng với yếu tố B j

T k : Giá trị ứng với yếu tố C k

r : Số lượng mức độ khảo sát của mỗi nhân tố (ở đây r=4) Với các giá trị thống kê tim được, ta lần lượt so sánh với giá trị F 0,05 (3.6) để kiểm định các giả thuyết:

H 0 : “Các giá trị trung bình bằng nhau”.

H 1 : “Có ít nhất 2 giá trị trung bình khác nhau”.

o Nếu F A <F 0,05 (3,6)i Chấp nhân giả thuyết H 0 cho yếu tố A

o Nếu F B <F 0,05 (3,6)i Chấp nhân giả thuyết H 0 cho yếu tố B

o Nếu F C <F 0,05 (3,6)i Chấp nhân giả thuyết H 0 cho yếu tố C

Bước 1: Nhập dữ liệu vào bảng tính:

Bước 2: Thiết lập các biểu thức và tính các giá trị thống kê

1 Tính các giá trị Ti , T.j , T k và T

Các giá trị Ti

Chọn ô B7 và chọn biểu thức=SUM(B2:E2) Chọn ô C7 và nhập biểu thức=SUM(B3:E3) Chọn ô D7 và nhập biểu thức=SUM(B4:E4) Chọn ô E7 và nhập biểu thức=SUM(B4:E4)

Trang 4

BÁO CÁO BÀI TẬP LỚN Nhóm 7

Các giá trị T.j.

Chọn ô B8 và nhập biểu thức=SUM(B2:B5) Dùng con trỏ kéo ký tự điền từ ô B8 đến ô E8

Các giá trị T k Chọn ô B9 và nhập biểu thức=SUM(B2,C5,D4,E3) Chọn ô C9 và nhập biểu thức=SUM(B3,C2,D5,E4) Chọn ô D9 và nhập biểu thức=SUM(B4,C3,D2,E5) Chọn ô E9 và nhập biểu thức=SUM(B5,C4,D3,E2)

Giá trị SST Chọn ô I11 và nhập biểu thức=G11-G10/POWER(4,2)

Giá trị SSE Chọn ô I10 và nhập biểu thức=I11-SUM(I7:I9)

Trang 5

4 Tính các giá trị MSR.MSC.MSF và MSE

Giá trị SST Chọn ô K7 và nhập biểu thức=I7/(4-1) Dùng con trỏ kéo ký tự điền từ ô K7 đến ô K9

Chọn ô K10 và nhập biểu thức=I/((4-1)*(4-2))

5 Tính các giá trị G và F:

Chọn ô M7 và nhập biểu thức=K7/0.3958 Dùng con trỏ kéo ký tự điền từ ô M7 đến M9.

Kết quả và biện luận:

(Tra bảng Fisher để được giá trị F 0,05 (3,6))

Trang 6

BÁO CÁO BÀI TẬP LỚN Nhóm 7

Phần B: Ví dụ 4.2 trang 216 SBT XSTK 2012 (N.Đ.Huy):

C kết hợp với 3 khoảng thời gian là 15,30 và 60 phút để thực hiện một phản ứng tổng hợp.các hiệu xuất của phản ứng(%) được trình bày trong bảng sau:

Thời gian (phút)

X1

Nhiệt độ ( 0

C) X2

Hiệu xuất (%) Y

Bài làm:

Nhận định bài toán: Bài toán yêu cầu cho biết yếu tố nhiệt độ hoặc thời gian có lien

quan tuyến tính với hiệu suất của phản ứng tổng hợp hay không i Giải quyết bài toán

bằng phương pháp hồi quy tuyến tính đa tham số.

Trong phương trình hồi quy tuyến tính đa tham số ,biến số phụ thuộc Y có liên quan đến k biến số độc lập X i (i=1,2,…k) thay vì chỉ có một như trong hồi quy tuyến tính đơn giản.

Tổng số bình phương

Bình phương trung bình

Giá trị thống kê

Trang 7

-Trong trắc nghiệm t

H 0 : β i=0 Các hệ số hồi quy không có ý nghĩa

H 0 : β i ≠ 0 Có ít nhất vài hệ số hồi quy có ý nghĩa Bậc tự do của giá trị t: γ =N-k-1

t=¿B i – β i∨ ¿

S n2¿ ; S n2= S2

∑(X i− ´X)2-Trong trắc nghiệm F:

H 0 : β i=0 Phương trình hồi quy không thích hợp

H 0 : β i ≠ 0 Phương trình hồi quy thích hợp với ít nhất vài β i Bậc tự do của giá trị F: v 1 =1; v 2 =N-k-1

Bước 1: Nhập dử liệu vào bản tính

Dữ liệu nhất thiết phải được nhập theo cột.

Trang 8

BÁO CÁO BÀI TẬP LỚN Nhóm 7

Bước 2: Sử dụng Regression

- Nhấn lần lượt đơn lệnh Data i Data Analysis

- Chọn chương trình Regression trong hộp thoại Data Analysis rồi nhấp OK

- Trong hộp thoại Regression ,làn lượt ấn các chi tiết:

Trang 9

- Các giá trị đầu ra cho bảng sau:

Trang 10

BÁO CÁO BÀI TẬP LỚN Nhóm 7

Trang 11

Phương trình hồi quy: Y^X1=f(X1 )

Vậy cả hai hệ số 2.73(B 0 ) và 0.04(B 1 ) của phương trình hồi quy Y^X1=2.73+0.04X 1

đều không có ý nghĩa thống kê Nói cách khác phương trình hồi quy này không thích hợp.

Kết luận: Yếu tố thời gian không có liên quan tuyến tính với hiệu suất của phản

Trang 12

BÁO CÁO BÀI TẬP LỚN Nhóm 7

=2-Kết luận: Yếu tố nhiệt độ có liên quan tuyến tính với hiệu xuất của phản ứng tổng

Trang 13

o t 0 =11.528> t 0.05 =2.365(hay P v 2 =2.260*10 -5 <α=0.05)

Trang 14

BÁO CÁO BÀI TẬP LỚN Nhóm 7

=-Kết luận: Hiệu xuất của phản ứng tổng hợp có liên quan tuyến tính với cả hai yếu tố

là thời gian và nhiệt độ.

Sự tuyến tính của phương trình Y^X1, X2= -12.70+0.04X 1 +0.13X 2 có thể được trình bày trên biểu đồ phân tán (scatterplots):

trỏ tự điền từ ô E2 đến ô E10.

Chọn ô E2 i vào Insert i Scatteri Scatter with only Markers BIỂU ĐỒ:

Kết luận: Hiệu xuất của phản ứng tổng hợp có liên quan tuyến tính với cả hai yếu tố

là thời gian và nhiệt độ.

Trang 15

Nếu muốn dự đoán hiệu xuất bằng phương trình hồi quy

^

Y X1, X2= -12.70+0.04X 1 +0.13X 2 , chỉ cần chọn một ô, ví dụ như B31, sau đó nhập hàm

=B28+B29*50+B30*115 và được kết quả như sau:

(thời gian) và 115 là giá trị của X 2 (nhiệt độ)

Trang 16

BÁO CÁO BÀI TẬP LỚN Nhóm 7

Bài 2: Một nhà nông học tiến hành việc kiểm định hiệu quả của ba loại phân này

trên các cây cà chua và theo dõi số quả cà chua mọc trên mỗi cây Kết quả thu được như sau:

Loại phân

24 18 27 28

21 26 32 25

16 22 19 17 Với mức ý nghĩa  = 5%, hay so sánh số quả cà chua mọc trung bình khi bón

ba loại phân A, B, C nói trên

Trang 17

2 Mở Data Analysis chọn Anova: Single Factor

3 Nhập vào hộp thoại Anova: Single Factor

 Input Range: phạm vi đầu vào (ô A2  ô C6)

 Grouped By: nhóm dữ liệu theo hàng hoặc cột (chọn cột)

 Labels in first column: nhãn ở cột đầu tiên (chọn)

 Alpha: giá trị α (0,05)

 Output Range: phạm vi dữ liệu xuất ra (ô Ạ9)

Trang 18

BÁO CÁO BÀI TẬP LỚN Nhóm 7

Ta nhận được bảng kết quả:

Biện luận: F = 3.8556562174 < F0.05 = 4.256494729 => chấp nhận giả thiết H0.

Kết luận: số quả cà chua mọc trung bình khi bón ba loại phân A, B, C nói trên nói

trên là như nhau.

Trang 19

Bài 3: Bảng sau đây cho ta số liệu về màu tóc của 422 người:

Màu tóc Nam Nữ Đen

Hung Nâu Vàng

56 37 84 19

32 66 90 38 Với mức ý nghĩa 3%, nhận định xem số liệu có mối quan hệ giữa màu tóc và giới tính hay không.

0,01=11,34

Vì Tqs> χ2

0,01=11,34 nên bác bỏ giả thiết H0 tức là màu tóc và giới tính không

có mối quan hệ với nhau

Trang 20

BÁO CÁO BÀI TẬP LỚN Nhóm 7

0,01 ) Nếu P(Tqs<χ2

0,01 )> α chấp nhận giả thiết H0

Nếu ngược lại thì bác bỏ giả thiết H0

b) Quá trình giải thuật:

 Nhập dữ liệu vào bảng:

 Nhập thêm các dòng tổng hàng, tổng cột:

 Tính tổng hàng, tổng cột:

Chọn ô để nhập giá trị tổng sau đó dùng cú pháp sau:

=SUM(trị bảng dò) sau đó Enter

Trang 21

 Tiếp theo tính các tần số lí thuyết

 Sử dụng công thức:

Tần số lý thuyết = (tổng hàng * tổng cột)/tổng cộng

Trang 22

BÁO CÁO BÀI TẬP LỚN Nhóm 7

Gọi hàm CHITEST tính giá trị P

Nhấp vào Insert chọn Insert Fuction chọn Chitest nhấn Ok

Xuất hiện hộp thoại Fuction Agruments:

- Nhập các giá trị tần số quan sát vào mục Actual_range

- Nhập các giá trị tần số lí thuyết vào mục Expected_range -> Ok

KẾT QUẢ:

Biện luận: P(X > χ2) = 0.000246775 < α = 0.01 bác bỏ giả thuyết

H0

P=0.000246775

Trang 24

BÁO CÁO BÀI TẬP LỚN Nhóm 7

Bài 4: Tiến hành thăm dò ba nhóm xã hội khác nhau: công nhân, nông dân, trí

thức Kết quả cuộc thăm dò như sau:

Tầng lớp

Ý kiến

Công nhân Nông dân Trí thức Tổng số Tăng 100 300 20 420 Như cũ 200 400 30 630 Giảm 50 80 5 135 Không ý

kiến

30 70 5 105 Tổng số 380 850 60 1290

Với mức ý nghĩa  = 2%, có sự khác nhau về ý kiến trong các tầng lớp xã hội trên hay không?

Trang 25

Giá trị 2 theo biểu thức

Xác suất P  (  2) với bậc tự do DF = (r – 1)(c – 1); trong đó r là số hàng và

c là số cột trong bảng ngẫu nhiên (contingency table).

Nếu P  (  2)>α => Chấp nhận giả thuyết H0 và ngược lại.

Bài toán này dựa trên cơ sở lý thuyết “Kiểm định tính độc lập” (Đã được trình bày trong Sách giáo khoa trang 112) chúng tôi xin nhắc lại cách ngắn gọn như sau.

Cho X và Y là hai dấu hiệu trên cùng một tổng thể Từ một mẫu kích thước n

ta có số liệu :

Y1 Y2 Yh ni X1 N11 N12 N1h N1 X2 N21 N22 N2h N2

Trang 26

BÁO CÁO BÀI TẬP LỚN Nhóm 7

Mj (j = 1,h) – số lần Y nhận yj Ni,j (i = 1,k ; j = 1,h) – số lần đồng thời X nhận xi và Y nhận yj Kiểm định giả thiết H : X và Y độc lập với mức ý nghĩa α.

Phương pháp giải

Tìm 2 2 k 1 h 1

từ trong bảng phân vị 2 Tính thống kê

 ij 2

2 0

Thực hiện bài toán trên Excel:

Yêu cầu bài toán thực chất là kiểm định tính độc lập giữa ý kiến và các tầng lớp xã hội Từ số liệu bài toán ta có bảng số liệu sau:

Bước 1: Nhập giá trị vào bảng:

Trang 28

BÁO CÁO BÀI TẬP LỚN Nhóm 7

Bước 2: Tính các tần số lý thuyết

Tần số lý thuyết = (tổng hàng * tổng cột) / tổng cộng.

Trang 29

Bước 3: Tính xác xuất P(χ > χ2)

Chọn ô C14 nhập giá trị biểu thức =CHITEST(B2:D5,B9:D12)

Ta có giá trị xác suất là 0.06118 >0.02  Chấp nhận giả thiết H.

Kết luận: Có sự giống nhau về ý kiến trong các tầng lớp xã hội.

Trang 30

BÁO CÁO BÀI TẬP LỚN Nhóm 7

Bài 5: Với mức ý nghĩa  = 2%,Hãy phân tích vai trò ngành nghề (chính, phụ)

trong hoạt động kinh tế của các hộ gia đình ở một vùng nông thôn trên cơ sở bảng số liệu về thu nhập trung bình của một hộ tương ứng với các ngành nghề nói trên như sau:

Nghề chính Nghề phụ

(1) (2) (3) (4) Trồng lúa (1)

Trồng cây ăn quả (2) Chăn nuôi (3)

Dịch vụ (4)

3.5 5.6 4.1 7.2

7.4 4.1 2.5 3.2

8.0 6.1 1.8 2.2

3.5 9.6 2.1 1.5

Bài giải

Dạng bài : Kiểm định trung bình hai yếu tố (không lặp).

Sự phân tích này nhằm đánh giá sự ành hưởng của hai yếu tố trên các giá trị quan sát Yij (i = 1, 2, … r: yếu tố A; j = 1, 2, … c: yếu tố B).

Mô hình

Yếu tố A Yếu tố B Tổng

cộng

Trung bình

Trang 31

Bảng ANOVA

Nguồn

sai số Bậc tự do Tổng số bình phương

Bình phương trung bình

Giá trị thống kê Yếu tố

H0: µ1= µ2=…µk ( Các giá trị trung bình bằng nhau )

H1: µ1≠ µ2 ( Ít nhất có hai giá trị trung bình khác nhau)

Trang 32

BÁO CÁO BÀI TẬP LỚN Nhóm 7

Bước 1: Nhập dữ liệu vào bảng:

Bước 2:

Nhấn lần lượt đơn lệnh Tools và lệnh Data Analysis.

Chọn trương trình Anova: Two trong hộp thoại Data Analysis rồi nhấn nút OK.

Trong hộp thoại Anova: Two-Factor Without Replication lần lượt ấn định

 Phạm vi đầu vào (Input range)

 Nhãn dữ liệu (Labels in Fisrt Row/Column)

 Ngưỡng tin cậy (Alpha)

 Phạm vi đầu ra (Output range)

Trang 33

Kết luận:

Từ giá trị trong bảng Anova:

FR= 1,9966 < Fα= 5,5097=> Chấp nhân giả thiết H0 (nghề chính)

FC= 0,1106 < Fα= 5,097 => Chấp nhân giả thiết H0 (nghề phụ)

Trang 34

BÁO CÁO BÀI TẬP LỚN Nhóm 7

Vậy nghề chính và nghề phụ đều có vai trò quan trọng đối với thu nhập của một hộ gia đình

Ngày đăng: 23/08/2017, 17:14

TỪ KHÓA LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w