1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Báo cáo bài tập lớn xác suất thống kê đh bách khoa

33 403 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 33
Dung lượng 795,96 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Câu 1Ví dụ 3.4: Hiệu suất phần trăm % của một phản ứng hóa học được nghiên cứu theo 3 yếu tố: pH A, nhiệt độ B và chất xúc tác C được trình bày trong bảng sau: Bài toán phân tích phươn

Trang 1

BÁO CÁO BÀI

Trang 2

Câu 1

Ví dụ 3.4: Hiệu suất phần trăm (%) của một phản ứng hóa học được nghiên

cứu theo 3 yếu tố: pH (A), nhiệt độ (B) và chất xúc tác (C) được trình bày trong bảng sau:

Bài toán phân tích phương sai 3 yếu tố

1) C s lý thuy t: ơ sở lý thuyết: ở lý thuyết: ết:

Khi phân tích phương sai ba yếu tố ta thường dung mô hình vuông La tinh có dạng như sau:

Trang 3

Giá trị thống kê Yếu tố

Sai số (r-1)(r-2) SSE = SST – (SSF + SSR +SSC) MSE =SSE

Ta tiến hành phân tích phương sai ba yếu tố trên và dựa trên bảng ANOVA

để kết luận ảnh hưởng của các yếu tố đến hiệu suất của phản ứng

Trang 4

Nhập dữ liệu vào bảng như sau:

 Tính các giá trị Ti… T.j. T k và T

- Các giá trị T i

Chọn ô B7 và nhập biểu thức =SUM(B2:E2) Chọn ô C7 và nhập biểu thức =SUM(B3:E3) Chọn ô D7 và nhập biểu thức =SUM(B4:E4) Chọn ô E7 và nhập biểu thức =SUM(B5:E5)

- Các giá trị T.j.

Chọn ô B8 và nhập biểu thức =SUM(B2:B5) Dùng con trỏ kéo kí hiệu tự điền từ ô B8 đến E8

- Các giá trị T k

Chọn ô B9 và nhập biểu thức =SUM(B2,C5,D4,E3) Chọn ô C9 và nhập biểu thức =SUM(B3,C2,D5,E4) Chọn ô D9 và nhập biểu thức =SUM(B4,C3,D2,E5) Chọn ô E9 và nhập biểu thức =SUM(B5,C4,D3,E2)

- Giá trị T…

Chọn ô B10 và nhập biểu thức =SUM(B5,C4,D3,E2)

 Tính các giá trị G´và G´

- Các giá trị G´G´

Trang 5

Chọn ô G7 và nhập biểu thức =SUMSQ(B7:E7) Dùng con trỏ kéo kí hiệu tự điền từ ô G7 đến ô G9

- Giá trị SST

Chọn ô I11 và nhập biểu thức =G11-G10/POWER(4,2)

- Giá trị SSE

Chọn ô I10 và nhập biểu thức =I11-SUM(I7:I9)

 Tính các giá trị MSR, MSC, MSF, và MSE

- Các giá trị MSR, MSC và MSF

Chọn ô K7 và nhập biểu thức =I7/(4-1) Dùng con trỏ kéo kí hiệu tự điền từ ô K7 đến ô K9

- Giá trị MSE

Chọn ô K10 và nhập biểu thức =I10/((4-1)*(4-2))

 Tính giá trị G và F

Chọn ô M7 và nhập biểu thức =K7/0.3958 Dùng con trỏ kéo kí hiệu tự điền từ ô M7 đến ô M9

Trang 6

Ví dụ 4.2: Người ta dung ba mức nhiệt độ gồm 105, 120 và 135 C kết hợp với ba khoảng thời gian là 15, 30 và 60 phút để thực hiện một phản ứng tổng hợp Các hiệu suất của phản ứng (%) được trình bày trong bảng sau đây:

- Nh n đ nh ận định ịnh

Hồi quy tuyến tính đa tham số

1) C s lý thuy t: ơ sở lý thuyết: ở lý thuyết: ết:

Phương trình tổng quát cho biến phụ thuộc Y có liên quan đến k biến số

độc lập Xi (i=1,2, ,k):

^

Y X1,X2,…, X k= ¿B0 + B1X1 + B2X2 + … + BkXk

Trang 7

Giá trị thống kê

Sai số N - k - 1 SSE MSE = SSE / (N - k- 1)

R ii2 sẽ trở nên âm hay không xác định nếu R 2 hay N nhỏ

 Độ lệch chuẩn:

S=SSN

(N −k −1) (S ≤ 0.30 là khá tốt) Trắc nghiệm thống kê:

Trang 9

Sử dụng Regression: Data -> Data Analysis

Trong cửa sổ Data Analysis chọn Regression:

Hồi quy theo Thời gian (X 1 ):

Các thông số:

- Input Y Range: Phạm vi biến số Y

- Input X Range: Phạm vi biến số X

- Labels: Dữ liệu bao gồm nhãn

- Confidence Level: Mức tin cậy (chọn 95%)

- Output options: Chọn New Worksheet Ply (Xuất kết quả ở sheet Thời

gian)

Trang 10

Kết quả:

Trang 11

Phương trình hồi quy:

 Nên chấp nhận giả thiết H0

F = 1.9049 < F0.053 = 5.590 (tra bảng VIII với n1 = 1 và n2 = 7) hay F S4 = 0.2100 > α = 0.05

 Nên chấp nhận giả thiết H0.Vậy phương trình hồi quy trên không có ý nghĩa thống kê

Kết luận: Yếu tố thời gian không có liên quan tính tuyến với hiệu suất của

phản ứng tổng hợp

Hồi quy theo Nhiệt độ (X 2 ):

Các thông số ở cửa sổ Regression như Hồi quy theo X 1 , trừ Input X

Range là $B$1:$B$10

Trang 13

Các thông số ở cửa sổ Regression như Hồi quy theo X 1 , trừ Input X

 Nên bác bỏ giả thiết H0

F = 131.3921 > F0.05 = 5.140 (tra bảng VII với n1 = 2 và n2 = 6) hay FS =0.0021 < α = 0.05

Trang 14

 Nên bác bỏ giả thiết H0.Vậy phương trình hồi quy trên có ý nghĩa thống kê.

Kết luận: Hiệu suất phản ứng có liên quan tính tuyến với cả hai yếu tố là

thời gian và nhiệt độ

Dữ liệu với hàm hồi quy Y = -12.7000 + 0.0445X 1 + 0.1286X 2:

Vẽ biểu đồ: chọn ô

C2,

vào Insert -> Scatter -> Scatter with only Maker

Sự tính tuyến của phương trình hồi quy Y X1, X2 = -12.7000 + 0.0445X 1 +

0.1286X 2 có thể được trình bày trên biểu đồ phân tán:

Trang 15

Dự đoán hiệu suất của phản ứng bằng phương trình hồi quy tại nhiệt thời gian(X1) 50 phút, nhiệt độ (X2) 115oC:

Hàm l ượng dự đoán (Y’) ng th c nghi m (Y) ự đoán (Y’) ệm (Y)

Công thức ô E3:

=B1+B2*E1+B3*E2

Kết quả: 4.3109

Trang 16

Câu 2

Một nghiên cứu được tiến hành ở thành phố công nghiệp X để xác định tỷ lệ những người đi làm bằng xe máy, xe đạp và buýt Việc điều tra được tiến hành trên hai nhóm Kết quả như sau:

Kiểm tra cơ cấu sử dụng phương tiện giao thông đi làm trong nhóm công nhân nam và nữ bằng phương pháp so sánh tỉ số

1) C s lý thuy t : ơ sở lý thuyết: ở lý thuyết: ết:

- Đối với một số bài toán có hai hay nhiều kết quả, ta thường phải so sánh hai hay nhiều tỉ số với nhau (thực nghiệm với lý thuyết, thực nghiệm với thực

nghiệm…) Phép trắc nghiệm khi bình phương không chỉ cho phép ta so sánh hai

mà là nhiều tỉ số ( hay tỉ lệ hoặc xác suất một cách tiện lợi )

- χ2 là phân phối về xác suất không có tính đối xứng và có gián trị ≥0 , bà toán với N lần thử nghiệm mỗi lần thử nghiệm có k kết quả và mỗi kết quả mang một xác suất thực nghiệm P i ( i= 1,2,3…,k ) Nếu gọi P i ,0 là các giá trị lý thuyết tươngứng với P i thì các tần số lý thuyết E i = NP i ,0 Điều kiện trắc nghiệm χ2 một cách thành công là các tần số ký thuyết E i ≥ 5

Trang 17

Giả thiết :

H0 : P1=P1,0 , P2=P2,0 , …P k , 0  “Các giá trị trung bình bằng nhau”Các giá trị trung bình bằng nhau”

H1 : “Các giá trị trung bình bằng nhau” Có ít nhất 2 giá tri trung bình bằng nhau “Các giá trị trung bình bằng nhau”

Nếu χ2>χ2α => Bác bỏ giả thiết H0 ( DF= k-1 )

Trong chương trình MS-EXCEL có hàm số CHITEST để tính

- Giả thiết H0 : “Các giá trị trung bình bằng nhau” Cơcấu sử dụng phương tiện giao thông của công nhân nam

và công nhân nữ giống nhau ”

Trang 18

Chọn B8 nhập công thức =B$4*$E2/$E$4, dùng con trỏ kéo nút tự điền từ ô

B8 đến ô D9 hoặc nhấn tổ hợp phím ctrl + enter

Ta được bảng sau :

Áp dụng hàm CHITEST:

Chọn A11 và nhập biểu thức =CHITEST(B2:D3,B8:D9)

Ta sẽ có được kết quả của P( X> χ¿¿ 2) ¿

Kết luận:

P( X> χ¿¿ 2) ¿= 0.0022 < α = 0.05 => Bác bỏ giả thuyết Ho

Cơ cấu sử dụng các phương tiện giao thông đi làm trong 2 nhóm công nhân nam và nữ khác nhau

Trang 19

Tương đối Không

A B C D E

220 130 84 156 122

121 207 54 95 164

63 75 24 43 73

Với mức ý nghĩa  = 3%, kiểm định xem mức độ thỏa mãn cuộc sống có phân

bố giống nhau trong 5 thành phố trên hay không?

Bài toán kiểm định mức độ thỏa mãn cuộc sống tại năm thành phố bằng phươngpháp so sánh tỉ số

1) C s lý thuy t ơ sở lý thuyết: ở lý thuyết: ết: :

Đối với một thí nghiệm có hai kết quả (binomial experiment) – thí dụ, đối với một thuốc được kê đơn: có hay không - bạn thường so sánh hai tỉ số với nhau (thực nghiệm với lí thuyết hay thực nghiệm với thực nghiệm) Song đối với một thí nghiệm có nhiều kết quả (multinomial experiment)-thí dụ, bác sĩđánh giá tình trạng của các bệnh nhân được điều trị bởi thuốc trong một khoảng thời gian - bạn cần so sánh nhiều tỉ số Trắc nghiệm “Các giá trị trung bình bằng nhau”khi” bình phương (X2) cho phép bạn so sánh không những hai mà còn nhiều tỉ số (hay tỉ lệ hoặc xác suất) một cách tiện lợi X2 là phân phối về xác suất, không có tính đối xứng và

Trang 20

chỉ có giá trị ≥ 0 Giả sử bạn có một công trình nghiên cứu với N thử nghiệm độc lập, mỗi thử nghiệm có k kết quả và mỗi kết quả mang một các xác suất thựcnghiệm là Pi(i = 1, 2, …k) Nếu gọi Pi,0 là các giá trị lí thuyết tương ứng với Pi thì các tần số lí thuyết sẽ là

Ei = NP i ,0 Điều kiện để áp dụng trắc nghiệm X2một cách thành công là các tần số lí thuyết Ei phải ≥ 5

Giả thuyết

H0: P1=P1,0, P2=P2,0, … , P k , 0 “Các giá trị trung bình bằng nhau”Các cặp P i và P i ,0 giống nhau”

H1 : “Các giá trị trung bình bằng nhau” Ít nhất có một cặp P i và P i ,0 khác nhau”

O i - các tần số thực nghiệm (observed frequency)

E i - các tần số lý thuyết (expected frequency)

Biện luận:

Nếu χ2>χ2α => bác bỏ giả thiết H0

Giá trị χ2 tính theo biểu thức:

O i - các tần số thực nghiệm của ô thuộc hàng i cột j

E i - các tần số lý thuyết của ô thuộc hàng i cột j, r là số hàng và c là số cột

Xác xuất P( X> χ2) với bậc tự do DF = (r - 1)(c - 1); trong đó r là số hàng và c là

số cột trong bảng VI

Nếu P( X> χ¿¿2)> α¿ => Chấp nhận giả thiết H0 và ngược lại

Trang 21

2) Bài làm

Ta cần đi kiểm định giả thiết:

Ho: mức độ thỏa mãn cuộc sống phân bố giống nhau trong 5 thành phố trên

Nhập dữ liệu vào bảng và tính tổng:

Trang 22

Tính các tần số lý thuyết:

Tần số lý thuyết = ( tổng hàng * tổng cột ) / tổng cộng

Chọn ô B10 nhậpcôngthức=(B$8*$E3/$E$8), sau đó kéo nút tự điền từ B10 đến D14 hoặc nhấn tổ hợp phim ctrl + enter, ta sẽ được kết quả.

Trang 23

Áp dụng hàm CHITEST:

Chọn ô E15 và nhập biểu thức=CHITEST(B3:D7;B10:D14)

Ta sẽ có được kết quả củaP( X> χ¿¿ 2) ¿

Kết luận :

P( X> χ¿¿ 2)=3.5299∗10 −13

¿ < 0.03 bác bỏ giả thiết Ho Vậy mức độ thỏa mãn cuộc sống có phân bố khác nhau trong 5 thành phố trên

Trang 24

Câu 4

Sau đây là số liệu về số lượng một loại báo ngày bán được ở 5 quận nội thành:

Thứ haiThứ baThứ tưThứ nămThứ sáuThứ bảy

222125242830

181825241922

222225181528

181819202225

181920222525Lượng báo bán được ở 5 quận có khác nhau thực sự không? Chọn  = 2%.Lượng báo bán ra có chịu tác động của các yếu tố ngày trong tuần không?

- Nh n đ nh ận định ịnh

Bài toán phân tích phương sai 2 yếu tố không lặp

1) C s lí thuy t: ơ sở lý thuyết: ở lý thuyết: ết:

Phân tích phương sai hai yếu tố không lặp:

Sự phân tích này nhằm đánh giá sự ảnh hưởng của hai yếu tố trên các giá trị quan sát Yij (i=1,2…r: yếu tố A; j=1,2…c: yếu tố B)

Trang 25

Bình phương trung bình

Giá trị thống kê Yếu tố A

H0: μ1=μ2=…μ k  “Các giá trị trung bình bằng nhau”Các giá trị trung bình bằng nhau”

H1: μ1≠ μ2  “Các giá trị trung bình bằng nhau”Ít nhất có hai giá trị trung bình khác nhau”

Trang 26

Giá trị thống kê:

F R=MSB MSE và F C=MSF

MSE

Biện luận:

Nếu F R<F a[b−1,(k −1) (b−1 )] => Chấp nhận H0 (yếu tố A)Nếu F C<F a[b−1, (k−1) (b−1)] => Chấp nhận H0 (yếu tố B)

2) Bài làm

Áp dụng “Anova: Two-Factor Without Replication”

Vào Data -> Data Analysis Chọn mục Anova: Two-Factor Without

Replication Chọn OK.

Trang 27

Trong hộp thoại Anova: Two-Factor Without Replication lần lượt ấn định

các chi tiết:

 Phạm vi đầu vào (Input Range): $A$2:$F$8

Nhãn dữ liệu (Labels in First Row/Column)

Ngưỡng tin cậy (Alpha): 0.02 (mức ý nghĩa = 2%)

Nhấn OK Ta được bảng sau:

Trang 28

Kết luận:

FR = 3,5672 > F0.02 = 3,4817 =>không chấp nhận giả thiết H0(thứ)

→ Vậy lượng báo bán ra có sự khác nhau theo thứ

FC = 2,4748< F0.02 = 3,7313=> chấp nhận giả thiết H0 (quận)

→ Vậy lượng báo bán ra theo quận không có sự khác nhau

Trang 29

Câu 5

Theo dõi ngẫu nhiên giá thuê nhà tại 5 thành phố (với điều kiện thuê nhà như nhau) thu được các số liệu sau:

Thành phốA

900

1200

850 132

0

1400

1150975

Thành phốB

625

640 775 100

0

0Thành phố

C

415

0Thành phố

D

410

Thành phốE

340

Hãy tìm P-value để kiểm định xem có sự khác biệt về giá thuê nhà ở 5 thành phố nói trên hay không

-Nh n đ nh ận định ịnh

Bài toán phân tích phương sai một yếu tố

1) C s lí thuy t: ơ sở lý thuyết: ở lý thuyết: ết:

Phân tích phương sai một yếu tố

Sự phân tích này nhằm đánh giá sự ảnh hưởng của một yếu tố trên các giá trị quan sát Yi (i=1,2,…,k)

Trang 30

Tổng số bình phương

Bình phương trung bình

Giá trị thống kê Yếu tố

Giả thuyết:

H0: μ1=μ2=…μ k  “Các giá trị trung bình bằng nhau”Các giá trị trung bình bằng nhau”

H1: μ1≠ μ2  “Các giá trị trung bình bằng nhau”Ít nhất có hai giá trị trung bình khác nhau”

Giá trị thống kê:

F= MSF MSE

Biện luận:

Nếu F R<F a(k −1, N −k ) => Chấp nhận giả thiết H0

Trang 31

2) Bài làm:

Nhận xét: Đây là bài toán phân tích phương sai một yếu tố

Giả thiết H 0 : không có sự khác biệt về giá thuê nhà ở 5 thành phố

Nhập bảng số liệu như hình dưới:

Vào Data /Data analysis, chọn Anova: Single Factor rồi bấm OK

Trên màng hình sẽ hiện lên hộp thoại của Anova: Single Factor

Ta nhập các thông số như hình dưới

Phạm vi của biến số Y(Input Range): ta kéo chuột từ ô A1 tới ô I5

 Alpha: 0.05

Group by: Rows

Xuất kết quả (Output options): kích vào New Worksheet Ply

Trang 32

Ta được kết quả như sau:

Trang 33

Kết Luận

P-Value = 6.46E-10 < Alpha=0.05

F= 28.08985 > F0.05 =2.6787

Suy ra: Không chấp nhận giả thuyết Ho

Vậy có sự khác biệt về giá thuê nhà giữa 5 thành phố

Ngày đăng: 29/08/2017, 08:51

HÌNH ẢNH LIÊN QUAN

Bảng ANOVA: - Báo cáo bài tập lớn xác suất thống kê đh bách khoa
ng ANOVA: (Trang 6)
Bảng ANOVA - Báo cáo bài tập lớn xác suất thống kê đh bách khoa
ng ANOVA (Trang 27)
Bảng ANOVA - Báo cáo bài tập lớn xác suất thống kê đh bách khoa
ng ANOVA (Trang 32)

TỪ KHÓA LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w