Báo cáo bài tập lớn môn xác suất thống kê GVHD nguyễn đình huy Báo cáo bài tập lớn môn xác suất thống kê GVHD nguyễn đình huy Báo cáo bài tập lớn môn xác suất thống kê GVHD nguyễn đình huy Báo cáo bài tập lớn môn xác suất thống kê GVHD nguyễn đình huy Báo cáo bài tập lớn môn xác suất thống kê GVHD nguyễn đình huy Báo cáo bài tập lớn môn xác suất thống kê GVHD nguyễn đình huy Báo cáo bài tập lớn môn xác suất thống kê GVHD nguyễn đình huy Báo cáo bài tập lớn môn xác suất thống kê GVHD nguyễn đình huy Báo cáo bài tập lớn môn xác suất thống kê GVHD nguyễn đình huy Báo cáo bài tập lớn môn xác suất thống kê GVHD nguyễn đình huy Báo cáo bài tập lớn môn xác suất thống kê GVHD nguyễn đình huy Báo cáo bài tập lớn môn xác suất thống kê GVHD nguyễn đình huy Báo cáo bài tập lớn môn xác suất thống kê GVHD nguyễn đình huy Báo cáo bài tập lớn môn xác suất thống kê GVHD nguyễn đình huy Báo cáo bài tập lớn môn xác suất thống kê GVHD nguyễn đình huy Báo cáo bài tập lớn môn xác suất thống kê GVHD nguyễn đình huy Báo cáo bài tập lớn môn xác suất thống kê GVHD nguyễn đình huy Báo cáo bài tập lớn môn xác suất thống kê GVHD nguyễn đình huy Báo cáo bài tập lớn môn xác suất thống kê GVHD nguyễn đình huy Báo cáo bài tập lớn môn xác suất thống kê GVHD nguyễn đình huy Báo cáo bài tập lớn môn xác suất thống kê GVHD nguyễn đình huy Báo cáo bài tập lớn môn xác suất thống kê GVHD nguyễn đình huy Báo cáo bài tập lớn môn xác suất thống kê GVHD nguyễn đình huy Báo cáo bài tập lớn môn xác suất thống kê GVHD nguyễn đình huy Báo cáo bài tập lớn môn xác suất thống kê GVHD nguyễn đình huy
Trang 2BAISO 8
I Trinh bay lai vi du 3.4 trang 207 va vi du 4.2 trang 216 Sach BT XSTK 2012 (N.D.HUY)
Vi du 3.4 trang 207 sach BT
Hiéu suat phan tram (%) của một phản ứng hoá học được nghiên cứu theo ba yêu tô pH
(A) nhiệt độ (B) và chât xúc tác (C) được trình bày trong bảng sau:
Phân tích phương sai ba yếu tô
e© _ Cơ sở lý thuyết:
Sự phân tích này được dùng đề đánh giá về sự ảnh hưởng của ba yêu tố trên các giá trị
quan sat G (i= 1, 2 r: yéu t6 A; j = l1, 2 r: yêu tô B; k = 1, 2 r: yêu tô C)
Mô hình vuông latinh 3 yếu tố được trình bày như sau:
Yếu tô C (T k ví dụ: T I = Y111 + Y421 + Y331 + Y241)
Trang 3Hạ: tị = tạ = = tụ Các giá trị trung bình bằng nhau
Hị: tị # tụ Có ít nhất hai giá trị trung bình khác nhau
Trang 4Chon ô B7 và nhập biểu thức =SUM(B2:E2)
4 Tính giá trịT (tông các phân tử trong bảng)
Chon 6 B10 va nhập biêu thức =SUM(B2:E5)
+ Tính các gia tri SSR,SSC,SSF,SST va SSE
“+ Cac gia tri SSR,SSC va SSF
Chon ô K7 và nhap biéu thtre =17/(4-1)
Dùng con trỏ kéo kí hiệu tự điền từ ô K7 đến ô K9
Giá trị MSE
Trang 5Chọn ô K10 và nhập biểu thức =I10/((4-1)*(4-2))
* Tính các giá trị G và F
Chọn ô M7 và nhập biêu thức =K7/0.3958
Dùng con trỏ kéo kí hiệu tự điền từ ô M7 đến ô M9
Kết luận và Biện luận:
®©_ Fạ=3.10< Foos(3.6)= 4.76 =>chap nhan Ho(pH)
Trang 6Sử dụng chương trình “ Regression” trong the Data => Data Analysis
Chọn OK hộp thoại Regression xuất hiện
Trong hộp Regression,lần lượt ấn định các chỉ tiết
- Phạm vi của biến số Y (Input Y Range)
- Pham vi của biến số X (Input Y Range)
- - Nhãn dữ liệu (Labels)
- Muc tin cay (Confidence Level)
- Toa d6 dau ra (Output Range)
- Va mot số tùy chọn khác như đường hồi quy (Line Fit Plots), biéu thirc sai sO (Residuals Plots)
1 Phwong trinh héi quy twong wng X,
Kiém dinh gia thiét H,: thời gian không liên quan tuyến tính với hiệu suất của phản ứng tông hợp
Input
Input Y Range: $C$1:$C$10
Input X Range: $A$1:SA$10
Labels || Constant is Zero
|| Standardized Residuals |V¥) Line Fit Plots
Normal Probability
|| Normal Probability Pilots
Trang 7
= chap nhan gia thiét H,
t= 1.3802 < tos = 2.365 (P\= 0.2099 > a = 0.05) (Tra bang STUDENT)
=> chap nhan gia thiét H,
F = 1.905 < Fos” = 5.590 (hay F, = 0.209 > a = 0.05) (Tra bang FISHER)
= chap nhan gia thiét H,
Vậy cả 2 hệ số 2.73(Bụạ) và 0.04(B,) của phương trình hồi quy (1) đều không có ý nghĩa
Trang 8thống kê Do vậy phương trình hồi quy này không thích hợp
Kết luận: Vậy yếu tô £hời gian không liên quan tuyến tính với hiệu suất của phản ứng tông hợp
2 Phương trình hồi quy tương ứng X;
Kiểm định giả thiết H,: nhiệt độ không liên quan tuyến tính với hiệu suất của phản ứng tông hợp
Trang 9Ta cũng kết luận: Hai hệ số -11.141(B,) và 0.1286(B;) của phương trình hôi quy(2)
đêu có ý nghã thống kê Hay nói phương trình hôi quy này phù hợp
Vậy yếu tô nhiệt độ liên quan tuyến tính với hiệu suất của phản ứng tông hợp
3 Phương trình hồi quy tương ứng X¡.X;
Kiểm định giả thiét H,: thoi gian và nhiệt độ không liên quan tuyến tính với hiệu suất của phan tng tong hop
Trang 10|) Residuals
Trang 11
= bac bé gia thiét Ho
ty = 14.3278 > tos = 2.365 (Py = 7.234x10*-6< a = 0.05) (Tra bang STUDENT)
—= bác bỏ giả thiết Hụ
F= 131.392 >Foos' “5= 5.140 ( hay F, =1.112x10^-5 < a = 0.05) (Tra bảng FISHER)
—= bác bỏ giả thiết Hụ
Vậy các hệ sô -12.7(Bạ) , 0.04(B,) va 0.1286(Bo) của phương trình hỏi quy (3) đều có ý
nghĩa thông kê Vậy phương trình này là phù hợp
Kết luận: :hời gian và nhiệt độ có liên quan tuyên tính với hiệu suất của phản ứng tông hợp
Sự tuyến tính của phương trình Yx1,x2 =—12.70+ 0.04x1+0.1286x2
Dự đoán hiệu suất phản ứng bằng phương trình hồi quy (3) ta làm như sau
Hiệu suất dự đoán = By + B,*50 + B,*115
Với Bọ, Bị, B; là hệ số phương trình hỏi quy (3)
Trang 12Kết qua thu được như sau:
Standard Coefficients Error t Stat
a) Tìm đường hồi quy của Y đối với X
b) Tính sai số tiêu chuẩn của đường hồi quy
c) Tính tỷ số F để kiểm định giả thiết có hồi quy tuyến tính giữa Y với X
Trang 13Thực hiện bài toán bằng Excel
* Trong hop thoai Regression lần lượt ấn định:
e Pham vi đầu vào: Input Y Range, quét ving(B3:B23)
Input X Range, quét ving(A3:A23)
e Chon Labels (thém nhãn dữ liệu)
e Pham vi daura: Output Range, chon 6 D3
¢ Chon Line Fit Plots trong Residuals dé vé dudng héi quy
Regression
Input
Input ¥ Range:
Input X Range: $A$3:$A$23
` Standardized Residuals |¥) Line Fit Plots
Normal Probability (| Normal Probability Plots
& Sau đó nhân OK ta có kết quả :
Trang 142 Câu 2 (Hồi quy tuyến tính) | cơ _
Sai số tiêu chuẩn của đường hỏi quy : 2,22
(tra bang phan tô Fisher với bậc tự do (1,18) ở mức 0,05)
Vậy: có hôi quy tuyến tính giữa Y với X
Có hồi quy tuyến tính giữa đường kính và chiều cao
BAI3
Một công ty muốn mớ rộng việc bán sản phẩm sang 3 thị trường nước ngoài Để đánh giá xem thị phần mà công ty có thế chiếm lĩnh được tại ba thị trường đó so với các đối thủ cạnh tranh có khác nhau hay không người ta đã thủ nghiệm thị trường
bằng cách bán thử sản phẩm cho 150 khách hàng tiềm năng tại mỗi thị trường và thu
được kết quả sau:
Trang 15Hạ : Pị=P\ o; P;_ Pạ ọ; ; P,o <Ð> các cặp P¡ và P;o giông nhau
H, : co it nhất mot cap P; và P;¡o khác nhau
Z} > # ((a) ® bác bỏ giả thiết Hạ (DF=K-l)
Trong Excel có hàm Chitest có thê tính giá trị ” theo biểu thức:
O:3—E: ‘2
8 r c (Oj-Fij
# De Lj, 2 1
Oj; : các tân SỐ thực nghiệm cua 6 thudc hang thu I cot j
Hy : các tan số lý thuyết của ô thuộc hàng thứ I cột j; r là số hàng: c là số
cột
e Xác suất P(X> x’) voi bac tu do DF= (r-1) (c-1)
Nêu P(X > y?) > « — chap nhan gia thiét H, va nguogc lai
THUC HIEN BAI TOAN BANG EXCEL
+ Nhập giá trị vào bảng tính:
Trang 16Tinh tong cac so:
e Tổng hàng: Chọn F3, nhập =SUM(B3:D3), rồi Enter, diing con trỏ kéo nút tự
diéu khién tir dién tir F3 dén F6
+ Tổng cột: Chọn B8, nhập =SUM(B3:B6), rồi Enter, dùng con trỏ kéo nút tự
e B: Chọn C12: nhập =F3*$C$8/$F$8, rồi Enter, dùng con trỏ kéo nút tự điều
e C: Chọn D12: nhập =F3*$D$8/$F$8, rồi Enter, dùng con trỏ kéo nút tự điều
Trang 17e Ap dung hàm số CHITEST tính giá trị P(X > #2)
Chọn B17, nhập =CHITEST(B3:D6,B12:D15), rồi Enter
Hoặc chọn Formulas — Insert Function — chitest — OK
Xuât hiện hộp thoại Function Agruments
® Nhập các giá trị tân sô quan sát vào mục Actual_range
e Nhập các giá trị tần số lí thuyết vào mục Expected_range Chon OK
Expected_range is the range of data that contains the ratio of the product of row totals and
column totals to the grand total
Formula result = 0,000448454
Ta được P = 0.00044854 < 0.05 nên bác bó giả thuyết Hạ
=› Kết luân: Như vậy cơ câu 3 thị trường trên là không giống nhau
Trang 18
BAI GIAI
L.Cở sở lý thuyết:
a.Dạng bài toán : Phân tích phương sai I yếu tô
b.Khái niệm thống kê và giả thuyết bài toán:
Sự phân tích phương sai 1 yếu tô là đánh giá sự ảnh hưởng của một yếu tố (nhân tạo hay tự
nhiên) nào đó trên các giá trị quan sat , Y; ,(i=1,2, ,k)
Ho: My, = , = ,u„ © “ Cac gia tri trung binh bang nhau”
Ay wth, Ít nhất có hai giá trị trung bình khác nhau”
0 Gia tri thống kê:
Trang 19Ta gia thiết:
Mực nước sông trung bình/ngày của các điểm đã đo là như nhau
THUC HIEN BAI TOAN BANG EXEL
Nhấp vào lénh Data va lénh Data Analysis
Chọn chương trình Anova:Single Factor trong hộp thoại Dafa Analysis rôi nhân OK
Anova: Two-Factor Without Replication
Trong hop Anova:Single Factor lần lượt ấn định:
Pham vi dau vào (Input Range):ta kéo từ B2 đến E9
Cách sắp xếp theo hàng hay cột (Group By):Chọn Columns
Nhấn dữ liệu (Labels in Fisrt row/column)
Pham vi dau ra (Output Range):Chon A12.
Trang 21
a Dạng bài toán : Phân tích phương sai 2 nhân tố không liên quan
b Khái niệm thống kê và giả thiết bài toán :
Sự phân tích này nhằm đánh giá sự ảnh hưởng của hai yếu tô trên các giá trị quan sát Yi (i= 1.2 r: yếu tô A; j = 1.2 c : yếu tô B)
Trang 22
Trac nghiém
© Gia thiét:
Ho: My = My = ©> “ Các giá trị trung bình bằng nhau”
H): H,#jủ, © ” Ít nhất có hai giá trị trung bình khác nhau”
© Gia tri thống kê:
b Nhap lần lượt Data tab và Data Analysis tab
c Chọn chương trình Anova : Two-Factor Without Replication trong hộp thoại Data Analysis rôinhâp nút OK
sua Analysis Tools Km Anova: Single Factor
Anova: Two-Factor With Tp at 3 Correlation
F-Test Two-Sample for Variances
Fourier Analysis Histogram >4
d Trong hộp thoại Anova: Single Factor lần lượt xác định:
Phạm vi đầu vào (Input Range)
Cách sắp xếp theo hàng hay cột (Group by)
Nhãn dữ liéu (Label in First Row/Column)
Pham vi dau ra (Output Range)
Trang 23Fr = 24,91589 > Foos = 6.944272 — Bac bỏ giả thuyết Hạ( Thành phô)
Fo = 24,7477 > Fos = 6.944272 — Bác bỏ giả thuyêt Hạ( Loại dich vụ)
Vay chi phi cho 3 loai dich vu 6 3 thanh phố khác nhau không chịu ảnh hưởng của thành phô hay loại dịch vụ nên chúng giông nhau