Đặt giả thiết: Hị: Hiệu suất phản ứng trung bình của các phản ứng không phụ thuộc vào pH Yếu tố pH không ảnh hưởng đến hiệu suất phản ứng trung bình.. Hạ: Hiệu suất phản ứng trung bình c
Trang 1TRUONG DAI HOC BACH KHOA
a
eo
XAC SUAT VA THONG KE (MT2013)
Bài Tập Lớn 1
Giải bài toán băng các phầi mền Thống kê
GV ra đề và HD: Nguyễn Đình Huy
Sinh viên thực hiện: L15, Nhóm 06
Thanh phố H ôChí Minh, 04 - 2021
Trang 2Nhóm 06 - LI5 - GVHD: Nguyễn Đình Huy
3.1.2 Giải bài toán bằng IBM SPSS
Vidu 12/181 2 Q Q Q Q Q Q Q HQ V2 3.217 Đềbài Q Q Q Q Q HQ HQ va
3.2.2 Giải bài toán bằng IBM SPSS
Trang 3> 4 Nhóm 06 - LI5 - GVHD: Nguyễn Đình Huy
1 Loi mo du
Xác suất và Thống kê đóng vai trò quan trọng trong cuộc sống hằng ngày Nấm chắc kiến thức về xác suất, thống kê có thể giúp chúng ta giải quyết được rất nhiên bài toán thực tế
Ngoài việc nấm lý thuyết, chúng ta còn cần phải biết cách sử dụng các công
cụ hỗ trợ cho việc tính toán, đặc biệt là các phầìi mền thống kê Nổi bật có thể
kể đến các phầìi mm nhu R, SPSS, MS-Excel, Qua BTLI này, chúng ta sẽ cùng giải các bài toán để hiểu hơn về cách sử dụng các phần mềần thống kê
Trang 4> 4 Nhóm 06 - LI5 - GVHD: Nguyễn Đình Huy
Hãy đánh giá về ảnh hưởng của các yếu tố trên hiệu suất phản ứng
3.1.2 Giải bài toán bằng IBM SPSS
Phương pháp: Phân tích phương sai 3 yếu tố
Đặt giả thiết:
Hị: Hiệu suất phản ứng trung bình của các phản ứng không phụ thuộc vào pH (Yếu tố pH không ảnh hưởng đến hiệu suất phản ứng trung bình)
Hị: Tần tại 2 pH có hiệu suất phản ứng trung bình khác nhau
Hạ: Hiệu suất phản ứng trung bình của các phản ứng không phụ thuộc vào nhiệt độ (Yếu tố nhiệt độ không ảnh hưởng đến hiệu suất phản ứng trung bình)
Hạ: Tần tại 2 nhiệt độ có hiệu suất phản ứng trung bình khác nhau
Bài tập lớn 1 môn Xác Suất và Thống Kê (MT2013), HK2, Năm học 2020-2021 Trang 3/50
Trang 5< Nhóm 06 - LI5 - GVHD: Nguyễn Đình Huy
Hạ: Hiệu suất phản ứng trung bình của các phản ứng không phụ thuộc vào chất xúc tác (Yếu tố chất xúc tác không ảnh hưởng đến hiệu suất phản ứng trung bình)
H:: Tồn tại 2 chất xúc tác có hiệu suất phản ứng trung bình khác nhau
Khai báo biến dữ liệu trong cửa sổ Varible view:
File Edt View Data Transform Analyze Direct Marketing Graphs Utilities Add-ons Window
Buel Res Be ABE RAS 228 99 |
| | Type | Width |Decimais| Label | Values | Missing | Columns| Alin | Measure | Role
1 mm Sting 8 0 None None 8 = Left & Nominal “ Input
2 nhietdo String 8 ñ None None 8 = Left & Nomina! ® Input
3 chatuctac Sting 8 ũ None None 10 = Left => Nominal ® Input
4 hieusuatph Numeric 8 2 None None 14 = Right [PScale |S Input
5
Nhập số liệu vào cửa sổ Dafta view:
File Edit View Data Transform Analyze DirectMarketng Graphs Utilities Adc
SHu6 Rez SRR RSE
Bài tập lớn 1 môn Xác Suất và Thống Kê (MT2013), HK2, Năm học 2020-2021 Trang 4/50
Trang 6> Nhóm 06 - LI5 - GVHD: Nguyễn Đình Huy
Chon Analyze — General Linear Model — Univariate
Trang 7Nhóm 06 - LI5 - GVHD: Nguyễn Đình Huy
Chon Model — Custom — đưa các biến pH, Nhietdo và Chatxucfac vào khung Model—>Continue
lo Full factorial ® Custom
Factors & Covariates: Model:
Chọn Options, nhập mức y nghia & 6 Significance level
Continue
= 005 —
Bài tập lớn 1 môn Xác Suất và Thống Kê (MT2013), HK2, Năm học 2020-2021 Trang 6/50
Trang 8> 4 Nhóm 06 - LI5 - GVHD: Nguyễn Đình Huy
Estimated Marginal Means
Factor(s) and Factor Interactions: Display Means for:
(OVERALL)
nhietdo chatxuctac
mm Compare main effects
C al adjustment
-Display
¡ Descriptive statistics ("| Homogeneity tests
| Estimates of effect size ("| Spread vs level plot
| Observed power ("| Residual plot
| Parameter estimates () Lack of fit
| Contrast coefficient matrix (| General estimable function
Significance level: Confidence intervals are 95.0 %
(continue) Cancel }_Help_)
Kết quả và biện luận:
Tests of Between-Subjects Effects Dependent Variable: hieusuatphanung
Type Ill Sum
Source of Squares df Mean Square F Sig
a R Squared = 958 (Adjusted R Squared = 894)
Bài tập lớn 1 môn Xác Suất và Thống Kê (MT2013), HK2, Năm học 2020-2021 Trang 7/50
Trang 93 Nhóm 06 - LI5 - GVHD: Nguyễn Đình Huy
Với mức mức ý nghĩa 0.05, r=4 ta có bật tự do là (3,6) Fa.05=4.76(dò bảng VIII trang 201 Giáo trình với nị =3, nạ =6)
Bang Test of Between-Subjects Effects cho ta két qua:
* Fr = Fey = 3,105
* Fo = Fhhietto = 11,947
° F = Fonatxuctae = 30,053
Fạ< Fo.05(Hoặc sigFyy =0,110> a =0,05) Chấp nhận giả thiết H¡(P H)
Yếu tế pH không ảnh hưởng đến hiệu suất phản ứng trung bình
Fc > Fạ,05(Hoặc sigEnueao =0.006< œ =0,05) Bác bỏ giả thiết (Nhietdo)
Tần tại 2 nhiệt độ có hiệu suất phản ứng trung bình khác nhau
F > Fy,05(sigF.hatxuctac =0,001< a =0,05) Bac bd giả thiết (Chatxuc-
tac)
Tần tại 2 chất xúc tác có hiệu suất phản ứng trung bình khác nhau
Kết luận:
s Yếu tố pH không ảnh hưởng đến hiệu suất phản ứng trung bình
* Tôn tại 2 nhiệt độ có hiệu suất phản ứng trung bình khác nhau
* Tên tại 2 chất xúc tác có hiệu suất phản ứng trung bình khác nhau
3.2 Ví dụ 12/181
3.21 Đề bài
Người ta đã dùng ba mức nhiệt d6 g%m 105, 120 và 135°C kết hợp với ba khoảng thoi gian là 15, 30, 60 phút để thực hiện một phản ứng tổng hợp Các hiệu suất của phản ứng (%) được trình bày trong bảng sau đây:
Bài tập lớn 1 môn Xác Suất và Thống Kê (MT2013), HK2, Năm học 2020-2021 Trang 8/50
Trang 10Nhóm 06 - LI5 - GVHD: Nguyễn Đình Huy
Dạng toán: Hỗ quy tuyến tính đa tham số
3.2.2 Giải bài toán bằng IBM SPSS
Nhập dữ liệu vào tab Variable view:
File Edit View Data Transform Analyze Direct Marketing Graphs Utilities Add-ons Window Help
Missing | Columns! Align Measure None 8 = Center £ Scale None 8 = Center 2 Scale None 8 = Center
Trang 11Nhóm 06 - LI5 - GVHD: Nguyễn Đình Huy
Nhập số liệu vào cửa sổ Dafta view:
File Edit View Data Transform Analyze DirectMarketin
Trang 12Nhóm 06 - LI5 - GVHD: Nguyễn Đình Huy
View Data Transform
Compare Means m——- va | var | var | var
General Linear Model ` Generalized Linear Models »
Mixed Models `
Correlate »
[Bi Automatic Linear Modeling
Loglinear `
Neural Networks > eae
Classy Partial Least Squares
Multiple Response >» |G Noniinear
| Ea Missing Value Analysis fal Weight Estimation
Multple imputation » | [Ei 2-Stage Least Squares
Complex Samples » Optimal Scaling (CATREG)
§& Simulation seein ‘ \IBM SPSS Statistics istics F
EAROC Curve “ee r
1 Cho Y vào khung Dependent, cho X1 vao khung Independents
Trang 13Nhóm 06 - LI5 - GVHD: Nguyễn Đình Huy
Kết quả và biện luận:
a Dependent Variable: Y
b All requested variables entered
Model Summary Adjusted R Std Error of Model R R Square Square the Estimate
Trang 14
> 4 Nhóm 06 - LI5 - GVHD: Nguyễn Đình Huy
F =1,905< F 3 995=5,590(Hay F4 , =0,209> a =0,05)
— Chap nhận giả thuyết Hạ
hồ quy này không thích hợp
Kết luận: Yếu tố thơi gian không liên quan tuyến tính tới hiệu suất của phản ứng tổng hợp
2 Cho Y vào khung Dependent, cho X2 vào khung Independents
Kết quả và biện luận:
Bài tập lớn 1 môn Xác Suất và Thếng Kê (MT2013), HK2, Năm học 2020-2021 Trang 13/50
Trang 15Nhóm 06 - LI5 - GVHD: Nguyễn Đình Huy
Trang 16> 4 Nhóm 06 - LI5 - GVHD: Nguyễn Đình Huy
«XI
(x)
| Method: [Enter > | | Selection Variable-
Trang 17Variables Variables Model Entered Removed Method
a Dependent Variable: Y
b All requested variables entered
Model Summary Adjusted R Std Error of Model R R Square Square the Estimate
Trang 18- Nhóm 06 - LI5 - GVHD: Nguyễn Đình Huy
Kết luận: Hiệu suất của phản ứng tổng hợp có liên quan tuyến tính với cả hai yếu tố là thởi gian và nhiệt độ
— Điền kiện nhiệt độ 115°C trong vòng 50 phút thì hiệu suất phản ứng sẽ là:
xi = =12,70+0.04X: +0, 13X; = —12,70+0,01.50+0, 13.115=4,25
Bài tập lớn 1 môn Xác Suất và Thống Kê (MT2013), HK2, Năm học 2020-2021 Trang 17/50
Trang 194 Nhóm 06 - LI5 - GVHD: Nguyễn Đình Huy
Trang 204 Nhóm 06 - LI5 - GVHD: Nguyễn Đình Huy
Giá trị thống kê: Giá tr R bình phương
+ Giá tri R* duoc hiéu chinh (Adjusted R Square )
R WN SRO _ kF
ST — (N-k-IHkF + Giá tri R* duoc hiéu chinh (Adjusted R Square )
Độ lệch chuẩn:
2 Rij
S 1 SÑH—I1 Công cụ hỗ trợ giải:
* Ham TINV ( mitc ý nghĩa, bậc tự do)
Kết luan: Néu F < F,(1, N -2)— Chap nhan gia thuyét Hp
Bài tập lớn 1 môn Xác Suất và Thống Kê (MT2013), HK2, Năm học 2020-2021 Trang 19/50
Trang 21
4 Nhóm 06 - LI5 - GVHD: Nguyễn Đình Huy
4.2 Giải toán bằng phầì mền MS-EXCEL
4.2.1 Phân tích tương quan tuyến tính
Bước 1: Đặt giả thiết:
Hạ: X, Y không có tương quan tuyến tính
H;: X, Y có tương quan tuyến tinh
Trang 22> 4 Nhóm 06 - LI5 - GVHD: Nguyễn Đình Huy
Bước 3: Chon Data — Data Analysis — Regression
Mi Review View Power Pivot Nguyễn 2 BYTE
v ¬ š =D :
i Sort Filter Data What-If Forecast Outline
4 Tools~ Analysis Sheet =
Sort & Filter Forecast Analysis ^
Random Number Generation Rank and Percentile Reare , Sampling t-Test: Paired Two Sample for Means t-Test: Two-Sample Assuming Equal Variances t-Test: Two-Sample Assuming Unequal Variances z-Test: Two Sample for Means
Trang 23O New Worksheet Ply:
O New Workbook Residuals L] Residuals L] Residual Plots
L_] standardized Residuals L_] Line Fit Plots Normal Probability
(] Normal Probability Plots
Kết quả
D E F G H | J K Ẻ SUMMARY OUTPUT
Trang 24> 4 Nhóm 06 - LI5 - GVHD: Nguyễn Đình Huy
Vào Formulas — chon Insert Function
G6 TINV vao thanh tim kiém ham — Go
Chon ham TINV — OK
Page layout Formulas Data D o0 WY Power Pivot
IB IR I4) | fy, ]Define Name ~- 3 Trace Precedents [5 Show F
a fx Use in Formula oyt Trace Dependents @ Error C
inancial Logical Text Date & Lookup & Math& More Name ; sẽ = ~ ~ Time Reference Trig~ Functions~ Manager ES Create from Selection + Remove Arrows ~ (&) Evaluat
Function Library Defined Names Formula Auditin
Total! tiyviprobability,deg freedom)
This function is available for compatibility with Excel 2007 and earlier
Returns the two-tailed inverse of the Student's t-distribution
Lower 95% | -37.36235616 1.146638802
Bài tập lớn 1 môn Xác Suất và Thống Kê (MT2013), HK2, Năm học 2020-2021 Trang 23/50
Trang 25> 4 Nhóm 06 - LI5 - GVHD: Nguyễn Đình Huy
Function Arguments
TINV
Probability 0.05 4l = 0.05 Deg freedom 28-2| fii] = 26
= 2055529439
This function is available for compatibility with Excel 2007 and earlier
Returns the two-tailed inverse of the Student's t-distribution
IT] = 20,7583 > C = 2,0555 — Bac bd gia thiét Hạ
Bước 7: Kết luận: X, Y có tương quan tuyến tính
4.2.2 Phân tích tương quan phi tuyến
Bước 1: Đặt giả thiết:
Bài tập lớn 1 môn Xác Suất và Thống Kê (MT2013), HK2, Năm học 2020-2021 Trang 24/50
Trang 26-< Nhóm 06 - LI5 - GVHD: Nguyễn Đình Huy
Ho: X, Y không có tương quan phi tuyến
H;: X, Y có tương quan phi tuyến
Bước 2: Nhập lại bảng số liệu
| Y > , Fost SE = Data Analysis
Z| Sort Filter Data What-If Forecast Outline
7% Tools~ Analysis~ Sheet *
Sort & Filter Forecast Analysis ^
Trang 27> 4 Nhóm 06 - LI5 - GVHD: Nguyễn Đình Huy
Bước 4: Input range: quét vùng số liệu đề bai, chon Labels in first row, Alpha: 0,05, Ouput rangc: chọn địa chỉ ô cần xuất dữ liệu — OK
© Output Range: $Assl Fits
O New Worksheet Ply:
Trang 284 Nhóm 06 - LI5 - GVHD: Nguyễn Đình Huy
Trang 29> 4 Nhóm 06 - LI5 - GVHD: Nguyễn Đình Huy
Vào Formulas — chon Insert Function
Gõ FINV vào thanh tìm kiếm hàm — Go
Chon ham FINV — OK
Page Layout Formulas Data Review View Power Pivot
SUM | _ FINV(probability,deg freedom1,deg_freedom2)
†Ệ This function is available for compatibility with Excel 2007 and earlier
4 Returns the inverse of the (right-tailed) F probability distribution: if p = FDIST(x ), then FINV(p ) = x
Probability: nhaép 0.05; Deg Freedom 1: nhap 7-2; Deg Freedom 2: nhap 28-7
Bài tập lớn 1 môn Xác Suất và Thống Kê (MT2013), HK2, Năm học 2020-2021 Trang 28/50
Trang 30> 4 Nhóm 06 - LI5 - GVHD: Nguyễn Đình Huy
Function Arguments ? x
3) FIN
Probability 0.05 Fia| = 0.05 Deg freedom1 7-2 8 = 5 Deg freedom2 28-7| fig} = 21
= 2.68478073
This function is available for compatibility with Excel 2007 and earlier
Retums the inverse of the (right-tailed) F probability distribution: if p = FDIST(x ), then FINV(p, ) = x
Deg_freedom2_ is the denominator degrees of freedom, a number between 1 and 10*10, excluding
F = 03468 < C = 2,6848 — Chap nhan gia thiết Hạ
Kết luận: X, Y không có tương quan phi tuyến
5 Cau 3
Một nhà nghiên cứu muốn khảo sát thời gian phản ứng của nam giới và nữ giới đối với các loại tín hiệu khác nhau Các đối tượng tham gia thí nghiệm được yêu cầi nhấn nút ENTER trên bàn phím máy tính ngay khi nhận biết tín hiệu thời gian (đo bằng giây) giữa lúc tín hiệu phát ra và lúc đối tượng nhận biết được ghi
Bài tập lớn 1 môn Xác Suất và Thống Kê (MT2013), HK2, Năm học 2020-2021 Trang 29/50
Trang 31> 4 Nhóm 06 - LI5 - GVHD: Nguyễn Đình Huy
lại Sau đây là kết quả trên 15 nam và 15 nữ
Nữ 92 2,5 5,2
8,1 42 2,5 13.4 1,8 3,9
Với mức œ= 5% Có sự tương tác giữa giới tính và tín hiệu hay không?
Dạng bài: Phân tích phương sai 2 yếu tố có lặp
5.1 Cơ sở lý thuyết
Xét nhân tố A và B:
s Nhân tố A được xem xét ở các mức Aj, Ag, .A;
° Nhân tố B được xem xét ở các mức B;¡, Bạ, B,
Gọi Xị là ĐLNN đo lường hiệu quả việc tác động của mức A¡ và B¿ lên cá thể Giả sử Xi, Xajk Xujk là mẫu kích thước n¡ rút ra từ tập hợp chính các giá trị của Xj, => goi 1a mau (j, k)
Ta có:
Bài tập lớn 1 môn Xác Suất và Thống Kê (MT2013), HK2, Năm học 2020-2021 Trang 30/50