Đo kiểm tra hàm lượng chất C có trong một số sản phẩm được chọn ngẫu nhiên trên thị trường, người ta thu được số liệu sau: Hãy so sánh mức độ đồng đều của hàm lượng chất C trong các sản
Trang 1ĐẠI HỌC QUỐC GIA TP.HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC BÁCH KHOA
BÁO CÁO Môn:Xác Xuất Thống Kê Giáo Viên Hướng Dẫn : Nguyễn Kiều Dung
Thành Viên Trong Nhóm :
Trang 2Bài 1:
Tìm m t d li u đ nh lộ ữ ệ ị ượng (A) và m t d li u đ nh tính (B) thích h p, s d ng ộ ữ ệ ị ợ ử ụcác d li u đó cho các yêu c u sau:ữ ệ ầ
1) Th c hi n phự ệ ương pháp phân t d li u (A).ổ ữ ệ
► D ng bài : ạ Th ng kê mô tố ả
► D li u đ nh l ữ ệ ị ượ ng (A): Đ bi t kh năng thu n th c c a sinh viên trong vi c ể ế ả ầ ụ ủ ệ
đi u ch m t lo i mu i cô giáo đã đo th i gian hoàng thành bài thí nghi m c a 40 ề ế ộ ạ ố ờ ệ ủsinh viên D a vào k t qu thu đự ế ả ược ta có b ng sau (Đ n v : phút) :ả ơ ị
Trang 4 Ch n ch c năng Data/ Data Analysis/Histogram ọ ứ
+ Input Range: đ a ch tuy t đ i ch a d li u ị ỉ ệ ố ứ ữ ệ
+ Bin Range: đ a ch ch a b ng phân nhóm ị ỉ ứ ả
Trang 51.2) Vẽ đ th phân ph i t n s và bi u đ tích lũy t n s (A): ồ ị ố ầ ố ể ồ ầ ố
Trang 7+ Input Range: đ a ch tuy t đ i ch a d li u.ị ỉ ệ ố ứ ư ệ
+ Output options: v trí xu t k t qu ị ấ ế ả
+ Confidence Level for Mean: đ tin c y cho trung bình.ộ ậ
K t qu thu đế ả ược là:
1.4) Trình bày d li u đ nh tính (B) d ng phân lo i b ng các đ th ữ ệ ị ạ ạ ằ ồ ị
Trang 8 Nh p d li u và b ng tính: ậ ữ ệ ả
Tính t l cho các thi t b , linh ki n: ỉ ệ ế ị ệ
Nh p vào C3: =B3/$B$11, copy cho các ô t C4:C11 ta đậ ừ ược
Vẽ bi u đ tròn th hi n t l h h ng, m t mát c a các thi t b : ể ồ ể ệ ỉ ệ ư ỏ ấ ủ ế ị
+ Gi Ctrl, quét ch n c t (A3:A10) và (C3:C10)ữ ọ ộ
+ Dùng ch c năng Insert/Insert Pie/2-D Pie trên menu Insert ứ
Trang 9Gi thi t ki m đ nh: Hả ế ể ị 0: M u A phù h p phân ph i chu nẫ ợ ố ẩ
Gi thi t đ i Hả ế ố 1: M u A không phù h p phân ph i chu nẫ ợ ố ẩ
Các đ c tr ng m u: ặ ư ẫ n=40; x 41.525; ˆs29.025
a41.525; 29.025
Mi n bác b : ề ỏ W ( 2(k r 1); � ) ( 0.082 (4 2 1); � )
Dùng hàm: CHIINV(Probability,deg_freedom)
Trang 10Trên Excel ta nh p: =ậ CHIINV(0.08,1)
Mi n bác b : ề ỏ
Bài 2:
Hàm lượng (%) của chất C trong cùng một loại sản phẩm của 2 công ty được công
bố xấp xỉ nhau Đo kiểm tra hàm lượng chất C có trong một số sản phẩm được
chọn ngẫu nhiên trên thị trường, người ta thu được số liệu sau:
Hãy so sánh mức độ đồng đều của hàm lượng chất C trong các sản phẩm của 2 công ty
với mức ý nghĩa 3% Giả thiết hàm lượng này phân bố theo quy luật chuẩn
D ng bài: ạ Ki m đ nh gi thuy t cho phể ị ả ế ương sai hai t ng th ổ ể
Công cụ: t-Test: Two-Sample Assuming Equal Variances
Trang 112.2/ Tính các s li u ố ệ
Count = số lượng mẫu ở các công ty (hàm COUNT)
Mean = trung bình (hàm AVERAGE)
Variance = phương sai (hàm VAR.S)
F stat = Phương sai lớn / phương sai nhỏ
DF drub = Số lượng mẫu CTY A
DF control = số lượng mẫu CTY B
F crit = tra bảng DF drub và DF control
2.3/ Chọn phương pháp T-test
Theo lý thuyết, nếu F stat < F crit, ta có thể kết luận phương sai của 2 mẫu được cho là
giống nhau (Sử dụng “t-Test: Two-Sample Assuming Equal Variances”)
Trang 122.4/ Dùng công cụ Data Analysis và chọn “t-Test: Two-Sample Assuming Equal
Variances”
2.5/ Ch n dãy bi n và nh p đ tin c y đ ch y công c ọ ế ậ ộ ậ ể ạ ụ
2.6/ Xem kết quả:
Trang 14Có thể coi nồng độ chì trong không khí ở các giao lộ là giống nhau hay không, với mức ý nghĩa 5%? Tìm hệ số xác định R 2 của bài toán và giải thích ý nghĩa của nó.
D ng bài: ạ Ki m đ nh giá tr trung bình m t nhân t ể ị ị ộ ố
Phươ ng pháp gi i: ả Phân tích phương sai m t nhân t ộ ố
Công c gi i:ụ ả Anova single factor.
Tổng số bình phương
Bình phương trung bình
Giá trị thống kê Yếu tố
Sai số
k-1N-k
: N ng đ chì trong không khí các giao l là gi ng nhauồ ộ ở ộ ố
: N ng đ chì trong không khí các giao l là khác nhauồ ộ ở ộ
3.1/ Nh p s li u đ bài vào excel ậ ố ệ ề
Trang 153.2/ Dùng công c Anova Single Factor đ phân tích ụ ể
3.3/ Ch n d li u ọ ữ ệ
Trang 163.5/ K t lu n ế ậ
Ta có ch s F = 1.667233 < F critical = 3.049125, ta có th k t lu n gi ỉ ố ể ế ậ ảthuy t ế đúng (N ng đ chì trong không khí các giao l là gi ng nhau)ồ ộ ở ộ ố
Tính chỉ số :
= = = 0.185236
Ý nghĩa: n i l y m u đây là các giao l ch nh hơ ấ ẫ ở ộ ỉ ả ưởng đ n s bi n đ ng ế ự ế ộ
c a chì trong không khí ủ 18.52%
này được thể hiện trong bảng theo dõi sau:
bình
Nhiều
Trang 17C 53
75
1519
1912
Với mức ý nghĩa = 0,05, hãy nhận định xem có phải 3 giống bò này
thuần như nhau về phương diện sản lượng sữa hay không?
Bài làm:
D ng bài : ki m đ nh gi thi t v tạ ể ị ả ế ề ỷ l ệ
Phương pháp gi i : Áp d ng ki m đ nh chi bìnhả ụ ể ị phương
Công c gi i : hàm CHITEST trênụ ả EXCEL
C s lýơ ở thuy t:ế
2
Theo thống kê,kiểm định chi bình phương hay kiểm tra 2 (đôi khi đọc là
khi bình phương”) là một họ các phương pháp kiểm định giả thuyết thống kê trong
đó thống kê kiểm địnhtuântheophân bố
gồm:
nếu giả thuyết là không đúng.Chúng
Kiểm định chi bình phương Pearsom
Kiểm định chi bình phương Yates
Kiểm định chi bình phương Mantel-Haenszel
…
Dạng thống kê kiểm định thông dụng nhất là:
V i O là d li u đo đ c, E là giá tr d đoán chính xác.ớ ữ ệ ạ ị ự
Nh n ậ xét: Đây là bài toán ki m đ nh gi thuy t v tể ị ả ế ể ỷ l ệ
Gi i thuy t ả ế H0: T l s a c a ba gi ng bò này có phân phân ỷ ệ ữ ủ ố b ố t l nhỉ ệ ư nhau(thu n nh nhau).ầ ư
Trang 19 Áp d ng hàm s ụ ố CHITEST tính giá tr ịP(X > X2)
Ch n ọ B15, nh p ậ =CHITEST(B3:D5,B11:D13), r i Enter.ồ
Bi n ệ lu n: ậ P(X >X2) = 0,022515147 < 0.05
Bác b gi thuy t Hỏ ả ế 0
Trang 20 K t ế lu n: ậ Ba gi ng bò này có t l khác nhau (không thu n) v phố ỉ ệ ầ ề ương
1) Tìm hệ số tương quan giữa X,Y
2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Hãy ước lượngđường hồi quy tuyến tính Y theo X và biểu thị bằng hình vẽ
3) Tìm sai số chuẩn của ước lượng
b) Tìm một dữ liệu ngẫu nhiên k chiều (k >2) để sử dụng mô hình hồi quy tuyếntính đa biến Tìm các hệ số hồi quy tuyến tính mẫu và kết luận về sự thích hợp
Bình phương trung bình Giá
trịthống
kê Hồi
quy
F=
���Sai
Trang 213)Trắc nghiệm thống kê: Đối với một phương trình hồi quy +BX
ý nghĩa thống kê của các hệ số ��( �0 hay B) được đánh giá bằng trắc nghiệm t (
phân phối student) trong khi tính chất thích hợp của phương trình �̂�=f(X) được đánh giá bằng trắc nghiệm F (phân bố Fischer)
300
375
450
525
600
675
750
825
900
34
55
59
67
73
76
81
87
89
92
93
1/ Tìm hệ số tương quan:
- Nhập giữ liệu như hình
Dữ liệu nhất thiết phải được nhập theo cột - Chọn Data, Data Analysis, Correlatio
Trang 23 Tính T: chọn ô I14 và nhập biểu thức =R*SQRT(12-2)/SQRT(1-R^2).
Tính c: chọn ô I15 và nhập biểu thức =TINV (0.05,10)
( c là phân vị mức α/2=0.025 của phân bố Student với n-2=10 bậc tự do)
Áp dụng Regression
Nhấn lần lượt đơn lệnh Tools và lệnh Data Analysis
Chọn chương trình Regression trong hộp thoại data Analysis rồi nhấp OK
Trong hộp thoại Regression ,làn lượt ấn các chi tiết:
- Phạm vi của biến số Y (input Y range)
- Phạm vi của biến số X (input X range)
Trang 24- Nhãn dử liệu(Labels)
- Mức tin cậy (Confidence level)
- Tọa độ đầu ra(Output range)
- Đường hồi quy (line Fit Plots),…
Trang 25Phương trình hồi quy: Y=f(X)
Trang 26Trắc nghiệm thống kê:
-Giả thuyết:
Ho : Hệ số hồi quy không có ý nghĩa
�1: Hệ số hồi quy có ý nghĩa
Hệ số hồi quy0.000247711< 0,05: hệ số hồi quy Bo không có ý nghĩa
2.0122E-07 < 0,05: hệ số B không có ý nghĩa
Phương trình hồi quy tuyến tính này không thích hợp vì 0.000020122 < 0,05
3 ) Sai số chuẩn của ước lượng
- Đối với biến tự do: SE = 75.12299301
- Đối với biến X: SE = 1.030363839
5
30
32
34
32
35
32
5
31
29
27
26C5
0
32
33
34
35
33
33
5
32
34
36
- Với mức ý nghĩa 4%, có thể coi như khả năng chịu lực của thép C45 cao hơn sao
với C50 hay không?
- Tìm giá trị P trong kiểm định.
2) C s lí thuy t : ơ ở ế
D ng ạ : Ki m đ nh trung bìnhể ị
- So sánh 2 trung bình v i phớ ương sai ch a bi t.ư ế
Trang 27n i i
n i i
Dùng công c : T-Test: Two-Sample Assuming Unequal Variancesụ
Vào menu Data
Ch n công c ọ ụ Data Analysis
Ch n ọ T-Test: Two-Sample Assuming Unequal Variances và nh n ấ Ok
M t h p tho i hi n ra:ộ ộ ạ ệ