Bài 1: Tìm một dữ liệu định lượng A và một dữ liệu định tính B thích hợp, sử dụng các dữ liệu đó cho các yêu cầu sau: 1Thực hiện phương pháp phân tổ dữ liệu A.. 4Trình bày dữ liệu định t
Trang 1TRƯỜNG ĐẠI HỌC BÁCH KHOA THÀNH PHỐ HỒ CHÍ MINH
KHOA CƠ KHÍ
BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ
ĐỀ TÀI 6 GVHD: NGUYỄN KIỀU DUNG THỰC HIỆN: NHÓM 06 – L08
1) 1410272 Hoàng Thái Bình2) 1410611 Phan Thái Duy3) 1411564 Phạm Hoàng Hùng (L06)
4) 1412373 Nguyễn Hữu Nam
5) 1412449 Lê Trung Nghĩa6) 1412854 Từ Tấn Phát (L10)7) 1414174 Nguyễn Quốc Khánh Triều8) 1414402 Nguyễn Bá Tuấn
Thành phố Hồ Chí Minh, tháng 5 năm 2016
Trang 3Bài 1: Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp,
sử dụng các dữ liệu đó cho các yêu cầu sau:
1)Thực hiện phương pháp phân tổ dữ liệu (A).
2)Vẽ đồ thị phân phối tần số và đa giác tần số (A).
3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát với độ tin cậy 96% (A).
4)Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị.
5) Hãy kiểm định xem dữ liệu (A) hoặc (B) có phù hợp với 1 phân bố xác suất nào đó hay không.
Bài làm:
1) Thực hiện phương pháp phân tổ dữ liệu A:
A: Khảo sát thời gian hoàn thành một sản phẩm tiện của 40 sinh viên khi học thực tập Cơ khí ta có bảng số liệu: Thời gian (phút)
Trang 4- Chọn chức năng Data/ Data Analysis/Histogram
o Trong ô Input Range nhập địa chỉ của khu vực chứa dữ liệu vào:
A1:J4
o Trong ô Bin Ran Range đưa địa chỉ phạm vi chứa các giá trị cận
trên vào: A10:A13
o Trong mục Output option chọn Cumulative percentage (tính tần
Trang 5o Thêm 0 vào đầu và cuối hàng của bảng phân phối tần số
Trang 6- Chọn Data/ Data Analysis/ Descriptive Statistics Nhấn OK
o Trong ô Input Range nhập địa chỉ của khu vực chứa dữ liệu vào
o Mục Grouped by chọn Columns
o Chọn Summary statistics
o Confidence level for mean( độ tin cậy): chọn 96%.
- Kết quả:
4) Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị
B: Phân ngành sinh viên khoa Cơ khí khóa 2014 của trường Đại học Bách Khoa thành phố Hồ Chí Minh
Trang 7Ho : Mẫu phù hợp phân phối chuẩn
H1 : Mẫu không phù hợp phân phối chuẩn
Tính các đặc trưng mẫu:
n = 40 ; x=18,375=a; ^s=4,46=σxlà ướclượng hợplý cực đại choa
còn ^s2làướclượng hợp lý cực đại cho σ2
Tra bảng Chi-BP với k = 4 ; r = 2 ; α=0,04
Trang 8Bài 2:
Người ta dùng 2 loại nguyên liệu A và B để sản xuất thử đế của 10 đôi giày trẻ
em, các đôi có trọng lượng ban đầu như nhau Sau đó người ta cho cho các em
đi thử trong vòng 6 tháng với cường độ sử dụng tương tự như nhau Sau thử nghiệm, trọng lượng đế giày còn lại được cho trong bảng sau:
Trang 9Với mức ý nghĩa 0,07 có thể cho rằng dùng loại nguyên liệu A làm đế giày bền hơn dùng loại nguyên liệu B hay không? Tìm thêm giá trị P trong kiểm định.
3) Thực hiện trên Excel
- Gọi a1, a2là độ bền của đề giày được làm từ vật liệu A và B
- Giả thuyết kiểm định: H o :a1=a2
- Giả thuyết đối: H1: a1>a2
o Phạm vi của dữ liệu 1( variable 1 range): Chọn B2:K2
o Phạm vi dữ liệu 2 ( variable 2 range): Chọn B3:K3
o Alpha (độ tin cậy): 0,07
- Kết quả:
Trang 11- Phương pháp: PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ
Phép phân tích phương sai được dùng trong các trắc nghiệm để so sánh các giá
trị trung bình của hai hay nhiều mẫu được lấy từ các phân số.Đây có thể được xem
như phần mở rộng các trắc nghiệm t hay z (so sánh hai giá trị trung bình)
Mục đích của sự phân tích phương sai một yếu tố là đánh giá sự ảnh hưởng của
một yếu tố (nhân tạo hay tự nhiên) nào đó trên các giá trị quan sát, Yi(i=0,1,2,…,k)
Trang 12 Giá trị thống kê: F=
MSF MSE
Biện luận: Nếu F < Fα(k-1;N-k) => chấp nhận giả thiết H0
Bài làm:
Giả thiết:
- H0 : doanh thu của các cửa hàng là như nhau
Đối giả thiết:
- H1 : Ít nhất có hai giá trị trung bình doanh thu khác nhau
Nhập dữ liệu vào bảng:
Áp dụng “ Anova: Single Factor”
a Nhấn lần lượt đơn lệnh Data và lệnh Data Analysis
b Chọn trương trình Anova: Single Factor trong hộp thoại Data Analysis rồinhấn nút OK
c Trong hộp thoại Anova: Single Factor lần lượt ấn định
- Phạm vi đầu vào (Input range)
- Cách xắp xếp theo hàng hay cột (Group by)
- Nhãn dử liệu (Labels in fisrt row/column)
- Phạm vi đầu ra (Output range)
Trang 13Bảng Anova:
Từ giá trị trong bảng Anova:
Trang 14F= 6.16276> Fα=3.098391 => Không chấp nhận H0
Kết luận: Doanh số bán hàng của các cửa hàng là không như nhau.
b) Xét sự liên quan giữa yếu tố doanh thu và yếu tố thời gian
Bài làm:
Giả thiết:
H0: Doanh thu và yếu tố thời gian có liên quan với nhau
Đối giả thiết:
H1: Doanh thu và yếu tố thời gian không liên quan với nhau
Nhập dữ liệu vào bảng tính:
Áp dụng “Anova: Two-Factor Without Replication”
a) Nhập lần lượt đơn lệnh Tools và lệnh Data Analysis
b) Chọn chương trình Anova: Two- trong hộp thoại Data Anylysis rồi nhấp OK
c) Trong hộp thoại Anova: Two-Factor Without Replication, lần lượt ấn định các chi tiết:
- Phạm vi đầu vào ( Input Range)
- Nhãn dữ liệu (Labels in Fisrt Row/ Column)
- Ngưỡng tin cậy (Alpha)
- Phạm vi đầu ra ( Output Range)
Trang 15Từ giá trị trong bảng Anova:
FR= 4.879478 > F0.05=2.901295 => Không chấp nhận giả thiết H0
Kết luận:
Không có sự liên quan giữa yếu tố doanh thu và yếu tố thời gian
Trang 16Bài 4:
Trong một thí nghiệm khoa học, người ta nghiên cứu dộ dày của lớp mạ kền khi dùng ba loại bể mạ khác nhau Sau một thời gian mạ, người ta đo độ dày của lớp mạ nhận được ở các bể:
Độ dày lớp mạ kền tính bằng µm
H 0 : Độ dày lớp mạ không phụ thuộc vào bể mạ được dùng.
Ta tiến hành tính toán các tỉ số và so sánh để có thể kết luận được rằng độ dày lớp
mạ không phụ thuộc vào bể mạ được dùng
Giải toán trên Excel:
Nhập dữ liệu và tính tổng ni và mj vào bảng như sau:
ni = SUM (hàng)
mj = SUM (cột) Tính dữ liệu kỳ vọng ij theo công thức ij = ni* mj /n ta được bảng sau:
Trang 17Tính P(X > ²) = CHITEST (Bảng thực tế, Bảng kỳ vọng)
= CHITEST (C3:E7,C13:E17)
= 8.67E-06
Phân tích kết quả: P(X > ²) = 8.67E-06 < = 0.05
Do đó giả thuyết Ho không được chấp nhận Kết luận: Vậy độ dày lớp mạ phụ thuộc vào bể mạ được dùng.
Bài 5:
Trang 18Tìm một dữ liệu ngẫu nhiên 2 chiều (X, Y) có kích thước n >10 để sử dụng mô hìnhhồi quy tuyến tính đơn Thực hiện các yêu cầu:
1) Tìm hệ số tương quan giữa X,Y
2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Hãy ướclượng đường hồi quy tuyến tính Y theo X và biểu thị bằng hình vẽ
3) Tìm sai số chuẩn của ước lượng
o Nếu R > 0 thì X, Y tương quan thuận
o Nếu R < 0 thì X, Y tương quan nghịch
o Nếu R = 0 thì X, Y không tương quan
o Nếu |R| = 1 thì X, Y có quan hệ hàm bậc nhất
o Nếu |R| → 1 thì X, Y có tương quan chặt (tương quan mạnh)
o Nếu |R| → 0 thì X, Y có tương quan không chặt (tương quan yếu)
- Thực hiện trên Excel
o Chọn Data/Data Analysis/Correlation
Trang 19o Vì |T| > c nên bác bỏ Ho
o Vậy X và Y có tương quan tuyến tính
Ước lượng đường hồi quy tuyến tính Y theo X:
- Cơ sở lý thuyết:
Trang 20o Phương trình hồi quy tuyến tính:
y x =a+bx ,a=r S y
S x ,b= y−a x
o Kiểm định hệ số a, b:
Giả thiết Ho: Hệ số hồi quy không có ý nghĩa ( = 0 )
H1: Hệ số hồi quy có ý nghĩa ( ≠ 0 )
Trắc nghiệm t <t α, n−2: chấp nhận Ho
o Kiểm định phương trình hồi quy:
Giả thiết Ho: “Phương trình hồi quy tuyến tính không thích hợp”
H1: “Phương trình hồi quy tuyến tính thích hợp”
Trắc nghiệm F<F α ,1, n−2: chấp nhận Ho
- Thực hiện trên Excel
o Nhập lại số liệu:
o Chọn Data/Data Analysis/Regression
Trang 21o Kết quả
Trang 22- Biện luận:
Phương trình hồi quy y x =−189,8347+17,3974 x
Hệ số hồi quy : 0,2379 > 0,05 => Hệ số tự do có ý nghĩa
0,00219 < 0,05 => Hệ số của x không có ý nghĩa
Phương trình hồi quy tuyến tính này không thích hợp vì 0,002198 < 0,053) Tìm sai số chuẩn của ước lượng
Trang 23- Đối với biến tự do: SE = 151,2200
- Đối với biến X: SE = 4,2594