Số khách hàng nam và nữ mua áo khoác với các màu được ghi trong bảng sau: Với mức ý nghĩa α = 1% hãy so sánh tỷ lệ khách hàng nam và nữ ưa chuộng một trong các màu sắc nói trên.. Giả thi
Trang 1ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA
GVHD: Thầy Nguyễn
Bá Thi
Sinh viên: Nguyễn Phước Lộc MSSV : 40901457 Nhóm 3 Lớp:
BÁO CÁO BÀI TẬP XÁC
SUẤT THỐNG KÊ
Trang 2MỤC LỤC
ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH 0
TRƯỜNG ĐẠI HỌC BÁCH KHOA 0
GVHD: Thầy Nguyễn Bá Thi 0
Sinh viên: Nguyễn Phước Lộc 0
Bài 1 2
BÀI LÀM 2
Nhận xét : Đây là bài toán kiểm định giả thiết về tỷ lệ 2
Thực hiện bài toán bằng Excel 2
Bài 2 5
BÀI LÀM 5
Thực hiện bài toán bằng Excel 5
Hay âm nhạc không ảnh hưởng đến lượng sữa của các con bò 8
Bài 3 9
BÀI LÀM 9
Thực hiện bài toán bằng Excel 9
Vì T < c nên chưa có cơ sở bác bỏ giả thiết H o 11
Vậy: Chưa kết luận được X và Y có tương quan tuyến tính 11
SSF = 0,22537 13
SST = 5,3115 13
Ta có: F = 0,87673 với 13
Vì: F < c nên chấp nhận giả thiết H o 14
Vậy: X và Y không có tương quan phi tuyến 14
Bài 4 16
BÀI LÀM 16
Thực hiện bài toán bằng Excel 16
Trang 3Bài 1
Một xí nghiệp may sản xuất áo khoác với 4 màu: đỏ, xanh, vàng và tím than Số khách hàng nam và nữ mua áo khoác với các màu được ghi trong bảng sau:
Với mức ý nghĩa α = 1% hãy so sánh tỷ lệ khách hàng nam và nữ ưa chuộng một trong các màu sắc nói trên
BÀI LÀM
Nhận xét : Đây là bài toán kiểm định giả thiết về tỷ lệ.
Giả thiết Ho: Tỷ lệ khách hàng nam và nữ ưa chuộng một trong các màu sắc là như
nhau.
Thực hiện bài toán bằng Excel
Nhập giá trị vào bảng tính :
Tính các tổng số:
Trang 2
Trang 4
Tổng hàng: Chọn ô E8 và nhập = SUM(C8:D8)
Dùng con trỏ kéo nút tự điền từ E8 đến E11
Tổng cột: Chọn C12 và nhập = SUM(C8:C11)
Dùng con trỏ kéo nút tự điền từ C12 đến D12
Tổng cộng: Chọn E12 và nhập =SUM(E8:E11)
Tính các tần số lý thuyết:
Chọn C16 và nhập =$C$12*E8/$E$12
Dùng con trỏ kéo nút tự điền từ C16 đến C19
Chọn D16 và nhập =$D$12*E8/$E$12
Dùng con trỏ kéo nút tự điền từ D16 đến D19
Áp dụng hàm số CHITEST :
Chọn C21 và nhập = CHITEST(C8:D11,C16:D19)
Ta sẽ có được kết quả của P(X>X²).
Trang 6
Biện luận : P(X>X²) = 1,71514e-18 < α = 0,01.
=> Bác bỏ giả thiết Ho
Kết luận : Tỉ lệ khách hàng nam và nữ ưa chuộng một trong các màu sắc là
khác nhau.
Trang 7Bài 2
Lượng sữa vắt được bởi 16 con bò cái khi nghe các loại nhạc khác nhau (nhạc nhẹ, nhạc rốc, nhạc cổ điển, không có nhạc) được thống kê trong bảng sau đây:
Với
nghĩa 5%, nhận định xem lượng sữa trung bình của mỗi nhóm như trên như nhau hay khác nhau Liệu âm nhạc có ảnh hưởng đến lượng sữa của các con bò hay không?
BÀI LÀM
Nhận xét: Đây là bài toán phân tích phương sai một nhân tố.
Giả thiết Ho: Lượng sữa trung bình của mỗi nhóm là như nhau.
Thực hiện bài toán bằng Excel
Nhập dữ liệu vào bảng tính :
Vào Data /Data analysis, chọn Anova: Single Factor.
Trang 6
Trang 8
Trong hộp thoại Anova: Single Factor lần lượt ấn định :
Phạm vi đầu vào: Input Range, quét chọn vùng (C4:F8) Cách nhóm theo hàng hay cột: Group By, chọn Columns
(nhóm theo cột)
Chọn Labels in first row (nhãn dữ liệu nằm ở dòng đầu) Mức ý nghĩa α: Alpha (ấn định α=0,05).
Phạm vi đầu ra: Output Range, chọn ô C10.
Nhấn OK, ta sẽ có bảng kết quả sau:
Trang 9Biện luận : F = 1.354679803 < F0.05 = 3.490295.
Chấp nhận giả thiết Ho
Kết luận : Lượng sữa trung bình của các nhóm là như nhau Hay âm nhạc không ảnh hưởng đến lượng sữa của các con bò.
Trang 8
Trang 10Bài 3
Từ 12 cặp quan sát (x,y) sau đây từ cặp 2 biến (X,Y) ,tính tỷ số tương quan, hệ số tương quan và hệ số xác định của Y đối với X Với mức ý nghĩa α = 5%, có kết luận gì về mối tương quan giữa X và Y (tuyến tính hay phi tuyến )? Tìm đường hồi quy của Y đối với X
BÀI LÀM
Nhận xét : đây là bài toán phân tích tương quan
Thực hiện bài toán bằng Excel
1 Phân tích tương quan tuyến tính.
Nhập giá trị vào bảng tính:
X 123 356,9 111,1 118 123 356,9 111,1 118 123 356,9 111,1 118
Trang 11Thiết lập bảng Correlation.
Vào Data /Data analysis , chọn Correlation.
Phạm vi đầu vào: Input Range, quét vùng (C5:D17).
Cách nhóm theo hang hay cột: Group By, chọn Columns (nhóm theo
cột)
Chọn Labels in first row (nhãn dữ liệu ở hàng đầu).
Phạm vi đầu ra: Output Range, chọn ô F6.
Nhấn OK, ta sẽ có bảng kết quả sau:
Trang 10
Trang 12Ta tìm được hệ số tương quan r = 0.17875.
Và hệ số xác định r 2 = 0.03195.
* Giả thiết Ho : X và Y không có tương quan tuyến tính.
Ta có: T = 0.574506 với
Mà: c = 2,228.
(c là phân vị mức α/2=0.025 của phân bố Student với n-2=10 bậc tự do).
Vì T < c nên chưa có cơ sở bác bỏ giả thiết H o
Vậy: Chưa kết luận được X và Y có tương quan tuyến tính.
2 Phân tích tương quan phi tuyến.
Sắp xếp lại các giá trị của X và Y theo bảng sau:
2
2 1
r n T
r
Trang 13Thiết lập bảng Anova: Single Factor.
Vào Data /Data analysis , chọn Anova: Single Factor.
Trong hộp thoại Anova: Single Factor lần lượt ấn định :
o Phạm vi đầu vào: Input Range, quét vùng (D29:G32).
o Cách nhóm theo hàng hay cột: Group By, chọn Columns (nhóm theo
cột)
o Chọn Labels in first row (nhãn dữ liệu nằm ở hàng đầu).
o Mức ý nghĩa α: Alpha (ấn định α=0,05).
o Phạm vi đầu ra: Output Range, chọn ô C34.
Trang 12
Trang 14Nhấn OK, ta sẽ có bảng kết quả sau:
Rút ra được từ bảng Anova:
SSF = 0,22537
SST = 5,3115
2
Trang 15Mà: c = 4,46.
(c là phân vị mức α=0,05 của phân bố Fisher bậc tự do (k-2,n-k)=(2,8)).
Vì: F < c nên chấp nhận giả thiết H o
Vậy: X và Y không có tương quan phi tuyến.
Trang 14
Trang 16
Kết luận :
Hệ số tương quan: r = 0.178749.
Hệ số xác định: r² 0.03195.
Tỷ số tương quan: η Y/X = 0.206.
T = 0,574506 < c = 2,228
(c là phân vị mức 0.025 của phân bố Student bậc tự do 10).
=> Chưa kết luận được X và Y có tương quan tuyến tính.
F = 0,043772 < c = 4,46
(c là phân vị mức 0,05 của phân bố Fisher bậc tự do (2,8)).
=> X và Y không có tương quan phi tuyến với mức ý nghĩa 5%.
3 Tìm đường hồi quy của Y đối với X.
Trang 17Bài 4
Hãy phân tích sự biến động của thu nhập ($/tháng/người) trên cơ sở số liệu điều tra vềt thu nhập trung bình của 4 loại ngành nghề ở 4 khu vực khác nhau sau đây:
Loại ngành
nghề
Nơi làm việc
BÀI LÀM
Nhận xét: Đây là dạng bài tập phân tích phương sai hai yếu tố
Giả thiết Ho: “lượng thu nhập trung bình là như nhau theo ngành và nơi làm việc”
Ta áp dụng phương pháp phân tích phương sai 2 yếu tố
Thực hiện bài toán bằng Excel
1 Nhập dữ liệu vào bảng tính:
Trang 16