Cách làm tất chỉ rất chi tiết (cách giải + dạng bài + công cụ + minh họa + giải thích ) xem xong lên thuyết trình luôn ( có file báo cáo all + EXCEL giải chi tiết ). ..............................................................
Trang 1ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC BÁCH KHOA
KHOA GIAO THÔNG
BÁO CÁO XÁC SUẤT THỐNG KÊ
GVHD: Thầy Nguyễn Bá Thi
Sinh viên thực hiện:
Họ Tên: NPQ
MSSV:
Hồ Chí Minh, tháng 6 năm 2020
Trang 2Câu 1: Một cuộc điều tra xã hội được tiến hành ở 5 thành phố A, B, C, D,
E yêu cầu những người được hỏi diễn tả mức độ thoả mãn của mình đối với thành phố mà họ đang sống Kết quả như sau:
5 thành phố trên hay không?
Bài làm:
Dạng bài: Kiểm định giả thiết về tỉ lệ 5 mẫu
Phương pháp giải: Sử dụng tiêu chuẩnχ2
Công cụ: Sử dụng lệnh CHITEST trong MS-Excel để tính giá trị quan sát P Giả thiết H0: Mức độ thoả mãn cuộc sống các thành phố là như nhau
H1: Mức độ thỏa mãn cuộc sống các thành phố là không giống nhau
Thực nghiệm: Tính các tổng số
Trang 3Tính các tần số lý thuyết:
-Ta có tần số lý thuyết = tổng hàng* tổng cột/ tổng cộng
Dùng hàm CHITEST tính xác suất P(X > χ 2)
Giá trịP=3,53.10−13< 0,05
Bác bỏ H0: Mức độ thoả mãn cuộc sống các thành phố là như nhau
Kết luận: Mức độ thoả mãn cuộc sống của 5 thành phố là không giống
nhau
Trang 4Bài 2: Để đánh giá hiệu quả của một chiến dịch quảng cáo, người ta so
sánh doanh số của công ty tại 6 khu vực thị trường trước và sau chiến dịch quảng cáo và thu được các số liệu sau (đơn vị triệu đồng/tháng)
Với độ tin cậy 95% hãy ước lượng doanh số trung bình trước và sau chiến dịch quảng cáo Với mức ý nghĩa 5% hãy cho ý kiến là chiến dịch quảng
cáo có thành công hay không? Biết rằng doanh số của công ty là biến ngẫu nhiên phân phối chuẩn
Bài làm:
Dạng bài: Ước lượng khoảng trung bình tổng thể và kiểm định giả thuyết
về giá trị trung bình hai mẫu
Công cụ giải: Descriptive statistics trong MS-Excel để tìm khoảng ước
lượng doanh số trung bình, dùng t-Test: Paired Two Sample for Means là công cụ để kiểm định giả thuyết về giá trị trung bình
Giả thiết: H0 – a1 = a2 Chiến dịch quảng cáo không làm thay đổi doanh số
H1 – a1 < a2 Chiến dịch quảng cáo làm tăng doanh số
Biện luận: Ước lượng giá trị trung bình theo công thức sau: ( ´x−ε , ´x +ε)
Trong đó : là giá trị trung bình, còn = ε là độ chính xác
Bảng số liệu nhập vào:( bảng 1)
Trang 5Tính toán:
Chọn tab Data Data Analysis Descriptive statistics
Sau đó thực hiện như hình:
Bấm OK ta nhận được bảng kết quả:
Trang 6Khoảng ước lượng doanh số trung bình : ( ´x−ε , ´x +ε)
Khoảng ước lượng doanh số trung bình trước chiến dịch quảng cáo: (583.45, 636.55) triệu đồng/ tháng
Khoảng ước lượng doanh số trung bình sau chiến dịch quảng cáo: (586.16, 663.84) triệu đồng/ tháng
Dùng công cụ t-Test: Paired Two Sample for Means
Bảng xuất ra (nhập từ bảng 1):
Trang 7|t Stat|=2.74>T 2 α a 1<a 2
Bác bỏ H0, chấp nhận H1 : Chiến dịch làm ảnh hưởng đến doanh thu
Và doanh số trung bình sau quảng cáo lớn hơn nên chiến dịch quảng cáo thành công
Bài 3 : Một nghiên cứu được tiến hành ở Mỹ để xác định mối quan hệ giữa
chiều cao X của một người và cỡ giày Y của họ Nhà nghiên cứu đã thu được số liệu như sau:
Tính tỷ số tương quan, hệ số tương quan và hệ số xác định của Y đối với
X Với mức ý nghĩa α <5 %, có kết luận gì về mối quan hệ giữa X và Y(Có phi tuyến không? Có tuyến tính không?)? Tìm đường hồi quy của Y đối với X, đường hồi quy và các hệ số hồi quy có ý nghĩa hay không?
Bài làm:
Dạng bài: Tương quan và hồi qui mẫu
Phương pháp giải: Phân tích tương quan tuyến tính, tương quan phi
tuyến, hồi quy
Công cụ giải: Sử dụng Correlation, Anova: Single Factor, Regression trong
MS-Excel
Trang 8Giả thiết: H0: X và Y không có tương quan tuyến tính.
H1: X và Y không có tương quan phi tuyến
Biện luận: Hệ số quan sát:
Nếu |T|<t chấp nhận H0 và ngược lại
F < c chấp nhận giả thiết H1 và ngược lại
Phương pháp giải trên Excel:
Nhập bảng đề bài vào excel, sau đó mở hộp thoại Data Analysis trong thẻ Data, chọn Correlation, và nhập số liệu như bảng sau:
Trang 9Thu được kết quả:
Y
0.53314
Hệ số tương quan r =¿ 0.533142624
Hệ số xác định r2= ¿ 0.284241057
1 Phân tích tương quan tuyến tính
Tra bảngc=¿ 2.228138852
Vì∨T ∨¿c nên chấp nhận giả thiết H0
2 Phân tích tương quan phi tuyến
Bảng vào
Mở hộp thoại Data Analysis trong thẻ Data, chọn Anova Single Factor Hộp thoại Anova Single Factor xuất hiện:
T ¿r√n−2
√1−r2= 2.182984421
Trang 10Bảng xuất ra:
Từ bảng ANOVA ta có:
Trang 11SST = 58 Tổng bình phương các độ lệch
Tatính được tỉ số tương quan của X đối với Y :
η Y / X2
=SSF
SST=
44
48=0.758621
Vì |F|= 3.77 <F crit= 4.39 nên ta chấp nhận giả thuyết H1
Kết luận: Y và X có tương quan phi tuyến
3 Phân tích hồi quy
Bảng ra (nhập từ bảng 2)
ta sử dụng Regression:
Trang 12Từ cột Coefficients
Đường hồi quy truyến tính mẫu Y theo X là :y=−17.7103+ 0.3925 x
Giả thiết:
H2 - Hệ số góc không có ý nghĩa
H3 - Hệ số tự do không có ý nghĩa
Kiểm định hệ số a,b (từ cột
tStat)
| Tb|< t(0.05,10) chấp nhận giả thiết H2
Trang 13| Ta|< t(0.05,10) chấp nhận giả thiết H3
Kết luận: Cả hệ số góc và hệ số tự do đều không có ý nghĩa
Fqs = 3.971184151
Fkđ= 4.964603
Significance F = 0.0743 > α = 0.05 chấp nhận giả thiết H4
Kết Luận: Đường hồi quy không có ý nghĩa.
Câu 4: Hãy phân tích vai trò ngành nghề (chính, phụ) trong hoạt động
kinh tế của các hộ gia đình ở một vùng nông thôn trên cơ sở bảng số liệu
về thu nhập của một hộ tương ứng với các ngành nghề nói trên như sau (mức ý nghĩa 5%):
Bài làm:
Dạng bài: Kiểm định giá trị trung bình 2 nhân tố
Phương pháp giải: Phân tích phương sai 2 nhân tố không lặp
Giả thiết: H1 - Thu nhập các ngành chính bằng nhau
Công cụ : Anova: Two-Factor Without Replication trong MS-Excel
Bảng nhập vào :
Trang 14Nhập các số liệu cần thiết vào bảng tính, sau đó chọn công cụ Anova: Two-Factor Without Replication trong thẻ Data và chọn như sau
Bảng xuất ra
Trang 15Từ bảng ANOVA so sánh:
|Frow| = 1.9966 < Fcrit row = 3.8625 nên chấp nhận giả thiết H1
|Fcolums| = 0.1106 < Fcrit columns = 3.8625 nên chấp nhận giả thiết H2
ngành phụ bằng nhau