Bài giải: - Dạng bài : bài toán kiểm định giả thuyết tỉ lệ. - Giả thuyết H0 : tỷ lệ đàn ông và đàn bà trong việc chọn mua các loại ôtô là như nhau. - Quy trình thực hiện bằng EXCEL + Nhập dữ liệu vào bảng tính : + Tính các tổng số trên bảng Theo hàng : nhập vào J23 biểu thức “=SUM(G22:I23)”, sau đó kéo nút tự điền đến J25. Theo cột : nhập vào G25 biểu thức “=SUM(G23:G24)”, sau đó kéo nút tự điền đến I25. Ta được bảng : + Tính các tần số lí thuyết : Nhập vào G30 biểu thức =G$25*$J23/$J$25, sau đó kéo nút tự điền đến I31 Bài giải: - Dạng bài : bài toán kiểm định giả thuyết tỉ lệ. - Giả thuyết H0 : tỷ lệ đàn ông và đàn bà trong việc chọn mua các loại ôtô là như nhau. - Quy trình thực hiện bằng EXCEL + Nhập dữ liệu vào bảng tính : + Tính các tổng số trên bảng Theo hàng : nhập vào J23 biểu thức “=SUM(G22:I23)”, sau đó kéo nút tự điền đến J25. Theo cột : nhập vào G25 biểu thức “=SUM(G23:G24)”, sau đó kéo nút tự điền đến I25. Ta được bảng : + Tính các tần số lí thuyết : Nhập vào G30 biểu thức =G$25*$J23/$J$25, sau đó kéo nút tự điền đến I31 Bài giải: - Dạng bài : bài toán kiểm định giả thuyết tỉ lệ. - Giả thuyết H0 : tỷ lệ đàn ông và đàn bà trong việc chọn mua các loại ôtô là như nhau. - Quy trình thực hiện bằng EXCEL + Nhập dữ liệu vào bảng tính : + Tính các tổng số trên bảng Theo hàng : nhập vào J23 biểu thức “=SUM(G22:I23)”, sau đó kéo nút tự điền đến J25. Theo cột : nhập vào G25 biểu thức “=SUM(G23:G24)”, sau đó kéo nút tự điền đến I25. Ta được bảng : + Tính các tần số lí thuyết : Nhập vào G30 biểu thức =G$25*$J23/$J$25, sau đó kéo nút tự điền đến I31
Trang 1ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC BÁCH KHOA
………… o O o…………
BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊGiáo viên hướng dẫn : Nguyễn Bá Thi
Sinh viên : Lê Anh Duy
MSSV : 1410560
Nhóm 1 - Lớp DT04
Trang 21 Một hãng sản xuất ôtô tiến hành một nghiên cứu nhằm xác định xem có sự khác nhau giữa tỷ lệ đàn ông và đàn bà trong việc chọn mua các loại ôtô của hãng hay không Kết quả thu được như sau:
- Dạng bài : bài toán kiểm định giả thuyết tỉ lệ
- Giả thuyết H0 : tỷ lệ đàn ông và đàn bà trong việc chọn mua các loại ôtô lànhư nhau
- Quy trình thực hiện bằng EXCEL
Trang 3Ta có bảng:
+ Áp dụng hàm Chitest để tìm kết quả :
Cú pháp hàm chitest : CHITEST (actual_range, expected_range)
Điền vào ô H33 biểu thức
=CHITEST(G23:I24,G30:I31)
Ta được kết quả của P(X<X2)
- Biện luận : vì P = 0.5820927> α = 0.05 nên chấp nhận giả thuyết H0
- Kết luận : Tỷ lệ đàn ông và đàn bà trong việc chọn mua các loại ôtô là như nhau.
Trang 4Bài 2:
Để xác định hiệu quả của một loại thức ăn phụ đối với sự tăng trọng của bò, người ta lấy ngẫu nhiên 8 con bò cùng trọng lượng chia thành hai nhóm, mỗi nhóm 4 con, một nhóm ăn bình thường, một nhóm cho ăn thêm thức ăn phụ Sau 6 tháng thu được kết quả sau:
Nhóm ăn thêm thức ăn phụ
Bài làm:
- Dạng bài: Kiểm định giá trị trung bình với phương sai bằng nhau & Ước lượnghai trung bình tổng thể
- Quy trình thực hiện bằng EXCEL:
Phần 1: Tìm kết luận về tác dụng của loại thức ăn phụ.
Giả thuyết H0: Trọng lượng trung bình của bò ở nhóm ăn thêm thức ăn phụ(A) và nhóm thức ăn bình thường (B) là như nhau
Nhập dữ liệu vào bảng tính
Assuming
4) Nhập vào hộp thoại t-Test Two-Sample Assuming Equal Variances
Variable 1 Range: Nhập “$A$13:$E$13” (ô A13 → E13)
Variable 2 Range: Nhập “$A$14:$E$14” (ô A14 → E14)
Trang 5Vậy thức ăn phụ không có tác dụng đối với số cân nặng của bò.
Phần 2: Ước lượng trọng lượng trung bình của các con bò với mỗi loại thức ăn.
Mở hộp thoại Data Analysis chọn Descriptive Statistics
Trang 63) Nhập vào hộp thoại Desciptive Statistics.
Input Range: phạm vi dữ liệu nhập vào (ô A13 → E13)
Grouped By: nhóm dữ liệu theo hàng hoặc cột (chọn hàng).
Labels in first row: nhãn ở cột đầu tiên (chọn).
Output Range: phạm vi dữ liệu xuất ra (ô I29)
Tích dấu chọn vào Summary statistics
Confidence Level for Mean: Nhập 95 (%).
4) Ta được bảng kết quả
Trang 7 Kết luận:
Trọng lượng trung bình của các con bò ở nhóm ăn thêm thức ăn phụ (A) là:
360 ± 46,84434123.
5) Mở hộp thoại chọn Descriptive Statistics
6) Nhập vào hộp thoại Desciptive Statistics
Input Range: phạm vi dữ liệu nhập vào (ô A14 → E14)
Grouped By: nhóm dữ liệu theo hàng hoặc cột (chọn hàng)
Labels in first row: nhãn ở cột đầu tiên (chọn).
Output Range: phạm vi dữ liệu xuất ra (ô I47)
Tích dấu chọn vào Summary statistics
Confidence Level for Mean: Nhập 95 (%).
Trang 8 Thức ăn phụ không có tác dụng đối với số cân nặng của bò.
Trọng lượng trung bình của các con bò ở nhóm ăn thêm thức ăn phụ
(A) là: 360 ± 46,84434123.
Trang 9 Trọng lượng trung bình của các con bò ở nhóm thức ăn bình thường (B) là: 330 ± 53,56855363.
Trang 103 Tính tỷ số tương quan của Y đối với X ,hệ số tương quan và hệ số xác định của tập số liệu sau đây Với mức ý nghĩa = 5%, có kết luận gì về mối tương quan giữa
X và Y (Có phi tuyến không ? Có tuyến tính không ?).Tìm đường hồi quy của Y đối với X.
Bài giải
Dạng bài : bài toán kiểm định tương quan và hồi quy
Quy trình thực hiện bằng EXCEL
1)Phân tích tương quan tuyến tính
· Giả thuyết H0 : X và Y không có tương quan tuyến tính
· Nhập dữ liệu vào máy tính
Mở hộp thoại trong thẻ Data, chọn Corelation
· Nhập vào hộp thoại Correlation
· Input Range: phạm vi đầu vào (ô B7 → Q8)
· Grouped By: nhóm dữ liệu theo hàng hoặc cột (chọn hàng)
· Labels in first row: nhãn ở cột đầu tiên (chọn).
· Output Range: phạm vi dữ liệu xuất ra (ô B12)
Trang 11· Ta nhận được bảng kết quả.
Biện luận :
Kết luận : X và Y tương quan tuyến tính
2) Phân tích tương quang phi tuyến :
· Giả thiết H1: X và Y không có tương quan phi tuyến.
o Nhập dữ liệu vào bảng tính sau khi đã sắp xếp lại
Trang 12o Mở hộp thoại chọn Anova Single Factor.
o Nhập vào hộp thoại Anova Single Factor.
Input Range: phạm vi đầu vào (ô F20 → L23)
Grouped By: nhóm dữ liệu theo hàng hoặc cột (chọn cột)
Labels in first column: nhãn ở cột đầu tiên (chọn)
Alpha: giá trị α =0,05
Output Range: phạm vi dữ liệu xuất ra E26
Ta nhận được bảng kết quả :
Trang 13C = 3.68749867
Vì F < c nên chấp nhận giả thuyết H1
Kết luận:
Vậy X và Y không có tương quan phi tuyến.
3) Phân tích hồi quy (sử dụng Regression).
Giả thiết H: Hệ số không thích hợp.
Nhập bảng:
Trang 14
Mở Data Analysis chọn Regression
Hộp thoại Regression xuất hiện
Input Y Range: $C$55:$C$70 Input X Range: $B$55:$B$70 Labels: nhãn (chọn)
Line Fit Plots: vẽ đồ thị (chọn) Output Range: $E$55
Trang 15Ta được bảng kết quả:
Trang 16Biện luận:
Hệ số góc = 1.169300226
Hệ số tự do = 6.10609480812639Giá trị P của hệ số tự do (P-value) = 0.668535974062108> α = 0,05 =>chấp nhận giả thiết H
->Hệ số tự do không có ý nghĩa thống kêGiá trị P của hệ số góc (P-value) = 8.41537970890307E-10< α = 0,05 => bác bỏ giả thiết H
->Hệ số góc có ý nghĩa thống kêGiá trị F (Significance F) = 8.41537970890307E-10< α = 0,05 => Bác
bỏ giả thiết H->Phương trình đường hồi quy thích hợp
Trang 17X và Y có tương quan phi tuyến với mức ý nghĩa 5%.
Phương trình đường hồi quy của Y đối với X: Y = 01.169300226X + 6
4 Hãy phân tích vai trò ngành nghề (chính, phụ) trong hoạt động kinh tế của các hộ gia đình ở một vùng nông thôn trên cơ sở bảng số liệu về thu nhập của một số hộ tương ứng với các ngành nghề nói trên như sau(mức ý nghĩa 5 %):
Trang 18Nghề chính Nghề phụ
Trồng lúa (1) 3.5:3.4:4.0 7.4:7.6:7.1 8.3:8.1:8.0 3.5:3.4:3.7 Trồng cây ăn quả (2) 5.6:5.2:5.8 4.1:4.4:3.9 6.1:6.4:5.8 9.6:9.7:9.2 Chăn nuôi (3) 4.1:4.4:3.8 2.5:2.5:2.7 1.8:1.6:1.4 2.1:2.3:2.0
Bài giải:
Dạng bài: bài toán phân tích phương sai hai yếu tố không lặp
Giả thiết H: Các giá trị trung bình bằng nhau
Quy trình thực hiện bằng EXCEL Nhập dữ liệu :
Tách xuất dữ liệu:
Nhập vào ô B165 phép toán “=(VALUE(LEFT(C7,FIND(":",C7)-1))
+VALUE(MID(C7,FIND(":",C7)+1,FIND(":",C7,FIND(":",C7)+1)-FIND(":",C7)-1))+VALUE(RIGHT(C7,LEN(C7)-FIND(":",C7,FIND(":",C7)+1))))/3”
Ta được bảng số liệu trung bình:
Trang 19Mở hộp thoại trong thẻ Data, chọn Anova : Two-Factor without replication
Trang 20Biện luận :
F rows (Nghề chính) 2.004372056 F0.05 3.862548 nên chấp nhận giả thuyết H(nghề chính)
F col (Nghề phụ) 0.119184704 F0.05 3.862548 nên chấp nhận giảthuyết H(Nghềphụ)
Kết luận :
Vậy cả nghề chính và nghề phụ đều ảnh hưởng đến thu nhập