1. Trang chủ
  2. » Kỹ Thuật - Công Nghệ

BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ

21 264 2

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 21
Dung lượng 648,93 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Bài giải: - Dạng bài : bài toán kiểm định giả thuyết tỉ lệ. - Giả thuyết H0 : tỷ lệ đàn ông và đàn bà trong việc chọn mua các loại ôtô là như nhau. - Quy trình thực hiện bằng EXCEL + Nhập dữ liệu vào bảng tính : + Tính các tổng số trên bảng Theo hàng : nhập vào J23 biểu thức “=SUM(G22:I23)”, sau đó kéo nút tự điền đến J25. Theo cột : nhập vào G25 biểu thức “=SUM(G23:G24)”, sau đó kéo nút tự điền đến I25. Ta được bảng : + Tính các tần số lí thuyết : Nhập vào G30 biểu thức =G$25*$J23/$J$25, sau đó kéo nút tự điền đến I31 Bài giải: - Dạng bài : bài toán kiểm định giả thuyết tỉ lệ. - Giả thuyết H0 : tỷ lệ đàn ông và đàn bà trong việc chọn mua các loại ôtô là như nhau. - Quy trình thực hiện bằng EXCEL + Nhập dữ liệu vào bảng tính : + Tính các tổng số trên bảng Theo hàng : nhập vào J23 biểu thức “=SUM(G22:I23)”, sau đó kéo nút tự điền đến J25. Theo cột : nhập vào G25 biểu thức “=SUM(G23:G24)”, sau đó kéo nút tự điền đến I25. Ta được bảng : + Tính các tần số lí thuyết : Nhập vào G30 biểu thức =G$25*$J23/$J$25, sau đó kéo nút tự điền đến I31 Bài giải: - Dạng bài : bài toán kiểm định giả thuyết tỉ lệ. - Giả thuyết H0 : tỷ lệ đàn ông và đàn bà trong việc chọn mua các loại ôtô là như nhau. - Quy trình thực hiện bằng EXCEL + Nhập dữ liệu vào bảng tính : + Tính các tổng số trên bảng Theo hàng : nhập vào J23 biểu thức “=SUM(G22:I23)”, sau đó kéo nút tự điền đến J25. Theo cột : nhập vào G25 biểu thức “=SUM(G23:G24)”, sau đó kéo nút tự điền đến I25. Ta được bảng : + Tính các tần số lí thuyết : Nhập vào G30 biểu thức =G$25*$J23/$J$25, sau đó kéo nút tự điền đến I31

Trang 1

ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH

TRƯỜNG ĐẠI HỌC BÁCH KHOA

………… o O o…………

BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊGiáo viên hướng dẫn : Nguyễn Bá Thi

Sinh viên : Lê Anh Duy

MSSV : 1410560

Nhóm 1 - Lớp DT04

Trang 2

1 Một hãng sản xuất ôtô tiến hành một nghiên cứu nhằm xác định xem có sự khác nhau giữa tỷ lệ đàn ông và đàn bà trong việc chọn mua các loại ôtô của hãng hay không Kết quả thu được như sau:

- Dạng bài : bài toán kiểm định giả thuyết tỉ lệ

- Giả thuyết H0 : tỷ lệ đàn ông và đàn bà trong việc chọn mua các loại ôtô lànhư nhau

- Quy trình thực hiện bằng EXCEL

Trang 3

Ta có bảng:

+ Áp dụng hàm Chitest để tìm kết quả :

Cú pháp hàm chitest : CHITEST (actual_range, expected_range)

Điền vào ô H33 biểu thức

=CHITEST(G23:I24,G30:I31)

Ta được kết quả của P(X<X2)

- Biện luận : vì P = 0.5820927> α = 0.05 nên chấp nhận giả thuyết H0

- Kết luận : Tỷ lệ đàn ông và đàn bà trong việc chọn mua các loại ôtô là như nhau.

Trang 4

Bài 2:

Để xác định hiệu quả của một loại thức ăn phụ đối với sự tăng trọng của bò, người ta lấy ngẫu nhiên 8 con bò cùng trọng lượng chia thành hai nhóm, mỗi nhóm 4 con, một nhóm ăn bình thường, một nhóm cho ăn thêm thức ăn phụ Sau 6 tháng thu được kết quả sau:

Nhóm ăn thêm thức ăn phụ

Bài làm:

- Dạng bài: Kiểm định giá trị trung bình với phương sai bằng nhau & Ước lượnghai trung bình tổng thể

- Quy trình thực hiện bằng EXCEL:

Phần 1: Tìm kết luận về tác dụng của loại thức ăn phụ.

Giả thuyết H0: Trọng lượng trung bình của bò ở nhóm ăn thêm thức ăn phụ(A) và nhóm thức ăn bình thường (B) là như nhau

Nhập dữ liệu vào bảng tính

Assuming

4) Nhập vào hộp thoại t-Test Two-Sample Assuming Equal Variances

 Variable 1 Range: Nhập “$A$13:$E$13” (ô A13 → E13)

 Variable 2 Range: Nhập “$A$14:$E$14” (ô A14 → E14)

Trang 5

Vậy thức ăn phụ không có tác dụng đối với số cân nặng của bò.

Phần 2: Ước lượng trọng lượng trung bình của các con bò với mỗi loại thức ăn.

Mở hộp thoại Data Analysis chọn Descriptive Statistics

Trang 6

3) Nhập vào hộp thoại Desciptive Statistics.

 Input Range: phạm vi dữ liệu nhập vào (ô A13 → E13)

 Grouped By: nhóm dữ liệu theo hàng hoặc cột (chọn hàng).

 Labels in first row: nhãn ở cột đầu tiên (chọn).

 Output Range: phạm vi dữ liệu xuất ra (ô I29)

 Tích dấu chọn vào Summary statistics

 Confidence Level for Mean: Nhập 95 (%).

4) Ta được bảng kết quả

Trang 7

 Kết luận:

Trọng lượng trung bình của các con bò ở nhóm ăn thêm thức ăn phụ (A) là:

360 ± 46,84434123.

5) Mở hộp thoại chọn Descriptive Statistics

6) Nhập vào hộp thoại Desciptive Statistics

 Input Range: phạm vi dữ liệu nhập vào (ô A14 → E14)

 Grouped By: nhóm dữ liệu theo hàng hoặc cột (chọn hàng)

 Labels in first row: nhãn ở cột đầu tiên (chọn).

 Output Range: phạm vi dữ liệu xuất ra (ô I47)

 Tích dấu chọn vào Summary statistics

 Confidence Level for Mean: Nhập 95 (%).

Trang 8

Thức ăn phụ không có tác dụng đối với số cân nặng của bò.

Trọng lượng trung bình của các con bò ở nhóm ăn thêm thức ăn phụ

(A) là: 360 ± 46,84434123.

Trang 9

Trọng lượng trung bình của các con bò ở nhóm thức ăn bình thường (B) là: 330 ± 53,56855363.

Trang 10

3 Tính tỷ số tương quan của Y đối với X ,hệ số tương quan và hệ số xác định của tập số liệu sau đây Với mức ý nghĩa  = 5%, có kết luận gì về mối tương quan giữa

X và Y (Có phi tuyến không ? Có tuyến tính không ?).Tìm đường hồi quy của Y đối với X.

Bài giải

 Dạng bài : bài toán kiểm định tương quan và hồi quy

 Quy trình thực hiện bằng EXCEL

1)Phân tích tương quan tuyến tính

· Giả thuyết H0 : X và Y không có tương quan tuyến tính

· Nhập dữ liệu vào máy tính

Mở hộp thoại trong thẻ Data, chọn Corelation

· Nhập vào hộp thoại Correlation

· Input Range: phạm vi đầu vào (ô B7 → Q8)

· Grouped By: nhóm dữ liệu theo hàng hoặc cột (chọn hàng)

· Labels in first row: nhãn ở cột đầu tiên (chọn).

· Output Range: phạm vi dữ liệu xuất ra (ô B12)

Trang 11

· Ta nhận được bảng kết quả.

Biện luận :

Kết luận : X và Y tương quan tuyến tính

2) Phân tích tương quang phi tuyến :

· Giả thiết H1: X và Y không có tương quan phi tuyến.

o Nhập dữ liệu vào bảng tính sau khi đã sắp xếp lại

Trang 12

o Mở hộp thoại chọn Anova Single Factor.

o Nhập vào hộp thoại Anova Single Factor.

 Input Range: phạm vi đầu vào (ô F20 → L23)

 Grouped By: nhóm dữ liệu theo hàng hoặc cột (chọn cột)

 Labels in first column: nhãn ở cột đầu tiên (chọn)

 Alpha: giá trị α =0,05

 Output Range: phạm vi dữ liệu xuất ra E26

Ta nhận được bảng kết quả :

Trang 13

C = 3.68749867

Vì F < c nên chấp nhận giả thuyết H1

Kết luận:

Vậy X và Y không có tương quan phi tuyến.

3) Phân tích hồi quy (sử dụng Regression).

Giả thiết H: Hệ số không thích hợp.

Nhập bảng:

Trang 14

Mở Data Analysis chọn Regression

Hộp thoại Regression xuất hiện

Input Y Range: $C$55:$C$70 Input X Range: $B$55:$B$70 Labels: nhãn (chọn)

Line Fit Plots: vẽ đồ thị (chọn) Output Range: $E$55

Trang 15

Ta được bảng kết quả:

Trang 16

Biện luận:

Hệ số góc = 1.169300226

Hệ số tự do = 6.10609480812639Giá trị P của hệ số tự do (P-value) = 0.668535974062108> α = 0,05 =>chấp nhận giả thiết H

->Hệ số tự do không có ý nghĩa thống kêGiá trị P của hệ số góc (P-value) = 8.41537970890307E-10< α = 0,05 => bác bỏ giả thiết H

->Hệ số góc có ý nghĩa thống kêGiá trị F (Significance F) = 8.41537970890307E-10< α = 0,05 => Bác

bỏ giả thiết H->Phương trình đường hồi quy thích hợp

Trang 17

X và Y có tương quan phi tuyến với mức ý nghĩa 5%.

Phương trình đường hồi quy của Y đối với X: Y = 01.169300226X + 6

4 Hãy phân tích vai trò ngành nghề (chính, phụ) trong hoạt động kinh tế của các hộ gia đình ở một vùng nông thôn trên cơ sở bảng số liệu về thu nhập của một số hộ tương ứng với các ngành nghề nói trên như sau(mức ý nghĩa 5 %):

Trang 18

Nghề chính Nghề phụ

Trồng lúa (1) 3.5:3.4:4.0 7.4:7.6:7.1 8.3:8.1:8.0 3.5:3.4:3.7 Trồng cây ăn quả (2) 5.6:5.2:5.8 4.1:4.4:3.9 6.1:6.4:5.8 9.6:9.7:9.2 Chăn nuôi (3) 4.1:4.4:3.8 2.5:2.5:2.7 1.8:1.6:1.4 2.1:2.3:2.0

Bài giải:

 Dạng bài: bài toán phân tích phương sai hai yếu tố không lặp

 Giả thiết H: Các giá trị trung bình bằng nhau

 Quy trình thực hiện bằng EXCEL Nhập dữ liệu :

Tách xuất dữ liệu:

Nhập vào ô B165 phép toán “=(VALUE(LEFT(C7,FIND(":",C7)-1))

+VALUE(MID(C7,FIND(":",C7)+1,FIND(":",C7,FIND(":",C7)+1)-FIND(":",C7)-1))+VALUE(RIGHT(C7,LEN(C7)-FIND(":",C7,FIND(":",C7)+1))))/3”

Ta được bảng số liệu trung bình:

Trang 19

Mở hộp thoại trong thẻ Data, chọn Anova : Two-Factor without replication

Trang 20

Biện luận :

F rows (Nghề chính) 2.004372056  F0.05  3.862548 nên chấp nhận giả thuyết H(nghề chính)

F col (Nghề phụ) 0.119184704  F0.05  3.862548 nên chấp nhận giảthuyết H(Nghềphụ)

Kết luận :

Vậy cả nghề chính và nghề phụ đều ảnh hưởng đến thu nhập

Ngày đăng: 07/12/2018, 15:26

TỪ KHÓA LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w