1. Trang chủ
  2. » Công Nghệ Thông Tin

So 10 XÁC SUẤT THỐNG KÊ

17 3 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Xác Suất Thống Kê
Tác giả Nhóm 10: Sinh viên thực hiện: Lê Bá Bảo, Nguyễn Mạnh Cường, Trần Quang Khôi, Nguyễn Nhật Linh, Nguyễn Hữu Phúc, Trần Hoàng Tiến
Người hướng dẫn NGUYỄN KIỀU DUNG
Trường học Trường Đại Học Bách Khoa Thành Phố Hồ Chí Minh
Chuyên ngành Xác Suất Thống Kê
Thể loại báo cáo bài tập lớn
Năm xuất bản 2016
Thành phố Thành phố Hồ Chí Minh
Định dạng
Số trang 17
Dung lượng 0,91 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

TRƯỜNG ĐẠI HỌC BÁCH KHOA THÀNH PHỐ HỒ CHÍ MINH BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ Giáo viên hướng dẫn NGUYỄN KIỀU DUNG Nhóm 10 Sinh viên thực hiện 1 Lê Bá Bảo 1410198 L05 A 2 Nguyễn Mạnh Cường 1410[.]

Trang 1

TRƯỜNG ĐẠI HỌC BÁCH KHOA THÀNH PHỐ HỒ CHÍ MINH

BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ

Giáo viên hướng dẫn: NGUYỄN KIỀU DUNG

Nhóm 10:

Sinh viên thực hiện:

2 Nguyễn Mạnh Cường 1410452 L05-A

3 Trần Quang Khôi 1411875 L05-A

4 Nguyễn Nhật Linh 1412027 L10-B

5 Nguyễn Hữu Phúc 1412962 L05-A

6 Trần Hoàng Tiến 1414003 L05-A

Dĩ An, tháng 5 năm 2016

Trang 2

BÀI 1 :

Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng các dữ liệu đó cho các yêu cầu sau:

1 Thực hiện phương pháp phân tổ dữ liệu (A)

2 Vẽ đồ thị phân phối tần số và đa giác tần số (A)

3 Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát với độ tin cậy 96% (A)

4 Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị

5 Hãy kiểm định xem dữ liệu (A) hoặc (B) có phù hợp với một phân bố xác suất nào đó hay không?

TRÌNH BÀY :

Dạng bài: Thống kê mô tả

Dữ liệu (A): Khảo sát tuổi thọ của 40 lốp máy bay Airbus A320 của hãng Delay

Airline tại hangar, ta có bảng số liệu sau (đơn vị: giờ)

Dữ liệu (B): Thống kê số chuyến bay quốc tế trong tháng 1/2016 tại sân bay Tân

Sơn Nhất

1/Thực hiện phương pháp phân tổ dữ liệu (A).

 Nhập dữ liệu A vào excel:

 Xác định số tổ cần chia:

Chọn ô D7 nhập vào biểu thức: =(2*COUNT(A1:H5))^(1/3) Kết quả:

4.31

Ta chọn k=4

Trang 3

 Xác định trị số khoảng cách h theo công thức:

 Kết quả: h=21,25

 Ta xác định được các cận trên và cận dưới các tổ lần lượt là:

+ Tổ 1 : 13 - 34,25

+ Tổ 2 : 34,25 – 55,5

+ Tổ 2 : 55,5 – 76,75

+ Tổ 2 : 76,75 – 98

 Nhập vào các ô từ A11 đến A14 lần lượt các giá trị như sau:

 Chọn Data/ Data Analysis/ Histogram:

 Input Range: địa chỉ tuyệt đối chứa dư liệu

 Bin Range: địa chỉ chứa bảng phân nhóm

 Output options: vị trí xuất kết quả

 Confidence Level for Mean: độ tin cậy cho trung bình Chọn

Cumulative Percentage để tính tần suất tích lũy nếu không Excel chỉ tính tần số

 Kết quả sau khi hiệu chỉnh:

Trang 4

2/ Vẽ đồ thị phân phối tần số và đa giác tần số (A).

 Vẽ đồ thị phân phối tần số

+ Quét chọn bảng tần số B19:B22

+ Dùng chức năng Insert Column Chart trên menu Insert

 Kết quả sau khi hiệu chỉnh:

 Vẽ đa giác tần số:

+ Sử dụng bảng phân phối tần số của dữ liệu (A):

+ Thêm giá trị 0 vào đầu và cuối bảng phân phối tần số:

+ Quét chọn B17:B22; dùng chức năng Insert Line Chart trên menu Insert

 Kết quả sau chỉnh sửa:

Trang 5

3/ Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát với độ tin cậy 96% (A).

 Nhập dữ liệu vào bảng tính:

 Chọn chức năng Data/Data Analysis/Descriptive Statistics

+ Input Range: địa chỉ tuyệt đối chứa dư liệu

+ Output options: vị trí xuất kết quả

+ Confidence Level for Mean: độ tin cậy cho trung bình

Trang 6

4/ Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị.

 Nhập dữ liệu và bảng tính:

 Tính tỷ lệ số chuyến bay cho các địa điểm :

 Nhập vào C3: =B3/$B$10, copy cho các ô còn lại

 Vẽ biểu đồ đứng thể hiện số lượng chuyến bay đến các địa điểm

+ Quét chọn cột số chuyến bay (B3:B9)

+ Dùng chức năng Insert /Insert Column Chart/2-D Column trên menu Insert

 Kết quả thu được:

Trang 7

 Vẽ biểu đồ tròn thể hiện số lượng chuyến bay đến các địa điểm

+ Quét chọn cột Số sinh viên (C3:C9)

+ Dùng chức năng Insert/Insert Pie/2-D Pie trên menu Insert

 Kết quả thu được:

Trang 8

BÀI 2 :

Một máy sơn tự động được thiết kế để phun sơn 1 xe ô tô với mức trung bình là 4 kg sơn Dữ liệu dưới đây thể hiện lượng sơn thực tế đã sử dụng để sơn cùng một loại xe trong 2 ngày liên tiếp :

Ngày 1 : 3,8 4,2 3,6 4,1 3,9 4,3 4,1 3,8 3,95 4

Ngày 2 : 4,5 3,8 4,1 3,9 4,5 3,8 4 4,2 đơn vị : kg

Hãy kiểm định xem máy phun sơn có sử dụng lượng sơn trung bình khác nhau giữa 2

ngày hay không, với mức ý nghĩa 1%

TRÌNH BÀY :

Dạng bài : Bài toán kiểm định trung bình 2 tổng thể chưa biết giả thiết 2 phương sai.

Cơ sở lí thuyết :

Bước 1 : Kiểm tra giả thiết 2 phương sai, dùng công cụ F-Test Two-Sample for Variances

o Giả thiết : H01222H112≠ σ22

o Giá trị thống kê : F=s12/s22

o Phân phối Fisher : γ1=N1−1 ; γ2=N2−1

o Biện luận : Nếu F<F α (γ12)  Chấp nhận giả thiết H0 với xác xuất (1-)100%

Bước 2 : Sau khi xác định giả thiết 2 phương sai, ta chọn công cụ T-Test thích hợp.

Nếu σ1222, dùng công cụ T-Test Two-Sample Assuming Equal Variances

o Giả thiết :

H0: μ12H1: μ12 (trắc nghiệm bên phải)

H0: μ12H1: μ12 (trắc nghiệm bên trái)

H0: μ12H1: μ1≠ μ2 (trắc nghiệm 2 bên)

o Giá trị thống kê :

t=(X1− X2)−(μ1−μ2)

S2p

( 1

N1+ 1

N2) =

X1− X2

S2p

( 1

N1+ 1

N2)

o Phân phối Student với γ=N1+N2−2 bậc tự do

S2p=(N1 −1)S12+(N2−1)S21

N1+N2−2

o Biện luận : Nếu t <t α hay t <t α/2 (γ)  Chấp nhận giả thiết H0

Nếu σ12≠ σ22, dùng công cụ T-Test Two-Sample Assuming Unequal Variances

o Giả thiết : H0 H1 như trường hợp trên

o Giá trị thống kê : t như trường hợp trên

o Phân phối Student

N1+

S22

N2)2

(S12/ N1) 2

(S22/ N2) 2

N2 −1

o Biện luận : Nếu t <t α hay t <t α/2 (γ ước tính) Chấp nhận giả thiết H0

Thực hiện bài toán bằng Excel :

Nhập dữ liệu vào bảng tính:

Trang 9

Vào Data/ Data Analysis/ F-Test Two-Sample for Variances

Chọn các mục như hình :

Kết quả hiện thị:

Biện luận đầu tiên :

Giả thiết :

H01222“Lượng sơn phun từ máy là đồng đều ở 2 ngày.”

H1: σ1222 “Lượng sơn phun từ máy là không đồng đều ở 2 ngày.”

Miền bác bỏ : W α =(0,17892 ;+∞)

F = 0,5503 > F0,01 = 0,1782  Bác bỏ giả thiết H0, tức là phương sai của máy phun sơn

ở 2 ngày là khác nhau

Tiếp tục vào Data/ Data Analysis/ T-Test Two-Sample Assuming Unequal Variances

Chọn các mục như hình :

Trang 10

Kết quả hiển thị :

Biện luận cuối cùng :

Giả thiết :

H0: μ12“Máy phun sơn sử dụng lượng sơn giữa 2 ngày là giống nhau.”

H1: μ1≠ μ2 “Máy phun sơn sử dụng lượng sơn giữa 2 ngày là không giống nhau.”

t = 1,0416 < t0,01 = 3,0123  Chập nhận giả thiết H0, tức là máy phun sơn sử dụng lượng sơn giữa 2 ngày là giống nhau

BÀI 3 :

Một nhà nghiên cứu muốn khảo sát thời gian phản ứng của nam giới và nữ giới đối với các loại tín hiệu khác nhau Các đối tượng (15 nam, 15 nữ) tham gia thí nghiệm được yêu cầu nhấn nút ngay khi nhận biết có tín hiệu Đây là bảng số liệu ghi lại thời gian (giây) từ khi tín hiệu được phát đi cho đến khi đối tượng khảo sát có tín hiệu trả lời

Âm thanh Ánh sáng Xung Nam

10,0 7,2 6,8 6,0 5,0

6,0 3,7 5,1 4,0 3,2

9,1 5,8 6,0 4,0 5,1

8,8 9,2

6,6 4,9 2,5

7,3 6,1 5,2

Trang 11

8,1 13,4 4,21,8 2,53,9 Hãy áp dụng bài toán phân tích phương sai 2 yếu tố thích hợp với cơ sở số liệu trên và mức ý nghĩa  = 5%; trình bày các kết luận thu được

TRÌNH BÀY :

Dạng bài : Bài toán phân tích phương sai 2 yếu tố (có lặp)

Cơ sở lí thuyết :

Trang 12

Bảng ANOVA

Nguồn sai số Bậc tự do Tổng số bình phương Bình phươngtrung bình thống kêGiá trị Yếu tố A

(hàng)

Yếu tố B

(cột)

Sai số

Tổng cộng

*Giả thiết :

“Các giá trị trung bình bằng nhau”

“ít nhất có hai giá trị trung bình bằng nhau”

*Giá trị thống kê :

*Biện luận:

Thực hiện bài toán bằng excel :

Nhập số liệu bảng tính :

Sử dụng công cụ “Anova : Two-Factor With Replication”

 Kết quả hiển thị :

Trang 13

Biện luận :

F R =0,6410<F0,05=4,2597  Chấp nhận giả thiết H0

F C =14,6119>F0,05=3,4028  Bác bỏ giả thiết H0

F1=3,4952> F0,05=3,4028  Bác bỏ giả thiết H0

BÀI 4 :

Một nghiên cứu được tiến hành ở thành phố công nghiệp X để xác định tỉ lệ những người đi làm bằng xe máy, xe đạp, xe buýt Việc điều tra được tiến hành trên 2 nhóm và có kết quả như sau:

Với mức ý nghĩa  = 5%, hãy nhận định xem có sự khác nhau về cơ cấu sử dụng các phương tiện giao thông đi làm trong 2 nhóm người lao động nam và nữ hay không

TRÌNH BÀY :

Dạng bài : Kiểm định giả thiết về tỉ lệ.

Cơ sở lí thuyết :

o Giả thiết :

H0 : P1 = P1,0, P2 = P2,0, Pk,0  “Các cặp Pi và Pi,0 giống nhau.”

H1 : “Ít nhất có 1 cặp Pi và Pi,0 khác nhau.”

o Giá trị thống kê :

χ2 =∑

j=1

r

j =1

k

[ (O ij −E ij)2

Oij là tần số quan sát thực tế của ô ở địa chỉ ij

Eij là tần số lý thuyết của ô ở địa chỉ ij , được tính theo công thức:

Eij=((Tổng hàng i)(Tổng cột j))/(cỡ mẫu)

r là số hàng của bảng

c là số cột của bảng

i là kí hiệu của hàng (i=1,2,…,r)

j là kí hiệu của cột (j=1,2,…,c)

Số bậc tự do của đại lượng chi bình phương la df=(r-1)(c-1)

o Biện luận :

Nếu P(X > χ2)  Chấp nhận H0 và ngược lại

Thực hiện bài toán bằng Excel :

Nhập dữ liệu vào bảng tính và tính các tổng hàng, tổng cột :

Tính các giá trị tần số lí thuyết và dùng hàm Chitest để tính giá trị P :

=CHITEST(B2:D3;B7:D8)

Trang 14

Biện luận :

o Giả thiết :

H0 : “Việc chọn phương tiện đi làm có cơ cấu không phụ thuộc vào giới tính 2 nhóm lao động nam và nữ.”

H1 : “Việc chọn phương tiện đi làm có cơ cấu phụ thuộc vào giới tính 2 nhóm lao động nam và nữ.”

o Kết quả : P(X>2) = 0,0022 > =0,05 chấp nhận giả thiết H0, tức là việc chọn phương tiện đi làm có cơ cấu không phụ thuộc vào giới tính 2 nhóm lao động nam và nữ.

Trang 15

BÀI 5 :

Tìm một dữ liệu ngẫu nhiên 2 chiều (X, Y) có kích thước n >10 để sử dụng mô hình hồi

quy tuyến tính đơn Thực hiện các yêu cầu:

1) Tìm hệ số tương quan giữa X,Y

2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Hãy ước

lượng đường hồi quy tuyến tính Y theo X và biểu thị bằng hình vẽ

3) Tìm sai số chuẩn của ước lượng

TRÌNH BÀY :

Khi nghiên cứu lực nâng hình thành trên biên dạng cánh, người ta quan sát lực nâng theo góc tấn  (angle of attack), là góc hợp bởi phương của vận tốc gió và dây cung cánh

Từ đó, rút ra bảng hệ số lực nâng theo góc tấn  (deg) đối với 1 biên dạng cánh nào đó

Cl 0,24 0,35 0,46 0,56 0,65 0,76 0,87 0,97 1,07 1,16 1,26 1,35 1,44

1 Tìm hệ số tương quan giữa X và Y, ở đây là giữa  và C l :

o Cơ sở lí thuyết :

Hệ số tương quan :

R=x i y i−∑x iy i

 Nếu R > 0 thì X, Y tương quan thuận

 Nếu R < 0 thì X, Y tương quan nghịch

 Nếu R = 0 thì X, Y không tương quan

 Nếu | R |= 1 thì X, Y có quan hệ hàm bậc nhất

 Nếu | R |→ 1 thì X, Y có tương quan chặt (tương quan mạnh)

 Nếu | R |→ 0 thì X, Y có tương quan không chặt (tương quan yếu)

o Thực hiện trên Excel :

Nhập dữ liệu vào bảng tính :

Chọn chức năng Data/Data Analysis/Correlation :

Trang 16

o Kết quả :

Hê số tương quan R = 0,999655 ≈ 1, chứng tỏ góc tấn  và hệ số lực nâng Cl có quan hệ hàm bậc nhất

2 Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không ? Hãy ước

lượng đường hồi quy tuyến tính Y theo X và biểu thị bằng hình vẽ.

Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không ?

o Cơ sở lí thuyết :

Giả thiết H0 : X, Y không có tương quan tuyến tính

1−R2

o Thực hiện trên Excel :

Tính T : chọn ô B12 và nhập biểu thức =C10*SQRT(12-2)/SQRT(1-C10*C10)

Tính c : chọn ô B13 và nhập biểu thức =TINV(0.05,10) (c là phân vị mức α/2=0.025 của phân bố Student với n-2=10 bậc tự do)

Vì |T| > c nên bác bỏ giả thiết H0

Vậy: X và Y có tương quan tuyến tính

Ước lượng đường hồi quy tuyến tính Y theo X :

o Phương trình hồi quy tuyến tính :

y s =a+bx ,a=r S y

o Kiểm định hệ số a, b :

Giả thiết H0 : Hệ số hồi quy không có ý nghĩa (=0)

H1 : Hệ số hồi quy có ý nghĩa (≠0)

Trắc nghiệmt <t α, n−2: chấp nhận H0

o Kiểm định phương trình hồi quy :

Trang 17

Giả thiết H0 : “Phương trình hồi quy tuyến tính không thích hợp”.

H1 : “Phương trình hồi quy tuyến tính thích hợp”

Trắc nghiệm F<F α ,1, n−2: chấp nhận H0

o Thực hiện trên Excel :

Dùng chức năng Data/Data Analysis/Regression

-5 0 5 10 15

Cl Line Fit Plot

a Predicted a

Cl

o Biện luận:

Phương trình hồi quy: y s =−2,5399+9,9657 x

Hệ số hồi quy: 1,50587E-12 < 0.05  Hệ số tự do không có ý nghĩa

9,64802E-19 < 0.05  Hệ số của x không có ý nghĩa

 Phương trình hồi quy tuyến tính này không thích hợp vì 9,64802E-19 < 0.05

3) Tìm sai số chuẩn của ước lượng :

Dùng kết quả từ bảng SUMMARY OUTPUT từ câu trên ta xác định được sai số chuẩn của ước lượng:

Đối với biến tự do: SE = 0,073853139

Đối với biến X: SE = 0,078943999

Ngày đăng: 15/04/2023, 12:55

w