ống ở 5 thành phố là Gi i bài toán trên excel: ả thiết độc lập B1:nhập bảng giá trị, thêm dòng tổng cột và dòng tổng hang, tính tổng cột và tổng hàng, trọn hàng/ cột cần tính tổng nhậ
Trang 1ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA
BÁO CÁO BÀI TẬP XÁC SUẤT THỐNG KÊ
GVHD: Thầy Nguyễn Bá Thi
i 1:
Trang 2Bài 1: Một cuộc điều tra xã hội học được tiến hành ở 5 thành phố A, B, C, D, E yêu cầu những người được hỏi diễn tả mức độ thỏa mãn của mình đối với thành phối mà họ đang sống Kết quả được cho như sau:
Thành phố
Mức độ thỏa mãn
Rất thỏa mãn
Tương đối
Không
A B C D E
220 130 84 156 122
121 207 54 95 164
63 75 24 43 73
Với mức ý nghĩa = 5%, kiểm định xem mức độ thỏa mãn cuộc sống có phân bố giống nhau trong 5 thành phố trên hay không?
Bài làm
Nh n Đ nh: đây là d ng bài ki m đ nh gi thi t đ c l p ận Định: đây là dạng bài kiểm định giả thiết độc lập ịnh: đây là dạng bài kiểm định giả thiết độc lập ạng bài kiểm định giả thiết độc lập ểm định giả thiết độc lập ịnh: đây là dạng bài kiểm định giả thiết độc lập ả thiết độc lập ết độc lập ộc lập ận Định: đây là dạng bài kiểm định giả thiết độc lập
Gi thi t :H ả thiết độc lập ết độc lập 0 M c đ thõa mãn cu c s ng 5 thành ph là ức độ thõa mãn cuộc sống ở 5 thành phố là ộc lập ộc lập ống ở 5 thành phố là ở 5 thành phố là ống ở 5 thành phố là
gi ng nhau ống ở 5 thành phố là
Gi i bài toán trên excel: ả thiết độc lập
B1:nhập bảng giá trị, thêm dòng tổng cột và dòng tổng hang, tính tổng cột và tổng hàng, trọn hàng/ cột cần tính tổng nhập lệnh =Sum(vùng cần quét) ví dụ tính tổng hàng thành phố A
Ta chọn ô F4 và nhập =Sum(C4:E4),
Trang 3Làm tương tự vs các hàng và cột còn lại ta được bảng giá trị
Để tính tổng cộng ta kích cà ô F9 và nhập =SUM(F4:F8)
Trang 4B2:thiết lập bảng tần số , tính giá trị tần số lý thuyết và tính giá trị P
ví dụ Nhập vào ô C12 =($C$9*$F$4/$F$9)
Làm tương tự với các ô còn lại ta được
Trang 5Tính P, ta sử dụng hàm ChiTest Kích vào ô C17 và nhập = ChiTesT(C4:E8,C12:E16)
Kết quả: P= 3.5299E-13
Trang 6Biện luận:
P( X> χ2) = 3.5299E-13 < α = 0.05 bc bỏ giả thuyết H0
Kết luận:
Mức độ thỏa mãn cuộc sống phân bố khác nhau trong 5 thành phố trên.
Bài 2: Ở một bệnh việc lớn, số ca cấp cứu trong 5 ngày chọn ngẫu nhiên được ghi lại như sau:
Buổi sáng: 44 53 56 49 38
Buổi chiều: 33 42 15 30 45
Buổi tối: 39 24 30 27 30
Với mức ý nghĩa 5%, có thể cho rằng số ca cấp cứu trung bình trong ba buổi sáng, chiều, tối là khác nhau được không?
Bài làm
Nhận xét: đây là dạng bài phân tích phương sai 1 yếu tố
tối khơng khác nhau.
Dùng Excel để giải :
Nhập bảng số liệu :
Vào Data /Dataanalysis, chọn Anova: SingleFactor
Trang 7Chọn OK
Trên màng hình sẽ hiện lên hộp thoại của Anova: Single
Factor
Ta nhập các thông số như hình dưới
Phạm vi của biến số Y(Input Range): ta kéo chuột từ ô A1 tới ô
F3
Alpha: 0.05
Group by: Rows
Xuất kết quả (Output options): kích vào output Range
Chọn ô B5 xuất ra kết quả
Nhấn OK và ta được
Trang 8Kết quả F=6,26966 > F0,05 =3,88529
Kết luận: số ca cấp cứu trung bình trong 3 buổi sáng , chiều, tối khác nhau
Trang 93 Tính t s t ương quan của Y đối với X ,hệ số tương quan và hệ số xác định ng quan c a Y đ i v i X ,h s t ủa Y đối với X ,hệ số tương quan và hệ số xác định ới X ,hệ số tương quan và hệ số xác định ệ số tương quan và hệ số xác định ương quan của Y đối với X ,hệ số tương quan và hệ số xác định ng quan và h s xác đ nh ệ số tương quan và hệ số xác định ịnh
c a t p s li u sau đây V i m c ý nghĩa ủa Y đối với X ,hệ số tương quan và hệ số xác định ập số liệu sau đây Với mức ý nghĩa ệ số tương quan và hệ số xác định ới X ,hệ số tương quan và hệ số xác định ức ý nghĩa = 5%, cĩ k t lu n gì v m i t ết luận gì về mối tương ập số liệu sau đây Với mức ý nghĩa ề mối tương ương quan của Y đối với X ,hệ số tương quan và hệ số xác định ng quan gi a X và Y (Có phi tuy n không ? Có tuy n tính không ?).Tìm đ ết luận gì về mối tương ết luận gì về mối tương ường hồi ng h i ồi quy c a Y đ i v i X ủa Y đối với X ,hệ số tương quan và hệ số xác định ới X ,hệ số tương quan và hệ số xác định
X 210 90 240 50 240 270 130 270 90 240 130 170 50 170 210
Y 255 115 255 35 275 315 135 355 135 295 175 235 75 195 235
Bài gi i: ải:
D ng bài ạng bài : đây là bài toán phân tích tương quan và hồi quyng quan và h i quyồi quy
Th c hi n bài toán b ng Excel ực hiện bài toán bằng Excel ệ số tương quan và hệ số xác định ằng Excel
Phân tích t ương quan tuyến tính ng quan tuy n tính ến tính
1.Nh p giá tr vào b ng tínhận Định: đây là dạng bài kiểm định giả thiết độc lập ịnh: đây là dạng bài kiểm định giả thiết độc lập ả thiết độc lập
Thi t l p b ng ết luận gì về mối tương ập số liệu sau đây Với mức ý nghĩa ải: Correlation.
Vào Tools /Data analysis , ch n ọn Correlation
Trang 10Trong h p tho i ộc lập ạng bài kiểm định giả thiết độc lập Correlation l n lần lượt ấn định: ượt ấn định: ấn định:t n đ nh:ịnh: đây là dạng bài kiểm định giả thiết độc lập
Ph m vi đ u vào: ạng bài kiểm định giả thiết độc lập ần lượt ấn định: Input Range, quét vùng (A2:B17).
Cách nhóm theo hang hay c t: ộc lập Group By, ch n ọn Columns (nhóm theo
c t).ộc lập
Ch n ọn Labels in first row (nhn d li u hàng đ u).ữ liệu ở hàng đầu) ệu ở hàng đầu) ở 5 thành phố là ần lượt ấn định:
Ph m vi đ u ra: ạng bài kiểm định giả thiết độc lập ần lượt ấn định: Output Range, ch n ô ọn F11
Nh n OK, ta sẽ có b ng k t qu sau:ấn định: ả thiết độc lập ết độc lập ả thiết độc lập
Trang 11Ta tìm đượt ấn định: h s tc ệ số tương quan và hệ số xác định ương quan của Y đối với X ,hệ số tương quan và hệ số xác định ng quan r = 0.974356
Và h s xác đ nh ệ số tương quan và hệ số xác định ịnh r 2 = 0.94937
* Gi thi t Hả thiết độc lập ết độc lập o : X và Y không có t ương quan tuyến tính ng quan tuy n tính ến tính
Ta có T=15.61296 v i ới X ,hệ số tương quan và hệ số xác định
Mà c = 2.160
(c là phân v m c ịnh: đây là dạng bài kiểm định giả thiết độc lập ức độ thõa mãn cuộc sống ở 5 thành phố là á/2=0.025 c a phân b ủa phân bố ống ở 5 thành phố là Student v i n-2=ới n-2= 13 b c t do).ận Định: đây là dạng bài kiểm định giả thiết độc lập ự do)
Vì T> c nên bác b gi thuy t H ỏ giả thuyết H ả thuyết H ến tính 0 V y X và Y có t ậy X và Y có tương quan tuyến tính ương quan tuyến tính ng quan tuy n tính ến tính
I Phân tích t ương quan tuyến tính ng quan phi tuy n ến tính
S p x p l i các giá tr c a X và Y theo b ng sauắp xếp lại các giá trị của X và Y theo bảng sau ết độc lập ạng bài kiểm định giả thiết độc lập ịnh: đây là dạng bài kiểm định giả thiết độc lập ủa phân bố ả thiết độc lập
Thi t l p b ng ết luận gì về mối tương ập số liệu sau đây Với mức ý nghĩa ải: Anova: Single Factor.
Vào Tools /Data analysis , ch n ọn Anova: Single Factor
2
2 1
r n T
r
Trang 12
Trong h p tho i ộc lập ạng bài kiểm định giả thiết độc lập Anova: Single Factor l n lần lượt ấn định: ượt ấn định: ấn định:t n đ nhịnh: đây là dạng bài kiểm định giả thiết độc lập :
Ph m vi đ u vào: ạng bài kiểm định giả thiết độc lập ần lượt ấn định: Input Range, quét vùng (B2:H5).
Cách nhóm theo hàng hay c t: ộc lập Group By, ch n ọn Columns (nhóm theo c t).ộc lập
Ch n ọn Labels in first row (nhn d li u n m hàng đ u).ữ liệu ở hàng đầu) ệu ở hàng đầu) ằm ở hàng đầu) ở 5 thành phố là ần lượt ấn định:
M c ý nghĩa : ức độ thõa mãn cuộc sống ở 5 thành phố là Alpha ( n đ nh ấn định: ịnh: đây là dạng bài kiểm định giả thiết độc lập á=0,05).
Ph m vi đ u ra: ạng bài kiểm định giả thiết độc lập ần lượt ấn định: Output Range, ch n ô ọn J8
Nh n OK, ta sẽ có b ng k t qu sau Rút ra đấn định: ả thiết độc lập ết độc lập ả thiết độc lập ượt ấn định: ừ bảng Anova: ả thiết độc lập c t b ng Anova:
Trang 13SSF = 114693.3 SST = 119093.3
Y/X = SSF/SST = 0.96305
=> T s tỉ số tương quan ống ở 5 thành phố là ương quan và hồi quyng quan : çY/X =0.98135
* Gi thi t Hả thiết độc lập ết độc lập o : X và Y không có t ương quan tuyến tính ng quan phi tuy n ến tính
Ta có: F= 0,022728 v i ới n-2=
Mà: c = 3,69
(c là phân v m c ịnh: đây là dạng bài kiểm định giả thiết độc lập ức độ thõa mãn cuộc sống ở 5 thành phố là á=0,05 c a phân b ủa phân bố ống ở 5 thành phố là Fisher b c t do (k-2,n-k)=(ận Định: đây là dạng bài kiểm định giả thiết độc lập ự do) 5,8).
Vì: F < c nên ch p nh n gi thi t H ấp nhận giả thiết H ập số liệu sau đây Với mức ý nghĩa ải: ết luận gì về mối tương o
V y: ận Định: đây là dạng bài kiểm định giả thiết độc lập X và Y không có t ương quan tuyến tính ng quan phi tuy n ến tính
K t lu n ết luận gì về mối tương ập số liệu sau đây Với mức ý nghĩa :
H s t ệ số tương quan và hệ số xác định ương quan của Y đối với X ,hệ số tương quan và hệ số xác định ng quan: r = 0.974356
Và h s xác đ nh: ệ số tương quan và hệ số xác định ịnh r 2 = 0.94937
T s t ương quan của Y đối với X ,hệ số tương quan và hệ số xác định ng quan : ç2
Y/X = 0.96305
T = 15,61296 > c = 2.160
(c là phân v m c ịnh: đây là dạng bài kiểm định giả thiết độc lập ức độ thõa mãn cuộc sống ở 5 thành phố là 0.025 c a phân b ủa phân bố ống ở 5 thành phố là Student b c t do 13).ận Định: đây là dạng bài kiểm định giả thiết độc lập ự do)
Vì T> c nên bác b gi thuy t H ỏ giả thuyết H ả thuyết H ến tính 0 , hay X và Y có t ương quan tuyến tính ng quan tuy n tính ến tính
F = 0.022728 < c = 3.69
(c là phân v m c ịnh: đây là dạng bài kiểm định giả thiết độc lập ức độ thõa mãn cuộc sống ở 5 thành phố là 0,05 c a phân b ủa phân bố ống ở 5 thành phố là Fisher b c t do (5ận Định: đây là dạng bài kiểm định giả thiết độc lập ự do) ,8).
=> X và Y không có t ương quan tuyến tính ng quan phi tuy n v i m c ý nghĩa 5% ến tính ới mức ý nghĩa 5% ức ý nghĩa 5%.
III Phân tích h i quy: ồi
/ 2
Y X
Y X
r n k F
k
Trang 14S d ng Regression ử dụng Regression ụng Regression
Nh p d li u vào b ng tính nh sau: ập số liệu sau đây Với mức ý nghĩa ệ số tương quan và hệ số xác định ải: ư
Vào Tools/Data analysis, ch n ọn Regression
Trong h p tho i ộc lập ạng bài kiểm định giả thiết độc lập Regression l n lần lượt ấn định: ượt ấn định: ấn định:t n đ nh:ịnh: đây là dạng bài kiểm định giả thiết độc lập
Ph m vi đ u vào:ạng bài kiểm định giả thiết độc lập ần lượt ấn định:
Input Y Range, quét vùng ($B$2:$B$16).
Input X Range, quét vùng ($A$2:$A$16).
Ch n ọn Labels (thm nhn d li u).ữ liệu ở hàng đầu) ệu ở hàng đầu)
Ph m vi đ u ra: ạng bài kiểm định giả thiết độc lập ần lượt ấn định: Output Range, ch n ô $ọn D$11.
Ch n ọn Line Fit Plots trong Residuals đ vẽ đểm định giả thiết độc lập ường hồi quyng h i quyồi quy
Trang 15Sau đó nh n OK ta có k t qu :ấn định: ết độc lập ả thiết độc lập
K t lu n ến tính ậy X và Y có tương quan tuyến tính :
Đ ường hồi ng h i quy c a Y đ i v i X là : ồi ủa Y đối với X ,hệ số tương quan và hệ số xác định ới X ,hệ số tương quan và hệ số xác định
Y= 6.159101 + 1.167563X
4 Hy phn tích vai tr ngnh ngh (chính, ph ) trong ho t đ ng kinh t c a các ịnh ề mối tương ụng Regression ạng bài ộng kinh tế của các ết luận gì về mối tương ủa Y đối với X ,hệ số tương quan và hệ số xác định
h gia đình m t vng n ng thôn trên c s b ng s li u v thu nh p c a m t ộng kinh tế của các ở một vng nơng thôn trên cơ sở bảng số liệu về thu nhập của một ộng kinh tế của các ơng quan của Y đối với X ,hệ số tương quan và hệ số xác định ơng quan của Y đối với X ,hệ số tương quan và hệ số xác định ở một vng nơng thôn trên cơ sở bảng số liệu về thu nhập của một ải: ệ số tương quan và hệ số xác định ề mối tương ập số liệu sau đây Với mức ý nghĩa ủa Y đối với X ,hệ số tương quan và hệ số xác định ộng kinh tế của các
s h t ộng kinh tế của các ương quan của Y đối với X ,hệ số tương quan và hệ số xác định ng ng v i các ngành ngh nói trên nh sau(m c ý nghĩa 5 %): ức ý nghĩa ới X ,hệ số tương quan và hệ số xác định ề mối tương ư ức ý nghĩa
Ngh chính ề mối tương Ngh ph ề mối tương ụng Regression
Trang 16(1) (2) (3) (4)
Tr ng lúa (1) ồi
Tr ng cây ăn ồi
qu (2) ải:
Chăn nuôi (3)
D ch v (4) ịnh ụng Regression
3.5:3.4:4.
0 5.6:5.2:5.
8 4.1:4.4:3.
8 7.2:7.0:7.
7
7.4:7.6:7.
1 4.1:4.4:3.
9 2.5:2.5:2.
7 3.2:3.5:3.
1
8.3:8.1:8.
0 6.1:6.4:5.
8 1.8:1.6:1.
4 2.2:2.6:2.
3
3.5:3.4:3.
7 9.6:9.7:9.
2 2.1:2.3:2.
0 1.5:1.7:1.
4
D ng bài: đây là bài phân tích phạng bài kiểm định giả thiết độc lập ương quan và hồi quyng sai hai y u tết độc lập ống ở 5 thành phố là
Gi thuy t : Hả thiết độc lập ết độc lập A là năng su t không ph thu c vào ngh chínhấn định: ụ thuộc vào nghề chính ộc lập ề chính
: HB là năng su t không ph thu c vào ngh phấn định: ụ thuộc vào nghề chính ộc lập ề chính ụ thuộc vào nghề chính
: HAB là năng su t gi a ngh chính và ngh ph không có liên quan đ nấn định: ữ liệu ở hàng đầu) ề chính ề chính ụ thuộc vào nghề chính ết độc lập nhau
Th c hi n bài toán b ng Excelự do) ệu ở hàng đầu) ằm ở hàng đầu)
1 Nh p d li u vào b ng tính: ập số liệu sau đây Với mức ý nghĩa ệ số tương quan và hệ số xác định ải:
Ch n Tools\Data Analysis…\Anova: Two Factor With Replicationọn
Trang 17Trong h p tho i Anova : Two-factor With Replication l n n đ nh:ộc lập ạng bài kiểm định giả thiết độc lập ần lượt ấn định: ấn định: ịnh: đây là dạng bài kiểm định giả thiết độc lập
Ph m vi đ u vào:ạng bài kiểm định giả thiết độc lập ần lượt ấn định:
Input Y Range, quét vùng ($A$2:$E$14)
Rows per sample : 3
Alpha: 0.05
Output Range : ($G$17)
Sau đó nh n OK ta có k t qu : ấp nhận giả thiết H ết luận gì về mối tương ải:
Trang 19
K t lu n: ết luận gì về mối tương ập số liệu sau đây Với mức ý nghĩa
602.7073 = FA > Fn-1;nm(r-1);1-á = 2,901112 bác b y u t Hỏ yếu tố H ết độc lập ống ở 5 thành phố là A, năng ph ụ thuộc vào nghề chính thu c vào ngh chính.ộc lập ề chính
35.55285 = FB > Fm-1;nm(r-1);1-á = 2.901112 bác b y u t Hỏ yếu tố H ết độc lập ống ở 5 thành phố là B , năng su t ấn định:
ph thu c vào ngh ph ụ thuộc vào nghề chính ộc lập ề chính ụ thuộc vào nghề chính
301,7487 = FAB > F(n-1)(m-1);nm(r-1);1-á = 2.188766 bác b y u t Hỏ yếu tố H ết độc lập ống ở 5 thành phố là AB, có s ự do)
tương quan và hồi quyng tác năng su t gi a ngh chính và ngh ph ấn định: ữ liệu ở hàng đầu) ề chính ề chính ụ thuộc vào nghề chính