60 54 324 894 1202 903 112 Có sự khác nhau về tỷ lệ thu nhập của 2 nhóm tuổi này trong số các công nhân lành nghề hay không? Mức ý nghĩa α = 5%. Bài làm: Nhận xét: Đây là bài toán kiểm định giả thiết về tỷ lệ. Phương pháp làm theo tiêu chuẩn 2 Công cụ giải hàm CHITEST Giả thiết H o : Tỷ lệ thu nhập của 2 nhóm tuổi từ 4050 và nhóm từ 5060 trong số các công nhân lành nghề ở Thụy Điển năm 1930 là như nhau. Thực hiện toán bằng excel60 54 324 894 1202 903 112 Có sự khác nhau về tỷ lệ thu nhập của 2 nhóm tuổi này trong số các công nhân lành nghề hay không? Mức ý nghĩa α = 5%. Bài làm: Nhận xét: Đây là bài toán kiểm định giả thiết về tỷ lệ. Phương pháp làm theo tiêu chuẩn 2 Công cụ giải hàm CHITEST Giả thiết H o : Tỷ lệ thu nhập của 2 nhóm tuổi từ 4050 và nhóm từ 5060 trong số các công nhân lành nghề ở Thụy Điển năm 1930 là như nhau. Thực hiện toán bằng excel
Trang 1
TRƯỜNG ĐẠI HỌC BÁCH KHOA TP
HỒ CHÍ MINH
-FLUORESCENCE IN SITU HYDRIDIZATION
KĨ THUẬT LAI HUỲNH
QUANG TẠI CHỖ
GVHD: T.S Đặng Vũ Bích Hạnh
Tp Hồ Chí Minh, ngày 6 tháng 4
Trang 2Bài 1
Đề bài:
-Bảng sau đây cho ta phân bố thu nhập của 2 nhóm tuổi: nhóm từ 40-50 tuổi
và nhóm từ 50-60 tuổi trong số các công nhân lành nghề ở Thụy Điển năm 1930
Có sự khác nhau về tỷ lệ thu nhập của 2 nhóm tuổi này trong số các công nhân lành nghề hay không? Mức ý nghĩa α = 5%
Bài làm:
Nhận xét: Đây là bài toán kiểm định giả thiết về tỷ lệ.
Công cụ giải hàm CHITEST
Giả thiết Ho: Tỷ lệ thu nhập của 2 nhóm tuổi từ 40-50 và nhóm từ 50-60 trong số các công nhân lành nghề ở Thụy Điển năm 1930 là như nhau
Thực hiện toán bằng excel
Nhập giá trị vào bảng tính
Trang 3Tính các tổng số:
điền từ H5 đến H6
điền từ B7 đến G7
Tính các tần số lý thuyết
Áp dụng hàm số CHITEST :
Ta sẽ có được kết quả của P(X> X²).
Trang 4Biện Luận: P(X>X²)=0.5115823>α=0.05
=> Chấp nhận giả thuyết H0
Kết luận: vậy Tỷ lệ thu nhập của 2 nhóm tuổi từ 40-50 và nhóm từ 50-60 trong số các công nhân lành nghề ở Thụy Điển năm 1930 là như nhau
Bài 2
Đề bài:
So sánh giá trị trung bình của các đại lượng với các số liệu sau đây
Mẫu thứ hai: 27 25 22 27 19 23 21 28 23 25 27
Mẫu thứ ba: 20 18 21 21 16 17 20 18 17 19 18
Mẫu thứ tư: 18 16 24 19 22 22 24
Trang 5Mức ý nghĩa α= 5%.
Bài làm
Phương pháp giải là phân tích phương sai một nhân tố
Công cụ giải là Anova single factor
Giả thiết Ho: giá trị trung bình của các mẫu là như nhau
Thực hiện bài toán bằng Excel Nhập dữ liệu vào bảng tính
Vào Data /Data analysis, chọn Anova: Single Factor.
Trong hộp thoại Anova: Single Factor lần lượt ấn định :
hàng)
Trang 6 Chọn Labels in first column (nhãn dữ liệu nằm ở cột đầu).
Nhấn OK, ta sẽ có bảng kết quả sau:
Trang 7Biện luận: F=10.67926 > F0.05 = 2.874187
Kết luận: Vậy giá trị trung bình của các đại lượng của mẫu là khác nhau
Trang 8Bài 3
Đề bài:
Tuổi X và huyết áp Y của bệnh nhân trẻ em dưới 14 tuổi, chọn ngẫu nhiên
được cho như bảng sau:
Tính tỷ số tương quan, hệ số tương quan và hệ số xác định của Y đối với X
Với mức ý nghĩa α=5%, có kết luận gì mối tương quan giữa X và Y (có phi tuyến
không? Có tuyến tính không?)? Tìm đường hồi quy tuyến tính của Y đối với X
Tính sai số tiêu chuẩn của đường hồi quy?
Bài làm Nhận xét : Đây là bài toán kiểm định tương quan
Thực hiện bài toán bằng Excel
(i) Phân tích tương quan tuyến tính.
Nhập giá trị vào bảng tính:
Trang 9Thiết lập bảng Correlation
Trong hộp thoại Correlation lần lượt ấn định:
cột)
Trang 10 Phạm vi đầu ra: Output Range, chọn ô D6
Nhấn OK, ta sẽ có bảng kết quả sau:
Ta tìm được hệ số tương quan r = 0.466627
Và hệ số xác định r 2 = 0.217741
* Giả thiết Ho : X và Y không có tương quan tuyến tính.
2
r n
Trang 11+Tính T : chọn ô E10 và nhập biểu thức =E8*SQRT(14)/SQRT(1-(E8)^2) +Tính c: chọn ô E11 và nhập biểu thức =tinv(0.05,14) (c là phân vị mức
α/2=0.025 của phân bố Student với n-2=14 bậc tự do).
Vì lTl < c nên chưa có cơ sở bác bỏ giả thiết H o
Vậy: Chưa kết luận được X và Y có tương quan tuyến tính.
(ii) Phân tích tương quan phi tuyến.
Sắp xếp lại các giá trị của X và Y theo bảng sau:
Trang 12 Thiết lập bảng Anova: Single Factor.
Vào Data /Data analysis , chọn Anova: Single Factor
Trong hộp thoại Anova: Single Factor lần lượt ấn định :
cột)
Trang 13Nhấn OK, ta sẽ có bảng kết quả sau:
Rút ra được từ bảng Anova:
SSF = 6943.75
SST = 8515.75
Tính :tỉ số tương quan của ƞ2
Y/X = SSF/SST=0.81540
Trang 14* Giả thiết Ho : X và Y không có tương quan phi tuyến.
(c là phân vị mức α=0,05 của phân bố Fisher bậc tự do (k-2,n-k)=(4,10).
Vì: F > c nên bác bỏ giả thiết Ho
Vậy: X và Y có tương quan phi tuyến.
Kết luận :
Hệ số xác định: r2 = 0.217741
Tỷ số tương quan: ƞ2
Y/X =0.81540
T = 1.97405 < c = 2.14479
(c là phân vị mức 0.025 của phân bố Student bậc tự do 14).
F = 8.09403 > c = 3.48 (c là phân vị mức 0,05 của phân bố Fisher bậc tự do (4,10)).
iii) Phân tích hồi quy
Sử dụng Regression
Vào Data/Data analysis, chọn Regression
/ 2
Y X
Y X
F
k
Trang 15Trong hộp thoại Regression lần lượt ấn định:
Input Y Range, quét vùng ($B$3:$B$19).
Input X Range, quét vùng ($A$3:$A$19).
Chọn Line Fit Plots trong Residuals để vẽ đường hồi quy.
Sau đó nhấn OK ta có kết quả :
Kết luận :
Trang 160 2 4 6 8 10 12 14 16 0
50 100 150 200
X Line Fit Plot
Y Predicted Y
X
Sai số tiêu chuẩn của đường hồi quy : 21.81
(tra bảng phân tố Fisher với bậc tự do (4,10) ở mức 0,05)
Vậy: có hồi quy tuyến tính giữa Y với X.
Trang 17Bài 4
Đề bài:
Hãy phân tích tình hình kinh doanh của một số ngành nghề ở 4 quận nội thành trên
cơ sở số liệu và doanh thu trung bình như sau:
Điện lạnh
Vật liệu xây dựng
Dịch vụ tin học
5.7 5.0 3.8
3.1 15.0 1.8
4.4 9.5 1.3
5.0 17.5 4.8 Mức ý nghĩa là 10%
Bài làm :
-Đây là bài toán: Kiểm định giá trị trung bình 2 nhân tố
-Phương pháp làm Phân Tích phương sai 2 yếu tố không lặp
-Công cụ giải Anova: Two Factor without replication
-Các giả thuyết:
+Trung bình các khu vưc có doanh thu bằng nhau
+Trung bình các ngành nghề có doanh thu bằng nhau
+Không có sự tương tác giữa ngành nghề và khu vực
-Các bước làm:
+Chọn Tools\Data Analysis…\Anova: Two-Factor without replication + Chọn các mục như hình:
Trang 18Ta được:
-Ta có: E28>G28: Nên doanh thu phụ thuộc vào ngành
nghề kinh doanh
-E29<G29: Doanh thu không phụ thuộc vào địa điểm
kinh doanh