Áp dụng “t-Test: Two-Sample Assuming Equal Variances”.- Nhấp lần lượt đơn lệnh Data và lệnh Data Analysis EXCEL 2010... Phương pháp: Áp dụng MS-EXEL trong phân tích tương quan và hồi
Trang 1Bài 1:
Một hãng sản xuất ô tô tiến hành một nghiên cứu nhằm xác định xem có sự khácnhau giữa tỉ lệ đàn ông và đàn bà trong việc chọn mua các loại ô tô của hãng haykhông Kết quả thu được như sau:
BÀI LÀM:
Với mức α = 5%, ta cần đưa ra kết luận gì?
Loại bài: Kiểm định giả thiết về tỉ lệ.
Phương pháp: Áp dụng MS-EXCEL trong thống kê suy lý – So sánh tỉ số.
Giả thiết: Gọi H0 là giả thiết tỉ lệ đàn ông và đàn bà chọn mua các loại ô tô
của hãng là như nhau.
Áp dụng MS-EXCEL:
Nhập bảng dữ liệu thực nghiệm và tính tổng hàng tổng cột.
Tính các tổng số:
- Tổng hàng (Row totals): chọn ô B4 và nhập biểu thức = SUM(B2:B3).
- Dùng con trỏ để kéo nút tự điền từ ô C4 đến D5.
- Tổng cột (Column totals): chọn ô E2 nhập biểu thức = SUM(B2:D2).
- Dùng con trỏ để kéo nút tự điền từ ô E2 đến ô E3.
Trang 2- Tổng cộng (Grand total): chọn ô E4 và nhập vào biểu thức = SUM(E2:E3) Hoặc ta có thể tính bằng biểu thức = SUM(B4:D4).
Tính các tần số lý thuyết:
- Tần số lý thuyết = (tổng hàng x tổng cột) / tổng cộng.
- Chọn ô B8 và nhập vào biểu thức = B4*E2/E4.
- Chọn ô B9 và nhập vào biểu thức = B4*E3/E4.
- Tương tự các ô còn lại như trên hình vẽ.
Áp dụng hàm “ CHITEST ” để tính xác suất P:
- Chọn ô A9 và nhập vào biểu thức = CHITEST(B2:D3,B8:D9)
Kết quả : P = 0.582093 > α = 0.01, suy ra chấp nhận giả thiết H0.
Vậy tỉ lệ tỉ lệ đàn ông và đàn bà chọn mua các loại ô tô của hãng là như nhau.
Trang 3BÀI LÀM:
a) Với mức ý nghĩa 5% hãy cho kết luận về tác dụng của loại thức ăn phụ đó, biết rằng trọng lượng của bò là biến ngẫu nhiên phân phối chuẩn.
Loại bài: Kiểm định giả thiết về giá trị trung bình.
Phương pháp: Kiểm định giả thuyết so sánh 2 trung bình với phương sai bằng
nhau.
Giả thiết: Ho : Có thức ăn phụ và không có thức ăn phụ tác dụng như nhau
H1 : Thức ăn phụ có tác dụng tăng trọng
Áp dụng MS-EXCEL:
Nhập dữ liệu vào bảng tính :
Trang 4Áp dụng “t-Test: Two-Sample Assuming Equal Variances”.
- Nhấp lần lượt đơn lệnh Data và lệnh Data Analysis (EXCEL 2010).
Chọn chương trình t-Test: Two-Sample Assuming Equal Varianceslần lượt ấn định:
+ Phạm vi đầu vào (Input Range): Variable 1 range: $A$1:$A$5
Variable 2 range: $B$1:$B$5
+ Output Range: $C$12
- Nhấp OK ta được kết quả sau:
Trang 5- Kết quả và biện luận: F = 1.3416 < F crit = 1.9431
* Vậy bác bỏ giả thiết Ho ,chấp nhận giả thiết H1: thức ăn phụ có tác dụng vào sự
tăng trọng của bò
Trang 6b) Với độ tin cậy 95% hãy ước lượng trọng lượng trung bình của các con bò với mỗi loại thức ăn trên.
Loại bài: Ước lượng khoảng của trung bình.
Phương pháp: Áp dụng MS-EXCEL trong thống kê mô tả Áp dụng
“descriptive statistics”
- Nhấp lần lượt đơn lệnh Data và lệnh Data Analysis
- Chọn lệnh Descriptive statistics:
- Nhấn Ok:
+ Phạm vi đầu vào (Input Range): $A$1:$B$5
+ Cách sắp xếp theo hàng hay cột (Group By): Columns
+ Nhấn dữ liệu (Labels in First Row/Column): Check
+ Output Range: $J$8
+ Check summary statistics
+ Check confidence level for mean: 95%
Trang 7+ Nhấn Ok:
+ Chọn ô K25 nhập biểu thức =$K$6*K11
Trang 8+ Tính hệ số phân tán của nhóm A bằng biểu thức: =K14/K10*100
+ Tính hệ số phân tán của nhóm B bằng biểu thức: =M14/M10*100
- Ta được bảng sau:
Trang 9315 135
355 135
295
175
235
75
195
235
Loại bài: Tương quan và hồi quy.
Phương pháp: Áp dụng MS-EXEL trong phân tích tương quan và hồi quy – Phân
tích tương quan và đường hồi quy tuyến tính đơn giản
Áp dụng MS-EXCEL:
Tính hệ số tương quan:
- Nhập số liệu vào bảng tính:
Trang 10- Áp dụng “Correlation”:
+ Nhấp lần lượt đơn lệnh Data và lệnh Data analysis
+ Chọn phương trình Corelation trong hộp thoại Data analysis rồi nhấp nút OK.
+ Trong hộp thoại Correlation, lần lượt ấn định các chi tiết:
Phạm vi đầu vào (Input Range): $A$1:$B$10
Cách sắp xếp theo hàng hay cột (Group By): Columns
Trang 11 Nhãn dữ liệu (Labels First Row/Column): Checked
Phạm vi đầu ra (Output Range): $E$1
+ Nhấp OK, ta thu được bảng sau:
- Kết luận :
+ Hệ số tương quan: r = 0.97435576
+ Hệ số xác định: Bằng bình phương của hệ số tương quan: r2 = 0.949369149
Phân tích tương quan tuyến tính
- Giả thiết H: X và Y không có tương quan tuyến tính
- Ta tính đc T= 15,61282957
- Mà c = T0.05(13)=t 13:0.025 =2,160368656 (c là phân vị mức α/2=0.025 của phân bố Student với n-2=13 bậc tự do)
2
2 1
r n T
r
Trang 12- Biện luận: T > c
Suy ra bác bỏ giả thiết H X và Y tương quan tuyến tính với nhau
Phân tích mối tương quan phi tuyến:
- Giả thiết H: X và Y không có tương quan phi tuyến.
- Sắp xếp lại các giá trị của X và Y theo bảng sau :
295
- Sử dụng bảng Anova: Single Factor
+ Nhấp lần lượt đơn lệnh Data và lệnh Data analysis
+ Chọn chương trình “Anova: Single Factor” trong hộp thoại Data Analysis rồi nhấn OK
+ Trong hộp thoại Anova: Single Factor lần lượt ấn định:
Phạm vi đầu vào (Input Range): $B$24:$G$27
Cách sắp xếp theo hàng hay cột (Group By): Columns
Nhãn dữ liệu (Labels in First Row/Column): Checked
Mức ý nghĩa (Alpha): 0.05
Output Range: $A$29
Trang 13- Nhấp OK ta được bảng sau:
- Từ bảng Anova: Single Factor ta rút ra được SST và SSF:
+ SST = 118092.308(= Total)
Trang 14Suy ra chấp nhận giả thuyết H, X và Y không có tương quan phi tuyến
Đường hồi quy của Y đối với X :
- Nhấp lần lượt đơn lệnh Data và lệnh Data analysis.
- Chọn chương trình Regresstion trong hộp thoại Data Analysis rồi nhấn OK.
- Trong hộp thoại Regression, lần lượt ấn định các chi tiết:
+ Phạm vi của biến cố Y (Input Y Range): $B$55:$B$70
+ Phạm vi của biến cố X (Input X Range): $A$55:$A$70
+ Nhãn dữ liệu (Labels): Checked
+ Mức tin cậy (Confidence Level) = 95%
/ 2
Trang 15+ Tọa độ đầu ra (Ouput Range): $D$55
+ Và một số tùy chọn khác như đường hồi quy (Line fit plots)…
- Nhấp OK, ta thu được kết quả:
Suy ra đường hồi quy của Y đối với X là: Y = 1,1693X +6,1061
Mối tương quan giữa X và Y :
- Hệ số hồi quy:
0.668535974 > 0.05 : hệ số tự do có ý nghĩa
8.41538E-10 < 0.05: hệ số của X không có ý nghĩa
Trang 16- Phương trình hồi quy: 8.4154E-10 < 0.05 : phương trình hồi quy không thích hợp.
Kết luận: X và Y có tương quan tuyến tính
Trang 17Bài 4:
Hãy phân tích vai trò của ngành nghề ( chính , phụ ) trong hoạt động kinh tếcủa các hộ gia đình ở một vùng nông thôn trên cơ sở bản số liệu về thu nhập củamột số hộ tương ứng với các ngành nghề nói trên như sau ( mức ý nghĩa 5 %)
Loại bài: Kiểm định giả thiết về giá trị trung bình
Phương pháp: Áp dụng MS-EXCEL trong quy hoạch thực nghiệm và phân tích
phương sai – Phương pháp phân tích phương sai hai nhân tố có lặp
Giả thiết:
HA là thu nhập không phụ thuộc vào nghề chính
HB là thu nhập không phụ thuộc vào nghề phụ
HAB không có sự tương tác giữa nghề chính và nghề phụ
Áp dụng MS-EXCEL:
Áp dụng “Anova: Two factor with replication”.
- Nhập dữ liệu vào bảng tính:
Trang 18- Nhấn lần lượt lệnh Data và lệnh Data analysis (EXCEL 2010) như câu 2.
- Chọn chương trình Anova: “Two factor with replication” trong hộp thoại Data
Analysis rồi nhấn nút OK
- Trong hộp thoại Anova: Two factor with replication, lần lượt ấn định:
+ Phạm vi đầu vào (Input Range): $A$8:$E$20
+ Chọn Labels ( nhãn dữ liệu): Checked
+ Rows per sample: 3
+ Mức ý nghĩa (Alpha) : 0.05
Trang 19+ Tọa độ đầu ra (Output Range) là nơi Exel xuất kết quả phân tích: $G$7.
- Nhấp OK, ta thu được kết quả:
Trang 21Vậy: Thu nhập phụ thuộc vào nghề chính
Thu nhập phụ thuộc vào nghề phụ
Có sự tương tác giữa nghề chính và nghề phụ