Câu 4 Một nhóm gồm 105 nhà doanh nghiệp Mỹ được phân loại căn cứ theo thu nhập hàng năm và tuổi của họ Kết quả thu được như sau Tuổi Thu nhập Dưới 100 000 $ Từ 100 000 $ 399 599 $ Trên 400 000 $ Dưới[.]
Trang 1Câu 4 Một nhóm gồm 105 nhà doanh nghiệp Mỹ được phân loại căn cứ theo thu nhập hàng năm và tuổi của họ Kết quả thu được như sau:
Tuổi
Thu nhập
Dưới
100 000 $
Từ 100 000
$ - 399 599
$
Trên
400 000
$
Từ 40 đến
Với mức ý nghĩa 1%, kiểm định giả thiết cho rằng tuổi và mức thu nhập không có quan hệ với nhau.
Bài làm
I C ơ sở lý thuy ết:
a Dạng bài toán: Kiểm định tính độc lập
b Khái niệm thống kê:
Đối với một thí nghiệm có hai kết quả (binomial experiment) - thí dụ, đối với một thuốc được kê đơn: có hay không – bạn thường so sánh hai tỉ số với nhau (thực nghiệm với lí thuyết hay thực nghiệm với thực nghiệm) Song đối với một thí nghiệm có nhiều kết quả (multinomial experiment) – thí dụ, bác sĩ đánh giá tình trạng của các bệnh nhân được điều trị bởi thuốc trong một khoảng thời gian – bạn cần
so sánh nhiều tỉ số Trắc nghiệm “khi” bình phương (2) cho phép bạn so sánh không những hai mà còn nhiều tỉ số (hay tỉ lệ hoặc xác suất) một cách tiện lợi 2 là phân phối về xác suất, không có tính đối xứng và chỉ có giá trị ≥ 0 Giả sử bạn có một công trình nghiên cứu với N thử nghiệm độc lập, mỗi thử nghiệm có k kết quả và mỗi kết quả mang một trong các xác suất thực nghiệm là Pi (i = 1, 2, … k) Nếu gọi Pi,0 là các giá trị
lý thuyết tương ứng với Pi thì các tần số lí thuyết sẽ là Ei = NPi,0 Điều kiện để áp dụng trắc nghiệm 2 một cách thành công là các tần số lí thuyết Ei phải ≥ 5
c Giả thuyết:
H0: P1 = P1,0; P2 = P2,0; … ; Pk = Pk,0 “Các cặp Pi và Pi,0 giống nhau”
H1: “Ít nhất có một cặp Pi và Pi,0 khác nhau”
Trang 2trị thống kê:
Oi: các tần số thực nghiệm (observed frequency);
Ei: các tần số lý thuyết (expected frequency)
Biện luận:
Nếu Bác bỏ giả thuyết H0 (DF = k-1)
Trong chương trình MS-EXCEL có hàm CHITEST có thể tính:
- Giá trị 2 theo biểu thức:
Oij: tần số thực nghiệm của ô thuộc hàng i và cột j;
Eij: tần số lý thuyết của ô thuộc hàng i với cột j;
r: số hàng;
c: số cột
- Xác suất P(X >2) với bậc tự do DF = (r-1)(c-1); trong đó, r là số hàng và c là
số cột trong bảng ngẫu nhiên (contingency table)
Nếu P(X >2) > α Chấp nhận giả thuyết H0 và ngược lại
d Giải thuật:
- Tính các tổng số
- Tổng hàng (row totals)
- Tổng cột (column totals)
-Tổng cộng (grand total)
Trang 3- Tính các tần số lý thuyết
- Tần số lý thuyết = tổng hàng x tổng cột / tổng cộng
II Áp dụng Excel:
- Bảng số liệu:
Tính các tổng hàng : Chọn ô E4 và nhập biểu thức =SUM(B4:D4) Dùng con trỏ kéo kí hiệu tự điền ô E4 đến ô E6
Tính các tổng cột : Chọn ô B7 và nhập biểu thức =SUM(B4:B6) Dùng con trỏ kéo kí hiệu tự điền ô B7 đến ô E7
Chọn ô B10 nhập biểu thức =B$7*$E4/$E$7
Dùng con trỏ kéo ký hiệu từ điền từ ô B10 tới ô D10, D10 tới D12
Trang 4Tính giá trị “P” : Chọn ô B14 và nhập biểu thức =CHITEST(B4:D6,B10:D12)
P(X >2) =0.14375984 > α=0.01 Chấp nhận giả thuyết H0
Kết luận: Tuổi và mức thu nhập không có mối quan hệ với nhau