Kiém tra tinh độc lập

Một phần của tài liệu Giáo trình thống kê xã hội học (Trang 130 - 137)

I.4.6. Tiêu chuẩn phù hợp x2

11.4.7. Kiém tra tinh độc lập

Bài toán đặt ra là: Chúng ta có hai đại lượng (hai đặc trưng xã hội nào đó) X và Y. Thử xem 2 đại lượng này độc lập với nhau hay có sự phụ thuộc lẫn nhau.

H: X và Y độc lập.

K: X và Y phụ thuộc.

9.GTTKXHH-A 129

Giả sử ta có mẫu ngẫu nhiên cỡ n về 2 biến ngẫu nhiên X va Y: (x, ¥)5i= 1n

(Mỗi quan sát cho bai giá tri x, y¡ tương ứng với nhau).

Giá trị của X và Y có thể là định lượng, cũng có thể là định

tính (chẳng hạn phân loại chất lượng, các màu sắc, phân chia các cá thể,..). Giả sử biến X nhận r giá trị (hoặc r khoảng), biến Ÿ nhận s giá trị (hoặc s khoảng). Khi đó, để giải quyết bài toán đặt ra, các bước làm như sau:

— Từ mẫu đã cho ta xác định số lần biến Ä nhận giá trị xạ, biến Ý nhận giá trị yạ. Ký hiệu số này là nụ ¡ = 1,r, j = 1, s.

Ta có một bảng gồm r.s ô:

Y 2

x Yoo fs ++ [| Yo fe - Yoo Tổng hang: hg1

Xay ny ny Nis hgl

Xi nụ ny nhs hgi

Xm Thy ny 1y hgr

Tổng cột cot1 cotj cots n

cotj

— Tinh tổng theo hàng, tổng theo cột:

3 r

hgi= Yn, ; cot j= Sin

1 isl

(Dé ban doc làm quen với việc lấy tổng theo hai chỉ số, ta có:

"Tổng theo moi 6:

130 9. GTTXHH-B

(ny bo ty) + Og He Hg) He + Og toe + Dạ)

¥ Yay =

i=l jel

Hệ thức trên tương đương với:

hgl + hg2 +...+ her = Shei =n r

Me š =1 j islet i=l v= Sin, |-Soput=n

s afr 8

Snj; = Š[Šằ,]-ŸGoizn ) JA isl jel ist 1

x: và ao ^ wLE i.cot j x x

— Mỗi ô (, j ta tính một con số bằng: hgi.cotj Đặt con số n : nay 6 trong ngoặc () dé phan biệt với con số nụ đã có trước đó,

— Tính tổng:

th cot ti)

EP = ial jal Sao hgi.cot SH] vệ ja jet hei. oot

n

Miền bác bỏ tính độc lập của X và Y là:

S={ x” > xổ: se-p(9)} (198)

Lời giải vừa nêu trên là trường hợp riêng khí đưa về áp dụng tiêu chuẩn phù hợp 72. Nếu H đúng thi tổng x? có phân phối khí bình phương với tham SỐ

(t— 1J(s — 1). Do đó miễn S (1.28) sẽ có xác suất nhỏ ơ. Vì thế, nếu S(II.28)

xây ra ta sẽ bác bỏ H, Thực hiện như vậy sẽ thỏa mãn yêu cẩu †' và 2 của bài toán kiểm định giả thiết.

Nếu dùng tổng x? dạng sau (nhận được do khai triển bình phương và rút gọn tử tổng đầu) thi ta bổ qua bước 3.

131

Vi dy 11.18: Nghién citu vé su phu thude giữa đạo đức của trẻ ở tuổi vị thành niên và hoàn cảnh gia đình của họ, ta có một mẫu được điều tra ngẫu nhiên như sau:

Hoàn cảnh

gia đình | Bổ hoặc mẹ Bố mẹ Còn cả Tổng hàng

Phân loại đã mất ly hôn bố mẹ

đạo đức

Ngoan 20 15 50 85

Hư 8 12 10 30

Phạm tội 6 9 5 20

Tổng cột 34 38 65 135

Với mức ý nghĩa œ = 0,10 có thể kết luận tình trạng đạo

đức của trẻ ở tuổi vị thành niên phụ thuộc vào hoàn cảnh gia đình của họ hay không?

Giải:

H: Tình trạng đạo đức và hoàn cảnh gia đình là độc lập.

ẹ: Tỡnh trạng đạo đức và hoàn cảnh gia đỡnh là phụ thuộc.

Để tính toán, ta tính tổng hàng và tổng cột. Để đỡ phải lập lại bảng số liệu đã cho ta dùng luôn bằng trên.

2 [2 20? 182 50” 83 l2 „108 |

X? =135

2 2 2

+188|_Ổ—„ 9... 34.20 86.90 65.20 ố DỊ

= 135.0,0965 = 13,028.

Tra bảng ta được 990,10) = 7,78.

132

13,028 > 7,78 > Ta bac bỏ tính độc lập và chap nhan tình trạng đạo đức của trẻ vị thành niên phụ thuộc vào hoàn cảnh gia đình của họ.

II.4.8. So sánh nhiều tỷ lệ

Trong II.4.5. ta đã so sánh hai tỷ lệ. Bây giờ ta xét bài toán so sánh s tỷ lệ (s > 2).

Gợi p= P(A) hoặc là một tý lệ nào đó đang cần nghiên cứu.

p›, Pạ, ..., p, là các giá trị chưa biết của p tương ứng ở

s tập hoặc s biến.

H:pi=ps=...=p, (s>2) K: Các tỷ lệ không như nhau.

Để giải bài toán này ta đưa về áp dụng bài toán kiểm tra độc lập. Bởi lẽ khi xét một tỷ lệ chưa biết, chúng ta cần hai con số n và m,tức là tập số liệu mẫu sẽ chia làm hai lớp: số lần xây ra biến cố A (m) và số lần không xảy ra A, tức là xảy ra A_ (n — m). Nếu hai dấu hiệu A, A độc lập với các đốt tượng (các tập) thì tỷ lệ p đang xét sẽ như nhau đối với s đối tượng, còn nếu dấu hiệu A phụ thuộc vào các đối tượng thì tỷ lệ p đang xét sẽ thay đổi theo đối tượng. Nghĩa là, giả thiết H ở trên tương đương với tính độc lập của dấu hiệu A với s đối tượng, đối thiết K tương đương với tính phụ thuộc của A với s đối tượng. Vĩ vậy, lời giải của bài toán này hoàn toàn tương tự như bài toán kiểm tra độc lập (xin lưu ý là, ở đây r = 2 vì chỉ

có hai dấu higu Ava A).

_ hứi, ots)

= _

jal jal hại. mm ial j= > he si)

n

Miền bác bỏ giả thiết H sẽ là:

S={xẺ >x2,(@)} đL29)

133

Ví dụ II.19: Một hãng sản xuất ô tô muốn tìm hiểu xem

có sự phụ thuộc nào giữa giới tính của người sở hữu ô tô với kiểu dáng của ô tô hay không. Một mẫu ngẫu nhiên gồm 2000 chủ sở hữu ô tô đã được chọn và phân loại như sau (xem 2):

Kiểu dáng ô tô I II Mi

Gidi tinh

Nam 350 270 380

Nữ 340 400 260

Với mức ý nghĩa œ = 0,025, tỷ lệ nữ dùng ba loại ô tô trên có như nhau không?

Giải:

Rõ ràng bài toán này có thể được giải theo bài toán kiểm tra tính độc lập cũng như theo mô hình so sánh nhiều tỷ lệ.

Theo đề bài thì ta dùng bài toán so sánh ba tỷ lệ.

Gọi p; là tỷ lệ nữ ding 6 tô kiểu đáng loại ¡ ;

H: pi = Po = ps,

K: 3 tỷ lệ không như nhau; œ = 0,025.

Để tính tổng +? ta dùng biểu thức đầu. Ta có bang tinh nhu sau:

Kiểu dỏng ử tụ | lè II Tổng hàng

Giới tính

Nam 350 (345) | 270 (335) | 380 (320) 1000 Nữ 340 (345) | 400 (335) | 260 (320) 1000

Tổng cột 690 670 640 2000

134

ee (350 — 345)? + (340 - 345)" 220 — 335)? + (400 - 335)"

345 335

„ @80 ~ 320)? + (260 - 320)”

= 0,145 + 25,224 + 22,5 = 47,869 390

3. (0,025) = 7,38 > 47,869 > 7,38

Vậy ta chấp nhận ba tỷ lệ khác nhau, hoặc kiểu dáng ô tô có phụ thuộc vào giới tính của chủ sở hữu.

ILS. TUONG QUAN VA HỔI QUY ĐƠN

Đặt bài toán: Khi xét đồng thời hai biến ngẫu nhiên X và Y, như trong II.4.7 ta đã biết, hai biến này có thể độc lập với nhau hoặc hai biến này có sự phụ thuộc với nhau. Bây giờ ta tiếp tục xem xét tình huống hai biến có sự phụ thuộc với nhau. Hỏi rằng loại phụ thuộc là loại nào? Mức độ phụ thuộc là chặt hay lỏng? Biểu thức phụ thuộc như thế nào?

Có nhiều kiểu phụ thuộc, nhưng phổ biến nhất là dạng phụ thuộc hàm số: Y = £(X). C6 rất nhiều đạng ham f. Nhung đạng đơn giản nhất là dạng bậc nhất Y = aX + b, hay là dạng tuyến tính, hay là dạng đường thẳng. Ở mức độ đơn giản của giáo trình chúng ta sẽ đừng lại nghiên cứu ở dạng đơn giản nhất: dạng tuyến tính (mặc dù cho đến nay trong Thống kê Toán học người ta đã nghiên cứu nhiều dạng phụ thuộc khác).

Trong mục này chúng ta sẽ trả lời hai câu hỏi:

— 8ố đo mức độ phụ thuộc tuyến tính giữa hai biến là thế nào ?

~ Biểu thức phụ thuộc dạng tuyến tính giữa hai biến là gì?

135

Giả sử ta có bốn đạng phụ thuộc cụ thể được minh hoạ trong hình vẽ sau;

2) b ce)

Hình II.7. Minh họa xu thế đường thẳng trong một số đạng phụ thuộc

a) Quan hệ giữa hai biến là quan hệ bậc nhất, 100% là đường thẳng.

b) Tinh đường thẳng so với (a) là kém hơn, nhưng so với (e) xu thế đường thẳng còn rõ hơn nhiều.

©) Xu thế đường thẳng so với (b) là kém hơn, nhưng so với (đ) tính đường thẳng của (c) lại rõ hơn.

Như vậy, rõ ràng có tôn tại một số đo, để đo mức độ đường thẳng trong sự phụ thuộc giữa hai biến. Số đo ấy

chính là hệ số tương quan được trình bày dưới đây.

Một phần của tài liệu Giáo trình thống kê xã hội học (Trang 130 - 137)

Tải bản đầy đủ (PDF)

(210 trang)