Hướng dẫn cách đọc kết quả xử lý số liệu điều tra xã hội học bằng chương trình SPSS/PC+

Trang 1

H ng d n cách đ c k t qu x lý s li u đi u tra xã h i

h c b ng ch ng trình SPSS/PC+

TÔN L NG CHÍNH

I S l c v ch ng trình SPSS/PC+

Ngày nay, các cu c đi u tra Xã h i h c mang tính đ nh l ng th ng đ c x lý trên máy

vi tính b ng ch ng trình (ph n m m) SPSS/PC+ SPSS là tên vi t t t ti ng Anh c a Statistical Package For Social Science, ngh a là B ch ng trình th ng kê cho Khoa h c xã h i

Ch ng trình SPSS có kh n ng tính đ c t n s , t n xu t, trung v , m t, trung bình s h c,

ph ng sai, sai s tiêu chu n … c a t ng bi n riêng l c a toàn m u c ng nh c a t ng phân nhóm trong m u m t cách đ ng th i Ví d cùng m t lúc ta có th tín đ c tu i k t hôn trung bình c a nhóm Nam và N , ho c tu i k t hôn c a nh ng ng i các đ tu i khác nhau… SPSS cho phép

ta tính đ c t ng quan (m i liên h ) c a hai bi n i m u vi t c a ch ng trình này là ch : nó không ch cung c p cho chúng ta b ng t ng quan gi a hai bi n (ho c ba bi n) mà còn cung c p cho chúng ta h s t ng quan, mà các ch ng trình khác nh FOX , FOXBASE, LOTUS… không có đ c H s t ng quan bi u th m i liên h m nh hay y u c a hai bi n Thông qua h s

t ng quan này chúng ta có th bi t đ c tác đ ng c a bi n khác nhau đ n m t bi n nào đó (ch ng

h n xem tác đ ng c a bi n h c v n và bi n m c s ng đ n bi n đánh giá chính sách đ i v i chính sách đ i m i) thì bi n nào m nh h n H s t ng quan có đ c tính chung là chúng bi n thiên trong kho ng t 0 đ n 1 Khi h s t ng quan b ng 0 gi a hai bi n không có m i liên h Khi nó

b ng 1 thì gi a 2 bi n có m i liên h hàm s (m i liên h r t ch t), ngh a là ta có th bi u th m i liên h đó b ng m t hàm s , ch ng h n hàm s tuy n tính có d ng:

Y= ax + b

Trong đó x,y là các bi n c n đo, còn a, b là các h ng s Khi h t ng quan khác 0 thì ta nói r ng gi a hai bi n có m i liên h t ng quan H s t ng quan càng l n (càng g n 1) thì m i liên h càng ch t Nói cách khác nh h ng c a bi n s đ c l p đ n bi n s ph thu c càng m nh

Ch ng h n h s t ng quan gi a bi n h c v n và bi n đánh giá chính sách đ i m i b ng 0.25 còn

gi a bi n m c s ng và bi đánh giá chính sách đ i m i là 0.40 thì lúc đó ta cod th k t lu n đ c

r ng: h c v n và m c s ng c a ng i dân có nh h ng đ n cách đánh giá c a h v chính sách

Trang 2

đ i m i, song m c s ng c a nh ng ng i đ c h i có nh h ng m nh đ n nh n th c c a h v chính sách đ i m i h n h c v n c a h

Ngoài ra v i hai bi n đ nh l ng, ch ng trình SPSS còn tính đ c m i liên h h i quy

ty n tính, ngh a là đ a ra đ c s ph thu c d ng hàm s c a hai bi n này

Môt u đi m khác c a ch ng trình SPSS là ch nó có th t o ra cho ta các bi n m i t hai ho c ba bi n tr nên đã có s n b ng các phép tính s h c, logic

Ch ng trình SPSS là ch ng trình s d ng các công c th ng kê – toán, b i v y các tính toán c a nó đ c th c hi n trên các ngôn ng s Chính vì l đó các thông tin s c p thu đ c t các cu c đi u tra Xã h i h c b ng ph ng pháp ph ng v n tiêu chu n (có b ng h i) ng két c n

ph i đ c chuy n qua ngôn ng s Công vi c chuy n các thông tin b ng l i sang thông tin b ng

s đ c g i là mã hóa (code) Các thông tin b ng s trong ngôn ng máy đ c g i là các giá tr (Value) còn thông tin b ng l i ng v i các giá tr đó là tên c a giá tr (Value Label) Sau khi mã hóa (chuy n ngôn ng l i sang ngôn ng s ) các thông tin này s đ c ch ng trình SPSS /PC+

x lý và phân tích theo yêu c u c a ng i nghiên c u đ i v i t ng câu h i (t ng bi n) c th nh m đáp ng m c tiêu đ t ra cho t ng câu h i phù h p v i d ng thang đo c a câu h i đó

Thông th ng, ch ng trình SPSS cho ta các d ng k t qu sau:

1- B ng t n s , t n su t (Frequency) c a t ng bi n riêng l Khi tính toán t n s (Frequency)

ch ng trình SPSS còn có th cho ta bi t them m t s thông s h tr nh : Trung bình s h c (Mean),

M t (Mode): giá tr có t n s cao nh t, Trung v (Median): giá tr phân chia m u thành hai ph n b ng nhau theo bi n đang tính, Ph ng sai, l ch chu n … Ngoài ra khi t n s máy c ng có th v đ c

đ th phân b c a các giá tr theo ki u hình c t ho c đa giác

2- B ng giá tr trung bình s h c (Mean) c a m t bi n nào đó ( th ng là các bi n đo b ng thang đo đ nh l ng, ví d : ti n l ng, tu i, s thóc thu đ c…) v i m t bi n nào đó Ch ng h n v i câu h i: “ Trung bình m i n m gia đình ta thu đ c bao nhiêu thóc” Lúc đó b ng này cho ta không

nh ng tiêu chí (bi n) khác nhau mà ta c n tính cho nó nh : m c s ng, quy mô gia đình, ngh nghi p

c a gia đình… Bên c nh đó khi tính trung bình s h c Ch ng trình còn cho ta th m thông tin v đ

l ch tiêu chu n ( ph ng sai) theo t ng phân nhóm và s ng i (case) c a phân nhóm đ c đ a vào tính giá tr trung bình s h c

Trang 3

3- B ng t ng quan c a hai bi n, B ng này th ng có d ng b ng hai chi u v i k hàng và l c t

S l ng hang và c t ph thu c vào s l ng các ph ng án tr l i c a các bi n mà ta c n tính t ng quan Ví d : Bi n A có 3 ph ng án tr l i, còn bi n B có 5 ph ng án tr l i thì s K =3 còn s l = 5

Ch ng trình SPSS ch tính t ng quan cho hai bi n là hai câu h i tuy n (m i ng i ch đ c ch n 1

ph ng án tr l i trong s ph ng án v ch ra) ch không tính đ c cho các câu h i h i Trong b ng ngoài s l ng tuy t đ i (t n s ), còn có s l ng t ng đ i (ph n tr m) S ph n tr m có th tính

đ c theo hang (Row Percent), theo c t (Collum Percent) ho c c hai tùy theo yêu c u và ý ngh a c a cách tính

cu i b ng có đ a ra h t ng quan c a hai bi n Có nhi u lo i h s t ng quan khác nhau

nh : Phi, Cramer, Persson… Tùy theo t ng d ng thang đo c a các bi n mà chúng ta yêu c u máy tính

h s thu c d ng nào cho phù h p Thông th ng h s t ng quan Cramer hay đ c dùng nh t , b i

vì h s này dùng đ c cho t t c các d ng thang đo, t thang đ nh tính đ n thang đo đ nh l ng

II H ng d n s d ng các k t qu

1 B ng t n s có d ng sau:

A1 Thôn đi u tra

Valid Cum

Mode ……… Std Dev …… Variance………

Trang 4

Valid Case 202 Missing Case 1

Gi i thích:

Chú ý: Ch ng trình này đ c vi t b ng ti ng Anh cho nên các ph n gi i thích b ng ti ng Vi t

nh : N i dung câu h i, các ph ng án tr l i đ u không có d u, m t khác trong ti ng Anh quy c

ch s có khác v i ti ng Vi t: d u ph y th p phân đ c thay b ng d u ch m cho nên c n l u ý khi

đ c k t qu Ví d : 34.6 c n hi u là 34,6

-Value Label: Tên c a giá tr , ngh a là tên c a ph ng án tr l i trong câu h i mà ta đang tính

Ví d : Tên c a thôn trong câu h i: “Hi n nay gia đình ta s ng thôn nào”

-Value: Ch s , mà ta gán mã cho tên ph ng án đó (mã hóa) đ đ a vào máy tính

- Frenquency: T n s , ngh a là s ng i tr l i theo các ph ng án khác nhau c a câu h i này Ví d : S ng i c a thôn Xuân Viên là 106 ng i

- Percent ( Ph n tr m): T l ph n tr m s ng i tr l i c a m i ph ng án (Value) trên t ng

s ng i đ c đi u tra, k c nh ng ng i không tr l i câu h i này Ví d trong s 203 ng i đ c

đi u tra có 106 ng i c a thôn Xuân Viên, chi m 52,0%

- Valid Percent (T l ph n tr m th c): t l ph n tr m s ng i tr l i c a m i ph ng án (value) trên t ng s ng i tr l i câu h i này Ví d b ng trên do có m t ng i không tr l i câu h i:

“s ng thôn nào” nên t l ph n tr m th c (Valid Percent) c a s ng i thôn Xuân Viên (Value = 1) là 52,3%

- Cum Percent (T n su t tích l y hay ph n tr m tích l y ): T ng ph n tr m c a các ph ng án

tr l i

- Missing: S đ n v thi u v ng không quan sát đ c (không tr l i câu h i này)

- Total: T ng s theo các m c (c t) Ví d : Total theo c t Frequency là t ng s ng i đ c

đi u tra, b ng 203

- Mean: Trung bình s h c c a bi n đang tính (th ng ch đ c tính cho các bi n đo b ng thang đo đ nh l ng nh : thu th p, tu i đ i, s con )

- Std Err: Sai s tiêu chu n

Trang 5

- Median: Trung v , đi m phân chia t p h p m u (s ng i đ c đi u tra) thành hai ph n b ng nhau, ngh a là có 50% s ng i đ c đi u tra n m d i trung v , còn 50% ng i còn l i có giá tr

c a bi n (câu h i) đang tính l n h n trung v

- Mode: Giá tr c a bi n (ph ng án tr l i c a câu h i) có t n s cao nh t Mode c ng nh Median là m t d ng trung bình c a các bi n đ nh tính

- Std Dev: l ch chu n (có tài li u th ng kê g i là đ l ch chu n quân ph ng), nói lên s phân tán các giá tr c a bi n đ c tính so v i giá tr trung bình Ví d : 68% ng i tr l i có giá tr n m trong kho ng t trung bình s h c (mean) tr đi đ l ch tiêu chu n (Std Dev) đ n trung bình s h c

c ng v i đ l ch tiêu chu n

- Variance: Ph ng sai, bi u th đ phân tán c a các giá tr quanh trung binh s h c Ph ng sai b ng bình ph ng c a đ l ch tiêu chu n ( hi u rõ h n ý ngh a c a các con s này xin xem thêm tài li u th ng kê toán)

- Valid Cases: S ng i tr l i câu h i này

- Missing Cases: S ng i không tr l i câu h i này

T ng c a Valid Cases và Missing Cases b ng s ng i đ c đi u tra

2 B ng t ng quan (Crosstabulation)

Bi u th m i liên h c a hai bi n (hai câu h i hay hai d u hi u) v i nhau Thông th ng là m t

bi n đ c l p và m t bi n ph thu c B ng t ng quan có d ng sau:

Crosstabulation A5 N i dung (tên) c a bi n A5 (câu h i A5)

by B1 N i dung (tên) c a bi n B1 (câu h i B1) Count N i dung (tên) c a các ph ng án tr l i c a bi n B1

A5

N i dung

1 3

27.3

2 10.0

5

14.7 (tên) c a các

ph ng án

2 5

45.5

1 5.0

6

17.6

Trang 6

27.3 85.0 100.0 67.6 Câu A5

Total

Column 11

34.4

20 58.8

3 8.8

34 100.0

Number of Missing Observations = 168

Gi i thích:

M đ u b ng có ch Crosstabulation (t ng quan), tên bi n th nh t (th ng đ c bi u th

b ng ch cái v i s ch vi t t t tên bi n, ví d ch A1) ti p đó là gi i thích đ y đ tên bi n (n i dung câu h i th nh t)

Dòng th hai có ch By, ti p đó là ch vi t t t c a bi n th hai (ví d B1) và gi i thích đ y đ

c a bi n th hai (n i dung câu h i th hai) Chú ý: Gi i thích đ y đ tên bi n không đ c dài quá 48

ký t cho nên đ i v i nh ng câu h i dài ch có th vi t đ c các ch đ u Gi i thích các ph ng án tr

l i không đ c dài quá 16 ký t (k c kho ng cách gi a hai t ), dài quá s quy đ nh trên máy s t

đ ng c t Toàn b hai dòng đ u này có ý ngh a là b ng t ng quan c a bi n s nào (câu h i nào) v i

bi n (câi h i) nào

Ti p đ n là b ng s li u t ng quan c a hai bi n s Các ph ng án tr l i c a bi n th hai

đ c b trí theo hàng ngang c a dòng đ u (có m i tên ch vào, ví d B1å) còn các ph ng án tr l i

c a bi n th nh t đ c b trí trong c t đ u Trong ph n các ph ng án tr l i có n i dung các ph ng

án tr l i và ch s mã c a nó Trên cùng c a c t đ u có ghi ch Count, ngh a là cách tính ph n tr m

nh th nào N u d i ch Count có ch :

- Row Pct: Tính ph n tr m theo hàng, ngh a là b ng s ô đó chia cho t ng s các s trong hàng cùng v i ô đó nhân v i 100

- Col Pct: Tính ph n tr m theo c t

- Ho c có c hai ch Row.Pct và Col.Pct t c là tính ph n tr m cho c hàng l n c t

Trong m i ô c a b ng t ng quan có hai ho c ba ch s Ch s trên (s nguyên) là t n s ,

ch s th hai (s th p phân) là t l ph n tr m, ch s th ba (n u có) c ng là ch s th p phân, là t

l ph n tr m

Trang 7

C t cu i cùng bên tay ph i c a b ng có ch Row Total ngh a là cách tr l i các ph ng án c a

t t c m u đ i v i bi n A1

Dòng cu i cùng c a c t đ u có ch Column Total, cách tr l i các ph ng án đ i v i câu B1

c a t t c các m u (c cu c đi u tra)

Ti p theo d i b ng có các dòng ch sau:

Dòng th nh t:

- Statistic: Tên h s t ng quan

- Value: Giá tr c a h s t ng quan

Dòng th hai: D i ch Statistic là tên h s t ng quan mà ta tính, ch ng h n: Crammer, Phi, Student d i ch Value là giá tr c a h s t ng quan

Dòng cu i cùng c a b ng này là ch :

Number ò Missing Observation = Ngh a là t ng s ng i không có thông tin m t trong hai

bi n Ví d : câu A1 có 3 ng i không tr l i, còn câu B1 có 5 ng i không tr l i thì Number ò Missing Observation b ng 8

3 B ng tính giá tr trung bình s h c

B ng trung bình s h c c a m t bi n nào đó tính cho các nhóm nh trong m u (theo cách phân chia nào đó toàn m u thành nhóm nh ) th ng có d ng sau đây:

Summaries of A2 Tên bi n c n tính trung bình

By levels of A1 Tên bi n l y làm chu n đ phân chia thành nhóm nh

Trang 8

A1 3 nh c a tiêu 49.7727 14.3093 22

Total cases = 202

Missing Cases = 76 or 37.6 PCT

đây c t Variable c t nêu lên bi n (câu h i, d u hi u) làm tiêu chu n phân chia m u thành các nhóm

nh C t value labels là c t tên các nhóm nh , còn c t Mean là giá tr trung bình c a t ng nhóm nh ,

c t Std Dev là đ l ch tiêu chu n c a nhóm và cu i cùng c t Cases là s ng i đ c tính trong m i nhóm

D i dòng ch ti ng Anh đó có dòng ch For Entire Population ngh a là trung bình cho toàn m u Total cases: S ng i đ c đi u tra

Missing cases: T ng s ng i không tr l i c a hai câu là bao nhiêu và chi m bao nhiêu ph n tr m

Tiêu đề	Hướng dẫn cách đọc kết quả xử lý số liệu điều tra xã hội học bằng chương trình SPSS/PC+
Trường học	Đại học Khoa học Xã hội và Nhân văn, Đại học Quốc gia Hà Nội
Chuyên ngành	Xã hội học
Thể loại	Hướng dẫn
Năm xuất bản	1994
Thành phố	Hà Nội

Định dạng
Số trang	8
Dung lượng	265,32 KB