H ng d n cách đ c k t qu x lý s li u đi u tra xã h i
h c b ng ch ng trình SPSS/PC+
TÔN L NG CHÍNH
I S l c v ch ng trình SPSS/PC+
Ngày nay, các cu c đi u tra Xã h i h c mang tính đ nh l ng th ng đ c x lý trên máy
vi tính b ng ch ng trình (ph n m m) SPSS/PC+ SPSS là tên vi t t t ti ng Anh c a Statistical Package For Social Science, ngh a là B ch ng trình th ng kê cho Khoa h c xã h i
Ch ng trình SPSS có kh n ng tính đ c t n s , t n xu t, trung v , m t, trung bình s h c,
ph ng sai, sai s tiêu chu n … c a t ng bi n riêng l c a toàn m u c ng nh c a t ng phân nhóm trong m u m t cách đ ng th i Ví d cùng m t lúc ta có th tín đ c tu i k t hôn trung bình c a nhóm Nam và N , ho c tu i k t hôn c a nh ng ng i các đ tu i khác nhau… SPSS cho phép
ta tính đ c t ng quan (m i liên h ) c a hai bi n i m u vi t c a ch ng trình này là ch : nó không ch cung c p cho chúng ta b ng t ng quan gi a hai bi n (ho c ba bi n) mà còn cung c p cho chúng ta h s t ng quan, mà các ch ng trình khác nh FOX , FOXBASE, LOTUS… không có đ c H s t ng quan bi u th m i liên h m nh hay y u c a hai bi n Thông qua h s
t ng quan này chúng ta có th bi t đ c tác đ ng c a bi n khác nhau đ n m t bi n nào đó (ch ng
h n xem tác đ ng c a bi n h c v n và bi n m c s ng đ n bi n đánh giá chính sách đ i v i chính sách đ i m i) thì bi n nào m nh h n H s t ng quan có đ c tính chung là chúng bi n thiên trong kho ng t 0 đ n 1 Khi h s t ng quan b ng 0 gi a hai bi n không có m i liên h Khi nó
b ng 1 thì gi a 2 bi n có m i liên h hàm s (m i liên h r t ch t), ngh a là ta có th bi u th m i liên h đó b ng m t hàm s , ch ng h n hàm s tuy n tính có d ng:
Y= ax + b
Trong đó x,y là các bi n c n đo, còn a, b là các h ng s Khi h t ng quan khác 0 thì ta nói r ng gi a hai bi n có m i liên h t ng quan H s t ng quan càng l n (càng g n 1) thì m i liên h càng ch t Nói cách khác nh h ng c a bi n s đ c l p đ n bi n s ph thu c càng m nh
Ch ng h n h s t ng quan gi a bi n h c v n và bi n đánh giá chính sách đ i m i b ng 0.25 còn
gi a bi n m c s ng và bi đánh giá chính sách đ i m i là 0.40 thì lúc đó ta cod th k t lu n đ c
r ng: h c v n và m c s ng c a ng i dân có nh h ng đ n cách đánh giá c a h v chính sách
Trang 2đ i m i, song m c s ng c a nh ng ng i đ c h i có nh h ng m nh đ n nh n th c c a h v chính sách đ i m i h n h c v n c a h
Ngoài ra v i hai bi n đ nh l ng, ch ng trình SPSS còn tính đ c m i liên h h i quy
ty n tính, ngh a là đ a ra đ c s ph thu c d ng hàm s c a hai bi n này
Môt u đi m khác c a ch ng trình SPSS là ch nó có th t o ra cho ta các bi n m i t hai ho c ba bi n tr nên đã có s n b ng các phép tính s h c, logic
Ch ng trình SPSS là ch ng trình s d ng các công c th ng kê – toán, b i v y các tính toán c a nó đ c th c hi n trên các ngôn ng s Chính vì l đó các thông tin s c p thu đ c t các cu c đi u tra Xã h i h c b ng ph ng pháp ph ng v n tiêu chu n (có b ng h i) ng két c n
ph i đ c chuy n qua ngôn ng s Công vi c chuy n các thông tin b ng l i sang thông tin b ng
s đ c g i là mã hóa (code) Các thông tin b ng s trong ngôn ng máy đ c g i là các giá tr (Value) còn thông tin b ng l i ng v i các giá tr đó là tên c a giá tr (Value Label) Sau khi mã hóa (chuy n ngôn ng l i sang ngôn ng s ) các thông tin này s đ c ch ng trình SPSS /PC+
x lý và phân tích theo yêu c u c a ng i nghiên c u đ i v i t ng câu h i (t ng bi n) c th nh m đáp ng m c tiêu đ t ra cho t ng câu h i phù h p v i d ng thang đo c a câu h i đó
Thông th ng, ch ng trình SPSS cho ta các d ng k t qu sau:
1- B ng t n s , t n su t (Frequency) c a t ng bi n riêng l Khi tính toán t n s (Frequency)
ch ng trình SPSS còn có th cho ta bi t them m t s thông s h tr nh : Trung bình s h c (Mean),
M t (Mode): giá tr có t n s cao nh t, Trung v (Median): giá tr phân chia m u thành hai ph n b ng nhau theo bi n đang tính, Ph ng sai, l ch chu n … Ngoài ra khi t n s máy c ng có th v đ c
đ th phân b c a các giá tr theo ki u hình c t ho c đa giác
2- B ng giá tr trung bình s h c (Mean) c a m t bi n nào đó ( th ng là các bi n đo b ng thang đo đ nh l ng, ví d : ti n l ng, tu i, s thóc thu đ c…) v i m t bi n nào đó Ch ng h n v i câu h i: “ Trung bình m i n m gia đình ta thu đ c bao nhiêu thóc” Lúc đó b ng này cho ta không
nh ng tiêu chí (bi n) khác nhau mà ta c n tính cho nó nh : m c s ng, quy mô gia đình, ngh nghi p
c a gia đình… Bên c nh đó khi tính trung bình s h c Ch ng trình còn cho ta th m thông tin v đ
l ch tiêu chu n ( ph ng sai) theo t ng phân nhóm và s ng i (case) c a phân nhóm đ c đ a vào tính giá tr trung bình s h c
Trang 33- B ng t ng quan c a hai bi n, B ng này th ng có d ng b ng hai chi u v i k hàng và l c t
S l ng hang và c t ph thu c vào s l ng các ph ng án tr l i c a các bi n mà ta c n tính t ng quan Ví d : Bi n A có 3 ph ng án tr l i, còn bi n B có 5 ph ng án tr l i thì s K =3 còn s l = 5
Ch ng trình SPSS ch tính t ng quan cho hai bi n là hai câu h i tuy n (m i ng i ch đ c ch n 1
ph ng án tr l i trong s ph ng án v ch ra) ch không tính đ c cho các câu h i h i Trong b ng ngoài s l ng tuy t đ i (t n s ), còn có s l ng t ng đ i (ph n tr m) S ph n tr m có th tính
đ c theo hang (Row Percent), theo c t (Collum Percent) ho c c hai tùy theo yêu c u và ý ngh a c a cách tính
cu i b ng có đ a ra h t ng quan c a hai bi n Có nhi u lo i h s t ng quan khác nhau
nh : Phi, Cramer, Persson… Tùy theo t ng d ng thang đo c a các bi n mà chúng ta yêu c u máy tính
h s thu c d ng nào cho phù h p Thông th ng h s t ng quan Cramer hay đ c dùng nh t , b i
vì h s này dùng đ c cho t t c các d ng thang đo, t thang đ nh tính đ n thang đo đ nh l ng
II H ng d n s d ng các k t qu
1 B ng t n s có d ng sau:
A1 Thôn đi u tra
Valid Cum
Mode ……… Std Dev …… Variance………
Trang 4Valid Case 202 Missing Case 1
Gi i thích:
Chú ý: Ch ng trình này đ c vi t b ng ti ng Anh cho nên các ph n gi i thích b ng ti ng Vi t
nh : N i dung câu h i, các ph ng án tr l i đ u không có d u, m t khác trong ti ng Anh quy c
ch s có khác v i ti ng Vi t: d u ph y th p phân đ c thay b ng d u ch m cho nên c n l u ý khi
đ c k t qu Ví d : 34.6 c n hi u là 34,6
-Value Label: Tên c a giá tr , ngh a là tên c a ph ng án tr l i trong câu h i mà ta đang tính
Ví d : Tên c a thôn trong câu h i: “Hi n nay gia đình ta s ng thôn nào”
-Value: Ch s , mà ta gán mã cho tên ph ng án đó (mã hóa) đ đ a vào máy tính
- Frenquency: T n s , ngh a là s ng i tr l i theo các ph ng án khác nhau c a câu h i này Ví d : S ng i c a thôn Xuân Viên là 106 ng i
- Percent ( Ph n tr m): T l ph n tr m s ng i tr l i c a m i ph ng án (Value) trên t ng
s ng i đ c đi u tra, k c nh ng ng i không tr l i câu h i này Ví d trong s 203 ng i đ c
đi u tra có 106 ng i c a thôn Xuân Viên, chi m 52,0%
- Valid Percent (T l ph n tr m th c): t l ph n tr m s ng i tr l i c a m i ph ng án (value) trên t ng s ng i tr l i câu h i này Ví d b ng trên do có m t ng i không tr l i câu h i:
“s ng thôn nào” nên t l ph n tr m th c (Valid Percent) c a s ng i thôn Xuân Viên (Value = 1) là 52,3%
- Cum Percent (T n su t tích l y hay ph n tr m tích l y ): T ng ph n tr m c a các ph ng án
tr l i
- Missing: S đ n v thi u v ng không quan sát đ c (không tr l i câu h i này)
- Total: T ng s theo các m c (c t) Ví d : Total theo c t Frequency là t ng s ng i đ c
đi u tra, b ng 203
- Mean: Trung bình s h c c a bi n đang tính (th ng ch đ c tính cho các bi n đo b ng thang đo đ nh l ng nh : thu th p, tu i đ i, s con )
- Std Err: Sai s tiêu chu n
Trang 5- Median: Trung v , đi m phân chia t p h p m u (s ng i đ c đi u tra) thành hai ph n b ng nhau, ngh a là có 50% s ng i đ c đi u tra n m d i trung v , còn 50% ng i còn l i có giá tr
c a bi n (câu h i) đang tính l n h n trung v
- Mode: Giá tr c a bi n (ph ng án tr l i c a câu h i) có t n s cao nh t Mode c ng nh Median là m t d ng trung bình c a các bi n đ nh tính
- Std Dev: l ch chu n (có tài li u th ng kê g i là đ l ch chu n quân ph ng), nói lên s phân tán các giá tr c a bi n đ c tính so v i giá tr trung bình Ví d : 68% ng i tr l i có giá tr n m trong kho ng t trung bình s h c (mean) tr đi đ l ch tiêu chu n (Std Dev) đ n trung bình s h c
c ng v i đ l ch tiêu chu n
- Variance: Ph ng sai, bi u th đ phân tán c a các giá tr quanh trung binh s h c Ph ng sai b ng bình ph ng c a đ l ch tiêu chu n ( hi u rõ h n ý ngh a c a các con s này xin xem thêm tài li u th ng kê toán)
- Valid Cases: S ng i tr l i câu h i này
- Missing Cases: S ng i không tr l i câu h i này
T ng c a Valid Cases và Missing Cases b ng s ng i đ c đi u tra
2 B ng t ng quan (Crosstabulation)
Bi u th m i liên h c a hai bi n (hai câu h i hay hai d u hi u) v i nhau Thông th ng là m t
bi n đ c l p và m t bi n ph thu c B ng t ng quan có d ng sau:
Crosstabulation A5 N i dung (tên) c a bi n A5 (câu h i A5)
by B1 N i dung (tên) c a bi n B1 (câu h i B1) Count N i dung (tên) c a các ph ng án tr l i c a bi n B1
A5
N i dung
1 3
27.3
2 10.0
5
14.7 (tên) c a các
ph ng án
2 5
45.5
1 5.0
6
17.6
Trang 627.3 85.0 100.0 67.6 Câu A5
Total
Column 11
34.4
20 58.8
3 8.8
34 100.0
Number of Missing Observations = 168
Gi i thích:
M đ u b ng có ch Crosstabulation (t ng quan), tên bi n th nh t (th ng đ c bi u th
b ng ch cái v i s ch vi t t t tên bi n, ví d ch A1) ti p đó là gi i thích đ y đ tên bi n (n i dung câu h i th nh t)
Dòng th hai có ch By, ti p đó là ch vi t t t c a bi n th hai (ví d B1) và gi i thích đ y đ
c a bi n th hai (n i dung câu h i th hai) Chú ý: Gi i thích đ y đ tên bi n không đ c dài quá 48
ký t cho nên đ i v i nh ng câu h i dài ch có th vi t đ c các ch đ u Gi i thích các ph ng án tr
l i không đ c dài quá 16 ký t (k c kho ng cách gi a hai t ), dài quá s quy đ nh trên máy s t
đ ng c t Toàn b hai dòng đ u này có ý ngh a là b ng t ng quan c a bi n s nào (câu h i nào) v i
bi n (câi h i) nào
Ti p đ n là b ng s li u t ng quan c a hai bi n s Các ph ng án tr l i c a bi n th hai
đ c b trí theo hàng ngang c a dòng đ u (có m i tên ch vào, ví d B1å) còn các ph ng án tr l i
c a bi n th nh t đ c b trí trong c t đ u Trong ph n các ph ng án tr l i có n i dung các ph ng
án tr l i và ch s mã c a nó Trên cùng c a c t đ u có ghi ch Count, ngh a là cách tính ph n tr m
nh th nào N u d i ch Count có ch :
- Row Pct: Tính ph n tr m theo hàng, ngh a là b ng s ô đó chia cho t ng s các s trong hàng cùng v i ô đó nhân v i 100
- Col Pct: Tính ph n tr m theo c t
- Ho c có c hai ch Row.Pct và Col.Pct t c là tính ph n tr m cho c hàng l n c t
Trong m i ô c a b ng t ng quan có hai ho c ba ch s Ch s trên (s nguyên) là t n s ,
ch s th hai (s th p phân) là t l ph n tr m, ch s th ba (n u có) c ng là ch s th p phân, là t
l ph n tr m
Trang 7C t cu i cùng bên tay ph i c a b ng có ch Row Total ngh a là cách tr l i các ph ng án c a
t t c m u đ i v i bi n A1
Dòng cu i cùng c a c t đ u có ch Column Total, cách tr l i các ph ng án đ i v i câu B1
c a t t c các m u (c cu c đi u tra)
Ti p theo d i b ng có các dòng ch sau:
Dòng th nh t:
- Statistic: Tên h s t ng quan
- Value: Giá tr c a h s t ng quan
Dòng th hai: D i ch Statistic là tên h s t ng quan mà ta tính, ch ng h n: Crammer, Phi, Student d i ch Value là giá tr c a h s t ng quan
Dòng cu i cùng c a b ng này là ch :
Number ò Missing Observation = Ngh a là t ng s ng i không có thông tin m t trong hai
bi n Ví d : câu A1 có 3 ng i không tr l i, còn câu B1 có 5 ng i không tr l i thì Number ò Missing Observation b ng 8
3 B ng tính giá tr trung bình s h c
B ng trung bình s h c c a m t bi n nào đó tính cho các nhóm nh trong m u (theo cách phân chia nào đó toàn m u thành nhóm nh ) th ng có d ng sau đây:
Summaries of A2 Tên bi n c n tính trung bình
By levels of A1 Tên bi n l y làm chu n đ phân chia thành nhóm nh
Trang 8A1 3 nh c a tiêu 49.7727 14.3093 22
Total cases = 202
Missing Cases = 76 or 37.6 PCT
đây c t Variable c t nêu lên bi n (câu h i, d u hi u) làm tiêu chu n phân chia m u thành các nhóm
nh C t value labels là c t tên các nhóm nh , còn c t Mean là giá tr trung bình c a t ng nhóm nh ,
c t Std Dev là đ l ch tiêu chu n c a nhóm và cu i cùng c t Cases là s ng i đ c tính trong m i nhóm
D i dòng ch ti ng Anh đó có dòng ch For Entire Population ngh a là trung bình cho toàn m u Total cases: S ng i đ c đi u tra
Missing cases: T ng s ng i không tr l i c a hai câu là bao nhiêu và chi m bao nhiêu ph n tr m