Tuy nhiên trong SPSS ký t chúng ta nên mã hóa nó d ng s... c b n nh ng thông tin trong codebook gi ng nh là các thông tin c thVariable Information Measurement Level Column Width Alignmen
Trang 1Qu n lý s li u - bi n phân lo i
(bi n nh tính)
Tài li u gi ng d y: Giáo trình th ng kê Y t Công C ng- ph n 2, Phân tích
li u Nhà xu t b n Y h c xu t b n n m 2005 v i b s li u biostats2 sav
qu n lý s li u bao g m:
1 Mã hóa s li u
2 Nh p s li u
3 Ki m tra và làm s ch s li u
hành mã hóa s li u
I Mã hóa s li u là quá trình s hóa các giá tr ho c m c c a bi n Sau
ây là m t vài quy t c chúng ta nên tham kh o và cân nh c khi ti n hành mã hóa s li u:
câu (bi n d ng ký t ) nh là m t d ng s li u ký t Tuy nhiên trong SPSS
ký t chúng ta nên mã hóa nó d ng s Ví d nh bi n Gi i tính (gender), m t quan sát có th là nam ho c n V y chúng ta có th mã hóa l i nh sau:
1 : Nam
Trang 2u ý r ng b n ph i nh t quán trong nghiên c u cách mã hóa gi ng nhau và
2 Các giá tr mã c a m t bi n ph i không trùng nhau: t c m t bi n c a m i quan sát ch nh n m t giá tr ho c m t danh sách các giá tr Trên th c t , trong
Ví d :
1: nam 2: n
thì chúng ta ch c n m t bi n gender, bi n này có hai giá tr 1 và
2
6 Khác (… )
Trang 31 Ng i nào v a tr l i là v a t b n bè ng i thân v a t t p chí sách báo thì C42 có giá tr là 1 và C45 c ng có giá tr b ng 1
các m c phân lo i và các giá tr c a các bi n l i v i nhau khi ti n hành mã hóa
li u N u b n th y c n ph i g p thì hãy ti n hành g p khi phân tích s li u
chi ti t càng t t Các thông tin nh tính ch s BIM hay là nhóm tu i nên th c
có thông tin và ph i nh p l i toàn b s li u
li u SPSS Trong SPSS các thông tin c a m i quan sát ch n m trên m t
missing (ch ra bi n b thi u thông tin) Tuy nhiên thì nhi u khi chúng ta
có có ngh a là b n th ng nh t m t mã cho t t c các quan sát cùng tr l i m t câu h i, b thi u thông tin m t câu h i L u ý này r t quan tr ng cho nh ng câu h i nhi u l a ch n n u b n 1 là có, 0 là không cho l a ch n ó thì ph i
th ng nh t trên toàn b s li u ho c trong câu h i ó
6 Nên s d ng các giá tr cao cho nh ng câu tr l i có th t B n nên code
Trang 41Chi ti t c th v ph n mã hóa s li u, hãy c ph n 2.2.1 X lý và
nh p s li u trong Giáo trình Th ng kê Y t Công c ng ph n 2 (trang 12 -17).
II Nh p s li u
quá trình phân tích s li u Hi n nay có nhi u ph n m m có th h tr trong quá trình nh p s li u V i nh ng s li u l n chúng ta có th s d ng các ph n
m qu n lý s li u chuyên nghi p nh Microsoft Access, Oracle,… .V i
nh ng ph n m m nh chúng ta có th s d ng Epidata, Epi Info là nh ng ph n
tra N u th y sai khác quá nhi u c ng ph i nh p l i
1 c thêm ph n 2.2.2 Nh p s li u, Giáo trình Th ng kê Y t Công
ng, ph n 2 n m 2005 (trang 17 và 18)
III Ki m tra và làm s ch s li u
SPSS có hai c a s màn hình là Data view và Variable View bên c nh các c a
khác nh là Output, syntax C a s Data view hi n th s li u trong b s
bi n trong b s li u ang m
s li u Chilumba g m các bi n s có chi ti t nh sau:
Id (tên bi n) Identity number Mã s Caco (b nh) 1=case, 0=control 1=b nh, 0=ch ng
Trang 5Agegrp (nhóm
tu i)
Age group: 1=1/14 2=15/24 3
= 25/34 4 = 35-44 5 = 45+
Nhóm tu i: 1=1/14 2=15/24 3 = 25/34 4 = 35-44 5 = 45+
Sex (gi i thi u) 0=male, 1=female 0=nam, 1=nu Bcgscar (ch ng
ng a BCG)
0=no, 1=yes 0=không, 1=có
School (h c n)
Duration of schooling: 1=none 2=1-3 year 3=4-6 year 4=7+
year
H c v n : 1=không 2=1-3 n m 3=4-6 n m 4=7+ n m
Mbcont (ti p xúc phong u)
Contact with MB case Ti p xúc v i phong u (có nhi u
vi khu n) Pbcont (ti p
xúc phong c )
Contact with PB case Ti p xúc v i phong c (có ít vi
khu n)
bi n và lo i bi n Khi b n nh p m t ph n m m khác r i sau ó chuy n sang
u b n mu n chuy n ki u bi n hãy kích chu t vào d u ba ch m t i bi n mà
n mu n chuy n Khi ó c a s ki u bi n s hi n ra nh sau và b n ch n lo i
Trang 6u b n mu n chuy n ki u o l ng c a bi n nh l ng (có ba lo i o l ng chính scale – t s ; ordinal – th b c, norminal – nh danh) thì b n kích vào
xanh)
n
2 D a vào mã c a các giá tr bên c t mã bi n: hãy chuy n ki u o l ng cho t t c các bi n trong b s li u Chilumba Sav thành d ng thích h p
Trang 7Sau khi hoàn thành ph n ki m tra lo i bi n và d ng o l ng c a bi n, chúng ta
sau s hi n ra:
n nh p giá tr c a bi n vào r i kích add vào c a s B n thao tác cho khi hoàn thành h t các mã c a bi n ó
2 D a vào mã c a các giá tr bên c t mã bi n: hãy dán nhãn cho t t c các bi n trong b s li u Chilumba Sav
1Chi ti t thông tin v ph n này tham kh o ph n xem b s li u trong SPSS, Giáo trình Th ng kê y t công c ng ph n 2 (trang 18-20)
Sau ó b n ti n hành các khai báo v i các giá tr missing N u trong s li u b n
trong c t missing c a bi n ó thì SPSS s hi u ó là giá tr c a quan sát ó
khai báo missing b n kích vào c t missing c a ô ó:
Trang 8Sau ó có m t c a s nh Missing values hi n ra, b n ch n Dicrete missing
value và nh p vào nh ng giá tr mà b n ã mã hóa là missing.
u ph y c a bi n có d ng th p phân (decimal) và các tính ch t khác c a bi n
Chi ti t ph n này b n có th tham kh o Menu Help c a SPSS.
Bây gi b n ã nh ngh a và dán nhãn cho bi n xong, b n có th in ra m t
Display Data File Information Working File
Trang 9c b n nh ng thông tin trong codebook gi ng nh là các thông tin c th
Variable Information
Measurement Level
Column Width Alignment
Print Format
Write Format id
1 Identity
caco
2 1=case,
sex
bcgscar
school
6 Duration of
mbcont
7 Contact with
pbcont
8 Contact with
Variables in the working file
Variable Values
Trang 10Value Label
caco
sex
bcgscar
ng t
Làm s ch s li u:
khi phân tích s li u làm s ch s li u g m th c hi n các thao tác ki m tra tính
i v i các bi n nh tính, ki m tra và làm s ch s li u, chúng ta s
ng ng phân ph i t n s - nh Frequencies
nh Frequencies kích vào menu Analyse/Descriptives statistics/frequencies
nh này ch y u dùng cho các bi n phân lo i
Trang 11Sau ó c a s màn hình sau ây s hi n ra:
n ch n bi n mà b n c n ph i ki m tra kích chuy n sang ô Variable và kích Ok
t qu c a câu l nh này là:
Statistics
Valid Missing N
1=case, 0=control
0=male, 1=female 0=no, 1=yes
Trang 12Frequency Table 1=case, 0=control
0 case Total
Valid
Frequency Percent Valid Percent
Cumulative Percent
0=male, 1=female
Male Female Total
Valid
Frequency Percent Valid Percent
Cumulative Percent
0=no, 1=yes
no yes Total
Valid
Frequency Percent Valid Percent
Cumulative Percent
a b s li u Ví d nh bi n caco: bi n ghi là 0: control 1: case ( ã dán nhãn
ph i nh th ) nh ng ã dán nhãn nh m là 1: case, 2 là control Chúng ta ph i
Trang 13n thay s 2 Value và gõ vào s 0 r i kích vào Change Sau ó kích OK.
Ngòai ra câu lênh frequency c ng cho các b n bi n thông tin v giá tr missing
a các bi n
Statistics
Valid Missing N
1=case, 0=control
0=male, 1=female 0=no, 1=yes
1Ph n này b n c chi ti t ph n Ki m tra nh ng mã không phù h p trong giáo trình Th ng kê Y t công c ng, ph n 2, Nhà xu t b n y h c n m
2005 (trang 27-30)
Ngoài ra, c n c vào b câu h i mà b n ph i ki m tra tính nh t quán c a b s
Giáo trình th ng kê Y t Công c ng ph n 2); ki m tra s gi ng nhau c a các
mã cá nhân (trang 25,26); Ki m tra ngày thông tin c a bi n ngày tháng (trang 35-37) trong giáo trình trên
Tài li u tham kh o
Trang 14Use and interpretation, xu t b n l n th 2, Nhà xu t b n Lawrence
Erlbaum n m 2004
(truy c p ngày 23/01/08)