Các bước quản lý số liệu Thiết kế bộ câu hỏi thu thập số liệu Thử nghiệm bộ câu hỏi trước khi nhập số liệu Tạo form nhập liệu qes, rec, chk Nhập số liệu nhập hai lần Kiểm tra
Trang 1VIỆN NGHIÊN CỨU Y XÃ HỘI HỌC
Nguyễn Trương Nam
Nguyễn Thị Linh
Trang 2Các bước quản lý số liệu
Thiết kế bộ câu hỏi thu thập số liệu
Thử nghiệm bộ câu hỏi trước khi nhập số liệu
Tạo form nhập liệu (qes, rec, chk)
Nhập số liệu (nhập hai lần)
Kiểm tra số liệu
Kiểm tra lôgíc và tính nhất quán của bộ số liệu
Trang 3Thiết kế (layout) bộ câu hỏi
Trang 4Layout bộ câu hỏi
Trang 5Codebook
Trang 6Codebook
Trước khi nhập số liệu cần xây dựng codebook Mọi quyết định về mã hóa đều cần được ghi lại trên codebook trước khi nhập số liệu; nếu không nguy cơ sai số nhập liệu sẽ tăng lên và có thể xảy
ra trường hợp các quyết định mã hóa phát sinh trong quá trình nhập số liệu sẽ không được ghi lại
Kiểm tra sự nhất quán của bộ câu hỏi trước khi nhập số liệu Ví dụ, cách mã hóa số liệu “chữ” phải được quyết định trước khi nhập số liệu và ghi trên bộ câu hỏi - chứ không phải trong quá trình nhập liệu
Trang 7QUẢN LÝ SỐ LIỆU BẰNG PHẦN MỀM EPIDATA
Trang 8Phần mềm Epidata: http://www.epidata.dk/
Chương trình nhỏ, dễ cài đặt, đơn giản và
miễn phí, thân thiện với người sử dụng
Có thể nhập số liệu từ file dạng text (.txt),
Stata, dBase
Có thể xuất số liệu sang các dạng text (.txt), dBase, Excel, Stata, SPSS và SAS
Phổ biến, và được cập nhật thường xuyên
File qes bộ câu hỏi không được vượt quá
999 dòng (nhưng vẫn có cách khắc phục )
Biến chữ không được vượt quá 80 ký tự
Trang 9Tạo form nhập liệu và check file
Xây dựng qes file dựa trên bộ câu hỏi
Tạo form nhập liệu từ qes file (tạo rec file)
Viết Check file
Trang 10Tạo QES file
Trên thanh công cụ: Chọn 1 Define Data
→ New QES file
Trên thanh menu/ chọn File/New
Trang 11Qes file
Trang 12Các loại trường phổ biến
Trang 13Thực hành:Tạo QES file-Khanhhoa.qes
-
Nhap lieu Nha Trang Phu Nu Mai Dam -
{MS} Ma so bo cau hoi ###
{Dis} Huyen #
{Date} Ngay phong van <dd/mm/2010> {TS1} Thoi gian bat dau-gio ##
{TS2} Thoi gian bat dau-phut ##
{TE1} Thoi gian ket thuc-gio ##
{TE2} Thoi gian ket thuc-phut ##
{In} Ten phong van vien <A >
Trang 14Khanhhoa.qes
- PHAN 1: DAC DIEM CHUNG
- {C1} Tuoi ##
Trang 15Khanhhoa.qes
-
PHAN 2: DOI SONG TINH DUC -
{C11} Xu huong tinh duc #
{C11A} Khac #
{C12} QHTD lan dau ##
{C13} QHTD lan dau voi ai #
{C13A} Khac <A > {C14} Co QHTD trong 3 thang ##
{C15} So nguoi QHTD trong 3 thang ###
{C16} Khach hang khong thuong xuyen trong 3 thang ### {C17} Su dung BCS voi khach hang k thuong xuyen ##
{C18} So khach hang thuong xuyen trong 6 thang…… ###
{C19} Su dung BCS voi khach hang thuong xuyen… ##
{C20} Nhan gi khi QHTD voi khach hang #
{C201} Khac <A >
Trang 16Khanhhoa.qes
{C21} Phai tra tien cho ban tinh nam khi QHTD #
{C22} O Trung tam 06 #
{C23} Noi bat khach ## Next 00 {C231} Ngoai duong #
{C232} Nha nghi, khach san #
{C233} Quan Karaoke, cafe #
{C234} Hieu massage #
{C235} Bar, vu truong #
{C236} Bia hoi, quan nhau #
{C237} Nha chua #
{C238} Tai nha minh #
{C239} Qua internet #
{C2310} Qua dien thoai ##
{C2311} Khac <A >
Trang 17Qes file trên epidata
Trang 18Tạo file nhập số liệu (rec file)
Trên thanh công cụ, chọn Data in/out- New Data File
Một hộp thoại sẽ xuất hiện Trên dòng đầu
tiên, bên cạnh “Enter name of QES file”,
nhập tên của file bộ câu hỏi
Dòng thứ hai trên hộp thoại, bên cạnh “Enter name of data file”, sẽ tự động chứa tên của
file nhâp số liệu (với đuôi rec) mà tương ứng với file bộ câu hỏi
Trang 19Ví dụ:Tạo rec file từ ques file (khanhhoa.qes)
Trang 20Check file giúp hạn chế lỗi khi nhập liệu
Check file chứa các lệnh để kiểm tra hiệu lực dữ
Trang 21Các lệnh kiểm tra thường dùng
Trang 22Tạo check file – khanhhoa.chk
Sử dụng chế độ interactive
◦ Menu bar – Check – Add/Revised, open
khanhhoa.rec
◦ Sử dụng hộp thoại interactive- khanhhoa.chk
Viết trực tiếp
◦ File – new – editor – save – khanhhoa.chk
Trang 23Check file
Trang 24Check file
Trang 25Viết file check
Sử dụng cả 2 cách interactive (sử dụng hộp thoại) và viết check file trực tiếp
Trang 26Thực hành: Viết check file– khanhhoa.chk
Trang 27Thực hành: Viết check file– khanhhoa.chk
Trang 28Nhập số liệu– so sánh số liệu giữa 2 lần nhập
Nhập số liệu hai lần – nên được thực hiện bởi hai hay hai nhóm các nhập liệu viên
So sánh hai file nhập để tìm ra sự không nhất quán
Kiểm tra bộ câu hỏi gốc và xác đinh file nhập nào sai
Sửa lỗi ở cả hai file
So sánh một lần nữa để thấy không còn lỗi
Trang 29So sánh giữa 2 lần nhập liệu
Documents –/validate duplicate files
Epidata đưa ra báo cáo gồm các lỗi
Trang 30So sánh giữa 2 lần nhập liệu
Trang 31So sánh giữa 2 lần nhập liệu
Trang 32So sánh giữa 2 lần nhập liệu
Trang 33So sánh giữa 2 lần nhập liệu
Trang 34So sánh giữa 2 lần nhập liệu
Trang 35Báo cáo lỗi
Trang 36Thực hành
So sánh 2 lần nhập liệu
Khanhhoa files 1 và 2
Trang 37Kiểm tra tính nhất quán
Kiểm tra tính nhất quán tương tác (interactive) sẽ được thực hiện trong quá trình nhập liệu bằng
check file trong EpiData
Viết lệnh consistency check
CONSISTENCYBLOCK
REPORT ID
………
Trang 38Kiểm tra tính nhất quán
Check "Missing HH code" (a101 <>.)
Check "Missing Commune code" (a1061 <>.)
Check "Missing province code" (a1081 <>.)
CHECK "missing ID MEMBER" (M1 <> )
CHECK "missing ID MEMBER" (M2 <> )
Trang 39Consistency check
Chạy consistency check
Menu bar - Documents – consistency check
Xác đinh file số liệu và consistency check file
Epidata đưa ra lỗi không nhất quán
Trang 40Consistency check
Trang 41Consistency report
Consistency checks for D:\Research document\QUAN LY NHAP LIEU A&T\SO LIEU
4 TINH SAU VALIDATE_14 SEP\FINAL_4 TINH_4036\P1_4036_FINAL.rec
Based on D:\Research document\QUAN LY NHAP LIEU A&T\SO LIEU 4 TINH SAU VALIDATE_14 SEP\CHECK FILE_Update_Sep 19\Part 1_OK_Linh_Sep 19.chk
18 Sep 2010 13:50
Records identified by field id
Records where id = missing indicated as (## record number)
Consistency checks failed for id = 41077, 42057
Main job and kind of job logical
(M203=12) AND (M204=.) OR (m203=.) or (M203=1) OR (M203=2) OR (M203=3) OR (M203=4) OR (M203=5) OR (M203=6) OR (M203=7) OR (M203=8) OR (M203=9)OR (M203=10) OR (M203=11)
Consistency checks failed for id = 31046, 33115, 28020,
13077
Trang 42Gộp/nối các file số liệu
Menu bar
Data in/out – append/merge
Trang 43Gộp/nối các files số liệu
Trang 44Xuất số liệu từ epidata
Menu bar
Export – SPSS or Stata or SAS
Trang 45Xuất số liệu
Trang 46Ki ểm tra và làm sạch số liệu
Chạy tần số và kiểm tra các giá trị missing
Kiểm tra tính nhất quán giữa các biến
Kiểm tra các giá trị bất thường