BÀI GIẢNG giới thiệu khái quát về phần mềm nhập liệu EPIDATA và phân tích số liệu SPSS EpiData là phần mềm hỗ trợ nhập và quản lý số liệu, được lập trình bởi Bác sĩ Jens M.Lauritsen, người Đan Mạch. Phần mềm này đã được sử dụng lần đầu tiên cho một nghiên cứu dịch tễ học “Phòng chống tai nạn”. Phần mềm giúp ích cho các bạn sinh viên làm khóa luận tốt nghiệp, luận văn,..rất nhiều trong việc nhập số liệu từ phiếu điều tra SPSS (viết tắt của Statistical Package for the Social Sciences) là một chương trình máy tính phục vụ công tác thống kê. Phần mềm SPSS hỗ trợ xử lý và phân tích dữ liệu sơ cấp là các thông tin được thu thập trực tiếp từ đối tượng nghiên cứu, thường được sử dụng rộng rãi trong các các nghiên cứu điều tra xã hội học và kinh tế lượng.
Trang 1GIỚI THIỆU EPIDATA VÀ NHẬP
SỐ LIỆU BẰNG EPIDATA
THỐNG KÊ SAU ĐẠI HỌC
TRƯỜNG ĐẠI HỌC Y TẾ CÔNG CỘNG
BIOS_L2
NỘI DUNG
1 Mục tiêu bài học
2 Chức năng, tiện ích của EpiData
3 Khái niệm cơ bản dùng trong EpiData
4 Tệp qes/.check/.rec trong EpiData
5 Xuất và nhập số liệu trong Epitata
6 Sử dụng phần mềm EpiData
7 Tài liệu tham khảo
MỤC TIÊU BÀI HỌC
1. Trình bày được chức năng, tiện ích của
EpiData
2. Trình bày được phương pháp tạo bộ nhập
liệu trong EpiData: các tệp qes, check, rec
3. Trình bày được cách xuất/nhập dữ liệu
trong EpiData
4. Sử dụng được phần mềm EpiData để nhập
và kiểm soát số liệu điều tra
3
QUI TRÌNH LÀM VIỆC VỚI SỐ LIỆU
1. Thu thập số liệu tại thực địa
2. Tạo bộ nhập liệu trên phần mềm
3. Nhập số liệu vào máy tính
4. Làm sạch số liệu
5. Phân tích số liệu
4
Trang 2CHỨC NĂNG, TIỆN ÍCH CỦA EPIDATA
•EpiData là gì? – phần mềm hỗ trợ nhập và
quản lý số liệu do Jens M Lauritsen viết
•EpiData chuyên dùngcho nhập liệu
•Giao diện thân thiện, tiện lợi, dễ sử dụng
•Tính tương thích cao (HĐH Windows, các phần
mềm thống kê thông dụng…)
•Hoàn toàn miễn phí, tại trang web:
http://epidata.dk/download.php(phiên bản 3.1)
BIOS_L2
KHÁI NIỆM CƠ BẢN DÙNG TRONG EPIDATA
•Bản ghi (Record)
•Trường số liệu = Biến (Field)
•Tên trường = Tên biến (Field name)
•Nhãn biến (Label)
•Kiểu biến (Type)
•Mã hóa dữ liệu/biến (Code)
MÃ HÓA DỮ LIỆU
•Là quá trình chuyển đổi các số liệu thu thập
được (vd từ các bộ câu hỏi) thành các dạng
dữ kiện phù hợp với các phần mềm phân tích
thống kê (v.d SPSS)
7
MÃ HÓA DỮ LIỆU (tt)
•Các số liệu dạng ký tự được đổi thành các dữ liệu kiểu số
• Ví dụ: Nam = 1 , Nữ = 2
•Bảng mã số liệu cần được chuẩn bị trước cho các mã khác nhau
8
Trang 3CẤU TRÚC MỘT BẢN GHI
Bản ghi
Nhóm
biến 1
Biến 1
Nhãn biến Kiểu biến Mã hóabiến
Biến 2
Nhãn biến Kiểu biến Mã hóabiến Biến n…
Nhóm
biến 2
Biến 1 Biến 2 Biến n…
Nhóm
biến n…
BIOS_L2
CÁC KIỂU TRƯỜNG DỮ LIỆU (KiỂU BiẾN) CƠ BẢN
•Kiểu số: #
• Kiểu số tự động: <IDNUM>
•Kiểu chữ: _
•Kiểu thời gian: <dd/mm/yyyy>
• Kiểu thời gian tự động: <Today-dmy>
•Kiểu logic: <Y> (nhập giá trị Y - Yes hoặc N –
No, có thể thay thế bằng kiểu số)
•Cấu trúc:
{Tên biến} {Nhãn biến}{Kiểu dữ liệu}
PHÂN TÍCH BỘ CÂU HỎI
•Xác định: Câu hỏi một hay nhiều lựa chọn?
•Trả lời cho bảng giả sau:
11
ST
T Tên biến Nhãn biến Dạng biến Độ rộng của biến
1 HOTEN Ho va ten cua doi
tuong nghien cuu
text 20 ký tự (_)
3 TUOI Tuoi doi tuong NC numeric 2 ký tự (##)
TẠO BỘ NHẬP LIỆU TRONG EPIDATA
•Các tệp trong EpiData
•Tệp QES: định nghĩa các biến (1 Define data)
•Tệp REC: lưu dữ liệu nhập vào (2 Make data file)
•Tệp CHK: lưu các ràng buộc dữ liệu (3 Checks)
•.qes rec chk
•Sao lưu: cả 3 file này trong cùng một thư mục,
phần tên file phải giống nhau.
12
Trang 4TỆP QES TRONG EPIDATA
• Chức năng tệp qes
• Tạo tệp qes mới:
File/New hoặc Ctrl+N hoặc Define Data/New
.QES file
• Cấu trúc:
{Tên biến} {Nhãn biến}{Kiểu dữ liệu}
• Ví dụ:
sexGioi tinh #
• Lưu bộ qes
BIOS_L2
TỆP REC TRONG EPIDATA
•Chức năng tệp rec
•Tạo tệp rec mới
Make Data File hoặc Data File/Make Data File
•Chọn đường dẫn cho file đầu vào (.QES) và file đầu ra (.REC)
•Tên file REC được tự sinh và đặt cùng chỗ với file REC (mặc định)
•Đặt tên cho file REC
TỆP CHECK TRONG EPIDATA
• Chức năng tệp check
• Tạo tệp check
• Chọn file REC
•Range, Legal: Khoảng, giá trị hợp lệ Ngăn cách bằng
dấu phẩy
•Jumps: Bước nhẩy
• VD: 1>q3
•Must enter
•Repeat
•Value label: Nhãn các giá trị mã hóa
15
NHẬP SỐ LIỆU TRONG EPIDATA
•Nhập vào file REC
•Enter Data chọn file REC
•Nhập liệu theo mã đã được mã hóa (code)
•Lưu bản ghi đã nhập
•Các tiện ích trong màn hình nhập liệu
• Các nút Navigation
• Xóa bản ghi đã nhập
16
Trang 5XEM CÁC DỮ LIỆU ĐÃ NHẬP
• Ba câu lệnh cơ bản: View Data, List Data và Codebook
• Chọn file số liệu muốn xem
xem, không cho phép chỉnh sửa dữ liệu
BIOS_L2
CÁC TIỆN ÍCH KHÁC CỦA EPIDATA
•Xem cấu trúc file: File Structure
•Đếm bản ghi: Count Record
•Nối các file dữ liệu: Append/Merge Data files
XUẤT SỐ LIỆU TỪ EPIDATA (EXPORT)
• Chọn tệp muốn xuất sang định dạng Stata
• Chọn các biến, bản ghi muốn xuất dữ liệu
• Đầu ra: file dta
19
THỰC HÀNH SỬ DỤNG EPIDATA
• Mở chương trình
• Tạo tệp qes
• Tạo tệp rec
• Tạo tệp check
• Thực hành nhập số liệu từ phiếu điều tra
• Xuất số liệu
• Nối số liệu (nối ngang, nối dọc)
20
Trang 6TÀI LIỆU THAM KHẢO
• Phạm Việt Cường, Giáo trình EPI Data
(Đại Học Y Tế Công Cộng 2006)
• Phạm Việt Cường, Giáo trình đào tạo từ
xa EPI Data CD Based, (Đại Học Y Tế
Công Cộng 2007)
• Các tài liệu phát tay
Trang 7HANOI UNIVERSITY OF PUBLIC HEALTH
Phần mềm SPSS
SPSS là gì?
• Ban đầu : SPSS (Statistical Package for the Social Science)
• Đổi thành SPSS (Statistical Product and Service Solutions)
• Hiện nay gọi được thêm tên IBM SPSS/PAWN
• Là một phần mềm thống kê rất phổ biến dùng trong việc quản lý các hệ thống số liệu phức tạp và phân tích đưa ra kết quả với cách đơn giản
• Có 4 cửa sổ quan trọng
– Data Editor : quản lý số liệu
– Output Viewer : hiển thị kết quả
– Syntax editor : soạn thảo tập hợp lệnh
– Script editor : soạn thảo chương trình
Cửa sổ số liệu
Trang 8Cửa sổ số liệu
• Dạng bảng: giúp cho việc định nghĩa, nhập, chỉnh sửa và hiển
thị số liệu
Cửa sổ kết quả
• Hiển thị kết quả hoặc thông báo
Cửa sổ lệnh (syntax)
• Dùng để soạn thảo các lệnh thực hiện phân tích, quản lý số liệu
của SPSS
Scipt editor
• Soạn thảo các chương trình con/kịch bản để thực hiện các nhiệm vụ của SPSS/ít khi dùng
Trang 9Thực hành
• SPSS demo
• Thực hành
– Tạo các biến :
• Age: Tuổi – dạng số
• Sex: Giới – gán nhãn: 1-nam, 2- Nữ
• Edu: Trình độ học vấn : 1-cấp 1, 2 –cấp 2, 3- cấp 3
• Chiều cao: tính =cm
– Nhập ít nhất 20 số liệu
– Ghi lại và sử dụng vào bài sau