GIỚI THIỆU VÀ XÂY DỰNG FORM NHẬP DỮ LIỆU TRONG SPSS NHẬP, LỌC VÀ MÃ HÓA SỐ LIỆU TIN HỌC ỨNG DỤNG TRƯỜNG ĐẠI HỌC Y DƯỢC HUẾ BỘ MÔN THỐNG KÊ – DÂN SỐ SỨC KHỎE SINH SẢN 1 Mục tiêu 1/ Xác định được ý nghĩa của việc kiểm tra số liệu, lọc số liệu và mã hóa lại các số liệu thường gặp trong nghiên cứu y tế 2/ Thực hiện được các lệnh lọc, mã hóa số liệu cơ bản 3/ Nhập và kiểm tra một bộ số liệu hoàn chỉnh 2 Lỗi bỏ trống dữ liệu Lỗi logic Lỗi nhập sai giá trị đã mã hóa, outlier ( ví dụ code 1 nam , 2 nữ n[.]
Trang 1NHẬP, LỌC VÀ MÃ HÓA
SỐ LIỆU
TIN HỌC ỨNG DỤNG
TRƯỜNG ĐẠI HỌC Y DƯỢC HUẾ
BỘ MÔN THỐNG KÊ – DÂN SỐ - SỨC KHỎE SINH SẢN
TRƯỜNG ĐẠI HỌC Y DƯỢC HUẾ
BỘ MÔN THỐNG KÊ – DÂN SỐ - SỨC KHỎE SINH SẢN
Trang 2Mục tiêu
1/ Xác định được ý nghĩa của việc kiểm tra số liệu, lọc số liệu và mã hóa lại các số liệu thường gặp trong nghiên cứu y tế.
2/ Thực hiện được các lệnh lọc, mã hóa số liệu
cơ bản
3/ Nhập và kiểm tra một bộ số liệu hoàn chỉnh.
Trang 31) Lỗi bỏ trống dữ liệu.
2) Lỗi logic
3) Lỗi nhập sai giá trị đã mã hóa, outlier ( ví
dụ : code 1: nam , 2: nữ nhưng số liệu lại có
3,4,5…).
Một số lỗi thông thường
Trang 4Phương pháp kiểm tra số liệu
• Dùng các lệnh sắp xếp dữ liệu ( sort case: ascending/ descending) hiển thị các giá trị missing hay outline
• Chạy các bảng tần suất hoặc trung bình xác định giá trị missing/ lớn nhất , nhỏ nhất
• Chạy bảng chéo các lỗi logic đơn giản
Trang 5Biến cần sắp
xếp
Tăng dần Giảm dần
Trang 6Giá trị bổ trống thường
xuất hiện trên cùng bộ
số liệu ( ascending)
Giá trị bỏ trống thường xuát hiện cuối cùng bộ số liệu
(Descending)
Trang 7Lệnh lọc số liệu cơ bản
1 Select case (Lựa chọn các trường hợp
theo điều kiện )
2 Split file (chia tách dữ liệu)
2 lệnh này sẽ chỉ hiển thị kết quả khi chạy phân tích số liệu trên của số hiên thị kết quả ( out put)
Trang 8Thông thường sẽ có 2 dạng
• Mã hóa mớithực hiện ngay trên biến ban đầu ( lưu
ý số liệu gốc sẽ thay đổi theo) Recode into same
Trang 9Recode into same variables
TransVí dụ: Chia tuổi của bệnh nhân thành 3
nhóm : (60 – 70); (71- 80); và >80.
form / Recode into same variables
Đưa biến cần
mã hõa vào
Trang 10Giá trị cũ Giá trị mỡi cần mã
Trang 11Ví dụ chia nhóm tuổi
Trang 12Lệnh sẽ được thực hiện ngay trên biến tuổi ban đầu Lưu ý khi
sử dụng lệnh này
Trang 13• Về nguyên tắc thực hiện giống với recode into same variables.
• Tuy nhiên lệnh này sẽ tạo ra một biến mới
và nằm cuối cùng của bộ số liệu (không thay đổi số liệu gốc ban đầu)
• Chú ý thay đổi tên biến mới khi thực hiện
Recode into different variables
Trang 14Transform/ recode into different variables
Thực hiện tương tự như
mã hóa same into
Gõ tên biến mới
Trang 15Kết quả tạo một biến
mới nằm sau cùng
của bộ số liệu
Trang 16Kiểm tra kết quả sau mã hóa số liệu
• Để xem kết quả sau khi mã hóa dữ liệu có thể sử
dụng lệnh Analyze/ Descriptive statistics /
Frequencies xem tần số, tỷ lệ ( cửa số output)
• Ví dụ trường hợp biến tuổi
Trang 171 Dùng lệnh Sort cases phát hiện số liệu sai của
biến số cân nặng.
2 Dùng lệnh Find phát hiện số liệu sai của biến số
tuổi mẹ (tuổi mẹ có giá trị 8 hoặc 9 tuổi là sai).
3 Frequency để tìm số liệu sai của biến số Gan to
BÀI TẬP 1
Trang 184 Frequency tìm số liệu sai của biến số lách to
5 Crosstabs: Tìm mối liên quan giữa tuổi và cân nặng , phát hiện số liệu bất hợp lý
6 Select cases: Phân tich số liệu cho nữ giới: Tìm tỷ lệ % lách to theo độ cho nữ giới
Trang 191.Hãy cho biết số lượng và tỷ lệ mỗi nhóm?
2.Hãy cho biết số lượng và tỷ lệ mỗi nhóm theo giới tính (nam/nữ)?
Trang 201 Hãy cho biết số lượng và tỷ lệ mỗi nhóm?
2 Tỷ lệ cao nhất thuộc nhóm nào?
3 Tỷ lệ người nặng trên 60kg là bao nhiêu?
4 Hãy cho biết số lượng và tỷ lệ mỗi nhóm theo
giới tính (nam/nữ)?
Trang 211.Hãy cho biết số lượng và tỷ lệ mỗi nhóm?
2.Hãy cho biết số lượng và tỷ lệ mỗi nhóm theo giới