Quá trình nghiên cứu bao gồm• Thiết kế nghiên cứu • Thu thập số liệu • Xử lý số liệu • Phân tích và phiên giải 2... XỬ LÝ SỐ LIỆU• Quá trình xử lý số liệu là quá trình chuyển các số liệu
Trang 1QUẢN LÝ SỐ LIỆU
Ths Phùng Ngọc Đức – GV Khoa Y tế công cộng
Trang 2Quá trình nghiên cứu bao gồm
• Thiết kế nghiên cứu
• Thu thập số liệu
• Xử lý số liệu
• Phân tích và phiên giải
2
Trang 3XỬ LÝ SỐ LIỆU
• Quá trình xử lý số liệu là quá trình chuyển các
số liệu thu thập đựơc sang tệp số liệu chính xác, “sạch” và sẵn sàng cho việc phân tích.
Trang 4CHUẨN BỊ SỐ LIỆU CHO PHÂN TÍCH
• Mã hoá số liệu
• Nhập liệu
• Làm sạch số liệu
4
Trang 5MÃ HÓA SỐ LIỆU
Mã hoá số liệu là quá trình chuyển đổi các
số liệu thu thập được (Ví dụ: từ các bộ câu hỏi) thành các dạng dữ kiện phù hợp với các phần mềm phân tích thống kê: Biến số
Trang 6MÃ HÓA SỐ LIỆU
• Biến số được mã hóa
• Số liệu dạng ký tự mã hóa thành các dữ liệu dạng số (Nam 1 Nữ 2)
• Mã hóa số liệu có thể thể hiện trên các phiếu điều tra
• Bảng mã: Mã hóa của một bộ câu hỏi (phiếu điều tra)
6
Trang 8CÁC DẠNG LỖI VỀ SỐ LIỆU
• Có nhiều khả năng sinh lỗi do
• Mã hoá (nhà nghiên cứu)
• Nhập số liệu (nhà nghiên cứu)
• Tính thống nhất (người trả lời)
8
Trang 9KIỂM TRA SỐ LIỆU
Trang 11Frequency Percent Valid Percent
CumulativePercent
Trang 13KIỂM TRA SỐ LIỆU
Trang 14Frequency Percent Valid Percent
Cumulative Percent
Xác định giá trị bất thường bằng bảng phân phối tần số
Trang 15GIÁ TRỊ BẤT THƯỜNG
Trang 161 Dùng lệnh Sort case
Trang 17KIỂM TRA SỐ LIỆU
Trang 18KIỂM TRA VIỆC NHẬP LIỆU
• Kiểm tra số liệu đã nhập và bộ câu hỏi gốc
• Chỉ có thể thực hiện được với bộ số liệu nhỏ
18
Trang 19KIỂM TRA SỐ LIỆU
Trang 20Số liệu không đồng nhất có thể do mã hoá sai, lỗi đánh
máy, hoặc trả lời sai
20
Trang 23CÁCH KIỂM TRA TÍNH ĐỒNG NHẤT
• Dùng các lệnh Frequency của từng biến và xem các kết quả
• Dùng lệnh Crosstab xem mối quan hệ của hai biến định tính
Trang 24 Cách thức tiến hành lập bảng kết hợp biến
• Analyze => Descriptive Statistics => Crosstabs
Trang 25Sau khi phát hiện có lỗi, bạn dùng lệnh Select cases để tìm ra trường hợp có lỗi đó
Vào menu Data =>Select Cases mở hộp thoại Select Case
Trang 27TẠI SAO CẦN BẢNG MÃ?
• Cung cấp các mã đã dùng
• Giúp tra cứu và đảm bảo các mã được dùng thống nhất
• Giúp cho việc giảm thiểu lỗi/sự không thống nhất
Trang 28MỘT SỐ THAO TÁC TRONG QUẢN LÝ SỐ LIỆU BẰNG SPSS
• Mã hóa lại biến: Recode
• Tính toán biến mới từ các biến có sẵn: Compute
• Chọn lựa một phần số liệu: Select cases
• Sắp xếp số liệu: Sort cases
28
Trang 29Mã hóa lại biến: Recode
Trang 30Khi nào cần mã hóa lại?
• Khi câu hỏi nghiên cứu không dựa trên những số liệu có sẵn
Ví dụ: So sánh tình trạng béo phì giữa 3 nhóm tuổi: < 16 tuổi; 16-30 tuổi và trên 30 tuổi
• Câu hỏi này, nhóm tuổi là biến phân loại
• Trong khi đó, bộ số liệu chỉ có biến tuổi dưới dạng biến
định lượng
30
Trang 31Tạo biến mới – Câu lệnh Recode
• Biến đã có: tuổi (biến định lượng)
• Biến cần: nhóm tuổi (biến định tính)
• 0- 15 tuổi
• 16 – 30 tuổi
• Từ 30 trở lên
•
Trang 3232
Trang 33Tính toán biến mới:
Compute
33
Trang 34TÍNH TOÁN BIẾN MỚI TỪ BIẾN CÓ SẴN
• Dùng để tính toán 1 biến mới từ 1 hoặc nhiều biến có sẵn
Ví dụ: Tính BMI từ chỉ số chiều cao, cân nặng
• Sự liên kết thông qua công thức toán học.
• Câu lệnh
Transform/ Compute…
34
Trang 35CHỈ SỐ KHỐI CƠ THỂ (BMI)
Trang 3636
Trang 39LỰA CHỌN MỘT PHẦN SỐ LIỆU
Trang 40LỰA CHỌN MỘT PHẦN SỐ LIỆU
40
Trang 41LỰA CHỌN MỘT PHẦN SỐ LIỆU
Trang 42LỰA CHỌN MỘT PHẦN SỐ LIỆU
• Theo tiêu chí lựa chọn (sex=1), chỉ còn nhóm nam
được đưa vào phân tích
• Để quay trở lại phân tích bộ SL toàn vẹn sử dụng lệnh
Data/ Select cases…với tùy chọn All cases
42
Gioi tinh
Nam Valid
Frequency Percent Valid Percent
Cumulative Percent
Trang 43Lưu ý
• Nếu bạn không đưa về select all thì tất cả các lệnh các bạn thực hiện sau này đều phân tích trên giới tính =1.
Trang 44SẮP XẾP SỐ LIỆU
• Bộ số liệu có thể sắp xếp theo một/nhiều biến
• Tăng dần (Ascending) hoặc
Trang 45TÓM TẮT
để trả lời các câu hỏi NC