BIOS II BIOS II -- Chapter 2 Chapter 2 1 P PHÂN TÍCH SỐ LIỆU ĐỊNH LƯỢNG HÂN TÍCH SỐ LIỆU ĐỊNH LƯỢNG Quản lý số liệu Spsswin.exe BIOS II BIOS II -- Chapter 2 Chapter 2 2 Giới thiệu Chuẩn
Trang 1BIOS II BIOS II Chapter 2 Chapter 2 1
P
PHÂN TÍCH SỐ LIỆU ĐỊNH LƯỢNG HÂN TÍCH SỐ LIỆU ĐỊNH LƯỢNG
Quản lý số liệu
Spsswin.exe
BIOS II BIOS II Chapter 2 Chapter 2 2
Giới thiệu
Chuẩn bị số liệu
– –Mã hoá số liệu Mã hoá số liệu
– –Nhập liệu Nhập liệu –
–Làm sạch số liệu Làm sạch số liệu
Mục tiêu
Hiểu ñược quá trình chuẩn bị bộ số liệu nghiên
cứu ñể nhập liệu
Hiểu ñược lý do cơ bản, các nguyên tắc liên
quan, của việc mã số liệu và ñịnh nghĩa của mã
một bộ số liệu
Xác ñịnh một kế hoạch làm sạch số liệu cho bộ
số liệu
Nhận biết ñược các chiến lược khác nhau cho
việc ñảm bảo tính toàn vẹn của bộ số liệu
Mã hoá số liệu
Mã hoá số liệu là quá trình chuyển ñổi các
số liệu thu thập ñược (ex từ các bộ câu hỏi) thành các dạng dữ kiện phù hợp với các phần mềm phân tích thống kê (ex SPSS)
Trang 2BIOS II BIOS II Chapter 2 Chapter 2 5
Mã hoá số liệu
Các số liệu dạng ký tự ñược ñổi thành các
dữ liệu kiểu số
–
– Ví dụ: Nam Ví dụ: Nam 1 Nữ 1 Nữ 2 2
Bảng mã số liệu cần ñược chuẩn bị trước
cho các biến khác nhau
BIOS II BIOS II Chapter 2 Chapter 2 6
BIOS II BIOS II Chapter 2 Chapter 2 7
Số liệu dạng số
subject age Gender
male = 1 female = 2
driving distance (wkly- kms)
no
accidents
BIOS II BIOS II Chapter 2 Chapter 2 8
Ví dụ
Nghiên cứu chấn thương trên toàn quốc Mẫu nghiên cứu ñại diện cho toàn quốc Nghiên cứu nhiều loại chấn thương Chọn các chấn thương liên quan ñến giao thông ñể phân tích
Trang 3BIOS II BIOS II Chapter 2 Chapter 2 9
Điều tra chấn thương giao thông quốc gia năm 2003
Mã hộ: _ _ _ _ _ _ _ _
Vùng :
Ngày phỏng vấn: _
Thông tin về người trả lời
1 Anh/chị bao nhiêu tuổi (tính tròn năm)?
2 Anh/chị là nam hay nữ (khoanh vào lựa chọn phù hợp)?
3 Anh/chị sống ở ñâu? (Khoanh vào lựa chọn phù hợp)
Thành phố Nông thôn
4 Anh/chị ñã học ñến lớp mấy (Khoanh vào lựa chọn phù hợp)?
Không ñi học Tiểu học Dưới THCS Trên THCS
Học nghề Đại học Trên ñại học Trẻ nhỏ
5 Anh/chị làm nghề gì (Khoanh vào lựa chọn phù hợp)?
Làm ruộng CBCNVC Buôn bán nhỏ Làm chủ
Học sinh Nghề thủ công Nghỉ hưu Mất sức
Bảng mã số liệu Cột Mô tả Giá trị mã và ý nghĩa
h_id Mã hộ Chạy từ 10111001- 82436071 region Địa ñiểm 1 = Tây Bắc
2 = Đông Bắc
3 = Lưu vực sông Hồng
4 = Bắc Trung bộ
5 = Ven biển miền Trung
6 = Cao Nguyên trung bộ
7 = Đông Nam
8 = Lưu vực sông Mê Kông ageround Tuổi (năm) 0 – 65
2 = Nữ u_r Nơi cư trú 0 = Thành phố
1 = Nông thôn educatio Cấp học cao nhất 1 = Mù chữ
2 = Tiểu học
3 = Cấp II
4 = Cấp III
5 = Học nghề
idnumber Oc …
001 12 …
002 3 …
5 Anh/chị làm nghề gì (Khoanh vào lựa chọn phù hợp)?
Làm ruộng CBCNVC Buôn bán nhỏ Làm chủ
Học sinh Nghề thủ công Nghỉ hưu Mất sức
Thất nghiệp Trẻ nhỏ Other
Id_num Oc1 Oc2
001 1 6
002 3 -1
Các cách mã hoá khác nhau
Nhập số liệu
Nhập số liệu sử dụng các phần mềm phân tích thống kê ví dụ: SPSS 10.0, EPIINFO
Câu trả lời của ñối tượng ñược nhập vào từng ô của tệp số liệu
1 ô = 1 phương án trả lời
Trang 4BIOS II BIOS II Chapter 2 Chapter 2 13
Phần mềm thống kê
Thông thường
–
– Là các dạng bảng tính Là các dạng bảng tính
–
– Một dòng là một ñơn vị quan sát/ cá thể Một dòng là một ñơn vị quan sát/ cá thể
–
– Một cột là một câu hỏi Một cột là một câu hỏi
–
– Quy ñịnh chặt chẽ về ñộ dài và kiểu của tên cột Quy ñịnh chặt chẽ về ñộ dài và kiểu của tên cột
BIOS II BIOS II Chapter 2 Chapter 2 14
BIOS II BIOS II Chapter 2 Chapter 2 15
Tên cột
Không dài quá 8 ký tự
Không có dấu cách
Không bắt ñầu bằng chữ số
BIOS II BIOS II Chapter 2 Chapter 2 16
Trang 5BIOS II BIOS II Chapter 2 Chapter 2 17
Địa chỉ hòm thư của bạn là bao nhiêu ? _4350 _
B ạn bao nhiêu tuổi? 36 years
B ạn là (khoanh tròn)
Nam N ữ
B ạn có sẵn lòng trả lời hết bộ câu hỏi này không ?
C ó Kh ông
N ếu có, bắt ñầu bằng câu 1, nếu không thì cảm ơn người trả lời và kết thúc
C âu 1:
T ôi luôn chủ ñộng trong quá trình ra quyết ñịnh
Rất ñồng ý Đồng ý Bình thường Không ñồng ý Rất không ñồng ý
Địa chỉ hòm thư của bạn là bao nhiêu? _4350 _
Bạn là (khoanh tròn)
Nam Nữ
Bạn có sẵn lòng trả lời hết bộ câu hỏi này không?
Có Không
Nếu có, bắt ñầu bằng câu 1, nếu không thì cảm ơn người trả
lời và kết thúc
Câu 1:
Tôi luôn chủ ñộng trong quá trình ra quyết ñịnh
Rất ñồng ý Đồng ý Bình thường Không ñồng ý Rất không ñồng ý
BIOS II BIOS II Chapter 2 Chapter 2 18
idnumber postcode age gender refused quest1
•Tt c các s liu ñu là dng s
• Tt c các mã ñc ghi trong bng mã
Bộ số liệu
Có nhiều khả năng sinh lỗi do
–
–Mã hoá (nhà nghiên cứu) Mã hoá (nhà nghiên cứu)
–
–Nhập số liệu (nhà nghiên cứu) Nhập số liệu (nhà nghiên cứu)
–
–Tính thống nhất (người trả lời) Tính thống nhất (người trả lời)
Giới thiệu Nhập liệu Gán nhãn Bài tập thực hành
Spsswin.exe
Trang 6BIOS II BIOS II Chapter 2 Chapter 2 21 SPSS 10.0 for Windows.lnk
Biểu tượng SPSS
BIOS II BIOS II Chapter 2 Chapter 2 22
Cửa sổ nhập liệu trên SPSS
BIOS II BIOS II Chapter 2 Chapter 2 23
Xử lý số liệu
Kiểm tra
–
– Sai số do mã hoá Sai số do mã hoá
–
– Giá trị bất thường Giá trị bất thường
Kiểm tra nhập số liệu
Kiểm tra tính ñồng nhất
BIOS II BIOS II Chapter 2 Chapter 2 24
Gender Frequency Percent Valid
percent
Cum percent Valid 1 2 50.0 50.0 50.0
2 1 25.0 25.0 75.0
5 1 25.0 25.0 100.0 Total 4 100.0 100.0
Sai số mã hoá thể hiện trong bảng phân phối tần số
Trang 7BIOS II BIOS II Chapter 2 Chapter 2 25
idnumber postcode age gender refused bp_sys
001 4350 36 1 1 120
002 4127 28 2 0 -1
003 4005 47 1 1 140
004 4106 52 5 1 200
Bảng mã
Column Description Valid codes & meanings
gender Gender 1 = male
2 = female
BIOS II BIOS II Chapter 2 Chapter 2 26
Xử lý số liệu
Kiểm tra
– – Sai số do mã hoá Sai số do mã hoá –
– Giá trị bất thường Giá trị bất thường
Kiểm tra nhập số liệu Kiểm tra tính ñồng nhất
BLOOD PRESSURE (SYSTOLIC)
Frequency Percent Valid
percent
Cum percent Valid 120 13 25.0 33.3 33.3
Total 3 75.0 100.0
Missing -1 1 25.0
Xác ñịnh giá trị bất thường bằng bảng phân phối tần số
idnumber postcode age gender refused bp_sys
001 4350 36 1 1 120
002 4127 28 2 0 -1
003 4005 47 1 1 140
004 4106 52 5 1 200
•So sánh vi b câu h"i g c
• N$u ñúng, giá tr' này v)n phi ñ+ơc dùng
Trang 8BIOS II BIOS II Chapter 2 Chapter 2 29
Xử lý số liệu
Kiểm tra
–
– Sai số do mã hoá Sai số do mã hoá
–
– Giá trị bất thường Giá trị bất thường
Kiểm tra nhập số liệu
Kiểm tra tính ñồng nhất
BIOS II BIOS II Chapter 2 Chapter 2 30
Kiểm tra việc nhập liệu
Phương pháp 1
– – Kiểm tra số liệu ñã nhập và bộ câu Kiểm tra số liệu ñã nhập và bộ câu hỏi gốc
– – Chỉ có thể thực hiện ñược với bộ số Chỉ có thể thực hiện ñược với bộ số liệu nhỏ
BIOS II BIOS II Chapter 2 Chapter 2 31
Địa chỉ hòm thư của bạn là bao nhiêu? _4139 _
Bạn là (khoanh tròn)
Nam Nữ
Bạn có sẵn lòng trả lời hết bộ câu hỏi này không?
Có Không
Nếu có, bắt ñầu bằng câu 1, nếu không thì cảm ơn người trả
lời và kết thúc
Câu 1:
Tôi luôn chủ ñộng trong quá trình ra quyết ñịnh
Rất ñồng ý Đồng ý Bình thường Không ñồng ý Rất không ñồng ý
BIOS II BIOS II Chapter 2 Chapter 2 32
D A T A S H E E T
i d n u m b e r p o s t c o d e a g e g e n d e r r e f u s e d q u e s t 1
CODING MANUAL
Cột Mô tả Mã và ý nghĩa quest1 Ra quyết ñịnh -1 = mất số liệu
1 = Rất ñồng ý
2 = Đồng ý
3 = Bình thường
4 = Không ñồng ý
5 = Rất không ñồng ý
Tôi luôn chủ ñộng trong quá trình ra quyết ñịnh Rất ñồng ý Đồng ý Bình thường Không ñồng ý Rất không ñồng ý
Trang 9BIOS II BIOS II Chapter 2 Chapter 2 33
Kiểm tra việc nhập liệu
Phương pháp 2
–
– Nhập tất cả vào tệp số liệu thứ 1 Nhập tất cả vào tệp số liệu thứ 1
–
– Nhập toàn bộ lại một lần nữa vào tệp 2 Nhập toàn bộ lại một lần nữa vào tệp 2
–
– So sánh số liệu của tệp 1 và 2So sánh số liệu của tệp 1 và 2
–
– Nếu phát hiện có sự khác biệt, so sánh với số liệu gốcNếu phát hiện có sự khác biệt, so sánh với số liệu gốc
–
– Sửa chữa số liệu trong tệp 1Sửa chữa số liệu trong tệp 1
Phù hp vi b s liu nh"/ v0a
BIOS II BIOS II Chapter 2 Chapter 2 34
D A T A S H E E T 2
i d n u m b e r p o s t c o d e a g e g e n d e r r e f u s e d q u e s t 1
i d n u m b e r p o s t c o d e a g e g e n d e r r e f u s e d q u e s t 1
Tôi luôn chủ ñộng trong quá trình ra quyết ñịnh Rất ñồng ý Đồng ý Bình thường Không ñồng ý Rất không ñồng ý
Kiểm tra việc nhập liệu
Phơng pháp 3
–
– Nhập tất cả vào tệp số liệu thứ 1 Nhập tất cả vào tệp số liệu thứ 1
–
– Nhập Nhập ng)u nhiên 10 ng)u nhiên 10 20% 20% số liệu một lần nữa vào tệp 2 số liệu một lần nữa vào tệp 2
–
– So sánh số liệu của tệp 1 và 2So sánh số liệu của tệp 1 và 2
–
– Nếu phát hiện có sự khác biệt, so sánh với số liệu gốcNếu phát hiện có sự khác biệt, so sánh với số liệu gốc
–
– Sửa chữa số liệu trong tệp 1Sửa chữa số liệu trong tệp 1
Phù hp vi b s liu ln
Kiểm tra việc nhập liệu
Một công ñoạn quan trọng ñể ñảm bảo tính toàn vẹn của số liệu
Mục tiêu là giảm sai số do nhập liệu xuống dưới 1/ 1000 bản ghi
Lý tưởng là có 2 người khác nhau nhập liệu
Trang 10BIOS II BIOS II Chapter 2 Chapter 2 37
T t nht là có 2 ng:i nh;p
cùng m t b s liu!
Tại sao không dùng 1 người nhập
một bộ số liệu 2 lần?
BIOS II BIOS II Chapter 2 Chapter 2 38
Xử lý số liệu
Kiểm tra
– – Sai số do mã hoá Sai số do mã hoá –
– Giá trị bất thường Giá trị bất thường
Kiểm tra nhập số liệu Kiểm tra tính ñồng nhất
BIOS II BIOS II Chapter 2 Chapter 2 39
Kiểm tra tính ñồng nhất
Các câu trả lời không ñồng nhất nằm trong tệp số
liệu.
So sánh câu trả lời với bộ câu hỏi/ công cụ thu
thập số liệu.
Số liệu không ñồng nhất có thể do mã
hoá sai, lỗi ñánh máy, hoặc trả lời sai
BIOS II BIOS II Chapter 2 Chapter 2 40
Giới tính
Bạn có sẵn lòng trả lời hết bộ câu hỏi này không?
Nếu có, bắt ñầu bằng câu 1, nếu không thì cảm ơn người trả lời và kết thúc
Câu 10:
Bạn ñã mang bao giờ chưa?
Trang 11BIOS II BIOS II Chapter 2 Chapter 2 41
Cấp 2 Cấp 3
Bạn ñã từng học ñại học chưa?
BIOS II BIOS II Chapter 2 Chapter 2 42
Chúng ta nên làm g Chúng ta nên làm gìì…?? …??
Ghi ch ép lại toàn bộ các mã
ñã dùng
Tại sao lại cần sổ ghi chép mã?
Các mã ñã dùng
Giúp bạn tra cứu và ñảm bảo các mã ñược dùng
thống nhất
Đây là công cụ giúp cho việc giảm thiểu lỗi hoặc
sự không thống nhất
QUẢN LÝ SỐ LIỆU
Các Các câu câu lệnh lệnh thường thường dùng dùng
– – Compute Compute –
– Recode Recode –
– Select Select
Trang 12Sử
Sử dụng dụng tính tính toán toán biến biến mới mới dựa dựa trên trên các các
biến
biến có có sẵn sẵn
Dùng
Dùng một một biểu biểu thức thức toán toán học học
Câu
Câu lệnh lệnh
–
– transform/ compute… transform/ compute….
BIOS II BIOS II Chapter 2 Chapter 2 45
Recode
Dùng Dùng ñể ñể mã mã hóa hóa 1 1 biến biến dựa dựa trên trên một một hoặc hoặc nhiều
nhiều biến biến cũ cũ Mã
Mã hóa hóa
– – Biến Biến ñịnh ñịnh lượng lượng Biến Biến ñịnh ñịnh tính tính –
– Biến Biến ñịnh ñịnh tính tính Biến Biến ñịnh ñịnh tính tính
Câu Câu lệnh lệnh
– – Transform/ recode… Transform/ recode….
Mã
Mã hóa hóa::
– – Một Một biến biến mới mới ((nên nên dùng dùng)) –
– Mã Mã hóa hóa trên trên chính chính biến biến cũ cũ
BIOS II BIOS II Chapter 2 Chapter 2 46
Select cases…
Chọn
Chọn phân phân tích tích một một phần phần của của bộ bộ số số liệu liệu
Các
Các trường trường hợp hợp ñược ñược phân phân tích tích cần cần thỏa thỏa
mãn
mãn ñiều ñiều kiện kiện với với tùy tùy chọn chọn “if” “if”
Câu
Câu lệnh lệnh
–
– Data/ select cases… Data/ select cases…
BIOS II BIOS II Chapter 2 Chapter 2 47
THỰC HÀNH
Sử
Sử dụng dụng bộ bộ số số liệu liệu wh.sav wh.sav
– – Tìm Tìm giá giá trị trị bất bất thường thường –
– Xem Xem xét xét tính tính logic logic –
– Sai Sai số số mã mã hóa hóa –
– Thực Thực hiện hiện các các câu câu lệnh lệnh Compute
Recode Select cases…
BIOS II BIOS II Chapter 2 Chapter 2 48
...Chọn
Chọn phân phân tích tích một phần phần của bộ số số liệu liệu
Các
Các trường trường hợp hợp được phân phân tích tích cần cần thỏa thỏa...
Mã hóa hóa
– – Biến Biến định định lượng lượng Biến Biến định định tính tính –
– Biến Biến định định tính tính Biến Biến ñịnh ñịnh tính tính...
một số liệu lần?
BIOS II BIOS II Chapter Chapter 38
Xử lý số liệu
Kiểm tra
– – Sai số mã hoá Sai số mã hoá