Quản lí số liệu trong dịch tễ học... Vào cuối môn học, học viên có khả năngi Hiểu được các nguyên lí của thiết kế bộ câu hỏi tốt; ii Tạo được một cơ sở dữ liệu Epi-Data để chuyển số liệu
Trang 1Quản lí số liệu trong dịch tễ học
Trang 3Vào cuối môn học, học viên có khả năng
i) Hiểu được các nguyên lí của thiết kế bộ câu hỏi tốt;
ii) Tạo được một cơ sở dữ liệu Epi-Data để chuyển số liệu
từ bộ câu hỏi vào máy tính; Nhập, kiểm tra số liệu sử dụng phần mềm Epi-Data; Chuyển số liệu từ Epi-Data sang Stata và các phần mềm khác;
iii) Tạo và sử dụng Stata do file và Stata log file; Tiến hành được các nhiệm vụ cơ bản của quản lí số liệu trong
Stata bao gồm hợp nhất (merge) số liệu, nối tiếp
(append) số liệu và rút gọn (collapse) số liệu và sử dụng các lệnh Stata phổ biến để tạo ra biến số, mã hóa lại
biến số và thay thế biến số
Trang 4Merge - Append
• Merge: Hợp nhất số liệu
• Append: Kết nối số liệu
Trang 6Copy structure: Tạo ra một tập tin số liệu mới trống
để người khác nhập liệu Clear Checks: Xóa bỏ các check đã có
Compress data file: Xóa
bỏ các khoảng trống trong
số liệu
Trang 7Tạo biến số mới
Trang 8Nguyên tắc tạo biến mới
• Nguyên tắc:
– Nếu tạo biến mới là biến phân nhóm từ biến định lượng (sử dụng lệnh recode)
Thí dụ: tạo biến nhóm tuổi mẹ từ tuổi mẹ
– Nếu tạo biến mới là biến nhị giá (dùng biểu thức logic)
Thí dụ: tạo biến sinh non từ tuổi thai
– Tạo biến định lượng từ biến định lượng có sẵn:
Thí dụ: tính BMI từ cân nặng và chiều cao; tính tuổi
từ năm sinh và năm điều tra
Trang 9• Tạo biến định lượng bằng biểu thức đại số
• gen namsinh
tuoi=2001-Tạo biến nhị giá (biến boolean)
• Tạo biến boolean dựa vào biểu thức luận lí (cần lưu ý giá trị missing)
• gen daithaoduong
= duonghuyet
>=126
• Tạo nhãn (0: không; 1: có)
Trang 10Toán tử trong đại số luận lý
• Thể hiện các điều kiện
• Liên kết các điều kiện - Toán tử (operators)
– AND (VÀ): các điều kiện phải xảy ra đồng thời (&)– OR (HAY): chỉ cần một điều kiện xảy ra (|)
– NOT: nghịch đảo của điều kiện xảy ra (!)
Trang 13Đại số luận lý ứng dụng trong dịch tễ
• Trong nghiên cứu dịch tễ
– Biến số phụ thuộc và biến số độc lập thường được thể hiện bằng mệnh đề
• Biến phụ thuộc
– Có giá trị 1 khi có bệnh; có giá trị 0 khi không có bệnh– Thể hiện bằng mệnh đề nêu lên điều kiện có bệnh
• Biến độc lập
– Có giá trị 1 khi có yếu tố nguy cơ; có giá trị 0 khi
không có yếu tố nguy cơ
– Thể hiện bằng mệnh đề nêu lên điều kiện có yếu tố
nguy cơ
Trang 14Tạo biến mới
Trang 26• Điều kiện khác nhau cho 2 nhóm:
– 2 mệnh đề cho từng nhóm liên kết bằng toán
tử OR (|)
• Vòng eo tăng khi số đo eo (vongeo)
> 90 cm ở nam giới
> 80 cm ở nữ giới
• Biến giới (gioi); biến số đo eo (vongeo)
biến vòng eo tăng (y_eo)
Trang 27Contains data from C:\DATA\biendoibienso.dta
obs: 459
vars: 8 3 Dec 2004 14:10
size: 7,803 (99.3% of memory free)
- storage display value
variable name type format label variable label
-gioi byte %8.0g -gioi:
namsinh int %8.0g nam sinh
chieucao int %8.0g chieu cao (cm)
cannang byte %8.0g can nang (kg)
vongeo byte %8.0g vong eo(cm)
vonghong int %8.0g vong hong (cm)
hamax int %8.0g huyet ap toi da(cmHg)
hamin int %8.0g huyet ap toi thieu (cmHg)
Trang 28
-Bài tập
• Tạo biến số tuổi, biết năm điều tra là 2004
• Tạo biến số BMI=cân nặng / (chiều cao) ^2
– Cân nặng (kg)
– Chiều cao (mét)
• Nếu BMI>25 là béo phì, Hãy tính tỉ lệ béo phì trong dân số NC
• Phân loại tình trạng dinh dưỡng, theo BMI
– Dưới 18.5: thiếu năng lượng (0)
– 18.5- 23: bình thường (1)
– Trên 23: thừa cân (2)
• Phân loại tình trạng béo bụng
Vòng bụng > 90 cm ở nam giới HAY (|)
Vòng bụng > 80 cm ở nữ giới
• Phân loại cao huyết áp
– Huyết áp tâm thu ≥ 140 HAY (|)
– Huyết áp tâm trương ≥ 90
Trang 32Quy trình rà soát số liệu sau khi tạo
biến mới
• List biến số được tạo ra (BMI) và các biến
số liên quan (cân nặng và chiều cao)
• Thống kê mô tả (sum cho biến định lượng
và tab1 cho biến định tính để phát hiện sai sót)
• Sử dụng list … if để hiện ra các bản ghi
sai
• Sử dụng edit… if để sửa chữa các bản
ghi sai
Trang 33• Điều kiện khác nhau cho 2 nhóm:
– 2 mệnh đề cho từng nhóm liên kết bằng toán
tử OR (|)
• Vòng eo tăng khi số đo eo (vongeo)
> 90 cm ở nam giới
> 80 cm ở nữ giới
• Biến giới (gioi); biến số đo eo (vongeo)
biến vòng eo tăng (y_eo)
• ( gioi==1 & vongeo>=90 ) | ( gioi==0 &
vongeo>80 )
VÀ
Trang 34• replace bmi=round(bmi,0.01)
• recode bmi (min/18.49= 1 "CED") (18.5/22.99 =
2 "Binh thuong") (23/24.99 =3 "Thua can") (25/ max=4 "Beo phi"), gen(pldd)
Bình thường Quá cân Béo phì Thiếu NL mạn
Trang 35• recode bmi (min/18.49= 1 "CED")
(18.5/24.99 = 2 "Binh thuong") (25/29.99
=3 "Thua can") (30/max=4 "Beo phi"), gen(pldd)
Trang 37• gen beobung= (vongeo >=90 & gioi==1)
| (vongeo >=80 & gioi==0)
Trang 39recode hamax (min/119=-1 "bt") (120/139=0 "tien THA") (140/159=1 "THA1") (160/max=2 "THA2"), gen(sbpgrp)
recode hamin (min/79=-1 "bt") (80/89=0 "tien THA") (90/99=1 "THA1")
Trang 40• Có 5 câu hỏi về kiến thức về bệnh SXH-D Một người được xem là có kiến thức tốt
nếu
– Trả lời được ít nhất 3 câu hỏi
– và phải trả lời được câu hỏi 1 (biết muỗi là
vector truyền bệnh SXH-D)
Trang 41• Điểm thi gồm điểm chuyên môn
(chuyenmon), điểm toán (toan) và điểm
hóa (hoa) Một thí sinh được xem là trúng tuyển nếu tổng điểm >=15 và điểm chuyên môn phải lớn hơn 5 điểm.
• Y_trungtuyen=
((chuyenmon+toan+hoa)>=15) &
(chuyenmon>=5)
Trang 42• Mức độ tăng nguy cơ khi phơi nhiễm với yếu tố nguy cơ
• RR và OR
Nghiên cứu cắt ngang, đoàn hệ: RR và OR
NC bệnh chứng : OR
Trang 43Ước lượng RR
Trang 44Ước lượng OR
Trang 45Lực mẫu
• Xác suất nghiên cứu phát hiện sự phát
biệt có ý nghĩa thống kê nếu giả thuyết Ha
là đúng
• Lực mẫu tăng khi cỡ mẫu tăng
• Với OR=2 với tỉ lệ phơi nhiễm trong nhóm chứng là 60% - Để có lực mẫu 50%
– Cần 75 bệnh và 75 chứng (Tổng số 150)
– Cần 48 bệnh và 240 chứng (Tổng số 288)
Trang 46Lực mẫu
• Với OR=2 với tỉ lệ phơi nhiễm trong nhóm chứng là 5% - Để có lực mẫu 50%
– Cần 253 bệnh và 253 chứng (Tổng số 150) – Cần 122 bệnh và 610 chứng (Tổng số 732)
• Kết luận: Để có lực mẫu tối đa với cỡ mẫu nhất định
– Tỉ lệ phơi nhiễm với yếu tố nguy cơ gần 50%
– Tỉ lệ nhóm bệnh và nhóm chứng phải cân đối