Kiểm định phi tham số ÔN TẬP – GIẢI ĐÁP THẮC MẮC Thái Thanh Trúc Nội dung • Thống kê mô tả • Các kiểm định có tham số • Các kiểm định phi tham số • Ước lượng mức độ liên quan • Giải đáp thắc mắc Thống kê mô tả • Biến định tính – Tần số – Tỉ lệ phần trăm – Tỉ lệ phần trăm cộng đồn (với biến thứ tự) – Khoảng tin cậy 95% – Stata • tab1 CácBiếnSố – Ví dụ: tab1 gioi nghenghiep • ci prop BiếnNhịGiá – Ví dụ: ci prop ungthu
Trang 1ÔN TẬP – GIẢI ĐÁP THẮC MẮC
Thái Thanh Trúc
Trang 2Nội dung
• Thống kê mô tả
• Các kiểm định có tham số
• Các kiểm định phi tham số
• Ước lượng mức độ liên quan
• Giải đáp thắc mắc
2
Trang 3Thống kê mô tả
• Biến định tính
– Tần số
– Tỉ lệ phần trăm
– Tỉ lệ phần trăm cộng đồn (với biến thứ tự)
– Khoảng tin cậy 95%
– Stata
• tab1 CácBiếnSố
– Ví dụ: tab1 gioi nghenghiep
• ci prop BiếnNhịGiá
Trang 4Thống kê mô tả
• Biến định lượng
Cách 1: hist biếnsố, norm freq
– Ví dụ: hist tlsosinh, norm freq
→ Bình thường khi có dạng hình chuông
Cách 2: pnorm biếnsố # Normal probability plot
– Ví dụ: pnorm tlsosinh
→ Bình thường khi hai đường (đậm và nhạt) trùng nhau
Cách 3: qnorm biếnsố # Quantiles of normal distribution plot
– Ví dụ: qnorm tlsosinh
→ Bình thường khi hai đường (đậm và nhạt) trùng nhau
4
Trang 5Thống kê mô tả
• Biến định lượng
Cách 4: swilk biếnsố # Shapiro Wilk test
– Ví dụ: swilk tlsosinh, norm freq
→ Bình thường khi p > 0,05
→ Kiểm định này rất nhạy → nên hạn chế dùng
• Nếu số liệu có phân phối không bình thường (lệch) thì có thể xem gợi ý cách biến đổi số liệu
– gladder biến số, freq
– Ví dụ: gladder tlsosinh, freq
Trang 60 2.00e+10 4.00e+10 6.00e+10 8.00e+10 1.00e+11
cubic
0 50000001.00e+07 1.50e+07 2.00e+07
square
1000 2000 3000 4000 5000
identity
sqrt
log
5020
-.04 -.035 -.03 -.025 -.02 -.015
1/sqrt
-.0015 -.001 -.0005 0
inverse
-2.50e-06 -2.00e-06 -1.50e-06 -1.00e-06 -5.00e-07 0
1/square
-4.00e-09 -3.00e-09 -2.00e-09 -1.00e-09 0
1/cubic
trong luong so sinh (gram)
Histograms by transformation
Trang 7Thống kê mô tả
• Biến định lượng
– Khi có phân phối bình thường → Trung bình ± Độ lệch chuẩn – Khi không có phân phối bình thường → Trung vị (Khoảng tứ vị) – Khoảng tin cậy 95%
– Stata
• sum CácBiếnSố, d
– Ví dụ: sum tuoi bmi
• ci mean BiếnĐịnhLượng
– Ví dụ: ci mean bmi
Trang 8Thống kê mô tả
• Biến định tính
– Tần số
– Phần trăm
– Phần trăm cộng dồn
– KTC 95%
• Biến định lượng
– Có phân phối bình thường
• Trung bình
• Độ lệch chuẩn
• Phạm vi – Không có phân phối bình thường
• Trung vị
• Khoảng tứ vị
• Phạm vi – KTC 95%
8
Trang 9Kiểm định thống kê
• Kết cuộc định tính
– Kiểm định Chi bình phương
– Kiểm định chính xác Fisher
• Khi ≥ 20% số ô có vọng trị <5 hoặc tần số trong ô quá thấp (n < 5)
– Stata:
• tab BiếnBênTrái BiếnỞTrên, co ro cell exp chi exact
Trang 10Kiểm định thống kê
• Kết cuộc định lượng
– Kiểm định có tham số
• Kiểm định t
– Bắt cặp – Không bắt cặp
» Phương sai bằng nhau
» Phương sai không bằng nhau
10
ttest BiếnTrước = BiếnSau
ttest BiếnĐịnhLượng, by(BiếnNhịGiá)
ttest BiếnĐịnhLượng, by(BiếnNhịGiá) unequal
Trang 11Kiểm định thống kê
• Kết cuộc định lượng
– Kiểm định có tham số
• Kiểm định ANOVA
oneway BiếnĐịnhLượng BiếnĐịnhTính, tab bon
• Hồi quy tuyến tính
pwcorr CácBiếnSố, sig star(5) regress BiếnPhụThuộc BiếnĐộcLập
Trang 12Kiểm định thống kê
• Kết cuộc định lượng
– Kiểm định phi tham số
• Kiểm định Wilcoxon Signed Rank
signrank BiếnTrước = BiếnSau
• Kiểm định Wilcoxon Ranksum
ranksum BiếnĐịnhLượng, by(BiếnNhịGiá)
• Kiểm định Kruskal Wallis
kwallis BiếnĐịnhLượng, by(BiếnĐịnhTính)
12
Trang 13Ước lượng mức độ liên quan
• Tỉ số nguy cơ # Risk Ratio (RR)
• Tỉ số số chênh # Odds Ratio (OR)
• Tỉ số tỉ lệ hiện mắc # Prevalence Ratio (PR)
Trang 14Ước lượng mức độ liên quan
• Tỉ số nguy cơ # Risk Ratio (RR)
• Tỉ số tỉ lệ hiện mắc # Prevalence Ratio (PR)
cs BiếnPhụThuộc BiếnĐộcLập
nptrend biếnphụthuộc , by( biếnđộclập ) glm BiếnPhụThuộc i BiếnĐộcLập , family(poisson) link( log ) robust eform glm BiếnPhụThuộc BiếnĐộcLập , family(poisson) link( log ) robust eform
• Tỉ số số chênh # Odds Ratio (OR)
cc biếnphụthuộc biếnđộclập
nptrend biếnphụthuộc , by( biếnđộclập ) logistic biếnphụthuộc i biếnđộclập
logistic biếnphụthuộc biếnđộclập
14
Trang 15Thực hành
• Hoàn thành bài tập phân tích nghiên cứu về HIV
net install https://www.trim.vn/stata/taball
Trang 16Câu hỏi?
16
Trang 17Nội dung đã học
• Thống kê mô tả
• Các kiểm định có tham số
• Các kiểm định phi tham số
• Ước lượng mức độ liên quan
• Giải đáp thắc mắc
Trang 18Chủ đề phân tích số liệu
• Phân tích NC sống còn
• Phân tích NC thử nghiệm lâm sàng
• Phân tích test chẩn đoán
• Phân tích NC theo dõi dọc
• Phân tích dữ liệu khuyết
• Giả lập và mô hình hóa
• Phân tích NC chuẩn hóa thang đo
18
Trang 19Chủ đề phân tích số liệu
• Phân tích sự đồng thuận
• Phân tích NC cộng đồng có tính trọng số
• Phân tích dữ liệu theo dõi giám sát
• Phân tích dự báo
• Phân tích dữ liệu chuỗi thời gian
• Phân tích gộp
Trang 20Thông tin liên hệ
• TS Thái Thanh Trúc
• Điện thoại: 0908 381 266
• Email: thaithanhtruc@ump.edu.vn
20