QUẦN THỂ VÀ MẪU NGHIấN CỨU " Quần thể: Tập hợp toàn bộ cỏc cỏ thể mà chúng ta quan tâm ở một khía cạnh nào đó trong một khoảng thời gian nhất định " Mẫu: Phần được chọn ra để đo lường
Trang 1THỐNG KÊ CƠ BẢN
VÀ PHÂN TÍCH SỐ
LIỆU Y TẾ
ThS Đỗ Thanh Toàn (dothithanhtoan@hmu.edu.vn)
BM Thống kê, Tin học Y học
Mục tiêu học tập
Sau bài häc, học viªn cã kh¶ n¨ng:
1. Trình bày được một số khái niệm cơ bản về
thống kê và phân tích số liệu
2. Trình bày và áp dụng được nguyên tắc lựa
chọn trắc nghiệm thống kê cho các mục tiêu
phân tích và biến số
3. Trình bày và áp dụng được nguyên tắc phiên
giải được kết quả phân tích số liệu
4. Lập được các bảng, biểu đồ cho dự kiến phân
tích số liệu cho đề cương NC nhóm
Trang 2nh»m ®ưa ra c¸c suy luËn vÒ toµn bé hay mét
phÇn quÇn thÓ nghiªn cøu
Thống kê y sinh học
" Thống kê y sinh học là 1 cụm từ bao gồm “y
sinh” và “thống kê” Y sinh có nghĩa là cuộc
sống, còn thống kê liên quan đến thu thập, tổ
chức, phân tích và phiên giải các SL
" Thống kê y sinh học liên quan đến ứng dụng
các phương pháp TK vào KH cuộc sống như
sinh học, y học và y tế công cộng
" Thống kê có ý nghĩa khác nhau trong các
ngữ cảnh khác nhau VD: TK YTCC, TK bệnh
viện, TK dân số, TK các dịch vụ, vvv
Trang 3SỐ LIỆU
" Là kết quả “quan sát” được trên từng cá thể
(hay từng đối tượng nghiên cứu)
Ví dụ: Quan sát hộ gia đình:
Số người trong hộ: 8 (4 nam, 4 nữ)
Số trẻ dưới 5 tuổi: 2 Nguồn nước: nước giếng khoan Loại nhà ở: kiên cố
Thu nhập bình quân: 1 triệu/tháng
SỐ LIỆU
" Loại số liệu - Nguồn số liệu
– Số liệu ban đầu: Do tự thu thập
" Qua điều tra
" Nghiên cứu thử nghiệm
– Số liệu có sẵn: Do người khác thu thập
" Từ kết quả của các nghiên cứu khác
" Từ báo cáo, sổ sách, hồ sơ, bệnh án,…
Trang 4BIẾN SỐ
" Là cỏc đặc điểm cú thể quan sỏt được
" Biến định tớnh:
Vớ dụ: dõn tộc, giới tớnh, nghề nghiệp,
" Biến định lượng (biến dạng số):
– Biến liờn tục: chiều cao theo cm, cõn nặng
theo kg
– Biến rời rạc: số bệnh nhõn đến khỏm trong
một ngày, số giường bệnh, số trứng giun
trong tiờu bản,
Tôi cân nặng bao nhiêu?!
Nhiệt độ bình nước như thế nào ?
Trang 5QUẦN THỂ VÀ MẪU NGHIấN CỨU
" Quần thể: Tập hợp toàn bộ cỏc cỏ thể mà
chúng ta quan tâm ở một khía cạnh nào
đó trong một khoảng thời gian nhất định
" Mẫu: Phần được chọn ra để đo lường,
quan sỏt được gọi là mẫu
• Cỏc con số, vấn đề được mụ tả dựa trờn cỏc
giỏ trị thống kờ như: trung bỡnh, trung vị,
mode, tổng số, khoảng, độ lệch chuẩn, tỉ lệ,
• Trỡnh bày cỏc kết quả dựa trờn cỏc bảng biểu
và đồ thị
" Thống kờ suy luận
• Dựa trờn cỏc con số từ một mẫu để cung cấp
cỏc giỏ trị khỏi quỏt, suy luận về quần thể
Trang 6Quần thể đích!
Quần thể nghiên cứu!
- Mẫu kinh nghiệm !
- Mẫu thuận tiện !
- Mẫu chỉ tiêu!
- Mẫu có mục đích.!
Chọn mẫu!
Ước lượng!
• điểm!
• khoảng!
Kiểm định giả thuyết!
Suy luận thông kê
dụng cho mẫu xác suất với
Giá trị p Lựa chọn!
Suy luận biến định lượng
Suy luận biến định tớnh
Trang 7Thống kê mô tả biến định lượng
" Đo lường độ tập trung
– Trung bình (mean)
– Trung vị (median)
– Mode
" Đo lường độ phân tán
– Khoảng số liệu (range)
– Khoảng tứ phân vị (25%-75%) (Interquartile )
– Độ lệch chuẩn (Standard deviation)
– Phương sai (Variance)
DTT - Tong hop so lieu 14
1 Tổng hợp và mô tả số liệu định lượng
Trang 8DTT - Tong hop so lieu 15
Đo lường độ phân tán
Thống kê mô tả biến định tính
" Tần số: Số lần xuất hiện của một quan sát
" Tỷ số: Là phân số mà mẫu số không bao
hàm tử số
" Tỷ lệ phần trăm: Là phân số mà mẫu số
bao hàm tử số
" Tỷ suất: dạng đặc biệt của tỷ lệ khi được
đo lường trong một khoảng thời gian nhất
định
Trang 9N Range Minimum Maximum Mean Std
" Mở file số liệu trên SPSS
⇒ Màn hình data view: màn hình số liệu
⇒ Màn hình variable view: xem tên biến số và
giải thích của biến số
" Thực hiện thống kê mô tả: biến định lượng
⇒ Analyze -> Descriptive Statistic -> Descriptive
⇒ Kiểm tra phân bố số liệu
" Thực hiện thống kê mô tả: biến định tính
⇒ Analyze -> Descriptive Statistic -> Crosstab
Trang 10Thống kê suy luận
" Là quá trình ngoại suy kết quả nghiên cứu
từ mẫu ra quần thể nghiên cứu:
– Ước lượng khoảng
– Kiểm định giả thuyết
Các tham số mẫu và tham số quần thể
Các tiêu thức Tham số
quần thể
Tham số mẫu
Trung binh sè häc (mean) µ
Trang 11Ước lượng khoảng-khoảng tin cậy
(confidence interval)
" Thường chọn khoảng tin cậy 95%
(95%CI)
" Khi thực hiện đo đạc 100 lần thì it nhất 95
lần kết quả nằm trong khoảng tin cậy
" 95% tin tưởng rằng giá trị thực của quần
thể nằm trong khoảng tin cậy
95%CI= Trung bình ± 1,96*sai số chuẩn
Ước lượng khoảng-khoảng tin cậy
Trang 12Sai số chuẩn (standard errors)
95%CI= Trung bình ± 1,96*sai số chuẩn
Trang 13Kiểm định giả thuyết
kết luận về giả thuyết của nhà nghiên cứu là
chấp nhận được hay không
Quần thể
Mẫu NC
Chọn mẫu Ngoại suy Trắc nghiệm thống kê
Giả thuyết nghiên cứu
" Giả thuyết Ho: Không có sự khác biệt
(Điều trị không hiệu quả)
" Giả thuyết Ha: Có sự khác biệt (Điều trị có
hiệu quả)
Trang 14Các loại sai lầm trong kiểm định
= Xác suất để giả thuyết Ho đúng là < 5%
= Ho xảy ra chỉ là may rủi
= Bác bỏ Ho
= Xác suất để giả thuyết Ha đúng là > 95%
= Ha xảy ra là chắc chắn
Trang 16Lựa chọn trắc nghiệm thống kê
" Mục tiêu của nghiên cứu?
– Các giá trị trung bình
– Các tỷ lệ
– Giữa hai biến:
"
– Giữa nhiều biến
"
Xác định sự khác biệt hai biến định lượng
Kruskal- Wallis test
Trang 17T test (Student t test)
" Sử dụng cho số liệu định lượng, có phân bố chuẩn
" So sánh sự khác biệt về giá trị trung bình của một hoặc hai
" Sử dụng cho so sánh 2 giá trị trung bình
của các nhóm độc lập, số liệu là phân bố
không chuẩn hoặc chuẩn
" Analyze -> Nonparametric Tests -> 2 Independent
Samples
Trang 18ANOVA test
" So sánh ≥ 3 giá trị trung bình của các nhóm
độc lập
" Điều kiện:
- Biến số kiểm định có phân bố chuẩn
- Phương sai đồng nhất giữa các nhóm
Analyze -> Compare Means -> One-Way ANOVA
(Đánh dấu hộp Option: Homogeneity of variance
test để kiểm định tính đồng nhất của phương sai)
Kruskal Wallis Test
" So sánh ≥ 3 giá trị trung bình của các
nhóm độc lập khi biến số kiểm định có
phân bố không chuẩn hoặc chuẩn
Analyze -> Nonparametric Tests -> K Independent
Samples
Trang 19Giá trị mong đợi ≥ 5
Trang 20Test Khi bình phương
" So sánh hai hay nhiều tỷ lệ
" Điều kiện: Dưới 20% số ô trong bảng có
tần số mong đợi (E) < 5 và không có ô
nào có tần số mong đợi <1
Analyze -> Descriptive Statistic -> Crosstab
Hoặc
Analyze -> Nonparametric Tests -> Chi-square Test
Xác định mối liên quan
v Tỷ suất chênh (OR), nguy cơ tương đối (RR)
v Hồi quy logistic
Trang 21Tương quan của hai biến định lượng
" Hệ số tương quan r
• Có giá trị từ -1 đến +1
" Khi HSTQ > 0 => tương quan đồng biến
" Khi HSTQ < 0 => tương quan nghịch biến
Tương quan của hai biến định lượng
Analyze -> Correlate -> Bivariate
• Chọn Pearson khi các biến tương quan là
phân bố chuẩn
• Chọn Spearman khi các biến tương quan
không tuân theo phân bố chuẩn
Trang 22Tương quan của 2 biến định tính
" Khi muốn tìm cường độ mối liên quan giữa hai
Công thức tính OR - RR
" RR = Risk ratio = risk1/risk2
" RR/OR có thể:
– >1 ð Yếu tố nguy cơ
– =1 ð Không liên quan
– <1 ð Yếu tố bảo vệ
Trang 23Test χ2 cho ≥ 2 tỷ lệ
Tìm mối
tương quan
Quan sát ghép cặp
Biến định tính - Test χ2 Mc Nemar Biến định lượng - Test t ghép cặp
Test χ2 tìm
mối liên quan
Hệ số tương quan Hồi qui tuyến tính
Biến định tính
Biến định lượng
Quan sát độc lập
4 Nồng độ Hb trong máu trung bình
của những người mắc bệnh xơ gan
so với người bình thường
5 Liên quan giữa giới và tình trạng
bệnh tiểu đường (có bệnh/không
bệnh) trong nghiên cứu bệnh chứng