Số đo về chiều cao, cân nặng, huyết áp củatừng người trong mộtSố liệu Số liệu, thông tin và bằng chứng huyết áp của từng người trong một nhóm đối tượng NC Giá trị trung bình của chiều ca
Trang 1THỐNG KÊ CƠ BẢN ỨNG DỤNG
TRONG NGHIÊN CỨU KHOA HỌC
TS Hoàng Văn Minh, Đại học Y Hà nội
MỤC TIÊU
Sau bài học, học viên có khả năng
Trình bày một số khái niệm cơ bản
về thống kê
Lựa chọn được trắc nghiệm thống
Trang 2Khái niệm
“Statistics is a mathematical science pertaining to
the collection analysis interpretation or
the collection , analysis , interpretation or
explanation , and presentation of data”
Trang 3Bằng chứng
Phiên giải
Thông tin
Trang 4Số đo về chiều cao, cân nặng, huyết áp củatừng người trong một
Số liệu
Số liệu, thông tin và bằng chứng
huyết áp của từng người trong một
nhóm đối tượng NC
Giá trị trung bình của chiều cao, cân nặng, tỷ lệ cao huyết áp của cả nhóm đối tượng NC
Các
Các dạng dạng số số liệu liệu ((biến biến số số))
Số liệu định lượng
Rời rạc (discrete): không có giá trị thập phânạ ( ) g g ị ập p
Liên tục (continuous): Có giá trị thập phân
Số liệu định tính
Danh mục (nominal, categorical)
Thứ hạng (ordinal)ạ g ( )
Nhị phân (binominal)
Trang 5Dạng số liệu ?
Biến số Định lượng Định tính
Rời rạc Liên tục Định
d h h Thứ Nhị phân danh hạng
Quần thể Toàn bộ các cá thể mà chúng ta đang quan tâm
Trang 6Thống kê mô tả
Thống kê mô tả (Descriptive statistics):
Kỹ thuật dùng để mô tả các đặc tính
của mẫu
statistics): Quá trình suy luận từ đặc
tính của mẫu ra đặc tính của quần thể
Thống kê
Quần thể Q
Chọn mẫu Thống kê
suy luận
Mẫu
Thống kê mô tả
Trang 7Thống kê mô tả biến định lượng
Đo lường độ tập trung (Location)
Trung bình (mean)
Trung vị (median)
Mode
Đo lường độ phân tán (Spread )
Khoảng số liệu (range)
Độ lệch chuẩn (Standard deviation)
Phương sai (Variance)
Trung bình
34 27 45 55 22 34
Trang 10- 10.5
- 1.5
- 13.5
10.252.25112.25
Trang 11Thống kê mô tả biến định tính
Trang 12Thống kê suy luận
Ước lượng điểm
Quần thểƯớc lượng khoảng
Kiểm định giả thuyết
Thống kê mô tả
Ước lượng khoảng
Ước lượng khoảng khoảng tin cậy khoảng tin cậy
(confidence interval)
Thường chọn khoảng tin cậy 95% (95%CI)
Khi thực hiện đo đạc 100 lần thì it nhất 95 lần
kết quả nằm trong khoảng tin cậy
95% tin tưởng rằng giá trị thực của quần thể
nằm trong khoảng tin cậy
95%CI= Trung bình± 1,96*sai số chuẩn
Trang 13Sai số chuẩn (standard errors)
Trang 14Khoảng tin cậy
Khoảng tin cậy (CI) (CI)
Nghiên cứu về huyết áp trên 200 người
cho kết quả sau:
trị số huyết áp tối đa trung bình là 123mmHg
Kiểm định định giả giả thuyết thuyết
sử dụng trắc nghiệm (test) thống kê để đưa ra kết luận về
giả thuyết của nhà nghiên cứu là chấp nhận được hay không
Trang 15Kiểm định giả thuyết
Giả thuyết Ho: Không có sự khác biệt
Giả thuyết Ha: Có sự khác biệt
Sai lầm
Thực tế→ H 0 đúng H 0 sai
↓ Quyết định
Trang 16Mức ý nghĩa thống kê
Loại bỏ sai lầm loại I
P<0.05 = Xác suất để giả thuyết Ho đúng là < 5%
= Ho xảy ra chỉ là may rủi
= Bác bỏ Ho
= Xác suất để giả thuyết Ha đúng là > 95%
= Ha xảy ra là chắc chắn Ha xảy ra là chắc chắn
= Chấp nhận Ha P>0.05 = ???
Trang 18• So sánh thu nhập ở 2 xã của
1 huyện liên quan đến hút thuốc lá, chế độ ăn như thế nào
Lựa chọn trắc nghiệm thống kê
Trang 19Kiểm định giả thuyết
1 Hình thành giả thuyết
2 Đề xuất mức ý nghĩa thống kê
3 Lựa chọn TNTK thích hợp
4 Thực hiện TNTK và tính toán giá trị p
5 Phiên giải kết quả
6 Kết luận
So s
So sánh, t ánh, tìm sự khác biệt ìm sự khác biệt
bi biến ến định định llượng ượng
P.bố chuẩn+k.chuẩn Phân bố chuẩn
Trang 20Giá trị mong đợi <
Giá trị mong đợi <55 Giá trị mong đợi >=5
Trang 21Phân tích tương quan
Tỷ suất chênh (OR), nguy cơ tương đối (RR)
Hồi quy logistic
Tương quan giữa 2 biến đ.lượng
• Nghiên cứu mối liên hệ giữa cân nặng của 20 trẻ 5 tuổi
và thu nhập gia đình
Trang 22Hệ số tương quan (r)
Hệ số tương quan (r)
• Hệ số tương quan r
– Có giá trị từ -1 đến +1 g ị
• Khi HSTQ > 0 ⇒ tương quan đồng biến
• Khi HSTQ < 0 ⇒ tương quan nghịch biến
• Càng gần 1 ⇒ tương quan càng chặt
– Quy ước:
• <0,3: tương quan yếu
• >=0,3-0,5: 0,3 0,5: tương quan TB tương quan TB
• >=0,5-0,7: tương quan chặt chẽ
• >=0,7: tương quan rất chặt chẽ
Trang 23Hệ số tương quan (r)
Tương quan của 2 biến định tính
Khi muốn tìm cường độ mối liên quan giữa hai
biến định tính=> có thể sử dụng:
–– Tỷ suất chênh: Tỷ suất chênh: OR
–– Nguy cơ tương đối: Nguy cơ tương đối: RR
Trang 24Công thức tính OR
OR = ad/bc
95%CI :
– >1 Ö Yếu tố nguy cơ
– =1 Ö Không liên quan
d c b a Z
OR1± / 2 1/ +1/ +1/ +1/
α
– <1 Ö Yếu tố bảo vệ
Tỷ suất chênh - OR
Nghiên cứu bệnh-chứng về mối liên quan giữa ăn thịt và
viêm ruột hoại tử
Trang 25Tỷ suất chênh - OR (tiếp)
• Nếu tỷ lệ ăn thịt ở nhóm bệnh (50/61) lớn hơn tỷ lệ này
giữa ăn thịt và bị hoại tử ruột
OR = ab/cd = 50 x 41/16 x 11 = 11,65
Khoảng tin cậy 95%: 4,87 - 27,85
Những người ăn thịt có nguy cơ bị hoại tử ruột
cao gấp hơn 11 lần so với người không ăn thịt!
Công thức tính RR
)/(
d c
c
b a
Trang 26Nguy cơ tương đối - RR
Nghiên cứu hiệu quả của vaccine với bệnh cúm
Khoảng tin cậy: 0,15 - 0,36
• Khi được tiêm vaccine, khả năng mắc bệnh chỉ
còn khoảng 23%