– xảy ra khi có sự khác biệt hệ thống các đặc tính của những đối tượng được chọn vào nghiên cứu với đặc tính của những người không được chọn vào nghiên cứu.. – Khi mẫu không đại diện cho
Trang 1Quản lý chất lượng nghiên cứu:
Sai số, nhiễu và phương pháp
khống chế
Kim Bảo Giang
Hà Nội, 2013
M
Mụ ụ c tiêu c tiêu
Sau bu ổ i h ọ c, h ọ c viên có kh ả năng
1 Trình bày được các khía cạnh của chất
lượng nghiên cứu
2 Trình bày được khái niệm, phân loại và
cách khắc phục các sai số thường gặp
trong nghiên cứu
3 Trình bày được khái niệm nhiễu và cách
khắc phục ảnh hưởng của nhiễu
Trang 2Hai khía khía khía c c cạ ạ nh nh c c củ ủ a a ch ch chấ ấ tttttttt lư lư lượ ợ ng
nghiên
nghiên c c cứ ứ u
• Tính giá trị (validity):
– Nội suy (internal validity)
– Ngoại suy (external validity)
• Tính tin cậy (reliability)
• Ví dụ cụ thể:
– Nghiên cứu huyết áp của một cộng đồng cụ
thể ở Việt Nam
Tin cậy và giá trị (Reliability and validity)
Trang 3Sai số
Quần thể
Mẫu NC
Ước lượng
Giá trị thực
Sai số= Khác biệt giữa giá trị ước lượng từ mẫu và giá trị thực của quần thể
Trang 4Cỏc lo
Cỏc loạ ạ i sai s i sai số ố
• Cỏc sai số ngẫu nhiờn (random
error)
• Cỏc sai số hệ thống (sai
chệch-bias):
Sai số ngẫu nhiờn và sai số hệ thống
**
******
**
******
* *
* * *
* * * *
* * *
* * * * ** *
* * * *
* * * * *
Độ lặp lại cao, độ chính xác thấp
(high reproducibility, low accuracy)
Độ lặp lại cao, độ chính xác cao (high reproducibility, high accuracy)
Độ lặp lại thấp, độ chính xác cao (low reproducibility, high accuracy)
Độ lặp lại thấp, độ chính xác thấp
(low reproducibility, low accuracy)
Trang 5Sai s
Sai số ố ngẫ ng ẫ u nhiên
• giá trị của một quan sát trên một mẫu nghiên
cứu bị lệch ñi so giá trị thật của quần thể hoàn
toàn do ngẫu nhiên, may rủi dẫn ñến sự thiếu
chính xác trong mô tả thông số của quần thể và
trong việc ño lường sự kết hợp
• không thể khống chế ñược bằng các kỹ thuật
thu thập số liệu
• Nguyên nhân:
– Do may rủi
– Do biến ñổi sinh học của ñối tượng nghiên
cứu
• Không có sai số ngẫu nhiên= chính xác (precise)chính xác (precise)
ði
ðiể ể m thi
Sinh viên số 1 2 3 4 5 6 7 8 9
Điểm đạt được 9 8 7 9 6 4 5 8 3
Nếu coi 9 sinh viên này là 1 quần thể
Chọn ngẫu nhiên mẫu có 2 SV, ta sẽ có 36 cơ hội
Trang 6STT CÆp sinh
viªn sè:
§iÓm cña tõng sinh viªn
§iÓm trung b×nh cña 2 sinh viªn
Sai số ngẫu nhiên không làm thay đổi số đo trung bình chỉ ảnh hưởng đến các dao động
xung quanh số trung bình
Trang 7Sai s
Sai số ố hệ h ệ th thố ố ng
• còn gọi là sai chệch là bất kỳ sai số
nào trong quá trình nghiên cứu làm sai
lệch ước lượng sự kết hợp giữa phơi
nhiễm và bệnh
• Dẫn tới kết quả chệch, không giá trị
• Không có sai số hệ thống= trúng, có trúng, có
giá tr
giá trị (accurate, valid) (accurate, valid)
Sai số hệ thống làm thay đổi số đo trung bình
nên gọi là sai chệch
Trang 8Các lo
Các loạ ạ i sai số i sai s ố h hệ ệ th thố ố ng
1 Sai số chọn.
– xảy ra khi có sự khác biệt hệ thống các đặc tính của
những đối tượng được chọn vào nghiên cứu với đặc
tính của những người không được chọn vào nghiên
cứu
– Khi mẫu không đại diện cho quần thể nghiên cứu :
Ví dụ: Chọn mẫu từ các bệnh nhân đến viện Huyện để
nghiên cứu về kiến thức về bệnh HIV
– Người được chọn nhưng từ chối tham gia nghiên cứu
– Bỏ cuộc trong các nghiên cứu thuần tập tương lai (di
chuyển, không tuân thủ điều trị)
2 Sai số chẩn đoán:
• Các đối tương khác nhau áp dụng quy trình
chẩn đoán khác nhau kết quả
• Xảy ra khi một hiểu biết về mối quan hệ
nhân quả ảnh hưởng đến kết quả chẩn
đoán:
• Ví dụ:
– Mố quan hệ giữa hút thuốc và ung thư phổi
Các lo
Các loạ ạ i sai s i sai số ố hệ h ệ th thố ố ng
Trang 93 Sai số thông tin
• Sai chệch gây ra do đo lường kết quả sai
hoặc phân loại sai đối tượng nghiên cứu,
nguyên nhân từ phía người làm nghiên cứu
hoặc từ đối tượng nghiên cứu
Các lo
Các loạ ạ i sai s i sai số ố hệ h ệ th thố ố ng
3 Sai số thông tin
• Các loại sai số thông tin:
– Sai số nhớ lại(recall bias): Loại sai số này thường xảy
ra trong các nghiên cứu bệnh chứng và các nghiên cứu
thuần tập hồi cứu,
– Sai số quan sát (thu thập thông tin) hay sai số
phỏng vấn (interview bias)
– Sai số phân loại (xếp lẫn- misclassification): sai
số sắp xếp nhầm đối tượng vào nhóm
bệnh-không bệnh, phơi nhiễm – bệnh-không phơi nhiễm
Các lo
Các loạ ạ i sai s i sai số ố hệ h ệ th thố ố ng
Trang 10Các yếu tố liên quan đến sai số
trong quá trình thu thập số liệu
Nghiên cứu
viên
Đối tượng:
con người, hiện tượng,
sự việc
Môi trường:
địa điểm, tiếng
ồn, thời điểm, mùa, v.v
Phương pháp, phương tiện
đo lường: độ chính xác, thời điểm đo, nhập, mã hóa, kết hợp biến, phần mềm, v.v
Giới, tuổi, học vấn,
kinh nghiệm, quan
niệm, kỹ năng, v.v.
Giới, tuổi, học vấn, quan niệm, sự sẵn sàng, trung thực, v.v.
Ví dụ về ảnh hưởng của người
nghiên cứu (quan sát, thu thập
thông tin)
Trang 11Ảnh hưởng của đối tượng nghiên
cứu
-Nhớ lại
-Khả năng đọc, hiểu
- Đặc điểm kinh tế, văn hóa, xã hội
Trang 12Sự thay đổi câu trả lời giữa 2 lần phỏng vấn , theo dõi 193 đối tượng
Tác động của công cụ
Trang 13Hạn chế các sai số ngẫu nhiên:
• Cách tốt nhất để hạn chế sai số ngẫu
nhiên là đảm bảo cỡ mẫu đủ lớn
Trang 14Hạn chế các sai số hệ thống:
• Hạn chế tối đa việc đối tượng từ chối tham gia nghiên
cứu hoặc bỏ cuộc giải thích rõ về mục tiêu, ý nghĩa +
hỗ trợ họ một số điều kiện cần thiết
• lựa chọn chỉ số nghiên cứu và thiết kế phù hợp
• chọn quần thể nghiên cứu phù hợp
• sử dụng quy trình chẩn đoán, theo dõi và đánh giá giống
nhau để hạn chế các sai số chẩn đoán
• Chuẩn hoá công cụ đo lường có độ chính xác cao và phải
đo đi đo lại nhiều lần
• Sử dụng thống nhất công cụ đo lường, phương pháp tiến
hành giữa các đối tượng nghiên cứu
Hạn chế các sai số hệ thống:
• Đào tạo thống nhất các nghiên cứu viên, điều tra viên,
người thu thập số liệu để thực hiện quy trình và phương
pháp giống nhau
• không nên hỏi về sự kiện xảy ra quá lâu, quá xa mà đối
tượng không thể nhớ được SD nhật ký
• tạo cho đối tượng sự thoải mái khi cung cấp thông tin
• Sử dụng nhiều nguồn thông tin đối chiếu
• Làm mù, phân bổ đối tượng và NCV ngẫu nhiên
Trang 15Bài t
Bài tậ ậ p: xác ñinh nhữ p: xác ñinh nh ữ ng sai số ng sai s ố có
th
thể ể có và chi có và chiế ế n lư n lượ ợ c h c hạ ạ n ch n chế ế sai số sai s ố
• Nghiên cứu xác định tỷ lệ mắc bệnh phụ
khoa tại 1 cộng đồng
• Nghiên cứu bệnh chứng về liên quan giữa
xơ gan và uống rượu: chọn bệnh ở khoa
tiêu hóa, chứng ở khoa chấn thương, tai
nạn
• Nghiên cứu theo dõi kết quả điều trị thông
qua các cuộc khám lại
Nghiên cứu xác định tỷ lệ mắc
bệnh phụ khoa tại 1 cộng đồng
• Sai số ngẫu nhiên
• Sai số hệ thống
– Sai số chọn:
• đối tương đến khám là người có vấn đề tỷ lệ mắc cao hơn.
• Chọn khu vực nước ngập/sông nước
– Sai số chẩn đoán: dùng hai phương pháp phát hiện
khác nhau để chẩn đoán, hoặc người lao động ở
vùng sông nước được khám kỹ hơn
– Sai số thông tin:
• Nhớ lại triệu chứng
• Phỏng vấn: Bác sĩ nam khám đối tượng ngại kể các dấu
hiệu, 2 người PV cho 2 kết quả khác nhau
• Xếp lẫn: test có độ nhạy và độ đặc hiệu không cao xếp lẫn
Trang 16• Là yếu tố nguy cơ (hoặc bảo vệ) đối với bệnh
• Có liên quan đến phơi nhiễm, không phụ thuộc vào phơi
nhiễm
• Không phải là kết quả trung gian giữa phơi nhiễm và
bệnh
• Nhiễu và phơi nhiễm có thể đổi chỗ cho nhau nếu quan
tâm của nghiên cứu thay đổi
Nhi
Nhiễ ễ u
Phơi nhiễm Bệnh
Nhiễu
Hút thuốc
Nhi
Nhiễ ễ u?
Hút thuốc có gây CHD? Có Hút thuốc có liên quan ñến uống cà phê? Có
Là kết quả trung gian? Không
Trang 17Béo phì Cao HA
Tuổi
Nhi
Nhiễ ễ u?
PN Bệnh Chứng
Có 30 18
Không 70 82
Tổng 100 100
OR=(30x82)/(70x18)
OR=1.95
Tuổi Bệnh Chứng
<40 50 80
>=40 50 20 Chung 100 100
OR khi phân tích bình thường Phân bố bệnh theo 2 nhóm tuổi
Tuổi Tổng PN Không
PN
% PN
<40 130 13 117 10
>=40 70 35 35 50
Phân bố PN theo 2 nhóm tuổi
Trang 18Tuổi PN Bệnh Chứng OR
OR=(5x72)/(45x8) OR=1.0
OR=(25x10)/(25x10) OR=1.0
M
Mộ ộ t số t s ố biệ bi ệ n pháp khử n pháp kh ử nhiễ nhi ễ u
– Chọn ngẫu nhiên và phân bổ ngẫu nhiên,
– Thu hẹp phạm vi nghiên cứu
– Biện pháp ghép cặp
– Khử nhiễu bằng phân tích tầng
– Khử nhiễu bằng phân tích đa biến
Trang 19Bài t
Bài tậ ậ p 2: xác ñinh nhữ p 2: xác ñinh nh ữ ng y ng yế ế u t u tố ố
nhi
nhiễ ễ u có th u có thể ể có cho các nghiên cứ có cho các nghiên c ứ u
sau
• Nghiên cứu về mối liên quan giữa bệnh
phụ khoa và nghề nghiệp của phụ nữ
• Nghiên cứu về liên quan giữa xơ gan và
uống rượu
Trình bày về chiến lược quản lý
chất lượng số liệu trong đề cương
• Mô tả rõ việc tổ chức chọn đối tượng để đảm bảo đúng
thiết kế
• Trình bày rõ người thực hiện quan sát là ai, tập huấn đào
tạo như thế nào, kinh nghiệm?
• Người giám sát là ai, phương thức giám sát như thế nào
để đảm bảo tính trung thực, khách quan
• Phương pháp, phương tiên thu thập số liệu như thế nào để
đảm bảo tính chính xác? (đo 2 lần, v.v)
• Kiểm tra các thông tin thu thập: làm sạch trước nhập và
phân tích?
• Phần mềm nào được sử dụng và phân tích
• V.v