GIỚI THIỆU 1.1 Định nghĩa: Một nghiên cứu đoàn hệ cohort study là một thiết kế nghiên cứu quan sát observational research study khởi đầu với một nhóm người một đoàn hệ không có bệnh h
Trang 1Bài 6
NGHIÊN CỨU ĐOÀN HỆ
TS.BS Tăng Kim Hồng
I GIỚI THIỆU
1.1 Định nghĩa: Một nghiên cứu đoàn hệ (cohort study) là một thiết kế nghiên cứu
quan sát (observational research study) khởi đầu với một nhóm người (một đoàn hệ) không có bệnh (hay vấn đề cần nghiên cứu) được chia thành hai nhóm: có tiếp xúc (exposed) hay không có tiếp xúc (non-exposed) với yếu tố nguy cơ và theo dõi sau một thời gian để xem trong số họ bao nhiêu người có bệnh, bao nhiêu người không có bệnh (hay vấn đề cần nghiên cứu) Nói cách khác, mục tiêu của nghiên cứu đoàn hệ là nhằm xác định xem có bao nhiêu ca bệnh mới (hay bao nhiêu trường hợp mới có vấn đề đang cần nghiên cứu) trong từng nhóm có tiếp xúc và không có tiếp xúc với yếu tố nguy cơ
Thời gian Hướng khảo sát
Có bệnh Nhóm người Có tiếp xúc Không bệnh
Dân số không có
Hình 1: Thiết kế nghiên cứu doàn hệ
1.2 Phân biệt những đặc tính của nghiên cứu bệnh chứng và các loại nghiên cứu phân tích khác:
1.2.1 Khác với nghiên cứu cắt ngang (cross-sectional study), trong nghiên cứu
đoàn hệ tình trạng tiếp xúc với yếu tố nguy cơ (exposure) và mắc bệnh (hay có vấn đề đang cần nghiên cứu) được đo ở 2 thời điểm khác nhau chứ không đồng thời
1.2.2 Nghiên cứu đoàn hệ khác với nghiên cứu bệnh – chứng (case-control study) ở chỗ: các đối tượng nghiên cứu trong nghiên cứu đoàn hệ được phân loại dựa
Trang 2II CÁC LOẠI NGHIÊN CỨU ĐOÀN HỆ
Trên cơ bản, có hai loại nghiên cứu đoàn hệ Đó là nghiên cứu tiền cứu (prospective) và nghiên cứu hồi cứu (retrospective) Sự khác nhau giữa hai loại này là
ở chỗ thời điểm bắt đầu nghiên cứu
1) Trong nghiên cứu đoàn hệ tiền cứu (prospective cohort study), thời điểm bắt
đầu nghiên cứu (điểm 0) là hiện tại và dân số được tiếp tục khảo sát, theo dõi trong tương lai Việc tiếp xúc với yếu tố nguy cơ có thể đã xảy ra hay chưa xảy ra khi nghiên cứu bắt đầu, nhưng “kết quả” (tức là có bệnh hay xuất hiện vấn đề cần nghiên cứu) thì chắc chắn chưa xảy ra
Một trong những tiện lợi của loại nghiên cứu này là các yếu tố nghiên cứu có thể được xác định đúng như nhà nghiên cứu mong muốn Một thí dụ về nghiên cứu
đoàn hệ tiền cứu là nghiên cứu Framingham Nghiên cứu này bắt đầu vào năm 1948
tại Framingham, Hoa kỳ và toàn bộ cộng đồng được theo dõi trong vòng 40 năm để khảo sát các yếu tố nguy cơ của bệnh tim mạch, hô hấp, xương khớp và một số vấn đề sức khoẻ khác
2) Trong nghiên cứu đoàn hệ hồi cứu (retrospective cohort study, historical
cohort study), “điểm bắt đầu” – tức thời điểm xảy ra việc tiếp xúc với yếu tố nguy cơ là ở quá khứ và dân số được theo dõi cho đến hiện tại Vào lúc bắt đầu nghiên cứu, cả việc tiếp xúc với yếu tố nguy cơ và mắc bệnh (hay có vấn đề đang nghiên cứu) đều đã xảy ra
Sự khác nhau giữa nghiên cứu bệnh-chứng, nghiên cứu đoàn hệ tiền cứu và nghiên cứu đoàn hệ hồi cứu được mô tả trong hình 2 (trang sau)
III ƯU ĐIỂM VÀ NHƯỢC ĐIỂM CỦA THIẾT KẾ NGHIÊN CỨU ĐOÀN HỆ 3.1 Ưu điểm:
- cung cấp bằng chứng mạnh mẽ về nguyên nhân của bệnh, cho phép kết luận mối quan hệ nhân-quả (cause-effect relationship) giữa tiếp xúc với yếu tố nguy
cơ (exposure) và bệnh (disease)
- việc xác định tình trạng tiếp xúc với yếu tố nguy cơ có thể không gặp bias vì ở thời điểm đó, bệnh (hay vấn đề cần nghiên cứu) chưa xảy ra
- có thể khảo sát được nhiều kết quả (outcome) từ một nguyên nhân
- là nghiên cứu thích hợp dùng để khảo sát ảnh hưởng của những tình trạng tiếp xúc với yếu tố nguy cơ hiếm gặp (rare exposures)
3.2 Nhược điểm:
- là loại nghiên cứu tốn thời gian, tốn tiền nhất trong số các thiết kế nghiên cứu phân tích
- đôi khi cần phải theo dõi đối tượng nghiên cứu trong một thời gian dài (vì kết quả xuất hiện chậm) nên khi có kết quả thì vấn đề nghiên cứu không còn thích hợp nữa
Trang 3Nghiên cứu bệnh-chứng
Nghiên cứu đoàn hệ tiền cứu
?
#
Nghiên cứu đoàn hệ hồi cứu
Tiếp xúc Bệnh
# = Có
) = Không
? = Cần được xác định
b= Nhà nghiên cứu lúc bắt đầu cuộc nghiên cứu
Hình 2: Sự khác nhau về thời gian giữa nghiên cứu bệnh-chứng, nghiên cứu đoàn hệ tiền cứu và nghiên cứu đoàn hệ hồi cứu
IV CÁC VẤN ĐỀ TRONG THIẾT KẾ VÀ THỰC HIỆN NGHIÊN CỨU ĐOÀN HỆ
4.1 Tính cỡ mẫu:
Cỡ mẫu được tính theo công thức sau:
0 1
1 1 1 2
/
p p
p p p z pq z
n = − α + − β − − + 0 1 −p0 2
Trong đó: p 1 : Tỉ lệ bệnh trong nhóm có tiếp xúc với yếu tố nguy cơ (exposed group)
p 0 : Tỉ lệ bệnh trong nhóm không tiếp xúc với yếu tố nguy cơ (non-exposed group)
Khi p1 đã biết, thì p0 có thể suy ra được từ công thức: RR = p1/p0
( 1 0) 2
1 p p
4.2 Chọn mẫu:
Các nhóm nghiên cứu (gồm những người có tiếp xúc vàkhông tiếp xúc với yếu tố
nguy cơ) có thể được chọn từ nhiều nguồn tùy theo cỡ mẫu và kinh phí cho phép của cuộc nghiên cứu Khi chọn nhóm nghiên cứu cần phải chú ý đến những vấn đề sau: tần
Trang 4thông tin đầy đủ và chính xác về việc có hay không có tiếp xúc với yếu tố nguy cơ; khả năng theo dõi và quản lý các đối tượng nghiên cứu trong một thời gian dài
Khi việc tiếp xúc với yếu tố nguy cơ tương đối phổ biến (VD: hút thuốc lá, uống
rượu…) thì có thể chọn đối tượng có tiếp xúc với yếu tố nguy cơ từ dân số chung Trong
trường hợp việc tiếp xúc với yếu tố nguy cơ hiếm xảy ra (rare exposures) (VD việc tiếp xúc với yếu tố nguy cơ có liên quan đến một số ngành, nghề đặc biệt) thì có thể
chọn đối tượng (có tiếp xúc) trong nhóm người có tiếp xúc với yếu tố nguy cơ hơn là
chọn từ dân số chung VD: muốn khảo sát mối liên quan giữa việc tiếp xúc với uranium và bệnh ung thư, đối tượng được chọn để theo dõi nên lấy từ những người thợ mỏ uranium hơn là chọn từ cộng đồng người bình thường
Lý tưởng nhất, nhóm so sánh (gồm những người không tiếp xúc với yếu tố nguy cơ – unexposed group) được chọn từ cùng một dân số với nhóm tiếp xúc VD: trong nghiên cứu Framingham về bệnh tim mạch, cả 2 nhóm có tiếp xúc và không tiếp xúc với yếu tố nguy cơ được chọn từ cùng một vùng Tuy nhiên, nếu nhóm có tiếp xúc được
chọn từ 1 quần thể đặc biệt thì nhóm so sánh nên lấy từ một nguồn khác Điều quan
trọng là các nhóm nghiên cứu, ngoại trừ sự khác nhau ở chỗ có tiếp xúc hay không tiếp xúc với yếu tố nguy cơ, phải giống nhau ở các đặc điểm khác Có nghĩa là nếu thực
sự không có mối liên quan giữa việc tiếp xúc với yếu tố nguy cơ và bệnh (hay vấn đề cần khảo sát) thì tỉ suất của bệnh (hay vấn đề cần khảo sát) ở hai dân số (mà từ đó hai nhóm nghiên cứu được chọn) phải gần như bằng nhau
Trong trường hợp nhóm tiếp xúc với yếu tố nguy cơ quá đặc biệt đến nỗi chúng ta
không thể tìm được nhóm so sánh tương tự thì lúc đó cần sử dụng nhiều nhóm so sánh,
mỗi nhóm có một đặc điểm nào đó giống vơiù nhóm có tiếp xúc với yếu tố nguy cơ
4.3 Xác định tình trạng tiếp xúc với yếu tố nguy cơ:
Để xác định tình trạng tiếp xúc với yếu tố nguy cơ, chúng ta có thể dựa vào nhiều nguồn số liệu Trong nghiên cứu tiền cứu, việc xác định tình trạng tiếp xúc với yếu tố nguy cơ có thể trực tiếp dựa vào bảng câu hỏi chi tiết, các xét nghiệm sinh hóa hoặc các cuộc khảo sát về môi trường, nghề nghiệp Còn trong nghiên cứu hồi cứu, việc xác định tình trạng tiếp xúc với yếu tố nguy cơ thường khó hơn nhưng chúng ta vẫn có thể lấy được qua hồ sơ bệnh, hồ sơ làm việc hoặc sổ sách thống kê về môi trường, nghề nghiệp… Vấn đề quan trọng là làm sao xác định người nào có tiếp xúc với yếu tố nguy
cơ, người nào không Nói cách khác, chúng ta cần phải xác định ở giá trị nào, ngưỡng nào, “điểm cắt” (cut-off point) nào thì một người được gọi là có tiếp xúc với yếu tố nguy cơ Nếu không chúng ta sẽ dễ dàng mắc phải sai số hệ thống (bias) ở đây
VD: trong nghiên cứu tìm mối liên quan giữa nồng độ cholesterol/máu và bệnh tim mạch, chúng ta cần phải định nghĩa rõ thế nào là nồng độ cao, thế nào là nồng độ bình thường Từ đó mới xác định được chính xác tình trạng có tiếp xúc với yếu tố nguy cơ hay không, mức độ như thế nào
Trang 5V CÁC VẤN ĐỀ TRONG PHÂN TÍCH VÀ DIỄN GIẢI KẾT QUẢ:
5.1 Nguy cơ tương đối (relative risk)
Nguy cơ tương đối là tỉ số giữa tỉ suất bệnh mới (Incidence) trong nhóm có tiếp xúc
(exposed group) và tỉ suất bệnh mới trong nhóm không tiếp xúc (non-exposed group)
d c
c a b a
RR = // ++
d c
c a b
a CI CI
0 1
5.1.1 Nếu tỉ suất mới mắc dồn (Cumulative Incidence – CI) được sử dụng:
Bệnh + Bệnh - Tổng cộng
Tổng cộng a+c b+d a+b+c+d
Và nguy cơ qui trách (attributable risk, risk difference) được tính bằng công thức:
AR = CI1 – CI0 = a/a+b – c/c+d
VD: Trong nghiên cứu về mối liên quan giữa chỉ số Apgarvà nguy cơ tử vong trong
năm đầu của trẻ sơ sinh nhẹ cần (<2.500g), người ta thấy:
Số trẻ tử vong/năm đầu
Số trẻ không tử vong/năm
8 , 2
345 /
43 /122
=
RR
Vậy trẻ sơ sinh có chỉ số Apgar 0-3 có nguy cơ bị tử vong trong năm đầu cao
gần gấp 3 lần trẻ sơ sinh có chỉ số Apgar 4-6
5.1.2 Nếu tỉ suất mới mắc theo đơn vị người – thời gian (Incidence density –
ID) được sử dụng:
Và nguy cơ qui trách (attributable risk, risk difference) được tính bằng công thức:
0 1 0
1 /
/
N c N a ID ID
AR = ID1 – ID0 = a/N1 – c/N0
Bệnh + Người-thời gian
Trang 6VD: Trong nghiên cứu tìm mối liên quan giữa nồng độ cholesterol/máu và tử vong
do bệnh mạch vành do Hội tim mạch Chicago thực hiện trên những người đàn ông da trắng trong độ tuổi 25-39, cho kết quả như sau
Số người tử vong Người-năm
5 , 3
68239 /
1426 /36581 =
=
RR
Vậy người có nồng độ cholesterol/máu cao có nguy cơ bị tử vong do bệnh mạch vành cao gấp 3,5 lần so với người có nồng độ cholesterol/máu thấp
5.2 Các sai số hệ thống (bias) thường gặp trong nghiên cứu đoàn hệ
Một số sai lệch thường gặp là sai lệch do phân loại sai (misclassification bias), sai lệch do mất đối tượng theo dõi (losses of follow-up)
* Mất đối tượng theo dõi có thể gây ra bias nghiêm trọng trong nghiên cứu đoàn
hệ Nếu tỉ lệ mất đối tượng theo dõi lớn (30 – 40%) so với mẫu ban đầu thì cần phải nghi ngờ giá trị của mối liên quan (giữa tiếp xúc với yếu tố nguy cơ và bệnh) mà ta tìm thấy trong nghiên cứu Tuy nhiên, vấn đề không chỉ đơn giản ở tỉ lệ mất đối tượng mà bias sẽ xảy ra nếu việc mất đối tượng theo dõi (do người tham gia bỏ cuộc hay dọn đi nơi khác) có liên quan đến tình trạng tiếp xúc với yếu tố nguy cơ hay tình trạng bệnh
VD những người bị bệnh tim mạch hay bệnh ung thư thường ít có khả năng tiếp tục tham gia nghiên cứu hơn những người không bệnh (trong trường hợp này có một tỉ lệ lớn người bệnh trong số đối tượng theo dõi bị mất) Hoặc những người tập thể dục thường xuyên thường có xu hướng di chuyển (sống ở nơi khác) hơn những người không tập thể dục (trong trường hợp này trong tỉ lệ đối tượng theo dõi bị mất lại có một số đông người khoẻ mạnh) Sự khác nhau về tỉ lệ mất đối tượng trong nhóm tiếp xúc và không tiếp xúc có thể sẽ “đe doạ” đến giá trị trong (internal validity) của nghiên cứu
Trang 7TÀI LIỆU THAM KHẢO
1 David C., Ian G., Richard H Epidemiology Sidney, University of New South
Wales Press Ltd., 1994
2 Friedman G.D Primer of epidemiology Singapore, McGraw-Hill Book Co., 1994
3 Greenberg R.S., Daniels S.R., Flanders W.D., Eley J.W., Boring J.R Medical
epidemiology New Jersey, Prentice-Hall International, Inc., 2005
4 Hennekens C.H., Buring J.E Epidemiology in Medicine Boston, Little Brown
Company, 1987
5 Hulley S.B., Cummings S.R Designing clinical research Baltimore, Williams &
Wilkins, 1988
6 Mausner J.S., Bahn A.K Epidemiology: An introductory text Philadelphia, W.B
Saunders Company, 1985
Trang 8SỬ DỤNG PHẦN MỀM PS ĐỂ TÍNH CỞ MẪU TRONG NGHIÊN
CỨU ĐOÀN HỆ
Trang 10BÀI TẬP SỬ DỤNG STATA TRONG NGHIÊN CỨU ĐOÀN HỆ
A Tính RR (với cohort study risk ratio)
1) Sử dụng file “INJDEATH”
2) Tính RR
- Tìm lệnh để sử dụng trong STATA
Statistics -> Epidemiology and related -> Tables for epidemiologist -> Cohort study risk ratio
- Lệnh sử dụng trong STATA
cs [biến số bệnh] [biến số tiếp xúc]
Trang 11- Kết quả thu được như sau:
+ RR= 1.70 (KTC 95% = 1.27 – 2.29)
Như vậy, bà mẹ không đi khám tiền sản có nguy cơ sinh con bị chết do chấn thương cao gấp 1.7 lần bà mẹ có đi khám tiền sản
+ Tỉ lệ bị tử vong do chấn thương trong nhóm bà mẹ không đi khám tiền sản là 14%, tỉ lệ vong do chấn thương trong nhóm bà mẹ có đi khám tiền sản là 8.2%
+ Nguy cơ qui trách (nguy cơ sai biệt) là 0.06 (6%o)
+ Phần trăm nguy cơ qui trách trong nhóm không đi khám tiền sản là 41.3%
+ Phần trăm nguy cơ qui trách trong dân số là 7.3%
cs injdth pnclate
| Late or no prenatal care|
| Exposed Unexposed | Total
-+ -+ -
Cases | 47 218 | 265
Noncases | 289 2437 | 2726
-+ -+ -
Total | 336 2655 | 2991
| |
Risk | .139881 .0821092 | .0885991
| |
| Point estimate | [95% Conf Interval] | -+ - Risk difference | 0577717 | .0192413 .0963021 Risk ratio | 1.703596 | 1.269566 2.286008 Attr frac ex | 4130064 | .2123295 .5625563 Attr frac pop | 0732502 |
+ - chi2(1) = 12.33 Pr>chi2 = 0.0004
Trang 124) Kiểm tra hôn nhân bất hợp pháp có phải là yếu tố gây nhiễu/yếu tố thay đổi tương quan (tương tác) cho mối liên hệ giữa khám tiền sản và tử vong do chấn thương hay không?
- Lệnh sử dụng trong STATA
cc [biến số bệnh] [biến số tiếp xúc], by (biến số phân tầng)
Để biết một yếu tố (thứ 3) có phải là yếu tố gây nhiễu hay yếu tố thay đổi tương quan (tương tác), chúng ta có thể thực hiện phân tích phân tầng theo yếu tố thứ 3 đó
- Thực hiện phân tích bảng 2x2 phân tầng
- Kiểm tra tính đồng nhất của RR theo tầng bằng cách đọc kết quả của “Test of
homogeneity” Nếu p < 0.05 => Có tương tác (Yếu tố thứ 3 đang xét là yếu tố thay đổi tương quan) => Báo cáo kết quả của RR theo từng tầng Nếu p > 0.05 => So sánh RR thô và RR hiệu chỉnh
- So sánh RR thô và RR hiệu chỉnh (hay còn gọi RR kết hợp Mantel-Haenszel tức
adjusted RR) Nếu khác biệt >10% => Yếu tố thứ 3 là yếu tố gây nhiễu=> Báo cáo kết quả của RR kết hợp M-H Nếu khác biệt < 10% => Yếu tố thứ 3 này không phải
là yếu tố gây nhiễu => Báo cáo kết quả của RR thô
- Kết quả thu được
+ Đối với biến số “hôn nhân họp pháp”: test of homogeneity cho thấy p>0.05 => RR của tình trạng kết hôn không khác nhau 1 cách có ý nghĩa RR hiệu chỉnh và RR thô cũng không khác biệt có ý nghĩa => Tình trạng kết hôn không hợp pháp không phải là yếu tố gây nhiễu cũng không phải là interaction
cs injdth pnclate, by(illegit)
Illegitimate | RR [95% Conf Interval] M-H Weight -+ -
No | 1.519019 8180733 2.820553 6.204969 Yes | 1.246788 885521 1.755441 23.3711 -+ - Crude | 1.703596 1.269566 2.286008 M-H combined | 1.303901 9667027 1.758719
- Test of homogeneity (M-H) chi2(1) = 0.300 Pr>chi2 = 0.5841
Tính với số có sẵn
- Tìm lệnh để sử dụng trong STATA
Statistics -> Epidemiology and related -> Tables for epidemiologist -> Cohort study -> Cohort study calculator