NGHIÊN CỨU KHOA HỌC NGÀNH Y - Bài 6 nâng cao ppsx

GIỚI THIỆU 1.1 Định nghĩa: Một nghiên cứu đoàn hệ cohort study là một thiết kế nghiên cứu quan sát observational research study khởi đầu với một nhóm người một đoàn hệ không có bệnh h

Trang 1

Bài 6

NGHIÊN CỨU ĐOÀN HỆ

TS.BS Tăng Kim Hồng

I GIỚI THIỆU

1.1 Định nghĩa: Một nghiên cứu đoàn hệ (cohort study) là một thiết kế nghiên cứu

quan sát (observational research study) khởi đầu với một nhóm người (một đoàn hệ) không có bệnh (hay vấn đề cần nghiên cứu) được chia thành hai nhóm: có tiếp xúc (exposed) hay không có tiếp xúc (non-exposed) với yếu tố nguy cơ và theo dõi sau một thời gian để xem trong số họ bao nhiêu người có bệnh, bao nhiêu người không có bệnh (hay vấn đề cần nghiên cứu) Nói cách khác, mục tiêu của nghiên cứu đoàn hệ là nhằm xác định xem có bao nhiêu ca bệnh mới (hay bao nhiêu trường hợp mới có vấn đề đang cần nghiên cứu) trong từng nhóm có tiếp xúc và không có tiếp xúc với yếu tố nguy cơ

Thời gian Hướng khảo sát

Có bệnh Nhóm người Có tiếp xúc Không bệnh

Dân số không có

Hình 1: Thiết kế nghiên cứu doàn hệ

1.2 Phân biệt những đặc tính của nghiên cứu bệnh chứng và các loại nghiên cứu phân tích khác:

1.2.1 Khác với nghiên cứu cắt ngang (cross-sectional study), trong nghiên cứu

đoàn hệ tình trạng tiếp xúc với yếu tố nguy cơ (exposure) và mắc bệnh (hay có vấn đề đang cần nghiên cứu) được đo ở 2 thời điểm khác nhau chứ không đồng thời

1.2.2 Nghiên cứu đoàn hệ khác với nghiên cứu bệnh – chứng (case-control study) ở chỗ: các đối tượng nghiên cứu trong nghiên cứu đoàn hệ được phân loại dựa

Trang 2

II CÁC LOẠI NGHIÊN CỨU ĐOÀN HỆ

Trên cơ bản, có hai loại nghiên cứu đoàn hệ Đó là nghiên cứu tiền cứu (prospective) và nghiên cứu hồi cứu (retrospective) Sự khác nhau giữa hai loại này là

ở chỗ thời điểm bắt đầu nghiên cứu

1) Trong nghiên cứu đoàn hệ tiền cứu (prospective cohort study), thời điểm bắt

đầu nghiên cứu (điểm 0) là hiện tại và dân số được tiếp tục khảo sát, theo dõi trong tương lai Việc tiếp xúc với yếu tố nguy cơ có thể đã xảy ra hay chưa xảy ra khi nghiên cứu bắt đầu, nhưng “kết quả” (tức là có bệnh hay xuất hiện vấn đề cần nghiên cứu) thì chắc chắn chưa xảy ra

Một trong những tiện lợi của loại nghiên cứu này là các yếu tố nghiên cứu có thể được xác định đúng như nhà nghiên cứu mong muốn Một thí dụ về nghiên cứu

đoàn hệ tiền cứu là nghiên cứu Framingham Nghiên cứu này bắt đầu vào năm 1948

tại Framingham, Hoa kỳ và toàn bộ cộng đồng được theo dõi trong vòng 40 năm để khảo sát các yếu tố nguy cơ của bệnh tim mạch, hô hấp, xương khớp và một số vấn đề sức khoẻ khác

2) Trong nghiên cứu đoàn hệ hồi cứu (retrospective cohort study, historical

cohort study), “điểm bắt đầu” – tức thời điểm xảy ra việc tiếp xúc với yếu tố nguy cơ là ở quá khứ và dân số được theo dõi cho đến hiện tại Vào lúc bắt đầu nghiên cứu, cả việc tiếp xúc với yếu tố nguy cơ và mắc bệnh (hay có vấn đề đang nghiên cứu) đều đã xảy ra

Sự khác nhau giữa nghiên cứu bệnh-chứng, nghiên cứu đoàn hệ tiền cứu và nghiên cứu đoàn hệ hồi cứu được mô tả trong hình 2 (trang sau)

III ƯU ĐIỂM VÀ NHƯỢC ĐIỂM CỦA THIẾT KẾ NGHIÊN CỨU ĐOÀN HỆ 3.1 Ưu điểm:

- cung cấp bằng chứng mạnh mẽ về nguyên nhân của bệnh, cho phép kết luận mối quan hệ nhân-quả (cause-effect relationship) giữa tiếp xúc với yếu tố nguy

cơ (exposure) và bệnh (disease)

- việc xác định tình trạng tiếp xúc với yếu tố nguy cơ có thể không gặp bias vì ở thời điểm đó, bệnh (hay vấn đề cần nghiên cứu) chưa xảy ra

- có thể khảo sát được nhiều kết quả (outcome) từ một nguyên nhân

- là nghiên cứu thích hợp dùng để khảo sát ảnh hưởng của những tình trạng tiếp xúc với yếu tố nguy cơ hiếm gặp (rare exposures)

3.2 Nhược điểm:

- là loại nghiên cứu tốn thời gian, tốn tiền nhất trong số các thiết kế nghiên cứu phân tích

- đôi khi cần phải theo dõi đối tượng nghiên cứu trong một thời gian dài (vì kết quả xuất hiện chậm) nên khi có kết quả thì vấn đề nghiên cứu không còn thích hợp nữa

Trang 3

Nghiên cứu bệnh-chứng

Nghiên cứu đoàn hệ tiền cứu

?

#

Nghiên cứu đoàn hệ hồi cứu

Tiếp xúc Bệnh

# = Có

) = Không

? = Cần được xác định

b= Nhà nghiên cứu lúc bắt đầu cuộc nghiên cứu

Hình 2: Sự khác nhau về thời gian giữa nghiên cứu bệnh-chứng, nghiên cứu đoàn hệ tiền cứu và nghiên cứu đoàn hệ hồi cứu

IV CÁC VẤN ĐỀ TRONG THIẾT KẾ VÀ THỰC HIỆN NGHIÊN CỨU ĐOÀN HỆ

4.1 Tính cỡ mẫu:

Cỡ mẫu được tính theo công thức sau:

0 1

1 1 1 2

/

p p

p p p z pq z

n = − α + − β − − + 0 1 −p0 2

Trong đó: p 1 : Tỉ lệ bệnh trong nhóm có tiếp xúc với yếu tố nguy cơ (exposed group)

p 0 : Tỉ lệ bệnh trong nhóm không tiếp xúc với yếu tố nguy cơ (non-exposed group)

Khi p1 đã biết, thì p0 có thể suy ra được từ công thức: RR = p1/p0

( 1 0) 2

1 p p

4.2 Chọn mẫu:

Các nhóm nghiên cứu (gồm những người có tiếp xúc vàkhông tiếp xúc với yếu tố

nguy cơ) có thể được chọn từ nhiều nguồn tùy theo cỡ mẫu và kinh phí cho phép của cuộc nghiên cứu Khi chọn nhóm nghiên cứu cần phải chú ý đến những vấn đề sau: tần

Trang 4

thông tin đầy đủ và chính xác về việc có hay không có tiếp xúc với yếu tố nguy cơ; khả năng theo dõi và quản lý các đối tượng nghiên cứu trong một thời gian dài

Khi việc tiếp xúc với yếu tố nguy cơ tương đối phổ biến (VD: hút thuốc lá, uống

rượu…) thì có thể chọn đối tượng có tiếp xúc với yếu tố nguy cơ từ dân số chung Trong

trường hợp việc tiếp xúc với yếu tố nguy cơ hiếm xảy ra (rare exposures) (VD việc tiếp xúc với yếu tố nguy cơ có liên quan đến một số ngành, nghề đặc biệt) thì có thể

chọn đối tượng (có tiếp xúc) trong nhóm người có tiếp xúc với yếu tố nguy cơ hơn là

chọn từ dân số chung VD: muốn khảo sát mối liên quan giữa việc tiếp xúc với uranium và bệnh ung thư, đối tượng được chọn để theo dõi nên lấy từ những người thợ mỏ uranium hơn là chọn từ cộng đồng người bình thường

Lý tưởng nhất, nhóm so sánh (gồm những người không tiếp xúc với yếu tố nguy cơ – unexposed group) được chọn từ cùng một dân số với nhóm tiếp xúc VD: trong nghiên cứu Framingham về bệnh tim mạch, cả 2 nhóm có tiếp xúc và không tiếp xúc với yếu tố nguy cơ được chọn từ cùng một vùng Tuy nhiên, nếu nhóm có tiếp xúc được

chọn từ 1 quần thể đặc biệt thì nhóm so sánh nên lấy từ một nguồn khác Điều quan

trọng là các nhóm nghiên cứu, ngoại trừ sự khác nhau ở chỗ có tiếp xúc hay không tiếp xúc với yếu tố nguy cơ, phải giống nhau ở các đặc điểm khác Có nghĩa là nếu thực

sự không có mối liên quan giữa việc tiếp xúc với yếu tố nguy cơ và bệnh (hay vấn đề cần khảo sát) thì tỉ suất của bệnh (hay vấn đề cần khảo sát) ở hai dân số (mà từ đó hai nhóm nghiên cứu được chọn) phải gần như bằng nhau

Trong trường hợp nhóm tiếp xúc với yếu tố nguy cơ quá đặc biệt đến nỗi chúng ta

không thể tìm được nhóm so sánh tương tự thì lúc đó cần sử dụng nhiều nhóm so sánh,

mỗi nhóm có một đặc điểm nào đó giống vơiù nhóm có tiếp xúc với yếu tố nguy cơ

4.3 Xác định tình trạng tiếp xúc với yếu tố nguy cơ:

Để xác định tình trạng tiếp xúc với yếu tố nguy cơ, chúng ta có thể dựa vào nhiều nguồn số liệu Trong nghiên cứu tiền cứu, việc xác định tình trạng tiếp xúc với yếu tố nguy cơ có thể trực tiếp dựa vào bảng câu hỏi chi tiết, các xét nghiệm sinh hóa hoặc các cuộc khảo sát về môi trường, nghề nghiệp Còn trong nghiên cứu hồi cứu, việc xác định tình trạng tiếp xúc với yếu tố nguy cơ thường khó hơn nhưng chúng ta vẫn có thể lấy được qua hồ sơ bệnh, hồ sơ làm việc hoặc sổ sách thống kê về môi trường, nghề nghiệp… Vấn đề quan trọng là làm sao xác định người nào có tiếp xúc với yếu tố nguy

cơ, người nào không Nói cách khác, chúng ta cần phải xác định ở giá trị nào, ngưỡng nào, “điểm cắt” (cut-off point) nào thì một người được gọi là có tiếp xúc với yếu tố nguy cơ Nếu không chúng ta sẽ dễ dàng mắc phải sai số hệ thống (bias) ở đây

VD: trong nghiên cứu tìm mối liên quan giữa nồng độ cholesterol/máu và bệnh tim mạch, chúng ta cần phải định nghĩa rõ thế nào là nồng độ cao, thế nào là nồng độ bình thường Từ đó mới xác định được chính xác tình trạng có tiếp xúc với yếu tố nguy cơ hay không, mức độ như thế nào

Trang 5

V CÁC VẤN ĐỀ TRONG PHÂN TÍCH VÀ DIỄN GIẢI KẾT QUẢ:

5.1 Nguy cơ tương đối (relative risk)

Nguy cơ tương đối là tỉ số giữa tỉ suất bệnh mới (Incidence) trong nhóm có tiếp xúc

(exposed group) và tỉ suất bệnh mới trong nhóm không tiếp xúc (non-exposed group)

d c

c a b a

RR = // ++

d c

c a b

a CI CI

0 1

5.1.1 Nếu tỉ suất mới mắc dồn (Cumulative Incidence – CI) được sử dụng:

Bệnh + Bệnh - Tổng cộng

Tổng cộng a+c b+d a+b+c+d

Và nguy cơ qui trách (attributable risk, risk difference) được tính bằng công thức:

AR = CI1 – CI0 = a/a+b – c/c+d

VD: Trong nghiên cứu về mối liên quan giữa chỉ số Apgarvà nguy cơ tử vong trong

năm đầu của trẻ sơ sinh nhẹ cần (<2.500g), người ta thấy:

Số trẻ tử vong/năm đầu

Số trẻ không tử vong/năm

8 , 2

345 /

43 /122

=

RR

Vậy trẻ sơ sinh có chỉ số Apgar 0-3 có nguy cơ bị tử vong trong năm đầu cao

gần gấp 3 lần trẻ sơ sinh có chỉ số Apgar 4-6

5.1.2 Nếu tỉ suất mới mắc theo đơn vị người – thời gian (Incidence density –

ID) được sử dụng:

Và nguy cơ qui trách (attributable risk, risk difference) được tính bằng công thức:

0 1 0

1 /

/

N c N a ID ID

AR = ID1 – ID0 = a/N1 – c/N0

Bệnh + Người-thời gian

Trang 6

VD: Trong nghiên cứu tìm mối liên quan giữa nồng độ cholesterol/máu và tử vong

do bệnh mạch vành do Hội tim mạch Chicago thực hiện trên những người đàn ông da trắng trong độ tuổi 25-39, cho kết quả như sau

Số người tử vong Người-năm

5 , 3

68239 /

1426 /36581 =

=

RR

Vậy người có nồng độ cholesterol/máu cao có nguy cơ bị tử vong do bệnh mạch vành cao gấp 3,5 lần so với người có nồng độ cholesterol/máu thấp

5.2 Các sai số hệ thống (bias) thường gặp trong nghiên cứu đoàn hệ

Một số sai lệch thường gặp là sai lệch do phân loại sai (misclassification bias), sai lệch do mất đối tượng theo dõi (losses of follow-up)

* Mất đối tượng theo dõi có thể gây ra bias nghiêm trọng trong nghiên cứu đoàn

hệ Nếu tỉ lệ mất đối tượng theo dõi lớn (30 – 40%) so với mẫu ban đầu thì cần phải nghi ngờ giá trị của mối liên quan (giữa tiếp xúc với yếu tố nguy cơ và bệnh) mà ta tìm thấy trong nghiên cứu Tuy nhiên, vấn đề không chỉ đơn giản ở tỉ lệ mất đối tượng mà bias sẽ xảy ra nếu việc mất đối tượng theo dõi (do người tham gia bỏ cuộc hay dọn đi nơi khác) có liên quan đến tình trạng tiếp xúc với yếu tố nguy cơ hay tình trạng bệnh

VD những người bị bệnh tim mạch hay bệnh ung thư thường ít có khả năng tiếp tục tham gia nghiên cứu hơn những người không bệnh (trong trường hợp này có một tỉ lệ lớn người bệnh trong số đối tượng theo dõi bị mất) Hoặc những người tập thể dục thường xuyên thường có xu hướng di chuyển (sống ở nơi khác) hơn những người không tập thể dục (trong trường hợp này trong tỉ lệ đối tượng theo dõi bị mất lại có một số đông người khoẻ mạnh) Sự khác nhau về tỉ lệ mất đối tượng trong nhóm tiếp xúc và không tiếp xúc có thể sẽ “đe doạ” đến giá trị trong (internal validity) của nghiên cứu

Trang 7

TÀI LIỆU THAM KHẢO

1 David C., Ian G., Richard H Epidemiology Sidney, University of New South

Wales Press Ltd., 1994

2 Friedman G.D Primer of epidemiology Singapore, McGraw-Hill Book Co., 1994

3 Greenberg R.S., Daniels S.R., Flanders W.D., Eley J.W., Boring J.R Medical

epidemiology New Jersey, Prentice-Hall International, Inc., 2005

4 Hennekens C.H., Buring J.E Epidemiology in Medicine Boston, Little Brown

Company, 1987

5 Hulley S.B., Cummings S.R Designing clinical research Baltimore, Williams &

Wilkins, 1988

6 Mausner J.S., Bahn A.K Epidemiology: An introductory text Philadelphia, W.B

Saunders Company, 1985

Trang 8

SỬ DỤNG PHẦN MỀM PS ĐỂ TÍNH CỞ MẪU TRONG NGHIÊN

CỨU ĐOÀN HỆ

Trang 10

BÀI TẬP SỬ DỤNG STATA TRONG NGHIÊN CỨU ĐOÀN HỆ

A Tính RR (với cohort study risk ratio)

1) Sử dụng file “INJDEATH”

2) Tính RR

- Tìm lệnh để sử dụng trong STATA

Statistics -> Epidemiology and related -> Tables for epidemiologist -> Cohort study risk ratio

- Lệnh sử dụng trong STATA

cs [biến số bệnh] [biến số tiếp xúc]

Trang 11

- Kết quả thu được như sau:

+ RR= 1.70 (KTC 95% = 1.27 – 2.29)

Như vậy, bà mẹ không đi khám tiền sản có nguy cơ sinh con bị chết do chấn thương cao gấp 1.7 lần bà mẹ có đi khám tiền sản

+ Tỉ lệ bị tử vong do chấn thương trong nhóm bà mẹ không đi khám tiền sản là 14%, tỉ lệ vong do chấn thương trong nhóm bà mẹ có đi khám tiền sản là 8.2%

+ Nguy cơ qui trách (nguy cơ sai biệt) là 0.06 (6%o)

+ Phần trăm nguy cơ qui trách trong nhóm không đi khám tiền sản là 41.3%

+ Phần trăm nguy cơ qui trách trong dân số là 7.3%

cs injdth pnclate

| Late or no prenatal care|

| Exposed Unexposed | Total

-+ -+ -

Cases | 47 218 | 265

Noncases | 289 2437 | 2726

-+ -+ -

Total | 336 2655 | 2991

| |

Risk | .139881 .0821092 | .0885991

| |

+ - chi2(1) = 12.33 Pr>chi2 = 0.0004

Trang 12

4) Kiểm tra hôn nhân bất hợp pháp có phải là yếu tố gây nhiễu/yếu tố thay đổi tương quan (tương tác) cho mối liên hệ giữa khám tiền sản và tử vong do chấn thương hay không?

- Lệnh sử dụng trong STATA

cc [biến số bệnh] [biến số tiếp xúc], by (biến số phân tầng)

Để biết một yếu tố (thứ 3) có phải là yếu tố gây nhiễu hay yếu tố thay đổi tương quan (tương tác), chúng ta có thể thực hiện phân tích phân tầng theo yếu tố thứ 3 đó

- Thực hiện phân tích bảng 2x2 phân tầng

- Kiểm tra tính đồng nhất của RR theo tầng bằng cách đọc kết quả của “Test of

homogeneity” Nếu p < 0.05 => Có tương tác (Yếu tố thứ 3 đang xét là yếu tố thay đổi tương quan) => Báo cáo kết quả của RR theo từng tầng Nếu p > 0.05 => So sánh RR thô và RR hiệu chỉnh

- So sánh RR thô và RR hiệu chỉnh (hay còn gọi RR kết hợp Mantel-Haenszel tức

adjusted RR) Nếu khác biệt >10% => Yếu tố thứ 3 là yếu tố gây nhiễu=> Báo cáo kết quả của RR kết hợp M-H Nếu khác biệt < 10% => Yếu tố thứ 3 này không phải

là yếu tố gây nhiễu => Báo cáo kết quả của RR thô

- Kết quả thu được

+ Đối với biến số “hôn nhân họp pháp”: test of homogeneity cho thấy p>0.05 => RR của tình trạng kết hôn không khác nhau 1 cách có ý nghĩa RR hiệu chỉnh và RR thô cũng không khác biệt có ý nghĩa => Tình trạng kết hôn không hợp pháp không phải là yếu tố gây nhiễu cũng không phải là interaction

cs injdth pnclate, by(illegit)

Illegitimate | RR [95% Conf Interval] M-H Weight -+ -

No | 1.519019 8180733 2.820553 6.204969 Yes | 1.246788 885521 1.755441 23.3711 -+ - Crude | 1.703596 1.269566 2.286008 M-H combined | 1.303901 9667027 1.758719

- Test of homogeneity (M-H) chi2(1) = 0.300 Pr>chi2 = 0.5841

Tính với số có sẵn

- Tìm lệnh để sử dụng trong STATA

Statistics -> Epidemiology and related -> Tables for epidemiologist -> Cohort study -> Cohort study calculator

Định dạng
Số trang	16
Dung lượng	602,92 KB