MÔ HÌNH COX VỚI NHIỀU BIẾN LIÊN TỤC VÀ PHÂN LOẠI

Một phần của tài liệu SURVIVAL ANALYSIS trong Stata (Trang 31 - 39)

Mô hình Cox cho thấy nồng độ cholesterol và hút thuốc lá (cigs) có làm tăng có ý nghĩa thống kê nguy cơ biến cố tim mạch xảy ra. Ngược lại, trọng lượng lại làm giảm nguy cơ. Biến huyết áp tâm trương (sbp) và A/B personality (ab) không có ảnh hưởng có ý nghĩa thống kê.

Tiên đoán ho(t) và hàm hazard baseline

Sau khi ước lượng mô hình, chúng ta có thể tiên đoán các biến mới là ước lượng baseline cummulative hazard và hàm sống còn tiên đoán. Bởi vì “baseline”

đòi hỏi một tình huống mà tất cả các biến x đều = 0, nên cần phải trung tâm hóa một số biến để giá trị 0 có ý nghĩa. Một bệnh nhân nặng 0 pound, hoặc có huyết áp 0 thì không cung cấp một sự so sánh có ích. Dựa trên giá trị tối thiểu của dữ liệu, có thể dịch chuyển trọng lượng để 0 tương ứng với 120, sbp 0 tương tứng với 105 và chol có 0 tương ứng 340.

Giá trị 0 cho tất cả các biến x hiện đã trở nên có ý nghĩa.

Chúng ta có thể tạo hàm sống còn baseline và hàm nguy cơ tích lũy baseline bằng hai câu lệnh predict

Vẽ đồ thị giữa hàm baseline survivor (biến survivor) theo thời gian. Hàm baseline survivor mô tả xác suất sống còn của bệnh nhân có “0” trọng lượng (120 pound),

“0” huyết áp (105), “0” cholesterol (340), 0 cigarette/ngày, và tính cách loại B giảm theo thời gian. Mặc dù sự sụt giảm này trông kỳ cục ở bên phải đồ thị, cần lưu ý rằng xác suất thật sự chỉ giảm từ 1 đến 0.96. Bởi vì lý do là các giá trị của biến predictor ít thuận lợi, nên xác suất sống sót sẽ sụt giảm nhanh hơn.

Thay vì vẽ baseline survivor functions, sau khi chạy lệnh xtcox.

Lệnh sts graph cũng vẽ đường xác suất sống còn baseline tương tự như đồ thị ở trên, với option là adjustfor(các biến predictor). Đồ thị này chỉ khác ở chỗ thang đo trên trục tung là sử dụng thang đo truyền thống của hàm sống còn (0-1) trong khi thang đo của đồ thị vẽ từ mô hình là theo xác suất sống baseline.

Vẽ estimated baseline cummulative hazard theo thời gian. Baseline cummulative hazard tăng dần theo 8 bậc (vì có 8 đối tượng failed) từ gần 0 lên 0.03

Tiên đoán survival time cho một đối tượng cụ thể

. stcox age ndrugtx treat site c.age#i.site, nohr basesurv(surv0) failure _d: censor

analysis time _t: time

Iteration 0: log likelihood = -2868.555 Iteration 1: log likelihood = -2851.487 Iteration 2: log likelihood = -2850.8935 Iteration 3: log likelihood = -2850.8915 Refining estimates:

Iteration 0: log likelihood = -2850.8915 Cox regression -- Breslow method for ties

No. of subjects = 610 Number of obs = 610 No. of failures = 495

Time at risk = 142994

LR chi2(5) = 35.33 Log likelihood = -2850.8915 Prob > chi2 = 0.0000

--- _t | Coef. Std. Err. z P>|z| [95% Conf. Interval]

---+--- age | -.0336943 .0092913 -3.63 0.000 -.051905 -.0154837 ndrugtx | .0364537 .0077012 4.73 0.000 .0213597 .0515478 treat | -.2674113 .0912282 -2.93 0.003 -.4462153 -.0886073 site | -1.245928 .5087349 -2.45 0.014 -2.24303 -.2488262 |

site#c.age |

1 | .0337728 .0155087 2.18 0.029 .0033764 .0641693 --- . generate surv1 = surv0^exp( (-0.0336943*30+0.0364537*5 - 0.2674113))

(18 missing values generated)

. line surv1 _t, sort ylab(0 .1 to 1) xlab(0 200 to 1200)

0.1.2.3.4.5.6.7.8.91surv1

0 200 400 600 800 1000 1200

_t

Tiên đoán đường sống còn cho một đối tượng cụ thể. Ví dụ một người 30 tuổi (age=30), có số thuốc sử dụng trước đó là 5 (ndrugtx=5) và hiện đang điều trị dài hạn (treat=1) tại nơi A (site=0 và agesite=30*0=0). Đầu tiên phải tạo hàm sống còn nền cho mô hình đồng biến trong đó tất cả các predictor được thiết lập =0 (surv0). Sau đó sẽ nâng hàm sống còn nền lên bằng cách lấy mũ của kết hợp tuyến tính của các hệ số và giá trị của các đồng biến số trong mô hình đồng biến tính được. Do đó để tính thời gian sử dụng lại thuốc của đối tượng này sẽ được tính là -0.0336943*30+0.0364537*5 - 0.2674113*1 - 1.245928*0 - .0337728*0.

. generate surv2 = surv0^exp( (-0.0336943*30+0.0364537*5)) (18 missing values generated)

. label variable surv1 "long treatment"

. label variable surv2 "short treatment"

. line surv1 surv2 _t, sort ylab(0 .1 to 1) xlab(0 200 to 1200) . drop surv0-surv2

0.1.2.3.4.5.6.7.8.91

0 200 400 600 800 1000 1200

_t

long treatment short treatment

Tiên đoán đường sống còn cho đối tượng cụ thể ở hai nhóm khác nhau. Ví dụ một người 30 tuổi (age=30), có số thuốc sử dụng trước đó là 5 (ndrugtx=5) và hiện đang điều trị ngắn hạn (treat=0) tại nơi A (site=0 và agesite=30*0=0). Hàm sống còn của bệnh nhân ở nhóm điều trị ngắn hạn là surv2. Đối với bệnh nhân ở nhóm điều trị ngắn hạn hàm sống còn của nhóm này tính được là -0.0336943*30+0.0364537*5. Từ đồ thị cho thấy thời gian sử dụng lại thuốc của nhóm ngắn và nhóm dài là hoàn toàn khác nhau.

Một phần của tài liệu SURVIVAL ANALYSIS trong Stata (Trang 31 - 39)

Tải bản đầy đủ (DOCX)

(50 trang)
w