Những thử nghiệm này có thể được sử dụng để đánh giá sự an toàn của một loại thuốc mới ở những người tình nguyện khỏe mạnh, hoặc để đánh giá lợi ích điều trị ở những bệnh nhân mắc bệnh c
Trang 1ĐỊNH NGHĨA THỬ NGHIỆM LÂM SÀNG 2
MỤC TIÊU NGHIÊN CỨU (ESTIMAND/GOAL OF THE CLINICAL STUDY).3 TARGET POPULATION AND PATIENT SELECTION 10
ETHICAL CONSIDERATIONS 12
SELECTION OF CONTROLS 13
STRATIFICATION ISSUES 14
EFFICACY ASSESSMENT 15
SAFETY ASSESSMENT 16
SAMPLE SIZE ESTIMATION 17
INTERIM ANALYSIS AND DATA MONITORING 19
DESIGNS FOR CLINICAL TRIALS 20
INSTITUTIONAL REVIEW BOARD/INDEPENDENT ETHICS COMMITTEE (IRB/IEC) 21
Trang 2ĐỊNH NGHĨA THỬ NGHIỆM LÂM SÀNG
Một thử nghiệm lâm sàng (clinical trial) đánh giá tác dụng của một loại thuốc
mới (hoặc thiết bị hoặc quy trình) đối với người tình nguyện.
Những thử nghiệm này có thể được sử dụng để đánh giá sự an toàn của một loại thuốc mới ở những người tình nguyện khỏe mạnh, hoặc để đánh giá lợi ích điều trị
ở những bệnh nhân mắc bệnh cụ thể
Các thử nghiệm lâm sàng có thể so sánh một loại thuốc mới với các loại thuốc hiện
có hoặc với thuốc giả (giả dược) hoặc chúng có thể không có nhánh so sánh.
Trong một thử nghiệm lâm sàng ngẫu nhiên, bệnh nhân và nhân viên thử nghiệm được cố tình không biết bệnh nhân nào đang dùng thuốc mới.
Các thử nghiệm lâm sàng cũng có thể được phân loại thành các nghiên cứu đơn trung tâm hoặc đa trung tâm theo số lượng địa điểm liên quan Trong khi các nghiên cứu đơn trung tâm chủ yếu được sử dụng cho các nghiên cứu pha I và II, các nghiên cứu đa trung tâm có thể được thực hiện ở bất kỳ giai đoạn phát triển lâm sàng nào Nghiên cứu đa trung tâm là cần thiết cho hai lý do chính:
Để đánh giá một loại thuốc mới hoặc quy trình hiệu quả hơn về mặt tích lũy
đủ đối tượng trong một khoảng thời gian ngắn
Để cung cấp một cơ sở tốt hơn cho việc khái quát hóa tiếp theo của kết quả thử nghiệm, tức là, hiệu quả của việc điều trị được đánh giá ở nhiều loại trung tâm.
Trang 3CLINICAL TRIAL DESIGN
PARALLEL GROUP DESIGNS
Mỗi bệnh nhân chỉ được nhận một loại điều trị mà thôi
Có hai loại là group comparision design và matched pairs parallel design
Group comparision design: mỗi nhóm thường có số mẫu bằng nhau Có thể chỉ có 1 nhóm treatment và nhiều nhóm control Three-goup parallel design bao gồm 1 nhóm treatment, 1 nhóm active control và 1 nhóm placebo
control Nhóm treatment thường có số bệnh nhân nhiều hơn nhóm placebo (gấp 2 hoặc gấp 3) vì lý do đạo đức, bệnh nhân sẽ được hưởng điều trị nhiều hơn nhóm placebo Thường dùng trong phase II và phase III
matched pairs parallel group design: là randomized complete block design với block size bằng 2 trong đó mỗi bệnh nhân sẽ bắt cặp với một bệnh nhân khác có cùng yếu tố tiên lượng (ví dụ béo phì) cho bệnh nghiên cứu Một bệnh nhân trong cặp sẽ được phân vào nhóm treatment và một phân vào nhóm control Thiết kế phù hợp cho các bệnh diễn tiến như bệnh ung thư
Trước khi bệnh nhân được thu tuyển vào nghiên cứu người ta thường thực hiện một run-in periods (lead-in) với thuốc placebo, không có thuốc nghiên cứu.
Nghiên cứu run-in periods có mục đích:
Xác định tác dụng của placebo (tác dụng wash-out )
Dùng để làm cơ hội tập huấn cho bệnh nhân, điều tra viên, và nghiên cứu viên.
Phát hiện các bệnh nhân không hợp tác trong giai đoạn đầu để cung cấp các tư vấn cần thiết cho những bệnh nhân này.
Run-in periods thường là single-blind, bệnh nhân không biết mình sử dung placebo Tuy nhiên run-in periods thường kéo dài thời gian nghiên cứu và tốn nhiều chi phí hơn.
CLUSTERED RANDOMIZED DESIGNS
Đối với các can thiệp không phải điều trị (như can thiệp lối sống, chương trình
giáo dục) thì việc lấy mẫu ngẫu nhiên theo cluster (gia đình, bệnh viện, đội,
Trang 4nhóm) (hay còn gọi là social intact unit) sẽ giúp việc chọn ngẫu nhiên được thực
Chúng ta dùng ICC (intraclass correlation coefficient) để đo lường sự giống nhau giữa các subject trong cùng 1 cluster.
Nếu ICC dương nghĩa là intracluster variation nhỏ hơn intercluster variation.
Phương sai của trung bình mẫu sẽ tăng khi ICC và cỡ mẫu tăng lên (VIF: variance inflation factor yếu tố làm tăng phương sai).
CROSSOVER DESIGNS
TITRATION DESIGNS
Trang 5MỤC TIÊU NGHIÊN CỨU (ESTIMAND/GOAL OF THE CLINICAL
STUDY)
Hai mục tiêu chính của thử nghiệm thuốc: the efficacy và safety
The efficacy dùng phép kiểm để kiểm tra treatment effect, còn safety thì trình bày
số tóm tắt kèm khoảng tin cậy.
In the case of adverse event data, the rate of occurrence of each distinct adverse event on each treatmentgroup should be reported, together with confidence intervals for the difference between the rates ofoccurrence on the different treatments
An alternative would be to present risk ratios or relative risks of occurrence, with confidence intervals forthe relative risk
Mục tiêu nghiên cứu phải xác định rõ được cách đo lường efficacy và safety như thế nào.
Phải thêm vào xu hướng giả thuyết nữa (ví dụ thuốc có hiệu quả tốt hơn/ngang bằng/ hoặc thấp hơn thuốc control).
Mục tiêu có thể có composite endpoints (nghĩa là nhiều cách đo lường cho cùng một hiệu quả hoặc độ an toàn).
Mục tiêu còn có thể có thêm tertiary objective dành cho các subgroup của quần thể nghiên cứu.
Ví dụ:
Primary Objectives This trial is a randomized, double-blind, placebo-controlled trial conducted in x centers to assess
the efficacy of the test drug under investigation at dose y, frequency z for a 52-week treatment of patients with
COPD in terms of:
1 The reduction in the risk of exacerbation of COPD for patients receiving the investigational drug as compared to
2 A superior pulmonary function as assessed by the forced expiratory volume in
1 second (FEV1) for patients receiving the investigational drug as compared to
Secondary Objectives The secondary objectives are to assess the safety and tolerability
of the investigational drug at dose y, frequency z versus placebo by the evaluation of the
incidence rates of adverse events and laboratory parameters over a 52-week treatment ofpatients with COPD
Trang 6Ví dụ 2:
Primary Objectives This is a randomized, parallel-group study for determining whether
the efficacy of the test drug is not inferior to that of the active competitor for the prevention of all stroke (fatal and
1 To compare the efficacy of the test drug to that of the active competitor in terms of
the composite endpoint of the prevention of death, nonfatal stroke, nonfatal systemicembolic events, and nonfatal myocardial infarction in patients with atrial fibrillation(AF)
2 To compare the safety of the test drug to that of the active competitor with major
bleeding events and treatment discontinuation as the primary safety endpoints
1 To compare the efficacy of the test drug to that of the active competitor for the
prevention of all strokes with a poor outcome (defined as a Modified Rankin score
of 3 or more at 3 months post-stroke or a Barthel score less than 60 at 3 monthspost-stroke)
2 To compare the efficacy of the test drug to that of the active competitor for the
prevention of all strokes and systemic embolic events in patients 75 years of age orolder with AF and to compare this with patients below the age of 75 years
objectives and the analysis methods by more precisely defining what is to
be estimated and how that quantity will be interpreted This provides clarity on what data needs to be collected and how that data should be analyzed and interpreted
Conceptually, an estimand is simply the true population quantity of interest (NRC 2010); this is specific to a particular parameter, time point, and population (also sometimes referred to as the intervention effect)
Trang 7With the diversity in medical research and the many clinical trial scenarios that exist, consensus on a universally best estimand is neither realistic nor desirable Therefore, attention has turned to how to choose estimands
Importantly, the chart makes clear that in order to determine how best
to analyze clinical trial data, it is important to first consider the trial objectives and the estimands needed to be estimated in order to address those objectives
For example, at the most conceptual level, estimands can be divided into two
protocol-defined interventions: (1) Efficacy is the effects of the drug if taken
as directed; that is, the effects if patients adhere to the protocol-defined interventions (2) Effectiveness is the effects of the drug as actually taken; that
is, the effects without regard to adherence to the protocol-defined interventions Estimand 3, the de jure estimand, can be considered hypothetical (i.e., counterfactual) for groups of patients because treatment effects are assessed as if taken as directed when in any meaningfully sized group some patients will not adhere (NRC 2010) Therefore, de jure estimands assess what is possible to achieve in a group of patients, not what actually was achieved However, de jure estimands assess what to expect if patients are adherent—and in most clinical settings the majority of patients are adherent (Mallinckrodt et al 2014) In addition, patients are advised to take their medication as directed; therefore, it is important to assess what would happen if a medication were taken as directed so that optimal directions can be developed
De facto estimands can be considered counterfactual for individual patients because treatment effects are assessed from a mix of adherent and nonadherent patients, but each patient is either adherent or not adherent, no patient
Trang 8is both On the other hand, de facto estimands can provide useful estimates
of what to expect from the group as a whole
Design Considerations in Choosing Estimands
Missing Data Considerations
Universal agreement exists that clinical trials should aim to minimize missing data, thereby maximizing the portion of the intended data that was actually collected These considerations have often been in the context of de jure estimands However, the impact of maximizing retention on de facto estimands is also important
Specifically, assessment of de facto estimands often entail using adherence
as part of the primary outcome
Rescue Medication Considerations
Whether or not data should be collected after discontinuation of initially randomized study medication or initiation or rescue medication, and whether that data should be included in an analysis are critically important considerations
Use of rescue medications for patients not adequately responding to the initially randomized medications has been suggested because this provides
an assessment of pragmatic effectiveness and can reduce dropout
beneficial and post-rescue data are included in the analysis, the treatment effect is likely to be substantially diminished compared to the effect if postrescue data are not included
Another consideration is that readily available rescue medications may reduce study discontinuation, but could increase discontinuation from the initially randomized medication, which would of course be counter to the primary goal of maximizing retention on the initial medications (Mallinckrodt 2013) This issue may be particularly important in placebo-controlled trials
Trang 9where patients are aware that they may be randomized to an ineffective treatment but switching to rescue guarantees use of an effective treatment
With estimand 1 (de facto, treatment regimens), data after discontinuation
of the initially randomized medication and/or addition of rescue medication are included in the analyses
The ICH E9 guidance is often cited when justifying choice of a primary analytic approach (http://www.ich.org/fileadmin/Public_Web_Site/ICH_ Products/Guidelines/Efficacy/E9/Step4/E9_Guideline.pdf) This guidance emphasizes the ITT principle, which is defined as “the principle that asserts that the effect of a treatment policy can be best assessed by evaluating on the basis of the intention to treat a subject (i.e., the planned treatment regimen) rather than the actual treatment given It has the consequence that subjects allocated to a treatment group should be followed up, assessed and analyzed
as members of that group irrespective of their compliance to the planned course of treatment.
The guidance is clear on the need to include all randomized patients and that all data should be included, but it does not specifically address data after initiation of rescue treatment
Rescue therapy is specifically addressed in ICH E10, Section 2.1.5.2.2 (http:// www.ich.org/fileadmin/Public_Web_Site/ICH_Products/Guidelines/
Efficacy/E10/Step4/E10_Guideline.pdf) In referring to trials with rescue, E10 states: “In such cases, the need to change treatment becomes a study endpoint.” Thus, according to E10, post-rescue data need not be included in the primary analysis
In this modified approach to ITT, all randomized patients are again included, thereby maintaining consistency with the first tenant of ITT The
Trang 10second tenant of ITT is modified to mean that all data—relevant to the
estimand—are included
O’Neill and Temple (2012) noted that estimand 1 may be a more common choice for the primary estimand in outcomes trials where the presence/absence
of a major health event is the endpoint and/or the intervention is intended
to modify the disease process Symptomatic trials (symptom severity is the endpoint) often use a primary estimand where the inferential target is the initially randomized treatments In these scenarios the confounding from rescue medications is avoided by excluding data after discontinuation of study medication/initiation of rescue from the primary analysis
1.4Analysis Considerations
Although failure to adhere can be manifest in many ways, the most common scenario is that of missing data Patients may discontinue the study and all study-related procedures prior to the planned time of the primary assessment Patients may also discontinue the randomized study medication but remain in the study for follow-up assessments
For estimand 3, data after discontinuation of the initially randomized study medication are not needed
not included, thereby avoiding the potentially confounding effects of rescue medication
That is, patients with poor outcomes are more likely to be missing than patients with good outcomes
estimand 3 requires estimates of what would have happened if all patients were
adherent, but this cannot be based on only those patients who were adherent.
Trang 11Common analytic approaches for estimand 3 involve the assumption that data are missing at random (MAR)
Missing at random essentially means that conditional on the observed data, the
(means, variances, etc.) of the unobserved data is the same as the observed data Put another way, the unobserved data can be predicted in an unbiased manner from the observed data
include likelihood-based analyses, multiple imputation of missing values followed by an analysis that would have been appropriate had the data been complete, and weighted generalized estimating equations
Given the reliance of these methods on assumptions about the missing data, which of course cannot be verified since the data are missing, sensitivity analyses are required to assess the degree to which inferences are dependent on the assumptions
Estimand 1 can be evaluated using analyses similar to estimand 3, with the exception that estimand 1 requires including post-rescue data
Approaches to assessing estimand 2 often entail ascribing unfavorable outcomes to patients who discontinue the initially randomized medication or who need rescue medication, regardless of what outcomes were actually observed while the patients were adherent
Trang 12TARGET POPULATION AND PATIENT SELECTION
Cần phải xác định target patient population Sau đó bệnh nhân được lựa chọn từ target patient population cho RCT.
Phải xác định target patient population theo một cách đồng nhất với những đặc điểm cụ thể.
Có hai loại bệnh nhân: bệnh nhân nội trú (inpatient) cho nghiên cứu bệnh viện ngắn hạn và bệnh nhân ngoại trú (outpatient) đối với bệnh mạn tính.
Eligibility Criteria
Tiêu chí đưa vào (inclusion criteria): bệnh nhân phải thỏa tất cả các tiêu chí đưa vào mới được đưa vào nghiên cứu.
Tiêu chí loại ra (exclusion criteria): bệnh nhân thỏa bất kỳ tiêu chí loại ra nào cũng
sẽ bị loại ra khỏi nghiên cứu.
Tiêu chí eligibility: được xây dựng dựa trên
Tiền sử bệnh nghiên cứu
Tiêu chí loại ra thường là:
Bệnh nhân có tiền sử mẫn cảm với thuốc nghiên cứu
Bệnh nhân có kháng thuốc
Bệnh nhân thay đổi bệnh
Bệnh nhân có bệnh hiện tại cần điều trị
Trang 13Patient Selection Process
Thường nghiên cứu lâm sàng phải làm đa trung tâm (multicenter trial) để thu thập
đủ mẫu trong thời gian nghiên cứu.
Số site nghiên cứu không được lớn hơn số bệnh nhân thu thập tại mỗi site.
Việc lựa chọn site phải dựa vào:
Trình độ và kinh nghiệm của từng nghiên cứu viên với bệnh nghiên cứu
Tính phù hợp của site nghiên cứu để triển khai nghiên cứu
Sự nhiệt tình, trình độ học vấn, đào tạo và kinh nghiệm của nhân viên tại site
Tính sẵn có của trang thiết bị dụng cụ
Vị trí địa lý
Khả năng thu tuyển và hoàn thành nghiên cứu trong thời hạn của site hoặc của nghiên cứu viên
Việc lựa chọn bệnh nhân trong từng site phải dựa vào:
Dự đoán ban đầu số bệnh nhân có đủ tiêu chuẩn (nghiên cứu viên phải dự đoán dựa trên hồ sơ lưu trữ hoặc có thể qua nghiên cứu pilot trước)
Tầm soát dựa trên tiêu chí chẩn đoán
Thay đổi bệnh của bệnh nhân
Bệnh hiện mắc/thuốc hiện đang sử dụng
Yếu tố tâm lý (nỗi sợ bị nhiễm độc…)
Đồng thuận tham gia nghiên cứu
Trang 14ETHICAL CONSIDERATIONS
For example, in its 1993 revised guidelines for clinical trials, the FDA suggests including in clinical trials women of childbearing potential who
are usually excluded in early drug studies of non-life-threatening disease Since neonates,
infants, and children respond to certain medicines differently than adults, trials of medicines
to be used in this age group are always necessary Therefore, special consideration must
be given to the conduct of trials in children For this purpose, the CPMP
medicines and impaired homeostasis in the elderly.
Note that in the pharmaceutical industry a copy of the final Institutional Review Board
(IRB) approved informed consent form must be provided to the sponsor before
are shipped or enrollment in the study can begin
Trang 15SELECTION OF CONTROLS
Concurrent Control Group: là nhóm chứng được lựa chọn trong cùng dân số với
nhóm can thiệp.
Historical or external control: là nhóm chứng được lựa chọn từ dân số bệnh nhân
mục tiêu khác với dân số mục tiêu của nhóm can thiệp.
Có 4 loại điều trị một bệnh nhân trong nhóm chứng có thể nhận: (1) placebo, (2) không điều trị,(3) liều hoặc công thức khác với thuốc thử nghiệm,(4) sử dụng thuốc hoạt tính khác.
Theo CFR và ICH E10: có 5 nhóm chứng là placebo concurrent control, dose– response concurrent control, active (positive) concurrent control, no-treatment concurrent control, và external control (historical control).
Placebo Concurrent Control
Trang 16STRATIFICATION ISSUES
Nếu các biến số nền có tỷ lệ bằng nhau ở nhóm chứng và nhóm can thiệp, chúng ta
có thể quy kết sự khác biệt giữa hai nhóm về outcome là do treatment Nếu tỷ lệ của hai nhóm ở các biến số nền khác nhau, chúng ta có vấn đề
Cách giải quyết vấn đề này chính là phân tầng phân tích (stratification of analysis)
và hạn chế tối đa sự mất cân bằng giữa hai nhóm (minimization of imbalance between treatment groups).
Trong phân tích phân tầng, các nhóm nhỏ đồng nhất được phân tích riêng biệt Điểm hạn chế của phương pháp này là chỉ phân tích được 1 biến duy nhất
Minimization: trước khi phân nhóm nghiên cứu viên phân loại bệnh nhân theo các yếu tố họ muốn cân bằng sau đó mới phân nhóm treatment ngẫu nhiên.
Số lượng bệnh nhân trong mỗi phân tầng của các yếu tố nền cũng có thể ảnh hưởng đến tính giá trị của kết quả Một nhóm điều trị có 5 còn nhóm còn lại có 7 thì tỷ lệ bệnh nhân là 5/27 và 7/27 mặc dù không có ý nghĩa thống kê khác biệt nhưng tính giá trị của nghiên cứu bị nghi ngờ vì yếu tố đó đóng vai trò quan trọng ảnh hưởng đến hiệu ứng của treatment.
Trang 17EFFICACY ASSESSMENT
Response variable (clinical endpoints): phải có tính giá trị, sẵn có phổ biến, dễ
hiểu và dễ chấp nhận.
Outcome (kết cục): một response variable có thể có nhiều outcome Ví dụ biến
response variable là dysuria (khó tiểu) thì outcome có thể là cure, cure with relapse, treatment failure
Criteria for evaluation of an outcome: tiêu chí đánh giá một outcome ví dụ
outcome là cure thì tiêu chí đánh giá cure sẽ là hết tất cả các triệu chứng.
Sau khi xác định được biến response variable dùng để đánh giá efficacy, chúng ta
cần xác định chính xác các tiêu chí đánh giá sự tham gia của bệnh nhân (the
evaluability of the patients) Nên phân tích intent-to-treat analysis bên cạnh viện
phân tích số lượng bệnh nhân hoàn thành điều trị.
Trang 18SAFETY ASSESSMENT
Tất cả bệnh nhân nhận ít nhất một liều điều trị phải được đưa vào phân tích an toàn.
Biến an toàn chính chính là incidence của AE, được định nghĩa là bất kỳ bệnh, dấu
hiệu hay triệu chứng xuất hiện hoặc tệ hơn trong suốt quá trình nghiên cứu lâm sàng bất kể mối quan hệ nhân quả với thuốc đang nghiên cứu.
Nếu cỡ mẫu đủ lớn thì các AE liên quan đến thuốc nên được kiểm tra quan hệ với liều và liều mg/kg, với phác đồ liều, với thời gian điều trị, với tổng liều, với đặc điểm dân số hoặc với các đặc trưng nền nếu dữ liệu cho phép.
Nếu 0.1< (p) <0.9, thì phân phối nhị giá gần phân phối bình thường.
Nếu p < 0.1, dữ liệu bị lệch còn gọi là phân phối Poisson.
Phải báo cáo 95%CI của p
Trang 19Để so sánh sự khác biệt về tỷ lệ AE giữa hai nhóm thì phải sử dụng phép kiểm chi bình phương hoặc Fisher exact’s test cho dữ liệu nhỏ.
Ongoing Safety Monitoring. all safety issues are tracked andmonitored in order to understand the safety profile of the productunder study significant new safety information will be sharedpromptly with the clinical investigators and any Data and safety
regulatory authorities in accordance with applicable law
Trang 20SAMPLE SIZE ESTIMATION
Xác suất phát hiện đúng sự khác biệt có ý nghĩa lâm sàng được gọi là power of the
clincal trial.
Có thể tăng power của trial bằng cách tăng cỡ mẫu.
Prestudy for power analysis for sample size estimation: thường được thực hiện để đảm bảo trial có được power mong muốn.
Sample size estimation có thể chia thành sample size determination hoặc sample size justification.