DANH MỤC CÁC KÝ HIỆU, CHỮ VIẾT TẮT ADMET Quá trính hấp thu, phân bố, chuyển hóa, thải trừ, độc tính BP Quá trình sinh học Biological Process Cell Component DEG Gene có biểu hiện khác
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO BỘ Y TẾ
TRƯỜNG ĐẠI HỌC DƯỢC HÀ NỘI
NGUYỄN QUỐC DOANH
NGHIÊN CỨU XÁC ĐỊNH ĐÍCH PHÂN TỬ BẰNG PHƯƠNG PHÁP PHÂN TÍCH MẠNG PROTEIN (PPIN) NHẰM ỨNG DỤNG TÌM KIẾM THUỐC
ĐIỆU TRỊ UNG THƯ DẠ DÀY
LUẬN VĂN THẠC SĨ DƯỢC HỌC
HÀ NỘI 2019
Trang 2BỘ GIÁO DỤC VÀ ĐÀO TẠO BỘ Y TẾ
TRƯỜNG ĐẠI HỌC DƯỢC HÀ NỘI
NGUYỄN QUỐC DOANH
NGHIÊN CỨU XÁC ĐỊNH ĐÍCH PHÂN TỬ BẰNG PHƯƠNG PHÁP PHÂN TÍCH MẠNG PROTEIN (PPIN) NHẰM ỨNG DỤNG TÌM KIẾM THUỐC ĐIỆU TRỊ UNG THƯ DẠ DÀY
LUẬN VĂN THẠC SĨ DƯỢC HỌC
Trang 3LỜI CẢM ƠN
Trong suốt quá trình nghiên cứu thực hiện luận văn, tôi đã nhận được sự giúp đỡ tận tình của thầy cô hướng dẫn, các giảng viên, kỹ thuật viên của bộ môn Hóa Dược Với tất cả lòng kính trọng và biết ơn sâu sắc, tôi xin được bày
tỏ lời cảm ơn chân thành tới các thầy cô
Tôi xin cảm ơn thầy TS Phạm Thế Hải là người trực tiếp hướng dẫn chỉ
bảo tận tình, tạo điều kiện thuận lợi và động viên tôi trong suốt quá trình thực
hiện luận văn Cám ơn PGS TS Lê Đức Hậu và TS Lê Thị Thu Hường đã
Trang 4MỤC LỤC
DANH MỤC CÁC KÝ HIỆU, CHỮ VIẾT TẮT
DANH MỤC HÌNH VẼ
DANH MỤC BẢNG
ĐẶT VẤN ĐỀ 1
Chương 1 TỔNG QUAN 3
1.1 Sơ lược quá trình nghiên cứu và phát triển thuốc mới 3
1.2 Xu hướng nghiên cứu thuốc hiện nay 5
1.3 Mạng tương tác protein (PPIN) trong nghiên cứu thuốc mới 6
1.3.1 Thành phần, đặc điểm mạng PPIN 6
1.3.2 Gót chân achille 11
1.4 Quy trình xây dựng và phân tích mạng PPIN 14
1.5 Sàng lọc thuốc hợp lý (virtual screening) 15
1.6 Mô phỏng Protein Docking 17
1.6.1 Tổng quan về phương pháp mô phỏng Protein Docking 17
1.6.2 Quy trình Docking 18
1.7 Ung thư dạ dày (UTDD) 19
1.7.1 Vài nét về dịch tễ học UTDD 19
1.7.2 Điều trị hóa chất trong ung thư dạ dày 20
1.8 Tổng quan một số nghiên cứu chemogenomics trong chuẩn đoán và tìm kiếm thuốc điều trị ung thư dạ dày 23
Chương 2: ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU 25
2.1 Đối tượng nghiên cứu 25
2.1.1 Các ngân hàng dữ liệu về gen, tương tác protein (interactome) và chuyển hóa 25
2.1.2 Dữ liệu về các hợp chất hóa học dùng cho sàng lọc 27
2.2 Các công cụ tính toán 34
Trang 52.2.1 Công cụ tra cứu và phân tích biểu hiện gen trực tuyến 34
2.2.2 Các phần mềm (off-line) phục vụ mô phỏng và phân tích dữ liệu 35
2.3 Thiết bị dùng trong nghiên cứu: 35
2.4 Phương pháp nghiên cứu 35
2.4.1 Phân tích dự đoán gene/protein liên quan đến bệnh 36
2.4.2 Sàng lọc hoạt chất có tác dụng trên đích đã chọn bằng phương pháp Docking phân tử 39
2.4.3 Dự đoán các thông số hóa lý và ADMET của các hợp chất được chọn… 41
Chương 3: KẾT QUẢ NGHIÊN CỨU 44
3.1 Xác định các gen liên quan đến bệnh UTDD 44
3.1.1 Các gen có biểu hiện khác biệt trên tế bào bệnh và tế bào thường 44
3.1.2 Phân tích làm giàu chú giải (Annotation enrichment analysis) 48
3.1.3 Xây dựng và phân tích mạng tương tác protein (PPIN) 62
3.1.4 Phân tích sống còn các hub gene 65
3.2 Sàng lọc một số hợp chất có ái lực cao với đích phân tử 66
3.5.1 Docking phân tử 66
3.5.2 Nghiên cứu tính toán các thông số hoá lý và ADMET 75
Chương 4 BÀN LUẬN 78
4.1 Về phương pháp phân tích mạng PPIN nhằm dự đoán các gene/protein liên quan đến ung thư dạ dày 80
4.2 Về xác định đích phân tử liên quan đến ung thư dạ dày 83
4.3 Về sàng lọc được một số hợp chất có ái lực cao với SPARC và FN1 84
4.4 Ưu điểm của phương pháp nghiên cứu 90
4.5 Nhược điểm phương pháp nghiên cứu 90
KẾT LUẬN VÀ KIẾN NGHỊ 92 TÀI LIỆU THAM KHẢO
PHỤ LỤC
Trang 6DANH MỤC CÁC KÝ HIỆU, CHỮ VIẾT TẮT
ADMET Quá trính hấp thu, phân bố, chuyển hóa, thải trừ, độc tính
BP Quá trình sinh học
(Biological Process)
(Cell Component)
DEG Gene có biểu hiện khác biệt
(Different expression gene)
DNA Deoxyribonucleic Acid
FDA Cục quản lí Thực phẩm và Dược phẩm Hoa Kỳ
(Gene Onology)
KEGG Từ điển bách khoa toàn thư về gen và bộ gen của Kyoto
(Kyoto Encyclopedia of Genes and Genomes)
PPIN Mạng tương tác protein-protein
(protein – protein interaction network)
QSAR Tương quan định lượng cấu trúc-tác dụng
RNA Axit ribonucleic
TPSA Diện tích bề mặt phân cực
(Topological polar surface area)
UTDD Ung thư dạ dày
(gastric cancer)
Trang 7Hình 1.5: Sơ đồ quy trình xây dựng và phân tích mạng sinh
Hình 1.6 Số lượng bài báo về “virtual screening” trong cơ
Hình 1.7 Mô phỏng Docking – một phương pháp nghiên cứu
Hình 2.2 Qui trình tính toán bằng công cụ admetSAR 42 Hình 2.3 Qui trình tính toán bằng công cụ SwissADME 43 Hình 3.1 Biểu đồ dạng núi lửa của các gen trong GSE13911có biểu
Hình 3.2 Biểu đồ dạng núi lửa của các gen trong GSE19826 có biểu
Hình 3.3 Biểu đồ dạng núi lửa của các gen trong GSE54129 có biểu
Hình 3.4 Biểu đồ dạng núi lửa của các gen trong GSE79973 có biểu
Hình 3.5 Đồ thị Venn biểu hiện các gene có biểu hiện khác
Hình 3.6 Vai trò của các gen DEG trên con đường bệnh sinh
Trang 8Hình 3.7 Vai trò của các gen DEG trên con đường bệnh sinh
Hình 3.8 Mạng tương tác PPIN của các gene biểu hiện khác biệt 62
Hình 3.12 Kết quả docking (vị trí và các loại tương tác) trên
SPARC của 3 chất có khả năng gắn vào trung tâm hoạt
động của đích
67
Hình 3.13 Kết quả docking (vị trí và các loại tương tác) trên
FN1 của 3 chất có khả năng gắn vào trung tâm hoạt động
Hình 3.16 Các tương tác của diglycoside atripliside B với
Hình 4.1 : Ảnh cây Actiso và hoạt chất Cynarin 85 Hình 4.2 : Ảnh cây lá móng tay và hoạt chất Daphneside 87 Hình 4.3: Ảnh cây ngũ gia bì hương và hoạt chất
Trang 9Bảng 2.2 Danh sách và cấu trúc hóa học của các hợp chất
tiên nhiên phục vụ nghiên cứu sàng lọc thuốc mới
Bảng 3.6 Năng lượng tương tác giữa Cynarin và 2 đích
Trang 10ĐẶT VẤN ĐỀ
Mặc dù tỷ lệ mắc ung thư dạ dày (gastric cancer, UTDD) trên thế giới
đang có chiều hướng giảm trong những năm gần đây nhờ những bước tiến lớn trong tầm soát, phòng và điều trị, UTDD vẫn được xếp vào nhóm ung thư phổ biến (đứng thứ 5) và gây tử vong cao (đứng thứ 3) trên toàn cầu Có thể nói, nghiên cứu thuốc điều trị ung thư nói chung và ung thư dạ dày nói riêng đang
là một trong những hướng đi cấp bách nhất hiện nay [27]
Trong hai thập kỷ qua, phát triển liệu pháp trúng đích là các phân tử nhỏ
có khả năng tác động vào một đích (protein hay gene liên quan đến ung thư)
là chiến lược nghiên cứu thuốc chủ đạo Cách tiếp cận mang tính cá thể hóa này đã phát huy hiệu quả đối với một số loại ung thư gây nên bởi đột biến trên một đoạn ADN, điển hình như bệnh bạch cầu myeloid cấp tính (AML) Tuy nhiên, UTDD cũng như phần lớn các bệnh ung thư khác không phải do một đột biến đơn lẻ; thay vào đó, ung thư thường phát sinh từ một mạng lưới đột
biến lớn, có tính hệ thống Các phát hiện mới nhất về hệ gen học (genomics)
và hệ protein học (proteomics) đã và đang làm thay đổi cách tiếp cận trúng
đích trong nghiên cứu cứu thuốc điều trị ung thư Hướng tiếp cận đa đích, hay
còn gọi là đa dược lý mạng (polypharmacology network) hiện nhận được sự
quan tâm lớn từ giới khoa học [29] Theo đó, thay vì tìm kiếm hoạt chất tác dụng mạnh và chọn lọc trên một đích cụ thể, ứng viên thành thuốc sẽ có khả
năng can thiệp vào những con đường (pathway) trọng yếu trong chu trình sinh
học của tế bào gây bệnh, từ đó giảm thiểu tỷ lệ kháng thuốc, tăng hiệu quả điều trị, và kiểm soát cũng như dự phòng được tác dụng phụ có thể có
Để làm được điều này, các nhà khoa học phát triển một phương pháp nghiên cứu mới, gọi là dược lý học hệ thống, phương pháp này có thể khái quát thành 2 bước cơ bản: 1 Xác định cơ chế đa đích và 2 Xác định hợp chất hóa học hướng tác dụng đa đích
Trang 11Trong bước đầu tiên, mạng tương tác protein (protein-protein interaction network, PPIN) là một công cụ hữu ích giúp sàng lọc đích mới cũng như tìm
hiểu sâu cơ chế tác dụng của thuốc [65] Mạng PPIN là một sơ đồ graph,
trong đó, các protein đóng vai trò các nút (node) và tương tác giữa chúng (interactome) là các cạnh nối giữa các nút (edge) Tương tác ở đây có thể là các quá trình hoá sinh học như tổng hợp cấu trúc, truyền tín hiệu (signal transduction), vận chuyển (transport) hay phosphoryl hoá… Tầm quan trọng
của một protein được xác định thông qua mức độ thay đổi cấu trúc PPIN khi
bỏ đi một nút trong mạng Dựa trên phân tích PPIN, các đích phân tử cũng như những con đường sinh học trọng yếu trong tế bào gây bệnh sẽ được phát hiện
Trong bước tiếp theo, sau khi xác định được tên và cấu trúc các đích tác dụng, các thư viện hóa học lớn sẽ được sàng lọc sử dụng các phương pháp
hiệu năng cao như tương quan định lượng cấu trúc – tác dụng (quantitative structure-activity relationship, QSAR), protein Docking và động lực học phân
tử (Molecular dynamics) Trong bước này, các phương pháp hóa tin học (cheminformatics) có thể được áp dụng nhằm loại bớt các hợp chất có đặc điểm “không giống thuốc”, trên cơ sở đánh giá các thông số dược động học
(sinh khả dụng, chuyển hóa…) và độc tính
Xuất phát từ những phân tích nêu trên, chúng tôi thực hiện đề tài:
“Nghiên cứu xác định đích phân tử bằng phương pháp phân tích mạng
protein (PPIN) nhằm ứng dụng tìm kiếm thuốc điều trị ung thư dạ dày” với
Trang 12Chương 1 TỔNG QUAN
1.1 Sơ lược quá trình nghiên cứu và phát triển thuốc mới
Quá trình nghiên cứu và phát triển thuốc là một quá trình tốn kém cả về thời gian và tiền bạc Trung bình để ra đời một thuốc mới tiêu tốn hơn 1 tỷ đô
la Mỹ, kéo dài từ 10 đến 15 năm bao gồm nhiều giai đoạn khác nhau Hình 1.1 mô tả các giai đoạn chung của quá trình nghiên cứu và phát triển thuốc
Hình 1.1: Quá trình nghiên cứu phát triển thuốc
Việc nghiên cứu thuốc mới bắt đầu bằng cách tìm hiểu cơ chế bệnh sinh
để nhận biết các “mục tiêu phân tử” hay đích phân tử [49] Đích thường là một cấu trúc đại phân tử (protein), VD như enzyme, kênh xuyên màng Trong giai đoạn này, đích phân tử được chọn phải chính xác, tức là nó có ảnh hưởng lớn đối với quá trình bệnh sinh
Bước tiếp theo là sàng lọc tìm kiếm hoạt chất tiềm năng có thể ức chế hoặc tăng hoạt động của đích phân tử Hàng loạt các chất trong tự nhiên (chiết xuất từ cây cỏ, động vật ) và nhân tạo (tổng hợp hóa học) được tiến hành thử nghiệm trong phòng nghiên cứu trên các mô hình bệnh tật khác nhau, bao gồm cả thiết kế thuốc trên máy tính Mục đích chính là nhằm tìm ra các hoạt
Trang 13chất có tác dụng tốt nhất, liều lượng thấp nhất và an toàn nhất Thống kê chỉ
ra rằng cứ mỗi 10.000 hợp chất được nghiên cứu sàng lọc thì chỉ có duy nhất
1 chất may mắn trở thành ứng viên thuốc tiềm năng (Hình 1.1)
Các hoạt chất tiềm năng sẽ được tiến hành thử nghiệm tiền lâm sàng trên các mô hình động vật (chuột, thỏ, chó…) nhằm xác định khả năng điều trị cũng như độ an toàn của hoạt chất trên cơ thể sống, đặc biệt là cơ thể có hệ thống tương đồng với con người [17]
Ứng viên thành thuốc tiềm năng (có tác dụng tốt trên động vật) sẽ được tiến hành thử nghiệm lâm sàng (pha I, II và III) [53] Pha I thực hiện trên người tình nguyện khỏe mạnh và giai đoạn II-III trên người bệnh với số lượng người tham gia tăng dần (khoảng 50 người cho pha I đến khoảng vài ngàn người cho pha III), nhằm đánh giá hiệu quả, liều lượng cũng như độ an toàn của thuốc
Đăng ký thuốc và đưa ra thị trường: sau khi có đầy đủ các dữ liệu khoa học, thuốc được đăng ký với cơ quan pháp lý, được bảo hộ độc quyền trong khoảng 10 – 15 năm, được sản xuất và bán ra thị trường [50]
Trong vòng 60 năm qua, khoa học công nghệ đang phát triển chóng mặt Tuy nhiên, trong lĩnh vực dược học, số lượng thuốc mới ra đời không hề đột biến Cụ thể, từ năm 1950 tới 2008, có 1222 hoạt chất mới (1103 phân tử hóa
học và 119 hoạt chất sinh học) được FDA (Food and Drug Administration,
Cục quản lý thực phẩm và dược phẩm Hoa Kỳ) chấp thuận, tức chỉ trung bình
21 thuốc mới được ra đời hàng năm [41] Con số này không đủ khi trên thế giới có hàng trăm loại bệnh tật, và nguy hiểm hơn khi những loại bệnh không
có thuốc trị ngày càng gia tăng Gần đây, việc xuất hiện chủng siêu vi khuẩn
Escherichia coli kháng colistin, một loại kháng sinh dự phòng chỉ dành cho vi
khuẩn đã kháng những kháng sinh khác, đã dấy lên một tình trạng báo động trong giới y học [38]
Trang 141.2 Xu hướng nghiên cứu thuốc hiện nay
Nghiên cứu thuốc truyền thống chủ yếu dựa trên kinh nghiệm với cách
tiếp cận “thử và lỗi” (trial and error), dẫn đến chi phí tăng cao và xác suất
thành công thấp Có rất nhiều lý do cản trở sự thành công của quá trình này,
ví dụ như đích tác dụng không đúng, không tìm thấy hoặc tìm thấy hoạt chất không đủ tốt để trở thành thuốc hay các vấn đề liên quan đến dược động học hay độc tính
Trong hơn ba thập kỷ qua, sàng lọc hay thiết kế hợp chất có hoạt tính chọn lọc trên một đích phân tử với mong muốn giảm thiểu tác dụng không mong muốn là hướng đi chủ đạo trong nghiên cứu và phát triển thuốc mới [66] Tuy nhiên, kỷ nguyên hậu genomic đã mở ra một bức tranh vô cùng phức tạp về cơ chế tác dụng của thuốc [37] Công bố của Yildirim và cộng sự năm 2007 đã chỉ ra rằng không chỉ nhiều thuốc có thể gắn với cùng một đích
mà trên thực tế một thuốc có thể tác dụng trên nhiều đích [66] Cơ chế tác dụng đa đích là rất phổ biến trên thuốc kháng ung thư, thuốc điều trị bệnh lý thần kinh, kháng sinh và kháng viêm Năm 2014, David Cook và cộng sự, khi tổng kết các số liệu của các dự án nghiên cứu và phát triển thuốc phân tử nhỏ được thực hiện bởi tập đoàn Dược phẩm Astra Zeneca trong khoảng thời gian
5 năm (2005-2010) đã chỉ ra rằng xác định đúng đích phân tử là yếu tố then
chốt đầu tiên (1-Right target), quyết định thành công của quá trình nghiên cứu
và phát triển thuốc mới [8]
Mặt khác, sự phát triển của khoa học máy tính và đặc biệt là ngành hóa
tin học (cheminformatics), tin sinh học (bioinformatics) đã và đang trở thành
một phần không thể thiếu trong các dự án phát triển thuốc của các tập đoàn
dược phẩm lớn [56], [40] Các phương pháp này (gọi chung là in silico) sử
dụng các công cụ toán học để trích xuất các thông tin hữu ích từ các dữ liệu hỗn độn được thu nhận từ các thí nghiệm hóa, sinh học với lưu lượng mức độ lớn, do đó giúp đẩy nhanh bất kỳ quá trình sàng lọc và tối ưu hóa thuốc mới,
Trang 15đồng thời giảm thiểu chi phí nghiên cứu Ngoài ra, những mô hình mô phỏng hay giả lập còn giúp phát hiện và nâng cao tri thức về các hiện tượng sinh học liên quan đến thuốc ở mức độ phân tử hay thậm chí sâu hơn
1.3 Mạng tương tác protein (PPIN) trong nghiên cứu thuốc mới
Tin sinh học (bioinformatics) là ngành cấu thành bởi hai yếu tố (tin học
và sinh học phân tử), trong đó người ta sử dụng máy tính và tư duy thuật toán
để phân tích, rút trích thông tin và quản lý các dữ liệu liên quan đến sinh học phân tử Trong nghiên cứu thuốc mới, tin sinh học ứng dụng thường thiên về
sinh học hệ thống (systems biology) và phân tích các dữ liệu về tác nhân sinh học liên quan đến bệnh, như nghiên cứu hệ gen (genomics) hay protein (proteomics)
Một trong các lĩnh vực được quan tâm, đó là dự đoán mối quan hệ tương tác giữa các protein tham gia quá trình bệnh sinh dưới dạng mạng tương tác
protein (Protein-protein interaction network, PPIN), từ đó xác định đích phân
tử của thuốc Cách tiếp cận này giúp người nghiên cứu có một cái nhìn tổng quát về cơ chế bệnh sinh, từ đó xây dựng một chiến lược nghiên cứu và phát triển thuốc hiệu quả nhất [5], [12]
1.3.1 Thành phần, đặc điểm mạng PPIN
1.3.1.1 Lý thuyết cơ bản về mạng theo định nghĩa đồ thị (Graph)
Về mặt hình học, mạng PPIN có dạng đồ thị (Graph) biểu diễn cho các
tương tác giữa giữa các protein Để hiểu được cách xây dựng cũng như phân tích mạng PPIN, một số lý thuyết đồ thị sẽ được trình bày tương đối kỹ trong phần này Đồ thị (hay mạng) kí hiệu là G(V,E), gồm hai thành phần:
- Tập hợp V , bao gồm các đối tượng, được gọi là tập hợp các nút (vertex hay node) của đồ thị, trong PPIN V là tập hợp các protein tham gia
trong thành phần mạng
- Tập hợp 2
V
E bao gồm một cặp các nút, được gọi là tập hợp các cạnh
(edge) của đồ thị, biểu diễn mỗi tương quan giữa 2 nút bất kỳ
Trang 16Gọi n và m lần lượt là số nút và số cạnh của đồ thị, trong đó V n,E m
Số lượng các cạnh nối với 1 nút gọi là bậc của nút, thường ký hiệu là d(a)
Các nút trong graph không nhất thiết có bậc như nhau Hình 1.2 biểu diễn một
số đồ thị graph có 5 nút là a, b, c, d và e
Hình 1.2: Các dạng đồ thị Graph: (1) đồ thị vô hướng 5 nút 9
cạnh với 1 cạnh lặp và 2 cạnh song song; (2) đơn đồ thị vô
hướng 5 nút 7 cạnh; (3) đồ thị có hướng 5 nút 9 cạnh
Trong hình 1.2 (1), cạnh (aa) được gọi là cạnh lặp (loop) hay cạnh khuyên Hai cạnh phân biệt tương ứng với 1 cặp nút (b,d) được gọi là hai cạnh song song (parallel edges) Một đồ thị được gọi là một đơn đồ thị (simple graph) nếu nó không có cạnh lặp và cạnh song song (hình 1.2 (2)) Khi đồ thị
có những cặp nút được nối với nhau bằng nhiều hơn một cạnh thì được gọi là
đa đồ thị (multigraph) Mỗi đơn đồ thị là đa đồ thị, nhưng không phải đa đồ
thị nào cũng là đơn đồ thị, vì trong đa đồ thị có thể có hai (hoặc nhiều hơn) cạnh nối một cặp nút nào đó Đồ thị G(V,E) có thể là vô hướng (hình 1.2 (1)
và 1.2 (2)) hoặc có hướng (hình 1.2 (3)) Ngoài ra, các cạnh hoặc/ và các nút cũng có thể mang giá trị trọng số đặc chưng của chúng hay đơn giản chỉ biểu diễn tầm quan trọng (các thuật ngữ khác xem thêm tại [62])
Để lưu trữ đồ thị và thực hiện các thuật toán khác nhau với đồ thị trên máy tính, ta có thể sử dụng cấu trúc của ma trận liền kề để biểu diễn đồ thị,
Trang 17trong đó phổ biến nhất là ma trận liền kề, được định nghĩa như sau Xét đồ thị
vô hướng G có tập nút V = {1, 2… n}, tập cạnh E = {e 1 , e 2 …e m} Ta gọi ma
trận kề của đồ thị G là ma trận: A = {a i,j : i,j = 1, 2… n} với các phần tử được
xác định theo quy tắc sau đây:
a i,j = 0 nếu (i,j) E và
a i,j = 1 nếu (i,j) E, i,j = 1, 2, … n
Để dễ hình dung, xét 2 đồ thị G và H dưới đây:
Hình 1.3 Đồ thị vô hướng G và đồ thị có hướng H
Ma trận liền kề của 2 đồ thị nếu trên là:
Trong đồ thị, đường dẫn là một dãy các nút <x1, x2, … xk> sao cho, mỗi
nút trong dãy (không kể nút đầu tiên) kề với nút trước nó bằng 1 cạnh nào đó,
nghĩa là với mọi i = 1, 2,…k: (x i-1 , x i) E Theo đó, đường dẫn này đi từ đầu x1 đến nút cuối xk, và độ dài của đường dẫn bằng số cạnh nó đi qua
Tồn tại hai cách phát triển mạng chính: ngẫu nhiên (random graph) và
co dãn tự do (scale-free), trong đó các mạng mô tả quá trình sinh học phức tạp
Trang 18(quá trình chuyển hóa trong tế bào, dẫn truyền thần kinh, tương tác của các vật chất di truyền ADN hay ARN trong nhiễm sắc thể) thường phát triển theo cách thứ 2, tức là chỉ có một số ít các nút có bậc lớn hơn nhiều lần so với trung bình số bậc của toàn mạng Các nút này còn gọi là trục/ hub [62]
- Độ trung tâm (centrality) của một nút trong mạng được sử dụng đánh
giá “tầm quan trọng” của nút ấy Có nhiều cách tính độ trung tâm:
o Độ trung tâm dựa trên bậc của nút (degree centrality) Đây là
độ đo chỉ dựa vào bậc của nút và được xác định bằng số cạnh hay số kết nối
mà mỗi nút có Công thức tính như sau: C D (V) = deg(V) Với deg(V) là số
cạnh mà nút đó có [11]
o Độ trung tâm ở giữa (betweenness centrality) chỉ ra vị trí các
nút và vai trò của chúng trong kết nối các thành phần hoặc nhóm trong mạng
Nó định lượng số lần một nút (v) hoạt động như một cầu nối dọc theo đường
dẫn ngắn nhất kết nối giữa hai nút khác trong mạng lưới Hệ số này được tính
bằng công thức C B (v) = ∑ S≠v≠t⸦V (σ st (v)/σ st ) với σ st là tổng số đường dẫn ngắn nhất ngắn nhất từ s tới t mà đi qua nút v [26]
o Độ trung tâm dựa trên sự gần gũi (closeness centrality) chỉ ra
một nút trong mạng có thể tiếp cận nhanh tới nhiều nút khác trong mạng Hệ
số này được tính theo công thức C c (v) = ∑ tc/v d c (vt)/(n-t) với S t⸦V/v d c (v, t) là
Trang 19tổng số đường dẫn ngắn nhất từ nút v tới n-1 nút còn lại, n là số nút trong
mạng [11]
o Độ trung tâm dựa trên giá trị riêng (eigenvalue centrality) chỉ
ra các nút có độ trung tâm nhất dựa trên véc tơ riêng của ma trận mô tả mạng
Nó được tính bằng công thức xv = ( )
1
v M
vt x A
1
1
với A v,t là ma trận
kề của mạng, M(v) là tập nút mà được kết nối với nút thứ v, n là tổng số nút
và λ là một hằng số Với nút có trị số đặc trưng cao chỉ ra nút đó có độ trung tâm cao hơn các nút khác, đồng thời đây cũng là thước đo lợi thế về vị trí
- Phân tích nhóm / cộng đồng (cluster / community): trong một mạng
sinh học, luôn tồn tại các nút có một số đặc trưng giống nhau, chúng được phân vào cùng một nhóm Có rất nhiều thuật toán để có thể tìm kiếm các cộng
đồng trên mạng (community detection) Thuật toán được sử dụng phổ biến
nhất được đề xuất bởi Girvan-Newman Ngoài ra còn có phương pháp
Module cực đại, tìm kiếm dựa trên nhóm (clique) lớn nhất Một thuật toán
được biết tới như một phương thức tự động tìm kiếm những đồ thị con có tính liên kết cao (coi như các cộng đồng) là thuật toán MCODE Thuật toán này có hiệu năng tính toán cao đặc biệt cho các mạng có kích thước lớn [45]
Trong các đặc tính vừa nêu, đáng chú ý nhất là tính co dãn tự do free) của mạng sinh học theo quy luật gắn kết ưu tiên (preferential attachment), như đã được đề cập trong rất nhiều nghiên cứu trước đây Khi
(scale-phát triển theo quy luật này, trong mạng sẽ có một số ít có bậc lớn hơn rất nhiều so với độ bậc trung bình của mạng, chúng tham gia vào một số trục quan trọng đảm bảo dòng chảy liên tục từ nút đầu tới nút cuối của mạng Hệ quả là mạng có sức kháng cự lại những thay đổi bất thường nhưng lại rất dễ bị
tổn thương (vulnerable) đối với những tấn công tọa độ (coordinated attacks)
nghĩa là sự tấn công vào các trục quan trọng Đây chính là điểm mấu chốt của
Trang 20mạng PPIN mà nghiên cứu này khai thác, và sẽ được trình bày cụ thể trong phần tiếp theo
1.3.2 Gót chân achille
Nghiên cứu tính kháng kháng sinh là một ví dụ điển hình Rất nhiều công trình đã được thực hiện nhằm tìm kiếm các đột biến quan trọng quyết định tốc độ và cường độ kháng kháng sinh Một số nghiên cứu tiêu biểu như
của Suzuki et al phân tích mạng gen kháng kháng sinh của E Coli đối với 11 kháng sinh tìm ra 8 đột biến quan trọng (Nat Commun 2014 Dec 17; 5: 5792); hay như Hwang et al khi phân tích mạng gen kháng kháng sinh của trực khuẩn mủ xanh (Pseudomonas aeruginosa) đã phát hiện 13 đột biến (Scientific Reports volume 6, Article number: 26223 (2016)); nghiên cứu của Wang et al., của Parker et al và rất nhiều công trình khác đã cố gắng biểu
diễn một cách tổng quát nhất có thể các đột biến tham gia trong quá trình sinh
học này [54], [18] Tuy nhiên cho tới nay, “điểm chết” (lethal node) của cơ
chế kháng kháng sinh xét trên phương diện di truyền học vẫn là một ẩn số lớn Rõ ràng khi tấn công vào các gen kháng thuốc đã biết, nhiều đường dẫn
có thể bị trục trặc song mạng về toàn cục vẫn hoạt động, những protein không
bị tác động vẫn hoạt động cùng nhau một cách bình thường Đó là vì các
mạng có được tính bền chắc (robustness) Sở dĩ có sự bền chắc như vậy vì
loại bỏ một số nút không ảnh hưởng nhiều đến topo của mạng một cách đáng
kể do các nút đó chứa ít đường nối so với các trục Các phân tích gần đây cho thấy rằng sự loại bỏ một số protein có nhiều liên kết có khả năng giết chết một tế bào hơn là sự loại bỏ các protein khác Các protein này rất quan trọng, nếu chúng bị trục trặc thì vi khuẩn sẽ chết Các đường dẫn như thế chính là
các trục dễ bị tấn công (coordinated attack), và đây chính gót chân Achille
trong mạng PPIN của vi khuẩn Sự loại bỏ một số trục sẽ dẫn đến sự tan rã mạng thành nhiều mạng con không còn tác dụng
Trang 21Tế bào ung thư cũng hoạt động tương tự như vậy, điểm mấu chốt là tìm
ra các protein hub có vai trò trọng yếu bảo tồn cấu trúc tổng thể của mạng PPIN cũng như hoạt động của tế bào ác tính Điều này mở ra hướng đi mới trong việc phát triển các liệu pháp điều trị hiệu quả đối với tế bào ác tính bằng cách chọn những trục nhất định và không can thiệp vào các tổ chức khác Hình 1.4 biểu diễn cách tiếp cận như vậy trong nghiên cứu và phát triển thuốc
Hình 1.4: Minh họa chiến lược can thiệp hiệu quả trong
nghiên cứu thuốc
Theo hình 1.4: (A) Mạng PPIN (tối giản) của các protein tham gia cấu trúc màng tế bào vi khuẩn Các nút màu xanh lá cây là các protein điều hoà
Trang 22hậu giải mã các thành phần cấu tạo nên thành tế bào Các thành phần này (nút màu vàng) sau đó phải tương tác với các protein vận chuyển (nút màu xanh nước biển) để tạo thành phức (nút màu da cam) để sau đó gắn kết với các protein khác trên thành tế bào (nút màu đỏ) Để hình thành vách tế bào cũng như đảm bảo hoạt động bình thường của tế bào, các mối liên hệ giữa các protein phải liên tục Mục tiêu của phương pháp chemogenomics ở đây là xác định 5 vị trí trên PPIN cần can thiệp sao cho con đường tổng hợp vách tế bào
bị ngắt quãng (B) Nếu xoá đi 5 điểm bất kỳ như trường hợp này không gây được hiệu ứng gì vì vẫn tồn tại con đường liên tục từ xanh lá cây tới đỏ (C)
Việc xoá đi 3 nút (hub protein) có bậc cao nhất và 2 nút có vị trí trung gian
quan trọng nhất tỏ ra là một chiến lược hợp lý trong trường hợp này Không một tương tác quan trọng nào còn tồn tại và vi khuẩn không thể tổng hợp được vách tế bào Như vậy việc tác động ngẫu nhiên trên đích phân tử không thể ảnh hưởng lên tính toàn vẹn của cấu trúc mạng, do đó không hiệu quả Việc xoá đi các nút đơn hay kể cả các nút trung gian ở đây cũng không ngăn được sự sản sinh ra các nút đỏ và hiệu quả cũng sẽ thấp Ngoài cách can thiệp như trường hợp C vẫn tồn tại các giải pháp khác, cũng hiệu quả trong phá vỡ cấu trúc mạng PPIN như xoá tổ hợp ABJGH, AFJGH, AFJKH… Bài toán đặt
ra cho nghiên cứu thuốc mới là cần xác định đâu là cơ chế tác dụng cần hướng đến trên mạng PPIN và thiết kế cũng như sàng lọc ra các phân tử hoá học nào có khả năng can thiệp vào những con đường trọng yếu trong chu trình sinh học của tế bào gây bệnh, từ đó sẽ có hiệu quả tối đa trong điều trị [67] Tuy nhiên để “tấn công tọa độ”, một số vấn đề cần làm rõ: Nếu các tương tác giữa nhiều nút vận hành sai lệch trong một hệ di truyền học thì điều này đã dẫn đến ung thư như thế nào? Có bao nhiêu trục là quan trọng thiết yếu? Đây cũng là những thành phần chính trong một nghiên cứu đa dược lý
mạng (network polypharmacology) trong ung thư [69]
Trang 231.4 Quy trình xây dựng và phân tích mạng PPIN
Quy trình xây dựng và phân tích mạng PPIN nói chung gồm 4 bước cơ bản:
Hình 1.5: Sơ đồ quy trình xây dựng và phân tích mạng sinh
học
Bước 1: Xác định các protein chức năng (dựa trên các gen mã hóa chúng)
(seed proteins) tham gia vào cơ chế bệnh sinh Đây là các nút tham gia cấu
trúc trong mạng PPIN [39]
Bước 2: Thu thập tương tác protein-protein (interactome) Hầu như tương tác
của các protein đã biết đều nằm trong một số cơ sở dữ liệu sinh học như STRING, UniHi và BioGRIP Trong một số trường hợp, có thể tiến hành các thực nghiệm để xác định các tương tác protein cần quan tâm, như sàng lọc thể
lai hai mảnh Y2H (two-hybrid screening) [39]
Bước 3: Xây dựng cấu trúc mạng PPIN
Trang 24Các thông tin về các protein tham gia cơ chế bệnh sinh (các nút) và các tương tác giữa chúng (các cạnh) khi kết hợp lại tạo thành mạng tương tác giữa các protein dạng Graph Để phân tích cấu trúc và hiển thị có thể dử dụng một
số công cụ tin sinh học như CYTOSCAPE, IGRAPH, GEPHI, NETWORK X [39]
Bước 4: phân tích cấu trúc mạng với mục đích chính để tìm ra các nút hub
(đây có thể là các đích tiềm năng), thường phân tích theo 2 phương pháp:
phân tích trung tâm và phân tích cụm [13]
Sau bước 4: Đưa ra giả thuyết và kiểm chứng về vai trò của các nút hub trong
cơ chế bệnh sinh, từ đó tìm kếm thông tin các protein mã hóa và ứng dụng trong nghiên cứu và phát triển thuốc mới
1.5 Sàng lọc thuốc hợp lý (virtual screening)
Các khái niệm về sàng lọc hợp lý xuất hiện vào những năm 60 của thế kỷ
XX với các mô hình của Hansch Từ đầu thập niên 90 thì lĩnh vực này bắt đầu
có nhiều bước tiến và từ đó đến nay, ngày càng phát triển mạnh mẽ Sàng lọc
ảo tương đối rẻ (tiết kiệm nguyên liệu thử), nhanh và cho phép làm việc với
số lượng lớn lên tới hàng triệu hợp chất (hiệu năng cao), một điều không thể làm được trong các mô hình thực nghiệm Sàng lọc ảo không những bổ sung cho các sàng lọc thật mà còn giúp định hướng quá trình nghiên cứu tổng hợp / phân lập hợp chất mới [36]
Trong một khảo sát cơ sở dữ liệu của Scopus (https://www.scopus.com/)
sử dụng từ khóa tìm kiếm “virtual screening” từ 1974 đến cuối 2015, chúng
tôi nhận thấy số lượng các bài báo về sàng lọc ảo tăng lên hàng năm, nhất là
từ sau năm 2000, phản ánh rõ xu hướng ứng dụng ngày càng phổ biến các kỹ thuật sàng lọc ảo trong nghiên cứu và phát triển thuốc mới Hình 1.6 biểu diễn
số lượng các công bố từ năm 2000 bởi vì từ năm này số lượng bài báo đã vượt hơn 100 bài/năm
Trang 25Hình 1.6 Số lượng bài báo về “virtual screening” trong cơ sở
dữ liệu Scopus theo năm công bố
Trong các nghiên cứu sàng lọc ảo, việc tìm kiếm các hợp chất mới có thể
được tiến hành dựa trên cấu tử (ligand-based) hay dựa trên cấu trúc mục tiêu (structure-based)
Với phương pháp sàng lọc dựa trên cấu tử, thông tin cấu trúc của các hợp chất hóa học đã biết trước hoạt tính được khai thác để xây dựng các mô hình toán học, cho phép dự đoán hoạt tính (định tính hoặc định lượng) dựa trên mối tương quan định lượng giữa cấu trúc và tác dụng Các mô hình như
vậy được gọi chung là mô hình QSAR (Quantitative Structure-Activity Relationship) Gần đây, các phương pháp tìm kiếm đồng dạng (similarity searching) đang được sử dụng ngày càng nhiều, nhất là trong việc sàng lọc
tác dụng mới cho các thuốc đã biết [33]
Sàng lọc dựa trên cấu trúc mục tiêu được tiến hành khi có đầy đủ thông tin về đích phân tử, đặc biệt là cấu trúc tinh thể Các kỹ thuật phổ biến được
sử dụng là động lực học phân tử (molecular dynamics, MD), phương pháp
năng lượng tự do dựa trên mô phỏng Monte Carlo và protein Docking Hiện nay, xu hướng chung là kết hợp hai cách tiếp cận (dựa trên cấu trúc và cấu tử) trong sàng lọc hợp lý nhằm giảm thiểu những hạn chế của từng phương pháp
Trang 261.6 Mô phỏng Protein Docking
Hình 1.7 Mô phỏng Docking – một phương pháp nghiên cứu
thuốc dựa trên cấu trúc đích phân tử
1.6.1 Tổng quan về phương pháp mô phỏng Protein Docking
Phương pháp Protein docking ra đời từ những năm 1980, được sử dụng phổ biến trong quá trình thiết kế thuốc dựa trên cấu trúc với khả năng dự đoán
sự hình thành liên kết của cấu tử với receptor trong túi liên kết với độ chính xác khá cao [20] Không những chỉ ra được các liên kết có ý nghĩa, docking còn có thể định lượng khả năng tương tác thông qua các hàm tính điểm, qua
đó phân hạng các liên kết mạnh yếu của các cấu tử [21] Nhờ ưu điểm thực hiện trên máy tính với tốc độ càng ngày càng nhanh và chính xác, Protein docking dần được coi là bước khởi đầu cho nghiên cứu thiết kế thuốc hiện đại
Docking thực chất là một bài toán tối ưu, tìm vị trí và cấu hình phù hợp nhất của một cơ chất gắn kết lên protein Về mặt nhiệt động lực học, mục tiêu chính của docking là tìm ra cấu hình mà năng lượng tự do của toàn hệ là thấp nhất, tương đương với cấu hình bền nhất sau khi tạo thành liên kết giữa phối
tử và protein Để tìm cấu hình phù hợp nhất, cần liên hệ cấu hình không gian
Trang 27với các trị số đánh giá được khả năng gắn kết của cơ chất lên protein và sau
đó áp dụng thuật toán tìm kiếm [21]
Chương trình docking sử dụng các hàm tính điểm (scoring function) để
lượng giá khả năng liên kết của phức hợp cấu tử - receptor Năng lượng này được cho bởi hằng số liên kết (Kd) và năng lượng tự do Gibbs (ΔGL) Dự đoán về năng lượng liên kết được thực hiện bằng cách đánh giá những tương tác hóa lý quan trọng bao gồm: các tương tác liên phân tử, các ảnh hưởng solvat và entropy [21] Do đó, số lượng các tham số hoá lý được đánh giá càng lớn thì độ chính xác càng cao Tuy nhiên, nếu số lượng biến càng lớn thì thời gian tính toán sẽ càng lâu Các hàm tính điểm hiệu quả nên đưa ra sự cân bằng giữa độ chính xác và tốc độ
1.6.2 Quy trình Docking
Quá trình docking được thực hiện thông qua ba bước: chuẩn bị cấu tử, chuẩn bị protein, mô phỏng docking
Bước 1: Chuẩn bị cấu tử
Các cấu trúc được vẽ trên phần mềm ChemDraw Sau khi xây dựng được cấu trúc 3D, sử dụng phần mềm MOE để xử lí cấu tử theo các bước: chỉnh sửa điện tích cho phù hợp, tối giản hóa năng lượng, gắn trường lực cho phân tử
Bước 2: Chuẩn bị protein
Cấu trúc 3D của protein thường có sẵn trên ngân hàng dữ liệu protein
(protein data bank, https://www.rcsb.org/) Trong trường hợp chưa có sẵn,
chúng ta có thể xây dựng cấu trúc 3D theo phương pháp mô hình hóa tương
đồng (Homology modeling) [63] Lý thuyết cơ bản của phương pháp mô hình
hóa tương đồng là sắp xếp chuỗi amino acid của protein thu được bởi quá trình giải mã gen lên khung cấu trúc bậc 3 của protein có độ phân giải cao
nhưng thiếu thông tin của toàn bộ amino acid
Trang 28Sau khi có cấu trúc 3D, sử dùng các phần mềm để chuẩn bị protein cho chương trình mô phỏng docking Các bước chuẩn bị thường gồm: loại nước
và các cấu tử (nếu có), thêm hydro, gắn trường lực, phân tích vùng có khả năng tương tác…
Bước 3: Mô phỏng docking
Trước khi tiến hành mô phỏng, cần sử dụng phần mềm để tìm kiếm túi tương tác trên protein để đánh giá khả năng liên kết của phối tử tại vị trí đó
Vị trí của vùng tìm kiếm thông thường sẽ được đặt ở trung tâm hoạt động của protein Khi quá trình docking được tiến hành, phần mềm sẽ tự động tìm kiếm cấu dạng phù hợp nhất của phối tử, tương ứng với năng lượng của toàn hệ thấp nhất Cấu dạng này cùng với các tương tác sẽ được phân tích bởi các phần mềm chuyên dụng như: MOE, Discovery studio
1.7 Ung thư dạ dày (UTDD)
1.7.1 Vài nét về dịch tễ học UTDD
UTDD là một trong các loại ung thư phổ biến nhất trên thế giới và đứng hàng đầu trong số các ung thư đường tiêu hóa Tỷ lệ mắc bệnh có xu hướng giảm dần ở các nước phát triển (Châu Âu, Bắc Mỹ), ngược lại có xu hướng tăng dần ở các nước châu Á
Tại Việt Nam, UTDD đang là vấn đề y tế lớn trong nhân dân, đặc biệt là
ở nam giới trên 40 tuổi Theo WHO, tỷ lệ mắc UTDD ở nước ta là 18,9/100.000 dân, ước tính mỗi năm nước ta có 15.000 – 20.000 người mới mắc [1]
UTDD rất khó chẩn đoán và phát hiện sớm, tỷ lệ mắc bệnh của nam giới lại cao hơn nữ giới Những năm gần đây, bệnh ngày càng có xu hướng trẻ hóa Dự báo đến năm 2020, cứ 100.000 nam giới thì 25 người mắc UTDD Việc chẩn đoán ung thư thường gặp nhiều khó khăn, khoảng 70% bệnh nhân phát hiện ở giai đoạn muộn
Trang 29Cho đến nay nguyên nhân gây ra UTDD vẫn chưa rõ ràng, tuy nhiên các yếu tố nguy cơ lại được xác định khá cụ thể, bao gồm: [47]
- Loạn sản dạ dày mức độ nặng: thường gặp ở các thể viêm, loét dạ dày
mạn với loạn sản tuyến Khoảng 10% có thể tiến đến UTDD sau 5 đến 15 năm
- Một nghiên cứu theo dõi trong nhiều năm cho thấy việc loại trừ vi khuẩn
Helicobacter pylori (Hp) giúp giảm tới 40% nguy cơ UTDD
- Yếu tố di truyền: Polyp dạng tuyến có tính gia đình (Familial
adenomatous polyposis, FAP) Nhiều nghiên cứu chỉ ra rằng trong gia
đình có bố mẹ, anh chị em ruột bị ung thư dạ dày thì những thành viên còn lại cũng có nguy cơ bị UTDD cao hơn hẳn những người khác
- Biến chứng từ các bệnh khác liên quan tới dạ dày gây nên ví dụ như:
viêm gan mạn tính, loét dạ dày tá tràng, suy gan, xơ gan…
- Môi trường sống: môi trường sống bị ô nhiễm nặng, tiếp xúc với các hóa
chất hay chất phóng xạ độc hại cũng có thể là nguyên nhân gây nên bệnh ung thư dạ dày
- Thói quen ăn uống không hợp vệ sinh hoặc ăn nhiều thực phẩm có nguy
cơ mắc bệnh UTDD cao như đồ nướng, đồ chiên, rán…
- Sinh hoạt không hợp lý: quá căng thẳng, mệt mỏi thường xuyên trong
công việc cuộc sống, thường xuyên thức đêm cũng là một trong những yếu tố gián tiếp gây nên bệnh UTDD
- Sử dụng một số chất gây hại cho dạ dày: như rượu, bia, thuốc lá… Các
chất làm tiêu lớp chất nhầy bảo vệ dạ dày, chất cồn khi tiếp xúc thường xuyên với niêm mạc dạ dày cũng có xu hướng là biến đổi các tế bào này
và có thể dẫn tới UTDD
1.7.2 Điều trị hóa chất trong ung thư dạ dày
Hoá trị liệu là phương pháp sử dụng các thuốc gây độc trên tế bào nhằm tiêu diệt các tế bào ung thư trong người bệnh Trong điều trị UTDD, phẫu
Trang 30thuật luôn là ưu tiên hàng đầu Hóa trị thường được áp dụng kết hợp với xạ trị
và phẫu thuật nhằm loại bỏ các tế bào ung thư còn lại sau khi xạ trị và phẫu thuật Ngoài ra, hóa trị cũng được dùng nhằm kéo dài sự sống khi các tế bào ung thư đã di căn, và nó giúp làm giảm sự đau đớn khi các khối u tác động lên người bệnh [1]
Trong những năm gần đây, những tiến bộ về y-dược học đã cho ra đời nhiều loại thuốc điều trị ung thư góp phần cải thiện chất lượng sống và tuổi thọ cho bệnh nhân Tuy nhiên, các thuốc điều trị UTDD độc tính rất cao, đặc biệt trên các mô hay các tổ chức phân chia nhanh như tuỷ xương, niêm mạc tiêu hoá… Do vậy, việc phối hợp thuốc trong điều trị UTDD góp phần làm tăng hiệu quả điều trị đồng thời giảm độc tính của thuốc qua đó cải thiện chất lượng sống cho người bệnh [1]
Hiện nay, có thể chia các thuốc dùng trong hoá trị liệu UTDD thành 6 nhóm (Bảng 1.1)
Bảng 1.1: Các nhóm thuốc sử dụng trong hoá trị liệu ung thư dạ dày
Nhóm thuốc Cơ chế tác dụng Tác dụng phụ Thuốc
Nhóm Alkyl
hoá
Tác động lên DNA tế bào bằng các phản ứng thế, liên kết chéo… làm thay đổi thông tin trên DNA dẫn đến đột biến hoặc chết tế bào
Gây suy tuỷ, buồn nôn, viêm thần kinh ngoại
vi, tổn thương thận và thính giác
Cisplatin, Oxaliplatin
Nhóm chống
chuyển hoá
Thuốc có cấu trúc tương tự các chất chuyển hoá của quá trình tổn hợp acid nucleic, qua
đó, ức chế enzyme tổng hợp acid nucleic hoặc gắn với acid
Suy tuỷ, suy thận, xơ gan, loét dạ dày, rối loạn vận động
Metrotrexat, 5-
Fluorouracil Capecitabin
Trang 31nucleic làm sai mã ức chế tổng hợp DNA, gây chết tế bào
Nhóm kháng
sinh chống
ung thư
Ức chế sự tổng hợp và chức năng của acid nucleic
Sốc phản vệ, rụng tóc, suy tuỷ, viêm phổi, nhồi máu cơ tim, buồn nôn-nôn
Bleomycin, Doxorubicin Epirubicin, Mitomycin
Nhóm taxan
Là sản phẩm tự nhiên/bán tổng hợp từ thông đỏ có tác dụng ổn định quá trình polymer thành vi quản, ức chế
sự gián phân của tế bào
Nhóm ức chế
topoisomerase
I
Ức chế topoisomerase I – enzym cần cho sự tháo xoắn DNA- do đó ức chế phiên mã
Suy tuỷ, nôn, tiêu chảy, chán
Suy tuỷ, buồn nôn, hội chứng giả cúm
Etoposid
Các phác đồ phối hợp đa hoá trị liệu cho hiệu quả điều trị cao hơn và giảm được độc tính trên người bệnh Trong lâm sàng hiện nay có khá nhiều phác đồ được áp dụng với các đối tượng bệnh nhân khác nhau, giúp cải thiện chất lượng cuộc sống và kéo dài tuổi thọ, ví dụ như công thức FAM, công thức kết hợp 5-Fluorouracil với Acid Folinique, công thức ELF, EAP, DCF, ECF…
Trang 321.8 Tổng quan một số nghiên cứu chemogenomics trong chuẩn đoán và tìm kiếm thuốc điều trị ung thư dạ dày
Dự án Bản đồ gen người (Human Genome Project – HGP), do GS
James Watson khởi xướng và hoàn thành năm 2003 được xem là công trình thế kỷ, mở ra một kỷ nguyên mới trong nỗ lực chinh phục bệnh tật con người Hơn ba tỷ ký tự của mã di truyền tạo nên ADN của con người và khoảng
25000 gen đã được xác định Căn cứ trên số lượng mã hóa, ước tính khoảng
5000 protein tham gia vào quá trình bệnh sinh trên cơ thể người, chúng đều có thể được xem là mục tiêu phân tử tiềm năng mà các thuốc nhắm tới Tuy nhiên, các thuốc được nghiên cứu và phát triển trong hơn 100 năm qua chỉ
gắn kết vào khoảng 500 trong số các protein này! Câu hỏi đặt ra là: làm thế nào ngành công nghiệp dược có thể khai thác hiệu quả và biến các thông tin thu thập từ bộ gen người thành thuốc trị bệnh? Ngành nghiên cứu
chemogenomics ra đời với mục đích giải quyết phần thứ hai của câu hỏi trên
Chemogenomics, hiểu theo nghĩa rộng, là việc phát hiện và phân tích mối liên quan giữa bất kỳ hợp chất hoá học nào đối với tất cả các đích phân tử của
chúng Để làm được điều này không chỉ đòi hỏi công nghệ tính toán hiệu năng cao mà còn phải thay đổi cả cách tiếp cận trong nghiên cứu và phát triển
thuốc mới
Điểm qua một số nghiên cứu chenogenomics trong tìm kiếm dấu ấn sinh
học (biomarkers) phục vụ chuẩn đoán sớm UTDD, sàng lọc đích phân tử hay
con đường bệnh sinh mà một thuốc điều trị UTDD có thể can thiệp, có thể thấy, các nghiên cứu dạng này vẫn còn rất ít, nhưng số lượng có xu hướng
tăng trong 5 năm trở lại đây Một số nghiên cứu nổi bật gần đây như năm
2013, nhóm nghiên cứu của B Wu cùng cộng sự đã nghiên cứu đặc điểm gene HMGB3 và vai trò của chúng trong ung thư dạ dày tiến triển [15] Năm
2015, Jian T và Chen Y đã ứng dụng tin sinh trong nghiên cứu cơ chế điều tiết các yếu tố phiên mã và gene mục tiêu trên ung thư dạ dày [23] Năm 2017,
Trang 33Myung JK và cộng sự tiến hành nghiên cứu Calgranulin B và thực hiện phân tích mạng PPIN trong UTDD qua đó đã cung cấp những kiến thức về vài trò của protein này [30] Năm 2018, Yuan L và cộng sự đã nghiên cứu về UTDD kháng các thuốc nhóm cisplatin, dựa vào công cụ tin sinh để tìm ra một số dấu ấn sinh học mới trong nhóm ung thư này [10] Trong khi đó, việc sàng lọc hợp lý thuốc hiện vẫn đang tập trung vào nhóm đích cũ (VD topoisomerase I,
NF-κB…) và tổng hợp các dẫn xuất dựa trên các khung cấu trúc đã biết như
5-fluorouracil, curcuminoid
Trang 34Chương 2: ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU
2.1 Đối tượng nghiên cứu
2.1.1 Các ngân hàng dữ liệu về gen, tương tác protein (interactome) và chuyển hóa
- Dữ liệu microarray (Microarrays data): 4 bộ dữ liệu microarray mang
thông tin trình tự gene của bệnh nhân ung thư dạ dày, với nhóm bệnh
và nhóm chứng thu được từ ngân hàng dữ liệu Gene Expression Omnibus (GEO)
Bảng 2.1 Mô tả 4 cơ sở dữ liệu biểu hiện gen liên quan đến ung thư
STT Mã số dữ
1 GSE13911
- Ngày công bố 18-12-2008
- Nền tảng (platform): GeneChip® (Affymetrix)
- Thuộc dự án nghiên cứu biểu hiện phiên mã của các khối u dạ dày nguyên phát và các mẫu bình thường thu được từ mô lân cận của D'Errico
và cộng sự
- Các mẫu bệnh phẩm được lấy từ bệnh nhân ung thư dạ dày ở Florence (Ý) và được phân loại theo phân loại của Lauren
- Số lượng mẫu giải trình tự gen:
+ 31 mẫu bình thường + 38 mẫu ung thư dạ dày
IRBM (MERK)
2 GSE19826
- Ngày công bố 12-1-2010
- Nền tảng (platform): GeneChip® (Affymetrix)
- Nghiên cứu tương quan tăng biểu hiện phiên
mã INHBA và tỷ lệ sống sót của bệnh nhân ung
Wang et
al
Trang 35thư dạ dày của Wang và cộng sự
- Các mẫu bệnh phẩm được lấy từ bệnh nhân ung thư dạ dày Trung Quốc đang điều trị tại Bệnh viện Nhân dân Đệ nhất Thượng Hải trong giai đoạn 2004-2006 và được phân loại theo mô hình UICC pTNM (1997)
- Số lượng mẫu giải trình tự gen:
+ 15 mẫu bình thường + 12 mẫu ung thư dạ dày
3 GSE54129
- Ngày công bố 15-1-2017
- Nền tảng (platform): GeneChip® (Affymetrix)
- Nghiên cứu phân tích biểu hiện gen của ung thư dạ dày bằng microarray oligonucleotide mật
độ cao của Liu và cộng sự
- Các mẫu bệnh phẩm được lấy trực tiếp từ khối
u của 111 bệnh nhân ung thư dạ dày điều trị tại Bệnh viện Ruijin, Thượng Hải, Trung Quốc
Mẫu đối chiếu thu được qua sinh thiết dạ dày 21 người tình nguyện Trung Quốc
- Số lượng mẫu giải trình tự gen:
+ 21 mẫu bình thường + 111 mẫu ung thư dạ dày
Liu et al
4 GSE79973
- Ngày công bố 7-4-2016
- Nền tảng (platform): GeneChip® (Affymetrix)
- Nghiên cứu điều hòa giảm phiên mã ALDOB (fructose-bisphosphate aldolase) và ảnh hưởng làm giảm khả năng chuẩn đoán trên bệnh nhân
He et al
Trang 36ung thư dạ dày của He và cộng sự
- Các mẫu bệnh phẩm được lấy từ bệnh nhân ung thư dạ dày điều trị tại Bệnh viện Nhân dân tỉnh Chiết Giang, Trung Quốc
- Số lượng mẫu giải trình tự gen:
+ 10 mẫu bình thường + 10 mẫu ung thư dạ dày
2.1.2 Dữ liệu về các hợp chất hóa học dùng cho sàng lọc
- 48 hợp chất tự nhiên Việt Nam được thu thập từ các nghiên cứu chiết, tách đã công bố trên các tạp chí trong nước và quốc tế Các hợp chất được lựa chọn sàng lọc hoạt tính là các chất từng được công bố tác
dụng kháng ung thư và kháng viêm in vitro
Bảng 2.2 Danh sách và cấu trúc hóa học của các hợp chất
tiên nhiên phục vụ nghiên cứu sàng lọc thuốc mới
26
Lucidadiol
Nấm linh chi
Trang 37phong,
Engelhardtia chrysolepis Hance
Vàng nhựa,
Garcinia vilersiana
Còng mù-U
Calophyllum inophyllum
L
Acanthus ilicifolius
Acanthopa nax
trifoliatus (L.) Voss
30
Ganoderiol F
Nấm linh chi
Ganoderm
a lucidum
6 (+)-5-Methoxypurpurin 31 Ganodermadiol
Trang 387
(+)-Eudesmin
Xuân hoa đỏ
Pseuderanth emum
34
điehydroandrographoli
liên
Andrograp his
Trang 39tinctoria Linn
frutescens var crispa
a Roxb Ex Hornem
14
Cynarin
Actiso
Cynara scolymus 39
Hidropiperosides A
Nghế răm
Trang 4015
Laudanidin
Khổ sâm Bắc bộ
Brucea tonkinensis
40
dimethoxyxanthone
(Z)-3-Hexenyl-1-O-β-Mại liễu,
Arachnoth ryx
leucophyll
a
Bù dẻ tía
Uvaria grandiflor
a Roxb Ex Hornem
18 Astilbin
Sói rừng,
Sarcandra glabra
Lãnh công gân hoe
43
dimethoxy-9,10-anthraquinone
1,3-Dihydroxy-2,4-Thảo quyết minh
Senna obtusifolia