Nghiên cứu xác định đích phân tử bằng phương pháp phân tích mạng protein (PPIN) nhằm ứng dụng tìm kiếm thuốc điều trị ung thư dạ dày

DANH MỤC CÁC KÝ HIỆU, CHỮ VIẾT TẮT ADMET Quá trính hấp thu, phân bố, chuyển hóa, thải trừ, độc tính BP Quá trình sinh học Biological Process Cell Component DEG Gene có biểu hiện khác

Trang 1

BỘ GIÁO DỤC VÀ ĐÀO TẠO BỘ Y TẾ

TRƯỜNG ĐẠI HỌC DƯỢC HÀ NỘI

NGUYỄN QUỐC DOANH

NGHIÊN CỨU XÁC ĐỊNH ĐÍCH PHÂN TỬ BẰNG PHƯƠNG PHÁP PHÂN TÍCH MẠNG PROTEIN (PPIN) NHẰM ỨNG DỤNG TÌM KIẾM THUỐC

ĐIỆU TRỊ UNG THƯ DẠ DÀY

LUẬN VĂN THẠC SĨ DƯỢC HỌC

HÀ NỘI 2019

Trang 2

BỘ GIÁO DỤC VÀ ĐÀO TẠO BỘ Y TẾ

TRƯỜNG ĐẠI HỌC DƯỢC HÀ NỘI

NGUYỄN QUỐC DOANH

NGHIÊN CỨU XÁC ĐỊNH ĐÍCH PHÂN TỬ BẰNG PHƯƠNG PHÁP PHÂN TÍCH MẠNG PROTEIN (PPIN) NHẰM ỨNG DỤNG TÌM KIẾM THUỐC ĐIỆU TRỊ UNG THƯ DẠ DÀY

LUẬN VĂN THẠC SĨ DƯỢC HỌC

Trang 3

LỜI CẢM ƠN

Trong suốt quá trình nghiên cứu thực hiện luận văn, tôi đã nhận được sự giúp đỡ tận tình của thầy cô hướng dẫn, các giảng viên, kỹ thuật viên của bộ môn Hóa Dược Với tất cả lòng kính trọng và biết ơn sâu sắc, tôi xin được bày

tỏ lời cảm ơn chân thành tới các thầy cô

Tôi xin cảm ơn thầy TS Phạm Thế Hải là người trực tiếp hướng dẫn chỉ

bảo tận tình, tạo điều kiện thuận lợi và động viên tôi trong suốt quá trình thực

hiện luận văn Cám ơn PGS TS Lê Đức Hậu và TS Lê Thị Thu Hường đã

Trang 4

MỤC LỤC

DANH MỤC CÁC KÝ HIỆU, CHỮ VIẾT TẮT

DANH MỤC HÌNH VẼ

DANH MỤC BẢNG

ĐẶT VẤN ĐỀ 1

Chương 1 TỔNG QUAN 3

1.1 Sơ lược quá trình nghiên cứu và phát triển thuốc mới 3

1.2 Xu hướng nghiên cứu thuốc hiện nay 5

1.3 Mạng tương tác protein (PPIN) trong nghiên cứu thuốc mới 6

1.3.1 Thành phần, đặc điểm mạng PPIN 6

1.3.2 Gót chân achille 11

1.4 Quy trình xây dựng và phân tích mạng PPIN 14

1.5 Sàng lọc thuốc hợp lý (virtual screening) 15

1.6 Mô phỏng Protein Docking 17

1.6.1 Tổng quan về phương pháp mô phỏng Protein Docking 17

1.6.2 Quy trình Docking 18

1.7 Ung thư dạ dày (UTDD) 19

1.7.1 Vài nét về dịch tễ học UTDD 19

1.7.2 Điều trị hóa chất trong ung thư dạ dày 20

1.8 Tổng quan một số nghiên cứu chemogenomics trong chuẩn đoán và tìm kiếm thuốc điều trị ung thư dạ dày 23

Chương 2: ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU 25

2.1 Đối tượng nghiên cứu 25

2.1.1 Các ngân hàng dữ liệu về gen, tương tác protein (interactome) và chuyển hóa 25

2.1.2 Dữ liệu về các hợp chất hóa học dùng cho sàng lọc 27

2.2 Các công cụ tính toán 34

Trang 5

2.2.1 Công cụ tra cứu và phân tích biểu hiện gen trực tuyến 34

2.2.2 Các phần mềm (off-line) phục vụ mô phỏng và phân tích dữ liệu 35

2.3 Thiết bị dùng trong nghiên cứu: 35

2.4 Phương pháp nghiên cứu 35

2.4.1 Phân tích dự đoán gene/protein liên quan đến bệnh 36

2.4.2 Sàng lọc hoạt chất có tác dụng trên đích đã chọn bằng phương pháp Docking phân tử 39

2.4.3 Dự đoán các thông số hóa lý và ADMET của các hợp chất được chọn… 41

Chương 3: KẾT QUẢ NGHIÊN CỨU 44

3.1 Xác định các gen liên quan đến bệnh UTDD 44

3.1.1 Các gen có biểu hiện khác biệt trên tế bào bệnh và tế bào thường 44

3.1.2 Phân tích làm giàu chú giải (Annotation enrichment analysis) 48

3.1.3 Xây dựng và phân tích mạng tương tác protein (PPIN) 62

3.1.4 Phân tích sống còn các hub gene 65

3.2 Sàng lọc một số hợp chất có ái lực cao với đích phân tử 66

3.5.1 Docking phân tử 66

3.5.2 Nghiên cứu tính toán các thông số hoá lý và ADMET 75

Chương 4 BÀN LUẬN 78

4.1 Về phương pháp phân tích mạng PPIN nhằm dự đoán các gene/protein liên quan đến ung thư dạ dày 80

4.2 Về xác định đích phân tử liên quan đến ung thư dạ dày 83

4.3 Về sàng lọc được một số hợp chất có ái lực cao với SPARC và FN1 84

4.4 Ưu điểm của phương pháp nghiên cứu 90

4.5 Nhược điểm phương pháp nghiên cứu 90

KẾT LUẬN VÀ KIẾN NGHỊ 92 TÀI LIỆU THAM KHẢO

PHỤ LỤC

Trang 6

DANH MỤC CÁC KÝ HIỆU, CHỮ VIẾT TẮT

ADMET Quá trính hấp thu, phân bố, chuyển hóa, thải trừ, độc tính

BP Quá trình sinh học

(Biological Process)

(Cell Component)

DEG Gene có biểu hiện khác biệt

(Different expression gene)

DNA Deoxyribonucleic Acid

FDA Cục quản lí Thực phẩm và Dược phẩm Hoa Kỳ

(Gene Onology)

KEGG Từ điển bách khoa toàn thư về gen và bộ gen của Kyoto

(Kyoto Encyclopedia of Genes and Genomes)

PPIN Mạng tương tác protein-protein

(protein – protein interaction network)

QSAR Tương quan định lượng cấu trúc-tác dụng

RNA Axit ribonucleic

TPSA Diện tích bề mặt phân cực

(Topological polar surface area)

UTDD Ung thư dạ dày

(gastric cancer)

Trang 7

Hình 1.5: Sơ đồ quy trình xây dựng và phân tích mạng sinh

Hình 1.6 Số lượng bài báo về “virtual screening” trong cơ

Hình 1.7 Mô phỏng Docking – một phương pháp nghiên cứu

Hình 2.2 Qui trình tính toán bằng công cụ admetSAR 42 Hình 2.3 Qui trình tính toán bằng công cụ SwissADME 43 Hình 3.1 Biểu đồ dạng núi lửa của các gen trong GSE13911có biểu

Hình 3.2 Biểu đồ dạng núi lửa của các gen trong GSE19826 có biểu

Hình 3.5 Đồ thị Venn biểu hiện các gene có biểu hiện khác

Hình 3.6 Vai trò của các gen DEG trên con đường bệnh sinh

Trang 8

Hình 3.7 Vai trò của các gen DEG trên con đường bệnh sinh

Hình 3.8 Mạng tương tác PPIN của các gene biểu hiện khác biệt 62

Hình 3.12 Kết quả docking (vị trí và các loại tương tác) trên

SPARC của 3 chất có khả năng gắn vào trung tâm hoạt

động của đích

67

Hình 3.13 Kết quả docking (vị trí và các loại tương tác) trên

FN1 của 3 chất có khả năng gắn vào trung tâm hoạt động

Hình 3.16 Các tương tác của diglycoside atripliside B với

Hình 4.1 : Ảnh cây Actiso và hoạt chất Cynarin 85 Hình 4.2 : Ảnh cây lá móng tay và hoạt chất Daphneside 87 Hình 4.3: Ảnh cây ngũ gia bì hương và hoạt chất

Trang 9

Bảng 2.2 Danh sách và cấu trúc hóa học của các hợp chất

tiên nhiên phục vụ nghiên cứu sàng lọc thuốc mới

Bảng 3.6 Năng lượng tương tác giữa Cynarin và 2 đích

Trang 10

ĐẶT VẤN ĐỀ

Mặc dù tỷ lệ mắc ung thư dạ dày (gastric cancer, UTDD) trên thế giới

đang có chiều hướng giảm trong những năm gần đây nhờ những bước tiến lớn trong tầm soát, phòng và điều trị, UTDD vẫn được xếp vào nhóm ung thư phổ biến (đứng thứ 5) và gây tử vong cao (đứng thứ 3) trên toàn cầu Có thể nói, nghiên cứu thuốc điều trị ung thư nói chung và ung thư dạ dày nói riêng đang

là một trong những hướng đi cấp bách nhất hiện nay [27]

Trong hai thập kỷ qua, phát triển liệu pháp trúng đích là các phân tử nhỏ

có khả năng tác động vào một đích (protein hay gene liên quan đến ung thư)

là chiến lược nghiên cứu thuốc chủ đạo Cách tiếp cận mang tính cá thể hóa này đã phát huy hiệu quả đối với một số loại ung thư gây nên bởi đột biến trên một đoạn ADN, điển hình như bệnh bạch cầu myeloid cấp tính (AML) Tuy nhiên, UTDD cũng như phần lớn các bệnh ung thư khác không phải do một đột biến đơn lẻ; thay vào đó, ung thư thường phát sinh từ một mạng lưới đột

biến lớn, có tính hệ thống Các phát hiện mới nhất về hệ gen học (genomics)

và hệ protein học (proteomics) đã và đang làm thay đổi cách tiếp cận trúng

đích trong nghiên cứu cứu thuốc điều trị ung thư Hướng tiếp cận đa đích, hay

còn gọi là đa dược lý mạng (polypharmacology network) hiện nhận được sự

quan tâm lớn từ giới khoa học [29] Theo đó, thay vì tìm kiếm hoạt chất tác dụng mạnh và chọn lọc trên một đích cụ thể, ứng viên thành thuốc sẽ có khả

năng can thiệp vào những con đường (pathway) trọng yếu trong chu trình sinh

học của tế bào gây bệnh, từ đó giảm thiểu tỷ lệ kháng thuốc, tăng hiệu quả điều trị, và kiểm soát cũng như dự phòng được tác dụng phụ có thể có

Để làm được điều này, các nhà khoa học phát triển một phương pháp nghiên cứu mới, gọi là dược lý học hệ thống, phương pháp này có thể khái quát thành 2 bước cơ bản: 1 Xác định cơ chế đa đích và 2 Xác định hợp chất hóa học hướng tác dụng đa đích

Trang 11

Trong bước đầu tiên, mạng tương tác protein (protein-protein interaction network, PPIN) là một công cụ hữu ích giúp sàng lọc đích mới cũng như tìm

hiểu sâu cơ chế tác dụng của thuốc [65] Mạng PPIN là một sơ đồ graph,

trong đó, các protein đóng vai trò các nút (node) và tương tác giữa chúng (interactome) là các cạnh nối giữa các nút (edge) Tương tác ở đây có thể là các quá trình hoá sinh học như tổng hợp cấu trúc, truyền tín hiệu (signal transduction), vận chuyển (transport) hay phosphoryl hoá… Tầm quan trọng

của một protein được xác định thông qua mức độ thay đổi cấu trúc PPIN khi

bỏ đi một nút trong mạng Dựa trên phân tích PPIN, các đích phân tử cũng như những con đường sinh học trọng yếu trong tế bào gây bệnh sẽ được phát hiện

Trong bước tiếp theo, sau khi xác định được tên và cấu trúc các đích tác dụng, các thư viện hóa học lớn sẽ được sàng lọc sử dụng các phương pháp

hiệu năng cao như tương quan định lượng cấu trúc – tác dụng (quantitative structure-activity relationship, QSAR), protein Docking và động lực học phân

tử (Molecular dynamics) Trong bước này, các phương pháp hóa tin học (cheminformatics) có thể được áp dụng nhằm loại bớt các hợp chất có đặc điểm “không giống thuốc”, trên cơ sở đánh giá các thông số dược động học

(sinh khả dụng, chuyển hóa…) và độc tính

Xuất phát từ những phân tích nêu trên, chúng tôi thực hiện đề tài:

“Nghiên cứu xác định đích phân tử bằng phương pháp phân tích mạng

protein (PPIN) nhằm ứng dụng tìm kiếm thuốc điều trị ung thư dạ dày” với

Trang 12

Chương 1 TỔNG QUAN

1.1 Sơ lược quá trình nghiên cứu và phát triển thuốc mới

Quá trình nghiên cứu và phát triển thuốc là một quá trình tốn kém cả về thời gian và tiền bạc Trung bình để ra đời một thuốc mới tiêu tốn hơn 1 tỷ đô

la Mỹ, kéo dài từ 10 đến 15 năm bao gồm nhiều giai đoạn khác nhau Hình 1.1 mô tả các giai đoạn chung của quá trình nghiên cứu và phát triển thuốc

Hình 1.1: Quá trình nghiên cứu phát triển thuốc

Việc nghiên cứu thuốc mới bắt đầu bằng cách tìm hiểu cơ chế bệnh sinh

để nhận biết các “mục tiêu phân tử” hay đích phân tử [49] Đích thường là một cấu trúc đại phân tử (protein), VD như enzyme, kênh xuyên màng Trong giai đoạn này, đích phân tử được chọn phải chính xác, tức là nó có ảnh hưởng lớn đối với quá trình bệnh sinh

Bước tiếp theo là sàng lọc tìm kiếm hoạt chất tiềm năng có thể ức chế hoặc tăng hoạt động của đích phân tử Hàng loạt các chất trong tự nhiên (chiết xuất từ cây cỏ, động vật ) và nhân tạo (tổng hợp hóa học) được tiến hành thử nghiệm trong phòng nghiên cứu trên các mô hình bệnh tật khác nhau, bao gồm cả thiết kế thuốc trên máy tính Mục đích chính là nhằm tìm ra các hoạt

Trang 13

chất có tác dụng tốt nhất, liều lượng thấp nhất và an toàn nhất Thống kê chỉ

ra rằng cứ mỗi 10.000 hợp chất được nghiên cứu sàng lọc thì chỉ có duy nhất

1 chất may mắn trở thành ứng viên thuốc tiềm năng (Hình 1.1)

Các hoạt chất tiềm năng sẽ được tiến hành thử nghiệm tiền lâm sàng trên các mô hình động vật (chuột, thỏ, chó…) nhằm xác định khả năng điều trị cũng như độ an toàn của hoạt chất trên cơ thể sống, đặc biệt là cơ thể có hệ thống tương đồng với con người [17]

Ứng viên thành thuốc tiềm năng (có tác dụng tốt trên động vật) sẽ được tiến hành thử nghiệm lâm sàng (pha I, II và III) [53] Pha I thực hiện trên người tình nguyện khỏe mạnh và giai đoạn II-III trên người bệnh với số lượng người tham gia tăng dần (khoảng 50 người cho pha I đến khoảng vài ngàn người cho pha III), nhằm đánh giá hiệu quả, liều lượng cũng như độ an toàn của thuốc

Đăng ký thuốc và đưa ra thị trường: sau khi có đầy đủ các dữ liệu khoa học, thuốc được đăng ký với cơ quan pháp lý, được bảo hộ độc quyền trong khoảng 10 – 15 năm, được sản xuất và bán ra thị trường [50]

Trong vòng 60 năm qua, khoa học công nghệ đang phát triển chóng mặt Tuy nhiên, trong lĩnh vực dược học, số lượng thuốc mới ra đời không hề đột biến Cụ thể, từ năm 1950 tới 2008, có 1222 hoạt chất mới (1103 phân tử hóa

học và 119 hoạt chất sinh học) được FDA (Food and Drug Administration,

Cục quản lý thực phẩm và dược phẩm Hoa Kỳ) chấp thuận, tức chỉ trung bình

21 thuốc mới được ra đời hàng năm [41] Con số này không đủ khi trên thế giới có hàng trăm loại bệnh tật, và nguy hiểm hơn khi những loại bệnh không

có thuốc trị ngày càng gia tăng Gần đây, việc xuất hiện chủng siêu vi khuẩn

Escherichia coli kháng colistin, một loại kháng sinh dự phòng chỉ dành cho vi

khuẩn đã kháng những kháng sinh khác, đã dấy lên một tình trạng báo động trong giới y học [38]

Trang 14

1.2 Xu hướng nghiên cứu thuốc hiện nay

Nghiên cứu thuốc truyền thống chủ yếu dựa trên kinh nghiệm với cách

tiếp cận “thử và lỗi” (trial and error), dẫn đến chi phí tăng cao và xác suất

thành công thấp Có rất nhiều lý do cản trở sự thành công của quá trình này,

ví dụ như đích tác dụng không đúng, không tìm thấy hoặc tìm thấy hoạt chất không đủ tốt để trở thành thuốc hay các vấn đề liên quan đến dược động học hay độc tính

Trong hơn ba thập kỷ qua, sàng lọc hay thiết kế hợp chất có hoạt tính chọn lọc trên một đích phân tử với mong muốn giảm thiểu tác dụng không mong muốn là hướng đi chủ đạo trong nghiên cứu và phát triển thuốc mới [66] Tuy nhiên, kỷ nguyên hậu genomic đã mở ra một bức tranh vô cùng phức tạp về cơ chế tác dụng của thuốc [37] Công bố của Yildirim và cộng sự năm 2007 đã chỉ ra rằng không chỉ nhiều thuốc có thể gắn với cùng một đích

mà trên thực tế một thuốc có thể tác dụng trên nhiều đích [66] Cơ chế tác dụng đa đích là rất phổ biến trên thuốc kháng ung thư, thuốc điều trị bệnh lý thần kinh, kháng sinh và kháng viêm Năm 2014, David Cook và cộng sự, khi tổng kết các số liệu của các dự án nghiên cứu và phát triển thuốc phân tử nhỏ được thực hiện bởi tập đoàn Dược phẩm Astra Zeneca trong khoảng thời gian

5 năm (2005-2010) đã chỉ ra rằng xác định đúng đích phân tử là yếu tố then

chốt đầu tiên (1-Right target), quyết định thành công của quá trình nghiên cứu

và phát triển thuốc mới [8]

Mặt khác, sự phát triển của khoa học máy tính và đặc biệt là ngành hóa

tin học (cheminformatics), tin sinh học (bioinformatics) đã và đang trở thành

một phần không thể thiếu trong các dự án phát triển thuốc của các tập đoàn

dược phẩm lớn [56], [40] Các phương pháp này (gọi chung là in silico) sử

dụng các công cụ toán học để trích xuất các thông tin hữu ích từ các dữ liệu hỗn độn được thu nhận từ các thí nghiệm hóa, sinh học với lưu lượng mức độ lớn, do đó giúp đẩy nhanh bất kỳ quá trình sàng lọc và tối ưu hóa thuốc mới,

Trang 15

đồng thời giảm thiểu chi phí nghiên cứu Ngoài ra, những mô hình mô phỏng hay giả lập còn giúp phát hiện và nâng cao tri thức về các hiện tượng sinh học liên quan đến thuốc ở mức độ phân tử hay thậm chí sâu hơn

1.3 Mạng tương tác protein (PPIN) trong nghiên cứu thuốc mới

Tin sinh học (bioinformatics) là ngành cấu thành bởi hai yếu tố (tin học

và sinh học phân tử), trong đó người ta sử dụng máy tính và tư duy thuật toán

để phân tích, rút trích thông tin và quản lý các dữ liệu liên quan đến sinh học phân tử Trong nghiên cứu thuốc mới, tin sinh học ứng dụng thường thiên về

sinh học hệ thống (systems biology) và phân tích các dữ liệu về tác nhân sinh học liên quan đến bệnh, như nghiên cứu hệ gen (genomics) hay protein (proteomics)

Một trong các lĩnh vực được quan tâm, đó là dự đoán mối quan hệ tương tác giữa các protein tham gia quá trình bệnh sinh dưới dạng mạng tương tác

protein (Protein-protein interaction network, PPIN), từ đó xác định đích phân

tử của thuốc Cách tiếp cận này giúp người nghiên cứu có một cái nhìn tổng quát về cơ chế bệnh sinh, từ đó xây dựng một chiến lược nghiên cứu và phát triển thuốc hiệu quả nhất [5], [12]

1.3.1 Thành phần, đặc điểm mạng PPIN

1.3.1.1 Lý thuyết cơ bản về mạng theo định nghĩa đồ thị (Graph)

Về mặt hình học, mạng PPIN có dạng đồ thị (Graph) biểu diễn cho các

tương tác giữa giữa các protein Để hiểu được cách xây dựng cũng như phân tích mạng PPIN, một số lý thuyết đồ thị sẽ được trình bày tương đối kỹ trong phần này Đồ thị (hay mạng) kí hiệu là G(V,E), gồm hai thành phần:

- Tập hợp V , bao gồm các đối tượng, được gọi là tập hợp các nút (vertex hay node) của đồ thị, trong PPIN V là tập hợp các protein tham gia

trong thành phần mạng

- Tập hợp 2

V

E bao gồm một cặp các nút, được gọi là tập hợp các cạnh

(edge) của đồ thị, biểu diễn mỗi tương quan giữa 2 nút bất kỳ

Trang 16

Gọi n và m lần lượt là số nút và số cạnh của đồ thị, trong đó V n,E m

Số lượng các cạnh nối với 1 nút gọi là bậc của nút, thường ký hiệu là d(a)

Các nút trong graph không nhất thiết có bậc như nhau Hình 1.2 biểu diễn một

số đồ thị graph có 5 nút là a, b, c, d và e

Hình 1.2: Các dạng đồ thị Graph: (1) đồ thị vô hướng 5 nút 9

cạnh với 1 cạnh lặp và 2 cạnh song song; (2) đơn đồ thị vô

hướng 5 nút 7 cạnh; (3) đồ thị có hướng 5 nút 9 cạnh

Trong hình 1.2 (1), cạnh (aa) được gọi là cạnh lặp (loop) hay cạnh khuyên Hai cạnh phân biệt tương ứng với 1 cặp nút (b,d) được gọi là hai cạnh song song (parallel edges) Một đồ thị được gọi là một đơn đồ thị (simple graph) nếu nó không có cạnh lặp và cạnh song song (hình 1.2 (2)) Khi đồ thị

có những cặp nút được nối với nhau bằng nhiều hơn một cạnh thì được gọi là

đa đồ thị (multigraph) Mỗi đơn đồ thị là đa đồ thị, nhưng không phải đa đồ

thị nào cũng là đơn đồ thị, vì trong đa đồ thị có thể có hai (hoặc nhiều hơn) cạnh nối một cặp nút nào đó Đồ thị G(V,E) có thể là vô hướng (hình 1.2 (1)

và 1.2 (2)) hoặc có hướng (hình 1.2 (3)) Ngoài ra, các cạnh hoặc/ và các nút cũng có thể mang giá trị trọng số đặc chưng của chúng hay đơn giản chỉ biểu diễn tầm quan trọng (các thuật ngữ khác xem thêm tại [62])

Để lưu trữ đồ thị và thực hiện các thuật toán khác nhau với đồ thị trên máy tính, ta có thể sử dụng cấu trúc của ma trận liền kề để biểu diễn đồ thị,

Trang 17

trong đó phổ biến nhất là ma trận liền kề, được định nghĩa như sau Xét đồ thị

vô hướng G có tập nút V = {1, 2… n}, tập cạnh E = {e 1 , e 2 …e m} Ta gọi ma

trận kề của đồ thị G là ma trận: A = {a i,j : i,j = 1, 2… n} với các phần tử được

xác định theo quy tắc sau đây:

a i,j = 0 nếu (i,j) E và

a i,j = 1 nếu (i,j) E, i,j = 1, 2, … n

Để dễ hình dung, xét 2 đồ thị G và H dưới đây:

Hình 1.3 Đồ thị vô hướng G và đồ thị có hướng H

Ma trận liền kề của 2 đồ thị nếu trên là:

Trong đồ thị, đường dẫn là một dãy các nút <x1, x2, … xk> sao cho, mỗi

nút trong dãy (không kể nút đầu tiên) kề với nút trước nó bằng 1 cạnh nào đó,

nghĩa là với mọi i = 1, 2,…k: (x i-1 , x i) E Theo đó, đường dẫn này đi từ đầu x1 đến nút cuối xk, và độ dài của đường dẫn bằng số cạnh nó đi qua

Tồn tại hai cách phát triển mạng chính: ngẫu nhiên (random graph) và

co dãn tự do (scale-free), trong đó các mạng mô tả quá trình sinh học phức tạp

Trang 18

(quá trình chuyển hóa trong tế bào, dẫn truyền thần kinh, tương tác của các vật chất di truyền ADN hay ARN trong nhiễm sắc thể) thường phát triển theo cách thứ 2, tức là chỉ có một số ít các nút có bậc lớn hơn nhiều lần so với trung bình số bậc của toàn mạng Các nút này còn gọi là trục/ hub [62]

- Độ trung tâm (centrality) của một nút trong mạng được sử dụng đánh

giá “tầm quan trọng” của nút ấy Có nhiều cách tính độ trung tâm:

o Độ trung tâm dựa trên bậc của nút (degree centrality) Đây là

độ đo chỉ dựa vào bậc của nút và được xác định bằng số cạnh hay số kết nối

mà mỗi nút có Công thức tính như sau: C D (V) = deg(V) Với deg(V) là số

cạnh mà nút đó có [11]

o Độ trung tâm ở giữa (betweenness centrality) chỉ ra vị trí các

nút và vai trò của chúng trong kết nối các thành phần hoặc nhóm trong mạng

Nó định lượng số lần một nút (v) hoạt động như một cầu nối dọc theo đường

dẫn ngắn nhất kết nối giữa hai nút khác trong mạng lưới Hệ số này được tính

bằng công thức C B (v) = ∑ S≠v≠t⸦V (σ st (v)/σ st ) với σ st là tổng số đường dẫn ngắn nhất ngắn nhất từ s tới t mà đi qua nút v [26]

o Độ trung tâm dựa trên sự gần gũi (closeness centrality) chỉ ra

một nút trong mạng có thể tiếp cận nhanh tới nhiều nút khác trong mạng Hệ

số này được tính theo công thức C c (v) = ∑ tc/v d c (vt)/(n-t) với S t⸦V/v d c (v, t) là

Trang 19

tổng số đường dẫn ngắn nhất từ nút v tới n-1 nút còn lại, n là số nút trong

mạng [11]

o Độ trung tâm dựa trên giá trị riêng (eigenvalue centrality) chỉ

ra các nút có độ trung tâm nhất dựa trên véc tơ riêng của ma trận mô tả mạng

Nó được tính bằng công thức xv =  ( )

1

v M

vt x A

1

 với A v,t là ma trận

kề của mạng, M(v) là tập nút mà được kết nối với nút thứ v, n là tổng số nút

và λ là một hằng số Với nút có trị số đặc trưng cao chỉ ra nút đó có độ trung tâm cao hơn các nút khác, đồng thời đây cũng là thước đo lợi thế về vị trí

- Phân tích nhóm / cộng đồng (cluster / community): trong một mạng

sinh học, luôn tồn tại các nút có một số đặc trưng giống nhau, chúng được phân vào cùng một nhóm Có rất nhiều thuật toán để có thể tìm kiếm các cộng

đồng trên mạng (community detection) Thuật toán được sử dụng phổ biến

nhất được đề xuất bởi Girvan-Newman Ngoài ra còn có phương pháp

Module cực đại, tìm kiếm dựa trên nhóm (clique) lớn nhất Một thuật toán

được biết tới như một phương thức tự động tìm kiếm những đồ thị con có tính liên kết cao (coi như các cộng đồng) là thuật toán MCODE Thuật toán này có hiệu năng tính toán cao đặc biệt cho các mạng có kích thước lớn [45]

Trong các đặc tính vừa nêu, đáng chú ý nhất là tính co dãn tự do free) của mạng sinh học theo quy luật gắn kết ưu tiên (preferential attachment), như đã được đề cập trong rất nhiều nghiên cứu trước đây Khi

(scale-phát triển theo quy luật này, trong mạng sẽ có một số ít có bậc lớn hơn rất nhiều so với độ bậc trung bình của mạng, chúng tham gia vào một số trục quan trọng đảm bảo dòng chảy liên tục từ nút đầu tới nút cuối của mạng Hệ quả là mạng có sức kháng cự lại những thay đổi bất thường nhưng lại rất dễ bị

tổn thương (vulnerable) đối với những tấn công tọa độ (coordinated attacks)

nghĩa là sự tấn công vào các trục quan trọng Đây chính là điểm mấu chốt của

Trang 20

mạng PPIN mà nghiên cứu này khai thác, và sẽ được trình bày cụ thể trong phần tiếp theo

1.3.2 Gót chân achille

Nghiên cứu tính kháng kháng sinh là một ví dụ điển hình Rất nhiều công trình đã được thực hiện nhằm tìm kiếm các đột biến quan trọng quyết định tốc độ và cường độ kháng kháng sinh Một số nghiên cứu tiêu biểu như

của Suzuki et al phân tích mạng gen kháng kháng sinh của E Coli đối với 11 kháng sinh tìm ra 8 đột biến quan trọng (Nat Commun 2014 Dec 17; 5: 5792); hay như Hwang et al khi phân tích mạng gen kháng kháng sinh của trực khuẩn mủ xanh (Pseudomonas aeruginosa) đã phát hiện 13 đột biến (Scientific Reports volume 6, Article number: 26223 (2016)); nghiên cứu của Wang et al., của Parker et al và rất nhiều công trình khác đã cố gắng biểu

diễn một cách tổng quát nhất có thể các đột biến tham gia trong quá trình sinh

học này [54], [18] Tuy nhiên cho tới nay, “điểm chết” (lethal node) của cơ

chế kháng kháng sinh xét trên phương diện di truyền học vẫn là một ẩn số lớn Rõ ràng khi tấn công vào các gen kháng thuốc đã biết, nhiều đường dẫn

có thể bị trục trặc song mạng về toàn cục vẫn hoạt động, những protein không

bị tác động vẫn hoạt động cùng nhau một cách bình thường Đó là vì các

mạng có được tính bền chắc (robustness) Sở dĩ có sự bền chắc như vậy vì

loại bỏ một số nút không ảnh hưởng nhiều đến topo của mạng một cách đáng

kể do các nút đó chứa ít đường nối so với các trục Các phân tích gần đây cho thấy rằng sự loại bỏ một số protein có nhiều liên kết có khả năng giết chết một tế bào hơn là sự loại bỏ các protein khác Các protein này rất quan trọng, nếu chúng bị trục trặc thì vi khuẩn sẽ chết Các đường dẫn như thế chính là

các trục dễ bị tấn công (coordinated attack), và đây chính gót chân Achille

trong mạng PPIN của vi khuẩn Sự loại bỏ một số trục sẽ dẫn đến sự tan rã mạng thành nhiều mạng con không còn tác dụng

Trang 21

Tế bào ung thư cũng hoạt động tương tự như vậy, điểm mấu chốt là tìm

ra các protein hub có vai trò trọng yếu bảo tồn cấu trúc tổng thể của mạng PPIN cũng như hoạt động của tế bào ác tính Điều này mở ra hướng đi mới trong việc phát triển các liệu pháp điều trị hiệu quả đối với tế bào ác tính bằng cách chọn những trục nhất định và không can thiệp vào các tổ chức khác Hình 1.4 biểu diễn cách tiếp cận như vậy trong nghiên cứu và phát triển thuốc

Hình 1.4: Minh họa chiến lược can thiệp hiệu quả trong

nghiên cứu thuốc

Theo hình 1.4: (A) Mạng PPIN (tối giản) của các protein tham gia cấu trúc màng tế bào vi khuẩn Các nút màu xanh lá cây là các protein điều hoà

Trang 22

hậu giải mã các thành phần cấu tạo nên thành tế bào Các thành phần này (nút màu vàng) sau đó phải tương tác với các protein vận chuyển (nút màu xanh nước biển) để tạo thành phức (nút màu da cam) để sau đó gắn kết với các protein khác trên thành tế bào (nút màu đỏ) Để hình thành vách tế bào cũng như đảm bảo hoạt động bình thường của tế bào, các mối liên hệ giữa các protein phải liên tục Mục tiêu của phương pháp chemogenomics ở đây là xác định 5 vị trí trên PPIN cần can thiệp sao cho con đường tổng hợp vách tế bào

bị ngắt quãng (B) Nếu xoá đi 5 điểm bất kỳ như trường hợp này không gây được hiệu ứng gì vì vẫn tồn tại con đường liên tục từ xanh lá cây tới đỏ (C)

Việc xoá đi 3 nút (hub protein) có bậc cao nhất và 2 nút có vị trí trung gian

quan trọng nhất tỏ ra là một chiến lược hợp lý trong trường hợp này Không một tương tác quan trọng nào còn tồn tại và vi khuẩn không thể tổng hợp được vách tế bào Như vậy việc tác động ngẫu nhiên trên đích phân tử không thể ảnh hưởng lên tính toàn vẹn của cấu trúc mạng, do đó không hiệu quả Việc xoá đi các nút đơn hay kể cả các nút trung gian ở đây cũng không ngăn được sự sản sinh ra các nút đỏ và hiệu quả cũng sẽ thấp Ngoài cách can thiệp như trường hợp C vẫn tồn tại các giải pháp khác, cũng hiệu quả trong phá vỡ cấu trúc mạng PPIN như xoá tổ hợp ABJGH, AFJGH, AFJKH… Bài toán đặt

ra cho nghiên cứu thuốc mới là cần xác định đâu là cơ chế tác dụng cần hướng đến trên mạng PPIN và thiết kế cũng như sàng lọc ra các phân tử hoá học nào có khả năng can thiệp vào những con đường trọng yếu trong chu trình sinh học của tế bào gây bệnh, từ đó sẽ có hiệu quả tối đa trong điều trị [67] Tuy nhiên để “tấn công tọa độ”, một số vấn đề cần làm rõ: Nếu các tương tác giữa nhiều nút vận hành sai lệch trong một hệ di truyền học thì điều này đã dẫn đến ung thư như thế nào? Có bao nhiêu trục là quan trọng thiết yếu? Đây cũng là những thành phần chính trong một nghiên cứu đa dược lý

mạng (network polypharmacology) trong ung thư [69]

Trang 23

1.4 Quy trình xây dựng và phân tích mạng PPIN

Quy trình xây dựng và phân tích mạng PPIN nói chung gồm 4 bước cơ bản:

Hình 1.5: Sơ đồ quy trình xây dựng và phân tích mạng sinh

học

Bước 1: Xác định các protein chức năng (dựa trên các gen mã hóa chúng)

(seed proteins) tham gia vào cơ chế bệnh sinh Đây là các nút tham gia cấu

trúc trong mạng PPIN [39]

Bước 2: Thu thập tương tác protein-protein (interactome) Hầu như tương tác

của các protein đã biết đều nằm trong một số cơ sở dữ liệu sinh học như STRING, UniHi và BioGRIP Trong một số trường hợp, có thể tiến hành các thực nghiệm để xác định các tương tác protein cần quan tâm, như sàng lọc thể

lai hai mảnh Y2H (two-hybrid screening) [39]

Bước 3: Xây dựng cấu trúc mạng PPIN

Trang 24

Các thông tin về các protein tham gia cơ chế bệnh sinh (các nút) và các tương tác giữa chúng (các cạnh) khi kết hợp lại tạo thành mạng tương tác giữa các protein dạng Graph Để phân tích cấu trúc và hiển thị có thể dử dụng một

số công cụ tin sinh học như CYTOSCAPE, IGRAPH, GEPHI, NETWORK X [39]

Bước 4: phân tích cấu trúc mạng với mục đích chính để tìm ra các nút hub

(đây có thể là các đích tiềm năng), thường phân tích theo 2 phương pháp:

phân tích trung tâm và phân tích cụm [13]

Sau bước 4: Đưa ra giả thuyết và kiểm chứng về vai trò của các nút hub trong

cơ chế bệnh sinh, từ đó tìm kếm thông tin các protein mã hóa và ứng dụng trong nghiên cứu và phát triển thuốc mới

1.5 Sàng lọc thuốc hợp lý (virtual screening)

Các khái niệm về sàng lọc hợp lý xuất hiện vào những năm 60 của thế kỷ

XX với các mô hình của Hansch Từ đầu thập niên 90 thì lĩnh vực này bắt đầu

có nhiều bước tiến và từ đó đến nay, ngày càng phát triển mạnh mẽ Sàng lọc

ảo tương đối rẻ (tiết kiệm nguyên liệu thử), nhanh và cho phép làm việc với

số lượng lớn lên tới hàng triệu hợp chất (hiệu năng cao), một điều không thể làm được trong các mô hình thực nghiệm Sàng lọc ảo không những bổ sung cho các sàng lọc thật mà còn giúp định hướng quá trình nghiên cứu tổng hợp / phân lập hợp chất mới [36]

Trong một khảo sát cơ sở dữ liệu của Scopus (https://www.scopus.com/)

sử dụng từ khóa tìm kiếm “virtual screening” từ 1974 đến cuối 2015, chúng

tôi nhận thấy số lượng các bài báo về sàng lọc ảo tăng lên hàng năm, nhất là

từ sau năm 2000, phản ánh rõ xu hướng ứng dụng ngày càng phổ biến các kỹ thuật sàng lọc ảo trong nghiên cứu và phát triển thuốc mới Hình 1.6 biểu diễn

số lượng các công bố từ năm 2000 bởi vì từ năm này số lượng bài báo đã vượt hơn 100 bài/năm

Trang 25

Hình 1.6 Số lượng bài báo về “virtual screening” trong cơ sở

dữ liệu Scopus theo năm công bố

Trong các nghiên cứu sàng lọc ảo, việc tìm kiếm các hợp chất mới có thể

được tiến hành dựa trên cấu tử (ligand-based) hay dựa trên cấu trúc mục tiêu (structure-based)

Với phương pháp sàng lọc dựa trên cấu tử, thông tin cấu trúc của các hợp chất hóa học đã biết trước hoạt tính được khai thác để xây dựng các mô hình toán học, cho phép dự đoán hoạt tính (định tính hoặc định lượng) dựa trên mối tương quan định lượng giữa cấu trúc và tác dụng Các mô hình như

vậy được gọi chung là mô hình QSAR (Quantitative Structure-Activity Relationship) Gần đây, các phương pháp tìm kiếm đồng dạng (similarity searching) đang được sử dụng ngày càng nhiều, nhất là trong việc sàng lọc

tác dụng mới cho các thuốc đã biết [33]

Sàng lọc dựa trên cấu trúc mục tiêu được tiến hành khi có đầy đủ thông tin về đích phân tử, đặc biệt là cấu trúc tinh thể Các kỹ thuật phổ biến được

sử dụng là động lực học phân tử (molecular dynamics, MD), phương pháp

năng lượng tự do dựa trên mô phỏng Monte Carlo và protein Docking Hiện nay, xu hướng chung là kết hợp hai cách tiếp cận (dựa trên cấu trúc và cấu tử) trong sàng lọc hợp lý nhằm giảm thiểu những hạn chế của từng phương pháp

Trang 26

1.6 Mô phỏng Protein Docking

Hình 1.7 Mô phỏng Docking – một phương pháp nghiên cứu

thuốc dựa trên cấu trúc đích phân tử

1.6.1 Tổng quan về phương pháp mô phỏng Protein Docking

Phương pháp Protein docking ra đời từ những năm 1980, được sử dụng phổ biến trong quá trình thiết kế thuốc dựa trên cấu trúc với khả năng dự đoán

sự hình thành liên kết của cấu tử với receptor trong túi liên kết với độ chính xác khá cao [20] Không những chỉ ra được các liên kết có ý nghĩa, docking còn có thể định lượng khả năng tương tác thông qua các hàm tính điểm, qua

đó phân hạng các liên kết mạnh yếu của các cấu tử [21] Nhờ ưu điểm thực hiện trên máy tính với tốc độ càng ngày càng nhanh và chính xác, Protein docking dần được coi là bước khởi đầu cho nghiên cứu thiết kế thuốc hiện đại

Docking thực chất là một bài toán tối ưu, tìm vị trí và cấu hình phù hợp nhất của một cơ chất gắn kết lên protein Về mặt nhiệt động lực học, mục tiêu chính của docking là tìm ra cấu hình mà năng lượng tự do của toàn hệ là thấp nhất, tương đương với cấu hình bền nhất sau khi tạo thành liên kết giữa phối

tử và protein Để tìm cấu hình phù hợp nhất, cần liên hệ cấu hình không gian

Trang 27

với các trị số đánh giá được khả năng gắn kết của cơ chất lên protein và sau

đó áp dụng thuật toán tìm kiếm [21]

Chương trình docking sử dụng các hàm tính điểm (scoring function) để

lượng giá khả năng liên kết của phức hợp cấu tử - receptor Năng lượng này được cho bởi hằng số liên kết (Kd) và năng lượng tự do Gibbs (ΔGL) Dự đoán về năng lượng liên kết được thực hiện bằng cách đánh giá những tương tác hóa lý quan trọng bao gồm: các tương tác liên phân tử, các ảnh hưởng solvat và entropy [21] Do đó, số lượng các tham số hoá lý được đánh giá càng lớn thì độ chính xác càng cao Tuy nhiên, nếu số lượng biến càng lớn thì thời gian tính toán sẽ càng lâu Các hàm tính điểm hiệu quả nên đưa ra sự cân bằng giữa độ chính xác và tốc độ

1.6.2 Quy trình Docking

Quá trình docking được thực hiện thông qua ba bước: chuẩn bị cấu tử, chuẩn bị protein, mô phỏng docking

Bước 1: Chuẩn bị cấu tử

Các cấu trúc được vẽ trên phần mềm ChemDraw Sau khi xây dựng được cấu trúc 3D, sử dụng phần mềm MOE để xử lí cấu tử theo các bước: chỉnh sửa điện tích cho phù hợp, tối giản hóa năng lượng, gắn trường lực cho phân tử

Bước 2: Chuẩn bị protein

Cấu trúc 3D của protein thường có sẵn trên ngân hàng dữ liệu protein

(protein data bank, https://www.rcsb.org/) Trong trường hợp chưa có sẵn,

chúng ta có thể xây dựng cấu trúc 3D theo phương pháp mô hình hóa tương

đồng (Homology modeling) [63] Lý thuyết cơ bản của phương pháp mô hình

hóa tương đồng là sắp xếp chuỗi amino acid của protein thu được bởi quá trình giải mã gen lên khung cấu trúc bậc 3 của protein có độ phân giải cao

nhưng thiếu thông tin của toàn bộ amino acid

Trang 28

Sau khi có cấu trúc 3D, sử dùng các phần mềm để chuẩn bị protein cho chương trình mô phỏng docking Các bước chuẩn bị thường gồm: loại nước

và các cấu tử (nếu có), thêm hydro, gắn trường lực, phân tích vùng có khả năng tương tác…

Bước 3: Mô phỏng docking

Trước khi tiến hành mô phỏng, cần sử dụng phần mềm để tìm kiếm túi tương tác trên protein để đánh giá khả năng liên kết của phối tử tại vị trí đó

Vị trí của vùng tìm kiếm thông thường sẽ được đặt ở trung tâm hoạt động của protein Khi quá trình docking được tiến hành, phần mềm sẽ tự động tìm kiếm cấu dạng phù hợp nhất của phối tử, tương ứng với năng lượng của toàn hệ thấp nhất Cấu dạng này cùng với các tương tác sẽ được phân tích bởi các phần mềm chuyên dụng như: MOE, Discovery studio

1.7 Ung thư dạ dày (UTDD)

1.7.1 Vài nét về dịch tễ học UTDD

UTDD là một trong các loại ung thư phổ biến nhất trên thế giới và đứng hàng đầu trong số các ung thư đường tiêu hóa Tỷ lệ mắc bệnh có xu hướng giảm dần ở các nước phát triển (Châu Âu, Bắc Mỹ), ngược lại có xu hướng tăng dần ở các nước châu Á

Tại Việt Nam, UTDD đang là vấn đề y tế lớn trong nhân dân, đặc biệt là

ở nam giới trên 40 tuổi Theo WHO, tỷ lệ mắc UTDD ở nước ta là 18,9/100.000 dân, ước tính mỗi năm nước ta có 15.000 – 20.000 người mới mắc [1]

UTDD rất khó chẩn đoán và phát hiện sớm, tỷ lệ mắc bệnh của nam giới lại cao hơn nữ giới Những năm gần đây, bệnh ngày càng có xu hướng trẻ hóa Dự báo đến năm 2020, cứ 100.000 nam giới thì 25 người mắc UTDD Việc chẩn đoán ung thư thường gặp nhiều khó khăn, khoảng 70% bệnh nhân phát hiện ở giai đoạn muộn

Trang 29

Cho đến nay nguyên nhân gây ra UTDD vẫn chưa rõ ràng, tuy nhiên các yếu tố nguy cơ lại được xác định khá cụ thể, bao gồm: [47]

- Loạn sản dạ dày mức độ nặng: thường gặp ở các thể viêm, loét dạ dày

mạn với loạn sản tuyến Khoảng 10% có thể tiến đến UTDD sau 5 đến 15 năm

- Một nghiên cứu theo dõi trong nhiều năm cho thấy việc loại trừ vi khuẩn

Helicobacter pylori (Hp) giúp giảm tới 40% nguy cơ UTDD

- Yếu tố di truyền: Polyp dạng tuyến có tính gia đình (Familial

adenomatous polyposis, FAP) Nhiều nghiên cứu chỉ ra rằng trong gia

đình có bố mẹ, anh chị em ruột bị ung thư dạ dày thì những thành viên còn lại cũng có nguy cơ bị UTDD cao hơn hẳn những người khác

- Biến chứng từ các bệnh khác liên quan tới dạ dày gây nên ví dụ như:

viêm gan mạn tính, loét dạ dày tá tràng, suy gan, xơ gan…

- Môi trường sống: môi trường sống bị ô nhiễm nặng, tiếp xúc với các hóa

chất hay chất phóng xạ độc hại cũng có thể là nguyên nhân gây nên bệnh ung thư dạ dày

- Thói quen ăn uống không hợp vệ sinh hoặc ăn nhiều thực phẩm có nguy

cơ mắc bệnh UTDD cao như đồ nướng, đồ chiên, rán…

- Sinh hoạt không hợp lý: quá căng thẳng, mệt mỏi thường xuyên trong

công việc cuộc sống, thường xuyên thức đêm cũng là một trong những yếu tố gián tiếp gây nên bệnh UTDD

- Sử dụng một số chất gây hại cho dạ dày: như rượu, bia, thuốc lá… Các

chất làm tiêu lớp chất nhầy bảo vệ dạ dày, chất cồn khi tiếp xúc thường xuyên với niêm mạc dạ dày cũng có xu hướng là biến đổi các tế bào này

và có thể dẫn tới UTDD

1.7.2 Điều trị hóa chất trong ung thư dạ dày

Hoá trị liệu là phương pháp sử dụng các thuốc gây độc trên tế bào nhằm tiêu diệt các tế bào ung thư trong người bệnh Trong điều trị UTDD, phẫu

Trang 30

thuật luôn là ưu tiên hàng đầu Hóa trị thường được áp dụng kết hợp với xạ trị

và phẫu thuật nhằm loại bỏ các tế bào ung thư còn lại sau khi xạ trị và phẫu thuật Ngoài ra, hóa trị cũng được dùng nhằm kéo dài sự sống khi các tế bào ung thư đã di căn, và nó giúp làm giảm sự đau đớn khi các khối u tác động lên người bệnh [1]

Trong những năm gần đây, những tiến bộ về y-dược học đã cho ra đời nhiều loại thuốc điều trị ung thư góp phần cải thiện chất lượng sống và tuổi thọ cho bệnh nhân Tuy nhiên, các thuốc điều trị UTDD độc tính rất cao, đặc biệt trên các mô hay các tổ chức phân chia nhanh như tuỷ xương, niêm mạc tiêu hoá… Do vậy, việc phối hợp thuốc trong điều trị UTDD góp phần làm tăng hiệu quả điều trị đồng thời giảm độc tính của thuốc qua đó cải thiện chất lượng sống cho người bệnh [1]

Hiện nay, có thể chia các thuốc dùng trong hoá trị liệu UTDD thành 6 nhóm (Bảng 1.1)

Bảng 1.1: Các nhóm thuốc sử dụng trong hoá trị liệu ung thư dạ dày

Nhóm thuốc Cơ chế tác dụng Tác dụng phụ Thuốc

Nhóm Alkyl

hoá

Tác động lên DNA tế bào bằng các phản ứng thế, liên kết chéo… làm thay đổi thông tin trên DNA dẫn đến đột biến hoặc chết tế bào

Gây suy tuỷ, buồn nôn, viêm thần kinh ngoại

vi, tổn thương thận và thính giác

Cisplatin, Oxaliplatin

Nhóm chống

chuyển hoá

Thuốc có cấu trúc tương tự các chất chuyển hoá của quá trình tổn hợp acid nucleic, qua

đó, ức chế enzyme tổng hợp acid nucleic hoặc gắn với acid

Suy tuỷ, suy thận, xơ gan, loét dạ dày, rối loạn vận động

Metrotrexat, 5-

Fluorouracil Capecitabin

Trang 31

nucleic làm sai mã  ức chế tổng hợp DNA, gây chết tế bào

Nhóm kháng

sinh chống

ung thư

Ức chế sự tổng hợp và chức năng của acid nucleic

Sốc phản vệ, rụng tóc, suy tuỷ, viêm phổi, nhồi máu cơ tim, buồn nôn-nôn

Bleomycin, Doxorubicin Epirubicin, Mitomycin

Nhóm taxan

Là sản phẩm tự nhiên/bán tổng hợp từ thông đỏ có tác dụng ổn định quá trình polymer thành vi quản, ức chế

sự gián phân của tế bào

Nhóm ức chế

topoisomerase

I

Ức chế topoisomerase I – enzym cần cho sự tháo xoắn DNA- do đó ức chế phiên mã

Suy tuỷ, nôn, tiêu chảy, chán

Suy tuỷ, buồn nôn, hội chứng giả cúm

Etoposid

Các phác đồ phối hợp đa hoá trị liệu cho hiệu quả điều trị cao hơn và giảm được độc tính trên người bệnh Trong lâm sàng hiện nay có khá nhiều phác đồ được áp dụng với các đối tượng bệnh nhân khác nhau, giúp cải thiện chất lượng cuộc sống và kéo dài tuổi thọ, ví dụ như công thức FAM, công thức kết hợp 5-Fluorouracil với Acid Folinique, công thức ELF, EAP, DCF, ECF…

Trang 32

1.8 Tổng quan một số nghiên cứu chemogenomics trong chuẩn đoán và tìm kiếm thuốc điều trị ung thư dạ dày

Dự án Bản đồ gen người (Human Genome Project – HGP), do GS

James Watson khởi xướng và hoàn thành năm 2003 được xem là công trình thế kỷ, mở ra một kỷ nguyên mới trong nỗ lực chinh phục bệnh tật con người Hơn ba tỷ ký tự của mã di truyền tạo nên ADN của con người và khoảng

25000 gen đã được xác định Căn cứ trên số lượng mã hóa, ước tính khoảng

5000 protein tham gia vào quá trình bệnh sinh trên cơ thể người, chúng đều có thể được xem là mục tiêu phân tử tiềm năng mà các thuốc nhắm tới Tuy nhiên, các thuốc được nghiên cứu và phát triển trong hơn 100 năm qua chỉ

gắn kết vào khoảng 500 trong số các protein này! Câu hỏi đặt ra là: làm thế nào ngành công nghiệp dược có thể khai thác hiệu quả và biến các thông tin thu thập từ bộ gen người thành thuốc trị bệnh? Ngành nghiên cứu

chemogenomics ra đời với mục đích giải quyết phần thứ hai của câu hỏi trên

Chemogenomics, hiểu theo nghĩa rộng, là việc phát hiện và phân tích mối liên quan giữa bất kỳ hợp chất hoá học nào đối với tất cả các đích phân tử của

chúng Để làm được điều này không chỉ đòi hỏi công nghệ tính toán hiệu năng cao mà còn phải thay đổi cả cách tiếp cận trong nghiên cứu và phát triển

thuốc mới

Điểm qua một số nghiên cứu chenogenomics trong tìm kiếm dấu ấn sinh

học (biomarkers) phục vụ chuẩn đoán sớm UTDD, sàng lọc đích phân tử hay

con đường bệnh sinh mà một thuốc điều trị UTDD có thể can thiệp, có thể thấy, các nghiên cứu dạng này vẫn còn rất ít, nhưng số lượng có xu hướng

tăng trong 5 năm trở lại đây Một số nghiên cứu nổi bật gần đây như năm

2013, nhóm nghiên cứu của B Wu cùng cộng sự đã nghiên cứu đặc điểm gene HMGB3 và vai trò của chúng trong ung thư dạ dày tiến triển [15] Năm

2015, Jian T và Chen Y đã ứng dụng tin sinh trong nghiên cứu cơ chế điều tiết các yếu tố phiên mã và gene mục tiêu trên ung thư dạ dày [23] Năm 2017,

Trang 33

Myung JK và cộng sự tiến hành nghiên cứu Calgranulin B và thực hiện phân tích mạng PPIN trong UTDD qua đó đã cung cấp những kiến thức về vài trò của protein này [30] Năm 2018, Yuan L và cộng sự đã nghiên cứu về UTDD kháng các thuốc nhóm cisplatin, dựa vào công cụ tin sinh để tìm ra một số dấu ấn sinh học mới trong nhóm ung thư này [10] Trong khi đó, việc sàng lọc hợp lý thuốc hiện vẫn đang tập trung vào nhóm đích cũ (VD topoisomerase I,

NF-κB…) và tổng hợp các dẫn xuất dựa trên các khung cấu trúc đã biết như

5-fluorouracil, curcuminoid

Trang 34

Chương 2: ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU

2.1 Đối tượng nghiên cứu

2.1.1 Các ngân hàng dữ liệu về gen, tương tác protein (interactome) và chuyển hóa

- Dữ liệu microarray (Microarrays data): 4 bộ dữ liệu microarray mang

thông tin trình tự gene của bệnh nhân ung thư dạ dày, với nhóm bệnh

và nhóm chứng thu được từ ngân hàng dữ liệu Gene Expression Omnibus (GEO)

Bảng 2.1 Mô tả 4 cơ sở dữ liệu biểu hiện gen liên quan đến ung thư

STT Mã số dữ

1 GSE13911

- Ngày công bố 18-12-2008

- Nền tảng (platform): GeneChip® (Affymetrix)

- Thuộc dự án nghiên cứu biểu hiện phiên mã của các khối u dạ dày nguyên phát và các mẫu bình thường thu được từ mô lân cận của D'Errico

và cộng sự

- Các mẫu bệnh phẩm được lấy từ bệnh nhân ung thư dạ dày ở Florence (Ý) và được phân loại theo phân loại của Lauren

- Số lượng mẫu giải trình tự gen:

+ 31 mẫu bình thường + 38 mẫu ung thư dạ dày

IRBM (MERK)

2 GSE19826

- Nghiên cứu tương quan tăng biểu hiện phiên

mã INHBA và tỷ lệ sống sót của bệnh nhân ung

Wang et

al

Trang 35

thư dạ dày của Wang và cộng sự

- Các mẫu bệnh phẩm được lấy từ bệnh nhân ung thư dạ dày Trung Quốc đang điều trị tại Bệnh viện Nhân dân Đệ nhất Thượng Hải trong giai đoạn 2004-2006 và được phân loại theo mô hình UICC pTNM (1997)

3 GSE54129

- Nghiên cứu phân tích biểu hiện gen của ung thư dạ dày bằng microarray oligonucleotide mật

độ cao của Liu và cộng sự

- Các mẫu bệnh phẩm được lấy trực tiếp từ khối

u của 111 bệnh nhân ung thư dạ dày điều trị tại Bệnh viện Ruijin, Thượng Hải, Trung Quốc

Mẫu đối chiếu thu được qua sinh thiết dạ dày 21 người tình nguyện Trung Quốc

Liu et al

4 GSE79973

- Nghiên cứu điều hòa giảm phiên mã ALDOB (fructose-bisphosphate aldolase) và ảnh hưởng làm giảm khả năng chuẩn đoán trên bệnh nhân

He et al

Trang 36

ung thư dạ dày của He và cộng sự

- Các mẫu bệnh phẩm được lấy từ bệnh nhân ung thư dạ dày điều trị tại Bệnh viện Nhân dân tỉnh Chiết Giang, Trung Quốc

2.1.2 Dữ liệu về các hợp chất hóa học dùng cho sàng lọc

- 48 hợp chất tự nhiên Việt Nam được thu thập từ các nghiên cứu chiết, tách đã công bố trên các tạp chí trong nước và quốc tế Các hợp chất được lựa chọn sàng lọc hoạt tính là các chất từng được công bố tác

dụng kháng ung thư và kháng viêm in vitro

Bảng 2.2 Danh sách và cấu trúc hóa học của các hợp chất

tiên nhiên phục vụ nghiên cứu sàng lọc thuốc mới

26

Lucidadiol

Nấm linh chi

Trang 37

phong,

Engelhardtia chrysolepis Hance

Vàng nhựa,

Garcinia vilersiana

Còng mù-U

Calophyllum inophyllum

L

Acanthus ilicifolius

Acanthopa nax

trifoliatus (L.) Voss

30

Ganoderiol F

Nấm linh chi

Ganoderm

a lucidum

6 (+)-5-Methoxypurpurin 31 Ganodermadiol

Trang 38

7

(+)-Eudesmin

Xuân hoa đỏ

Pseuderanth emum

34

điehydroandrographoli

liên

Andrograp his

Trang 39

tinctoria Linn

frutescens var crispa

a Roxb Ex Hornem

14

Cynarin

Actiso

Cynara scolymus 39

Hidropiperosides A

Nghế răm

Trang 40

15

Laudanidin

Khổ sâm Bắc bộ

Brucea tonkinensis

40

dimethoxyxanthone

(Z)-3-Hexenyl-1-O-β-Mại liễu,

Arachnoth ryx

leucophyll

a

Bù dẻ tía

Uvaria grandiflor

a Roxb Ex Hornem

18 Astilbin

Sói rừng,

Sarcandra glabra

Lãnh công gân hoe

43

dimethoxy-9,10-anthraquinone

1,3-Dihydroxy-2,4-Thảo quyết minh

Senna obtusifolia

Định dạng
Số trang	117
Dung lượng	9,24 MB