Một số cơ sở dữ liệu thường dùng trong nghiên cứu dược lý mạng [57, 59] TT Tên CSDL Mô tả Đường dẫn truy cập 1 TCM-Mesh Mạng lưới tích hợp dữ liệu và hệ thống phân tích dữ liệu dược lý
Trang 1BỘ Y TẾ
TRƯỜNG ĐẠI HỌC DƯỢC HÀ NỘI
VƯƠNG HOÀNG HÙNG
NGHIÊN CỨU IN SILICO MỐI
LIÊN QUAN GIỮA THÀNH PHẦN HOÁ HỌC VÀ TÁC DỤNG SINH HỌC ĐỊNH HƯỚNG ĐIỀU TRỊ COVID-19
CỦA MỘT SỐ CÂY THUỐC
KHÓA LUẬN TỐT NGHIỆP DƯỢC SĨ
HÀ NỘI - 2022
Trang 2BỘ Y TẾ
TRƯỜNG ĐẠI HỌC DƯỢC HÀ NỘI
HỌ VÀ TÊN: VƯƠNG HOÀNG HÙNG
MÃ SINH VIÊN: 1701234
NGHIÊN CỨU IN SILICO MỐI LIÊN
QUAN GIỮA THÀNH PHẦN HOÁ HỌC
VÀ TÁC DỤNG SINH HỌC ĐỊNH
HƯỚNG ĐIỀU TRỊ COVID-19 CỦA MỘT
SỐ CÂY THUỐC KHOÁ LUẬN TỐT NGHIỆP DƯỢC SĨ
NGHIÊN CỨU IN SILICO MỐI
LIÊN QUAN GIỮA THÀNH PHẦN
HOÁ HỌC VÀ TÁC DỤNG SINH HỌC ĐỊNH HƯỚNG ĐIỀU TRỊ COVID-19
CỦA MỘT SỐ CÂY THUỐC
KHÓA LUẬN TỐT NGHIỆP DƯỢC SĨ
Trang 3LỜI CẢM ƠN
Lời đầu tiên, với sự kính trọng và lòng biết ơn sâu sắc, tôi xin được gửi lời cảm
ơn chân thành tới PGS.TS Nguyễn Thu Hằng – Trưởng bộ môn Dược liệu, Trường
Đại học Dược Hà Nội Cô là người đã trực tiếp hướng dẫn, chỉ dạy tôi trong quá trình
thực hiện khoá luận Nhờ sự hướng dẫn của cô, tôi đã có thể từng bước giải quyết được các vấn đề mình gặp phải trong quá trình nghiên cứu Những lời khuyên của cô không chỉ về chuyên môn mà còn về tác phong, kinh nghiệm làm việc sẽ là hành trang quý báu đồng hành cùng tôi trong chặng đường tiếp theo
Tôi xin được gửi lời tri ân sâu sắc tới ThS Nguyễn Văn Phương – Giảng viên
Bộ môn Dược liệu, Trường Đại học Dược Hà Nội, người thầy đã luôn đồng hành,
quan tâm giúp đỡ và động viên tôi trong suốt quá trình nghiên cứu tại bộ môn Sự giúp
đỡ và khích lệ của thầy có ý nghĩa vô cùng to lớn đối với tôi trong quá trình thực hiện khóa luận này Thầy đã dành rất nhiều thời gian và tâm huyết để trực tiếp hướng dẫn tôi tìm hiểu về một mảng kiến thức hoàn toàn mới đối với bản thân trước đó Qua đó, tôi
đã trưởng thành hơn rất nhiều sau quãng thời gian thực hiện khoá luận này
Tôi xin chân thành cảm ơn các thầy cô và các anh chị đang công tác tại Bộ môn Dược liệu đã hết sức tạo điều kiện cho tôi trong quá trình thực hiện khóa luận Cảm ơn
sự đồng hành, chia sẻ và động viên từ các bạn sinh viên đang học tập và nghiên cứu khoa học tại bộ môn đã giúp tôi vượt qua những khó khăn để hoàn thành khóa luận này
Tôi cũng xin gửi lời cảm ơn sâu sắc tới Ban Giám hiệu Trường Đại học Dược Hà Nội, cùng các phòng ban và toàn thể quý thầy cô giáo đã luôn tạo điều kiện tốt nhất cho tôi trong suốt quá trình học tập và nghiên cứu tại trường
Cuối cùng, tôi xin đặc biệt cảm ơn gia đình, bạn bè và những người thân yêu đã luôn ở bên, là chỗ dựa tinh thần to lớn, luôn khích lệ và động viên tôi trong học tập cũng như trong cuộc sống!
Trong quá trình thực hiện khóa luận không thể tránh khỏi những thiếu sót, tôi rất mong nhận được những nhận xét và góp ý từ các thầy cô và bạn bè để khóa luận được hoàn thiện hơn
Tôi xin chân thành cảm ơn!
Hà Nội, tháng 06 năm 2022
Sinh viên
Trang 4MỤC LỤC
LỜI CẢM ƠN 3
MỤC LỤC 4
DANH MỤC CÁC KÍ HIỆU, CHỮ VIẾT TẮT 5
DANH MỤC CÁC BẢNG 6
DANH MỤC CÁC HÌNH VÀ BIỂU ĐỒ 7
ĐẶT VẤN ĐỀ 1
CHƯƠNG 1 TỔNG QUAN 3
1.1 Tổng quan về SARS-CoV-2 và COVID-19 3
1.2 Tổng quan về dược lý mạng (Network pharmacology) 5
1.3 Giới thiệu Gen Ontology - GO 9
1.4 KEGG và làm giàu KEGG (KEGG enrichment) 11
1.5 Mô phỏng tương tác phân tử (Molecular docking) 12
1.6 Thành phần hóa học và tác dụng liên quan đến COVID-19 của Xuyên tâm liên, Thanh cao hoa vàng và Hoàng cầm 12
CHƯƠNG 2 ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU 14
2.1 Nguyên vật liệu, thiết bị 14
2.2 Nội dung nghiên cứu 14
2.3 Sơ đồ thiết kế nghiên cứu 14
2.4 Phương pháp nghiên cứu 16
CHƯƠNG 3 THỰC NGHIỆM, KẾT QUẢ VÀ VÀ BÀN LUẬN 19
3.1 Kết quả xây dựng cơ sở dữ liệu về đích tác dụng liên quan đến COVID-19 (CSDL1) 19
3.2 Kết quả nghiên cứu cây Xuyên tâm liên (Andrographis paniculata (Burm.f.) Nees., Acanthaceae) 19
3.3 Kết quả nghiên cứu cây Thanh cao hoa vàng (Artemisia annua L., Asteraceae) 28
3.4 Kết quả nghiên cứu cây Hoàng cầm (Scutellaria baicalensis Georgi., Lamiaceae) 35
3.5 BÀN LUẬN 42
KẾT LUẬN VÀ ĐỀ XUẤT 46
TÀI LIỆU THAM KHẢO 48
PHỤ LỤC
Trang 5DANH MỤC CÁC KÍ HIỆU, CHỮ VIẾT TẮT
3CLP 3-chymotripsin-like protease
AKT1 AKT serine/threonine kinase 1
BP Biological process (Quá trình sinh học)
CatL Cathepsin L
CC Cellular component (Thành phần tế bào)
CSDL Cơ sở dữ liệu
DL Drug likeness (Đặc tính giống thuốc)
EGFR Epidermal growth factor receptor
FDR False discovery rate (Tỉ lệ phát hiện sai)
GO Gene Ontology
HIF1A Hypoxia-inducible factor 1-alpha
HSP90AA1 Heat shock protein HSP 90-alpha
IL1B Interleukin-1 beta
IL6 Interleukin-6
KEGG Kyoto Ecyclopedia of Genes and Genomes
MAPK Mitogen-activated protein kinase
MF Molecular function (Chức năng phân tử)
Nsp Non-structural protein (Protein không cấu trúc)
OB Oral bioavailability (Sinh khả dụng đường uống)
PDB Protein databank
PLP Papain-like protease
PPI Protein-protein interaction (Tương tác protein-protein)
RdRp RNA-dependent RNA polymerase
RNA Ribonucleic acid
SARS-CoV-2 Severe Acute Respiratory Syndrome Coronavirus 2
SKD Sinh khả dụng
SMILES Simplified Molecular Input Line Entry System
STAT3 Signal transducer and activator of transcription 3
STD Swiss Target Prediction
TCM Traditional Chinese Medicine
TCMSP The traditional Chinese medicine systems pharmacology database
and analysis platform
Trang 6DANH MỤC CÁC BẢNG
TT Kí hiệu Tên bảng Trang
1 1.1 Một số cơ sở dữ liệu thường dùng trong nghiên cứu dược
2 1.2 Một số phần mềm máy tính và thuật toán được sử dụng
3 3.1 7 hợp chất tiềm năng trong tác dụng định hướng điều trị
Trang 7DANH MỤC CÁC HÌNH VÀ BIỂU ĐỒ
TT Kí hiệu Tên hình và biểu đồ Trang
1 1.1 Cấu trúc phân cấp của chú thích GO:0051575 10
3 3.1 Mạng lưới hợp chất - đích tác dụng tiềm năng của Xuyên
4 3.2
Biểu đồ phân tích các tham số của các đích tác dụng trong mạng lưới tương tác hợp chất – đích tác dụng của Xuyên tâm liên
21
5 3.3 Mạng lưới tương tác protein-protein (PPI) của Xuyên tâm
6 3.4 Biểu đồ phân tích các tham số của các đích tác dụng
trong mạng lưới PPI của Xuyên tâm liên 23
7 3.5 Kết quả làm giàu GO – Chức năng phân tử của Xuyên
26
12 3.10 Biểu đồ nhiệt mô phỏng tương tác của 7 hợp chất tiềm
13 3.11 2 hợp chất quan trọng nhất liên quan đến tác dụng định
hướng điều trị COVID-19 của Xuyên tâm liên 28
14 3.12 Mạng lưới hợp chất - đích tác dụng tiềm năng của Thanh
Trang 818 3.16 Kết quả làm giàu GO – Quá trính sinh học của Thanh cao
33
21 3.19 Biểu đồ nhiệt mô phỏng tương tác của 6 hợp chất tiềm
năng trong Thanh cao hoa vàng 34
22 3.20 3 hợp chất quan trọng nhất liên quan đến tác dụng định
hướng điều trị COVID-19 của Thanh cao hoa vàng 34
23 3.21 Mạng lưới hợp chất - đích tác dụng tiềm năng của Hoàng
30 3.28 Biểu đồ nhiệt mô phỏng tương tác của 5 hợp chất tiềm
31 3.29 3 hợp chất quan trọng nhất liên quan đến tác dụng định
hướng điều trị COVID-19 của Hoàng cầm 41
Trang 9ĐẶT VẤN ĐỀ
COVID-19 là bệnh gây ra bởi SARS-CoV-2 (Severe Acute Respiratory Syndrome
Coronavirus 2) [33] với tính chất lây lan nhanh và mạnh Theo số liệu thống kê của Bộ
Y tế [62], tính đến ngày 25/05/2022, trên thế giới đã có hơn 500.000.000 ca nhiễm, với 6.302.057 trường hợp tử vong Riêng tại Việt Nam đã có gần 11.000.000 ca nhiễm COVID-19 đã gây ra những tổn thất nặng nề ở nhiều quốc gia trên thế giới nói chung cũng như ở Việt Nam nói riêng
Bên cạnh các thuốc hóa dược, một số sản phẩm có nguồn gốc tự nhiên đã có những thành công nhất định trong việc phòng chống dịch SARS (2003), H1N1 (2009) cũng như kiểm soát COVID-19 ở Trung Quốc Điều này cho thấy phát triển thuốc điều trị COVID-19 có nguồn gốc tự nhiên là một hướng đi triển vọng Một số cây thuốc bước đầu đã được chứng minh có tác dụng ức chế SARS-CoV-2 hoặc giải quyết các triệu
chứng của COVID-19, trong đó đáng chú ý là Xuyên tâm liên [39], Thanh cao hoa vàng
[32] và Hoàng cầm [27], Tuy nhiên, các hoạt chất cũng như cơ chế tác dụng của những cây thuốc này vẫn chưa được nghiên cứu một cách đầy đủ
Trên thế giới, cuộc Cách mạng công nghiệp lần thứ tư đang diễn ra với phạm vi, chiều sâu và tốc độ chưa từng có tiền lệ trong lịch sử Những tiến bộ về tin sinh học
(bioinformatics), sự bùng nổ của các cơ sở dữ liệu trong đó có các dữ liệu lớn (big data)
cùng với các phần mềm máy tính đã trở thành những công cụ đắc lực trong lĩnh vực nghiên cứu phát triển thuốc
Dược lý mạng (Network pharmacology) là một phương pháp tiếp cận mới và độc
đáo trong quá trình nghiên cứu phát triển thuốc với sự hỗ trợ của các cơ sở dữ liệu và máy tính Dược lý mạng mô tả mối liên quan phức tạp giữa các yếu tố của bệnh, hệ thống sinh học của cơ thể người và các đích tác dụng của thuốc điều trị thông qua các mạng lưới Từ đó cho phép tìm hiểu cơ chế tác dụng của thuốc, chỉ ra các đích tác dụng cũng như các quá trình sinh học và con đường có sự can thiệp của thuốc liên quan đến
một bệnh cụ thể Với mô hình nghiên cứu mạng lưới đa đích tác dụng - nhiều thành
phần, dược lý mạng đã nhanh chóng được ứng dụng rộng rãi trong việc nghiên cứu thành
phần hoạt chất và cơ chế tác dụng của các thuốc gồm nhiều thành phần nói chung cũng như thuốc thảo dược nói riêng
Mô phỏng tương tác phân tử (Molecular docking) là kỹ thuật quan trọng để sàng
lọc các hợp chất có hoạt tính sinh học thông qua việc dự đoán khả năng liên kết của protein và phối tử mà không cần tiến hành thực nghiệm Việc kết hợp dược lý mạng và
mô phỏng tương tác phân tử trong việc sàng lọc hoạt chất và dự đoán cơ chế tác dụng của các thảo dược giúp giảm thiểu số thí nghiệm cần thực hiện, do đó tiết kiệm đáng kể thời gian và chi phí so với các phương pháp nghiên cứu truyền thống
Trang 10Vì những lý do trên, đề tài khóa luận “Nghiên cứu in silico mối liên quan giữa
thành phần hóa học và tác dụng sinh học định hướng điều trị COVID-19 của một
số cây thuốc” được thực hiện với ba mục tiêu sau:
1 Dự đoán các hợp chất và các đích tác dụng tiềm năng theo định hướng điều trị COVID-19 của Xuyên tâm liên, Thanh cao hoa vàng và Hoàng cầm
2 Dự đoán các quá trình sinh học và con đường liên quan đến các đích tác dụng tiềm năng định hướng điều trị COVID-19 của ba cây thuốc
3 Mô phỏng tương tác phân tử của các hợp chất tiềm năng có trong ba cây thuốc với protein của SARS-CoV-2
Trang 11CHƯƠNG 1 TỔNG QUAN 1.1 Tổng quan về SARS-CoV-2 và COVID-19
SARS-CoV-2 (Severe Acute Respiratory Syndrome Coronavirus 2) [33] thuộc
phân họ Coronaviriae, họ Coronaviridae, bộ Nidovirales [4] SARS-CoV-2 thuộc cùng phân họ với coronavirus gây hội chứng hô hấp cấp tính nghiêm trọng (SARS-CoV) và coronavirus gây hội chứng hô hấp Trung Đông (MERS-CoV) Mặc dù nguồn gốc của SARS-CoV-2 vẫn chưa được xác định chính xác song phần lớn các nhà khoa học đều công nhận virus này có nguồn gốc từ động vật và liên quan tới việc lây nhiễm từ động vật sang người SARS-CoV-2 có xu hướng tiến hóa di truyền và hình thành các biến thể
có thể có các đặc tính khác so với virus gốc, đặc biệt là việc nâng cao khả năng lây truyền hoặc độc lực, giảm tác động của các kháng thể thu được từ quá trình nhiễm trùng
tự nhiên hoặc tiêm chủng, từ đó giảm hiệu quả điều trị và/hoặc hiệu lực của vaccin Một
số biến thể SARS-CoV-2 phổ biến bao gồm Alpha (B.1.1.7 linegae) (12/2020), Beta (B.1.351 linegae) (10/2020), Gamma (P.1 lineage) (12/2020), Delta (B.1.617.2 linegae) (12/2020) và Omicron (B.1.1.529 linegae) (11/2021) [6]
1.1.1 Các triệu chứng lâm sàng
Theo Tổ chức Y tế thế giới (WHO), COVID-19 là bệnh truyền nhiễm gây ra bởi SARS-CoV-2 [66] Thời gian ủ bệnh thường kéo dài từ 2-14 ngày, trung bình là 5-7 ngày Khởi phát ban đầu với triệu chứng hay gặp là sốt, ho khan, mệt mỏi và đau cơ Một số trường hợp đau họng, nghẹt mũi, chảy nước mũi, đau đầu, ho có đờm, nôn và tiêu chảy Hầu hết người bệnh (khoảng hơn 80%) là ca bệnh nhẹ không bị viêm phổi và thường tự hồi phục sau 1 tuần, một số trường hợp dương tính với virus thậm chí không
có biểu hiện triệu chứng lâm sàng [1]
Những trường hợp diễn biến thành ca bệnh nặng bắt đầu xuất hiện triệu chứng sau khoảng từ 7-8 ngày Các biểu hiện nặng bao gồm: viêm phổi, viêm phổi nặng cần nhập viện… Trong đó khoảng 5% bệnh nhân cần điều trị tại các đơn vị hồi sức tích cực với các biểu hiện hô hấp cấp (thở nhanh, khó thở, tím tái,…), hội chứng suy hô hấp cấp tiến triển (ARDS), sốc nhiễm trùng, suy chức năng các cơ quan bao gồm tổn thương thận và tổn thương cơ tim, dẫn đến tử vong [1]
1.1.2 Nguyên tắc điều trị
Theo Hướng dẫn chẩn đoán và điều trị COVID-19 của Bộ Y tế [1], các nhóm thuốc được sử dụng trong điều trị COVID-19 bao gồm: các thuốc kháng virus (Remdesivir), các kháng thể kháng virus (Casirivimab), thuốc ức chế Interleukin-6 (Tocilizumab), thuốc corticoid (Dexamethason), thuốc chống đông (Heparin) Bệnh nhân được phân loại dựa theo mức độ nguy cơ và được điều trị kết hợp giữa sử dụng thuốc và các phương pháp điều trị đặc biệt khác như ECMO, dinh dưỡng và phục hồi chức năng
Trang 121.1.3 Các mục tiêu phân tử của SARS-CoV-2
Các mục tiêu ức chế SARS-CoV-2 tiềm năng được xác định là những mục tiêu phân tử có vai trò quan trọng trong vòng đời, quá trình xâm nhập hay quá trình nhân lên của virus
Main protease (M pro ) hay 3-chymotrypsin-like protease (3CLP) là một protein
được mã hóa bởi gen có trong tất cả các biến chủng SARS-CoV-2 có vai trò quan trọng trong sự nhân lên cũng như cả vòng đời của virus 3CLP cũng đã được chứng minh là một đích tác dụng tiềm năng của thuốc trong các ca nhiễm SARS-CoV và MERS-CoV trước đó [29, 48]
Protein gai hay S-protein là một đích tác dụng được các nhà nghiên cứu khai
thác để tạo vaccin COVID-19, gồm 2 tiểu đơn vị đóng vai trò quan trọng trong quá trình gắn kết với tế bào chủ và quá trình xâm nhập của virus vào tế bào [2]
Cathepsin L (CatL) là một protein giúp loại tiểu đơn vị S1 và thúc đẩy quá trình
hòa màng của virus, giải phóng RNA và quá trình nhân lên của virus Có ít nhất 7 chất
ức chế chọn lọc CatL cho thấy hiệu quả trong việc ngăn chặn lây nhiễm và có ít nhất 10 thuốc được FDA phê duyệt cho thấy có hoạt động ức chế CatL [28]
ARN polymerase phụ thuộc ARN (RdRp) hay Nsp12 là một enzym quan trọng
trong vòng đời của virus có tác dụng tăng tốc độ sao chép ARN Remdesivir là một thuốc có khả năng ức chế cạnh tranh với ATP của RdRp và can thiệp vào quá trình tổng
hợp ARN của virus [25, 29] Helicase (Nsp13) cùng với RdRp tạo điều kiện thuận lợi
cho quá trình phiên mã và sao chép của ARN, do đó có vai trò hết sức quan trọng quá trình nhân lên của virus [25]
Papain-like protease (PLP) là một protein quan trọng trong quá trình kích hoạt
sự lây nhiễm nhờ tính đối kháng interferon của nó Ngoài ra PLP cùng với 3CLP làhai enzym chính chịu trách nhiệm phân tách các polyprotein của SARS-CoV-2 và có vai trò quan trọng trong sự nhân lên của virus [25, 29]
Furin là một enzym protease liên kết màng loại 1 thuộc họ proprotein convertase
(PPC), có tác dụng kích hoạt các protein ở dạng tiền chất Furin có thể tác động đến nhiều loại protein bao gồm cả gycoprotein bề mặt của virus Đây là một tác nhân quan trọng để kích hoạt protein gai của SARS-CoV-2 [49] Ngoài ra, furin cũng tập trung với
số lượng lớn ở phổi nhằm tăng khả năng lây nhiễm của SARS-CoV-2 [25]
Methyltransferase (Nsp16) là một trong số các protein không cấu trúc (Nsp)
của SARS-CoV-2 đóng vai trò quan trọng trong quá trình dịch mã và nhân lên của virus Methytransferase có chức năng methyl hóa mũ ARN ở vị trí ribose-2’-O giúp bảo vệ virus khỏi sự phân hủy do 5’-3’-exoribonuclease [30]
Trang 13EndoRNAse là enzym có thể phân cắt cả RNA sợi đơn và sợi kép, đóng vai trò
quan trọng trong quá trình nhân lên của virus Protein này là đích tác dụng của một số thuốc đang được lưu hành hiện nay như Sempremivir và Nelfinavir [29]
1.2 Tổng quan về dược lý mạng (Network pharmacology)
1.2.1 Khái niệm dược lý mạng
Trước đây, trong một khoảng thời gian dài, thuốc mới thường được phát triển thông qua việc sàng lọc, tìm kiếm ngẫu nhiên từ thực vật, động vật và khoáng chất trong
tự nhiên Năm 2000, việc giải mã thành công trình tự bộ gen người đã tạo nên một bước ngoặt quan trọng trong lĩnh vực nghiên cứu phát triển thuốc mới Kể từ đây, các thuốc mới được phát triển dựa theo mục tiêu phân tử cụ thể Các protein mà thuốc liên kết
hoặc tác dụng được gọi là “đích” Phương pháp tiếp cận một thuốc - một đích tác dụng
- một bệnh được tiếp tục trong thời gian dài sau đó Kết quả tạo ra hàng loạt thuốc điều
trị có tác dụng đặc hiệu và chọn lọc tại đích Tuy nhiên, cách tiếp cận này chưa mang lại hiệu quả khi nghiên cứu các thuốc thảo dược với thành phần hóa học phức tạp và cơ chế tác dụng chưa rõ ràng Tác dụng điều trị của thuốc thảo dược thường liên quan đến nhiều thành phần, nhiều đích tác dụng, nhiều quá trình sinh học và con đường khác nhau,
do đó, cần tiếp cận nghiên cứu dựa trên mô hình mạng lưới đa đích tác dụng - nhiều
thành phần [7]
Năm 2007, Andrew L Hopkins lần đầu tiên đưa ra khái niệm về dược lý mạng
(Network pharmacology) [19] - một phương pháp tiếp cận mới tích hợp lý thuyết mạng (Network theory) và các nguyên lý sinh học hệ thống (system biology principles) trong
lĩnh vực nghiên cứu phát triển thuốc Thông qua các mạng lưới, mối liên quan phức tạp giữa các yếu tố của bệnh, hệ thống sinh học của cơ thể người và các đích tác dụng của thuốc điều trị được mô tả rõ ràng ở mức độ phân tử Từ đó cho phép tìm hiểu cơ chế tác dụng của thuốc, chỉ ra các đích tác dụng cũng như các quá trình sinh học và con đường
có sự can thiệp của thuốc liên quan đến một bệnh cụ thể
Kể từ khi ra đời đến nay, dược lý mạng ngày càng thể hiện tính ưu việt và được ứng dụng rộng rãi trong lĩnh vực nghiên cứu phát triển thuốc Nhiều nghiên cứu đã sử dụng dược lí mạng để tìm hiểu và dự đoán cơ chế tác dụng định hướng điều trị COVID-
19 của Xuyên tâm liên [51, 61], Thanh cao hoa vàng [46] và Hoàng cầm [44]
1.2.2 Xây dựng và phân tích mạng lưới
Mạng lưới là sơ đồ tương tác giữa các nút (node), trong đó, các nút này có thể là các hợp chất hoặc đích tác dụng (gen/protein) Các nút được kết nối với nhau bằng các cạnh (edge) để biểu thị mối quan hệ giữa chúng
Mạng lưới được xây dựng bằng các phần mềm máy tính dựa trên cơ sở các thông tin về các nút và các cạnh Thông tin để xây dựng mạng lưới thường được thu thập từ
Trang 14các cơ sở dữ liệu sẵn có Một số cơ sở dữ liệu thường dùng trong nghiên cứu dược lý
mạng được trình bày ở Bảng 1.1
Bảng 1.1 Một số cơ sở dữ liệu thường dùng trong nghiên cứu dược lý mạng [57, 59]
TT Tên CSDL Mô tả Đường dẫn truy cập
1 TCM-Mesh Mạng lưới tích hợp dữ liệu và hệ
thống phân tích dữ liệu dược lý mạng các chế phẩm TCM
4 HIT Cơ sở dữ liệu về các tài nguyên
hiện có về các đích protein của thuốc được FDA phê duyệt cũng như các hợp chất có tiềm năng
http://lifecenter.sgst.cn/ hit
5 TCMID Cơ sơ dữ liệu cung cấp thông tin
là cầu nối giữa TCM với khoa học hiện đại
http://www.megabionet org/tcmid
6 ProteinData
Bank
Cơ sở dữ liệu cho dữ liệu cấu trúc
ba chiều của các phân tử sinh học lớn như protein và acid nucleic
https://www.rcsb.org
7 ChEMBL Cơ sở dữ liệu chứa thông tin về
cấu trúc, chức năng và các thông
số dược động học của nhiều hợp chất có hoạt tính sinh học giống thuốc
https://www.ebi.ac.uk/c hembl
8 PubChem Hệ thống thông tin phân tích các
hợp chất có hoạt tính sinh học và các hợp chất phân tử nhỏ
https://pubchem.ncbi nlm.nih.gov
9 STRING Cơ sở dữ liệu về các tương tác đã
biết hoặc dự đoán của protein với protein
https://string-db.org
Trang 15của protein người trong sức khoẻ
và bệnh tật
11 MINT Cơ sở dữ liệu tập trung vào các
tương tác protein-protein đã được xác nhận bằng thực nghiệm được khai thác từ các bài báo khoa học bởi các hội đồng chuyên gia
https://mint.bio.uniroma 2.it
12 IntAct Cơ sở dữ liệu mở và công cụ phân
tích các tương tác phân tử
https://www.ebi.ac.uk/in tact
13 HAPPI Cơ sở dữ liệu trực tuyến về chú
thích và dự đoán tương tác protein trong cơ thể người
http://discovery.informa tics.uab.edu/HAPPI
14 OMIM Danh mục về gen người cùng các
kiểu hình gen được xác minh và cập nhật hàng ngày
https://www.omim.org
15 GAD Cơ sở dữ liệu về các thông tin liên
quan tới gen từ các bệnh và rối loạn phức tạp
https://geneticassociatio ndb.nih.gov
16 TTD Cung cấp các mục tiêu, protein và
con đường của bệnh tật và các thông tin thuốc liên quan, được liên kết với các CSDL khác
http://db.idrblab.net/ttd/
17 CTD Cung cấp các thông tin về tương
tác gen, bệnh tật và các quan hệ giữa các gen
http://ctdbase.org
18 DisGeNet Gồm thông tin từ cơ sở dữ liệu
công cộng, danh sách động thực vật hoang dã toàn cầu, mô hình động vật và tài liệu khoa học
https://www.disgenet.or
g
19 Drugbank Cung cấp thông tin về phân tử hoá
học cũng như các tính chất hoá lý, thông số dược lực học và các đích tác dụng
http://www.swisstargetp rediction.ch
Trang 16phân tử, có thể dự đoán các mục tiêu đại phân tử protein
21 TargetNet Dự đoán hoạt động của các phân
tử sau khi mô phỏng qua nhiều
mô hình mối quan hệ giữa cấu trúc và hoạt tính
http://targetnet.scbdd.co
m
22 Genecards GeneCards là một cơ sở dữ liệu
về gen của con người cung cấp thông tin về gen, proteomic, phiên mã, di truyền và chức năng
về tất cả các gen người đã biết và được dự đoán
https://www.genecards org
Một số phần mềm máy tính và thuật toán được sử dụng trong nghiên cứu dược
lý mạng được trình bày ở Bảng 1.2
Bảng 1.2 Một số phần mềm máy tính và thuật toán được sử dụng trong
nghiên cứu dược lý mạng [57, 59]
TT Tên Mô tả Đường dẫn truy cập
1 Random walk Thuật toán cho phép dự đoán các
tương tác thuốc-đích tác dụng tiềm năng theo quy mô lớn dựa trên giả thuyết rằng các thuốc tương tự nhau thường tương tác với các đích tương tự nhau
https:
//www.rdocumentation org/packages/diffusr/ versions/0.1.4/topics/ random.walk
2 PRINCE Thuật toán dựa trên mạng lưới để
ưu tiên các gen gây bệnh và qua
đó suy ra các liên kết phức tạp của protein
https://github.com/ fosterlab/PrInCE Vanunu et al.,
201
3 Cytoscape Môi trường phần mềm cho các
mô hình tích hợp mạng lưới tương tác của các phân tử sinh học
https://cytoscape.org
4 DAVID Cung cấp các chú thích một cách
có hệ thống và dễ hiểu, giúp phân
https://david.ncifcrf.gov
Trang 17http://bionet.ncpsb.org/b atman-tcm
6 Venny [34] Công cụ giúp phân tích và minh
hoạ sơ đồ ven
http://bioinfogp.cnb.csic es/tools/venny/index.ht
ml
7 ShinnyGO [14] Công cụ làm giàu bộ gen và biểu
diễn kết quả dưới dạng đồ họa cho động vật và thực vật
http://bioinformatics.sds tate.edu/go/
Trong số các phần mềm, Cytoscape [42] là một phần mềm hữu ích để trực quan hóa các mạng lưới tương tác Ngoài Cytoscape, có một số công cụ khác như Visual Network Pharmacology, Gephi, Cell Illustrator cũng có thể được sử dụng với mục đích tương tự
Mạng lưới sau khi xây dựng và trực quan hoá bằng phần mềm Cytoscape sẽ được phân tích bằng ứng dụng có sẵn trong Cytoscape như CytoNCA hoặc các công cụ phân tích khác
Nhiều nghiên cứu
1.3 Giới thiệu Gen Ontology - GO
1.3.1 Một số khái niệm
Ontology (bản thể học) là một thuật ngữ được sử dụng rộng rãi trong khoa học
máy tính và khoa học thông tin để chỉ một tập hợp các khái niệm và mối quan hệ của chúng nhằm mô tả một vấn đề cụ thể theo một định dạng có thể mà máy tính có thể hiểu được, từ đó cho phép ứng dụng trong nhiều lĩnh vực khác nhau như tin sinh học, trí tuệ
nhân tạo, kỹ thuật thông tin… Ontology được đặc trưng bởi nhiều yếu tố như lớp (class), siêu dữ liệu (metadata), mối quan hệ (relation), định lý (axiom) Trong đó, cách biểu diễn mối quan hệ (relation) giữa các khái niệm đóng vai trò chính trong việc giúp cho
máy tính có thể hiểu và xử lý được thông tin, đồng thời cũng là yếu tố quan trọng khi ứng dụng Ontology trong nghiên cứu gen [12]
Mối quan hệ giữa các khái niệm trong bản thể học được sắp xếp theo một hệ thống phân cấp Bản thể học giúp việc chú thích các thuật ngữ trở nên có hệ thống và có thể xử lý được bằng máy tính Từ đó giúp cho việc diễn giải thuật ngữ liên ngành được
thuận tiện, đặc biệt đối với dữ liệu lớn (big data) Các cơ sở dữ liệu như ChEBI, FMA,
Trang 18Disease Ontology đều là những ví dụ của Ontology Bản thân Gen Ontology (GO) cũng
đồng thời là một ứng dụng của Ontology
Gen là một vùng tiếp giáp với ADN, mã hóa cho một hay nhiều đại phân tử khác
nhau [12]
Các đại phân tử (Large molecular/Macromolecular) là các sản phẩm của gen
do được tạo ra nhờ thông tin từ trình tự gen Đại phân tử gồm hai loại: một là protein (là
loại phổ biến nhất), và ARN không mã hóa (non-coding RNA) Các sản phẩm của gen
này có thể được ví như một cỗ máy phân tử để thực hiện một chức năng nhất định Các đại phân tử mã hóa từ nhiều gen khác nhau cũng có thể kết hợp lại để tạo thành một
phức hợp đại phân tử (complex) [12]
Chức năng phân tử (Molecular Function - MF) là một quá trình sinh hóa được
thực hiện bởi đại phân tử hoặc vai trò của đại phân tử trong hệ thống Ví dụ, thuật ngữ
GO:0051575 - 5'-deoxyribose-5-phosphate lyase activity được định nghĩa là “xúc tác
cho loại bỏ beta của 5’-deoxyribose-5-phosphat tại vị trí base trong DNA nơi (apurinic hoặc apyrimidinic) lyase đã cắt liên kết C-O-P 3’ thành apurinic hoặc apyrimindinic” Thuật ngữ này có 7 gen liên quan [63] Cấu trúc phân cấp cho thuật ngữ
DNA-này được thể hiện ở Hình 1.1
Hình 1.1 Cấu trúc phân cấp của chú thích GO:0051575 [63]
Thành phần tế bào (Cellular Component - CC) là vị trí trong tế bào hoặc các
khoang trong cơ thể mà tại đó các đại phân tử thực hiện các chức năng phân tử Thành phần tế bào cung cấp thông tin cho việc chức năng phân tử được diễn ra ở đâu trong cơ
thể Ví dụ, thuật ngữ GO:0009986 -cell surface được định nghĩa là “phần bên ngoài của
thành tế bào và/hoặc màng sinh chất” [65] Thành phần tế bào hướng tới khía cạnh giải phẫu tế bào hơn là đề cập tới các quá trình sinh học Do đó, khi phân tích làm giàu GO
Trang 19Quá trình sinh học (Biological Process - BP) là các mục tiêu cụ thể mà sinh vật
được lập trình về mặt di truyền Tên của quá trình sinh học thường mô tả kết quả hay trạng thái khi kết thúc quá trình đó Ví dụ, quá trình sinh học “phân chia tế bào” có kết quả là sự tạo thành hai tế bào con từ một tế bào mẹ Trong mỗi quá trình sinh học thường
đi kèm theo nhiều chức năng phân tử và được thực hiện bởi các sản phẩm gen cụ thể Đây là khía cạnh lớn nhất, đa dạng nhất trong GO Các quá trình sinh học có thể là quá trình phản ứng của enzym như “phản ứng phosphoryl hóa protein”, là con đường phân
tử như “quá trình đường phân”, hoặc các con đường lớn phức tạp như “sinh sản”
1.3.2 Làm giàu GO (GO enrichment)
Như đã đề cập ở trên, Ontology là hệ thống các khái niệm có cấu trúc và có thể
sử dụng các công cụ tính toán bằng máy tính Đối với GO, mỗi một thuật ngữ (GO term)
có thể được xác định dựa trên 3 khía cạnh: chức năng phân tử, quá trình sinh học và thành phần tế bào Ví dụ, gen FasR được xác định với chức năng phân tử là một receptor,
gắn với quá trình sinh học apoptosis, và có thành phần tế bào ở màng plasma
Làm giàu GO (GO enrichment) là một kỹ thuật sử dụng hệ thống chú thích của
GO để diễn giải một tổ hợp gen, từ đó xác định các chức năng phân tử, quá trình sinh học và thành phần tế bào có liên quan tới nhóm gen đó Các thuật toán làm giàu GO thực chất là một phân tích thống kê để xác định rằng tập hợp các thuật ngữ GO đó có liên quan tới một bộ gen cho trước hay không dựa trên các tham số thống kê như giá trị
p (p-value) hay tỉ lệ phát hiện sai (False Discovery Rate – FDR)
Có nhiều phương pháp để làm giàu bản thể học gen như: phép kiểm tra độ chính xác Fisher, phương pháp thống kê Bayes, hay phương pháp đa so sánh - hiệu chỉnh
Bonferroni Trong đó, phương pháp đa so sánh (multiple testing) được nhiều nghiên cứu
dược lý mạng sử dụng và kiểm soát tham số FDR được Hiệp hội Sinh lý học Hoa Kì xem xét như một giải pháp thực tiễn nhất cho việc đánh giá kết quả của phương pháp này [14]
1.4 KEGG và làm giàu KEGG (KEGG enrichment)
KEGG là viết tắt của Kyoto Encyclopedia of Genes & Genomes – Bách khoa toàn
thư về gen và bộ gen, được xây dựng bởi Trường Đại học Kyoto, Nhật Bản nhằm mục đích tìm hiểu các chức năng của cơ thể từ các thông tin ở mức độ phân tử, đặc biệt là từ
dữ liệu là kết quả của các nghiên cứu thông lượng cao như giải trình tự bộ gen
Một trong số những nội dung của KEGG là con đường KEGG (KEGG pathway)
- một tập hợp các sơ đồ con đường sinh học được vẽ thủ công biểu diễn các thông tin đã biết về tương tác phân tử, phản ứng và mạng lưới quan hệ của quá trình chuyển hóa, quá trình thông tin gen, quá trình tế bào, hệ thống sinh vật, các bệnh trên người (trong đó có COVID-19), phát triển thuốc và quá trình thông tin môi trường
Trang 20Việc phân tích làm giàu KEGG (KEGG enrichment) giúp trực quan hóa các con
đường sinh học có thể liên quan tới tổ hợp gen đầu vào, qua đó giúp tìm hiểu các cơ chế tác dụng của các hợp chất ban đầu tới các quá trình trong cơ thể [23] Một con đường
KEGG có thể có sự tham gia của nhiều đích và gồm nhiều quá trình sinh học (biological
process) khác nhau
1.5 Mô phỏng tương tác phân tử (Molecular docking)
Mô phỏng tương tác phân tử là phương pháp dự đoán khả năng liên kết giữa
protein và phối tử ở các trạng thái (vị trí và hướng trong không gian 3 chiều) khác nhau
Cụ thể, phối tử sẽ được di chuyển xung quanh vùng tìm kiếm định sẵn trong bước chuẩn
bị protein và ứng với mỗi trạng thái của phối tử, năng lượng liên kết protein-phối tử sẽ được ghi lại, từ đó, xác định trạng thái có năng lượng liên kết thấp nhất Giá trị năng lượng liên kết có thể được tính theo nhiều cách như: dựa trên tương tác Van der Waals, tương tác tĩnh điện; dựa trên tương tác giữa các nhóm thân nước và liên kết hydro; dựa trên tương tác đã biết của các cặp phức hợp có cấu trúc tương tự trong cơ sở dữ liệu
Mô phỏng tương tác phân tử là một công cụ quan trọng trong sinh học phân tử cấu trúc và thiết kế thuốc với sự hỗ trợ của máy tính Một trong những ứng dụng quan trọng của mô phỏng tương tác phân tử là sàng lọc các hợp chất có hoạt tính sinh học dựa trên các mục tiêu phân tử cụ thể
1.6 Thành phần hóa học và tác dụng liên quan đến COVID-19 của Xuyên tâm
liên, Thanh cao hoa vàng và Hoàng cầm
1.6.1 Xuyên tâm liên
Tên khoa học: Andrographis paniculata (Burm.f.) Nees., Acanthaceae
Bộ phận dùng: Bộ phận trên mặt đất
Thành phần hoá học chính: Flavonoid, diterpen lacton Các hợp chất trong Xuyên
tâm liên được trình bày chi tiết ở Phụ lục 2
Tác dụng ức chế SARS-CoV-2: Xuyên tâm liên và thành phần hóa học chính -
andrographolid thể hiện tác dụng ức chế SARS-CoV-2 in vitro mạnh và rõ rệt với giá
trị IC50 lần lượt là 0,036 µg/ml và 0,034 µM [39]
Tác dụng chống viêm: Dịch chiết methanol của Xuyên tâm liên thể hiện tác dụng
ức chế đáng kể triệu chứng viêm do carrageenan gây ra ở chuột BALB/c [43] Dịch chiết Xuyên tâm liên đã ngăn chặn sự xâm nhập của bạch cầu trung tính và tế bào lympho, làm giảm đáng kể việc sản xuất quá mức các cytokin và chemokin bao gồm IL-1β, IL-
6, CXCL-1, MCP-1 và RANTES theo cách phụ thuộc vào liều lượng Hơn nữa, Xuyên
tâm liên còn có thể ngăn chặn sự kích hoạt con đường NF-κB do mầm bệnh gây ra [60]
Tác dụng điều hòa miễn dịch: Nghiên cứu sử dụng 200mg sản phẩm chiết chuẩn
Trang 21hỗ trợ (T helper cell) tại ngày thứ 7 và ngày thứ 30 đồng thời giảm đáng kể IFN-γ, IL-4
và IL-2 ở ngày thứ 30 [36]
Tác dụng hạ sốt: Dịch chiết Xuyên tâm liên trong nước và cloroform đều cho
thấy tác dụng hạ sốt ở chuột khi so sánh với chiết xuất ete dầu hỏa và methanol, tác dụng
do các thành phần diterpen lacton [9, 11, 45]
1.6.2 Thanh cao hoa vàng
Tên khoa học: Artemisia annua L., Asteraceae
Bộ phận dùng: Bộ phận trên mặt đất
Thành phần hoá học chính: Flavonoid, sesquirterpen lacton Các hợp chất trong
Thanh cao hoa vàng được trình bày chi tiết ở Phụ lục 5
Tác dụng ức chế SARS-CoV-2: Cao chiết nước nóng từ Thanh cao hoa vàng có
tác dụng ức chế SARS-CoV-2 trong tế bào Vero E6 in vitro với IC50 là 8,7 µg/ml Artemisinin là thành phần chính cũng thể hiện tác dụng với IC50 là 70 µM [32]
1.6.3 Hoàng cầm
Tên khoa học: Scutellaria baicalensis Georgi., Lamiaceae
Bộ phận dùng: Rễ
Thành phần hoá học chính: Flavonoid, alcaloid Các hợp chất trong Hoàng cầm
được trình bày chi tiết ở Phụ lục 8
Tác dụng ức chế SARS-CoV-2: Cao chiết ethanol 70% của Hoàng cầm có tác
dụng ức chế sự nhân lên của SARS-CoV-2 in vitro với giá trị IC50 là 8,5 µg/ml Thành phần chính là baicalein cũng có khả năng ức chế SARS-CoV-2 với giá trị IC50 là 0,39
µM [27]
Tác dụng chống viêm: Hoàng cầm đã được nghiên cứu khả năng chống viêm
thông qua việc ức chế tạo ra NO, COX2, PEG2 [56] và các cytokin, chemokin [56, 58]
Tác dụng chống viêm được thử nghiệm in vivo thể hiện thông qua việc làm giảm phù
chân chuột do carrageenan gây ra [20]
Trang 22CHƯƠNG 2 ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU
2.1 Nguyên vật liệu, thiết bị
Thiết bị sử dụng để nghiên cứu in silico là máy tính
Các phần mềm: Cytoscape 3.8.0, Microsoft Excel, Venny 2.0, ShinyGO 0.7.4, MoE 2009
Các cơ sở dữ liệu: GeneCards, Uniprot, STRING, SwissTargetPrediction
2.2 Nội dung nghiên cứu
2.2.1 Thu thập thông tin về đích tác dụng liên quan tới COVID-19 trên người
(CSDL1)
2.2.2 Thu thập thông tin về thành phần hóa học của Xuyên tâm liên, Thanh cao hoa
vàng, Hoàng cầm và sàng lọc các hợp chất đạt yêu cầu về sinh khả dụng đường uống
2.2.3 Thu thập thông tin về đích tác dụng của các hợp chất trong các cây thuốc
(CSDL2) Xác định các đích tác dụng tiềm năng
2.2.4 Xây dựng và phân tích mạng lưới hợp chất - đích tác dụng tiềm năng Từ đó
chỉ ra các hợp chất tiềm năng tác dụng định hướng điều trị COVID-19 của các cây thuốc
2.2.5 Xây dựng và phân tích mạng lưới tương tác protein - protein (Protein-protein
interaction - PPI) của các đích tác dụng tiềm năng Từ đó chỉ ra các đích tác dụng trung tâm của mạng lưới
2.2.6 Phân tích làm giàu GO và con đường KEGG
2.2.7 Mô phỏng tương tác phân tử của các hợp chất tiềm năng với protein của
SARS-CoV-2
2.3 Sơ đồ thiết kế nghiên cứu
Sơ đồ thiết kế nghiên cứu được trình bày ở Hình 2.1
Trang 23Hình 2.1 Sơ đồ thiết kế nghiên cứu
Trang 242.4 Phương pháp nghiên cứu
2.4.1 Phương pháp thu thập thông tin về đích tác dụng liên quan tới COVID-19
(CSDL1)
GeneCards [37] (https://www.genecards.org/) là một cơ sở dữ liệu về gen của con người cung cấp thông tin về gen, proteomic, phiên mã, di truyền và chức năng về tất cả các gen người đã biết và được dự đoán Các gen liên quan tới COVID-19 trên người (CSDL1) được thu thập từ cơ sở dữ liệu GeneCards, sử dụng từ khóa “SARS-CoV-2, COVID-19” Tập hợp các gen này sẽ hình thành cơ sở dữ liệu về các đích tác
dụng liên quan tới COVID-19 trên người (CSDL1), được trình bày ở Phụ lục 1
2.4.2 Phương pháp thu thập thông tin về thành phần hóa học của cây thuốc và sàng
lọc các hợp chất đạt yêu cầu về sinh khả dụng đường uống
TCMSP (The traditional Chinese medicine systems pharmacology database and
analysis platform) [38] là một cơ sở dữ liệu chứa hơn 499 dược liệu có trong Dược điển Trung Quốc, với gần 30.000 hoạt chất, 3.400 đích tác dụng và hơn 800 các bệnh liên
quan Tìm kiếm trên TCMSP với từ khóa là tên khoa học của cây thuốc (Andrographis
paniculata, Artemisia annua, Scutellaria baicalensis) Tuy nhiên, trong TCMSP vẫn
còn chưa được cập nhật đầy đủ thông tin về thành phần hóa học của Xuyên tâm liên Do
đó thành phần hóa học của cây thuốc này sẽ được thu thập thêm từ một số nguồn thông tin khác như PubMed, Google Scholar
Các hợp chất thu thập được sẽ được quản lý theo ID và tiến hành dự đoán các đặc tính về sinh khả dụng đường uống (OB) sử dụng phần mềm ADMETlab 2.0 [53] Thông số đánh giá sinh khả dụng đường uống là F(30%), nhận các giá trị nằm trong khoảng từ 0 đến 1 Các hợp chất có giá trị F(30%) 0,3 có xác suất sinh khả dụng đường uống trên 30% tốt nhất sẽ được lựa chọn [64]
2.4.3 Phương pháp thu thập thông tin về đích tác dụng của các hợp chất trong cây
thuốc (CSDL2)
SwissTargetPrediction (STD) (http://www.swisstargetprediction.ch/index.php) [15] là một công cụ giúp dự đoán chính xác mục tiêu của các phân tử hoạt tính sinh học dựa trên sự kết hợp của các phép đo độ tương đồng 2D và 3D với các phối tử đã biết Các hợp chất đạt yêu cầu về sinh khả dụng đường uống sẽ được chuẩn hóa công thức
dưới dạng SMILES (Simplified Molecular Input Line Entry System - hệ thống nhập dòng
đầu vào phân tử được đơn giản hóa) bằng Chemdraw 16.0 và đưa vào STD để thu được
cơ sở dữ liệu các đích tác dụng trên người của những hợp chất này (CSDL2)
Các đích tác dụng cuối cùng được chuẩn hóa tên thông qua cơ sở dữ liệu Uniprot (https://www.uniprot.org/) [8] để thuận tiện cho việc phân tích và so sánh
Trang 252.4.4 Phương pháp xây dựng và phân tích mạng lưới hợp chất - đích tác dụng tiềm
năng
Với mỗi cây thuốc, tiến hành xác định các đích chung (các đích tiềm năng) của
cơ sở dữ liệu các đích tác dụng trên người của các hợp chất trong cây (CSDL2) và cơ sở
dữ liệu các gen liên quan tới COVID-19 trên người (CSDL1) Mạng lưới hợp chất - đích tác dụng tiềm năng được trực quan hóa bằng phần mềm Cytoscape 3.8.0 [42]
Phân tích các tham số bậc (degree), độ trung tâm (betweenness) và độ gần (closeness) trong mạng nhờ ứng dụng CytoNCA tích hợp trong Cytoscape Trong đó, tham số Bậc (degree) của một nút là số liên kết của nút đó với các nút khác trong mạng
Độ trung tâm (betweenness) của nút là số con đường ngắn nhất đi qua nút đó Độ gần (closeness) là khoảng cách lý thuyết tới tất cả các nút khác đã kết nối Các tham số này
của một hợp chất càng lớn thì hợp chất đó càng có vai trò quan trọng trong mạng lưới [13] Phân tích chọn ra các hợp chất dẫn đầu về mỗi tham số trên thu được 3 tập hợp hợp chất Các hợp chất tiềm năng được xác định là các hợp chất nằm trong vùng giao của 3 tập hợp trên
2.4.5 Phương pháp xây dựng và phân tích mạng lưới tương tác protein - protein
(Protein-protein interaction - PPI)
Các đích tiềm năng được nhập vào cơ sở dữ liệu STRING để xây dựng mạng lưới tương tác protein - protein (PPI) Mạng lưới tương tác được trực quan hoá bằng
Cytoscape 3.8.0 và phân tích chỉ ra các đích tiềm năng dẫn đầu về mỗi tham số bậc (degree), độ trung tâm (betweenness) và độ gần (closeness) bằng CytoNCA thu được 3
tập hợp đích tác dụng Các đích trung tâm của mạng lưới là các đích nằm trong vùng giao của 3 tập hợp trên Các đích này đóng vai trò trong tác dụng định hướng điều trị COVID-19 của cây thuốc
2.4.6 Phương pháp phân tích làm giàu GO và con đường KEGG
Các đích tiềm năng được chuẩn hóa danh pháp bằng Uniprot và được đưa vào phần mềm Shinny GO 0.7.4 Từ đó, xác định được 10 chức năng phân tử (MF), thành phần tế bào (CC), quá trình sinh học (BP) và 20 con đường chuyển hoá KEGG liên quan
nhất tới danh sách đích tiềm năng đã nhập vào, với giá trị FDR cận biên (false discovery
rate cutoff) là 0,05 Giá trị FDR càng thấp thì kết quả càng chính xác Giá trị fold
enrichment thu được thông qua so sánh giữa tỉ lệ nền trên tổng số gen trong một loài
nhất định liên quan tới một thuật ngữ GO (GO term) với tỉ lệ thực tế số lượng gen trong
bộ dữ liệu đầu vào liên quan tới thuật ngữ đó [10] Ví dụ, nếu 40/400 gen (tỉ lệ 10% - tỉ
lệ thực tế) trong bộ gen nhập vào có liên quan tới “hoạt động kinase”; và thông tin nền
(backgroud information) cho biết có tất cả 300/30000 gen (tỉ lệ 1% - tỉ lệ nền) có liên
quan tới “hoạt động kinase” Như vậy, fold enrichment được tính bằng 10%/1% = 10 Nhìn chung, giá trị fold enrichment càng cao, thuật ngữ GO đó càng nổi bật đặc trưng
Trang 26cho bộ gen đầu vào Các kết quả làm giàu GO và KEGG trong nghiên cứu được thể hiện
ở dạng biểu đồ điểm (dotplot) và sắp xếp theo thứ tự giảm dần của giá trị fold
enrichment
2.4.7 Phương pháp mô phỏng tương tác phân tử (Molecular docking)
Tiến hành mô phỏng tương tác phân tử giữa các hợp chất tiềm năng trong cây thuốc và các mục tiêu phân tử của SARS-CoV-2 gồm 3CLP, CatL, EndoRNAse, Furin, Helicase, Methyltransferase, PLP, RdRp và S-protein Quá trình mô phỏng tương tác được thực hiện qua 4 bước: lựa chọn và chuẩn bị protein, lựa chọn và chuẩn bị phối tử,
mô phỏng tương tác và đánh giá kết quả Phần mềm MoE 2009 được sử dụng để mô phỏng tương tác giữa hợp chất và protein
Lựa chọn và chuẩn bị protein: Các phân tử protein của virus với cấu trúc xác
định được thu thập từ Protein Data Bank (PDB) (https://www.rcsb.org/) PDB là một cơ
sở dữ liệu cho cấu trúc 3D của nhiều hợp chất sinh học, trong đó có protein và các acid nucleic [35] Sau khi có được cấu trúc 3D của protein, tiến hành loại các phối tử trong cấu trúc (nếu có), loại dung môi, thêm hydro, proton hóa ở pH 7 và gắn trường lực
Lựa chọn và chuẩn bị phối tử: Các phối tử (hợp chất) có thể lấy từ dữ liệu có
sẵn ở PubChem và tự xây dựng công thức từ ChemDraw Các phối tử được chuẩn hoá công thức SMILES, nhập vào phần mềm mô phỏng tương tác MoE 2009 thu được cấu trúc 2D, thêm Hydro, proton hóa ở pH 7 và xác định trạng thái năng lượng tối thiểu
(minimal energy) trong trường lực đã được gắn
Mô phỏng tương tác: Các phối tử được mô phỏng các trạng thái tương tác với
vùng receptor đã lựa chọn Kết quả là giá trị năng lượng liên kết được thể hiện ở dạng biểu đồ nhiệt của phối tử và protein
Đánh giá kết quả: Kết quả mô phỏng tương tác được đánh giá dựa trên giá trị
năng lượng liên kết giữa phối tử và protein Năng lượng liên kết càng nhỏ thì ái lực liên kết giữa hợp chất và receptor càng lớn Ngoài ra, có thể so sánh năng lượng liên kết của hợp chất với một chất đối chiếu giúp dự đoán được mức độ ý nghĩa của tương tác
Trang 27CHƯƠNG 3 THỰC NGHIỆM, KẾT QUẢ VÀ VÀ BÀN LUẬN
3.1 Kết quả thu thập thông tin về đích tác dụng liên quan đến COVID-19
(CSDL1)
Tiến hành tìm kiếm trên cơ sở dữ liệu GeneCards, 3304 đích tác dụng đã được
tìm thấy và xếp hạng theo điểm (score) biểu thị mức độ liên quan với COVID-19 Các
đích tác dụng này được tập hợp thành CSDL1 và được trình bày chi tiết ở
Phụ lục 1
3.2 Kết quả nghiên cứu cây Xuyên tâm liên (Andrographis paniculata (Burm.f.)
Nees., Acanthaceae)
3.2.1 Thu thập thông tin về thành phần hoá học của Xuyên tâm liên và sàng lọc các
hợp chất đạt yêu cầu về sinh khả dụng đường uống
Thông tin về thành phần hóa học của cây Xuyên tâm liên (Andrographis
paniculata (Burm.f.) Nees., Acanthaceae) được thu thập theo phương pháp mô tả ở mục
2.4.2, kết quả thu được 187 hợp chất Sàng lọc các hợp chất đạt yêu cầu về sinh khả dụng đường uống theo phương pháp mô tả ở mục 2.4.2, kết quả thu được 83 hợp chất
với cấu trúc hóa học tương ứng được trình bày chi tiết ở Phụ lục 2
3.2.2 Thu thập thông tin về đích tác dụng của các hợp chất trong Xuyên tâm liên
(CSDL2.1)
Chuẩn hóa công thức SMILES của 83 hợp chất trên bằng cơ sở dữ liệu PubChem (https://pubchem.ncbi.nlm.nih.gov/) 83 hợp chất với công thức SMILES tương ứng được nhập vào SwissTargetPrediction để dự đoán các đích tác dụng của các hợp chất này Kết quả thu được 798 đích tác dụng tương ứng với 83 hợp chất trên
Tiến hành so sánh 798 đích tác dụng trên với 3304 gen có liên quan tới
COVID-19 thu thập được từ GeneCards (CSDL1), thu được COVID-195 đích tác dụng tiềm năng của các hợp chất trong cây Xuyên tâm liên liên quan đến COVID-19 (CSDL2.1), được trình bày
ở Phụ lục 3
3.2.3 Xây dựng và phân tích mạng lưới hợp chất - đích tác dụng tiềm năng của
Xuyên tâm liên
Mạng lưới hợp chất - đích tác dụng tiềm năng được xây dựng bằng phần mềm Cytoscape 3.8.0. Mạng lưới thu được gồm 276 nút tương ứng với 81 hợp chất và 195 đích tác dụng tiềm năng; 1489 cạnh Sơ đồ mạng lưới hợp chất - đích tác dụng tiềm năng
của Xuyên tâm liên được trình bày ở Hình 3.1
Trang 28Hình 3.1 Mạng lưới hợp chất - đích tác dụng tiềm năng của Xuyên tâm liên
Ghi chú: Hình tam giác: các hợp chất; hình tròn: các đích tác dụng Kích thước nút đại diện cho bậc (degree) Các hợp chất được thể hiện bằng ID Tên đầy đủ và công
thức hoá học của hợp chất được trình bày ở Phụ lục 2
Tiến hành phân tích 3 tham số bậc, độ trung tâm và độ gần của các hợp chất
trong mạng lưới Lựa chọn ra 22 hợp chất dẫn đầu về mỗi tham số trên thu được 3 tập hợp các hợp chất Các hợp chất tiềm năng được xác định là các hợp chất nằm trong vùng
giao của 3 tập hợp trên Biểu đồ ven phân tích các tham số được trình bày ở Hình 3.2
Trang 29Hình 3.2 Biểu đồ phân tích các tham số của các đích tác dụng trong mạng lưới tương
tác hợp chất – đích tác dụng của Xuyên tâm liên
Kết quả phân tích các tham số ở biểu đồ Hình 3.2 thu được 7 hợp chất tiềm năng trong tác dụng định hướng điều trị COVID-19 của Xuyên tâm liên, được trình bày ở
Bảng 3.1
Bảng 3.1 7 hợp chất tiềm năng trong tác dụng định hướng
điều trị COVID-19 của Xuyên tâm liên
Trang 30Hình 3.3 Mạng lưới tương tác protein-protein (PPI) của Xuyên tâm liên
Ghi chú: Kích thước của nút thể hiện cho bậc (degree) của chúng Màu sắc của nút thể hiện cho độ trung tâm (betweenness) (độ trung tâm càng lớn nút có màu càng đậm) và độ dày viền của nút thể hiện cho độ gần (closeness)
Tiến hành phân tích 3 tham số bậc, độ trung tâm và độ gần của các đích tác dụng
trong mạng lưới Lựa chọn ra 10 đích tiềm năng dẫn đầu về mỗi tham số trên thu được
3 tập hợp đích tác dụng Các đích trung tâm của mạng lưới được xác định là các đích nằm trong vùng giao của 3 tập hợp trên Biểu đồ ven phân tích các tham số được trình
bày ở Hình 3.4 Kết quả thu được 7 đích trung tâm của mạng lưới có vai trò quan trọng trong tác dụng định hướng điều trị COVID-19 của Xuyên tâm liên là: TNF, AKT1, IL6,
IL1B, EGFR, HSP90AA1 và MAPK3
Trang 31Hình 3.4 Biểu đồ phân tích các tham số của các đích tác dụng trong mạng lưới PPI
của Xuyên tâm liên
3.2.5 Phân tích làm giàu GO và con đường KEGG của Xuyên tâm liên
Thực hiện phân tích làm giàu GO và con đường KEGG theo phương pháp mô tả
ở mục 2.4.6 với 195 đích tác dụng tiềm năng của Xuyên tâm liên (CSDL 2.1) Kết quả
phân tích chức năng phân tử (molecular function), thành phần tế bào (cellular
component), các quá trình sinh học (biological process) và các con đường KEGG được
trình bày dưới dạng biểu đồ tương ứng ở các Hình 3.5 - Hình 3.8 Các quá trình và chức năng phân tử được sắp xếp theo độ giá trị tăng dần của giá trị fold enrichment Kích
thước của điểm đại diện cho số gen cùng tham gia vào một con đường Màu sắc của
điểm đại diện cho giá trị FDR (false discovery rate)
Hình 3.5 Kết quả làm giàu GO – Chức năng phân tử của Xuyên tâm liên
Trang 32Hình 3.6 Kết quả làm giàu GO – Thành phần tế bào của Xuyên tâm liên
Hình 3.7 Kết quả làm giàu GO – Quá trình sinh học của Xuyên tâm liên
Nhận xét: Kết quả làm giàu GO cho thấy các đích tiềm năng của Xuyên tâm liên tham gia chủ yếu vào các quá trình sinh học gồm: đáp ứng với hợp chất hữu cơ vòng
(response to organic cyclic compound), đáp ứng với hợp chất chứa oxy (response to
oxygen-containing compound), hoạt hoá tế bào bạch cầu (leukocyte activation), hoạt hoá
và di cư tế bào (cell activation/cell migration), điều hoà quá trình tăng sinh quần thể tế bào (regulation of cell population proliferation) và điều hoà chết tế bào theo chu trình (regulation of programmed cell death) Đây là các quá trình có thể dẫn tới phản ứng
viêm, sinh miễn dịch và có liên quan tới “cơn bão cytokin” trong cơ chế bệnh sinh của
COVID-19 được trình bày ở Hình 3.9
Trang 33Hình 3.8 Kết quả phân tích các con đường KEGG của Xuyên tâm liên
Nhận xét: Các con đường quan trọng trong kết quả phân tích KEGG là: con đường
chuyển hoá carbon trung tâm trong ung thư (central carbon metabolism in cancer), đề kháng ức chế EGFR tyrosin kinase (EGFR tyrosine kinase inhibitor resistance), ung thư tuyến tiền liệt (prostate cancer), con đường biểu hiện PD-L1 và điểm kiểm tra PD-1 trong ung thư (PD-L1 expression and PD-1 checkpoint pathway in cancer)
Cơ chế tác dụng của Xuyên tâm liên hướng tới COVID-19 có thể thông qua các con đường KEGG liên quan tới quá trình như: con đường tín hiệu AGE-RAGE trong
biến chứng tiểu đường (AGE-RAGE signaling pathway in diabetic complications), biệt hoá tế bào Th17 (Th17 cell differentiation), con đường tín hiệu chemokin (chemokine
signaling pathway) và con đường tín hiệu PI3K-Akt (PI3K-Akt signaling pathway) Các
con đường này sẽ được phân tích kỹ ở phần bàn luận
Đáng chú ý, các đích tác dụng tiềm năng của Xuyên tâm liên còn tham gia vào
con đường gây viêm và phản ứng quá viêm (hyper-imflammation) do cơn bão cytokin
trong cơ chế bệnh sinh của COVID-19, được trình bày ở sơ đồ Hình 3.9
Trang 34Hình 3.9 Con đường bệnh sinh của COVID-19, trong đó các đích tác dụng tiềm năng
Trang 353.2.6 Mô phỏng tương tác phân tử
Kết quả mô phỏng tương tác của 7 hợp chất tiềm năng trong Xuyên tâm liên với các mục tiêu phân tử của SARS-CoV-2 được trình bày dưới dạng bảng số liệu ở
Phụ lục 4 Giá trị năng lượng liên kết của phối tử càng nhỏ hơn mẫu chuẫn thì ái lực
liên kết của phối tử đó với protein virus càng lớn Biểu đồ nhiệt mô phỏng tương tác
phân tử của 7 hợp chất được trình bày ở Hình 3.10
Hình 3.10 Biểu đồ nhiệt mô phỏng tương tác của 7 hợp chất tiềm năng trong
Xuyên tâm liên Ghi chú: Màu đỏ là các giá trị năng lượng liên kết nhỏ hơn chuẩn (ái lực tốt hơn) và ngược lại; độ đậm của màu sắc thể hiện sự chênh lệch với giá trị năng lượng liên kết
của chất chuẩn
Nhận xét: Từ kết quả mô phỏng tương tác phân tử được trình bày ở Hình 3.10
cho thấy 7 hợp chất tiềm năng trong Xuyên tâm liên đều có khả năng gắn tốt với 2 mục tiêu phân tử của SARS-CoV-2 là EndoRNAse và Helicase (7/7 hợp chất) với giá trị năng lượng liên kết của phối tử với protein nhỏ hơn năng lượng liên kết của chất chuẩn Điều này chứng tỏ EndoRNAse và Helicase là hai mục tiêu phân tử của SARS-CoV-2 cần được quan tâm trong quá trình nghiên cứu phát triển thuốc điều trị COVID-19 từ Xuyên tâm liên
Đáng chú ý, trong số 7 hợp chất tiềm năng trên, hợp chất ID 63 và ID 69 có khả
năng tương tác đồng thời với nhiều mục tiêu phân tử của virus (3CLP, CatL, EndoRNAse, Furin, Helicase, Methyltransferase, PLP, RdRp và S-protein) với năng lượng liên kết thấp (liên kết bền vững) Đây là những hợp chất quan trọng nhất liên quan đến tác dụng định hướng điều trị COVID-19 của Xuyên tâm liên Tên và cấu trúc hóa
học của 2 hợp chất này được trình bày ở Hình 3.11
Trang 36Hình 3.11 2 hợp chất quan trọng nhất liên quan đến tác dụng định hướng điều trị
COVID-19 của Xuyên tâm liên
3.3 Kết quả nghiên cứu cây Thanh cao hoa vàng (Artemisia annua L.,
Asteraceae)
3.3.1 Thu thập thông tin về thành phần hoá học của Thanh cao hoa vàng và sàng
lọc các hợp chất đạt yêu cầu về sinh khả dụng đường uống
Thành phần hóa học của cây Thanh cao hoa vàng (Artemisia annua L.,
Asteraceae) được thu thập theo phương pháp mô tả ở mục 2.4.2, kết quả thu được 126 hợp chất Trong số đó có 21 hợp chất đạt yêu cầu về sinh khả dụng đường uống được
trình bày ở chi tiết ở Phụ lục 5
3.3.2 Thu thập thông tin về đích tác dụng của các hợp chất trong Thanh cao hoa
vàng (CSDL2.2)
Thông tin về các đích tác dụng được tìm kiếm theo phương pháp ở mục 2.4.3, kết quả thu được 272 đích tác dụng tương ứng với 21 hợp chất trên và 72 đích tác dụng tiềm năng của các hợp chất trong cây Thanh cao hoa vàng liên quan đến COVID-19
(CSDL2.2) được trình bày ở Phụ lục 6
3.3.3 Xây dựng và phân tích mạng lưới hợp chất - đích tác dụng tiềm năng của
Thanh cao hoa vàng
Mạng lưới hợp chất - đích tác dụng tiềm năng được xây dựng bằng phần mềm Cytoscape 3.8.0 gồm 93 nút tương ứng với 21 hợp chất và 72 đích tác dụng; 413 cạnh,
được trình bày ở Hình 3.12
Trang 37Hình 3.12 Mạng lưới hợp chất - đích tác dụng tiềm năng của Thanh cao hoa vàng
Ghi chú: Hình tam giác: các hợp chất; hình tròn: các đích tác dụng Kích thước nút đại diện cho bậc (degree) Các hợp chất được thể hiện bằng ID Tên đầy đủ và công
thức hoá học của hợp chất được trình bày ở Phụ lục 5
Tiến hành phân tích 3 tham số bậc, độ trung tâm và độ gần của các hợp chất
trong mạng lưới Lựa chọn ra 12 hợp chất dẫn đầu về mỗi tham số trên thu được 3 tập hợp hợp chất Các hợp chất tiềm năng được xác định là các hợp chất nằm trong vùng giao của 3 tập hợp trên Kết quả thu được 6 hợp chất tiềm năng trong tác dụng định
hướng điều trị COVID-19 của Thanh cao hoa vàng gồm: Luteolin (ID 13); cirsiliol (ID
6); quercetin (ID 15); areapillin (ID 2); kaempferol (ID 12) và skrofulein (ID 17) Các
hợp chất tiềm năng trên đều thuộc nhóm flavonoid
3.3.4 Xây dựng và phân tích mạng lưới tương tác protein - protein (PPI) của Thanh
cao hoa vàng
Xây dựng mạng lưới tương tác protein-protein của 72 đích tác dụng tiềm năng theo phương pháp mô tả ở mục 2.4.5 Mạng PPI thu được gồm 72 nút và 323 cạnh, được
trình bày ở Hình 3.13
Trang 38Hình 3.13 Mạng lưới tương tác protein-protein (PPI) của Thanh cao hoa vàng
Ghi chú: Kích thước của nút thể hiện cho bậc (degree) của chúng Màu sắc của nút thể hiện cho độ trung tâm (betweenness) (độ trung tâm càng lớn nút có màu càng đậm) và độ dày viền của nút thể hiện cho độ gần (closeness)
Tiến hành phân tích 3 tham số bậc, độ trung tâm và độ gần của các đích tác dụng trong mạng lưới theo phương pháp mô tả ở mục 2.4.5, kết quả thu được 6 đích trung tâm
của mạng là AKT1, HSP90AA1, EGFR, MAPK3, MAPK1 và PPARA Các đích
trung tâm này có vai trò quan trọng trong cơ chế tác dụng định hướng điều trị
COVID-19 của Thanh cao hoa vàng
3.3.5 Phân tích làm giàu GO và con đường KEGG của Thanh cao hoa vàng
Kết quả phân tích chức năng phân tử (molecular function), thành phần tế bào (cellular component), các quá trình sinh học (biological process) và các con đường
KEGG của Thanh cao hoa vàng được trình bày dưới dạng biểu đồ tương ứng ở Hình
3.14 - Hình 3.17
Trang 39Hình 3.14 Kết quả làm giàu GO – Chức năng phân tử của Thanh cao hoa vàng
Hình 3.15 Kết quả làm giàu GO – Thành phần tế bào của Thanh cao hoa vàng
Hình 3.16 Kết quả làm giàu GO – Quá trính sinh học của Thanh cao hoa vàng
Trang 40Nhận xét: Kết quả làm giàu GO cho thấy các đích tiềm năng của Thanh cao hoa vàng tham gia chủ yếu vào các quá trình sinh học gồm: đáp ứng với hợp chất hữu cơ
vòng (response to organic cyclic compound), đáp ứng với hợp chất chứa oxy (reaction
to oxygen-containing compound), điều hoà các quá trình sinh vật đa bào (regulation of multicellular organismal process), điều hoà chết tế bào theo chu trình (regulation of programmed cell death), điều hoà quá trình tăng sinh quần thể tế bào (regulation of cell population proliferation) Đây là các quá trình có thể dẫn tới phản ứng viêm, sinh miễn
dịch và có liên quan tới “cơn bão cytokin” trong cơ chế bệnh sinh COVID-19 được trình
bày ở Hình 3.18
Hình 3.17 Kết quả phân tích các con đường KEGG của Thanh cao hoa vàng
Nhận xét: Cơ chế tác dụng của Thanh cao hoa vàng hướng tới COVID-19 có thể thông qua các con đường KEGG: con đường biểu hiện PD-L1 và điểm kiểm tra PD-1
trong ung thư (PD-L1 expression and PD-1 checkpoint pathway in cancer), con đường tín hiệu PI3K-AKT (PI3K-AKT signaling pathway)
Đáng chú ý, các đích tác dụng tiềm năng của Thanh cao hoa vàng còn tham gia
vào con đường gây viêm và phản ứng quá viêm (hyper-imflammation) do cơn bão
cytokin trong cơ chế bệnh sinh COVID-19, được trình bày ở Hình 3.18