1. Trang chủ
  2. » Luận Văn - Báo Cáo

XÂY DỰNG MÔ HÌNH PHÂN LOẠI VÀ DỰ ĐOÁN HOẠT TÍNH ỨC CHẾ βSECRETASE

100 131 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 100
Dung lượng 2,97 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

βsecretase là một enzyme thuộc nhóm aspartyl protease, là một trong hai enzyme tham gia vào quá trình sinh tổng hợp βAmyloid. βsecretase là BACE (βsite of Amyloid precursor protein Cleaving Enzyme) hay Memapsin2. BACE gồm 2 loại: BACE1 và BACE2 nhƣng tập trung với nồng độ cao trong tế bào thần kinh phần lớn là BACE1 nhƣ trong trong hồi hải mã, tiểu não và vùng thùy trán của não bộ. Vì vậy ức chế βsecretase là một trong những giải pháp cho bệnh Alzheimer. Trong đề tài này, các mô hình 2DQSAR, QSAR nhị phân, docking và 3DPharmacophore đƣợc thực hiện nhằm tìm ra các đặc trƣng cấu trúc cần thiết cho một chất ức chế βsecretase cũng nhƣ giúp dự đoán khả năng ức chế βsecretase của các thuốc có mặt trên thị trƣờng. Đối tƣợng và phƣơng pháp nghiên cứu Mô hình 2DQSAR đƣợc xây dựng dựa trên thuật toán bình phƣơng tối thiểu toàn phần PLS (MOE) trên tập cơ sở dữ liệu gồm 315 chất có giá trị IC50. Trên cùng tập cơ sở dữ liệu gồm 315 chất, mô hình QSAR nhị phân đƣợc tiến hành bằng phƣơng pháp Binary (MOE). Protein đƣợc chuẩn bị bằng công cụ LigX và ligand đƣợc tối thiểu hóa năng lƣợng bằng Sybyl X2.0. Công cụ FlexX tích hợp trong LeadIT đƣợc sử dụng để thực hiện docking. Kết quả đƣợc phân tích dựa trên sự kết hợp giữa điểm số docking và mô hình tƣơng tác Ligand interactions của MOE. 13 chất có hoạt tính mạnh đại diện cho các cấu trúc khác nhau đƣợc chọn làm cơ sở dữ liệu xây dựng mô hình Pharmacophore. Tập đánh giá gồm 302 chất đƣợc sử dụng để kiểm tra độ tin cậy của mô hình

Trang 2

PHẠM PHAN THÔNG

XÂY DỰNG MÔ HÌNH PHÂN LOẠI VÀ DỰ ĐOÁN HOẠT TÍNH ỨC CHẾ

β-SECRETASE

KHÓA LUẬN TỐT NGHIỆP DƯỢC SĨ ĐẠI HỌC

Giáo viên hướng dẫn: PGS.TS THÁI KHẮC MINH

Thành phố Hồ Chí Minh – Năm 2016

Trang 3

MỤC LỤC

DANH MỤC TỪ VIẾT TẮT VI

DANH MỤC BẢNG VII

DANH MỤC HÌNH VIII

LỜI CẢM ƠN X

1 ĐẶT VẤN ĐỀ 1

2 TỔNG QUAN TÀI LIỆU 3

2.1 SƠ LƯỢC VỀ ENZYM β-SECRETASE 3

2.2 CƠ CHẾ HOẠT ĐỘNG CỦA β-SECRETASE 4

2.3 QUÁ TRÌNH SINH TỔNG HỢP β-AMYLOID 5

2.4 SƠ LƯỢC VỀ BỆNH ALZHEIMER 7

2.5 SỰ TƯƠNG QUAN GIỮA β-SECRETASE VÀ BỆNH ALZHEIMER 7

2.6 CÁC CHẤT ỨC CHẾ β-SECRETASE 8

2.7 PHƯƠNG PHÁP XÁC ĐỊNH HOẠT TÍNH ỨC CHẾ β-SECRETASE 9

2.8 MỐI QUAN HỆ ĐỊNH LƯỢNG GIỮA CẤU TRÚC VÀ TÁC DỤNG – QSAR 10

2.9 MÔ HÌNH MÔ TẢ PHÂN TỬ DOCKING 11

2.9.1 Khái niệm Docking 11

2.9.2 Docking bằng phần mềm FlexX 12

2.10 MÔ HÌNH 3D-PHARMACOPHORE 16

Trang 4

3 PHƯƠNG PHÁP NGHIÊN CỨU 19

3.1 CÁC BƯỚC TIẾN HÀNH XÂY DỰNG MÔ HÌNH 2D-QSAR 19

3.1.1 Cơ sở dữ liệu 20

3.1.2 Tính toán thông số mô tả 23

3.1.3 Chia tỷ lệ thông số mô tả 24

3.1.4 Lựa chọn thông số mô tả 25

3.1.5 Loại chất gây nhiễu 25

3.1.6 Xây dựng mô hình QSAR 26

3.1.7 Đánh giá mô hình QSAR 27

3.1.8 Dự đoán hoạt tính sinh học 29

3.2 XÂY DỰNG MÔ HÌNH QSAR NHỊ PHÂN 29

3.2.1 Các bước tiến hành xây dựng mô hình QSAR nhị phân 29

3.2.2 Tiêu chí đánh giá mô hình 31

3.3 XÂY DỰNG MÔ HÌNH DOCKING MÔ TẢ PHÂN TỬ 33

3.3.1 Chuẩn bị protein bằng công cụ LigX 33

3.3.2 Chuẩn bị ligand bằng Sybyl – X2.0 33

3.3.3 Chọn lựa thông số cho chương trình mô tả phân tử docking LeadIT 35

3.3.4 Re-docking (docking lặp lại) 36

3.3.5 Đánh giá kết quả 36

3.4 MÔ HÌNH PHARMACOPHORE 37

3.4.1 Các bước xây dựng mô hình Pharmacophore 37

3.4.2 Cơ sở dữ liệu 38

3.4.3 Tạo cấu dạng các hợp chất 38

3.4.4 Xây dựng mô hình Pharmacophore 39

3.4.5 Đánh giá mô hình Pharmacophore 39

3.4.6 Ứng dụng mô hình Pharmacophore 39

4 KẾT QUẢ VÀ BÀN LUẬN 40

4.1 MÔ HÌNH 2D-QSAR DỰ ĐOÁN HOẠT TÍNH ỨC CHẾ ENZYM

β-SECRETASE 40

4.1.1 Mô hình 2D-QSAR dự đoán hoạt tính ức chế enzym β-secretase trên toàn bộ tập dữ liệu 40

Trang 5

4.2 MÔ HÌNH QSAR NHỊ PHÂN TRÊN CÁC CHẤT ỨC CHẾ β-SECRETASE

46

4.3 MÔ HÌNH DOCKING MÔ TẢ PHÂN TỬ 50

4.3.3 Kết quả redock 50

4.3.4 Kết quả docking của nhóm cấu trúc peptidomimetic 50

4.3.5 Kết quả docking của nhóm cấu trúc non-peptid 54

4.4 MÔ HÌNH 3D PHARMACOPHORE 57

4.4.3 Các mô hình Pharmacophore xây dựng đƣợc 57

4.4.4 Lựa chọn mô hình Pharmacophore 62

4.5 ỨNG DỤNG MÔ HÌNH SÀNG LỌC ẢO 63

5 KẾT LUẬN VÀ ĐỀ NGHỊ 65

TÀI LIỆU THAM KHẢO 67

Trang 6

Thầy hướng dẫn: PGS TS Thái Khắc Minh

Đặt vấn đề

β-secretase là một enzyme thuộc nhóm aspartyl protease, là một trong hai enzyme tham gia

vào quá trình sinh tổng hợp β-Amyloid β-secretase là BACE (β-site of Amyloid precursor

protein Cleaving Enzyme) hay Memapsin2 BACE gồm 2 loại: BACE1 và BACE2 nhưng

tập trung với nồng độ cao trong tế bào thần kinh phần lớn là BACE1 như trong trong hồi

hải mã, tiểu não và vùng thùy trán của não bộ Vì vậy ức chế β-secretase là một trong

những giải pháp cho bệnh Alzheimer Trong đề tài này, các mô hình 2D-QSAR, QSAR nhị

phân, docking và 3D-Pharmacophore được thực hiện nhằm tìm ra các đặc trưng cấu trúc

cần thiết cho một chất ức chế β-secretase cũng như giúp dự đoán khả năng ức chế β-secretase của các thuốc có mặt trên thị trường

Đối tượng và phương pháp nghiên cứu

Mô hình 2D-QSAR được xây dựng dựa trên thuật toán bình phương tối thiểu toàn phần

PLS (MOE) trên tập cơ sở dữ liệu gồm 315 chất có giá trị IC50 Trên cùng tập cơ sở dữ liệu

gồm 315 chất, mô hình QSAR nhị phân được tiến hành bằng phương pháp Binary (MOE)

Protein được chuẩn bị bằng công cụ LigX và ligand được tối thiểu hóa năng lượng bằng

Sybyl X2.0 Công cụ FlexX tích hợp trong LeadIT được sử dụng để thực hiện docking Kết

quả được phân tích dựa trên sự kết hợp giữa điểm số docking và mô hình tương tác Ligand

interactions của MOE 13 chất có hoạt tính mạnh đại diện cho các cấu trúc khác nhau được

chọn làm cơ sở dữ liệu xây dựng mô hình Pharmacophore Tập đánh giá gồm 302 chất

được sử dụng để kiểm tra độ tin cậy của mô hình

Kết quả và bàn luận

Mô hình 2D-QSAR bao gồm 12 thông số mô tả với độ sai lệch trung bình giữa giá trị thực

nghiệm và giá trị dự đoán RMSE = 0,57 và mức độ tương quan R2 = 0,67 Kết quả mô hình

QSAR nhị phân cả 3 ngưỡng hoạt tính có độ đúng trên 0,8 chứng tỏ độ chính xác cao của

mô hình Kết quả mô hình docking của các chất trên khoang gắn kết và các nghiên cứu cho

thấy các acid amin Asp32, Thr72, Gln73, Tyr198, Asp228, Thr232, Asn233, Arg235 và

Arg307 là những acid amin quan trọng trong khoang gắn kết Phân tích tương tác cho thấy

vai trò quan trọng của liên kết hydro và ion đặc biệt là khả năng tạo liên kết hydro và ion

của nitơ đối với Asp228 Hai mô hình Pharmacophore được đề xuất bao gồm mô hình A’1

và mô hình B’1 gồm 2 điểm kỵ nước, 2 vị trí nhận hydro và 1 vị trí cho hydro với khả năng

dự đoán lần lượt là 59,60% và 80,13%

Kết luận

Kết quả mô hình 2D-QSAR tương đối tốt với mức sai lệch của giá trị dự đoán so với các

giá trị thực nghiệm là khoảng 0,73 µM Kết quả của mô hình QSAR nhị phân trên các chất

có hoạt tính cả 3 ngưỡng hoạt tính đều cao có thể dự đoán tốt trên các chất có hoạt tính

ức chế β-secretase Kết quả mô hình docking cho thấy vị trí các acid amin quan

trọng, vai trò của các liên kết hydro, ion, kỵ nước và Van der Waals của tương tác

ligand với protein Bên cạnh đó, hai mô hình Pharmacophore xây dựng được có khả

năng dự đoán tốt các chất ức chế β-secretase tiềm năng, góp phần làm giảm công

sức và thời gian nghiên cứu, đồng thời mang loại lợi ích kinh tế trong quá trình

khám phá thuốc mới

Trang 7

Introduction

Beta-secretase is an enzyme belonging to the aspartyl protease group, it is one of the two main enzymes responsible for the synthesis of beta-amyloid Beta-secretase is a BACE (beta-site of amyloid precursor protein cleaving enzyme) or Memapsin2 BACE consists of

2 types: BACE1 and BACE2, but only BACE1 is at a high concentration in neurons Therefore, inhibiting beta-secretase is one of the possible solutions for Alzheimer In this study, the 2D-QSAR, binary QSAR, docking, and 3D-pharmacophore models were generated to figure out the structure(s) of a potential beta-secretase inhibitor, and to predict the inhibitory effect against beta-secretase, if there were any, of several drugs available in the market

Materials and methods

The 2D-QSAR model was built based on the PLS (MOE) method with the database comprised of 315 compounds along with their IC50 values On the same database, the binary QSAR model was built based on the Binary (MOE) method The proteins were prepared with the LigX application in the MOE 2008.10 software, and the ligands were energy-minimized in the Sybyl-X 2.0 software The FlexX application in the LeadIT 2.0.2 software was used to conduct the docking process The results were analyzed based on both the docking scores obtained and the interaction models (ligand interactions) in MOE

13 compounds with strong predicted inhibitory effects representing different chemical structures were selected as the database for the design of the pharmacophore models The testing set of 302 compounds was used to validate the predictive capacity of the models

Results and discussion

The 2D-QSAR model consisted of 12 descriptive parameters with an RMSE mean value of 0.57 and R2 = 0.67 The binary QSAR model indicated that all 3 activity thresholds resulted in an accuracy value above 0.8, inferring that the model’s precision was at a high level The docking results suggested that the amino acids Asp32, Thr72, Gln73, Tyr198, Asp228, Thr232, Asn233, Arg235 and Arg307 were important amino acids in the binding pocket The hydrogen bonds and the ionic bonds existing between the ligands and the receptors were crucial for the ligand-enzyme interactions, especially those involving the amino acid Asp228 The two generated pharmacophore models including the A’1 and the B’1 consisted of 2 hydrophobic centers, 2 hydrogen bond receptors and 1 hydrogen bond donor with the respective predictive capacity being 59.60% and 80.13%

Conclusion

The generated 2D-QSAR model exhibited high quality with the disparity between the predicted value and the experiment value being 0.73 mcM The binary QSAR model also predicted the potential beta-secretase inhibitors with a high accuracy The docking model indicated the important amino acids and different bonds (hydrogen bonds, ionic bonds, hydrophobic bonds, van der waals interactions) that involved Besides, 2 generated pharmacophore models were capable of predicting compounds with a potential inhibitory effect against beta-secretase, greatly reducing research time and labor work, leading to an economic advantage during the process of discovering new drugs in the future

Trang 8

Aβ β-Amyloid (protein beta-amyloid)

AD Alzheimer disease (bệnh Alzheimer)

APP Amyloid Precursor Protein (protein tiền chất Amyloid)

BACE β-site of Amyloid precursor protein Cleaving Enzyme (enzyme cắt protein tiền chất Amyloid tại vị trí beta)

BQSAR Binary QSAR (mô hình QSAR nhị phân)

CCC Concordance Correlation Coefficient (hệ số thống nhất tương quan)

FP False Positive (số lượng chất có hoạt tính dự đoán sai)

FN False Negative (số lượng chất không có hoạt tính dự đoán sai)

IC50 50% Inhibitory Concentration (nồng độ tối thiểu ức chế 50%)

L-20%-O Leave - 20% - Out (bỏ - 20% - ra)

LOO Leave One Out (bỏ một ra)

MCC Matthews Correlation Coefficient (hệ số tương quan Mathew)

PCA Principal Components Analysis (phân tích thành phần chính)

PDB Protein Data Bank (ngân hàng protein)

PLS Partial Least Squares (bình phương tối thiêu từng phần)

QSAR Quantitative Structure-Activity Relationship (mối quan hệ định lượng giữa cấu trúc và hoạt tính sinh học)

RMSE Root Mean Square Error (sai số bình phương trung bình)

TP True Positive (số lượng chất có hoạt tính được dự đoán đúng)

TN True Negative (số lượng chất không có hoạt tính được dự đoán đúng)

Trang 9

cơ sở dữ liệu 20

Bảng 3.2 Các nhóm thông số mô tả phân tử 2D tính bằng MOE 24

Bảng 4.1 Mô hình QSAR trung gian từ tập xây dựng và các thông số của mô hình

42

Bảng 4.2 Các giá trị đánh giá nội trên tập xây dựng của mô hình QSAR trung gian 43

Bảng 4.3 Các giá trị đánh giá trên tập ngoại của mô hình QSAR trung gian 43

Bảng 4.4 Mô hình QSAR hoàn chỉnh từ toàn tập dữ liệu và các giá trị đánh giá 44

Bảng 4.5 Kết quả các mô hình QSAR nhị phân trên các chất ức chế β-secretase 46

Bảng 4.6 Kết quả xây dựng mô hình Pharmacophore A1 58

Bảng 4.7 Kết quả đánh giá mô hình Pharmacophore A1 58

Bảng 4.8 Kết quả xây dựng và đánh giá mô hình Pharmacophore nhóm B 60

Bảng 4.9 Kết quả và so sánh khả năng dự đoán giữa các mô hình 62

Trang 10

Hình 2.2 Cấu trúc vùng flap và vòng 10s 4

Hình 2.3 Cơ chế hoạt động của BACE1 5

Hình 2.4 Quá trình phân cắt APP bởi α-secretase hoặc β-secretase và γ-secretase 6

Hình 2.5 Nhóm chất ức chế peptidomimetic 8

Hình 2.6 Nhóm chất ức chế non-peptide 9

Hình 2.7 Cơ chế phương pháp xác định hoạt tính ức chế BACE1 10

Hình 2.8 Cấu trúc của OM99-02 10

Hình 2.9 Giao diện của phần mềm FlexX 13

Hình 2.10 Thuật toán xây dựng docking lớn dần 14

Hình 2.11 Quá trình docking thực hiện bởi FlexX 15

Hình 2.12 Phương pháp xây dựng mô hình 3D-Pharmacophore 17

Hình 3.1 Các bước xây dưng mô hình 2D-QSAR 19

Hình 3.2 Loại nhiễu bằng PCA 26

Hình 3.3 Các bước xây dựng mô hình QSAR nhị phân 31

Hình 3.4 Năng lượng tối thiểu cục bộ và năng lượng tối thiểu toàn phần 35

Hình 3.5 Sơ đồ quá trình xây dựng mô hình Pharmacophore 37

Hình 4.1 Sự phân bố hoạt tính IC50 của các chất ức chế β-secretase theo số lượng

41

Trang 11

Hình 4.3 Biểu đồ thống kê điểm số docking của nhóm cấu trúc peptidomimetic 51

Hình 4.4 Liên kết hydro và ion giữa nhóm NH với Asp228; giữa nhóm SO2 và Arg307 52

Hình 4.5 Mô hình tương tác của BMC-2009-19-3669-11 với acid amin trong khoang gắn kết 52

Hình 4.6 Mô hình tương tác của BMC-2013-23-4674-50 với acid amin trong khoang gắn kết 53

Hình 4.7 Mô hình tương tác của EODD-2013-8-709-39a với acid amin trong khoang gắn kết 54

Hình 4.8 Biểu đồ thống kê điểm số docking của nhóm cấu trúc non-peptid 54

Hình 4.9 Mô hình tương tác của BMC-2014-24-2033-18 với acid amin trong khoang gắn kết 55

Hình 4.10 Mô hình tương tác của BMC-2014-24-2033-19 với acid amin trong khoang gắn kết 56

Hình 4.11 Mô hình tương tác của BMC-2013-23-4239-13 với acid amin trong khoang gắn kết 56

Hình 4.12 Mô hình Pharmacophore A1 57

Hình 4.13 Các mô hình Pharmacophore nhóm B 59

Hình 4.14 Các mô hình Pharmacophore 61

Hình 4.15 Sơ đồ quy trình sàng lọc các thuốc từ ngân hàng Drugbank của mô hình Pharmacophore A’1 63

Hình 4.16 Sơ đồ quy trình sàng lọc các thuốc từ ngân hàng Drugbank của mô hình Pharmacophore B’4 64

Trang 12

Nguyễn Thị Thu Hà đã dành thời gian quý báu để hướng dẫn, góp ý, chỉ bảo và truyền đạt kiến thức cũng như kinh nghiệm một cách tận tình trong thời gian nghiên cứu và hoàn thành khoá luận Bên cạnh đó còn giúp em sửa lỗi và hoàn thiện hơn phần trình bày khóa luận

Em xin cảm ơn chân thành đến cô TS.Nguyễn Thụy Việt Phương đã dành thời gian xem xét và góp ýcho khóa luận của em được hoàn thiện hơn

Em xin gửi lời cảm ơn đến các thầy cô ở bộ môn Hoá Dược: Thầy PGS.TS Lê Minh Trí, Thầy PGS.TS Trương Phương, Cô PGS.TS Huỳnh Thị Ngọc Phương, Thầy PGS.TS Trần Thành Đạo, Thầy TS Trần Ngọc Châu, Chị Đặng Thị Hồng Chi, Chị Lê Thị Hồng Điệp, Chị Ngô Thị Kiều Khương, Cô Võ Thị Ngọc Thảo luôn quan tâm và tạo cho chúng em một môi trường học tập và nghiên cứu vui vẻ, hoà đồng, giàu tình cảm

Cảm ơn “Super lầy Team” đã hỗ trợ và cùng nhau tạo một môi trường làm việc vui vẻ.Cảm ơn các bạn khác cùng nghiên cứu tại bộ môn Hoá Dược đã tạo một môi trường học tập và nghiên cứu hoà đồng, thân thiện

Em xin cảm ơn Chị Võ Thị Minh Nguyên, Anh Trình Đức Thụ đã hướng dẫn bước đầu cho em về mặt kỹ thuật và vận hành chương trình cũng như động viên em trong suốt quá trình làm khoá luận

Trang 13

từ 604 tỷ USD năm 2010 lên 818 tỷ USD năm 2015; tăng 35,4% và chiếm 1,09% GDP toàn cầu[54] Trước tình hình phát triển nhanh của AD và các bệnh liên quan đến hội chứng sa sút trí tuệ, vấn đề cấp thiết là phải tìm ra các phương pháp trị liệu mới có hiệu quả nhằm cải thiện tình trạng cho bệnh nhân

Nhiều giả thuyết được đưa ra về nguyên nhân bệnh AD như sự xuất hiện của mảng β-amyloid (Aβ), đám rối thần kinh Tau, giả thuyết về vai trò của hệ cholinergic, protein REST, các yếu tố liên quan đến di truyền thế nhưng cơ chế bệnh sinh của

AD vẫn chưa được hiểu rõ Trong đó, sự xuất hiện của các mảng Aβ được quan tâm nhiều trong những năm gần đây và enzym β-secretase là nguyên nhân chính gây nên

sự xuất hiện nhiều của các mảng Aβ Vì vậy mục tiêu của đề tài là nghiên cứu ra các hoạt chất có khả năng ức chế β-secretase

Phát triển thuốc mới là một quá trình lâu dài và tốn kém Bên cạnh việc xác định chất khởi nguồn, tối ưu hóa quá trình tổng hợp dẫn chất có hoạt tính, các thử

nghiệm in vitro và in vivo; các dẫn chất tiềm năng còn bước vào giai đoạn thử

nghiệm lâm sàng kéo dài nhiều năm và tốn nhiều chi phí Trong đó quá trình xác định chất khởi nguồn là giai đoạn tốn nhiều thời gian, phức tạp nhất và dễ dẫn đến thất bại Vì vậy mô hình sàng lọc ảo ra đời nhằm khắc phục những nhược điểm của quá trình tìm ra chất khởi nguồn

Trang 14

Đề tài “Xây dựng mô hình phân loại và dự đoán hoạt tính ức chế β-secretase” gồm những mục tiêu sau:

- Xây dựng mô hình 2D-QSAR trên các chất ức chế β-secretase

- Xây dựng mô hình QSAR nhị phân trên các chất ức chế β-secretase

- Xây dựng mô hình mô tả phân tử docking trên các chất ức chế β-secretase

- Xây dựng mô hình 3D-Pharmacophore trên các chất ức chế β-secretase

-Ứng dụng mô hình sàng lọc ảo trên 1554 thuốc từ ngân hàng Drugbank

Trang 15

2 TỔNG QUAN TÀI LIỆU

2.1 SƠ LƢỢC VỀ ENZYM β-SECRETASE

β-secretase là BACE (β-site of Amyloid precursor protein Cleaving Enzyme) hay Memapsin2, là một enzym thuộc nhóm aspartyl protease BACE gồm 2 loại: BACE1 và BACE2 nhƣng tập trung trong não phần lớn là BACE1

BACE1 đƣợc khám phá vào năm 1999 bởi vài nhóm nghiên cứu[24], [26], [37], [41], [48] BACE1 là enzym type 1 của aspartic protease liên kết màng thuộc nhóm pepsin Giống nhƣ những aspartic protease khác, BACE1 cũng chứa vùng hoạt động kép (D-T/S-G-T/S) trong vùng protein màng

Trình tự của BACE1 đƣợc mô tả nhƣ hình 2.1:

Hình 2.1 Trình tự của BACE1

Một cấu trúc hoàn chỉnh của BACE1 có một peptid với đầu tận cùng N (từ 1-23), một vùng Pro-peptid (từ 24-48), vùng catalytic (từ 49-454), một vùng màng trải dài (từ 455-478) và đuôi tế bào chất tận cùng C (từ 479-501) BACE1 có sáu cystein tạo thành 3 liên kết disulfid và vùng liên kết N glycosyl hóa Glycosyl hóa là một sự biến đổi trong quá trình hậu dịch mã trong đó các glycan đƣợc gắn vào protease BACE1 cũng có hai vùng hoạt động trong khu vực protein ngoại bào của nó (acid amin 93-96 và 289-292), là hai vùng cần thiết cho các hoạt động protease của BACE1[24]

Vùng hoạt động nằm trong một cấu trúc có hình dạng kẹp tóc β từ acid amin 67-77 đƣợc gọi là flap[47] Vùng flap mở trong quá trình tiếp nhận các cơ chất, đóng lại trong quá trình xúc tác và mở ra lại trong quá trình giải phóng sản phẩm đã bị phân cắt Từ acid amin 9-14 tạo ra một vòng lặp ngắn giữa hai sợi β ở đáy khoang gắn kết S3 đƣợc gọi là vòng 10s Khi vòng 10s mở, nó làm cho liên kết giữa cơ chất và khoang gắn kết S3 bền vững hơn[5]

Trang 16

Hình 2.2 Cấu trúc vùng flap và vòng 10s

BACE1 hiện diện ở khắp nơi trong cơ thể nhưng tập trung với nồng độ cao nhất ở tuyến tụy và các tế bào thần kinh[41] Hoạt lực của BACE1 trong tuyến tụy thấp mặc dù hàm lượng của nó cao bởi vì sự tạo thành của các phiên bản ghép nối khác nhau tạo thành BACE1 với hoạt tính phân giải protein giảm[29] Ngược lại hoạt tính của BACE1 cao hơn trong hồi hải mã, tiểu não và vùng thùy trán của não bộ[29]

2.2 CƠ CHẾ HOẠT ĐỘNG CỦA β-SECRETASE

BACE1 hoạt động theo cơ chế acid-base để cắt các liên kết peptid trong quá trình xúc tác của nó[39] Cơ chế hoạt động gồm hai bước:

Trong bước đầu tiên, quá trình không proton hóa của Asp228 hoạt động như một base và quá trình proton hóa của Asp32 hoạt động như một acid Từ chất phản ứng (I), Asp228 hút một proton từ phân tử nước xúc tác (W1) và tạo ra một ion hydroxyl (OH-) Các ion hydroxyl được sinh ra tạo thành một lực ái nhân tấn công vào nguyên tử C của gốc carbonyl của các liên kết peptid đồng thời Asp32 cho proton cho nguyên tử oxygen của gốc carbonyl của các liên kết peptid tạo thành gem-diol

tứ diện (II)

Trang 17

Trong bước thứ hai, hai aspartat đổi ngược chức năng cho nhau Asp32 đóng vai trò như một base và Asp228 đóng vai trò như một acid Asp228 cho proton của nó cho nhóm NH của liên kết peptid và Asp32 hút một proton của một trong hai OH- của tứ diện gem-diol Quá trình này dẫn đến sự phân cắt các peptid tại các liên kết peptid

(III)

Hình 2.3 Cơ chế hoạt động của BACE1[2]

2.3 QUÁ TRÌNH SINH TỔNG HỢP β-AMYLOID

β-Amyloid được sinh ra sau khi phân cắt APP (Amyloid Precursor Protein) bởi hai aspartic protease, β-secretase và γ-secretase[14] β-secretase cắt APP tại vùng β-site nên được gọi là "β-site APP cleaving enzyme 1" (BACE1) Tuy nhiên, β-secretase tương tranh với α-secretase trên bề mặt APP, và thông thường sự phân cắt bởi α-secretase thường không tạo thành Aβ Bên cạnh đó γ-secretase là một multiprotein gồm presenilin, nicastrin, Aph1 và Pen2 và cắt APP tại vị trí γ[45]

Quá trình sinh tổng hợp Aβ bắt đầu khi BACE1 cắt APP tại vị trí Asp+1 của trình

tự Aβ, hình thành phần N tận cùng của peptid Quá trình phân cắt này tạo thành hai đoạn: một phân đoạn là vùng protein màng APPsβ được tiết ra và phân đoạn còn lại dính vào đầu tận cùng là carboxyl (C99) Tiếp theo, C99 được cắt bởi γ-secretase tạo nên các đầu tận cùng C của protein Aβ và vùng nội bào của APP (AICD) Sự phân cắt này không thật sự đặc trưng bởi vì hầu hết các peptid Aβ được tạo bởi hoạt

Trang 18

động của γ-secretase thường kết thúc ở amino acid 40 (Aβ40), trong khi một số

khác lại kết thúc tại vùng amino acid 42 (Aβ42) Và việc dư thừa peptid cuối có liên

quan đến bệnh AD

Hình 2.4 Quá trình phân cắt APP bởi α-secretase hoặc β-secretase và

γ-secretase[50]

Rõ ràng, γ-secretase là một protease thích hợp cho việc nghiên cứu và phát triển các

thuốc ức chế bệnh AD[14] Một số nhóm chất đã được nghiên cứu và phát triển để

thử nghiệm lâm sàng trên con người Tuy nhiên, γ-secretase có nhiều chức năng

sinh lý trong sự tăng trưởng của tế bào và phá vỡ phân đoạn protein màng Sau này,

enzym này được nghiên cứu không những đặc trưng đối với APP mà còn với những

chất khác bao gồm các thụ thể xuyên màng và protein Notch tín hiệu Việc làm

giảm hoạt động của protein Notch sẽ cản trở sự tăng sinh và sự phân biệt tế bào[43]

Vì vậy, nhiều chất ức chế γ-secretase thường độc với bệnh nhân, đặc biệt là không

có cách nào khác để bù đắp lượng γ-secretase đã mất Tuy nhiên một vài chất ức

chế γ-secretase đã thành công ở một mức độ nhất định Điều này giải thích cho việc

Trang 19

chọn một protease quan trọng trong việc hình thành peptid Aβ thích hợp để phát triển thuốc ức chế bệnh AD: β-secretase hoặc BACE1[17]

2.4 SƠ LƯỢC VỀ BỆNH ALZHEIMER

Bệnh AD là một quá trình rối loạn não bộ không thể hồi phục có đặc điểm là sự khiếm khuyết về thần kinh và hành vi liên quan đến việc sản xuất các mảng bám và đám rối, mất synap và viêm thần kinh Hai yếu tố nguy cơ dẫn đến bệnh AD hay gặp nhất là: tuổi tác và di truyền

Bệnh AD được đặt tên theo tên của bác sỹ người Đức Alois Alzheimer Căn bệnh này được phát hiện lần đầu tiên ở một bệnh nhân nữ là bà Auguste D vào ngày 8 tháng 4 năm 1906 sau khi bà qua đời Sau khi kiểm tra bộ não của bà Auguste D, bác sỹ Alzheimer đã phát hiện ba đặc điểm bệnh lý lớn: mảng viêm thần kinh ngoại bào, đám rối sợi thần kinh nội bào và mất synap thần kinh[1]

Sa sút trí tuệ là bệnh lý đặc trưng của sự suy giảm khả năng suy đoán, ký ức và khả năng nhận thức Khi bệnh tiến triển, bệnh có thể ảnh hưởng tiêu cực đến những công việc hàng ngày như lái xe, làm công việc nhà và thậm chí những công việc cá nhân như tắm rửa, mặc quần áo và ăn uống Cho đến nay đã có hơn mười loại bệnh

sa sút trí tuệ đã được báo cáo: các bệnh sa sút trí tuệ do tai biến mạch máu não; bệnh sa sút trí tuệ do nhiều nguyên nhân; bệnh sa sút trí tuệ thể DLB (Lewy Body Disease); bệnh sa sút trí tuệ Parkinson (một số người mắc bệnh Parkinson sẽ dẫn đến sa sút trí tuệ và cơ chế như bệnh sa sút trí tuệ thể DLB); bệnh sa sút trí tuệ trán-thái dương; bệnh sa sút trí tuệ CJD (Creutzfeldt-Jacob Dementia); bệnh sa sút trí tuệ

do tràn dịch não áp lực bình thường; bệnh Huntington; hội chứng Korsakoff; bệnh suy giảm nhận thức thể nhẹ Alzheimer thường tiến triển theo sau bệnh suy giảm nhận thức thể nhẹ[53]

ALZHEIMER

Các mảng Aβ đóng vai trò quan trọng trong AD Nồng độ và quá trình lắng đọng

Aβ theo tuổi tác là nguyên nhân gây ra AD Quá trình lắng đọng Aβ là do sản xuất quá mức Aβ bởi sự đột biến APP hay sự tăng sinh quá mức APP trong cả AD và hội

Trang 20

chứng Down Bên cạnh đó, BACE1 đóng vai trò quan trọng trong quá trình sinh tổng hợp Aβ Vì vậy nhiều khả năng nồng độ BACE1 cao có thể dẫn đến tăng quá trình lắng đọng Aβ và gây ra AD

Hoạt tính của BACE1 tăng theo độ tuổi ở não chuột, khỉ và người bình thường đã được báo cáo[13] và có một sự tương quan thuận giữa hoạt tính của BACE1 và nồng độ Aβ ở não chuột và người bình thường Hơn nữa, việc tăng đáng kể cả về

số lượng cũng như hoạt tính của BACE1 đã được nghiên cứu ở não người AD Li

và cộng sự báo cáo đã quan sát được sự tương quan giữa hoạt tính tăng cao của BACE1 với quá trình sinh tổng hợp Aβ 1-x và Aβ1-42 ở thuỳ trán của não[25] cho thấy rằng sự tăng cao BACE1 có thể dẫn đến tăng cường sản xuất và lắng đọng Aβ

Có nhiều thông số sinh hoá bất thường trong AD và có khoảng 100 protein rối loạn hay thay đổi bất thường trong AD[12] Vì vậy rất khó xác định chính xác nếu nghiên cứu trên não người đã chết đặc biệt là trong giai đoạn sớm và trong giai đoạn cuối của bệnh Để giải quyết vấn đề này, thực hiện kiểm tra nồng độ BACE1 trong hai mô hình chuyển gen của AD: mô hình chuột 5XFAD[33] với sự phát triển các mảng Aβ ở độ tuổi trẻ và sự thiếu hụt những tế bào thần kinh quan trọng; mô hình chuột Tg2576[23] với sự phát triển các mảng Aβ ở độ tuổi già và đầy đủ những tế bào thần kinh quan trọng Kết quả là nồng độ BACE1 tăng cao ở não trong mô hình

Tg Vì vậy có thể kết luận sơ bộ nồng độ cao BACE1 liên quan đến bệnh lý amyloid hơn là gây chết các tế bào thần kinh

2.6 CÁC CHẤT ỨC CHẾ β-SECRETASE

Hình 2.5 Nhóm chất ức chế peptidomimetic

Trang 21

Hình 2.6 Nhóm chất ức chế non-peptide

Các chất ức chế β-secretase bao gồm hai nhóm chất lớn là peptidomimetic có cấu

trúc được mô tả trong hình 2.5 và các chất có cấu trúc non-peptide được mô tả như

hình 2.6 Các chất có cấu trúc hydroxyethylene và hydroxyethylamine của nhóm

peptidomimetic và nhóm non-peptide được nghiên cứu nhiều bởi cấu trúc không

cồng kềnh so với những chất có cấu trúc statine, norstatine, tert-hydroxyl Vì vậy

các chất có cấu trúc hydroxyethylene, hydroxyethylamine và nhóm non-peptide sẽ

là đối tượng nghiên cứu của đề tài này

2.7 PHƯƠNG PHÁP XÁC ĐỊNH HOẠT TÍNH ỨC CHẾ β-SECRETASE

Hoạt tính ức chế enzym BACE1 bằng phương pháp truyền năng lượng cộng hưởng

huỳnh quang (fluorescence resonance energy transfer) trong đó sử dụng BACE1 tái

tổ hợp từ baculovirus và chất nền Rh-EVNLDAEFK-Quencher trên APPswe đã đột

biến Chất nền peptid này sẽ trở nên phát quang mạnh hơn sau phản ứng phân cắt

của enzym BACE1 Độ hấp thu trên máy đo hấp thu huỳnh quang tại bước sóng

kích thích 545 nm và bước sóng phát quang 585 nm

Trang 22

Hình 2.7 Cơ chế phương pháp xác định hoạt tính ức chế BACE1

Cơ chế của quá trình truyền năng lượng cộng hưởng huỳnh quang: Chất nền bao gồm một chất cho năng lượng huỳnh quang và một chất nhận năng lượng huỳnh quanh Huỳnh quang của chất nền giảm đáng kể vì truyền năng lượng cộng hưởng nội phân tử với nhóm dập tắt huỳnh quang Sau khi phản ứng phân cắt của enzym, năng lượng truyền qua bị phá vỡ và năng lượng của chất cho năng lượng được phục hồi sẽ làm tăng mức năng lượng huỳnh quang so với ban đầu[49]

Hình 2.8 Cấu trúc của OM99-02

OM99-02 là một chất ức chế BACE1 có cấu trúc hydroxyethylene thường được dùng làm chất chuẩn để so sánh với các chất khác khi đo hoạt tính ức chế BACE1 bằng phương pháp truyền năng lượng cộng hưởng huỳnh quang có IC50 = 41,6 nM

2.8 MỐI QUAN HỆ ĐỊNH LƯỢNG GIỮA CẤU TRÚC VÀ TÁC

DỤNG – QSAR

Mối quan hệ định lượng giữa cấu trúc và tác dụng (Quantative Structure – Activity Relationship, QSAR) là một quá trình mang tính định lượng mối liên hệ giữa cấu trúc, tính chất hóa học và hoạt tính sinh học của các hợp chất Từ đó tìm ra những quy luật tương quan để đánh giá hoạt tính sinh học của những hợp chất mới

Trang 23

Công việc của QSAR là xác định những tham số C0, C1, C2, … Cn trong phương trình:

Hoạt tính sinh học (Biological activity) = C0 + C1*P1 + C2*P2 + … + Cn*Pn

Với sai số dự đoán là nhỏ nhất cho một tập dữ liệu có sẵn

Phương pháp được áp dụng để xác định các tham số trên là phương pháp hồi quy (hồi quy tuyến tính hay hồi quy phi tuyến), trong đó thuật toán bình phương tối thiểu từng phần (PLS), tính toán máy vector hỗ trợ (SVM) và mạng neuron nhân tạo (ANN) thường được áp dụng

Khái niệm QSAR nhị phân (BINARY QSAR, BQSAR)

Phương pháp QSAR nhị phân được sử dụng để đánh giá mức độ quan hệ giữa cấu trúc và tác dụng nhằm hạn chế những sai lầm do đầu vào và đưa ra mô hình với độ chính xác cao Trong binary QSAR, hoạt tính sinh học được thể hiện dưới dạng “nhị phân” (1: có tác động; 0: không có tác động) và có tương quan với mô tả phân tử Phương pháp này ước lượng mật độ xác suất Pr (Y = 1│X=x), trong đó Y là một biến nhị phân (Y = 1 có tác động; Y = 0 không có tác động) và X là một n-vector chứa các giá trị mô tả (n) cho một phân tử trong tập dữ liệu Một mô hình nhị phân giả định rằng các kết quả thử nghiệm là một giá trị nhị phân (1 hoặc 0), đại diện cho khả năng đạt/ không đạt hoặc khả năng hoạt động/ không hoạt động Nghiên cứu này sử dụng phần mềm MOE 2008.10 để ước tính mật độ xác suất nêu trên bằng cách áp dụng công thức Bayes:

2.9 MÔ HÌNH MÔ TẢ PHÂN TỬ DOCKING

2.9.1 Khái niệm Docking

Docking là phương pháp thiết kế thuốc dựa vào cấu trúc mục tiêu tác động, nghiên cứu khả năng gắn kết của một hay nhiều phân tử hợp chất (ligand) vào mô hình điểm gắn kết (binding site, active site) của protein, enzym, DNA… trong không

Trang 24

gian ba chiều Docking tìm các tương tác giữa phân tử hợp chất và điểm tác động theo ba hướng sau:

- Xem hợp chất và protein đều là những phân tử cứng (docking cứng)

- Xem hợp chất là những phân tử linh động (docking bán linh động)

- Xem cả hợp chất và protein đều linh động (docking linh động hoàn toàn), nhưng tính linh động chỉ giới hạn ở những chuỗi bên đặc trưng nào đó của điểm gắn kết Phương pháp được sử dụng phổ biến là docking bán linh động Các phần mềm docking như Gold, FlexX, Dock, AutoDock được sử dụng cho docking bán linh động[20]

2.9.2 Docking bằng phần mềm FlexX

2.9.2.1 Giới thiệu chung

FlexX là một chương trình dự đoán tương tác giữa protein-ligand (hình 2.7) FlexX

dự đoán cấu trúc hình học của phức hợp protein-ligand cũng như ái lực gắn kết Protein được giữ cứng Thuật toán docking trong FlexX hoạt động mà không có sự can thiệp thủ công FlexX hoạt động trên phức hợp protein-ligand và sàng lọc tập hợp lớn các chất để tìm ra định hướng cho thiết kế thuốc Tóm lại, FlexX rất hữu dụng trong trường hợp đã có cấu trúc 3D của protein và vị trí cụ thể của vùng hoạt động, có tập hợp phân tử các chất và FlexX sẽ phân tích việc gắn kết (có hay không

và bằng cách nào) của mỗi chất với protein FlexX hỗ trợ tốt cho phần mềm thiết kế thuốc dựa vào cấu trúc với kết quả dự đoán đáng tin cậy, xây dựng cách thức gắn kết của phân tử trong điểm gắn kết trên protein khá chính xác, có thể dock một phân

tử hợp chất với sai lệch nhỏ hơn 2 Å từ cấu trúc sinh học có sẵn; tốc độ nhanh, thích hợp cho sàng lọc ảo đầu vào cao[51]

Trang 25

Hình 2.9 Giao diện của phần mềm FlexX

2.9.2.2 Nguyên tắc docking trong FlexX

Trong FlexX, cấu trúc của mục tiêu tác động (protein) đƣợc giữ cứng còn phân tử chất gắn kết (ligand) đƣợc thiết kế linh động bằng cách tạo ra tập hợp nhiều cấu dạng khác nhau FlexX sử dụng thuật toán xây dựng lớn dần (Incremental Construction Algorithm) nhƣ sau: chia ligand thành từng mảnh cứng, dock các mảnh cứng vào túi gắn kết của protein, cuối cùng lắp ráp ligand lại từ các mảnh ở những cấu dạng năng lƣợng thấp (Hình 2.10)[28]

Trang 26

Hình 2.10 Thuật toán xây dựng docking lớn dần

Việc đặt ligand vào điểm gắn kết sử dụng phép tam giác phân (Triangle Matching), tức là xác định các trung tâm liên kết và bề mặt liên kết trên cả protein và ligand như vòng thơm, trung tâm cho và nhận hydro, liên kết ion,…; sau đó sự gắn kết được tạo thành nếu các trung tâm và bề mặt bổ sung nhau khi được phủ lên nhau[28]

Ái lực gắn kết giữa protein và phân tử hợp chất được thể hiện bằng điểm số docking Điểm số docking càng thấp thì ái lực gắn kết càng mạnh Năng lượng gắn kết được tính toán dựa vào năng lượng tiêu thụ để tạo các liên kết hydro, tương tác

ion, tương tác vòng thơm, tương tác kỵ nước (tương tác Van der Waals) giữa phân

tử hợp chất với mục tiêu tác động

2.9.2.3 Thực hiện docking trong FlexX

Quá trình docking trong FlexX:

- Chuẩn bị protein: FlexX sẽ tính toán các điện tích bề mặt protein, xác định vị trí khoang gắn kết và chuẩn bị cơ sở dữ liệu các tương tác

Trang 27

- Chuẩn bị phối tử (ligand): phân tử các chất được kiểm tra và hiệu chỉnh các liên kết, tạo cấu dạng thích hợp và tính toán các tương tác có thể xảy ra của ligand với protein[30]

Hình 2.11 Quá trình docking thực hiện bởi FlexX

Tiến hành docking

Chấm điểm và xếp hạng

Tính toán các tương tác ligan-protein

Xác định vùng gắn kết

Proton hoá và tích điện Cấu trúc protein

Trang 28

2.10 MÔ HÌNH 3D-PHARMACOPHORE

2.10.1 Khái niệm Pharmacophore

Mô hình Pharmacophore mô tả sự sắp xếp các thuộc tính phân tử mà hợp chất (ligand) cần phải có để có thể gắn kết một cách hiệu quả vào đích tác động Mô hình Pharmacophore được xây dựng nhằm mục đích hiểu rõ hơn các tương tác ligand-protein và có thể được dùng như một công cụ sàng lọc để tìm ra các phân tử hoạt chất mới có tiềm năng sinh học mong muốn Có hai cách cơ bản để tạo nên một mô hình Pharmacophore, đó là dựa trên cấu trúc của protein và dựa trên một tập hợp các chất có hoạt tính sinh học[27]

2.10.2 Xây dựng pharmacophore bằng phần mềm MOE 2008.10

Công cụ Pharmacophore Elucidator trong MOE 2008.10 được sử dụng nhằm tạo ra

một tập hợp các truy vấn Pharmacophore từ một tập hợp dẫn chất bao gồm cả chất

có hoạt tính và chất không có hoạt tính ức chế một đích tác động sinh học cụ thể Một truy vấn Pharmacophore là sự gióng hàng ba chiều các đặc tính của phân tử Trong trường hợp không có thông tin về đích tác động, các đặc tính hình học chung của các chất có hoạt tính được sử dụng để cung cấp thông tin liên quan đến các tương tác quan trọng giữa cấu dạng gắn kết của hoạt chất và đích tác động

Công cụ Pharmacophore Elucidator sử dụng dữ liệu đầu vào là tập hợp gồm N

phân tử với Ci cấu dạng cho mỗi chất Với mỗi phân tử, giá trị Ai bằng 1 biểu thị chất có hoạt tính và bằng 0 biểu thị chất không hoạt tính N1 biểu thị số phân tử có hoạt tính và N0 biểu thị sốphân tử không hoạt tính Pharmacophore Elucidator sẽ

tạo ra các truy vấn Pharmacophore thỏa tối thiểu n phân tử hoạt tính Một truy vấn Pharmacophore thỏa k phân tử hoạt tính sẽcó độ che phủ k (coverage k hoặc covers k) hoạt tính Do đó, mỗi truy vấn tạo được sẽ có độ che phủ n Thông thường n bằng khoảng 90% của N1[52]

- Tạo query: Đầu tiên các truy vấn ít điểm được tạo ra Tiếp theo các truy vấn nhiều điểm hơn được tạo ra dựa trên sự tổ hợp các truy vấn ít điểm này (Hình 2.12)

Trang 29

- Điểm chính xác: Độ chính xác toàn phần (accuracy) = m/N trong đó N là số phân

tử trong tập dữ liệu đầu vào và m là tổng số của số phân tử hoạt tính thỏa truy vấn

và số phân tử không hoạt tính không thỏa truy vấn

- Điểm chồng phủ (Overlap scoring): Một mô hình Pharmacophore đáng tin cậy là

mô hình có sự gióng hàng tốt các phân tử có hoạt tính Việc tìm kiếm được thực hiện để tìm ra các mô hình có đặc tính như vậy và được đánh giá bằng mức độ chồng phủ nguyên tử Điểm chồng phủ có giá trị trong khoảng [0, n] với n là số phân tử có hoạt tính được đưa vào xây dựng mô hình Điểm chồng phủ càng cao thể hiện mức độ gióng hàng càng tốt[52]

Hình 2.12 Phương pháp xây dựng mô hình 3D-pharmacophore

2.10.3 Phân tích mô hình pharmacophore

Kết quả truy xuất của chương trình bao gồm các thông số sau:

Trang 30

- Cover: Số phân tử có hoạt tính liên quan đến mô hình

- Overlap: Điểm chồng phủ

- Accuracy: Điểm chính xác

- Size: Tổng số các yếu tố trong mô hình

- Acc: Ký hiệu của trung tâm nhận liên kết hydro, đại diện cho các nguyên tố O, N,

S, ngoại trừ S=C, S-, =N=, >N<, >N-π, >N-C+, >N-S=O, >N-P=O, =O=, >O=,

>O<, >O-π

- Don: Ký hiệu của trung tâm cho liên kết hydro, đại diện cho tất cả các nguyên tố

O và N gắn với ít nhất 1 H

- Aro|PiR: Ký hiệu cho vòng thơm, vòng liên hợp π (không phải vòng thơm)

- Hyd: Ký hiệu của nhóm kỵ nước

Trang 31

3 PHƯƠNG PHÁP NGHIÊN CỨU

3.1 CÁC BƯỚC TIẾN HÀNH XÂY DỰNG MÔ HÌNH 2D-QSAR

Quy trình xây dựng mô hình 2D-QSAR bao gồm các bước như hình 3.1

Hình 3.1 Các bước xây dưng mô hình 2D-QSAR

Chuẩn bị cơ sở dữ liệu

Cấu trúc hóa học 2D và giá trị pIC50

Tối thiểu hóa năng lượng

Tính toán thông số mô tả phân tử (MOE 2008.10)

Chia tỷ lệ thông số mô tả trong khoảng 0-1

Loại chất gây nhiễu

Xây dựng mô hình QSAR

Phương pháp PLS

Đánh giá LOO, L-20%O

Xây dựng mô hình QSAR trên

toàn tập dữ liệu

Ứng dụng mô hình trong dự

đoán

Trang 32

3.1.1 Cơ sở dữ liệu

Các chất thuộc cơ sở dữ liệu được thu thập qua các bài báo, tạp chí quốc tế được vẽ

thông qua công cụ Buider trong phần mềm MOE 2008.10 được lưu dưới dạng

Database với các định dạng: mol: molecule; name: char; pIC50: float Mỗi bài báo

được lưu dưới dạng mỗi Database riêng và cơ sở dữ liệu là tổng tất cả các Database được gộp lại thông qua công cụ Merge Databases của phần mềm MOE 2008.10

Do hoạt tính sinh học IC50 có khoảng chênh lệch với nhau nhiều nên khi tính toán được đổi thành pIC50 với pIC50 = -log(IC50) để phù hợp cho việc xây dựng phương trình tuyến tính quan hệ cấu trúc – tác dụng

Bảng 3.1 Cấu trúc của chất đại diện cho các nhóm chất trong tập hợp 315 chất của

Trang 35

3.1.2 Tính toán thông số mô tả

Các cấu trúc được xây dựng trong MOE 2008.10 đã được tối thiểu hóa năng lượng

nhờ công cụ Energy minimize với thông số gradient là 0,0001 mV Trong phần mềm MOE 2008.10, công cụ Compute/Descriptors cho phép tính được 3 thông số mô tả:

2D: Các thông số mô tả 2D được tính toán chỉ bằng thông tin từ các nguyên tử và liên kết Các tọa độ 3D và cấu dạng riêng không được dùng tới

i3D: Các thông số mô tả 3D nội sử dụng thông tin về tọa độ 3D của các phân tử, tuy nhiên các phân tử này không quay và không thay đổi cấu dạng

x3D: Các thông số mô tả 3D ngoại cũng sử dụng thông tin về tọa độ 3D, nhưng đòi hỏi một khung tham chiếu tuyệt đối

Nghiên cứu này xây dựng mô hình tương quan giữa hoạt tính sinh học và cấu trúc 2D nên việc tính toán chỉ giới hạn trong nhóm thông số mô tả 2D

184 thông số mô tả 2D thể hiện cấu trúc hóa học hay tính chất vật lý của một phân

tử bằng các giá trị số, có ảnh hưởng tác dụng sinh học, bao gồm 7 nhóm và được trình bày ở bảng 3.2[52]

Trang 36

Bảng 3.2 Các nhóm thông số mô tả phân tử 2D tính bằng MOE

STT Nhóm thông số mô tả 2D Mô tả

2 Diện tích bề mặt được phân chia nhỏ Tính theo hệ số phân bố octanol/nước

hay tính khúc xạ

3 Đếm số nguyên tử và số liên kết Số lượng các nguyên tử và số lượng các

liên kết

4 Chỉ số hình dạng Kappa và chỉ số liên

kết Kier & Hall

Thể hiện các khía cạnh khác nhau của hình dạng phân tử

7 Thông số điện tích riêng phần Tính điện tích bề mặt có điện tích riêng

phần tương ứng

3.1.3 Chia tỷ lệ thông số mô tả

Chia tỷ lệ thông số mô tả là một bước quan trọng trước khi xây dựng mô hình Mục đích của việc này là để tránh sự ảnh hưởng của các thông số có giá trị lớn đối với các thông số có giá trị nhỏ và giảm bớt khó khăn cho việc tính toán Ví dụ một thông số mô tả có giá trị ở hàng trăm trong khi thông số khác có giá trị ở hàng đơn

vị Nếu không quy về một tỷ lệ nhất định thì ta đã vô tình chấp nhận thông số đầu quan trọng hơn thông số sau cả trăm lần

Phương pháp chia tỷ lệ khoảng được áp dụng trong nghiên cứu này Các thông số

mô tả được chia tỷ lệ trong khoảng [0, 1] bằng công cụ Normalize trong phần mềm

RapidMiner 5.3.013 Công thức chia tỷ lệ như sau:

Trong đó: Xn: Giá trị mới

X0: Giá trị ban đầu Min0 và Max0: Giá trị nhỏ nhất và lớn nhất của những giá trị ban đầu

Trang 37

3.1.4 Lựa chọn thông số mô tả

Các thông số mô tả của tập xây dựng mô hình được loại thô để loại các thông số không có ý nghĩa hoặc khiến mô hình tốt giả tạo, qua các bước:

- Loại các thông số có > 80% giá trị bằng 0 bằng phần mềm Exel 2010

- Lọc các thông số có độ lệch chuẩn bằng 0 bằng phần mềm Rapidminer 5

- Các nhóm thông số có hệ số tương quan với nhau ≥ 0,70 được loại bớt và chỉ giữ lại một thông số ngẫu nhiên bằng phần mềm RapidMiner 5.3.013

Sau đó, các thông số này tiếp tục được xử lý bằng phương pháp BestFirst của phần

mềm Weka3.6 nhằm tìm ra các thông số có giá trị tương quan với giá trị pIC50 thực nghiệm

Tập dữ liệu ban đầu được chia làm hai phần là tập xây dựng mô hình chiếm 80% dữ liệu ban đầu, còn lại là tập ngoại, sự phân chia này dựa trên mức độ đa dạng về cấu

trúc của các chất trong tập dữ liệu ban đầu Sử dụng công cụ Diverse subset trong

phần mềm MOE 2008.10 để thực hiện phân chia tập dữ liệu[52]

3.1.5 Loại chất gây nhiễu

Phương pháp phân tích thành phần chính – PCA

Ưu điểm của phương pháp này là loại nhanh và chính xác chất gây nhiễu do biểu hiện trực quan tập dữ liệu trong không gian ít chiều Trên không gian dễ dàng thấy được mức độ tập trung của các chất trong không gian và các chất nào nằm rời rạc so với vùng tuyến tính của tập dữ liệu Thể hiện các thông số PCA1, PCA2, PCA3 thông qua 3 bước[52]:

- Compute → Principal components

- Compute → Analysis → 3D Plot

- Tiến hành loại nhiễu đối với chất nằm ngoài phân bố chung của tập dữ liệu

Trang 38

Hình 3.2 Loại nhiễu bằng PCA Phương pháp loại nhiễu bằng Z – score

Z – score của một chất là độ lệch của giá trị hoạt tính dự đoán so với giá trị hoạt tính trung bình của toàn tập dữ liệu Một chất có Z – score lớn cho thấy khả năng cao chất đó nằm ngoài đường thẳng hồi quy QSAR

Tiến hành loại những chất có Z – score > 2,0 khi tiến hành khảo sát sơ bộ QSAR trên tập xây dựng Công thức tính Z – score như sau[52]:

3.1.6 Xây dựng mô hình QSAR

Tiến hành xây dựng mô hình QSAR trung gian từ những thông số mô tả đã lựa chọn được dựa trên tập xây dựng sau khi loại nhiễu Sau khi tiến hành đánh giá nội và đánh giá ngoại, tiếp tục xây dựng mô hình QSAR hoàn chỉnh cho toàn tập dữ liệu với những thông số mô tả đã chọn

Công cụ QSAR – Model trong MOE 2008.10 được sử dụng để xây dựng mô hình với cột hoạt tính sinh học (Activity Field) chọn giá trị pIC50 và phương pháp xây

dựng (Method) chọn PLS (thuật toán bình phương tối thiểu từng phần) Nhấn Fit để

thực hiện các lệnh hồi quy, các giá trị RMSE và R2 sẽ được hiển thị

Trang 39

Phương trình hồi quy được ghi nhận bằng lệnh Report trong cửa sổ QSAR – Model

Phương trình hồi quy thể hiện mối liên quan định lượng giữa cấu trúc (thông số mô tả) và tác dụng sinh học, có dạng y = ax + b

Mô hình được lưu bằng lệnh Save dưới dạng *.fit để ứng dụng dự đoán hoạt tính

sinh học của các chất cần nghiên cứu

3.1.7 Đánh giá mô hình QSAR

Mục tiêu của nghiên cứu QSAR là xây dựng được mô hình có khả năng dự đoán tốt, giá trị dự đoán và giá trị thực gần nhau Điều đó thể hiện qua giá trị bình phương hệ

số xác định R2 và căn của tổng bình phương phần dư RMSE của tập xây dựng mô hình Các giá trị này được thẩm định bằng các đánh giá nội như bỏ-một-ra (LOO), bỏ-20%-ra (L-20%-O), đảo biến ngẫu nhiên Y cũng như các đánh giá trên tập ngoại

Đánh giá nội

Đánh giá nội LOO được tiến hành đồng thời với xây dựng mô hình bằng lệnh

Validate trong của sổ QSAR – Model trong MOE 2008.10 Các thông số đánh giá là

giá trị trung bình bình phương hệ số tương quan của các mô hình thứ cấp Q2 (XR2)

và RMSE (XRMSE) đánh giá chéo

Đánh giá nội L-20%-O cũng tương tự như đánh giá LOO nhưng thay vì bỏ ra một thì ta bỏ 20% số chất ra, thực hiện 5 lần như vậy, sử dụng phương pháp phân bố

ngẫu nhiên (random) sử dụng hàm RAND trong MOE 2008.10

Phương pháp đảo biến ngẫu nhiên Y (Y – scrambling) cũng được sử dụng để chứng

tỏ kết quả độ đúng của mô hình dự đoán không phải do ngẫu nhiên mà có được Theo đó, giá trị hoạt tính sinh học của các chất trong tập xây dựng được xáo trộn một cách ngẫu nhiên để xây dựng mô hình và cũng thực hiện các đánh giá như trên Thực hiện quá trình này 50 lần, nếu kết quả đánh giá giữa mô hình đã xây dựng lớn hơn 0,2 trở lên thì chứng minh được kết quả mô hình xây dựng được là do mối tương quan giữa các thông số mô tả phân tử với giá trị sinh học chứ không phải đạt được ngẫu nhiên nhờ phần mềm đã sử dụng

Trang 40

Đánh giá ngoại

Tập ngoại được tách riêng sau khi lựa chọn các thông số mô tả trọng yếu và không tham gia vào quy trình xây dựng mô hình QSAR để đảm bảo tính khách quan cho việc đánh giá khả năng dự đoán của mô hình Ứng dụng tập ngoại vào mô hình xây

dựng bằng công cụ Model evaluate của MOE 2008.10 Phần lớn các giá trị dự đoán

của tập ngoại phải nằm trong khoảng tin cậy 95% dự đoán đúng của mô hình Các thông số bình phương hệ số tương quan R2 và căn của tổng bình phương phần dư RMSE giữa giá trị dự đoán và giá trị thực nghiệm của các chất trong tập ngoại cũng được sử dụng để đánh giá mô hình[35]

)

Trong đó:

Ypred: Giá trị dự đoán trên tập xây dựng bởi mô hình đã xây dựng

Y: Giá trị sinh học (pIC50) thực các chất trong tập xây dựng mô hình Y: Giá trị hoạt tính trung bình

Ypred(test): Giá trị dự đoán trên tập ngoại bởi mô hình đã xây dựng

Ytest: Giá trị sinh học (pIC50) thực các chất trong tập ngoại

Ytrain: Giá trị hoạt tính trung bình của tập xây dựng

Giá trị cũng được sử dụng để đánh giá khả năng dự đoán của mô hình với ưu điểm là tranh được sai số dự đoán do khoảng rộng của giá trị trả về (Y).[35]

Ngày đăng: 23/06/2020, 23:55

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] Alzheimer A, Stelzmann RA, Schnitzlein HN, Murtagh FR, (1995), "An English translation of Alzheimer's 1907 paper, "Uber eine eigenartige Erkankung der Hirnrinde"", Clin Anat. 8 (6),pp.429-431 Sách, tạp chí
Tiêu đề: An English translation of Alzheimer's 1907 paper, "Uber eine eigenartige Erkankung der Hirnrinde
Tác giả: Alzheimer A, Stelzmann RA, Schnitzlein HN, Murtagh FR
Năm: 1995
[2] Arghya Barman, Rajeev Prabhakar, (2014), "Computational Insights into Substrate and Site Specificities, Catalytic Mechanism, and Protonation States of the Catalytic Asp Dyad of β-Secretase", Scientifica. 2014, pp. 598728 Sách, tạp chí
Tiêu đề: Computational Insights into Substrate and Site Specificities, Catalytic Mechanism, and Protonation States of the Catalytic Asp Dyad of β-Secretase
Tác giả: Arghya Barman, Rajeev Prabhakar
Năm: 2014
[4] Carugo O, (2007), "Detailed estimation of bioinformatics prediction reliability through the Fragmented Prediction Performance Plots", BMC Bioinformatics. 8,pp.380 Sách, tạp chí
Tiêu đề: Detailed estimation of bioinformatics prediction reliability through the Fragmented Prediction Performance Plots
Tác giả: Carugo O
Năm: 2007
[5] Chakraborty S, Kumar S, Basu S, (2011), "Conformational transition in the substrate binding domain of beta-secretase exploited by NMA and its implication in inhibitor recognition: BACE1-myricetin a case study", Neurochem Int. 58 (8), pp.914-923 Sách, tạp chí
Tiêu đề: Conformational transition in the substrate binding domain of beta-secretase exploited by NMA and its implication in inhibitor recognition: BACE1-myricetin a case study
Tác giả: Chakraborty S, Kumar S, Basu S
Năm: 2011
[6] Charrier N, Clarke B, Cutler L, Demont E, Dingwall C, Dunsdon R, Hawkins J, Howes C, Hubbard J, Hussain I, Maile G, Matico R, Mosley J, Naylor A, O'Brien A, Redshaw S, Rowland P, Soleil V, Smith KJ, Sweitzer S, Theobald P, Vesey D, Walter DS, Wayne G, (2009), "Second generation of BACE- 1 inhibitors part 3: Towards non hydroxyethylamine transition state mimetics", Bioorg Med Chem Lett. 19 (13),pp.3674-3678 Sách, tạp chí
Tiêu đề: Second generation of BACE-1 inhibitors part 3: Towards non hydroxyethylamine transition state mimetics
Tác giả: Charrier N, Clarke B, Cutler L, Demont E, Dingwall C, Dunsdon R, Hawkins J, Howes C, Hubbard J, Hussain I, Maile G, Matico R, Mosley J, Naylor A, O'Brien A, Redshaw S, Rowland P, Soleil V, Smith KJ, Sweitzer S, Theobald P, Vesey D, Walter DS, Wayne G
Năm: 2009
[3] Beswick P, Charrier N, Clarke B, Demont E, Dingwall C, Dunsdon R, Faller A, Gleave R, Hawkins J, Hussain I, Johnson CN, MacPherson D, Maile G Khác

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w