1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Kết hợp phương pháp protein docking trong xây dựng mô hình tương quan định lượng cấu trúc hoạt tính ức chế histone deacetylase II của một số dẫn xuất acid hydroxamic đã tổng hợp

53 832 5

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 53
Dung lượng 1,86 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Thiết kế một số hợp chất có khả năng ức chế HDAC2 sử dụng mô phỏng protein docking và dự đoán hoạt tính của chúng dựa trên mô hình QSAR xây dựng được.. DANH MỤC CÁC KÝ HIỆU VIẾT TẮTHDAC

Trang 1

HỢP KHÓA LUẬN TỐT NGHIỆP DƯỢC SĨ

Trang 3

Lời cảm ơn

Trước hết, tôi xin bày tỏ lòng biết ơn sâu sắc và gửi lời cảm ơn chân

thành nhất tới người thầy của tôi – TS Phạm Thế Hải, người đã đồng hành

cùng tôi vượt qua khó khăn, ân cần quan tâm, động viên, tận tình hướng dẫn, chỉ bảo cho tôi từ những bước đi chập chững đầu tiên trên con đường nghiên cứu khoa học và trong suốt quãng thời gian tôi thực hiện khóa luận

Tôi xin chân thành cảm ơn cô Nguyễn Họa Mi, anh Phạm Trọng Lâm

công tác tại Khoa Hóa học, Trường Đại học KHTN – Đại học Quốc gia Hà Nội, đã chỉ bảo tận tình cho tôi từ những bước đi ban đầu khi nhận đề tài

Tôi cũng vô cùng biết ơn và xin được chân thành cảm ơn, các thầy cô

Bộ môn Hóa dược đã hết sức nhiệt tình, tạo điều kiện thuận lợi giúp đỡ tôi trong quá trình thực hiện khóa luận

Tôi cũng xin được cảm ơn những người bạn đã đồng hành cùng tôi trong suốt thời gian làm khóa luận

Cuối cùng, tôi xin dành sự biết ơn sâu sắc nhất tới bố mẹ tôi và tất cả những người thân trong gia đình, những người đã luôn yêu thương, ủng hộ để tôi có được ngày hôm nay!

Hà Nội, Ngày 18 tháng 5 năm 2017

Sinh Viên

Hoàng Văn Quân

Trang 4

MỤC LỤC DANH MỤC CÁC KÝ HIỆU VIẾT TẮT

DANH MỤC CÁC BẢNG

DANH MỤC CÁC HÌNH VẼ

ĐẶT VẤN ĐỀ 1

CHƯƠNG 1 TỔNG QUAN 2

1.1 Tổng quan về Histon Deacetylase (HDAC) 2

1.1.1 Khái niệm Histon Deacetylase 2

1.1.2 Phân loại các HDAC 3

1.1.3 Trung tâm hoạt động và cơ chế ức chế HDAC2 4

1.1.4 Các chất ức chế HDAC 2 5

1.1.5 HDAC2 và vai trò trong ung thư 7

1.2 Tổng quan về phương nghiên cứu QSAR 8

1.2.1 Lịch sử QSAR 8

1.2.2 Đại cương về QSAR 9

1.2.3 Quy trình xây dựng mô hình QSAR 10

1.3 Kỹ thuật Protein docking 14

1.3.1 Đại cương về phương pháp Protein docking 14

1.3.2 Quy trình Docking 15

CHƯƠNG 2 NGUYÊN LIỆU, THIẾT BỊ, NỘI DUNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU 15

2.1 Nguyên liệu và thiết bị 17

2.2 Nội dung nghiên cứu 17

2.3 Phương pháp nghiên cứu 17

2.3.1 Mô phỏng protein docking 17

2.3.2 Xây dựng mô hình QSAR 19

2.3.3 Thiết kế và dự đoán hoạt tính sinh học một số hợp chất 20

CHƯƠNG 3 KẾT QUẢ VÀ BÀN LUẬN 23

3.1 Mô phỏng protein docking 23

Trang 5

3.1.1 Re-dock SAHA 23

3.1.2 Mô phỏng protein docking 45 hợp chất 25

3.2 Xây dựng mô hình QSAR 27

3.2.1 Kết quả mô hình 27

3.2.2 Đánh giá mô hình 27

3.3 Thiết kế một số hợp chất có khả năng ức chế HDAC2 sử dụng mô phỏng protein docking và dự đoán hoạt tính của chúng dựa trên mô hình QSAR xây dựng được 30

3.3.1 Danh sách các hợp chất thiết kế 30

3.3.2 Mô phỏng protein docking 30

3.3.3 Dự đoán hoạt tính sinh học sử dụng mô hình QSAR 33

3.4 Bàn luận về phương pháp nghiên cứu 34

KẾT LUẬN VÀ KIẾN NGHỊ 38 TÀI LIỆU THAM KHẢO

Trang 6

DANH MỤC CÁC KÝ HIỆU VIẾT TẮT

HDAC Histon deacetylase

HDAC2 Histon deacetylase 2

FDA Food and Drug Administration (Cơ Quan Quản lý Thực phẩm

ZBG Zinc Binding Group (Nhóm gắn kẽm)

SAHA Suberoylanilide hydroxamic acid

CTCL Cutaneous T-cell lymphoma ( U lympho da tế bào)

IC50The half maximal inhibitory concentration (Nồng độ ức chế 50%, thường dùng đối với các chất ức chế enzym, chất đối vận receptor,…) MoRSE Molecule Representation of Structures based on Electron diffraction (Tham số mô tả cấu trúc phân tử dựa trên nhiễu xạ điện tử)

GETAWAYGEometry, Topology, and Atom-Weights AssemblY (Nhóm tham sốmô tả về hình học, hình học topo và trọng lượng nguyên tử)

GA Genetic Algorithm(Thuật giải di truyền)

KdHằng số liên kết

ΔGL Năng lượng tự do Gibbs

TrS Training set (Tập huấn luyện)

TSTest set (Tập kiểm tra)

Trang 7

RMSDRoot mean square deviation (Độ lệch căn quân phương)

MLR Multiple Linear Regression (Phương pháp hồi quy tuyến tính đa biến)

h Giá trị đòn bẩy

h* Giá trị đòn bẩy cảnh cáo

Å Angstrom (Đơn vị đo khoảng cách, chiều dài liên kết)

R2Hệ số xác định

Q2Hệ số tương quan chéo

Q2ext Hệ số xác định cho tập kiễm tra

Trang 8

DANH MỤC CÁC BẢNG

Bảng 1.1.Tóm tắt về các HDAC kinh điển với các đặc điểm về: kích thước, vị trí

phân bố trong tế bào và chức năng sinh lý 3

Bảng 1.2 Các chất ức chế HDAC đang thử nghiệm lâm sàng 6

Bảng 1.3 Các phần mềm tính tham số phân tử thông dụng 11

Bảng 3.1 So sánh các liên kết giữa SAHA gốc và SAHA dock lại với protein 24

Bảng 3.2 Kết quả đánh giá nội và đánh ngoại mô hình QSAR 28

Bảng 3.3 Kết quả docking 36 hợp chất 32

Bảng 3.4 Kết quả dự đoán họat tính ức chế HDAC2 của 36 hợp chất thiết kế 33

Trang 9

DANH MỤC CÁC HÌNH VẼ

Hình 1.1: Cấu trúc nhiễm sắc thể điều hòa hoạt động phiên mã ……….2

Hình 1.2 Cấu tạo trung tâm hoạt động và cơ chế ức chế của HDAC2 ………….5

Hình 1.3 Cấu trúc một số dẫn xuất acid hydroxamic ……… 7

Hình 3.1 Cấu dạngSAHA trong HDAC2 23

Hình 3.2 Kết quả mô phỏng protein docking của 45 hợp chất vào HDAC2 25

Hình 3.3.Độ dài liên kết phối trí Zn tới -C=O và OH-NH- 26

Hình 3.4 Năng lượng liên kết của các hợp chất 27

Hình 3.4 Miền ứng dụng của mô hình QSAR xác định hợp chất có khả năng ức chế HDAC2 28

Hình 3.5 Cấu trúc 2D của 36 hợp chất 30

Hình 3.6 Kết quả docking của 36 hợp chất 31

Hình 3.7.Áp dụng miền ứng dụng cho các hợp chất thiết kế 34

Hình 3.8 Kết quả docking của SAHA sau khi tối ưu hoá bởi các phần mềm khác nhau 36

Trang 10

ĐẶT VẤN ĐỀ

Histon deacetylase (HDAC)là một đích phân tử quan trọng trong nghiên cứu các thuốc điều trị ung thư hiện nay[37] Nhiều chất chất ức chế HDAC với đặc điểm cấu trúc đa dạng đã được xác định Trong số đó, bốn hợp chất là Vorinostat, Romidepsin, Belinostat và Panobinostat đã được Cơ Quan Quản lý Thực phẩm và Dược phẩm Hoa Kỳ (FDA) phê duyệt thành thuốc điều trị ung thư[17],[18],[28] Vì vậy, tổng hợp các chất ức chế HDAChiện đang là hướng đi đầy hứa hẹn trong nghiên cứu thuốc điều trị ung thư Tuy nhiên,tổng hợp và thử hoạt tính các hợp chất

là một quá trình tốn kém cả về thời gian và tiền bạc Nhằm tiết kiệm và nâng cao hiệu quả tìm kiếm, thiết kế thuốc với sự hỗ trợ của máy tính (Computer-Aided Drug Design) đã trở thành một hướng chủ đạo của nghiên cứu dược học trên thế giới Trong đó, xây dựng mô hình tương quan định lượng cấu trúc – hoạt tính (QSAR) là một trong những phương pháp được ứng dụng nhiều hiện nay Mô hình QSAR giúp

dự đoán hoạt tính sinh học của các hợp chất,ngay cả khi chúng chưa được tổng hợp, nhờ đó giúptiết kiệm thời gian, chi phí và giúp định hướng tổng hợp Cho tới nay,đã

có nhiều mô hình QSARdự đoán hoạt tính ức chế HDAC được xây dựng Tuy nhiên, các mô hình này có hạn chế là: các tham số phân tửchưa thể hiện được vị trí

và cấu dạng của cấu tử khi nó ức chế protein,do đó không phản ánh hết mối tương quan giữa cấu trúc và hoạt tính[27],[35] Để khắc phục hạn chế này chúng tôi tiến hành khoá luận “Kết hợp phương pháp protein docking trong xây dựng mô hình tương quan định lượng cấu trúc - hoạt tính ức chế Histone Deacetylase II của một số dẫn xuất acid hydroxamic đã tổng hợp”với ba mục tiêu chính như sau:

- Sử dụng cấu dạng thu được từ mô phỏng protein docking, xây dựng mô hình toán học mô tả mối tương quan định lượng giữa cấu trúc và hoạt tính (QSAR) ức chế HDAC2 của một số acid hydroxamic đã tổng hợp

- Thiết kế và dự đoánhoạt tính cho một sốacid hydroxamic mới

Trang 11

CHƯƠNG 1 TỔNG QUAN

1.1 Tổng quan về Histon Deacetylase (HDAC)

1.1.1 Khái niệm Histon Deacetylase

Cấu trúc của nhiễm sắc thể gồm 3 thành phần: ADN, protein histon và protein không phải histon[25] Đơn vị cơ bản của nhiễm sắc thể là nucleosom Mỗi nucleosom gồm 146 cặp base ADN được gói trong một protein histon octame [11] tạo bởi 4 thành phần: H2A, H2B, H3, H4 [38]

Các đầu amin của protein histon thường bị biến đổi bởi các quá trình methyl hóa, phosphoryl hóa hoặc acetyl hóa sau dịch mã Quá trình acetyl hoá là một trong những cơ chế điều hoà chính của biểu thị gen duới sự cân bằng hoạt động của enzym Histon Acetyltransferase (HAT) và enzym HDAC [5]

Hình 1.1: Cấu trúc nhiễm sắc thể điều hòa hoạt động phiên mã

(a) Sự methyl hóa và deacetyl hóa histon dẫn tới hình dạng đóng xoắn nhiễm sắc thể và ức chế phiên mã (b) Sự acetyl hóa và demethyl hóa histon làm tháo xoắn nhiễm sắc thể và cho phép phiên mã

HAT là enzym acetyl hóa nhóm -NH2 trong gốc lysin (đầu N tận) của histon, làm trung hòa điện tích dương trên lysin, do đó giảm khả năng tương tác của histon với ADN (tích điện âm) tạo cấu trúc mở chromatin Vì vậy, sự acetyl hóa histon tạo điều kiện cho quá trình phiên mã, dịch mã xảy ra (Hình 1.1b) [5],[25]

Trang 12

HDAC là enzym có tác dụng đối lập với HAT, giúp loại bỏ nhóm acetyl từ acetyl lysin (Ac-Lys) ở đầu N tận của histon, tạo điều kiện cho sự methyl hoá đuôi lysin làm cho ADN cuộn xoắn chặt chẽ hơn và ngăn cản các yếu tố phiên mã xâm nhập vào ADN, dẫn đến ức chế phiên mã (Hình 1.1a) [5],[25]

1.1.2 Phân loại các HDAC

Hiện nay người ta đã biết đến 18 loại HDAC khác nhau, được chia thành 4 nhóm: I, II, III, IV HDAC nhóm I, II và IV được gọi là các HDAC “kinh điển” phụ thuộc vào Zn2+ Đặc điểm của các enzym này được trình bày tóm tắt trong bảng 1.1

Bảng 1.1.Tóm tắt về các HDAC kinh điển với các đặc điểm về: kích thước, vị trí

phân bố trong tế bào và chức năng sinh lý

Nhóm HDAC Sốlượng

acid amin

Vị trí phân

bố trong tế bào

Chức năng sinh lý

I

HDAC1 483 Nhân tế bào Điều hoà sự sống sót và nhân

lên của tế bào HDAC2 488 Nhân tế bào Điều hoà sự nhân lên của tế bào

và sự kháng insulin HDAC3 428 Nhân tế bào Điều hoà sự sống sót và nhân

lên của tế bào HDAC8 377 Nhân tế bào Điều hoà sự nhân lên của tế bào

tế bào cơ tim và màng tế bào HDAC7 912 Nhân tế bào/ Biệt hoá tế bào tiền thân tạo

Trang 13

Tế bào chất máu, điều hoà chức năng nội

mô và quá trình tân tạo đường HDAC9 1069 Nhân tế bào/

Tế bào chất

Tái tổ hợp tương đồng, Biệt hoá tế bào tiền thân tạo máu, Điều hoà tăng trưởng và chức năng của tế bào cơ tim

1.1.3 Trung tâm hoạt động và cơ chế ức chế HDAC2

Để thiết kế các dẫn xuất ức chế enzym HDAC2, việc phân tích về trung tâm hoạt động và cơ chế ức chế nó là cần thiết Cấu trúc tinh thể hóa3D của enzym HDAC2 bởi Lauffer năm 2013 (ID 4LXZ, độ phân giải 1,85Å)[33]được tải về từ ngân hàng dữ liệu protein (protein data bank) Phân tích cấu trúc này bởi phần mềm Pymol ta thấy: Trung tâm hoạt động gồm túi enzyme và co-factor là Zn2+ Phần miệng túi rộng hình vành được tạo ra từ các chuỗi acid amin như: Gly32, His33, Pro34, Glu103, Asp104, Leu276, Thân túi có chiều dài khoảng 4-6C, tạo bởi các acid amin: Gly154, Phe155, Phe210, Đáy túi chứa co-factor Zn2+ đóng vai trò quan trọng trong cơ chế xúc tác của enzym Zn2+ tạo các liên kết phối trí với các acid amin ở đáy như His183, Asp 181, Asp269 Bên cạnh đó các acid amin như Tyr308, His145, His146 cũng đóng vai trò quan trọng trong việc tạo sự ổn định cho liên kết phối trí của co-factor (Hình 1.2)

Trang 14

Hình a: Cấu tạo miệng túi H

Hình c: Cấu tạo đáy túi H

Hình 1.2 Cấu t

Như vậy, để một cấu tử có thể

phải khóa được ion Zn

của cấu tử phải có các nhóm chức có thể tạo đ

76 Gly32

04

His183

Tyr 30

8

His146

ấu tạo miệng túi Hình b: Cấu tạo thân túi

ấu tạo đáy túi Hình d: Cơ chế ức chế HDAC2

ấu tạo trung tâm hoạt động và cơ chế ức chế

ể một cấu tử có thể thể hiện vai trò ức chếenzym HDAC2, nó cần

Zn2+ qua đó ức chế quá trình xúc tác của enzym Do đó cấu trúc

ủa cấu tử phải có các nhóm chức có thể tạo được liên kết phối trí với Zn

ũng có khả năng tạo liên kết được với các acid amin quan tr

ể tạo sự ổn định cho cấu tử trong trung tâm hoạt động

c chế HDAC 2

ấu trúc các chất ức chế HDAC2

ấu trúc các chất ức chế HDAC2 gồm 3 phần chính[14]:

ạt động (Capping group): là các vòng thơm ho

ào quá trình nhận diện với bề mặt acid amin

Zn2+

Phe155

Gly154

His145 Asp181

As p2

ấu tử trong trung tâm hoạt động

:

ơm hoặc peptid vòng,

Ph e21

0

Trang 15

- Vùng cầu nối (Linker): thường là các nhóm sơ nước, gồm các hydrocacbon thân dầu mạch thẳng hoặc vòng, có thể no hoặc không no, có vai trò tạo liên kết van der waals với thân túi (kênh enzym)

- Nhóm gắn với kẽm (Zinc Binding Group - ZBG): có thể là acid hydroxamic, các thiol, nhóm o-aminoanilin của benzamid, mercaptoceton Nhóm kết thúc gắn với kẽm tham gia tạo tương tác với ion Zn2+ tại trung tâm hoạt động của các HDAC

1.1.4.2 Các chất ức chế HDAC2 đã biết

Trong các nhóm chất ức chế HDAC, các acid hydroxamic là nhóm chất được quan tâm chú ý và tập trung nghiên cứu nhiều nhất Do các acid hydroxamic có cấu trúc đơn giản, dễ tổng hợp và có nhóm -CONHOH tạo được phức bền với Zn2+ở trung tâm hoạt động của HDAC mang lại có hoạt tính ức chế enzym mạnh Hiện nay, FDA đã phê duyệt một acid hydroxamic ức chế HDAC điển hình là vorinostat (Suberoylanilide hydroxamic acid - SAHA) vào năm 2006 sử dụng trong điều trị u

lympho da tế bào (Cutaneous T-cell lymphoma - CTCL)] Bảng 1.2 liệt kê các acid

hydroxamic tiêu biểu, bao gồm SAHA và một số hợp chất hiện đang trong các giai đoạn nghiên cứu lâm sàng Cấu trúc của chúng có thể được tham khảo trong Hình 1.3 Hiện nay, nhiều chất ức chế enzym HDAC với đặc điểm cấu trúc khác với acid hydroxamic cũng đang được thử nghiệm lâm như nhóm benzamid (SNDX-275, CI-

994 và MGCD-0103 đang nghiên cứu pha II), acid carboxylic (AN-9, Acid valproic –pha II, Phenyl butyrate –pha I lâm sàng), các peptid vòng (FK228 hiên trong pha II lâm sàng)[1],[49]

Bảng 1.2 Các chất ức chế HDAC đang thử nghiệm lâm sàng

Hợp chất Pha lâm sàng Loại ung thư

SAHA Được đưa vào điều trị Ung thư Lympho da tế bào

Trang 16

N

O

N H

O OH

N H

S

N H

O OH

O O

N H

O OH

N OH

N

H

NVP-LAQ824

PXD101 SAHA

HN

O OH

LBH-589

N H O

H N O

O

N H OH

và NuRD Những phức hợp là mục tiêu với các trình tự gen đặc hiệu bằng các tương tác với các yếu tố phiên mã trình tự đặc hiệu Ví dụ, các

Trang 17

HDAC2/HDAC1chứa phức hợp Sin3-SAP chọn lọc họ E2F của các yếu tố phiên

mã để ức chế phiên mã [9]

HDAC2 cũng quy định biểu hiện gen thông qua sự deacetyl của yếu tố phiên mã cụ thể bao gồm STAT3 và SMAD7 HDAC2 là một chìa khóa quan trọng của gen điều hòa chu kỳ tế bào, quá trình tế bào tự tiêu diệt, kết dính tế bào

và di cư Cùng với HDAC1, HDAC2 quy định việc phiên mã của các gen liên quan đến quá trình tạo máu, biệt hóa tế bào biểu mô, phát triển tim và tế bào thần kinh [12]

Các đột biến có thể có ở HDAC2 xuất hiện ở tế bào soma HDAC2 bị đột biến trong các khối u lẻ tẻ và trong các khối u phát sinh ở người có ung thư biểu

mô đại trực tràng không polyp di truyền Đột biến này do sự cắt bỏ 9 adenin ở exon1 tạo thành protein không hoạt động Sự biểu hiện các dạng đột biến của HDAC2 gây ra sự kháng với tác dụng của các chất ức chế HDAC Việc thiếu các biểu hiện và chức năng HDAC2 tạo nên sự tăng điều chỉnh gen thúc đẩy tăng trưởng khối u [2],[34] HDAC2 liên quan đến nhiều bệnh ung thư khác nhau: đại tràng, ung thư vú, ung thư tuyến tiền liệt, ung thư biểu mô tế bào gan, và ung thư phổi

1.2 Tổng quan về phương nghiên cứu QSAR

1.2.1 Lịch sử QSAR

Lịch sử phát triển của phương pháp QSAR có thể nói khởi nguồn từ những nghiên cứu của Crum-Brown và Frasher (1868)khi nhận xét rằng tác dụng sinh học

là hàm số của cấu trúc hóa học[8] Đến năm 1893, Richet đã cho rằng sự khác nhau

về tác dụng sinh học là do sự thay đổi về tính chất lí hóa[36] Đến năm 1935, một phương trình quan trọng của Hammett được coi là mô hình đầu tiên biểu diễn mối

quan hệt hoạt tính và cấu trúc:

Log (1)

Với K, Ko là hằng số acid,  là hằng số Hammett, thông số hóa lý đặc trưng cho khả năng hút hoặc đấy điện tử của nhóm thế[19]

Trang 18

QSAR thực sự được nghiên cứu bởi C.L Corwin Hansch từ những năm

60 của thế kỉ 20[20],[21] Mô hình QSAR Hansch thường sử dụng phương pháp hồi quy tuyến tính đa biến để biểu thị mối tương quan giữa các tham số hóa lí và hoạt tính sinh học, ví dụ một phương trình của ông như sau:

1.2.2 Đại cương về QSAR

Mô hình QSAR dựa trên giả thuyết là các hợp chất có đặc điểm cấu trúc tương đồng sẽ có tính chất sinh học tương đồng Về mặt toán học, mô hình QSAR biểu diễn mối tương quan định lượng giữa cấu trúc phân tử và hoạt tính thông qua phương trình:

QSAR được gọi là các tham số phân tử, mô tả một đặc điểm cấu trúc nào đó của

phân tử hóa học Theo Todeschini và Consonni [41], tham số phân tử là kết quả

cuối cùng của một quy trình toán học hoặc logic, biến đổi thông tin hóa học (vốn được đã hóa dưới dạng ký hiệu như C, H, N ) thành một số thực Tham số phân tử cũng có thể là kết quả thực nghiệm nào đó, như LogP, độ phân cực, v.v Hiện nay,

tham số phân tử có thể được chia thành 4 nhóm, dựa trên chiều thông tin (dimension) mô tả cấu trúc: (i) Tham số 0D mô tả thành phần cấu tạo nên cấu trúc, còn được gọi là các tham số đếm nguyên tử, như số lượng C, N (ii) Tham số 1D

mô tả cấu trúc dưới dạng chuỗi, như vân tay cấu trúc (fingerprint), hay số lượng các

Trang 19

mảnh cấu trúc, như số lượng nhân thơm, nhóm carboxylic (iii) Tham số 2D mô tả cấu trúc dưới dạng hình học topo, cho phép xác định chính xác thứ tự, vị trí của nguyên tố hay mảnh cấu trúc trong phân tử Các tham số 2D thường được tính toán dựa trên lý thuyết về graph (iii) Tham số 3D mô tả đặc điểm cấu trúc của phân tử trong không gian Các tham số 3D có thể được tính toán dựa trên các phương pháp

lý thuyết như MoRSE, GETAWAY, tính toán lượng tử, mô tả bề mặt hoặc thể tích phân tử Hiện nay, các nghiên cứu xây dựng mô hình QSAR dựa trên tham số 3D chủ yếu dựa trên cấu trúc hóa học được tối ưu hóa năng lượng trong môi trường chân không mà không quan tâm đến cấu dạng của phân tử khi nó nằm trong trung tâm hoạt động của đích, chịu tác động của các động lực của môi trường gắn kết Do

đó, mô hình QSAR chưa phản ánh chính xác mối tương quan cấu trúc-tác dụng của hoạt chất với đích phân tử của chúng

Hàm f là một hàm mô tả mối tương quan giữa Y và các biến x Để xây dựng được hàm f, cần áp dụng các thuật toán thống kê (statistical) hoặc học máy

(machine learning) Một số kỹ thuật thống kê thường được sử dụng trong xây dựng

mô hình QSAR có thể kể đến như bình phương tối thiểu từng phần (Partial Least Squares), hồi quy đa biến tuyến tính (Multiple Linear Regression),phân tích thành phần chính (Principal Component Analysis)[6],[12],[50] Kỹ thuật học máy là một lĩnh vực của trí tuệ nhân tạo, liên quan đến việc nghiên cứu và xây dựng các kĩ thuật cho phép các hệ thống "học" tự động từ dữ liệu để giải quyết những vấn đề cụ thể Trong xây dựng mô hình QSAR, các phương pháp học máy thường được sử dụng là: Cây quyết định (Decision Tree), mạng nơron nhân tạo (Artificial Neural Network), [3]

1.2.3 Quy trình xây dựng mô hình QSAR

Xây dựng cơ sở dữ liệu: Cơ sở dữ liệu thường là cấu trúc của các hợp chất

hoá học đã được chứng minh hoạt tính sinh họcin vitro Để hạn chế các yếu tố gây

sai số cho mô hình, cơ sở dữ liệu thường sẽ được làm sạch dựa trên sự tương đồng

về cấu trúc, về protocol,

Trang 20

Tính toán tham số mô tả phân tử đặc trưng cho cấu trúc: Tiến hành xây

dựng cấu trúc 2D, 3D của các hợp chất thu được, sau đó sử dụng các phần mềm để tính toán các tham số phân tử Số lượng tham số phân tử mà phần mềm tính toán càng nhiều thì càng mô tả chính xác cấu trúc của hợp chất

Bảng 1.3 Các phần mềm tính tham số phân tử thông dụng

STT Tên phần

mềm

Loại tham số tính được Số lượng

tham số

1 ADAPT Tham số cấu trúc hình học, hình học

tô pô, tham số điện tử, tham số lí hoá

>260

Predictor

Tham số điện tử, tham số hàm lượng

tử, tham số hình học tô pô

Xử lí sơ bộ dữ liệu: Trước khi tiến hành xây dựng mô hình, cần tiến hành xử

lí sơ bộ sô liệu để hạn chế bớt sai số, cũng như công việc cho chương trình xây dựng mô hình Công việc này có thể bao gồm loại bỏ các giá trị nằm ngoài phân bố của dữ liệu (outlier), chuyển đổi hàm thức của hoạt tính sinh học (logarit hóa, mũ hóa, nghịch đảo ), loại bỏ TSPT không liên quan,

Xây dựng mô hình QSAR: sử dụng các phương pháp xác xuất thống kê và

các kỹ thuật của trí tuệ nhân tạo để xây dựng mối liên hệ giữa các tham số phân tử

và giá trị đại lượng biểu diễn hoạt tính

Đánh giá mô hình: Đánh giá mô hình là giai đoạn quan trọng liên quan đến

khả năng ứng dụng của mô hình Đánh giá mô hình thường sử dụng 5 nguyên tắc của OECD[43]:

Trang 21

- Nguyên tắc 1: Có đích xác định (defined end-points)

Đích là những giá trị thực nghiệm về hoạt tính sinh học thu được tư cơ sở dữ liệu Nếu toàn bộ CSDL đều sử dụng một protocol để xác định giá trị của đích, thì

mô hình xây dựng được có độ tin cậy cao, có thể dùng để dự đoán hoạt tính các hợp chất mới (nếu thực nghiệm dùng theo quy trình này) Còn nếu CSDL sử dụng nhiều protocol khác nhau thì mô hình sẽ không có độ tin cậy cao

- Nguyên tắc 2: Các thuật toán sử dụng được mô tả rõ ràng

Các thuật toán sử dụng để xây dựng mô hình cần được mô tả rõ ràng, có khả năng ứng dụng để xây dựng các mô hình khác Cần xem xét các yếu tố sau khi đánh giá thuật toán:

 Dữ liệu về cấu trúc, hoạt tính sinh học đầy đủ, rõ ràng

 Thuật toán tính toán các tham số phân tử rõ ràng

 Mô tả về tập huấn luyện và tập quan sát, cách xác định giá trị ngoại lai (outlier)

 Mô tả thuật toán xây dựng mô hình

 Mô tả các thông số thống kê đánh giá mô hình

- Nguyên tắc 3: Có miền cấu trúc ứng dụng xác định

Miền cấu trúc ứng dụng là khoảng không gian cấu trúc được xác định bởi các hợp chất trong tập huấn luyện để xây dựng mô hình Những hợp chất thuộc tấp huấn luyện nếu có cấu trúc nằm ngoài miền cấu trúc ứng dụng sẽ ảnh hưởng đến độ chính xác của mô hình Những hợp chất thuộc tập dự đoán, nếu cấu có cấu trúc nằm ngoài miền này sẽ cho kết quả dự đoán không chính xác.Các phương pháp xác định miền ứng dụng thường gặp như: phương pháp đòn bẩy, phương pháp ba lân cận gần nhất, [40],[45]

- Nguyên tắc 4:Có độ khớp, độ ổn định, và khả năng dự đoán tốt

 Độ khớp hay độ tuyến tính được đánh giá thông qua giá hệ số xác định R2,

R2 càng cao thì mức độ khớp (tuyến tính) của mô hình với các giá trị thực nghiệm càng tốt.R2> 0,6 thì mô hình mới có ý nghĩa Công thức tính hệ số xác định như sau:

Trang 22

1 1

^

2

)(

)(

n i

i i

y y

y y

Trong đó n là số các quan sát của tập huấn luyện; yi,^y,lần lượt là giá trị thực tế, giá trị dự đoán của biến phụ thuộc ở quan sát thứ i; y là giá trị thực tế trung bình của biến phụ thuộc

 Độ ổn định được đánh giá thông qua hệ số tương quan chéo Q2, Q2 được đánh giá dựa trên phương pháp tham số chéo (cross validation leave one out) bằng cách lần lượt loại 1 quan sát ra khỏi tập huấn luyện, giữ nguyên các biến đã lựa chọn và tính toán lại các thông số của mô hình Q2 càng gần 1, tính tổng quát hóa của mô hình càng cao, mô hình càng ổn định Thông thường, yêu cầu Q2 > 0,5 thì

mô hình mới bền vững.Công thức hệ số tương quan chéo tính như sau:

2

1 1

^ / 2

)(

)(

n i

i i

y y

y y

Trang 23

 Khả năng dự đoán ngoại

Khả năng dự đoán ngoại được đánh giá thông qua giá trị Q2ext, Q2ext càng lớn

mô hình cho thấy độ tuyến tính của tập kiễm tra và do vậy chứng tỏ khả năng dự đoán của mô hình cao

2

1 1

^

2

)(

)(

n i

i i ext

y y

y y

Trong đó n là số các quan sát tấp kiểm tra; yi, ^y, lần lượt là giá trị thực tế, giá trị dự đoán của biến phụ thuộc ở quan sát thứ i; y là giá trị thực tế trung bình của biến phụ thuộc

- Nguyên tắc 5: Giải thích được cơ chế (nếu có thể)

Mô hình cần được giải thích về vai trò của các biến trong mô hình, qua đó giúp định hướng thiết kế các hợp chất mới Tuy nhiên việc giải thích các biến này nhiều khi gặp phải khó khăn vì cơ chế của chúng phức tạp đòi hỏi những hiểu biết chuyên sâu về hóa lượng tử Bên cạnh đó có nhiều biến chưa có các tài liệu tham khảo, do

đó chưa đủ cơ sở để giải thích

1.3 Kỹ thuật Protein docking

1.3.1 Đại cương về phương pháp Protein docking

Protein docking là một trong những phương pháp được sử dụng phổ biến nhất trong quá trình thiết kế thuốc dựa trên cấu trúc vì có khả năng dựđoán với độ chính xác khá cao sự hình thành liên kết của cấu tử với receptor trong túi liên kết

Ra đời từ những năm 1980[23], docking phân tử đã trở thành một công cụ thiết yếu trong nghiên cứu và phát triển thuốc Không những chỉ ra các liên kết có ý nghĩa, docking còn có thể định lượng khả năng liên kết bởi các hàm tính điểm, qua đó phân hạng khả năng liên kết mạnh yếu của các cấu tử[24] Docking trở thành một bài toán tối ưu, tìm vị trí và cấu hình phù hợp nhất của một cơ chất gắn kết lên protein Về mặt nhiệt động lực học, mục tiêu chính của docking là tìm ra cấu hình

mà năng lượng tự do của toàn hệ là thấp nhất Để tìm cấu hình phù hợp nhất, cần

Trang 24

liên hệcấu hình không gian với các trị số đánh giá được khả năng gắn kết của cơ chất lên protein và sau đó áp dụng thuật toán tìm kiếm [24]

Thuật giải di truyền (Genetic Algorithm - GA) là thuật toán tìm kiếm được ứng dụng nhiều trong các chương trình docking như Autodock, Autodock Vina, GOLD[11],[19],[36] GA áp dụng các lí thuyết liên quan đến học thuyết tiến hoá và chọn lọc tự nhiên Đầu tiên, thuật toán sẽ mã hoá tất cả các tham số của cấu trúc ban đầu trong một nhiễm sắc thế - biểu diễn bằng một vec tơ Từ nhiễm sắc thể ban đầu này, tạo ngẫu nhiên một quần thể bao phủ một miền năng lượng Quần thể này được đánh giá và từ đó các nhiễm sắc thể thích nghi nhất (tức là có giá trị năng lượng thấp nhất) được chọn làm khung để tạo ra quần thể tiếp theo Quy trình này làm giảm năng lượng trung bình của toàn bộ nhiễm sắc thể bằng cách truyền các đặc tính cấu trúc thuận lợi từ một quần thể này sang một quần thể khác Sau một số chu

kỳ tìm kiếm và đánh giá, cuối cùng ta sẽ tìm được một nhiễm sắc thể (cấu dạng) phù hợp với mức năng lượng tối thiểu[17]

Chương trình docking sử dụng các hàm tính điểm (scoring function) để ước lượng các năng lượng liên kết của phức hợp cấu tử - receptor Năng lượng này được cho bởi hằng số liên kết (Kd) và năng lượng tự do Gibbs (ΔGL) Dự đoán về năng lượng liên kết được thực hiện bằng cách đánh giá những tương tác hóa lý quan trọng bao gồm: các tương tác liên phân tử, các ảnh hưởng solvat và entropy[24] Do

đó, số lượng các tham số hoá lý được đánh giá càng lớn thì độ chính xác càng cao Tuy nhiên, nếu số lượng biến càng lớn thì thời gian tính toán sẽ lâu Các hàm tính điểm hiệu quả nên đưa ra sự cân bằng giữa độ chính xác và tốc độ, đây là một điểm quan trọng khi làm việc với cơ sỡ dữ liệu lớn

1.3.2 Quy trình Docking

Quá trình docking được thực hiện thông qua ba bước: chuẩn bị cấu tử, chuẩn

bị protein, mô phỏng docking

Chuẩn bị cấu tử: cấu trúc các cấu tử có thể được lấy từ hệ thống dữ liệu có

sẵn như Pubchem,Zinc[16],[22] Trong trường hợp không có sẵn, chúng ta có thể

Trang 25

xây dựng cấu trúc cấu tử bởi các phần mềm như ChemDraw, Chemsketch…Sau khi xây dựng được cấu trúc 3D, sử dụng các phần mềm để chuẩn bị cấu tử cho chương trình mô phỏng docking, các bước chuẩn bị thường được tiến hành gồm: gắn hydro, gắn trường lực, xây dựng file pdbqt

Chuẩn bị protein: Cấu trúc 3D của protein thường có sẵn trên ngân hàng dữ

liệu protein (protein data bank) Trong trường hợp chưa có sẵn, chúng ta có thể xây

dựng cấu trúc 3D theo phương pháp mô phỏng tính tương đồng (homology modeling)[38] Sau khi có cấu trúc 3D, sử dùng các phần mềm để chuẩn bị protein cho chương trình mô phỏng docking Các bước chuẩn bị thường gồm: loại nước và các cấu tử (nếu có), thêm hydro, gắn trường lực và xây dựng file pdbqt

Mô phỏng docking: Trước khi phần mềm tiến hành tìm kiếm vị trí và cấu

dạng phù hợp của cấu tử, cần khoanh vùng tìm kiếm (grid box) cho thuật toán Kích thước của vùng tìm kiếm không nên quá lớn vì như thế sẽ tốn kém thời gian và độ lặp lại không cao, cũng không nên quá nhỏ vì như vậy phần mềm chỉ tìm kiếm được một vùng rất nhỏ, không có ý nghĩa Vị trí của vùng tìm kiếm thông thường sẽ được đặt ở trung tâm hoạt động của protein Sau khi xác định vị trí và kích thước của vùng tìm kiếm, phần mềm sẽ tự động tìm kiếm và đưa ra cấu dạng phù hợp với năng lượng thấp nhất Cấu dạng này cùng với các tương tác của nó với protein sẽ được phân tích bởi các phần mềm chuyên dụng như: MOE, Pymol, Discovery

studio…

Trang 26

CHƯƠNG 2 NGUYÊN LIỆU, THIẾT BỊ, NỘI DUNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU

2.1 Nguyên liệu và thiết bị

Nguyên liệu:

Cấu trúc của 46 hợp chất là dẫn xuất của acid hydroxamic có hoạt tính ức

chế HDAC2được đăng trên tạp chí khoa học [5],[6][7],[25],[33],[35](Phụ lục 1)

Cấu trúc tinh thể tia X của HDAC2 (4LXZ) được tải từ ngân hàng dữ liệu protein (protein data bank), sau đó tiến hành loại bỏ các chuỗi B và C, sử dụng chuỗi A cho quá trình nghiên cứu

Thiết bị: Sử dụngcác phần mềm trên máy tính Dell Vostro 1450 – Hệ điều

hành Windows 10

Phần mềm:Danh sách các phần mềm sử dụng bao gồm:

1 ChemBioOffice 2010 7 Dragon 6.0

2 ChemSketch 16.8.1 8 Mobydigs 1.0

3 MGLtools 1.5.7 9 Microsoft Excell 2010

4 Autodock Vina 1.1.210 10 Run Prodrg (sử dụng online)

5 Discovery Studio 2016 11 MOE 2009

6 UCSF Chimera 1.10.2

2.2 Nội dung nghiên cứu

1 Xác định cấu dạng của một số dẫn xuất acid hydroxamic đã tổng hợp khi

chúng ức chế enzym HDAC2 thông qua mô phỏng protein docking

2 Xây dựng mô hình toán học mô tả mối tương quan định lượng giữa cấu trúc

và hoạt tính (QSAR) ức chế HDAC2 của các hợp chất sau khi docking

3 Thiết kế và dự đoán hoạt tính cho một số acid hydroxamic mới

2.3 Phương pháp nghiên cứu

2.3.1 Mô phỏng protein docking

2.3.1.1 Re-dock SAHA

Re-dock SAHA là bước quan trọng để thẩm định quy trình dock Quy trình dock được đánh giá là phù hợp nếu sự sai lệch giữa SAHA ở vị trí ban đầu trong

Ngày đăng: 09/10/2017, 16:34

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm