Tổng quan về Hóa học tính toán Hóa học tính toáncomputational chemistry là một thuật ngữ dùng để chỉ việc sử dụng các kĩ thuật tính toán trong hóa học, từ cơ học lượng tử các phân tử đến
Trang 1ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
-Phạm Trọng Lâm
NGHIÊN CỨU LÍ THUYẾT VỀ TƯƠNG TÁC GIỮA VEGFR-2 VÀ
LENVATINIB BẰNG PHƯƠNG PHÁP MÔ PHỎNG
ĐỘNG LỰC HỌC PHÂN TỬ
LUẬN VĂN THẠC SĨ KHOA HỌC
Trang 2ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
-Phạm Trọng Lâm
NGHIÊN CỨU LÍ THUYẾT VỀ TƯƠNG TÁC GIỮA VEGFR-2 VÀ
LENVATINIB BẰNG PHƯƠNG PHÁP MÔ PHỎNG
ĐỘNG LỰC HỌC PHÂN TỬ
Chuyên ngành: Hóa lý và Hóa lý thuyết
Mã số: 60440119
LUẬN VĂN THẠC SĨ KHOA HỌC
NGƯỜI HƯỚNG DẪN KHOA HỌC:
PGS.TS LÊ KIM LONG
TS NGUYỄN HỌA MI
Trang 3LỜI CẢM ƠN
Trước tiên tôi xin được bày tỏ lòng biết ơn chân thành đến PGS TS Lê KimLong và TS Nguyễn Họa Mi - Cán bộ Trung tâm Ứng dụng Tin học trong Hóa học,Khoa Hóa học, trường Đại học Khoa học Tự nhiên Thầy Lê Kim Long là người đã gợi
ý và chấp nhận đề xuất đề tài nghiên cứu của tôi Thầy cũng luôn tạo mọi điều kiệnthuận lợi giúp tôi chủ động trong nghiên cứu Cô Nguyễn Họa Mi là người đã trựctiếp hướng dẫn và góp ý trong suốt quá trình tôi học tập và nghiên cứu lĩnh vực Hóahọc tính toán ở Khoa Hóa học Cô cũng là người luôn động viên khi tôi gặp nhữngkhó khăn, căng thẳng trong cuộc sống cũng như trong nghiên cứu
Tôi cũng xin gửi lời cảm ơn sâu sắc đến GS TS Lâm Ngọc Thiềm, người thầy
đã có những chia sẻ, động viên để giúp tôi có thêm động lực hoàn thành bản luận vănnày
Tôi xin trân trọng cảm ơn các thầy giáo, cô giáo, cán bộ Khoa Hóa học, trườngĐại học Khoa học Tự nhiên - ĐHQGHN đã truyền đạt những kinh nghiệm và góp ýrất quý báu trong suốt thời gian tôi học tập và nghiên cứu ở khoa
Cuối cùng, tôi xin trân trọng cảm ơn sự hỗ trợ của đề tài cấp Đại học Quốc gia
Hà Nội, mã số QG.17.37 trong quá trình nghiên cứu
Học viên
Trang 4Danh mục hình
Trang
Hình 1 Cơ chế chung trong quá trình kích thích hình thành mạch máu
của tế bào ung thư và vị trí tác động của thuốc lenvatinib 15
Hình 2 Cấu trúc 3D của phức hợp VEGFR-2–lenvatinib 17
Hình 3 Nhiệt độ trong bước cân bằng NVT 33
Hình 4 Áp suất trong bước cân bằng NPT 34
Hình 5 Tương tác giữa lenvatinib (LEV) và protein trong cấu trúc X-Ray 36 Hình 6 Tương tác giữa lenvatinib (LEV) và protein trong cấu trúc đã bổ sung tham số trường lực 38
Hình 7 Tương tác giữa lenvatinib (LEV) và protein trong cấu trúc đã cân bằng nhiệt độ và áp suất 39
Hình 8 Tương tác giữa lenvatinib (LEV) và protein trong cấu trúc chiếm trọng số tồn tại lớn nhất trong 100 ns MD 40
Hình 9 Tương tác giữa LEV và protein trong cấu trúc chiếm trọng số tồn tại lớn nhất của 100 ns MD thể hiện bằng Pymol 42
Hình 10 Số liên kết hidro giữa lenvatinib và protein theo thời gian 43 Hình 11 RMSD mạch chính của protein trong 2 phức hợp với lenvatinib
Trang 5Hình 13 Root mean square fluctuation (RMSF) của các residue trong
phức hợp 3WZD 47
Hình 14 Root mean square fluctuation (RMSF) của các residue trong phức hợp 3WZE 48
Hình 15 Năng lượng tự do về liên kết trong phức hợp 3WZD và 3WZE, tính theo g_mmpbsa 49
Hình 16 Năng lượng tự do về liên kết giữa ligand và protein trong 2 phức hợp 3WZD và 3WZE tính theo mô hình LIE 54
Hình 17 Chu trình nhiệt động lực học dùng để tính toán đóng góp entropy vào quá trình tạo phức hợp 3WZD và 3WZE 56
Hình 18 Năng lượng tự do về liên kết trong phức hợp 3WZD, 3WZE, và 4AGD, tính theo g_mmpbsa 60
Hình 19 Sự hội tụ trong quá trình cực tiểu năng lượng 74
Hình 20 Sự dao động nhiệt độ trong cân bằng NVT 76
Hình 21 Sự dao động áp suất trong quá trình cân bằng NPT 78
Hình 22 Sự dao động mật độ 79
Hình 23 Sự thay đổi RMSD trong mô phỏng 81
Hình 24 Sự thay đổi Rg trong mô phỏng 82
Trang 6Danh mục bảng
Trang
Bảng 1 Tham số tương tác động học giữa VEGFR-2 và một số loại thuốctương tự 16
3WZE thu được từ mô phỏng MD kéo dài 100 ns 52
3WZE, và 4AGD thu được từ mô phỏng MD kéo dài 10 ns 59
Trang 7Danh mục kí hiệu và viết tắt
NPT Constatn number of particles, pressure and temperature ensemble
Trang 8Mục lục
Trang
1.1 Tổng quan về Hóa học tính toán 2
1.2 Mô phỏng động lực phân tử (Molecular Dynamic Simulations) 5
1.3 Thuật toán mô phỏng động lực phân tử 7
1.3.1 Thuật toán toàn cục 7
1.3.2 Một số thuật toán tiêu biểu trong MD 8
2 ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU 14 2.1 ĐỐI TƯỢNG NGHIÊN CỨU 14
2.2 PHƯƠNG PHÁP NGHIÊN CỨU 19
2.2.1 Phương pháp thực hiện tính toán MD 19
2.2.2 Các bước chuẩn bị tệp đầu vào 20
3 KẾT QUẢ VÀ THẢO LUẬN 32 3.1 Kết quả tính toán cân bằng nhiệt độ và áp suất 32
Trang 93.3.2 RMSF 46
3.4 Năng lượng tự do về liên kết chưa bao gồm đóng góp entropy 46
3.4.1 Mô hình MM-PBSA 46
3.4.2 Mô hình năng lượng tương tác bậc một - LIE 53
3.5 Năng lượng tự do về liên kết đã bao gồm đóng góp entropy 55
3.6 Năng lượng tự do về liên kết khi rút ngắn thời gian mô phỏng 58
KẾT LUẬN 63 TÀI LIỆU THAM KHẢO 64 Tiếng Việt 64
Tiếng Anh 65
Phụ lục A Các bước mô phỏng theo MD 68 A.1 Tổ chức thư mục 69
A.2 Xây dựng hệ mô phỏng 70
A.2.1 Protein 70
A.2.2 Ligand 70
A.2.3 Phức hợp protein-ligand 71
A.2.4 Định nghĩa ô mạng đơn vị và thêm dung môi 71
A.2.5 Thêm ion 72
A.3 Cực tiểu năng lượng - EM 73
A.3.1 Cân bằng 74
A.3.2 Cân bằng NVT 76
A.3.3 Cân bằng NPT 77
A.4 Thực hiện tính toán MD 79
A.5 Thực hiện phân tích kết quả 80
A.5.1 Liên kết hidro giữa protein-ligand 80
A.5.2 Năng lượng tương tác van der Waals và tĩnh điện 80
Trang 10A.5.3 RMSD 81
A.5.4 Bán kính hồi chuyển - Radius of gyration Rg 81
Phụ lục B Một số vấn đề còn tồn tại trong quá trình thực hiện nghiên cứu 83 Phụ lục C Một số kinh nghiệm trong quá trình thực hiện đề tài 85 Phụ lục D Một số mã nguồn sử dụng khi phân tích kết quả và vẽ đồ thị 86 D.1 Chuyển file PS sang PNG 86
D.2 Mã nguồn cho Hình 3 87
D.3 Mã nguồn cho Hình 4 89
D.4 Mã nguồn cho Hình 11 91
D.5 Mã nguồn cho Hình 12 93
D.6 Mã nguồn cho Hình 13 95
D.7 Mã nguồn cho Hình 14 97
D.8 Mã nguồn cho Hình 15 99
D.9 Mã nguồn cho Hình 16 101
D.10 Mã nguồn cho Hình 18 103
Trang 11MỞ ĐẦU
Ung thư là bệnh nguy hiểm và có xu hướng xuất hiện ngày càng phổ biến
Do đó việc phát triển các thuốc điều trị ung thư trở nên rất cần thiết Để tìm rathuốc điều trị ung thư hiệu quả, chúng ta cần nắm được cơ chế phát triển tế bàoung thư và cơ chế tương tác giữa thuốc kháng ung thư với cơ thể
Trong các cơ chế được nghiên cứu nhằm tìm ra thuốc điều trị ung thư hiệuquả, cơ chế hình thành mạch máu là một cơ chế đáng chú ý Các tế bào ungthư có tốc độ sinh trưởng và phát triển lớn nên cần có nhiều mạch máu đưachất dinh dưỡng tới nuôi dưỡng Thụ thể yếu tố tăng trưởng mạch máu nội môloại 2 (VEGFR-2) là một protein đóng vai trò quan trọng trong việc hình thànhmạch máu tới nuôi các tế bào ung thư Việc ức chế VEGFR-2 sẽ hạn chế sự pháttriển của các tế bào ung thư Hiện nay, Cục Quản lý Thực phẩm và Dược phẩm
Mỹ (FDA) đã cấp phép sử dụng một số loại thuốc ức chế VEGFR-2 trong việcđiều trị ung thư như bevacizumab, sorafenib, sunitinib, pazopanib, everolimus vàlenvatinib Trong số đó, lenvatinib là loại thuốc mới được cấp phép và tác dụng
ức chế ung thư mạnh hơn sorafenib và sunitinib, nhưng cơ chế chưa được hiểu rõ.Các nghiên cứu đã công bố hiện nay mới chỉ xác định được cấu trúc phân tử củaphức hợp VEGFR-2 liên kết với lenvatinib, và xác định một số tham số tương tácđộng học Việc đi sâu vào các tương tác biến đổi theo thời gian để làm rõ thêm
cơ chế vẫn còn chưa được nghiên cứu Phương pháp tính toán mô phỏng trên máytính có thể bổ sung các thông tin đó
Do đó, nghiên cứu lí thuyết bằng phương pháp mô phỏng trên máy tính để
bổ sung hiểu biết về cơ chế tương tác giữa protein VEGFR-2 và lenvatinib vừacần thiết về thực tiễn, vừa có ý nghĩa khoa học Xuất phát từ thực tế đó, chúng tôi
đã lựa chọn thực hiện đề tài "Nghiên cứu lí thuyết về tương tác giữa VEGFR-2
và lenvatinib bằng phương pháp mô phỏng động lực học phân tử"
Trang 12Chương 1.
TỔNG QUAN
Phần cơ sở lý thuyết được lược dịch từ hai tài liệu [12] và [21]
1.1 Tổng quan về Hóa học tính toán
Hóa học tính toán(computational chemistry) là một thuật ngữ dùng để chỉ việc
sử dụng các kĩ thuật tính toán trong hóa học, từ cơ học lượng tử các phân tử đến
động lực học của các hệ phức hợp hoặc phân tử lớn Mô phỏng phân tử (molecular
modelling) là danh từ dùng để chỉ quá trình mô tả các hệ hóa học phức tạp bằng môhình nguyên tử thực tế, nhằm hiểu rõ và tiên đoán các tính chất vĩ mô dựa trên kiênthức chi tiết ở qui mô nguyên tử Thông thường, mô phỏng phân tử được dùng để thiết
kế vật liệu mới, trong đó người ta cần tiên đoán chính xác tính chất vật lí của hệ thốngthực
Trang 13xuyên tâm của một chất lỏng, và (b) các tính chất động hoặc phi cân bằng (dynamic
or non-equilibrium properties), chẳng hạn như độ nhớt của chất lỏng, các quá trìnhkhuếch tán trong màng tế bào, động học chuyển pha, động học phản ứng, hoặc độnghọc khuyết tật tinh thể Việc lựa chọn kĩ thuật tính toán phụ thuộc vào câu hỏi đượcđặt ra và khả năng đưa ra câu trả lời đáng tin cậy của phương pháp tại thời điểmhiện giờ Trong trường hợp lí tưởng, phương trình Schr¨odinger phụ thuộc thời giantương đối tính (relativistic time-dependent Schr¨odinger equation) mô tả rất chính xác
hệ phân tử, nhưng với bất cứ hệ nào phức tạp hơn một vài nguyên tử ta lại không thể
sử dụng được phương pháp ab initio này Do đó ta cần sử dụng các phương pháp gần
đúng, hệ càng phức tạp và thời gian của quá trình quan tâm càng dài, ta càng sử dụngnhiều xấp xỉ Tại một điểm nào đó (sớm hơn rất nhiều so với mong muốn của chúng
ta), phương pháp ab initio cần phải được bổ sung hoặc thay thế bằng việc tham số
thực nghiệm hóa mô hình Khi các mô phỏng dựa trên các cơ sở vật lí của tương tácnguyên tử không thể thực hiện được do hệ có độ phức tạp quá cao, mô phỏng phân
tử lại hoàn toàn chỉ dựa vào việc phân tích tương tự các dữ liệu hóa học của các cấutrúc đã biết Các phương pháp QSAR (Quantitative Structure-Activity Relationship)
và nhiều phương pháp dự đoán cấu trúc protein dựa trên tính tương đồng thuộc vàoloại này
Các tính chất vĩ mô luôn là các trung bình tập hợp (ensemble average) của mộttập hợp thống kê đại diện (representative statistical ensemble) (cân bằng hoặc phi cânbằng) của hệ phân tử Với mô phỏng phân tử, điều này dẫn tới hai hệ quả quan trọng:
• Kiến thức về một cấu trúc, thậm chí là cấu trúc năng lượng cực tiểu toàn cục, là
không đủ Ta cần phải có tập hợp đại diện tại nhiệt độ đã cho, để tính toán cáctính chất vĩ mô Nhưng ngay cả điều này cũng không đủ để tính các tính chấtcân bằng nhiệt động dựa trên năng lượng tự do, chẳng hạn như cân bằng pha,hằng số liên kết, độ tan, độ bền tương đối của các cấu dạng phân tử Việc tínhtoán năng lượng tự do và các thế nhiệt động cần có sự mở rộng đặc biệt của các
Trang 14kĩ thuật mô phỏng phân tử.
• Tuy về mặt lí thuyết, mô phỏng phân tử cho ta chi tiết về cấu trúc và chuyểnđộng ở mức độ nguyên tử, các chi tiết này lại thường không liên quan tới cáctính chất vĩ mô mà ta quan tâm Điều này cho phép ta đơn giản hóa việc mô tảcác tương tác và lấy giá trị trung bình của các chi tiết không liên quan Cơ họcthống kê cung cấp cho ta cơ sở lí thuyết để thực hiện việc đơn giản hóa đó Có
cả một bậc thang các phương pháp từ việc coi các nhóm nguyên tử như một đơn
vị, mô tả chuyển động bằng các tọa độ tập hợp đã rút gọn số lượng (reducednumber of collective coordinates), lấy trung bình các phân tử dung môi với thếnăng của lực trung bình (potential of mean force) kết hợp với động học ngẫunhiên (stochastic dynamics), cho tới động học các hệ có kích thước trung gian(mesoscopic dynamics) mô tả các mật độ (density) thay vì mô tả các nguyên tử,
và các dòng (flux) theo hàm của gradient nhiệt động thay vì vận tốc hoặc giatốc theo hàm của lực
Để tạo ra tập hợp cân bằng đại diện ta có hai phương pháp: (a) mô phỏng MonteCarlo và (b) mô phỏng động học phân tử (Molecular Dynamics simulation) Để tạo racác tập hợp phi cân bằng và phân tích các hiện tượng động, ta chỉ có thể dùng phươngpháp (b) Tuy mô phỏng Monte Carlo đơn giản hơn MD (do không đòi hỏi việc tínhtoán các lực), nó lại không cho kết quả tốt hơn đáng kể so với phương pháp MD trongcùng một khoảng thời gian chạy máy Do đó, MD là phương pháp phổ quát hơn Nếucấu trúc ban đầu rất xa so với cấu trúc cân bằng, các lực có thể quá lớn và phươngpháp MD sẽ thất bại Trong các trường hợp đó, ta cần cực tiểu hóa năng lượng Một
lí do nữa để thực hiện cực tiểu hóa năng lượng (energy minimization) đó là việc loại
bỏ động năng ra khỏi hệ: nếu một vài cấu trúc trong mô phỏng động học cần được sosánh với nhau, việc cực tiểu hóa năng lượng sẽ giảm bớt nhiễu nhiệt (thermal noise)
Trang 151.2 Mô phỏng động lực phân tử (Molecular Dynamic
Các phương trình trên được giải đồng thời với các bước thời gian nhỏ Hệ được
mô phỏng trong một thời gian, đồng thời giữ nhiệt độ và áp suất ở giá trị yêu cầu, vàcác tọa độ được viết vào một file đầu ra ở các thời điểm cách đều nhau Tọa độ với vai
trò là hàm theo thời gian biểu diễn quĩ đạo (trajectory) của hệ Sau các biến đổi ban đầu, hệ sẽ thường đạt tới một trạng thái cân bằng (equilibrium state) Bằng cách lấy
trung bình theo một quĩ đạo cân bằng, ta có thể tính được nhiều tính chất vĩ mô từ fileđầu ra
Bây giờ ta đề cập tới một số giới hạn của phương pháp MD Người sử dụng cầnnắm được các giới hạn này và luôn kiểm chứng dựa trên các tính chất thực nghiệm đãbiết để đánh giá độ chính xác của mô phỏng
Mô phỏng MD có tính chất cổ điển (classical)
Việc sử dụng phương trình Newwton về chuyển động đồng nghĩa với việc áp
dụng cơ học cổ điển để mô tả chuyển động của các nguyên tử Điều này có thể chấp
nhận được với hầu hết các nguyên tử ở nhiệt độ thường, nhưng cũng có ngoại lệ Các
Trang 16nguyên tử hidro khá nhẹ và chuyển động của proton đôi khi có bản chất cơ học lượng
tử Chẳng hạn, một proton có thể xuyên hầm qua hàng rào thế năng trong quá trình
chuyền hidro qua liên kết hidro Quá trình như thế không thể mô tả đầy đủ bằng độnglực học cổ điển! Chất lỏng heli ở nhiệt độ thấp là một ví dụ khác về sự không áp dụngđược cơ học cổ điển Có thể chúng ta không quan tâm lắm về heli, nhưng các daođộng tần số cao của liên kết cộng hóa trị chắc chắc là điều ta cần quan tâm Cơ họcthống kê của dao động tử điều hòa cổ điển trở nên khác biệt đáng kể với dao động
tử lượng tử thực khi tần số cộng hưởng ν xấp xỉ hoặc vượt quá kBT /h Ở nhiệt độthường, số sóng ¯ν = 1/λ = ν/c tại đó hν = kBT rơi vào khoảng 200 cm−1 Do đó,tất cả các dao động có tần số ứng với số sóng cao hơn 100 cm−1 có thể không được
mô tả đủ tốt trong mô phỏng cổ điển Điều này có nghĩa là trên thực tế, tất cả các daođộng liên kết và dao động góc liên kết đều là gần đúng, và thậm chí các chuyển độngliên kết hidro bị vượt ra ngoài giới hạn cổ điển
Electron ở trạng thái cơ bản
Trong MD ta sử dụng trường lực bảo toàn là hàm của vị trí các nguyên tử Điều
này có nghĩa là chuyển động của các electron không được xét tới: các electron được
coi là tự điều chỉnh ngay lập tức khi vị trí các nguyên tử thay đổi (phép xấp xỉ
Born-Oppenheimer, và giữ nguyên ở trạng thái cơ bản Điều này có thể chấp nhận đượctrong phần lớn các trường hợp Nhưng các quá trình chuyển electron và các trạngthái kích thích electron không thể được mô tả chính xác Các phản ứng hóa học cũngkhông được mô tả chính xác
Trang 171.3 Thuật toán mô phỏng động lực phân tử
1.3.1 Thuật toán toàn cục
1 Nhập điều kiện ban đầu Thế năng tương tác V là hàm theo vị trí các nguyên
tử Vị trí r của tất cả các nguyên tử trong hệ Vận tốc v của tất cả các nguyên tửtrong hệ
2 Lặp lại 3, 4, 5 với số bước yêu cầu:
3 Tính toán các lựcLực trên mỗi nguyên tử
Fi =−∂V∂r
iđược tính bằng cách tính lực giữa các cặp nguyên tử không liên kết:
4 Cập nhật cấu hìnhChuyển động của các nguyên tử được mô phỏng bằng cáchgiải số học phương trình Newton
d2ri
dt2 = Fi
mihoặc
Trang 181.3.2 Một số thuật toán tiêu biểu trong MD
Các thuật toán lấy tích phân
Thuật toán nhảy cóc (leap-frog)
Đây là một thuật toán hay được sử dụng để lấy tích phân phương trình chuyểnđộng Khi cần độ chính xác cao trong việc lấy tích phân, ta có thể dùng thuật toánVerlet Thuật toán nhảy cóc sử dụng vị trí r ở thời điểm t và vận tốc v ở thời điểm
t− 1
2∆t; nó cập nhật vị trí và vận tốc sử dụng lực F (t) được xác định dựa trên vị trí
ở thời điểm t theo các phương trình sau:
Thuật toán này cho ra quĩ đạo trùng khớp với thuật toán Verlet
Thuật toán Verlet
Trong thuật toán Verlet, vị trí r và vận tốc v ở thời điểm t được dùng để lấy tíchphân các phương trình chuyển động; vận tốc ở nửa bước trước không cần thiết
Trang 19Các thuật toán điều nhiệt
Điều chỉnh vận tốc bằng cách nhân tỉ lệ
Mô phỏng được bắt đầu bằng thuật toán lấy tích phân với vị trí và vận tốc banđầu đã có Thông thường, ta biết vị trí từ thực nghiệm và vận tốc được lấy ngẫu nhiêntheo phân bố Maxwell-Boltzmann tương ứng với một nhiệt độ cần thiết
Trong quá trình mô phỏng, nhiệt độ thực tế sẽ bị sai lệch khỏi nhiệt độ yêu cầu:
T (t) = 2
3
Ekin(t)
Lưu ý rằng nhiệt độ trong công thức trên là "nhiệt độ tức thời" Nhiệt độ tức thời
có bản chất là động năng trung bình, được xác định từ vận tốc Do đó ý tưởng đơn
giản để đưa nhiệt độ tức thời về nhiệt độ yêu cầu là nhân tỉ lệ vận tốc của tất cả các
nguyên tử theo một thừa số λ Độ lớn cần thiết của thừa số này có thể được ước lượngbằng cách thay vận tốc "mới" λ · vivào biểu thức nhiệt độ và cho nó bằng với Tref:
Trang 20Thuật toán điều nhiệt Berendsen
Trong thuật toán Berendsen, hệ khảo sát được coi như đang ghép cặp với mộtbình nhiệt vô hạn (infinite thermal bath) có nhiệt độ Tref Ta yêu cầu nhiệt độ thayđổi giữa hai bước thời gian theo công thức:
độ yêu cầu Do đó, ta muốn thay đổi nhiệt độ theo công thức:
• Phương pháp này không sinh ra tập hợp chính tắc chặt chẽ (rigorous canonicalensemble)
Trang 21• Phương pháp này dịch chuyển dần năng lượng của hệ từ các "mốt" (mode) cótần số cao nhất về các "mốt" có tần số thấp nhất, vi phạm định lí cân bằng cácthành phần (equipartition theorem) Các "mốt" co dãn liên kết và bẻ cong gócthường là những "mốt" nhanh nhất, và việc mất năng lượng của các "mốt" nàylàm cho phân tử bị "đông cứng" Mặt khác, ba "mốt" tịnh tiến (với hệ khôngtuần hoàn là ba "mốt" quay) của hệ là các "mốt" chậm nhất và lại được nhậnnăng lượng Vấn đề này còn được gọi là hiện tượng "cục nước đá bay" (flyingice cube) hoặc "cục nước đá quay" (spinning ice cube).
Thuật toán điều nhiệt Andersen - Andersen thermostat
Thuật toán điều nhiệt Andersen có cách xử lí hoàn toàn khác Theo thời gian,một số hạt sẽ được chọn để "va chạm" với các hạt của bình nhiệt (heat bath), theo đóthay đổi vận tốc đột ngột Thuật toán như thế có đặc tính hỗn loạn (stochastic).Thuật toán điều nhiệt này hoạt động như sau:
• Bắt đầu MD với một thuật toán lấy tích phân chuẩn (Verlet )
• Chọn ngẫu nhiên các hạt (nguyên tử) sẽ chịu va chạm với bể nhiệt
• Gán vận tốc mới cho các hạt trên bằng cách lấy vận tốc từ phân bố Boltzmann Các hạt khác không bị ảnh hưởng
Maxwell-Ưu điểm của thuật toán điều nhiệt Andersen đó là nó sinh ra tập hợp chính tắc(canonical ensemble) nếu như được lập trình chính xác Tuy nhiên để điều này xảy
ra, tốc độ va chạm với các hạt tưởng tượng lại phải quá thấp (không đủ) hoặc quá cao(trong trường hợp này, các va chạm lại trở nên trội hơn động lực của hệ)
Trang 22Thuật toán điều nhiệt Nosé-Hoover - Nosé-Hoover thermostat
Thuật toán điều nhiệt Nosé-Hoover biểu diễn tập hợp chính tắc một cách chặtchẽ, và do đó thường được chọn Tuy nhiên thuật toán này lại khó hiểu hơn Dưới đây
là các ý tưởng cơ bản
Bể nhiệt được coi như là một phần của hệ và được gắn với độ tự do s và khốilượng ảo Q Bây giờ phương trình chuyển động được tính theo hệ mỏ rộng này với3N + 1độ tự do
Phương trình chuyển động của các nguyên tử được thay đổi thành
¨
ri = Fi
trong đó số hạng thứ hai tương ứng với một loại "ma sát" do bể nhiệt Thêm vào đó,
có một phương trình khác đối với tham số s của bể nhiệt:
˙s = 1
Độ mạnh yếu của sự ghép cặp giữa hệ thực với bể nhiệt được xác định bằng tham
số "khối lượng" Q Tham số này có thể trở nên dễ hiểu hơn khi đưa thêm tham số thờigian τ:
2· Tref
Tham số này có ý nghĩa ứng với chu kì dao động của động năng giữa hệ thực
và bể nhiệt Ta cần lưu ý sự khác nhau giữa τ trong ghép cặp Berendsen và ghép cặpNosé-Hoover Phương pháp Berendsen có sự tắt dần (theo hàm mũ) của sai lệch nhiệt
độ với hệ số τ Còn trong phương pháp Nosé-Hoover, sự hồi phục (có dao động) nhiệt
Trang 23toán lấy tích phân, thay vì phép điều chỉnh ở giai đoạn sau (a posteriori correction)như trong các phương pháp trước Thuật toán điều nhiệt Nosé-Hoover được sử dụngthường xuyên và người ta có thể chứng minh được rằng trung bình tập hợp tính theotập hợp Nosé-Hoover giống hệt với trung bình tập hợp tính theo tập hợp chuẩn tắc.
Thuật toán điều áp - Barostat
Thay vì thực hiện dưới điều kiện thể tích không đổi, các thí nghiệm hóa họcthường được diễn ra ở áp suất khí quyển không đổi Do đó việc mô phỏng điều kiệnđẳng áp trong MD là quan trọng
Tương tự như nhiệt độ, ta có thể tính được áp suất trong mô phỏng Việc nàythường được thực hiện bằng cách sử dụng đại lượng được gọi là hàm lực (the virial offorce):
i
mi· |~vi|2+ 1
2X
Trang 24Chương 2.
ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP
NGHIÊN CỨU
2.1 ĐỐI TƯỢNG NGHIÊN CỨU
Việc tìm ra thuốc điều trị ung thư hiệu quả luôn thu hút được sự chú ý do sự giatăng của số ca ung thư trong thời đại ngày nay Các loại thuốc kháng ung thư dựa trênnhiều cơ chế khác nhau Một trong các cơ chế đang thu được sự quan tâm hiện nay là
cơ chế ức chế sự hình thành mạch máu (angiogenesis)
Tế bào ung thư có tốc độ phân chia lớn nên chúng cần có sự bổ sung dinh dưỡng
và oxi Để đảm bảo điều kiện đó, tế bào ung thư tiết ra yếu tố VEGF (Vascular dothelial Growth Factor – yếu tố tăng trưởng mạch máu nội mô) Yếu tố này sẽ bámvào và kích hoạt protein VEGFR-2 (Vascular Endothelial Growth Factor Receptor 2– Thụ thể yếu tố tăng trưởng mạch máu nội mô loại 2) trên màng tế bào Thông qua
Trang 25En-thích hình thành mạch máu được minh họa trên Hình 1 [16] Nếu như ức chế đượcVEGFR-2 ta sẽ hạn chế được sự sinh trưởng và phân chia của khối u do quá trìnhtruyền dẫn tín hiệu hình thành mạch máu bị ngắt [11, 16].
Hình 1: Cơ chế chung trong quá trình kích thích hình thành mạch máu của tế bào ung
thư và vị trí tác động của thuốc lenvatinib
Lenvatinib là loại thuốc mới được FDA (Cục quản lý thuốc và thực phẩm Mỹ –Food and Drug Administration) cho phép dùng làm thuốc điều trị ung thư tuyến giáp(cuối năm 2015) và ung thư biểu mô tế bào thận (đầu năm 2016) do có kết quả thửnghiệm thuốc Pha II và Pha III hiệu quả [10, 17, 27] Lenvatinib ức chế nhiều proteintrong đó có VEGFR-2 [23] Tương tác của lenvatinib và VEGFR-2 có thể được biểudiễn như sau:
lenvatinib + VEGFR-2 → phức hợp VEGFR-2–lenvatinib
Trang 26Hiện nay chưa có nhiều nghiên cứu về tương tác giữa lenvatinib và VEGFR-2,đặc biệt là chưa tìm thấy nghiên cứu lí thuyết mô phỏng động lực học phân tử trên hệVEGFR-2–lenvatinib.
Hướng nghiên cứu về tương tác giữa VEGFR-2 và lenvatinib chưa xuất hiệnnhiều ở Việt Nam [3] Trên thế giới, trình tự amino axit (tổng cộng 1356 residue)của VEGFR-2 đã được xác định dựa trên ADN (chưa có dữ liệu X–ray của toàn bộprotein) và sự phân bố các miền (domain) của protein cũng đã được xác định [16].Trên cơ sở dữ liệu Protein Databank (https://www.rcsb.org) đã có mặt nhiềucấu trúc X–ray của phức hợp VEGFR-2 với một số ligand, tuy nhiên chỉ có tọa độ cácnguyên tử ở vùng ligand gắn vào mà không có tọa độ đầy đủ của tất cả các nguyên
tử còn lại (ví dụ như 5EW3, 5DG5, 3WZD – 48 cấu trúc khi tìm kiếm với từ khóaVEGFR-2 trên Protein Data Bank)
Cấu trúc X–ray của phức hợp VEGFR-2 với lenvatinib cùng với các tham sốtương tác động học (Hằng số phân hủy Kd và thời gian lưu trú residence time - Bảng1) mới được công bố vào năm 2015 [23] Cấu trúc phức hợp VEGFR-2–lenvatinibđược biểu thị trên Hình 2 Phân tử lenvatinib được biểu diễn dưới dạng ball-and-stick.Giá trị ∆Gexperimentđược tính theo công thức ∆Gexperiment =−RTlnKeq= RTlnKd
Bảng 1: Tham số tương tác động học giữa VEGFR-2 và một số loại thuốc tương tựLoại thuốc Kd (nmol L−1) ∆Gexperiment (kJ mol−1) Thời gian lưu trú (phút)
Trang 28tốc độ phân hủy thấp hơn trong phức hợp với VEGFR-2 Bài báo cho rằng trạng tháitương tác (binding mode of interaction) của lenvatinib rất khác biệt so với sorafenib[23] Tuy nhiên nghiên cứu này mới chỉ phân tích dựa trên trạng thái tĩnh thu được
từ tinh thể của phức hợp VEGFR-2–lenvatinib mà chưa xét tới sự biến đổi tương tác
có thể xảy ra theo thời gian (dynamic interaction) Việc thực hiện mô phỏng động lựcphân tử có thể giúp giải quyết hạn chế này Ngoài ra, các tác giả trên có sự phân tích sosánh giữa hai thuốc lenvatinib và sorafenib nhưng mô phỏng động lực phân tử mangtính chất so sánh của các hệ VEGFR-2–lenvatinib và VEGFR-2–sorafenib chưa đượcthực hiện Liệu có sự liên quan nào giữa năng lượng tự do về liên kết (free bindingenergy) và các tham số tương tác động học của 2 phức hợp này mà có thể rút ra từ
mô phỏng động lực phân tử hay không? Các yếu tố đóng vai trò quan trọng nhất trongtương tác giữa VEGFR-2 và lenvatinib là gì? Đây là những câu hỏi chưa được trả lờiđầy đủ
Do tác dụng của thuốc sorafenib cũng dựa trên sự ức chế protein VEGFR-2 tương
tự như thuốc lenvatinib nên có thể nghĩ rằng việc mô phỏng MD trên cả 2 hệ sẽ chonhững thông tin so sánh có ý nghĩa Vào năm đã từng có nghiên cứu thực hiện môphỏng MD của phức hợp VEGFR-2–sorafenib [22], tuy nhiên ở thời điểm đó cấu trúc3D X-ray của phân tử sorafenib chưa được công bố Độ phân giải của cấu trúc X–ray
sử dụng khi đó chưa cao (Mã PDB: 2RL5, 2, 65 ˚A) Hơn nữa thời gian mô phỏngtrong nghiên cứu [22] còn ngắn (chỉ 10 ns) Có thể nghĩ rằng việc thực hiện tính toán
lý thuyết bằng phương pháp mô phỏng động lực phân tử với thời gian dài hơn, và dựatrên cấu trúc X–ray mới công bố năm 2015 của Okamoto có độ phân giải cao hơn(Mã PDB: 3WZE, 1, 9 ˚A) [23] sẽ đem lại thêm những thông tin mới và đáng tin cậyhơn, sát hơn với cơ chế thực tế của thuốc
Trang 292.2 PHƯƠNG PHÁP NGHIÊN CỨU
Các tính toán mô phỏng MD được thực hiện trên phần mềm Gromacs 5.1.4 [12]với tham số trường lực amber99sb-ildn [20], mô hình nước SPC [7] Phần mềm miễnphí Gromacs là một công cụ tính toán có độ tin cậy rất cao trong cộng đồng Hóa họctính toán [2, 1] So với nhiều công cụ tính toán khác, phần mềm Gromacs có ba ưuđiểm vượt trội: tốc độ tính toán nhanh hàng đầu, hỗ trợ nhiều tham số trường lực vàmiễn phí Thời gian mô phỏng là 100 ns Các tính toán được thực hiện trên máy tính
cá nhân.Thời gian tính toán trên máy tính cá nhân chiếm thời lượng khoảng 20 ngàyđêm (chạy mô phỏng 24/7)
2.2.1 Phương pháp thực hiện tính toán MD
Cấu trúc của protein VEGFR-2 và ligand lenvatinib được trích ra từ dữ liệu Ray của phức hợp 3WZD trên Protein Data Bank1bằng phần mềm Chimera [25] Cácamino axit còn thiếu (có số thứ tự gốc là 814-819, 842-845, 1051-1066, 1168-1172)được bổ sung bằng phần mềm Modeller 9.17 [29] Amino axit số 940 vẫn được giữnguyên ở dạng đột biến như trong thí nghiệm của Okamoto [23] Phân tử lenvatinibđược bổ sung hidro bằng phần mềm Avogadro 1.1.1 [14] Tệp topology của ligandđược tạo ra bằng công cụ Acpype [28] Tệp topology của protein và của phức hợpđược tạo ra dựa trên trường lực amber99sb-ildn [20] và mô hình nước SPC [7] Hệđược solvat hóa trong hộp dodecahedron, khoảng cách tối thiểu đến thành hộp là 1
X-nm Do hệ đã trung hòa về điện tích nên không cần bổ sung ion Năng lượng của hệđược cực tiểu hóa bằng thuật toán đường dốc nhất Sau đó hệ được đưa đến nhiệt độ
300 K nhờ mô phỏng NVT trong 200 ps, sử dụng thuật toán Berendsen thermostat[8] Tất cả các liên kết được cưỡng bức bằng thuật toán LINCS [15] Sau đó hệ được
1http://www.rcsb.org/pdb/explore/explore.do?structureId=3WZD
Trang 30đưa đến áp suất 1 bar nhờ mô phỏng NPT trong 2 ns, sử dụng thuật toán Rahman barostat [24] Bước mô phỏng MD được thực hiện với độ dài 100 ns, sử dụngkhoảng cách cutoff 1 nm cho cả lực tĩnh điện và lực van der Waals [20] Các bướcchuẩn bị topology cho tới chạy MD được thực hiện trên phần mềm Gromacs 5.1.4 [9,4].
Parrinello-2.2.2 Các bước chuẩn bị tệp đầu vào
Tách protein và ligand thành tệp riêng từ phức hợp
Mở PDB code 3WZD bằng phần mềm Chimera
Menu Select -> Structure -> Protein
File -> Save PDB -> protein_extracted_from3WZD.pdb (save selected atoms only)Menu Select -> Residue -> LEV
File -> Save PDB -> LEV_extracted_from3WZD.pdb (save selected atoms only)
Xóa các nguyên tử đa vị trí (alternate location) trong protein.pdb
Mở file protein.pdb bằng phần mềm Pymol Nhập lệnh trong Pymol:
Lưu cấu trúc thành file 3WZD_protein_A_alternateonly.pdb
Trang 31Bổ sung các amino axit còn thiếu (missing residue) bằng modeller
Mục tiêu: bổ sung các residue 814-819, 842-845, 1051-1066, 1068-1172 (Xemtrong file 3WZD.pdb tải về từ PDB Databank, phần MISSING RESIDUE)
Tạo file createtemplate.py
sẽ thu được file 3WZD_protein_A_alternateonly.seq
Chuyển mã amino axit 3 kí tự sang mã 1 kí tự
residue 814-819
asp glu his cys glu arg
>results for sequence "Untitled" starting "ASPGLUHISCYS"
Trang 32residue 842-845
arg gly ala phe
>results for sequence "Untitled" starting "argglyalaphe"
RGAF
residue 1051-1066
arg asp ile tyr lys asp pro asp tyr val arg lys gly asp ala arg
>results for sequence "Untitled" starting "argaspiletyr"
RDIYKDPDYVRKGDAR
residue 1168-1172
arg ala gln gln asp
>results for sequence "Untitled" starting "argalaglngln"
Trang 33Tạo tệp align.ali dựa trên nội dung tệp seq ở trên
Xóa hết các TER record trong file 3WZD_protein_A_alternateonly.pdb
Tạo tệp addresidue.py
def select_atoms ( self ):
return selection( self residue_range( '1' ,
Trang 34Chuẩn bị ligand
Thêm các nguyên tử hidro (Add hydrogen) bằng phần mềm Avogadro Mởfile LEV_extracted_from3WZD.pdb bằng phần mềm Avogadro, thêm hydrogen vàorồi lưu thành file LEV_protonated.pdb Mở file vừa lưu ra, sửa tên chain và tên residue
mà Avogadro tự động thêm hidro vào cho trùng với tên residue cũ là LEV
Tạo tham số ligand (ligand parameter) bằng phần mềm acpype Tạo ligandparameter với force field GAFF và charge assignment = bcc charge
gmx
,→
Mở file LEV_protonated_GMX.itp đầu ra bằng text editor xem tên các nguyên
tử hidro có bị bất thường hay không (4 kí tự chẳng hạn)
Chuẩn bị các tệp đầu vào và thực hiện tính toán MD trên phần mềm Gromacs
Tạo file topology (Generate topology)
gmx pdb2gmx -f 3WZD_fill.B99990001.pdb -o 3wzd_protein.gro -water spc
,→
Chọn trường lực số 6: amber99sb-ILDN
Tạo file 3wzd_complex.gro
Tạo hộp và solvat hóa (Define box and solvate)
gmx editconf -f 3wzd_complex.gro -o newbox.gro -bt
Trang 35Thêm ion (Add ion)
gmx genion -s ions.tpr -o solv_ions.gro -p topol.top -pname NA
,→
Cực tiểu năng lượng (Energy Minimization) Nội dung file em.mdp như sau:
save
,→
steepest descent minimization)
,→
,→
,→
,→
electrostatic cut-off
,→
der Waals cut-off
Trang 36Cân bằng (Equilibrium)
Ràng buộc ligand (Restraining ligand)
gmx genrestr -f LEV_protonated_GMX.gro -o posre_LEV.itp -fc
1000 1000 1000
,→
Chèn nội dung file topol.top như sau:
; Include forcefield parameters
; Bond parameters
Trang 37; Neighborsearching
,→
; Periodic boundary conditions
Trang 38nstlog = 500 ; update log file every 1.0 ps
; Bond parameters
bonds) constrained
,→
; Neighborsearching
,→
Trang 40Thực hiện tính toán MD (MD Production) Nội dung file md.mdp như sau:
bonds) constrained
,→
; Neighborsearching