Các nghiên cứu đã công bố hiện nay mới chỉ xác định được cấu trúc phân tử của phức hợp VEGFR-2 liên kết với lenvatinib, và xác định một số tham số tương tác động học.. Tổng quan về Hóa h
Trang 1ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
-Phạm Trọng Lâm
NGHIÊN CỨU LÍ THUYẾT VỀ TƯƠNG TÁC GIỮA VEGFR-2 VÀ
LENVATINIB BẰNG PHƯƠNG PHÁP MÔ PHỎNG
ĐỘNG LỰC HỌC PHÂN TỬ
LUẬN VĂN THẠC SĨ KHOA HỌC
Trang 2ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
-Phạm Trọng Lâm
NGHIÊN CỨU LÍ THUYẾT VỀ TƯƠNG TÁC GIỮA VEGFR-2 VÀ
LENVATINIB BẰNG PHƯƠNG PHÁP MÔ PHỎNG
ĐỘNG LỰC HỌC PHÂN TỬ
Chuyên ngành: Hóa lý và Hóa lý thuyết
Mã số: 60440119
LUẬN VĂN THẠC SĨ KHOA HỌC
NGƯỜI HƯỚNG DẪN KHOA HỌC:
PGS.TS LÊ KIM LONG
TS NGUYỄN HỌA MI
Hà Nội - 2017
Trang 3LỜI CẢM ƠN
Trước tiên tôi xin được bày tỏ lòng biết ơn chân thành đến PGS TS Lê Kim Long và TS Nguyễn Họa Mi - Cán bộ Trung tâm Ứng dụng Tin học trong Hóa học, Khoa Hóa học, trường Đại học Khoa học Tự nhiên Thầy Lê Kim Long là người đã gợi
kiện thuận lợi giúp tôi chủ động trong nghiên cứu Cô Nguyễn Họa Mi là người đã trựctiếp hướng dẫn và góp ý trong suốt quá trình tôi học tập và nghiên cứu lĩnh vực Hóahọc tính toán ở Khoa Hóa học Cô cũng là người luôn động viên khi tôi gặp những khókhăn, căng thẳng trong cuộc sống cũng như trong nghiên cứu
Tôi cũng xin gửi lời cảm ơn sâu sắc đến GS TS Lâm Ngọc Thiềm,người thầy đã có những chia sẻ, động viên để giúp tôi có thêm động lựchoàn thành bản luận văn này
Tôi xin trân trọng cảm ơn các thầy giáo, cô giáo, cán bộ Khoa Hóa học,trường Đại học Khoa học Tự nhiên - ĐHQGHN đã truyền đạt những kinh nghiệm
và góp ý rất quý báu trong suốt thời gian tôi học tập và nghiên cứu ở khoa
Cuối cùng, tôi xin trân trọng cảm ơn sự hỗ trợ của đề tài cấp Đại họcQuốc gia Hà Nội, mã số QG.17.37 trong quá trình nghiên cứu
Học viên
Trang 4Danh mục hình
Trang
của tế bào ung thư và vị trí tác động của thuốc lenvatinib 15 Hình 2 Cấu trúc 3D của phức hợp VEGFR-2–lenvatinib 17
Hình 3 Nhiệt độ trong bước cân bằng NVT
sung tham số trường lực 38 Hình 7 Tương tác giữa lenvatinib (LEV) và protein trong cấu trúc đã
cân bằng nhiệt độ và áp suất 39 Hình 8 Tương tác giữa lenvatinib (LEV) và protein trong cấu trúc chiếm
trọng số tồn tại lớn nhất trong 100 ns MD
40 Hình 9 Tương tác giữa LEV và protein trong cấu trúc chiếm trọng số
tồn tại lớn nhất của 100 ns MD thể hiện bằng Pymol 42 Hình 10 Số liên kết hidro giữa lenvatinib và protein theo thời gian 43 Hình
11 RMSD mạch chính của protein trong 2 phức hợp với lenvatinib
Trang 5(3WZD) và sorafenib (3WZE) 44 Hình 12 RMSD của lenvatinib (LEV) và sorafenib (SOR) 45
Trang 6Hình 13 Root mean square fluctuation (RMSF) của các residue trong
hợp 3WZD và 3WZE tính theo mô hình LIE
54 Hình 17 Chu trình nhiệt động lực học dùng để tính toán đóng góp entropy
vào quá trình tạo phức hợp 3WZD và 3WZE 56 Hình 18 Năng lượng tự do về liên kết trong phức hợp 3WZD, 3WZE, và
4AGD, tính theo g_mmpbsa 60
Hình 19 Sự hội tụ trong quá trình cực tiểu năng lượng
Trang 7Bảng 3 Các thành phần năng lượng liên kết trong phức hợp 3WZD, 3WZE,
và 4AGD thu được từ mô phỏng MD kéo dài 10 ns 59
Trang 8Danh mục kí hiệu và viết tắt
US Food and Drug AdministrationFree energy perturbation
LenvatinibLinear Interaction EnergyLINear Constraint SolverMolecular DynamicsMolecular Mechanics
Constatn number of particles, pressure and temperature ensemble Constant number of particles, volume and temperature ensemble
Poisson-Boltzmann Surface AreaProtein Data Bank
Root Mean Square DeviationRoot Mean Square FluctuationSolven accessible surface areaSteering Molecular DynamicsSorafenib
Simple Point ChargeThermodynamic Integration
Trang 9Mục lục
Trang
1.1 Tổng quan về Hóa học tính toán 2
1.2 Mô phỏng động lực phân tử (Molecular Dynamic Simulations) 5
1.3 Thuật toán mô phỏng động lực phân tử 7
1.3.1 Thuật toán toàn cục 7
1.3.2 Một số thuật toán tiêu biểu trong MD 8
2 ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU 14 2.1 ĐỐI TƯỢNG NGHIÊN CỨU 14
2.2 PHƯƠNG PHÁP NGHIÊN CỨU 19
2.2.1 Phương pháp thực hiện tính toán MD 19
2.2.2 Các bước chuẩn bị tệp đầu vào 20
3 KẾT QUẢ VÀ THẢO LUẬN 32 3.1 Kết quả tính toán cân bằng nhiệt độ và áp suất 32
Trang 103.3 Sự dao động
của bộ khung protein và ligand 41
3.3.1
Trang 113.3.2 RMSF 46
3.4 Năng lượng tự do về liên kết chưa bao gồm đóng góp entropy 46
3.4.1 Mô hình MM-PBSA 46
3.4.2 Mô hình năng lượng tương tác bậc một - LIE 53
3.5 Năng lượng tự do về liên kết đã bao gồm đóng góp entropy 55
3.6 Năng lượng tự do về liên kết khi rút ngắn thời gian mô phỏng 58
KẾT LUẬN 63 TÀI LIỆU THAM KHẢO 64 Tiếng Việt 64
Tiếng Anh 65
Phụ lục A Các bước mô phỏng theo MD 68 A.1 Tổ chức thư mục 69
A.2 Xây dựng hệ mô phỏng 70
A.2.1 Protein 70
A.2.2 Ligand 70
A.2.3 Phức hợp protein-ligand 71
A.2.4 Định nghĩa ô mạng đơn vị và thêm dung môi 71
A.2.5 Thêm ion 72
A.3 Cực tiểu năng lượng - EM 73
A.3.1 Cân bằng 74
A.3.2 Cân bằng NVT 76
A.3.3 Cân bằng NPT 77
A.4 Thực hiện tính toán MD 79
A.5 Thực hiện phân tích kết quả 80
A.5.1 Liên kết hidro giữa protein-ligand 80
A.5.2 Năng lượng tương tác van der Waals và tĩnh điện 80
Trang 12RMSD 81
A.5.4 Bán kính hồi chuyển - Radius of gyration Rg 81
Phụ lục B Một số vấn đề còn tồn tại trong quá trình thực hiện nghiên cứu 83 Phụ lục C Một số kinh nghiệm trong quá trình thực hiện đề tài 85 Phụ lục D Một số mã nguồn sử dụng khi phân tích kết quả và vẽ đồ thị 86 D.1 Chuyển file PS sang PNG 86
D.2 Mã nguồn cho Hình 3 87
D.3 Mã nguồn cho Hình 4 89
D.4 Mã nguồn cho Hình 11 91
D.5 Mã nguồn cho Hình 12 93
D.6 Mã nguồn cho Hình 13 95
D.7 Mã nguồn cho Hình 14 97
D.8 Mã nguồn cho Hình 15 99
D.9 Mã nguồn cho Hình 16 101
D.10 Mã nguồn cho Hình 18 103
Trang 13MỞ ĐẦU
Ung thư là bệnh nguy hiểm và có xu hướng xuất hiện ngày càng phổ biến.
Do đó việc phát triển các thuốc điều trị ung thư trở nên rất cần thiết Để tìm ra thuốc điều trị ung thư hiệu quả, chúng ta cần nắm được cơ chế phát triển tế bào ung thư và cơ chế tương tác giữa thuốc kháng ung thư với cơ thể.
Trong các cơ chế được nghiên cứu nhằm tìm ra thuốc điều trị ung thư hiệu quả, cơ chế hình thành mạch máu là một cơ chế đáng chú ý Các tế bào ung thư
có tốc độ sinh trưởng và phát triển lớn nên cần có nhiều mạch máu đưa chất dinh dưỡng tới nuôi dưỡng Thụ thể yếu tố tăng trưởng mạch máu nội mô loại 2 (VEGFR-2) là một protein đóng vai trò quan trọng trong việc hình thành mạch máu tới nuôi các tế bào ung thư Việc ức chế VEGFR-2 sẽ hạn chế sự phát triển của các tế bào ung thư Hiện nay, Cục Quản lý Thực phẩm và Dược phẩm Mỹ (FDA) đã cấp phép sử dụng một số loại thuốc ức chế VEGFR-2 trong việc điều trị ung thư như bevacizumab, sorafenib, sunitinib, pazopanib, everolimus và lenvatinib Trong số đó, lenvatinib là loại thuốc mới được cấp phép và tác dụng
ức chế ung thư mạnh hơn sorafenib và sunitinib, nhưng cơ chế chưa được hiểu
rõ Các nghiên cứu đã công bố hiện nay mới chỉ xác định được cấu trúc phân tử của phức hợp VEGFR-2 liên kết với lenvatinib, và xác định một số tham số tương tác động học Việc đi sâu vào các tương tác biến đổi theo thời gian để làm rõ thêm cơ chế vẫn còn chưa được nghiên cứu Phương pháp tính toán mô phỏng trên máy tính có thể bổ sung các thông tin đó.
Do đó, nghiên cứu lí thuyết bằng phương pháp mô phỏng trên máy tính để
bổ sung hiểu biết về cơ chế tương tác giữa protein VEGFR-2 và lenvatinib vừa cần thiết về thực tiễn, vừa có ý nghĩa khoa học Xuất phát từ thực tế đó, chúng tôi
đã lựa chọn thực hiện đề tài "Nghiên cứu lí thuyết về tương tác giữa
VEGFR-2 và lenvatinib bằng phương pháp mô phỏng động lực học phân tử".
Trang 14Chương 1.
TỔNG QUAN
Phần cơ sở lý thuyết được lược dịch từ hai tài liệu [12] và [21]
1.1 Tổng quan về Hóa học tính toán
Hóa học tính toán (computational chemistry) là một thuật ngữ dùng để
chỉ việc sử dụng các kĩ thuật tính toán trong hóa học, từ cơ học lượng tử các phân tử đến động lực học của các hệ phức hợp hoặc phân tử lớn Mô
phỏng phân tử (molecular modelling) là danh từ dùng để chỉ quá trình mô tả
các hệ hóa học phức tạp bằng mô hình nguyên tử thực tế, nhằm hiểu rõ vàtiên đoán các tính chất vĩ mô dựa trên kiên thức chi tiết ở qui mô nguyên tử.Thông thường, mô phỏng phân tử được dùng để thiết kế vật liệu mới, trong
đó người ta cần tiên đoán chính xác tính chất vật lí của hệ thống thực
Các tính chất vật lí vĩ mô có thể được chia làm hai loại (a) các tính chất cân bằng tĩnh (static equilibrium properties), chẳng hạn hằng số liên kết (binding constant) của
một chất ức chế lên một enzym, thế năng trung bình của một hệ, hoặc hàm phân bố
2
Trang 15xuyên tâm của một chất lỏng, và (b) các tính chất động hoặc phi cân bằng (dynamic
or non-equilibrium properties), chẳng hạn như độ nhớt của chất lỏng, các quá trình khuếch tán trong màng tế bào, động học chuyển pha, động học phản ứng, hoặc động học khuyết tật tinh thể Việc lựa chọn kĩ thuật tính toán phụ thuộc vào câu hỏi được đặt ra và khả năng đưa ra câu trả lời đáng tin cậy của phương pháp tại thời điểm hiện giờ Trong trường hợp lí tưởng, phương trình Schrodinger¨ phụ thuộc thời gian tương đối tính (relativistic time-dependent Schrodinger¨ equation) mô tả rất chính xác hệ phân tử, nhưng với bất cứ hệ nào phức tạp hơn một vài nguyên tử ta lại không thể sử
dụng được phương pháp ab initio này Do đó ta cần sử dụng các phương pháp gần
đúng, hệ càng phức tạp và thời gian của quá trình quan tâm càng dài, ta càng sử dụng nhiều xấp xỉ Tại một điểm nào đó (sớm hơn rất nhiều so với mong muốn của
chúng ta), phương pháp ab initio cần phải được bổ sung hoặc thay thế bằng việc
tham số thực nghiệm hóa mô hình Khi các mô phỏng dựa trên các cơ sở vật lí của tương tác nguyên tử không thể thực hiện được do hệ có độ phức tạp quá cao, mô phỏng phân tử lại hoàn toàn chỉ dựa vào việc phân tích tương tự các dữ liệu hóa học của các cấu trúc đã biết Các phương pháp QSAR (Quantitative Structure-Activity Relationship) và nhiều phương pháp dự đoán cấu trúc protein dựa trên tính tương đồng thuộc vào loại này.
Các tính chất vĩ mô luôn là các trung bình tập hợp (ensemble average) của một tập hợp thống kê đại diện (representative statistical ensemble) (cân bằng hoặc phi cân bằng) của hệ phân tử Với mô phỏng phân tử, điều này dẫn tới hai hệ quả quan trọng:
không đủ Ta cần phải có tập hợp đại diện tại nhiệt độ đã cho, để tính toán các tính chất vĩ mô Nhưng ngay cả điều này cũng không đủ để tính các tính chất cân bằng nhiệt động dựa trên năng lượng tự do, chẳng hạn như cân bằng pha, hằng số liên kết, độ tan, độ bền tương đối của các cấu dạng phân tử Việc tính toán năng lượng tự do và các thế nhiệt động cần có sự mở rộng đặc biệt của các
Trang 16kĩ thuật mô phỏng phân tử.
động ở mức độ nguyên tử, các chi tiết này lại thường không liên quan tới các tính chất
vĩ mô mà ta quan tâm Điều này cho phép ta đơn giản hóa việc mô tả các tương tác vàlấy giá trị trung bình của các chi tiết không liên quan Cơ học thống kê cung cấp cho ta
cơ sở lí thuyết để thực hiện việc đơn giản hóa đó Có cả một bậc thang các phươngpháp từ việc coi các nhóm nguyên tử như một đơn vị, mô tả chuyển động bằng các tọa
độ tập hợp đã rút gọn số lượng (reduced number of collective coordinates), lấy trungbình các phân tử dung môi với thế năng của lực trung bình (potential of mean force) kếthợp với động học ngẫu nhiên (stochastic dynamics), cho tới động học các hệ có kíchthước trung gian (mesoscopic dynamics) mô tả các mật độ (density) thay vì mô tả cácnguyên tử, và các dòng (flux) theo hàm của gradient nhiệt động thay vì vận tốc hoặcgia tốc theo hàm của lực
Để tạo ra tập hợp cân bằng đại diện ta có hai phương pháp: (a) mô phỏng Monte Carlo và (b) mô phỏng động học phân tử (Molecular Dynamics simulation) Để tạo ra các tập hợp phi cân bằng và phân tích các hiện tượng động, ta chỉ có thể dùng phương pháp (b) Tuy mô phỏng Monte Carlo đơn giản hơn MD (do không đòi hỏi việc tính toán các lực), nó lại không cho kết quả tốt hơn đáng kể so với phương pháp
MD trong cùng một khoảng thời gian chạy máy Do đó, MD là phương pháp phổ quát hơn Nếu cấu trúc ban đầu rất xa so với cấu trúc cân bằng, các lực có thể quá lớn và phương pháp MD sẽ thất bại Trong các trường hợp đó, ta cần cực tiểu hóa năng lượng Một lí do nữa để thực hiện cực tiểu hóa năng lượng (energy minimization) đó
là việc loại bỏ động năng ra khỏi hệ: nếu một vài cấu trúc trong mô phỏng động học cần được so sánh với nhau, việc cực tiểu hóa năng lượng sẽ giảm bớt nhiễu nhiệt (thermal noise) trong cấu trúc và thế năng, do đó ta có thể so sánh tốt hơn.
4
Trang 171.2 Mô phỏng động lực phân tử (Molecular Dynamic
Simulations)
Mô phỏng MD giải phương trình Newton về chuyển động của
hệ N tương tác với nhau:
Các phương trình trên được giải đồng thời với các bước thời gian nhỏ
Hệ được mô phỏng trong một thời gian, đồng thời giữ nhiệt độ và áp suất ởgiá trị yêu cầu, và các tọa độ được viết vào một file đầu ra ở các thời điểm
cách đều nhau Tọa độ với vai trò là hàm theo thời gian biểu diễn quĩ đạo (trajectory) của hệ Sau các biến đổi ban đầu, hệ sẽ thường đạt tới một
trạng thái cân bằng (equilibrium state) Bằng cách lấy trung bình theo một
quĩ đạo cân bằng, ta có thể tính được nhiều tính chất vĩ mô từ file đầu ra.Bây giờ ta đề cập tới một số giới hạn của phương pháp MD Người sửdụng cần nắm được các giới hạn này và luôn kiểm chứng dựa trên các tínhchất thực nghiệm đã biết để đánh giá độ chính xác của mô phỏng
Mô phỏng MD có tính chất cổ điển (classical)
Việc sử dụng phương trình Newwton về chuyển động đồng nghĩa với việc áp dụng
cơ học cổ điển để mô tả chuyển động của các nguyên tử Điều này có thể chấp nhận
được với hầu hết các nguyên tử ở nhiệt độ thường, nhưng cũng có ngoại lệ Các
Trang 18nguyên tử hidro khá nhẹ và chuyển động của proton đôi khi có bản chất cơ học lượng
tử Chẳng hạn, một proton có thể xuyên hầm qua hàng rào thế năng trong quá trình
chuyền hidro qua liên kết hidro Quá trình như thế không thể mô tả đầy đủ bằng động lực học cổ điển! Chất lỏng heli ở nhiệt độ thấp là một ví dụ khác về sự không áp dụng được cơ học cổ điển Có thể chúng ta không quan tâm lắm về heli, nhưng các dao động tần số cao của liên kết cộng hóa trị chắc chắc là điều ta cần quan tâm Cơ học thống kê của dao động tử điều hòa cổ điển trở nên khác biệt đáng kể với dao động tử lượng tử thực khi tần số cộng hưởng xấp xỉ hoặc vượt quá kBT =h Ở nhiệt độ thường, số sóng = 1= = =c tại đó h = kBT rơi vào khoảng 200 cm−1 Do đó, tất cả các dao động có tần số ứng với số sóng cao hơn 100 cm − 1 có thể không được mô tả đủ tốt trong mô phỏng cổ điển Điều này có nghĩa là trên thực tế, tất cả các dao động liên kết và dao động góc liên kết đều là gần đúng, và thậm chí các chuyển động liên kết hidro bị vượt ra ngoài giới hạn cổ điển.
Electron ở trạng thái cơ bản
Trong MD ta sử dụng trường lực bảo toàn là hàm của vị trí các nguyên tử.
Điều này có nghĩa là chuyển động của các electron không được xét tới: cácelectron được coi là tự điều chỉnh ngay lập tức khi vị trí các nguyên tử thay đổi
(phép xấp xỉ Born-Oppenheimer, và giữ nguyên ở trạng thái cơ bản Điều này
có thể chấp nhận được trong phần lớn các trường hợp Nhưng các quá trình
chuyển electron và các trạng thái kích thích electron không thể được mô tảchính xác Các phản ứng hóa học cũng không được mô tả chính xác
6
Trang 191.3 Thuật toán mô phỏng động lực phân tử
1.3.1 Thuật toán toàn cục
1 Nhập điều kiện ban đầu Thế năng tương tác V là hàm theo vị trí các
nguyên tử Vị trí r của tất cả các nguyên tử trong hệ Vận tốc v của tất cả các
nguyên tử trong hệ
2 Lặp lại 3, 4, 5 với số bước yêu cầu:
3 Tính toán các lực Lực trên mỗi nguyên tử
nguyên tử), cộng với các lực bên ngoài Thế năng, động năng và
tenxơ áp suất có thể được tính toán
4 Cập nhật cấu hình Chuyển động của các nguyên tử được mô phỏng
bằng cách giải số học phương trình Newton
Trang 201.3.2 Một số thuật toán tiêu biểu trong MD
Các thuật toán lấy tích phân
Thuật toán nhảy cóc (leap-frog)
Đây là một thuật toán hay được sử dụng để lấy tích phân phương trình chuyển động Khi cần độ chính xác cao trong việc lấy tích phân, ta có thể dùng thuật toán Verlet Thuật toán nhảy cóc sử dụng vị trí r ở thời điểm t và vận tốc v ở thời điểm
trên vị trí ở thời điểm t theo các phương trình sau:
v(t +
1t) = v(t
1t) +
Thuật toán Verlet
Trong thuật toán Verlet, vị trí r và vận tốc v ở thời điểm t được dùng để lấy tích phân các phương trình chuyển động; vận tốc ở nửa bước trước không cần thiết.
Trang 212m8
Trang 22Các thuật toán điều nhiệt
Điều chỉnh vận tốc bằng cách nhân tỉ lệ
Mô phỏng được bắt đầu bằng thuật toán lấy tích phân với vị trí và vận tốc banđầu đã có Thông thường, ta biết vị trí từ thực nghiệm và vận tốc được lấy ngẫunhiên theo phân bố Maxwell-Boltzmann tương ứng với một nhiệt độ cần thiết
Trong quá trình mô phỏng, nhiệt độ thực tế sẽ bị sai lệch khỏi nhiệt độ yêu cầu:
T (t) =
2 Ekin(t)
3 N kLưu ý rằng nhiệt độ trong công thức trên là "nhiệt độ tức thời" Nhiệt độ tức thời có bản chất là động năng trung bình, được xác định từ vận tốc Do đó ý tưởng đơn giản để
đưa nhiệt độ tức thời về nhiệt độ yêu cầu là nhân tỉ lệ vận tốc của tất cả các nguyên tử
theo một thừa số Độ lớn cần thiết của thừa số này có thể được ước lượng bằng cách
Như vậy, ta cần nhân tỉ lệ vận tốc của tất cả các nguyên tử với thừa số này
rất thô sơ Khi thay đổi vận tốc, ta làm cho hệ không còn là tập hợp chuẩn tắc(canonical ensemble) nữa Ta không có gì đảm bảo cho vận tốc tuân theo phân bốMaxwell-Boltzmann Do đó ta cần các phương pháp chính xác hơn
9
Trang 23Thuật toán điều nhiệt Berendsen
Trong thuật toán Berendsen, hệ khảo sát được coi như đang ghép cặpvới một bình nhiệt vô hạn (infinite thermal bath) có nhiệt độ Tref Ta yêu cầunhiệt độ thay đổi giữa hai bước thời gian theo công thức:
dT
dtsao cho tốc độ thay đổi nhiệt độ (do thay đổi vận tốc gây ra) tỉ lệ với sự sai lệchkhỏi nhiệt độ yêu cầu Hằng số tỉ lệ là thời gian hồi phục (relaxation time) , vàphương trình vi phân bậc nhất này tương ứng với sự suy giảm hàm mũ củanhiệt độ tới nhiệt độ yêu cầu Do đó, ta muốn thay đổi nhiệt độ theo công thức:
canonical ensemble)
Trang 2410
Trang 25• Phương pháp này dịch chuyển dần năng lượng của hệ từ các "mốt" (mode) có tần số cao nhất về các "mốt" có tần số thấp nhất, vi phạm định lí cân bằng các thành phần (equipartition theorem) Các "mốt" co dãn liên kết và bẻ cong góc thường là những "mốt" nhanh nhất, và việc mất năng lượng của các "mốt" này làm cho phân tử bị "đông cứng" Mặt khác, ba "mốt" tịnh tiến (với hệ không tuần hoàn là ba "mốt" quay) của hệ là các "mốt" chậm nhất và lại được nhận năng lượng Vấn đề này còn được gọi là hiện tượng "cục nước đá bay" (flying ice cube) hoặc "cục nước đá quay" (spinning ice cube).
Thuật toán điều nhiệt Andersen - Andersen thermostat
Thuật toán điều nhiệt Andersen có cách xử lí hoàn toàn khác Theo thời gian,một số hạt sẽ được chọn để "va chạm" với các hạt của bình nhiệt (heat bath), theo
đó thay đổi vận tốc đột ngột Thuật toán như thế có đặc tính hỗn loạn (stochastic).Thuật toán điều nhiệt này hoạt động như sau:
Maxwell-Boltzmann Các hạt khác không bị ảnh hưởng
Ưu điểm của thuật toán điều nhiệt Andersen đó là nó sinh ra tập hợp chínhtắc (canonical ensemble) nếu như được lập trình chính xác Tuy nhiên để điều nàyxảy ra, tốc độ va chạm với các hạt tưởng tượng lại phải quá thấp (không đủ) hoặcquá cao (trong trường hợp này, các va chạm lại trở nên trội hơn động lực của hệ)
Trang 26Thuật toán điều nhiệt Nosé-Hoover - Nosé-Hoover thermostat
Thuật toán điều nhiệt Nosé-Hoover biểu diễn tập hợp chính tắc mộtcách chặt chẽ, và do đó thường được chọn Tuy nhiên thuật toán này lạikhó hiểu hơn Dưới đây là các ý tưởng cơ bản
Bể nhiệt được coi như là một phần của hệ và được gắn với độ tự do s
và khối lượng ảo Q Bây giờ phương trình chuyển động được tính theo hệ
mỏ rộng này với 3N + 1 độ tự do
Phương trình chuyển động của các nguyên tử được thay đổi thành
Q
Độ mạnh yếu của sự ghép cặp giữa hệ thực với bể nhiệt được xác địnhbằng tham số "khối lượng" Q Tham số này có thể trở nên dễ hiểu hơn khiđưa thêm tham số thời gian :
Q =
2 Tref
4 2Tham số này có ý nghĩa ứng với chu kì dao động của động năng giữa
hệ thực và bể nhiệt Ta cần lưu ý sự khác nhau giữa trong ghép cặpBerendsen và ghép cặp Nosé-Hoover Phương pháp Berendsen có sự tắtdần (theo hàm mũ) của sai lệch nhiệt độ với hệ số Còn trong phương phápNosé-Hoover, sự hồi phục (có dao động) nhiệt độ được thiết lập với chu kì Theo phương pháp này, các yêu cầu của thuật toán điều nhiệt được đưa luôn vào phương trình chuyển động, do đó thuật toán điều nhiệt trở thành một phần của thuật
12
Trang 27toán lấy tích phân, thay vì phép điều chỉnh ở giai đoạn sau (a posteriori correction) như trong các phương pháp trước Thuật toán điều nhiệt Nosé-Hoover được sử dụng thường xuyên và người ta có thể chứng minh được rằng trung bình tập hợp tính theo tập hợp Nosé-Hoover giống hệt với trung bình tập hợp tính theo tập hợp chuẩn tắc.
Thuật toán điều áp - Barostat
Thay vì thực hiện dưới điều kiện thể tích không đổi, các thí nghiệm hóahọc thường được diễn ra ở áp suất khí quyển không đổi Do đó việc môphỏng điều kiện đẳng áp trong MD là quan trọng
Tương tự như nhiệt độ, ta có thể tính được áp suất trong mô phỏng.Việc này thường được thực hiện bằng cách sử dụng đại lượng được gọi làhàm lực (the virial of force):
Trang 2813
Trang 29Chương 2.
ĐỐI TƯỢNG VÀ PHƯƠNG
PHÁP NGHIÊN CỨU
2.1 ĐỐI TƯỢNG NGHIÊN CỨU
Việc tìm ra thuốc điều trị ung thư hiệu quả luôn thu hút được sự chú ý do sựgia tăng của số ca ung thư trong thời đại ngày nay Các loại thuốc kháng ung thưdựa trên nhiều cơ chế khác nhau Một trong các cơ chế đang thu được sự quantâm hiện nay là cơ chế ức chế sự hình thành mạch máu (angiogenesis)
Tế bào ung thư có tốc độ phân chia lớn nên chúng cần có sự bổ sung dinh dưỡng
và oxi Để đảm bảo điều kiện đó, tế bào ung thư tiết ra yếu tố VEGF (Vascular dothelial Growth Factor – yếu tố tăng trưởng mạch máu nội mô) Yếu tố này sẽ bám vào
En-và kích hoạt protein VEGFR-2 (Vascular Endothelial Growth Factor Receptor 2
– Thụ thể yếu tố tăng trưởng mạch máu nội mô loại 2) trên màng tế bào Thông qua một chuỗi tương tác khởi đầu từ protein VEGFR-2, tế bào nội mô xung quanh sẽ khởi động quá trình hình thành mạch máu tới nuôi các tế bào ung thư Sơ đồ về cơ chế kích
Trang 30thích hình thành mạch máu được minh họa trên Hình 1 [16] Nếu như ức chếđược VEGFR-2 ta sẽ hạn chế được sự sinh trưởng và phân chia của khối u doquá trình truyền dẫn tín hiệu hình thành mạch máu bị ngắt [11, 16].
Hình 1: Cơ chế chung trong quá trình kích thích hình thành mạch máu của
tế bào ung thư và vị trí tác động của thuốc lenvatinib
Lenvatinib là loại thuốc mới được FDA (Cục quản lý thuốc và thựcphẩm Mỹ – Food and Drug Administration) cho phép dùng làm thuốc điều trịung thư tuyến giáp (cuối năm 2015) và ung thư biểu mô tế bào thận (đầunăm 2016) do có kết quả thử nghiệm thuốc Pha II và Pha III hiệu quả [10,
17, 27] Lenvatinib ức chế nhiều protein trong đó có VEGFR-2 [23] Tươngtác của lenvatinib và VEGFR-2 có thể được biểu diễn như sau:
lenvatinib + VEGFR-2 ! phức hợp VEGFR-2–lenvatinib
15
Trang 31Hiện nay chưa có nhiều nghiên cứu về tương tác giữa lenvatinib vàVEGFR-2, đặc biệt là chưa tìm thấy nghiên cứu lí thuyết mô phỏng động lựchọc phân tử trên hệ VEGFR-2–lenvatinib.
Hướng nghiên cứu về tương tác giữa VEGFR-2 và lenvatinib chưa xuấthiện nhiều ở Việt Nam [3] Trên thế giới, trình tự amino axit (tổng cộng 1356residue) của VEGFR-2 đã được xác định dựa trên ADN (chưa có dữ liệu X–raycủa toàn bộ protein) và sự phân bố các miền (domain) của protein cũng đãđược xác định [16] Trên cơ sở dữ liệu Protein Databank (https://www.rcsb.org)
đã có mặt nhiều cấu trúc X–ray của phức hợp VEGFR-2 với một số ligand, tuynhiên chỉ có tọa độ các nguyên tử ở vùng ligand gắn vào mà không có tọa độđầy đủ của tất cả các nguyên tử còn lại (ví dụ như 5EW3, 5DG5, 3WZD –
48 cấu trúc khi tìm kiếm với từ khóa VEGFR-2 trên Protein Data Bank)
Cấu trúc X–ray của phức hợp VEGFR-2 với lenvatinib cùng với các tham số tương tác động học (Hằng số phân hủy Kd và thời gian lưu trú residence time - Bảng 1) mới được công bố vào năm 2015 [23] Cấu trúc phức hợp VEGFR-2–lenvatinib được biểu thị trên Hình 2 Phân tử lenvatinib được biểu diễn dưới dạng ball-and-stick.
RTlnKeq = RTlnKd
Bảng 1: Tham số tương tác động học giữa VEGFR-2 và một số loại thuốc tương tự
Trang 32Hình 2: Cấu trúc 3D của phức hợp VEGFR-2–lenvatinib.
Trang 33tốc độ phân hủy thấp hơn trong phức hợp với VEGFR-2 Bài báo cho rằng trạng thái tương tác (binding mode of interaction) của lenvatinib rất khác biệt so với sorafenib
được từ tinh thể của phức hợp VEGFR-2–lenvatinib mà chưa xét tới sự biến đổi tươngtác có thể xảy ra theo thời gian (dynamic interaction) Việc thực hiện mô phỏng độnglực phân tử có thể giúp giải quyết hạn chế này Ngoài ra, các tác giả trên có sự phântích so sánh giữa hai thuốc lenvatinib và sorafenib nhưng mô phỏng động lực phân tửmang tính chất so sánh của các hệ VEGFR-2–lenvatinib và VEGFR-2–sorafenib chưađược thực hiện Liệu có sự liên quan nào giữa năng lượng tự do về liên kết (freebinding energy) và các tham số tương tác động học của 2 phức hợp này mà có thể rút
ra từ mô phỏng động lực phân tử hay không? Các yếu tố đóng vai trò quan trọng nhấttrong tương tác giữa VEGFR-2 và lenvatinib là gì? Đây là những câu hỏi chưa được trảlời đầy đủ
Do tác dụng của thuốc sorafenib cũng dựa trên sự ức chế protein VEGFR-2 tương
tự như thuốc lenvatinib nên có thể nghĩ rằng việc mô phỏng MD trên cả 2 hệ sẽ cho những thông tin so sánh có ý nghĩa Vào năm đã từng có nghiên cứu thực hiện mô phỏng
MD của phức hợp VEGFR-2–sorafenib [22], tuy nhiên ở thời điểm đó cấu trúc 3D X-ray của phân tử sorafenib chưa được công bố Độ phân giải của cấu trúc X–ray
˚
sử dụng khi đó chưa cao (Mã PDB: 2RL5, 2; 65 A) Hơn nữa thời gian mô phỏng trong nghiên cứu [22] còn ngắn (chỉ 10 ns) Có thể nghĩ rằng việc thực hiện tính toán lý thuyết bằng phương pháp mô phỏng động lực phân tử với thời gian dài hơn, và dựa trên cấu trúc X–ray mới công bố năm 2015 của Okamoto có độ phân giải cao hơn
˚(Mã PDB: 3WZE, 1; 9 A) [23] sẽ đem lại thêm những thông tin mới và đángtin cậy hơn, sát hơn với cơ chế thực tế của thuốc
Trang 342.2 PHƯƠNG PHÁP NGHIÊN CỨU
Các tính toán mô phỏng MD được thực hiện trên phần mềm Gromacs 5.1.4[12] với tham số trường lực amber99sb-ildn [20], mô hình nước SPC [7] Phầnmềm miễn phí Gromacs là một công cụ tính toán có độ tin cậy rất cao trong cộngđồng Hóa học tính toán [2, 1] So với nhiều công cụ tính toán khác, phần mềmGromacs có ba ưu điểm vượt trội: tốc độ tính toán nhanh hàng đầu, hỗ trợ nhiềutham số trường lực và miễn phí Thời gian mô phỏng là 100 ns Các tính toánđược thực hiện trên máy tính cá nhân.Thời gian tính toán trên máy tính cá nhânchiếm thời lượng khoảng 20 ngày đêm (chạy mô phỏng 24/7)
2.2.1 Phương pháp thực hiện tính toán MD
Cấu trúc của protein VEGFR-2 và ligand lenvatinib được trích ra từ dữ liệu Ray của phức hợp 3WZD trên Protein Data Bank 1 bằng phần mềm Chimera [25] Các amino axit còn thiếu (có số thứ tự gốc là 814-819, 842-845, 1051-1066, 1168-1172) được bổ sung bằng phần mềm Modeller 9.17 [29] Amino axit số 940 vẫn được giữ nguyên ở dạng đột biến như trong thí nghiệm của Okamoto [23] Phân tử lenvatinib được bổ sung hidro bằng phần mềm Avogadro 1.1.1 [14] Tệp topology của ligand được tạo ra bằng công cụ Acpype [28] Tệp topology của protein và của phức hợp được tạo ra dựa trên trường lực amber99sb-ildn [20] và mô hình nước SPC [7] Hệ được solvat hóa trong hộp dodecahedron, khoảng cách tối thiểu đến thành hộp là 1
X-nm Do hệ đã trung hòa về điện tích nên không cần bổ sung ion Năng lượng của hệ được cực tiểu hóa bằng thuật toán đường dốc nhất Sau đó hệ được đưa đến nhiệt
độ 300 K nhờ mô phỏng NVT trong 200 ps, sử dụng thuật toán Berendsen thermostat [8] Tất cả các liên kết được cưỡng bức bằng thuật toán LINCS [15] Sau đó hệ được
19
Trang 35đưa đến áp suất 1 bar nhờ mô phỏng NPT trong 2 ns, sử dụng thuật toánParrinello-Rahman barostat [24] Bước mô phỏng MD được thực hiện với
độ dài 100 ns, sử dụng khoảng cách cutoff 1 nm cho cả lực tĩnh điện và lựcvan der Waals [20] Các bước chuẩn bị topology cho tới chạy MD đượcthực hiện trên phần mềm Gromacs 5.1.4 [9, 4]
2.2.2 Các bước chuẩn bị tệp đầu vào
Tách protein và ligand thành tệp riêng từ phức hợp
Mở PDB code 3WZD bằng phần mềm Chimera
Menu Select -> Structure -> Protein
File -> Save PDB -> protein_extracted_from3WZD.pdb (save selected atoms only)Menu Select -> Residue -> LEV
File -> Save PDB -> LEV_extracted_from3WZD.pdb (save selected atoms only)
Xóa các nguyên tử đa vị trí (alternate location) trong protein.pdb
Mở file protein.pdb bằng phần mềm Pymol Nhập lệnh trong Pymol:
alter all, alt=''
Lưu cấu trúc thành file 3WZD_protein_A_alternateonly.pdb
Trang 36Bổ sung các amino axit còn thiếu (missing residue) bằng modeller
Mục tiêu: bổ sung các residue 814-819, 842-845, 1051-1066, 1068-1172 (Xem trong file 3WZD.pdb tải về từ PDB Databank, phần MISSING RESIDUE)
Tạo file createtemplate.py
sẽ thu được file 3WZD_protein_A_alternateonly.seq
Chuyển mã amino axit 3 kí tự sang mã 1 kí tự
residue 814-819
asp glu his cys glu arg
>results for sequence "Untitled" starting "ASPGLUHISCYS"
21
Trang 37residue 842-845
arg gly ala phe
>results for sequence "Untitled" starting "argglyalaphe"
RGAF
residue 1051-1066
arg asp ile tyr lys asp pro asp tyr val arg lys gly asp
ala arg >results for sequence "Untitled" starting
"argaspiletyr" RDIYKDPDYVRKGDAR
residue 1168-1172
arg ala gln gln asp
>results for sequence "Untitled" starting "argalaglngln"
RAQQD
Thay các chuỗi 1 letter code ở trên vào các vị trí có dấu / tương ứngtrong file 3WZD_protein_A_alternateonly.seq
Lưu ý: Nếu như cần tính toán vị trí kí tự để chèn (double check) thì cần tính
đến cả deleted residue 941-990 và cần để ý rằng khi mở file seq lên thì có
kí hiệu xuống dòng LF (dùng phần mềm Geany để mở)
Trang 38Tạo tệp align.ali dựa trên nội dung tệp seq ở trên
Xóa hết các TER record trong file 3WZD_protein_A_alternateonly.pdb
Tạo tệp addresidue.py
from modeller import *
# directories for input atom files
env.io.atom_files_directory = ['.', './atom_files']
def select_atoms(self):
return selection(self.residue_range('1',,!
'6' ), self residue_range( '29' , '32' ),self.residue_range('188',
,! '203' ), self residue_range( '305' , ,! '309' ),)
Trang 39Chuẩn bị ligand
Thêm các nguyên tử hidro (Add hydrogen) bằng phần mềm Avogadro Mở
file LEV_extracted_from3WZD.pdb bằng phần mềm Avogadro, thêm hydrogen vàorồi lưu thành file LEV_protonated.pdb Mở file vừa lưu ra, sửa tên chain và tênresidue mà Avogadro tự động thêm hidro vào cho trùng với tên residue cũ là LEV
Tạo tham số ligand (ligand parameter) bằng phần mềm acpype Tạo
ligand parameter với force field GAFF và charge assignment = bcc charge.
Mở file LEV_protonated_GMX.itp đầu ra bằng text editor xem tên các nguyên tử hidro có bị bất thường hay không (4 kí tự chẳng hạn)
Chuẩn bị các tệp đầu vào và thực hiện tính toán MD trên phần mềm Gromacs
Tạo file topology (Generate topology)
Chọn trường lực số 6: amber99sb-ILDN
Tạo file 3wzd_complex.gro
Tạo hộp và solvat hóa (Define box and solvate)
dodecahedron -d 1 0
gmx grompp -f em.mdp -c solv.gro -p topol.top -o ions.tpr
Trang 40Thêm ion (Add ion)
Cực tiểu năng lượng (Energy Minimization) Nội dung file em.mdp như sau:
calculate the interactions
,! to update the neighbor list andlongrange forces
,! determine neighbor list (simple, grid)
,! making neighbor list (shortrange forces)
,! longrange electrostatic interactions
,! electrostatic cut - off