Các khái niệm cơ bản về docking Trong lĩnh vực mô hình hóa phân tử, docking là phương pháp phỏng đoán hướng tiếp cận ưu đãi của một phân tử khi gắn kết với một phân tử khác, hình thành
Trang 1BỘ Y TẾ
ĐẠI HỌC Y DƯỢC TP HỒ CHÍ MINH
BÁO CÁO TỔNG KẾT
ĐỀ TÀI KHOA HỌC VÀ CÔNG NGHỆ CẤP TRƯỜNG
TƯƠNG TÁC ỨC CHẾ CÁC ENZYM PHÂN HỦY CARBOHYDRATES CỦA NHÓM HỢP CHẤT THIÊN NHIÊN MỚI TRONG CAN THIỆP ĐIỀU TRỊ ĐÁI
THÁO ĐƯỜNG TYPE 2
Trang 2BỘ Y TẾ
ĐẠI HỌC Y DƯỢC TP HỒ CHÍ MINH
BÁO CÁO TỔNG KẾT
ĐỀ TÀI KHOA HỌC VÀ CÔNG NGHỆ CẤP TRƯỜNG
TƯƠNG TÁC ỨC CHẾ CÁC ENZYM PHÂN HỦY CARBOHYDRATES CỦA NHÓM HỢP CHẤT THIÊN NHIÊN MỚI TRONG CAN THIỆP ĐIỀU TRỊ ĐÁI
THÁO ĐƯỜNG TYPE 2
Trang 3DANH SÁCH THÀNH VIÊN THAM GIA NGHIÊN CỨU
Họ và tên, học hàm học vị
Chức danh trong quá trình thực hiện nhiệm vụ
Đơn vị công tác
1 ThS Nguyễn Trương Công Minh Chủ nhiệm đề tài Đại học Y Dược TP HCM
2 PGS TS Lê Xuân Trường Thành viên Đại học Y Dược TP HCM
3 ThS Lê Thị Xuân Thảo Thành viên Đại học Y Dược TP HCM
4 PGS TS Bùi Thọ Thanh Thành viên Trường Đại học Khoa học Tự
nhiên, TP.HCM
Trang 4MỤC LỤC
CHƯƠNG 1: ĐẶT VẤN ĐỀ VÀ TỔNG QUAN TÀI LIỆU 1
1.1 Đặt vấn đề 1
1.2 Tổng quan 2
1.2.1 Tổng quan về mô hình hóa phân tử - docking phân tử 2
1.2.2 Các khái niệm cơ bản về docking 3
1.2.3 Các hướng tiếp cận của kỹ thuật docking phân tử 7
1.2.4 Thuật toán tìm kiếm và hàm đánh giá 9
1.2.5 Sàng lọc ảo (Virtual screening) 12
Chương 2: ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU 24
2.1 Đối tượng nghiên cứu 24
2.2 Phương pháp nghiên cứu 24
CHƯƠNG 3: KẾT QUẢ và BÀN LUẬN 27
3.1 Kết quả 27
3.2 Bàn luận 32
CHƯƠNG 4: KẾT LUẬN 38
TÀI LIỆU THAM KHẢO
Trang 5DANH MỤC BẢNG - HÌNH
Bảng 1: Mô hình ức chế enzym Alpha-amylase tương ứng với năng lượng gắn kết 27
Eb và loại tương tác cho mỗi hợp chất ức chế 27
Bảng 2: Mô hình ức chế enzym Alpha-glucosidase tương ứng với năng lượng 29
gắn kết Eb và loại tương tác cho mỗi hợp chất ức chế 29
Bảng 3: Tương quan giữa năng lượng gắn kết Eb (kcal/mol) và IC50 (µM) đối với 32
từng hợp chất ức chế 32
Hình 1 Các kiểu mô hình khác nhau của dẫn xuất 1, 3, 4-Oxadiazoles 2
Hình 2 Phức hợp docking protein-ligand 3
Hình 3 Biểu đồ docking phân tử ligand trên protein 4
Hình 4 Phân tử nhỏ gắn kết vào túi thụ thể protein 5
Hình 5 Các túi/hốc trên thụ thể gắn kết với ligand 7
Hình 6 Sơ đồ các thuật toán tìm kiếm 9
Hình 7 Sơ đồ các hàm đánh giá 12
Hình 8: Mô hình thế năng tĩnh điện của phức hợp chất ức chế – enzyme 33
Trang 6THÔNG TIN KẾT QUẢ NGHIÊN CỨU
ĐỀ TÀI KHOA HỌC VÀ CÔNG NGHỆ CẤP TRƯỜNG
1 Thông tin chung
- Tên đề tài: TƯƠNG TÁC ỨC CHẾ CÁC ENZYM PHÂN HỦY CARBOHYDRATES
CỦA NHÓM HỢP CHẤT THIÊN NHIÊN MỚI TRONG CAN THIỆP ĐIỀU TRỊ ĐÁI
THÁO ĐƯỜNG TYPE 2
- Mã số:
- Chủ nhiệm đề tài: ThS Nguyễn Trương Công Minh
Điện thoại: 01269635368 Email: congminh.ngtruong@gmail.com
- Đơn vị quản lý về chuyên môn: bộ môn Hóa Sinh, Khoa Y, Đại học Y Dược TP.HCM
- Thời gian thực hiện: từ tháng 6/2017 đến tháng 6/2018
Alpha-4 Kết quả chính đạt được (khoa học, đào tạo, kinh tế-xã hội, ứng dụng ):
- Công bố trên tạp chí trong nước: Tạp chí Y học TP.HCM, xuất bản năm 2018
5 Hiệu quả kinh tế - xã hội do đề tài mang lại
Trang 7- Góp phần cung cấp một số kiến thức quan trọng về cơ chế ức chế 2 enzym phân hủy
Carbohydrates của các hợp chất thiên nhiên mới, hỗ trợ điều trị đái tháo đường trong tương lai, đồng thời mở ra triển vọng định hướng cho nhiều nghiên cứu, ứng dụng trong tương lai nhằm mục đích can thiệp có hiệu quả các rối loạn đường huyết và giảm thiểu các biến chứng gây ra
Trang 8CHƯƠNG 1: ĐẶT VẤN ĐỀ VÀ TỔNG QUAN TÀI LIỆU
1.1 ĐẶT VẤN ĐỀ
Hóa học lý thuyết nói chung và các phương pháp tính hóa lượng tử nói riêng được áp dụng rộng rãi trong nhiều lĩnh vực, trong đó việc nghiên cứu hoạt động enzyme ứng dụng trong chẩn đoán và điều trị bệnh đang ngày càng phát triển Thành công trong lĩnh vực này sẽ định hướng cho việc tiếp cận phương pháp chữa trị mới, sử dụng công cụ hóa tính toán để điều chỉnh, can thiệp vào các quá trình diễn ra trong cơ thể sống bao gồm hoạt động của enzyme, giúp tiên lượng và điều trị bệnh trúng đích, hạn chế được nguy hiểm, rủi ro không mong muốn
Các phương pháp tính toán lý thuyết nghiên cứu hoạt động enzyme cho đến nay vẫn đang được bổ sung và hoàn thiện, chính vì thế vấn đề nghiên cứu góp phần cải tiến các phương pháp này có vai trò quan trọng, đặc biệt trong lĩnh vực y sinh học phân tử, đưa hóa tính toán tiếp cận gần hơn đến các ứng dụng trong thực hành lâm sàng
Đái tháo đường là một rối loạn mạn tính [1], có những thuộc tính sau: tăng glucose máu, kết hợp với những bất thường về chuyển hoá carbohydrate, lipid và protein Bệnh luôn gắn liền với xu hướng phát triển các bệnh lý về thận, đáy mắt, thần kinh và các bệnh tim mạch do hậu quả của xơ vữa động mạch
Đái tháo đường Type 2 (T2D) đặc trưng bởi sự khiếm khuyết chức năng tế bào beta, giảm hoạt tính của insulin do gen, gây nên tình trạng tăng đường huyết thời kỳ hậu mãn kinh [1]
Bên cạnh các hướng tiếp cận điều trị ngăn chặn rối loạn đường huyết thời kỳ hậu mãn kinh, giảm thiểu các biến chứng gây ra, một số phương pháp mới gần đây đã được áp dụng nhằm kiểm soát, giảm lượng đường hấp thu bằng cách gây ức chế các enzym phân hủy Carbohydrates chủ yếu là Alpha-glucosidase và Alpha-amylase [2] Đồng thời, xu hướng thay thế các tác nhân ức chế tổng hợp bằng các tác nhân ức chế có nguồn gốc tự nhiên ngày càng được chú trọng để hạn chế đến mức tối đa các tác dụng phụ không mong muốn
Trang 9Mục tiêu nghiên cứu
Góp phần hiểu rõ thêm cơ chế ức chế các enzym trong đái tháo đường tuýp 2 đồng thời đánh giá hiệu quả ức chế của nhóm hợp chất có nguồn gốc tự nhiên [7, 8] so sánh với hợp
chất ức chế tổng hợp (Acarbose)
1.2 TỔNG QUAN
1.2.1 Tổng quan về mô hình hóa phân tử - docking phân tử
Mô hình hóa phân tử là công cụ đắc lực phục vụ nghiên cứu, giảng dạy, đồng thời hỗ trợ khám phá các hiện tượng, các khái niệm hóa học mới Mô hình hóa là thuật ngữ mô tả việc sử dụng tài nguyên máy tính để xây dựng cấu trúc và thực hiện các tính toán nhằm
dự đoán tính chất hóa học đặc trưng của mỗi phân tử [3]
Hình 1 Các kiểu mô hình khác nhau của dẫn xuất 1, 3, 4-Oxadiazoles
Phương pháp mô hình hóa bao gồm tất cả các lý thuyết và kỹ thuật tính toán sử dụng trong lĩnh vực hóa học nói chung, hóa tính toán nói riêng, sinh học tính toán và khoa học vật liệu, nghiên cứu hệ phân tử trong phạm vi kích thước nhỏ tới hệ phân tử sinh học có kích thước lớn và các vật liệu khối Đặc điểm chung của các kỹ thuật này là
mô tả hệ phân tử dưới cấp độ nguyên tử, với mức độ thông tin thấp nhất là các đơn nguyên tử (hay một nhóm nhỏ nguyên tử) Như vậy, trái ngược so với các khái niệm hóa lượng tử trong đó việc thực hiện tính toán có kể đến hiệu ứng các electron và cấu trúc electron của nguyên tử Lợi ích của phương pháp mô hình hóa phân tử là đơn giản hóa độ phức tạp của hệ thống, cho phép các hạt nguyên tử tham gia vào quá trình mô phỏng Trong những năm gần đây, các nghiên cứu thiết kế phân tử có hoạt tính nói chung
và phân tử thuốc nói riêng đã được cải tiến đi từ phương pháp thử nghiệm – tổng hợp truyền thống đến quá trình mô phỏng sản xuất phức tạp, nhờ sự hỗ trợ bằng máy tính
Trang 10Thiết kế phân tử thuốc được thực hiện dựa trên cấu trúc các protein mục tiêu đã biết, từ
đó khám phá ra hợp chất mới sử dụng trong liệu pháp điều trị thích hợp Các hướng tiếp cận thiết kế phân tử có hoạt tính được phân thành 2 nhóm chính bao gồm: thiết kế de
novo protein và docking phân tử [4, 5] (Hình 2)
Hình 2 Phức hợp docking protein-ligand
“Docking” là khái niệm để chỉ sự tạo thành phức hợp gắn kết giữa phân tử protein
và phân tử ligand Nhiệm vụ của quá trình docking là dự đoán cấu trúc của phức hợp này trên cơ sở cấu trúc cho trước của một phân tử ligand và một phân tử protein bất kỳ Dạng hình học của phức hợp phải phản ánh cực tiểu toàn cục của năng lượng tự do gắn kết, do
đó docking mang bản chất của sự tối ưu hóa năng lượng Vấn đề đặt ra là cần có các giải pháp gần đúng thích hợp, thực hiện docking trong khoảng thời gian không quá dài Đồng thời, các phương pháp docking phải thỏa mãn yêu cầu về độ chính xác, dạng hình học lập thể phù hợp của mô hình dự đoán tương tác giữa protein – ligand
1.2.2 Các khái niệm cơ bản về docking
Trong lĩnh vực mô hình hóa phân tử, docking là phương pháp phỏng đoán hướng tiếp cận ưu đãi của một phân tử khi gắn kết với một phân tử khác, hình thành phức hợp bền, được đặc trưng bởi độ bền liên kết hay ái lực gắn kết giữa 2 phân tử sử dụng các hàm đánh giá (scoring functions) [5, 6]
Hai phân tử thực hiện docking có thể là các phân tử sinh học như protein, acid nucleic, carbohydrate và lipid Các phân tử này liên kết với nhau giữ vai trò trung tâm trong sự dẫn truyền tín hiệu Đồng thời, hướng tiếp cận tương ứng sẽ ảnh hưởng tới loại tín hiệu được tạo thành Như vậy, về mặt tổng quan, docking có khả năng dự đoán cả độ bền liên kết và loại tín hiệu tạo thành của các phân tử sinh học
Trang 11Hình 3 Biểu đồ docking phân tử ligand trên protein
Trong hóa học nói chung và hóa dược nói riêng, khái niệm docking thường đại diện cho việc tính toán, mô phỏng hướng tác kích và gắn kết của phân tử thuốc lên các protein
mục tiêu (Hình 3), nhằm dự đoán ái lực và hoạt tính của phân tử có kích thước nhỏ, có
vai trò quan trọng trong thiết kế thuốc hợp lý [4]
Docking phân tử là một nhiệm vụ khó khăn vì tồn tại nhiều dạng tiếp cận lập thể giữa các đại phân tử và ligand tương ứng, cũng như việc tính toán năng lượng một cách chính xác Số dạng tiếp cận tăng theo hàm mũ bậc tự do của phân tử docking
Docking phân tử có thể được xem như vấn đề về chìa khóa – ổ khóa, trong đó việc tìm kiếm chìa khóa thích hợp đồng nghĩa với cấu dạng ligand phù hợp theo kích thước và hình dạng của bề mặt ổ khóa và lổ khóa (protein)
Docking phân tử còn được định nghĩa là sự tối ưu hóa, mô tả hướng gắn kết phù hợp nhất của ligand với phân tử protein cần quan tâm, trong đó cả hai đều mang tính linh động cao
Ngày này, ứng dụng của các phương pháp tính toán nghiên cứu sự hình thành của phức hợp phân tử đã và đang mở rộng phát triển Quá trình tính toán nhằm đạt mục tiêu tìm kiếm ligand có dạng hình học và thế năng phù hợp, có thể liên kết với protein Trong hóa dược, phân tử thuốc có hoạt tính sinh học đặc trưng, gắn kết vào các túi thụ thể
(thường của protein) (Hình 4) Đối với mỗi cấu dạng gắn kết, phân tử thuốc biểu hiện
Trang 12từng tính chất hóa học và hình dạng đặc trưng, hình thành hoạt tính Mô phỏng docking phân tử hỗ trợ khảo sát các tương tác đặc hiệu thông qua xác định các tâm hoạt động thích hợp trên cấu trúc protein, đồng thời tính toán năng lượng tương tác cho nhiều ligand khác nhau, làm nền tảng thiết kế các cấu trúc ligand hiệu quả hơn
Hình 1.4 Phân tử nhỏ gắn kết vào túi thụ thể protein
Thụ thể hoặc đã được nghiên cứu thực nghiệm, hoặc đã được mô hình hóa lý thuyết dựa trên các kiến thức về xây dựng cấu trúc protein và đồng đẳng protein Công cụ, phần mềm docking phân tử được phát triển để xác định dạng hình học ưu đãi của phức hợp tương tác giữa ligand và thụ thể, có năng lượng thấp nhất, dựa trên các hàm đánh giá khác nhau liên quan tới: độ tĩnh điện, tổng độ lập thể - tĩnh điện (các tham số của trường lực MMFF) và điểm số đánh giá tương tác (Dock Score) Docking được phân loại thành các dạng cơ bản sau [3, 6]:
Docking cứng: cố định khung thụ thể trong môi trường cụ thể, chỉ thay đổi vị trí tác kích của ligand
Docking bán mềm: dạng hình học của tương tác giữa thụ thể - ligand được xác định với sự thay đổi góc xoắn của ligand, liên kết với tâm hoạt động của thụ thể giữ cố định
Docking mềm: Ligand và thụ thể có độ linh động cao tương ứng với sự thay đổi góc xoắn và mạch bên của phần tâm hoạt động (phần tâm hoạt động được chọn trong bán kính người dùng định nghĩa xung quanh ligand)
Khía cạnh chủ chốt trong mô hình hóa phân tử là tính toán năng lượng cấu dạng và tương tác, sử dụng các phương pháp cơ học lượng tử hay các hàm năng lượng kinh
Trang 13nghiệm Đánh giá năng lượng docking thường được thực hiện nhờ sự hỗ trợ của hàm tính điểm Nghiên cứu cải tiến các hàm tính điểm là thách thức lớn trong vấn đề thiết kế thuốc hợp lý Hiệu quả và độ chính xác mô hình hình học của quá trình gắn kết phụ thuộc vào các hàm tính điểm, thường dựa chủ yếu vào phương pháp trường lực phân tử được áp dụng để mô phỏng chức năng của protein Một vấn đề nữa là làm cách nào sàng lọc hàng triệu hợp chất sẵn có để gắn kết phù hợp với thụ thể và có ái lực lớn nhất
Nhiều kỹ thuật, phương pháp khác nhau đã được áp dụng để giải quyết một phần thách thức đặt ra như: thuyết nhiễu loạn năng lượng tự do hay làm thực nghiệm trực tiếp Trong đó, kỹ thuật docking cứng xem cả ligand và protein đều có khung cố định, chỉ thay đổi hướng tác kích của ligand đối với vị trí túi thụ thể trên protein Hướng tiếp cận này có tốc độ tính toán nhanh và mang tính liệt kê, vì chỉ có 6 bậc tự do tương ứng với vị trí của ligand tương tác với thụ thể Kỹ thuật mô phỏng động học phân tử (Molecular Dynamics Simulation, MDS) cho phép người dùng lựa chọn các tương tác liên phân tử như tương tác lập thể hay tương tác tĩnh điện Thêm vào đó, docking bán mềm hỗ trợ thay đổi bậc tự
do nội phân tử, đi kèm với sự dịch chuyển và xoay quanh một góc cố định, giúp quá trình tìm kiếm cấu dạng ligand có hiệu quả hơn, nhưng với thời gian tính toán lâu hơn so với docking cứng
Các hàm tính điểm dùng đánh giá năng lượng gắn kết giữa thụ thể và ligand đều có
kể đến các tương tác bao gồm: tương tác Vander Walls, liên kết hydrogen, liên kết biến dạng và hiệu ứng kỵ nước Trong kỹ thuật docking cứng dựa trên lưới (grid based docking) có sử dụng MDS, sau khi các cấu dạng duy nhất của ligand được hình thành,
người dùng sẽ chọn túi thụ thể bất kỳ (Hình 5) bằng cách thiết lập một lưới bao xung
quanh túi với khoảng kích thước mặc định là 1 Å
Trang 14Hình 5 Các túi/hốc trên thụ thể gắn kết với ligand
Tất cả chuyển động quay của ligand được quét tại mỗi túi nơi ligand tiến đến và gắn kết Tương ứng với một trạng thái chuyển động có giá trị, xác định bởi ngưỡng tiêu chuẩn cung cấp từ người dùng có liên quan tới số va chạm cho phép tối đa, điểm đánh giá sẽ được tính bởi các hàm tính điểm Kết quả thu được trạng thái của ligand với điểm đánh giá cao nhất Mặc dù đây là phương pháp áp dụng cho một ligand đáp ứng với một thụ thể biết trước, nhưng cũng có thể sử dụng cho tập hợp nhiều ligand hoặc cấu dạng của nhiều ligand với chế độ docking hàng loạt dựa trên lưới (batch grid docking mode) MDS cũng kết hợp với hàm tuyến tính từng khoảng (Piecewise Linear Pair wise Potential function, PLP) xử lý các tương tác bao gồm lực liên kết hydrogen cho-nhận, lực đẩy (cho-cho, nhận-nhận) và các loại lực phân tán (kể cả tương tác thuộc nhóm không phân cực) [6]
1.2.3 Các hướng tiếp cận của kỹ thuật docking phân tử
Hai hướng tiếp cận đặc biệt phổ biến trong docking phân tử là kỹ thuật khớp nối xem protein và ligand là các bề mặt bù trừ và kỹ thuật mô phỏng quá trình docking thực
tế, có tính toán năng lượng tương tác cặp ligand-protein [6] Cả hai đều có các lợi điểm quan trọng cũng như tồn tại một số giới hạn nhất định
Trang 15Tính bù trừ giữa 2 bề mặt về mặt tổng quan chính là hình dạng khớp nối phù hợp,
có thể hình thành trạng thái gắn kết giữa protein mục tiêu và các phân tử ligand Ngoài ra còn có thể dựa trên đặc tính kỵ nước của protein hoặc sử dụng kỹ thuật Fourier
Ưu điểm của hướng tiếp cận này là tính toán nhanh và cho phép khảo sát tính linh động của ligand, tuy nhiên không thể mô phỏng sự di chuyển hay sự thay đổi về mặt động học một cách chính xác của các cấu dạng ligand/protein Kỹ thuật này thường được
sử dụng nhiều trong hóa dược, vì có thể nhanh chóng sàng lọc vài ngàn phân tử ligand chỉ trong vài giây, giúp xác định khả năng gắn kết vào tâm hoạt động của protein, kể cả đối với các tương tác protein-protein
1.2.3.2 Mô phỏng quá trình docking
Mô phỏng quá trình docking là hướng tiếp cận phức tạp trong đó protein và ligand được phân cách một khoảng nhất định, tiếp theo là sự di chuyển của ligand tác kích vào tâm hoạt động của protein Trong thời gian di chuyển, ligand biểu hiện các trạng thái tịnh tiến và quay quanh một trục cố định, cũng như sự thay đổi góc xoắn nội phân tử Mỗi bước di chuyển đều thực hiện tính toán năng lượng hao phí tổng cộng của hệ thống
Ưu điểm rõ ràng của kỹ thuật này là mô tả đầy đủ tính linh động của ligand trong quá trình mô phỏng docking gần với thực tế Nhược điểm là thời gian tính toán kéo dài trước khi đánh giá được trạng thái gắn kết tối ưu Tuy nhiên, nếu sử dụng kỹ thuật docking dựa trên lưới kết hợp với các phương pháp tối ưu hóa nhanh sẽ góp phần cải thiện đáng kể vấn đề được đặt ra
Trang 161.2.4 Thuật toán tìm kiếm và hàm đánh giá
Để tiến hành quá trình docking, yêu cầu đầu tiên là cấu trúc của protein mục tiêu, thông thường được xác định bằng một số kỹ thuật lý sinh như tinh thể học tia X hoặc phổ cộng hưởng từ hạt nhân Cấu trúc protein này và cơ sở dữ liệu các ligand là thông số đầu vào cho chương trình docking Sự thành công hay thất bại của quá trình docking phụ thuộc vào 2 thành tố chính: thuật toán tìm kiếm và hàm đánh giá
1.2.4.1 Thuật toán tìm kiếm
Không gian tìm kiếm về mặt lý thuyết bao gồm tất cả hướng và cấu dạng có thể có của protein gắn kết với ligand Tuy nhiên, trên thực tế với lượng tài nguyên tính toán có giới hạn, hoàn toàn không thể liệt kê toàn bộ các trạng thái biến dạng của mỗi phân tử và tất cả các hướng tịnh tiến và hướng quay của ligand tương ứng với protein ở cấp độ hạt Hầu hết các chương trình docking được sử dụng chỉ để mô tả tính linh động của ligand,
và trong đó vẫn cần nhiều cải tiến cho việc mô hình hóa thụ thể protein một cách đầy đủ nhất Mỗi hình ảnh docking sẽ tương ứng với một trạng thái phức hợp gắn kết xác định
Hình 6 Sơ đồ các thuật toán tìm kiếm
Các thuật toán tìm kiếm làm sáng tỏ tất cả kiểu gắn kết có thể có giữa ligand và thụ thể, bao gồm 6 bậc tự do liên quan tới chuyển động tịnh tiến, chuyển động quay của
Trang 17ligand và các biến đổi về cấu dạng của protein và ligand Tuy nhiên, khả năng ứng dụng của các thuật toán còn hạn chế, do kích thước không gian tìm kiếm càng lớn thì thời gian tính toán càng kéo dài, tương ứng với mỗi cấu hình phân tử Như vậy, trên thực tế, chỉ cho phép một lượng nhỏ không gian tìm kiếm được xử lý, hay nói cách khác, việc xác định không gian tìm kiếm cần dung hòa với chi phí và tài nguyên tính toán
Nhiều chiến lược tìm kiếm cấu dạng của ligand và thụ thể đã được áp dụng bao gồm:
Tìm kiếm hệ thống hay tìm kiếm xoắn ngẫu nhiên (stochastictorsional searches) có liên quan tới các liên kết có thể quay được
Mô phỏng động học phân tử
Thuật toán di truyền “tiến hóa” các cấu dạng năng lượng thấp
Tính linh động của ligand
Các cấu dạng của ligand được hình thành trước khi có sự tham gia của thụ thể, đồng thời thay đổi trong quá trình tiến tới và gắn kết với túi thụ thể Sau đó là giai đoạn tính toán đánh giá năng lượng trường lực, sàng lọc các cấu dạng phù hợp về mặt năng lượng
Tính linh động của thụ thể
Tài nguyên tính toán đã được cải tiến mạnh mẽ trong nhiều thập kỷ qua, hỗ trợ giải quyết các bài toán phức tạp trong lĩnh vực thiết kế thuốc hợp lý Tuy nhiên, vấn đề về tính linh động của thụ thể trong các kỹ thuật tính toán docking vẫn còn nhiều hạn chế Lý
do mấu chốt là thời gian tính toán kéo dài khi xử lý với lượng lớn số bậc tự do phân tử Một cấu dạng đơn, cố định, không phải là đại diện tiêu biểu cho protein Thay vào
đó, trạng thái gấp nếp của protein phải được đặc trưng bởi một tập hợp các cấu dạng cân bằng về mặt năng lượng Dưới điều kiện thay đổi, cực tiểu cục bộ và số trạng thái cấu dạng cũng thay đổi Hơn nữa, cấu dạng của thụ thể được gắn kết có thể đã xuất hiện trước
đó trong tập hợp cấu dạng protein ban đầu, và ligand khi đó không còn vai trò chủ động tác kích, làm biến dạng bề mặt cố định của protein như nền tảng cơ sở ban đầu của lý thuyết docking phân tử
Trang 181.2.4.2 Hàm đánh giá
Hàm đánh giá hay hàm tính điểm là phương pháp toán học gần đúng, dự đoán độ bền tương tác phi cộng hóa trị giữa 2 phân tử đã thực hiện gắn kết Phổ biến nhất là một phân tử hợp chất hữu cơ kích thước nhỏ (thuốc) kết hợp với một phân tử sinh học mục tiêu (thụ thể protein) Các hàm đánh giá còn ứng dụng dự đoán độ bền tương tác liên phân tử, như giữa 2 protein hoặc giữa protein và DNA
Hàm đánh giá lấy dữ liệu đầu vào là một trạng thái cấu dạng và kết quả đầu ra là một giá trị bằng số, biểu diễn khả năng trạng thái đó đại diện phù hợp cho tương tác gắn kết ưu đãi [9] Hầu hết hàm đánh giá đều dựa trên trường lực cơ học phân tử, ước lượng năng lượng của trạng thái gắn kết: năng lượng thấp, có giá trị âm, cho biết hệ phức hợp gắn kết bền Hướng tiếp cận khác là tham khảo thống kê thế năng tương tác, thuộc cơ sở
dữ liệu phức hợp protein-ligand như Ngân Hàng Dữ liệu Protein (Protein Data Bank), và thực hiện đánh giá độ phù hợp của trạng thái gắn kết tương ứng Quá trình đánh giá, thực chất bao gồm 3 hướng khác nhau, liên quan tới docking và thiết kế phân tử có hoạt tính:
Xếp hạng các cấu hình được tạo thành từ thuật toán tìm kiếm, nhằm mục đích phát hiện kiểu gắn kết phù hợp, một cách gần đúng nhất, so với thực nghiệm
Xếp hạng các ligand khác nhau được gắn kết vào protein, lựa chọn ligand ưu đãi căn cứ vào ái lực đối với protein Hướng tiếp cận này cần thiết cho quá trình sàng lọc ảo (virtual screening)
Xếp hạng một hay nhiều ligand khác nhau, liên quan tới ái lực gắn kết vào các protein khác nhau Hướng tiếp cận này giải quyết vấn đề về độ chọn lọc và độ đặc hiệu
Phương pháp đánh giá có thể là trường lực cơ học phân tử như AMBER, OPLS hay CHARMM, cho tới các hàm năng lượng tự do kinh nghiệm hoặc các hàm số tri thức (knowledge based functions) Các kỹ thuật docking hiện tại thường vận dụng hàm đánh giá theo 2 phương pháp Phương pháp đầu tiên gồm 3 bước tiến hành:
Bước 1: Hàm đánh giá thực hiện xếp hạng cấu dạng protein và ligand
Bước 2: Phân tích hệ thống bằng thuật toán tìm kiếm
Trang 19 Bước 3: Hàm đánh giá thực hiện xếp hạng cấu trúc mới
Hình 7 Sơ đồ các hàm đánh giá
Ngoài ra, còn có thể sử dụng kiểu hàm đánh giá 2 giai đoạn bao gồm việc tìm kiếm cấu dạng các phân tử bằng một hàm đánh giá rút gọn, sau đó sử dụng hàm đánh giá đầy
đủ để xếp hạng các cấu trúc gắn kết thu được
Các phương pháp này thường bỏ qua việc tính toán tương tác tĩnh điện, chỉ kể đến một số loại tương tác tiêu biểu điển hình như tương tác hydrogen Nhược điểm đáng lưu
ý của nhiều hàm đánh giá hiện nay là xu hướng loại bỏ hiệu ứng solvat hóa hay sử dụng các mô hình dung môi không đặc trưng, theo kiểu thiết lập các cấu trúc ở môi trường chân không sau đó xếp hạng bởi một hàm đánh giá có sử dụng mô hình dung môi Như vậy, thuật toán tìm kiếm chỉ tính toán trong không gian các cấu dạng ưu đãi thuộc môi trường chân không Đồng thời, vai trò của các ion và phân tử dung môi đi kèm thường bị
bỏ qua
1.2.5 Sàng lọc ảo (Virtual screening)
Sàng lọc ảo (VS) là kỹ thuật tính toán sử dụng trong nghiên cứu thiết kế thuốc, dưới
sự hỗ trợ của máy tính, đánh giá nhanh chóng khả năng gắn kết ưu đãi của lượng lớn dữ liệu cấu trúc hóa học vào phân tử thuốc mục tiêu, điển hình là thụ thể protein hay enzyme
VS là kỹ thuật quan trọng, thiết yếu cho quá trình phát triển thuốc mới Walters và đồng nghiệp đã định nghĩa VS là “sự tự động hóa phân tích thư viện hợp chất khổng lồ”,
Trang 20sử dụng các chương trình máy tính Trên cơ sở cấu trúc 3-D của phân tử mục tiêu, VS được tiến hành qua các bước: Phân tích cấu trúc 3-D của protein, thực hiện tìm kiếm bằng máy tính cơ sở dữ liệu các hợp chất có khả năng tương tác và gắn kết phù hợp vào tâm hoạt động, hình thành thêm một số liên kết mới với protein (Giai đoạn này được thực hiện nhờ các kỹ thuật docking phân tử và/hoặc các thuật toán tìm kiếm cấu trúc có dược tính), sau cùng là quá trình thống kê các hợp chất thỏa mãn yêu cầu và loại bỏ cấu trúc không phù hợp
Xác định thuộc tính phân tử trong VS
Trong VS, thuộc tính phân tử là các chỉ số quan trọng của hợp chất hóa học, bao gồm các chất mang dược tính, được phân thành 3 nhóm tương ứng với các thông số về vật lý, hóa học và sinh học Theo đó, 3 phương pháp tính toán chủ đạo được sử dụng, kèm với ứng dụng VS, là:
Phương pháp kinh nghiệm (Cơ học phân tử): Phương pháp này ít phức tạp, tính toán nhanh, có thể xử lý nhiều hệ thống phân tử kích thước lớn bao gồm các enzyme Cơ học phân tử tái thiết lập dạng hình học phân tử, năng lượng và các yếu tố khác bằng cách thay đổi độ dài liên kết, góc liên kết và góc xoắn đạt tới giá trị cân bằng Giá trị này phụ thuộc vào sự lai hóa giữa nguyên tử và mô hình liên kết nguyên tử Thông qua đó, các trường lực được sử dụng để tính toán năng lượng và hình dạng phân tử, thực chất là tập hợp của các phương trình, tham số và loại nguyên tử
Phương pháp động học phân tử: Mô phỏng động học phân tử được sử dụng trong nhiều ứng dụng lưỡng phân tử Kỹ thuật này kết hợp với dữ liệu từ các nguyên cứu phổ cộng hưởng từ hạt nhân, sử dụng các cấu trúc 3-D của peptide
và các phân tử protein nhỏ (trường hợp không áp dụng được kỹ thuật tinh thể học tia X), kết xuất thành các dạng dữ liệu về nhiệt động, động học, dữ liệu về cấu trúc Qua đó, mô tả được tính chất ái lực gắn kết, độ linh động và độ bền của các protein, acid nucleic và nhiều đại phân tử khác mà các mô hình tĩnh không tính toán được
Trang 21 Cơ học lượng tử: là một trong những lý thuyết cổ điển của hóa học tính toán,
sử dụng các hằng số vật lý phổ biến như tốc độ ánh sáng, khối lượng và điện tích hạt nhân, kết hợp thành các phương trình vi phân trực tiếp tính toán thuộc tính và dạng hình học phân tử Thuộc tính phân tử về cơ bản là nghiệm của phương trình Schrodinger:
Hɸ=Eɸ
E: năng lượng hệ thống; ɸ: hàm sóng; H: toán tử Hamilton
1.2.6 Khái quát các phương pháp tin sinh trong khai phá dữ liệu
Khai phá dữ liệu là một khái niệm ra đời vào những năm cuối của thập kỷ 80 bao hàm một loạt các kỹ thuật nhằm phát hiện các thông tin có giá trị tiềm ẩn trong các tập dữ liệu lớn (các kho dữ liệu) Về bản chất, khai phá dữ liệu liên quan đến việc phân tích các
dữ liệu và sử dụng các kỹ thuật để tìm ra các mẫu hình có tính chính quy (regularities) trong tập dữ liệu Năm 1989, Fayyad, Piatestsky-Shapiro và Smyth đã dùng khái niệm phát hiện tri thức trong cơ sở dữ liệu (Kownledge Discovery in Database) để chỉ toàn bộ quá trình phát hiện các tri thức có ích từ các tập dữ liệu lớn Trong đó, khai phá dữ liệu là một bước quan trọng đặc biệt trong toàn bộ quá trình, sử dụng các giải thuật đặc biệt để truy xuất các mô hình từ dữ liệu
Mỗi tập dữ liệu sử dụng được thu thập riêng rẽ và nghiên cứu trong một nhóm chung vừa với mục đích phát hiện kiến thức mới vừa giảm thiểu chi phí khi thu thập thêm
dữ liệu Ngoài ra, dữ liệu thường tập trung với số lượng khổng lồ qua hệ thống liên mạng
và định dạng không có cấu trúc Trong trường hợp này, ứng dụng của khai phá dữ liệu góp phần tạo điều kiện thuận lợi cho quá trình phân tích hệ thống và hỗ trợ người dùng truy xuất các thông tin có liên quan Tuy nhiên, các loại dữ liệu khác nhau đôi khi được phân bố rải rác với độ chính xác không cao Lấy ví dụ đối với dữ liệu y học, các thông tin dạng số nguyên bản được phân vùng ngẫu nhiên, ký hiệu khác nhau có thể được sử dụng với cùng một ý nghĩa gây nên sự dư thừa và thường tồn tại phổ biến các sai sót, hiểu lầm trong thuật ngữ y học Vì vậy, đòi hỏi nhất thiết phải có một hệ thống tiền xử lý có thể truy xuất bất kỳ thông tin nào ngay cả đối với tập dữ liệu có kích thước trung bình Điển