TỔNG QUAN
Tổng quan về bệnh đái tháo đường
Theo Bộ Y tế Việt Nam năm 2017, Đái tháo đường (ĐTĐ) được định nghĩa là
Bệnh rối loạn chuyển hóa không đồng nhất đặc trưng bởi tình trạng tăng glucose huyết, xảy ra do khiếm khuyết trong việc tiết insulin hoặc tác động của insulin, hoặc cả hai Tình trạng tăng glucose mạn tính kéo dài có thể dẫn đến rối loạn chuyển hóa carbohydrate, protide và lipide, gây tổn thương cho nhiều cơ quan, đặc biệt là tim, mạch máu, thận, mắt và hệ thần kinh.
Theo Liên đoàn Đái tháo đường Thế giới (IDF), năm 2015, có 415 triệu người từ 20-79 tuổi mắc bệnh Đái tháo đường (ĐTĐ) tại 111 quốc gia, và dự báo đến năm 2040, con số này sẽ tăng lên 642 triệu, tức là cứ 10 người thì có 1 người bị ĐTĐ Đặc biệt, bệnh ĐTĐ tuýp 2 đang gia tăng ở trẻ em do thói quen ăn uống không khoa học và thiếu vận động, trở thành một vấn đề sức khỏe cộng đồng nghiêm trọng Bệnh ĐTĐ gây ra nhiều biến chứng nguy hiểm như bệnh tim mạch, đục thủy tinh thể, suy thận, và có thể dẫn đến cắt cụt chi.
Năm 2012, tỷ lệ mắc bệnh tiểu đường (ĐTĐ) ở người trưởng thành tại Việt Nam đạt 5.42%, trong khi tỷ lệ ĐTĐ chưa được chẩn đoán trong cộng đồng lên tới 63.6% Những số liệu này được thu thập từ cuộc điều tra STEPwise về các yếu tố nguy cơ của bệnh không lây nhiễm do Bộ Y tế thực hiện.
Y tế thực hiện năm 2015 ở nhóm từ 18-69 tuổi cho thấy tỷ lệ ĐTĐ toàn quốc là 4,1%, tiền ĐTĐ là 3,6% [1]
1.1.2 Phân loại a) Đái tháo đường tuýp 1 (do phá hủy tế bào beta tụy, dẫn đến thiếu insulin tuyệt đối) [1] Đái tháo đường tuýp 1 chiếm 5 - 10% của tất cả các trường hợp đái tháo đường do tế bào beta bị tàn phá nên bệnh nhân không còn hoặc còn rất ít insulin Trong đó, 95% là do cơ chế tự miễn (tuýp 1A), 5% vô căn (tuýp 1B) Bệnh nhân bị giảm lượng insulin, tăng glucagon trong máu, nếu không điều trị sẽ bị nhiễm toan ceton Bệnh ĐTĐ tuýp 1 có thể xảy ra ở mọi lứa tuổi nhưng chủ yếu xuất hiện từ sớm (trẻ em, thiếu niên) Bệnh nhân cần bổ sung insulin để ổn định đường huyết Người lớn
Bệnh đái tháo đường tự miễn diễn tiến chậm (LADA) có thể xuất hiện ở tuổi 2, khi bệnh nhân vẫn còn sản xuất đủ insulin, do đó chưa gặp phải tình trạng nhiễm toan ceton và có thể điều trị bằng thuốc viên Tuy nhiên, theo thời gian, tình trạng thiếu insulin sẽ ngày càng trở nên nghiêm trọng.
Di truyền của bệnh đái tháo đường tuýp 1 có những dấu ấn quan trọng, với nguy cơ con cái mắc bệnh là 3% nếu mẹ bị đái tháo đường tuýp 1 và tăng lên 6% nếu cha mắc bệnh Đặc biệt, tỷ lệ mắc đái tháo đường tuýp 1 ở hai trẻ sinh đôi cùng trứng có thể đạt từ 25% đến 50%.
Yếu tố môi trường liên quan đến đái tháo đường tuýp 1 bao gồm rubella bẩm sinh, virus quai bị, thuốc diệt chuột Vacor và hydrogen cyanide có trong rễ cây sắn Trong khi đó, đái tháo đường tuýp 2 xảy ra do giảm chức năng của tế bào β tuyến tụy trên nền tảng đề kháng insulin Đái tháo đường tuýp 2, trước đây được gọi là đái tháo đường của người lớn tuổi hay không phụ thuộc insulin, là dạng phổ biến nhất, chiếm 90-95% tổng số trường hợp và là trọng tâm nghiên cứu chính trong lĩnh vực bệnh tiểu đường.
Kháng insulin và sự suy giảm tế bào β đảo tụy là nguyên nhân chính gây ra ĐTĐ tuýp 2 Trong giai đoạn đầu, bệnh nhân thường không cần bổ sung insulin và không có sự phá hủy tế bào β do tự miễn Tình trạng kháng insulin khiến tế bào β tăng tiết insulin để bù đắp, nhưng nếu kéo dài, sẽ dẫn đến việc tế bào β không sản xuất đủ insulin, gây ra ĐTĐ tuýp 2 lâm sàng Mặc dù sự kháng insulin có thể cải thiện thông qua giảm cân hoặc sử dụng thuốc, nhưng không bao giờ trở lại mức bình thường hoàn toàn.
Tăng đường huyết, được định nghĩa là mức đường huyết lúc đói ≥ 7,0 mmol/L hoặc mức đường huyết ngẫu nhiên ≥ 11,1 mmol/L, là dấu hiệu bất thường của bệnh tiểu đường Việc đo mức đường huyết là cần thiết để sàng lọc, chẩn đoán và theo dõi bệnh tiểu đường Có bốn loại xét nghiệm để đánh giá tình trạng này: (1) xét nghiệm đường huyết lúc đói; (2) xét nghiệm dung nạp glucose đường uống; (3) xét nghiệm glucose ngẫu nhiên; và (4) xét nghiệm HbA1c, hay còn gọi là xét nghiệm hemoglobin glycated.
Hầu hết bệnh nhân mắc bệnh tiểu đường tuýp 2 thường có triệu chứng béo phì, thừa cân, và vòng eo lớn Nồng độ đường huyết cao kéo dài gây tổn hại cho nhiều hệ thống cơ quan, dẫn đến các biến chứng nghiêm trọng Những biến chứng này góp phần làm tăng tỷ lệ mắc bệnh và tử vong.
Tăng đường huyết mãn tính có thể gây tổn thương mạch máu và thần kinh, thúc đẩy sự phát triển của bệnh tim mạch (CVD) và dẫn đến các vấn đề nghiêm trọng như mất thị lực và suy thận Bệnh võng mạc do tiểu đường là nguyên nhân hàng đầu gây mù có thể phòng ngừa, trong khi bệnh thận do tiểu đường là nguyên nhân chính gây ra bệnh thận Do đó, kiểm soát mức đường huyết là mục tiêu quan trọng trong điều trị bệnh tiểu đường, nhằm giảm thiểu nguy cơ phát triển các biến chứng mãn tính.
Nguy cơ mắc bệnh tiểu đường tuýp 2 gia tăng theo độ tuổi, béo phì và lối sống ít vận động Bệnh này thường gặp ở phụ nữ có tiền sử tiểu đường thai kỳ, người bị tăng huyết áp, rối loạn lipid máu, và một số nhóm sắc tộc nhạy cảm như người Mỹ da đen, người Mỹ bản địa, người Mỹ gốc La tinh, người gốc Á, dân châu Mỹ La tinh, cùng với những người gốc Nam Á và cư dân một số đảo vùng Thái Bình Dương.
Yếu tố di truyền đóng vai trò quan trọng trong bệnh tiểu đường tuýp 2, với tỉ lệ mắc bệnh lên đến 90% ở những người sinh đôi cùng trứng Hầu hết bệnh nhân tiểu đường tuýp 2 có người thân cũng mắc bệnh này, cho thấy sự ảnh hưởng của nhiều gen trong quá trình phát triển bệnh Nếu xác định được một gen cụ thể liên quan đến tăng glucose huyết, bệnh nhân sẽ được phân loại vào thể bệnh chuyên biệt của tiểu đường.
Bệnh tiểu đường tuýp 2 phát sinh từ sự tương tác giữa yếu tố di truyền và các yếu tố môi trường như béo phì, chế độ ăn uống không lành mạnh và lối sống ít vận động Ngoài ra, đái tháo đường thai kỳ được chẩn đoán trong giai đoạn giữa hoặc cuối thai kỳ, không có dấu hiệu của đái tháo đường tuýp 1 hoặc tuýp 2 trước đó.
ĐTĐ thai kỳ là tình trạng rối loạn đường huyết được chẩn đoán trong 3 tháng giữa hoặc cuối của thai kỳ, không có tiền sử ĐTĐ tuýp 1 hay tuýp 2 Sau khi sinh, hầu hết phụ nữ sẽ trở lại mức glucose máu bình thường, tuy nhiên, một số ít có thể phát triển thành ĐTĐ tuýp 2.
Mô hình in silico trong nghiên cứu phát triển thuốc mới
Phát triển thuốc mới là một quá trình phức tạp, đòi hỏi nhiều thời gian và chi phí lớn, với mức đầu tư lên tới hàng tỷ đô la cho mỗi loại thuốc Tỷ lệ thành công trong việc đưa thuốc ra thị trường thường rất thấp, làm cho ngành dược phẩm trở thành một lĩnh vực đầy thách thức.
Chỉ có 9 từ một hợp chất dẫn đường ban đầu được thương mại hóa, với tỷ lệ dưới 2% các hợp chất mới nghiên cứu có khả năng sinh học phù hợp để làm thuốc Theo nghiên cứu năm 2016 của DiMasi và cộng sự từ Trung tâm nghiên cứu và phát triển thuốc, Đại học Tufts Hoa Kỳ, trung bình cần hơn 2,5 tỷ đô la và thời gian từ 10-15 năm cho mỗi dự án (nếu thành công) để đưa một loại thuốc ra thị trường.
Quá trình nghiên cứu và phát triển thuốc bao gồm nhiều bước quan trọng, bắt đầu từ việc xác định bệnh và đích tác dụng của thuốc Tiếp theo, các nhà nghiên cứu thiết lập quy trình thử nghiệm, tìm kiếm hợp chất dẫn đường, và xây dựng mối quan hệ giữa hợp chất và tác dụng Việc xác định pharmacophore, tối ưu hóa dược lực học và dược động học cũng là những bước thiết yếu Sau đó, sàng lọc in vitro và nghiên cứu in vivo sẽ diễn ra, bao gồm nghiên cứu dược lý, mô hình hiệu quả điều trị bệnh, và đánh giá độ an toàn cũng như độc tính Cuối cùng, các nghiên cứu tiền lâm sàng, bào chế, phát triển sản xuất, đăng ký giấy tờ pháp lý và thử nghiệm lâm sàng là những bước cuối cùng trong quy trình phát triển thuốc.
Hình 1.1 Quá trình nghiên cứu phát triển thuốc
Trong nghiên cứu hiện nay, thiết kế thuốc hiệu quả được cải thiện nhờ vào kỹ thuật thiết kế thuốc hỗ trợ bởi máy tính Máy tính được áp dụng trong nhiều giai đoạn, từ việc tìm kiếm các hợp chất hóa học có tác dụng sinh học đến tối ưu hóa cấu trúc của chúng nhằm nâng cao hoạt tính sinh học, giảm độc tính và cải thiện các đặc tính dược động học Các phương pháp này được gọi là “in silico”, nhằm phân biệt với các phương pháp truyền thống khác.
Các phương pháp in silico, như vivo, in situ và in vitro, mang lại nhiều ưu điểm vượt trội so với các phương pháp thực nghiệm truyền thống Chúng giúp thiết kế các phân tử thuốc mới hiệu quả hơn, giải thích rõ ràng bản chất phân tử của các tương tác thuốc và rút ngắn thời gian thực hiện.
Các mô hình toán học cho phép dự đoán hoạt tính sinh học, cơ chế tác dụng và độc tính của các hợp chất, giúp tiết kiệm thời gian và chi phí trong phát triển thuốc mới Phương pháp in silico đã hỗ trợ đáng kể trong việc phát hiện các hợp chất có hoạt tính sinh học thông qua quá trình sàng lọc ảo trước khi chúng được tổng hợp hoặc phân lập.
Đại cương về QSAR
Các mô hình liên quan định lượng cấu trúc và tác dụng (Quantitative
QSAR (Quantitative Structure-Activity Relationship) là một kỹ thuật dự đoán hoạt động và tính chất của các phân tử chưa biết thông qua phân tích mối liên hệ giữa cấu trúc và hoạt động của chúng Nguyên lý cơ bản của QSAR là mỗi phân tử chứa các yếu tố quyết định đặc tính sinh học, vật lý và hóa lý Các hợp chất có cấu trúc tương tự thường có hoạt tính tương tự, và các đặc điểm hóa học có thể được xác định từ lý thuyết hoặc thực nghiệm, như nhiệt độ bay hơi và khối lượng mol phân tử Do đó, bất kỳ yếu tố nào chứa thông tin hóa học quan trọng đều có thể được sử dụng làm biến dự báo hoặc tham số mô tả.
Các đặc tính lý hóa như nhiệt độ nóng chảy, thời gian bán hủy và sức căng bề mặt cung cấp thông tin quan trọng để giải thích các đáp ứng liên quan đến hợp chất Mô hình QSAR cho phép biểu diễn mối tương quan định lượng giữa cấu trúc phân tử và hoạt tính sinh học của chúng thông qua một hàm số.
Y là một biến đáp ứng sinh học hoặc hóa học được xác định thông qua các thí nghiệm, thường được thể hiện bằng các giá trị như nồng độ ức chế 50% (IC 50), nồng độ phần trăm ức chế (I%), và nồng độ 50% tác dụng tối đa (EC 50).
Các biến X1, X2,…Xn là các tham số phân tử (molecular descriptor, TSPT) được sử dụng để mô tả cấu trúc phân tử của hợp chất Để xây dựng hàm f(x), cần áp dụng các kỹ thuật thống kê hoặc học máy Một số kỹ thuật phổ biến trong mô hình QSAR bao gồm phân tích hồi quy đa biến tuyến tính, bình phương tối thiểu từng phần và phân tích thành phần chính Học máy, một lĩnh vực của trí tuệ nhân tạo, cho phép các hệ thống tự động học từ dữ liệu để giải quyết các vấn đề cụ thể Trong thiết kế mô hình QSAR, các phương pháp học máy thường được sử dụng bao gồm mạng nơron nhân tạo và cây quyết định Các bước xây dựng mô hình QSAR bao gồm nhiều quy trình quan trọng.
1) Xây dựng cơ sở dữ liệu (CSDL);
2) Tính toán TSPT đặc trưng cho cấu trúc bằng sử dụng các phần mềm giúp biểu diễn và tính toán;
3) Xây dựng mô hình QSAR: Sử dụng các phương pháp xác suất thống kê và các kỹ thuật của trí tuệ nhân tạo để xây dựng mối liên hệ giữa các tham số phân tử (TSPT) và các giá trị đại lượng biểu diễn hoạt tính;
5) Giải thích các kết quả và sử dụng mô hình trong quá trình sàng lọc ảo (nếu có thể)
Xây dựng cơ sở dữ liệu (CSDL) cho các hợp chất hóa học có hoạt tính sinh học in vitro là rất quan trọng Để giảm thiểu sai số trong mô hình, CSDL cần được làm sạch dựa trên sự tương đồng về cấu trúc và quy trình Các giá trị sinh học trong CSDL được điều chỉnh để đảm bảo tính đại diện và ý nghĩa thống kê.
Tính toán các tham số mô tả phân tử là quá trình chuyển đổi thông tin cấu trúc hóa học thành dạng số, giúp máy tính có khả năng "hiểu" và phân tích cấu trúc đó một cách chính xác.
Thiết kế tập huấn luyện và tập kiểm tra: CSDL được chia thành tập huấn luyện
(TS-Training set) chiếm khoảng 70-80 %, được sử dụng để xây dựng mô hình và
12 tập kiểm tra (PS-Prediction set) để đánh giá khả năng dự đoán của các mô hình đã xây dựng được
Xây dựng mô hình QSAR liên quan đến việc áp dụng các phương pháp xác suất thống kê và trí tuệ nhân tạo để thiết lập mối quan hệ giữa các tham số phân tử và giá trị hoạt tính Đánh giá mô hình là một giai đoạn quan trọng, đảm bảo khả năng ứng dụng của nó, bao gồm việc kiểm tra độ khớp và độ ổn định thông qua đánh giá nội trên tập dữ liệu huấn luyện, cũng như khả năng dự đoán chính xác trên tập dữ liệu kiểm tra.
Để đánh giá mô hình QSAR, các phương pháp thống kê phổ biến bao gồm đánh giá nội, đánh giá chéo, đánh giá ngẫu nhiên Y, và đánh giá ngoại Các phương pháp này thường liên quan đến việc chia tệp dữ liệu thành các hợp chất để huấn luyện và kiểm tra, cũng như áp dụng mô hình trên tập dữ liệu ngoại để kiểm tra độ chính xác của nó.
Kỹ thuật Protein docking
Docking phân tử là một phương pháp hiện đại để sàng lọc chất ức chế enzyme và chất chủ vận thụ thể trong nghiên cứu bệnh tiểu đường Phần mềm chuyên dụng sử dụng mô hình phân tử ba chiều, độ phân giải cao của protein mục tiêu để dự đoán các phối tử mới có khả năng liên kết và điều chỉnh hoạt động của nó Cấu trúc khuôn mẫu được xây dựng thông qua mô hình tương đồng hoặc tinh thể học Trong quá trình docking, mục tiêu phân tử có thể hoạt động theo nhiều hướng khác nhau, cho phép phần mềm sàng lọc cơ sở dữ liệu một cách hiệu quả Các chức năng chấm điểm tích hợp giúp dự đoán hoạt động sinh học dựa trên sự tương tác giữa phối tử và protein mục tiêu, xem xét các yếu tố quan trọng như hình dạng phối tử, khả năng tương thích tĩnh điện, năng lượng liên kết, và hiệu ứng entanpy và entropy, tất cả đều là những yếu tố quyết định cho sự thành công của tương tác phối tử - thụ thể.
Docking là một bài toán tối ưu nhằm xác định vị trí và cấu hình lý tưởng cho cơ chất gắn kết với protein Mục tiêu chính của quá trình này là tìm ra cấu hình với năng lượng tự do thấp nhất, tương ứng với cấu hình bền nhất khi phối tử liên kết với protein Để đạt được cấu hình tối ưu, cần liên kết cấu hình không gian với các chỉ số đánh giá khả năng gắn kết của cơ chất và áp dụng các thuật toán tìm kiếm thích hợp.
Quá trình docking bao gồm ba bước chính:
Chuẩn bị cấu tử: Cấu trúc các cấu tử có thể lấy từ các thư viện sẵn có như
Các phần mềm như ChemDraw và Chemsketch cho phép vẽ cấu trúc hóa học từ các nguồn như Pubchem và Zinc Sau khi tạo ra cấu trúc 3D, phần mềm MOE được sử dụng để xử lý cấu trúc, bao gồm các bước như chỉnh sửa điện tích, tối giản hóa năng lượng, gắn trường lực cho phân tử và xây dựng file dbpqt.
Để chuẩn bị protein, chúng ta thường sử dụng các cấu trúc 3D có sẵn từ ngân hàng dữ liệu protein Nếu không có sẵn, có thể xây dựng cấu trúc 3D thông qua phương pháp mô phỏng tính tương đồng (Homology modeling) Phương pháp này chủ yếu dựa vào việc sắp xếp chuỗi amino acid của protein đã được giải mã gen lên khung cấu trúc bậc 3 có độ phân giải cao, mặc dù thiếu thông tin về toàn bộ amino acid.
Sau khi xác định được cấu trúc 3D của protein, bước tiếp theo là sử dụng phần mềm để chuẩn bị cho chương trình mô phỏng docking Các bước chuẩn bị bao gồm loại bỏ nước và các thành phần không cần thiết, thêm nguyên tử hydro, gắn trường lực, phân tích các vùng có khả năng tương tác, và cuối cùng là xây dựng file dbqpt.
Mô phỏng docking là quá trình quan trọng trong nghiên cứu tương tác giữa protein và phối tử Trước khi thực hiện mô phỏng, cần sử dụng phần mềm để xác định các túi tương tác trên protein, thường tập trung ở trung tâm hoạt động của nó Trong quá trình docking, phần mềm sẽ tự động tìm kiếm cấu hình phù hợp nhất của phối tử, nhằm đạt được năng lượng toàn hệ thấp nhất Kết quả cấu hình này cùng với các tương tác sẽ được phân tích thông qua các phần mềm chuyên dụng như MOE và Discovery Studio.
NGUYÊN LIỆU, THIẾT BỊ, NỘI DUNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU
Nguyên liệu
2.1.1 Dữ liệu các chất có hoạt tính dùng để xây dựng mô hình QSAR
Gồm 110 hợp chất có hoạt tính ức chế SGLT2 được thu thập trực tiếp từ nghiên cứu của Chunlei Tang và cộng sự [54] (Phụ lục 1)
Hoạt tính in vitro được biểu thị bằng nồng độ ức chế 50% (IC50) chất chủ vận
Cấu trúc hóa học và hoạt tính của 88 hợp chất đối với PPARγ đã được thu thập từ nghiên cứu của Al-Najjar và cộng sự [64] (Phụ lục 2).
Cấu trúc khung của các hợp chất được trình bày trong Hình 2.1 Hoạt tính in vitro được xác định qua nồng độ chất thử có khả năng ức chế 50% lượng chất chủ vận được đánh dấu huỳnh quang trong trạng thái kích thích PPARγ.
Các thành phần dữ liệu đều chia thành tập huấn luyện và tập kiểm tra: Trong đó tập kiểm tra chiếm 20% được chọn một cách ngẫu nhiên
Hình 2.1 Cấu trúc khung các chất chủ vận PPARγ trong cơ sở dữ liệu
2.1.2 Dữ liệu các chất có hoạt tính dùng để xây dựng mô hình phân biệt
CSDL chứa 82 hợp chất với thông tin chi tiết về cấu trúc và tác dụng, được tổng hợp từ các nghiên cứu trong nước và quốc tế, cho thấy hiệu quả điều trị bệnh tiểu đường trên các mô hình động vật (Phụ lục 3).
2.1.3 Cơ sở dữ liệu dùng để sàng lọc hoạt tính
Cơ sở dữ liệu ChemBl đã tổng hợp các hợp chất từ tự nhiên, bao gồm những hợp chất đã được phân lập và xác định cấu trúc trong các nghiên cứu trước đây.
Thư viện dữ liệu hóa học sử dụng trong nghiên cứu bao gồm 758 hợp chất thiên nhiên với các thông tin liên quan
2.1.4 Cấu trúc tinh thể của các protein dùng trong nghiên cứu Docking
Cấu trúc 3D của protein được tải từ ngân hàng dữ liệu protein (Protein Data Bank) và được xử lý kỹ lưỡng trước khi sử dụng trong quá trình sàng lọc.
Hình 2.2 Cấu trúc 3D của thụ thể kích hoạt peroxisome proliferator-γ
Hình 2.3 Cấu trúc 3D của Protein đồng vận chuyển Natri - glucose 2
Thiết bị, phần mềm
Thiết bị : Sử dụng các phần mềm trên máy tính Asus Vivobook S14 – Hệ điều hành
Phần mềm: Danh sách các phần mềm sử dụng bao gồm:
- Phần mềm lưu trữ, hiệu chỉnh số liệu: Microsoft Excel 2010
- Phần mềm xây dựng cấu trúc hóa học: ChemDraw Professional bản 16.0
- Phần mềm tính toán tham số phân tử: Dragon 6.0
- Phần mềm xây dựng và tối ưu hóa mô hình QSAR: Statistica 12.0.5, và QSAR - MobyDigs
- Phần mềm mô phỏng Docking: gói ICM Pro bản 3.8-6 (Molsoft L.L.C.), phần mềm Autodock vina 1.1.2
- Phần mềm phân tích và biểu diễn tương tác: MGLtools 1.5.7, MOE bản 2009.10
The article discusses software for studying the physicochemical properties and pharmacokinetics and toxicity, specifically focusing on ADMET (Absorption, Distribution, Metabolism, Excretion, and Toxicity) Key tools mentioned include Volsurf version 1.0.4, Toxtree version 3.1.0, as well as online resources such as AdmetSAR version 2.0 and SwissADME.
Nội dung nghiên cứu
1 Xây dựng thư viện dữ liệu các hợp chất và tính toán các tham số phân tử
2 Xây dựng mô hình QSAR của các hợp chất có tác dụng ức chế SGLT2 và mô hình QSAR của các hợp chất có tác dụng hoạt hóa PPARγ
3 Xây dựng mô hình QSAR thể hiện mối tương quan giữa cấu trúc và tác dụng in vivo
4 Tiến hành sàng lọc tìm kiếm các hợp chất tự nhiên có hoạt tính sinh học đồng thời trên cả hai đích SGLT2 và PPARγ
5 Nghiên cứu Docking để đánh giá mức độ tương tác với trung tâm hoạt động trên đích tác dụng của các chất đã sàng lọc
6 Kiểm tra các chất đã sàng lọc trên mô hình QSAR thể hiện mối tương quan giữa cấu trúc và tác dụng in vivo để tìm kiếm được các hợp chất tự nhiên ở Việt
Nam có khả năng cao có tác dụng điều trị bệnh ĐTĐ tuýp 2 trên mô hình in vivo.
Phương pháp nghiên cứu
Nghiên cứu này áp dụng phương pháp sàng lọc ảo thông qua hệ thống phễu lọc, được thiết kế dựa trên tác dụng sinh học của các hợp chất đối với từng mục tiêu phân tử Quy trình bao gồm nhiều bước để đảm bảo tính chính xác và hiệu quả trong việc xác định các hợp chất tiềm năng.
- Xây dựng mô hình QSAR dự đoán hoạt tính trên các đích ĐTĐ tuýp 2 đã chọn
- Sàng lọc in silico các hợp chất thiên nhiên hướng tác dụng trên đích ĐTĐ tuýp 2: PPARγ và SGLT2
- Mô phỏng protein docking để đánh giá khả năng liên kết trong không gian của các cấu tử với đích tác dụng
Kiểm tra các chất đã được sàng lọc trên mô hình QSAR giúp phân biệt các hợp chất có hoạt tính in vivo và không có hoạt tính in vivo.
Quá trình nghiên cứu đề tài tìm kiếm các hợp chất thiên nhiên có tác dụng điều trị ĐTĐ tuýp 2, tập trung vào các đích PPARγ và SGLT2, được thực hiện thông qua mô hình in silico và in vivo.
2.4.1 Xây dựng mô hình QSAR dự đoán hoạt tính trên các đích ĐTĐ tuýp 2 đã chọn
Quy trình này tương tự cho các đích khác nhau, bao gồm:
1) Cơ chế ức chế SGLT2 ;
2) Cơ chế kích hoạt PPARγ ;
3) Có tác dụng trên các mô hình in vivo
Các bước tiến hành như sau:
- Bước 1 Thu thập dữ liệu độc tính tế bào
Trong bước này, các cơ sở dữ liệu (CSDL) được thu thập từ các công bố thực nghiệm và được xử lý để phân loại thành hai nhóm: có và không có hoạt tính (biến Y) Việc này hỗ trợ cho quá trình xây dựng mô hình QSAR Để giảm thiểu sai số cho mô hình, cơ sở dữ liệu thường được làm sạch dựa trên sự tương đồng về cấu trúc và protocol.
Sử dụng phần mềm Chemdraw Professional 16.0 để vẽ lại các công thức 2D và 3D
- Bước 2 Tính toán tham số phân tử đặc trưng cho cấu trúc các chất trong cơ sở dữ liệu:
Số lượng tham số phân tử mà phần mềm tính toán càng nhiều thì càng mô tả chính xác cấu trúc của hợp chất [2]
Bảng 2.1 Các phần mềm tính tham số phân tử thông dụng
Loại tham số tính đƣợc Số lƣợng tham số
1 ADAPT Tham số cấu trúc hình học, hình học tô pô, tham số điện tử, tham số lí hoá
Tham số điện tử, tham số hàm lượng tử, tham số hình học tô pô
3 MOE Tham số hình học topo, tính chất vật lý
4 Dragon Tham số cấu tạo cơ bản, tham số cấu trúc hình học và hình học tô pô
Để tính toán dãy tham số phân tử của các hợp chất, cần tổng hợp chúng thành cơ sở dữ liệu (CSDL) với công thức viết dưới dạng SMILES Sau đó, phần mềm Dragon 6.0 được sử dụng để tính toán các tham số phân tử, cho phép tính toán lên đến 5270 tham số.
- Bước 3 Xây dựng mô hình QSAR trên từng đích phân tử với dạng tổng quát :
Xi là các TSPT được lựa chọn vào mô hình;
IC50 của các hợp chất được xác định thông qua phần mềm MobyDigs, sử dụng các phương pháp xác suất thống kê và kỹ thuật trí tuệ nhân tạo Phần mềm này giúp xây dựng mối liên hệ giữa các tham số phân tử và giá trị đại lượng biểu diễn hoạt tính.
CSDL được chia thành hai phần: tập huấn luyện (TrS) chiếm 80% và tập kiểm tra (TS) Tập TrS được sử dụng để huấn luyện mô hình và phát hiện mối quan hệ dự đoán, trong khi tập TS gồm các phân tử chưa từng xuất hiện trong TrS, giúp đánh giá khả năng ngoại suy của mô hình Để xây dựng mô hình, phương pháp hồi quy tuyến tính đa biến (MLR) được áp dụng, với các mô hình MLR được phát triển thông qua thuật giải di truyền trên phần mềm Mobydigs.
- Bước 4 Đánh giá các mô hình xây dựng được
Các mô hình đã xây dựng được đánh giá dựa trên các tiêu chí [67], bao gồm:
1 Có đích cụ thể: Đích là những giá trị thực nghiệm về hoạt tính sinh học thu được tư cơ sở dữ liệu Nếu toàn bộ CSDL đều sử dụng một protocol để xác định giá trị của đích, thì mô hình xây dựng được có độ tin cậy cao, có thể dùng để dự đoán hoạt tính các hợp chất mới (nếu thực nghiệm dùng theo quy trình này) Còn nếu CSDL sử dụng nhiều protocol khác nhau thì mô hình sẽ không có độ tin cậy cao [2]
Các thuật toán được sử dụng trong việc xây dựng mô hình cần được mô tả một cách rõ ràng và có khả năng áp dụng cho việc phát triển các mô hình khác Khi đánh giá thuật toán, cần xem xét các yếu tố quan trọng để đảm bảo tính hiệu quả và khả năng ứng dụng của chúng.
Dữ liệu về cấu trúc, hoạt tính sinh học đầy đủ, rõ ràng
Thuật toán tính toán các tham số phân tử rõ ràng
Mô tả về tập huấn luyện và tập quan sát, cách xác định giá trị ngoại lai (outlier)
Mô tả thuật toán xây dựng mô hình
Mô tả các thông số thống kê đánh giá mô hình
3 Miền cấu trúc ứng dụng xác định [2]
Miền cấu trúc ứng dụng là không gian cấu trúc được xác định bởi các hợp chất trong tập huấn luyện để xây dựng mô hình Nếu các hợp chất trong tập huấn luyện có cấu trúc nằm ngoài miền này, độ chính xác của mô hình sẽ bị ảnh hưởng Tương tự, các hợp chất trong tập dự đoán với cấu trúc nằm ngoài miền cấu trúc ứng dụng cũng sẽ dẫn đến kết quả dự đoán không chính xác.
4 Có thước đo phù hợp để đánh giá độ chính xác, độ bền vững, khả năng dự đoán Các thông số được đánh giá gồm: R 2 , Q 2 , Q 2 ext
Độ khớp hay độ tuyến tính được đánh giá thông qua giá hệ số xác định R 2 ,
Hệ số xác định R² phản ánh mức độ khớp tuyến tính giữa mô hình và các giá trị thực nghiệm; khi R² càng cao, mức độ khớp càng tốt Một mô hình chỉ được coi là có ý nghĩa khi R² lớn hơn 0,6 Công thức tính R² được áp dụng để đánh giá độ phù hợp của mô hình.
Trong đó n là số các quan sát của tập huấn luyện; yi,
^ y, lần lượt là giá trị thực tế, giá trị dự đoán của biến phụ thuộc ở quan sát thứ i; y là giá trị thực tế trung bình của biến phụ thuộc
Độ ổn định của mô hình được đánh giá qua hệ số tương quan chéo Q2, được xác định thông qua phương pháp tham số chéo (cross validation leave one out) Phương pháp này loại bỏ lần lượt một quan sát khỏi tập huấn luyện, giữ nguyên các biến đã chọn và tính toán lại các thông số của mô hình Nếu Q2 gần 1, mô hình có tính tổng quát hóa cao và ổn định hơn Thông thường, yêu cầu Q2 phải lớn hơn 0,5 để mô hình được coi là bền vững Công thức tính hệ số tương quan chéo được áp dụng để đánh giá này.
Trong đó n là số các quan sát tập huấn luyện; yi, là giá trị thực tế của quan sát thứ i;
/i y i giá trị dự đoán của biến phụ thuộc ở quan sát thứ i sử dụng mô hình đã loại biến i; y là giá trị thực tế trung bình của biến phụ thuộc
Khả năng dự đoán ngoại
Khả năng dự đoán của mô hình được đánh giá thông qua giá trị Q² ext; giá trị này càng lớn, chứng tỏ độ tuyến tính của tập kiểm tra cao và khả năng dự đoán của mô hình cũng được nâng cao.
Trong đó n là số các quan sát tấp kiểm tra; yi,
^ y, lần lượt là giá trị thực tế, giá trị dự đoán của biến phụ thuộc ở quan sát thứ i; y là giá trị thực tế trung bình của biến phụ thuộc
5 Giải thích cơ chế tác dụng nếu có thể
Mô hình cần được làm rõ vai trò của các biến để hướng dẫn thiết kế hợp chất mới, nhưng việc giải thích các biến này thường gặp khó khăn do cơ chế phức tạp yêu cầu kiến thức sâu về hóa lượng tử Hơn nữa, nhiều biến vẫn thiếu tài liệu tham khảo, dẫn đến việc chưa có đủ cơ sở để đưa ra giải thích.
- Bước 5 Diễn giải và áp dụng mô hình xây dựng được
Các tham số phân tử được phân tích để xác định các yếu tố cấu trúc quan trọng ảnh hưởng đến hoạt tính sinh học Sau khi đánh giá và giải thích, mô hình được sử dụng để thể hiện mối quan hệ giữa cấu trúc của các hợp chất và hoạt tính của chúng.
2.4.2 Sàng lọc in silico các hợp chất thiên nhiên hướng tác dụng trên đích ĐTĐ tuýp 2: PPARγ và SGLT2
KẾT QUẢ VÀ BÀN LUẬN
Kết quả nghiên cứu
3.1.1 Kết quả xây dựng hai mô hình QSAR trên phần mềm MobyDigs cho phép tìm kiếm các hợp chất có tác dụng sinh học trên từng đích phân tử là PPARγ và SGLT2 hướng điều trị ĐTĐ tuýp 2
Cài đặt các thông số với mỗi mô hình:
- Y : là giá trị IC50 (nM)
- Các tham số phân tử còn lại là X
- Mô hình QSAR trên đích PPARγ xây dựng được gồm 8 biến như sau: log (1+Y) = 12.61522 - 8.30244 * SM1_Dz + 0.01569 * ATSC7s +
- Mô hình QSAR trên đích SGLT2 xây dựng được gồm 8 biến như sau: log (1+Y) = -3.20292 + 2.2232 * Eig09_EA(bo) - 2.98868 * Eig14_AEA(ed)
3.1.2 Kết quả sàng lọc đƣợc một số hợp chất thiên nhiên có tác dụng điều trị tiểu đường tuýp 2 sử dụng hai mô hình QSAR đã xây dựng
Sau khi sàng lọc 758 hợp chất qua hai mô hình QSAR đã xây dựng ta thu được
21 hợp chất cùng cho tác dụng sinh học tốt trên hai đích phân tử PPARγ và SGLT2
Bảng 3.1 Các hợp chất có tác dựng đồng thời trên 2 đích phân tử là PPARγ và
(S) -2- (4- Hydroxy-3- (3- metylbut-2-en-1- yl) phenyl) chroman-7-ol
3.1.3 Kết quả kiểm tra tác dụng của các hợp chất đã sàng lọc qua mô hình in vivo
Qua kiểm tra 21 hợp chất tự nhiên, 4 hợp chất được dự đoán có hoạt tính in vivo, bao gồm: 7-Hydroxyflavanone, 4',5-Dihydroxyflavone, và 7-Hydroxyflavone.
Bảng 3.2 Các hợp chất được dự đoán là có hoạt tính in vivo
Tên hợp chất Score-PPAR Score-
Bàn luận
3.2.1 Đánh giá kết quả xây dựng hai mô hình QSAR trên phần mềm MobyDigs cho phép tìm kiếm các hợp chất có tác dụng sinh học trên từng đích phân tử là PPARγ và SGLT2 hướng điều trị ĐTĐ tuýp 2
Tất cả dữ liệu được sử dụng đều dựa trên nồng độ ức chế 50% (IC50) và được thực hiện trong cùng một điều kiện thí nghiệm thông qua phần mềm MobyDigs.
Các phương pháp xây dựng mô hình trong nghiên cứu, được trình bày ở phần 2.4, cho phép sử dụng lặp lại các mô hình này để phát hiện các hợp chất mới có tác dụng sinh học đối với hai mục tiêu PPARγ và SGLT2 nhờ tính rõ ràng và chính xác của chúng.
Tiêu chí 3 : Xác định miền ứng dụng của mô hình:
Các hợp chất trong cả tập huấn luyện và tập kiểm tra đều thuộc miền ứng dụng của mô hình, cho thấy mô hình có khả năng dự đoán hiệu quả.
Tiêu chí 4 : Kết quả các đánh giá về độ chính xác, độ bền vững và khả năng đánh giá ngoại của mô hình
Hình 3.1 Khả năng kích thích thực tế so với số liệu tính toán của tập dữ liệu các chất kích hoạt PPARγ
(Ghi chú: màu xanh là phần của tập huấn luyện, màu đỏ là phần của tập kiểm tra)
Hình 3.2 Khả năng ức chế thực tế so với số liệu tính toán của tập dữ liệu các chất ức chế SGLT2
(Ghi chú: màu xanh là phần của tập huấn luyện, màu đỏ là phần của tập kiểm tra)
Bảng 3.3 Kết quả đánh giá nội và đánh ngoại mô hình QSAR
Mô hình đạt R² = 1,0, cho thấy độ chính xác cao, trong khi Q² > 0.5 chứng tỏ độ ổn định tốt Khả năng dự đoán ngoại > 0.6 cho thấy mô hình có khả năng dự đoán hoạt tính hiệu quả.
Như vậy mô hình thoả mãn các tiêu chí đánh giá nội và ngoại về độ chính xác, độ ổn định và khả năng dự đoán tốt
Cả hai mô hình đều có:
- R 2 > 0.6: mô hình có độ chính xác cao
- Q 2 > 0.5: thể hiện mô hình bền vững có khả năng dự đoán các thí nghiệm trong tương lai tốt
- Q 2 ext > 0.6 cho thấy mô hình có khả năng dự đoán ngoại tốt
Mô hình này đáp ứng các tiêu chí đánh giá về độ chính xác, độ ổn định và khả năng dự đoán, cho phép ứng dụng hiệu quả trong việc dự đoán hoạt tính sinh học của các hợp chất thiết kế.
Tiêu chí 5 : Giải thích cơ chế của mô hình Ý nghĩa của các tham số phân tử trong 2 mô hình QSAR thể hiện ở Bảng 3.4 và
Bảng 3.4: Bảng ý nghĩa các của các tham số phân tử trong mô hình QSAR trên đích PPARγ
SM1_Dz(Z) Mô men phổ của bậc 1 từ ma trận
Barysz có trọng số bằng số nguyên tử
Mô tả dựa trên ma trận 2D
ATSC7s Trung tâm tự tương quan Broto-
Moreau của độ trễ 7 trọng số theo trạng thái I
Mô tả dựa trên ma trận 2D
GATS7s Tương quan tự động của độ trễ 7 trọng số theo trạng thái I
Mô tả dựa trên ma trận 2D
SpMax3_Bh(p) Giá trị lớn nhất n 3 của ma trận
Burden có trọng số phân cực
Eig11_EA(dm) Giá trị riêng n 11 từ giá trị cạnh kề trọng số kể từ thời điểm lưỡng cực
T(N F) Tổng khoảng cách tôpô giữa N F Cặp nguyên tử
B07[N-F] Sự hiện diện / vắng mặt của N - F ở khoảng cách tôpô 7
F08[O-F] Tần số O - F ở khoảng cách tôpô 8 Cặp nguyên tử
Bảng 3.5: Bảng ý nghĩa các của các tham số phân tử trong mô hình QSAR trên đích SGLT2
Eig09_EA(bo) Giá trị riêng n 9 từ giá trị cạnh kề trọng số theo thứ tự từ trài sang
Eig14_AEA(ed) giá trị riêng n 14 từ thời điểm tăng cường trọng số theo mức độ cạnh
C-015 = CH2 Các mảnh trung tâm nguyên tử
NaaaC Số nguyên tử loại aaaC Chỉ số nhà nước điện tử
B08[O-O] Sự hiện diện / vắng mặt của O - O ở khoảng cách tôpô 8
B10[N-S] Sự hiện diện / vắng mặt của N - S ở khoảng cách tôpô 10
F03[C-N] Tần số C - N ở khoảng cách tôpô 3 Cặp nguyên tử
F03[C-O] Tần số C - O ở khoảng cách tôpô 3 Cặp nguyên tử
Cả hai mô hình QSAR sử dụng 8 biến, chủ yếu là các tham số phân tử 2D, cho thấy tầm quan trọng của thông tin cấu trúc 2D trong việc xác định hoạt tính sinh học đối với PPARγ và SGLT2.
Các tham số có hệ số dương cho thấy khả năng tăng cường ức chế của chúng trên đích SGLT2 và giảm khả năng ức chế trên đích PPARγ Ví dụ, B10[N-S] có thể nhận giá trị 1 hoặc 0 tùy thuộc vào sự hiện diện của khoảng cách giữa hai nguyên tử Nitơ và lưu huỳnh là 10 liên kết (C-C) Hệ số B10[N-S] mang dấu ( ) và nếu giá trị này bằng 0, sẽ làm tăng hoạt tính ức chế trên SGLT2.
Mô hình này đáp ứng đầy đủ các tiêu chí đánh giá của OECD, vì vậy có thể áp dụng để dự đoán hoạt tính sinh học của các hợp chất được thiết kế.
3.2.2 Về các hợp chất đã sàng lọc theo hai mô hình QSAR đã xây dựng
Sau khi sàng lọc 758 hợp chất qua hai mô hình QSAR, chúng tôi đã xác định được 21 hợp chất có tác dụng sinh học tốt trên hai đích phân tử SGLT2 và PPARγ Các hợp chất này đã được kiểm tra khả năng tương thích với đích phân tử thông qua phương pháp Docking Bảng 3.6 trình bày giá trị Score tốt nhất của 21 hợp chất, trong đó giá trị Score càng nhỏ cho thấy khả năng liên kết với đích phân tử càng cao, tỷ lệ thuận với mức năng lượng.
Bảng 3.6 Giá trị Score của các hợp chất trong Docking trên 2 đích phân tử
STT Tên hợp chất Score_PPARγ Score_SGLT2
8 (S) -2- (4-Hydroxy-3- (3- metylbut-2-en-1-yl) phenyl) chroman-7-ol
3.2.3 Đánh giá lại tác dụng của các hợp chất đã sàng lọc qua mô hình máy tính in vivo
Kết quả từ việc Docking cho thấy 7-Hydroxyflavanone có khả năng liên kết tốt nhất với protein PPARγ, trong khi 4', 5-Dihydroxyflavone thể hiện khả năng gắn kết mạnh mẽ nhất với mục tiêu SGLT2.
Bảng 3.7 Kết quả Docking của 4 hợp chất đã sàng lọc được trên đích PPARγ
Bảng 3.8 Kết quả Docking của 4 hợp chất đã sàng lọc được trên đích SGLT2
Một số thông tin về các hợp chất trong các tài liệu y văn:
Bảng 3.9 Một số thông tin về các hợp chất thu được sau quá trình sàng lọc
Tên hợp chất Dược liệu chứa hợp chất
Các hoạt tính đã được nghiên cứu TLTK
Zuccagnia puncata Cav (Fabace ae) Điều trị nhiễm trùng đường hô hấp mới
Spatholobus Suberectus Ức chế proteasome 20S [49]
4 ', 5-Dihydroxyflavone là chất ức chế men đậu nành LOX-1 và men α-Glucosidase, với Ki là 102,6 M đối với LOX-1 đậu nành và IC50 là 66 μM đối với men α- glucosidase
7-Hydroxyflavone là chất ức chế mạnh CYP1A1 với giá trị Ki là 0,015 M và thể hiện tính chọn lọc cao hơn gấp 6 lần đối với
CYP1A1 và CYP1A2 đều có đặc tính chống oxy hóa, chống viêm và chống tăng sinh, cho thấy tiềm năng bảo vệ trong điều trị bệnh nhân nhiễm EV71 mạn tính 7-Hydroxyflavone có khả năng bảo vệ tế bào thận khỏi độc tế bào liên quan đến NIC thông qua con đường ERK/Nrf2/HO-1, đồng thời cũng ức chế viêm do LPS.
38 gây ra thông qua việc làm giảm sản xuất NO, PGE2, TNF-α và IL-
Dihydrodaidzein Glycine max Dihydrodaidzein là một chất chuyển hóa estrogen hoạt động của daidzein
Dihydrodaidzein có liên quan đến việc giảm nguy cơ mắc bệnh tiểu đường ở nam giới và có tác dụng giãn mạch trên động mạch chủ chuột ở nồng độ 1 μg/ml Ngoài ra, nó cũng kích thích sự tăng trưởng phụ thuộc vào thụ thể estrogen của tế bào ung thư vú MCF-7 ở nồng độ micromol Dihydrodaidzein được hình thành từ sự chuyển hóa daidzein bởi vi khuẩn trong đại tràng và có khả năng chuyển hóa thành các hợp chất sinh học hoạt tính khác nhau, bao gồm solol.
Từ các thông tin trên cho thấy, các nghiên cứu về khả năng điều trị ĐTĐ của
Bốn hợp chất này hiện vẫn chưa được nghiên cứu nhiều, trong đó chỉ có Dihydrodaidzein có một số tài liệu tham khảo Đặc biệt, tác dụng của chúng đối với hai mục tiêu SGLT2 và PPARγ vẫn chưa được khám phá Ngoài ra, các dược liệu chứa những hợp chất này khá phổ biến, cho thấy tiềm năng phát triển nguồn dược liệu lớn Đây là một kết quả mới mà khóa luận này có thể tiếp tục phát triển.