1. Trang chủ
  2. » Cao đẳng - Đại học

Xây dựng mô hình toán học giúp nhận biết chất ức chế Enzym Histon Deacetylase 2 có tác dụng chống ung thư

72 7 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Xây dựng mô hình toán học giúp nhận biết chất ức chế enzym histon deacetylase 2 có tác dụng chống ung thư
Tác giả Nguyễn Thị Hiền
Người hướng dẫn TS. Lê Thị Thu Hường, TS. Phạm Thế Hải
Trường học Đại học Quốc gia Hà Nội
Chuyên ngành Dược học
Thể loại Khóa luận tốt nghiệp
Năm xuất bản 2017
Thành phố Hà Nội
Định dạng
Số trang 72
Dung lượng 1,44 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Dựa trên công thức hóa học của một chất đã có tác dụng ức chế HDAC2 mạnh là SAHA (Suberoylanilide hydroxamic acid hay còn gọi là Vorinostat), chúng tôi tìm kiếm[r]

Trang 1

ĐẠI HỌC QUỐC GIA HÀ NỘI

KHOA Y DƢỢC

NGUYỄN THỊ HIỀN

XÂY DỰNG MÔ HÌNH TOÁN HỌC GIÚP NHẬN BIẾT CHẤT ỨC CHẾ ENZYM HISTON DEACETYLASE 2

CÓ TÁC DỤNG CHỐNG UNG THƢ

KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC NGÀNH DƢỢC HỌC

Hà Nội – 2017

Trang 2

ĐẠI HỌC QUỐC GIA HÀ NỘI

KHOA Y DƢỢC

Người thực hiện: NGUYỄN THỊ HIỀN

XÂY DỰNG MÔ HÌNH TOÁN HỌC GIÚP NHẬN BIẾT CHẤT ỨC CHẾ ENZYM HISTON DEACETYLASE 2

Trang 3

LỜI CẢM ƠN

Trước hết, tôi xin tỏ lòng biết ơn sâu sắc và gửi lời cảm ơn chân thành

tới TS Lê Thị Thu Hường, công tác tại bộ môn Dược liệu và Dược học cổ

truyền - khoa Y Dược Trường Đại học Quốc gia Hà Nội là người thầy tận tình chỉ bảo, động viên, hướng dẫn để tôi hoàn thành luận văn

Tôi xin chân thành cảm ơn TS.Phạm Thế Hải công tác tại Trường Đại

học Dược Hà Nội đã chỉ bảo tận tình cho tôi từ những bước đi ban đầu khi nhận đề tài

Bên cạnh đó, tôi cũng xin gửi lời cảm ơn tới lãnh đạo, thầy cô Khoa Y Dược, Đại học Quốc gia Hà Nội đã giúp đỡ, tạo điều kiện để tôi được làm khóa luận, được học tập, nghiên cứu, rèn luyện tại Khoa suốt 5 năm học qua

Sau cùng, tôi xin bày tỏ lòng biết ơn sâu sắc tới gia đình, anh chị em và bạn bè luôn sát cánh, đồng hành, ủng hộ động viên tôi trong quá tình học tập, nghiên cứu hoàn thành luận văn

Dù đã rất cố gắng nhưng kiến thức, kỹ năng và thời gian thực hiện còn hạn hẹp, tôi khó tránh khỏi những thiếu sót Tôi rất mong nhận được những ý kiến đóng góp của các thầy cô để khóa luận của tôi được hoàn thiện hơn

Tôi xin chân thành cảm ơn

Hà Nội, Ngày 8 tháng 6 năm 2017

Sinh Viên

Nguyễn Thị Hiền

Trang 4

DANH MỤC KÝ HIỆU VIẾT TẮT

Tên viết tắt Tên Tiếng Anh Tên Tiếng Việt

Acetyltransferase

HDAC2 Histon deacetylase 2

Trang 5

TSPT Tham số phân tử

deacetylase

Trang 6

DANH MỤC HÌNH VẼ

1 Hình 1.1 Cấu trúc nhiễm sắc thể điều hòa hoạt động

phiên mã (a) Sự methyl hóa và deacetyl hóa histon dẫn tới hình dạng đóng xoắn nhiễm sắc thể và ức chế phiên mã (b) Sự acetyl hóa và demethyl hóa histon làm tháo xoắn nhiễm sắc thể và cho phép phiên mã

7

2 Hình 1.2 Cấu tạo trung tâm hoạt động của HDAC

nhóm I, II, IV

8

3 Hình 2.1 Cấu trúc hóa học của 45 dẫn xuất của acid

hydroxamic thu thập được

Trang 7

DANH MỤC BẢNG

1 Bảng 1.1 Các nhóm thuốc chống ung thư 5

2 Bảng 1.2 Các chất ức chế HDAC đang thử nghiệm

Trang 8

MỤC LỤC

DANH MỤC KÝ HIỆU VIẾT TẮT

DANH MỤC HÌNH VẼ

DANH MỤC BẢNG

MỞ ĐẦU 1

Chương 1- TỔNG QUAN 3

1.1 Thực trạng ung thư và tử vong do ung thư 3

1.1.1 Thực trạng ung thư và tử vong do ung thư trên thế giới 3

1.1.2 Thực trạng ung thư và tử vong do ung thư ở Việt Nam 4

1.2 Thuốc điều trị ung thư 4

1.3 Tổng quan histon deacetylase 6

1.3.1 Khái niệm histon deacetylase 6

1.3.2 Phân loại các HDAC 7

1.3.3 HDAC2 và vai trò trong ung thư 8

1.3.4 Các chất ức chế HDAC 11

1.3.5 Cơ chế tác dụng của các chất ức chế HDAC 13

1.4 Tổng quan phương pháp QSAR 13

1.4.1 Lịch sử QSAR 13

1.4.2 Đại cương về QSAR 14

1.4.3 Quy trình xây dựng mô hình QSAR 15

Chương 2 - NGUYÊN LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU 19

2.1 Nguyên liệu 19

2.1.1 Cơ sở dữ liệu 19

2.1.2 Phần mềm sử dụng 20

2.2 Phương pháp nghiên cứu 20

2.2.1 Tính toán tham số mô tả phân tử 20

2.2.2 Phân chia tập huấn luyện / Tập kiểm tra 21

2.2.3 Xây dựng mô hình QSAR 21

Trang 9

2.2.4 Sàng lọc và dự đoán hoạt tính một số dẫn xuất HDAC2 sử dụng mô

hình QSAR đã xây dựng được 21

Chương 3 – KẾT QUẢ VÀ BÀN LUẬN 23

3.1 Kết quả 23

3.1.1 Mô hình toán học thu được 23

3.1.2 Đánh giá mô hình theo các tiêu chí của OECD 27

3.1.3 Sàng lọc ảo đánh giá khả năng ức chế HDAC2 sử dụng mô hình xây dựng được 29

3.2 Bàn luận 34

3.2.1 Về mô hình QSAR 34

3.2.2 Về quy trình sàng lọc ảo 35

KẾT LUẬN VÀ KIẾN NGHỊ 37 TÀI LIỆU THAM KHẢO

PHỤ LỤC

Trang 10

MỞ ĐẦU

Theo thống kê của tổ chức Y tế giới (WHO), ung thư đã trở thành căn bệnh giết người hàng đầu thế giới, với khoảng 14 triệu ca mới phát hiện và 8,2 triệu trường hợp tử vong mỗi năm (số liệu tính đến hết năm 2012) So với thế giới thì Việt Nam thuộc nhóm nước có tỷ lệ mắc bệnh cao nhất đối với nhiều loại ung thư ớc tính mỗi năm tại Việt Nam có khoảng 150 - 200 nghìn người phát hiện bị ung thư, trong đó 70.000 trường hợp tử vong

Trước tình hình đó, việc nghiên cứu và phát triển các thuốc mới chống lại ung thư luôn là mối quan tâm hàng đầu của ngành công nghiệp dược phẩm thế giới và Việt Nam Tuy nhiên, quá trình nghiên cứu phát triển thuốc nói chung và các thuốc điều trị ung thư nói riêng hiện nay vẫn chủ yếu dựa trên

các phương pháp kinh điển hay phương pháp “thử và lỗi” với nhược điểm là

tốn thời gian, tiền bạc và cho hiệu quả thấp [22] Ngoài ra, các thuốc điều trị ung thư hiện đang gặp rất nhiều vấn đề liên quan đến độc tính và tỷ lệ kháng thuốc cao Do đó yêu cầu cấp bách đặt ra là phải nghiên cứu và phát triển thuốc chống ung thư mới, có tác dụng chọn lọc trên đích phân tử nhằm phát huy tối đa hiệu quả, lâu bị kháng và ít độc hơn

Histon deacetylase (HDAC) là một trong những đích phân tử được ch hiện nay, enzym này x c tác cho quá trình deacetyl hoá nhóm -N acetyl lysine amino acid ở phần đuôi của histon Người ta đã chứng minh được trong nhiều tế bào ung thư có sự huy động quá mức các enzym HDAC, gây nên hiện tượng giảm sự acetyl hoá của histon Các chất ức chế HDAC có thể ngăn chặn quá trình này thông qua việc làm thay đổi biểu hiện gen gây ung thư hay các gen ức chế khối u do gây cường acetyl hóa các protein histone [32] Hiện nay người ta đã biết đến 18 loại HDAC khác nhau, chia thành 4 nhóm, trong

đó HDAC2 thuộc nhóm I được đánh giá là một đích phân tử quan trọng do có vai trò trong quá trình deacetyl hoá của các histon H3K56 và H4K16 xảy ra trong hầu hết các dòng tế bào ung thư người [7,10]

Quá trình nghiên cứu tìm kiếm chất ức chế HDAC nhằm phát triển thành thuốc chống ung thư đã kéo dài hơn một thập kỷ [43] Các mô hình liên

Trang 11

quan mối quan hệ cấu trúc – tác dụng dược lý xuất hiện từ năm 1868, được biết đến là mô hình toán học định lượng mối liên quan tác dụng dược lý và cấu trúc hóa học của hợp chất hay còn gọi là QSAR Xây dựng mô hình QSAR để dự đoán hoạt tính của những phân tử chưa từng được kiểm tra Từ

đó gi p tìm kiếm các hợp chất hóa học có tác dụng sinh học, tối ưu hóa cấu

tr c các hợp chất này nhằm tăng hoạt tính sinh học, giảm độc tính, tăng các tính chất dược động học của thuốc Phương pháp này nhìn chung nhanh có tính kinh tế và hỗ trợ rất tốt cho các nghiên cứu thực nghiệm, giúp nâng cao

tỷ lệ thành công của nghiên cứu

Từ các vấn đề nêu trên, mục tiêu chung của nghiên cứu này là “Xây dựng

mô hình toán học giúp nhận biết chất ức chế enzym histon deacetylase 2 có tác dụng chống ung thư” Với mục tiêu cụ thể:

- Xây dựng mô hình QSAR mới sử dụng phương pháp hồi quy tuyến tính nhằm dự đoán khả năng ức chế HDAC2

- Đánh giá mô hình xây dựng được theo các tiêu chí của Tổ chức kinh tế thế giới (OECD)

- Vận dụng mô hình xây dựng được xác định hợp chất dẫn đường tiềm năng ức chế HDAC2 phát triển thành thuốc chữa ung thư

Trang 12

Chương 1- TỔNG QUAN 1.1 Thực trạng ung thư và tử vong do ung thư

1.1.1 Thực trạng ung thư và tử vong do ung thư trên thế giới

Ung thư là một trong những nguyên nhân hàng đầu gây tử vong trên toàn thế giới Trong năm 2012, có khoảng 14 triệu trường hợp ung thư được phát hiện mới và có đến 8,2 triệu ca tử vong liên quan đến ung thư [40] Trong đó, số lượng các ca tử vong do các ung thư chủ yếu là: ung thư phổi (1,59 triệu ca), ung thư gan (745000 ca), ung thư dạ dày (723000 ca), ung thư đại trực tràng (694000 ca), ung thư v (521000 ca), ung thư thực quản (400000 ca) [40]

Số lượng các ca ung thư mới được dự đoán sẽ tăng khoảng 70% trong vòng hai thập kỉ tới Dự đoán số trường hợp ung thư hàng năm sẽ tăng từ 14 triệu trong 2012 lên 22 triệu trong vòng hai thập kỉ tới [2] Hơn 60% số các ca ung thư mới hàng năm trên thế giới xảy ra ở Châu Phi, Châu Á, Trung và Nam Mỹ, chiếm 70% số các ca tử vong ung thư thế giới [40]

Đối với nam giới, 5 ung thư phổ biến nhất được chẩn đoán trong năm

2012 là ung thư phổi, tuyến tiền liệt, đại trực tràng, dạ dày và gan Đối với nữ giới, 5 ung thư phổ biến nhất được chẩn đoán là ung thư v , đại trực tràng, phổi, cổ tử cung, dạ dày

Khoảng 30% các trường hợp tử vong liên quan đến ung thư là do 5 yếu

tố nguy cơ hàng đầu về hành vi và chế độ ăn uống: chỉ số khối cơ thể cao (béo phì), ăn ít rau quả tươi, ít tập thể dục, nghiện thuốc lá hoặc rượu Thuốc lá là yếu tố nguy cơ quan trọng nhất đối với ung thư, gây ra hơn 20% các ca tử vong ung thư và khoảng 70% các ca tử vong do ung thư phổi trên toàn cầu Ngoài ra, các bệnh nhiễm virus HBV, HCV và một số type Human Papilloma Virus (HPV) là nguyên nhân của trên 20% số các ca tử vong ung thư ở các nước thu nhập thấp và thu nhập trung bình [12]

Trang 13

1.1.2 Thực trạng ung thư và tử vong do ung thư ở Việt Nam

Ở Việt Nam, trong năm 2012, số lượng các ung thư gặp phổ biến ở nam giới là gan 16.815 ca, phổi 16.082 ca, dạ dày 9.406 ca, đại trực tràng 4.561 ca

và mũi họng 3.301 ca; còn các ung thư gặp phổ biến ở nữ giới là: vú 11.067

ca, phổi 5.783 ca, gan 5.182 ca, cổ tử cung 5.146 ca và dạ dày 4.797 ca [39]

Ở Việt Nam, tổng số ca tử vong do ung thư năm 2012 là 91.600 ca, trong đó: số nam giới tử vong do ung thư là 58.200 ca: ung thư gan chiếm 26,9%, phổi 24,4%, dạ dày 14,5%, miệng - thực quản 5,8%, đại trực tràng 5,2% và do ung thư khác là 23,2%; số nữ giới tử vong do ung thư là 33.400 ca: ung thư phổi chiếm 14,5%, gan 13,7%, v 12,5%, dạ dày 12,1%, đại trực tràng 8% và do ung thư khác là 39,3% [39]

1.2 Thuốc điều trị ung thƣ

Ngày nay có nhiều phương pháp điều trị ung thư, gồm có phẫu thuật, vật lí trị liệu (xạ trị liệu), hóa trị liệu (dùng thuốc điều trị ung thư), nội tiết, miễn dịch [1] Tuy nhiên áp dụng phương pháp nào để điều trị có hiệu quả còn tuỳ thuộc vào giai đoạn, vào sức chịu đựng của cơ thể, vào khả năng của

cơ sở điều trị và một phần vào kinh nghiệm của thầy thuốc chuyên khoa

Từ khi bắt đầu tiến triển, ung thư đã có thể cho di căn, do đó các phương pháp điều trị tại chỗ và tại vùng như phẫu thuật và xạ trị thường không mang lại hiệu quả Sử dụng các thuốc điều trị ung thư đặc biệt là các hóa chất chống ung thư có thể ngăn chặn được tiến triển của ung thư Hóa chất chống ung thư đều là những chất gây độc tế bào Ch ng can thiệp vào

sự đáp ứng khác biệt nhau giữa tế bào ung thư và tế bào lành Đặc trưng tăng trưởng của ung thư có ảnh hưởng rất lớn đến đáp ứng với hóa trị Các hiểu biết về động học tế bào, sự tăng trưởng của khối u, sinh học ung thư là căn bản cho các nguyên tắc hóa trị lâm sàng

Trang 14

Có khoảng hơn 200 loại thuốc chống ung thư trên lâm sàng [1] Theo

cơ chế hoạt động, các thuốc chống ung thư được phân loại như bảng 1.1 [1]

Bảng 1.1 Các nhóm thuốc chống ung thư

Nitrosourea Halogenated hexitol Hợp chất platinum Kháng sinh kháng u Xen giữa DNA làm đứt gãy

DNA

Anthracyclin, Actinomycin D, Mitomycin C, Bleomycin Các kháng chuyển

hóa

Sinh tổng hợp acid nhân Các kháng acid Folic,

kháng Purin, kháng Pirimidin, các ức chế tổng hợp protein và acid amin

Các ức chế giai

đoạn gián phân hình

thoi

Ngăn cản hình thức thoi trong kì gián phân

Alkaloid nhóm vinca Podophylin

Colchicin

PMM)*

Dacarbazin Procarbazin Các Taxane Làm đông cứng các vi quản

nội tế bào Taxol, Taxotere

Trang 15

Các camptothecin Ức chế men topoisomerasa I Camptothecin, CPT - 11 Các hormone Androgen

Estrogen Steroid Progestin Các thuốc tác dụng lên tuyến yên

Antiandrogen Estrogen Antiestrogen Antisteroid

* HMM: Hexamethylmelamine

PMM: Pentamethylmelamine

1.3 Tổng quan histon deacetylase

1.3.1 Khái niệm histon deacetylase

Nhiễm sắc thể là phức hợp gồm 3 thành phần: ADN, protein histon và protein không phải histon [21] Đơn vị cơ bản của nhiễm sắc thể là nucleosom Mỗi nucleosom gồm 146 cặp base ADN được gói trong một protein histon octame [16] tạo bởi 4 thành phần: H2A, H2B, H3, H4 [13]

Các đầu amino của protein histon thường bị biến đổi bởi các quá trình methyl hóa, phosphoryl hóa hoặc acetyl hóa sau dịch mã Quá trình acetyl hoá

là một trong những cơ chế điều hoà chính của biểu thị gen Kiểm soát quá trình biểu thị gen này phụ thuộc vào sự cân bằng giữa hoạt động của enzym histon acetylase và enzym histon deacetylase, nhờ vào sự điều hoà quá trình acetyl hoá lysin ở phần đuôi histon [6]

Histon acetyltrasferase (HAT) là enzym acetyl hóa nhóm -NH2 trong gốc lysin (đầu N tận) của histon, làm trung hòa điện tích dương trên lysin, do

đó giảm khả năng tương tác của histon với ADN (tích điện âm) tạo cấu trúc

mở chromatin Vì vậy, sự acetyl hóa histon tạo điều kiện cho quá trình phiên

mã, dịch mã xảy ra (hình 1.1b) [6,21]

Histon deacetylase (HDAC) là enzym có tác dụng đối lập với HAT HDAC loại bỏ nhóm acetyl từ acetyl lysin (Ac-Lys) ở đầu N tận của histon, làm đóng xoắn chromatin, do đó ức chế quá trình phiên mã (Hình 1.1) [6,21]

Trang 16

Hình 1.1 Cấu trúc nhiễm sắc thể điều hòa hoạt động phiên mã (a) Sự

methyl hóa và deacetyl hóa histon dẫn tới hình dạng đóng xoắn nhiễm sắc thể

và ức chế phiên mã (b) Sự acetyl hóa và demethyl hóa histon làm tháo xoắn

nhiễm sắc thể và cho phép phiên mã

1.3.2 Phân loại các HDAC

Hiện nay người ta đã biết đến 18 loại HDAC khác nhau, được chia thành 4 nhóm: I, II, III, IV HDAC nhóm I, II và IV được gọi là các HDAC

“kinh điển” và thường được sử dụng để sàng lọc và thiết kế các chất ức chế HDAC mới [43]

Nhóm I: HDAC1, HDAC2, HDAC3, HDAC8 Các enzym này có ở phần nhân của nhiều loại tế bào

Nhóm II: gồm nhóm IIa và nhóm IIb Trong đó nhóm IIa có HDAC4, HDAC5, HDAC7, HDAC9, nhóm IIb có HDAC6, HDAC10 Các enzym này biểu thị mô đặc trưng, có khả năng di chuyển giữa bào tương và nhân

Nhóm III: Các protein điều hoà chuỗi thông tin 2 (SIRT): SIRT 1 – 7, chúng có ở bào tương, ty thể và nhân

Nhóm IV: HDAC11, có ở phần nhân của nhiều loại tế bào

Các enzym nhóm I, II và IV phụ thuộc vào Zn2+ Nhóm III là các enzym có cấu trúc phụ thuộc NAD+ [11,43]

Trang 17

Trung tâm hoạt động HDAC gồm 2 phần chính (Hình 1.2): ion Zn2+ là coenzyme của HDAC và kênh enzym dạng túi hình ống Cấu trúc rất linh động, có thể biến đổi phù hợp với chiều dài cơ chất khác nhau Trên miệng túi

có một vành nhỏ được tạo nên từ một vài vòng xoắn protein, phần vành này

sẽ tương tác với nhóm nhận diện bề mặt HDAC [18]

Hình 1.2 Cấu tạo trung tâm hoạt động của HDAC nhóm I, II, IV

1.3.3 HDAC2 và vai trò trong ung thư

Histon deacetylasa 2 (HDAC2) thuộc HDAC nhóm I HDAC2 hoạt động như một chất ức chế phiên mã thông qua loại bỏ nhóm lysine ở đầu N của protein histon (H2A, H2B, H3 và H4) Tuy nhiên HDAC2 không liên kết với ADN nên chúng sẽ được chọn lọc bởi các yếu tố phiên mã như YY1, SP1/SP3, gen ức chế khối u p53 và BRCA1 HDAC2 cũng có thể được gắn vào ADN như là một phần của phức hợp CoREST, mSin3 và NuRD Những phức hợp là mục tiêu với các trình tự gen đặc hiệu bằng các tương tác với các yếu tố phiên mã trình tự đặc hiệu Ví dụ, các HDAC2/HDAC1 chứa phức hợp Sin3-SAP chọn lọc họ E2F của các yếu tố phiên mã để ức chế phiên mã [17]

Phức hợp chứa HDAC2 cũng liên quan đến gen điều chỉnh phiên mã qua thụ thể trung gian Những phức hợp chứa gen biến đổi biểu sinh khác,

Trang 18

chẳng hạn như MeCp2 – là một protein có nhóm liên kết methyl Các enzyme vận chuyển nhóm methyl DNA DNMT1, DNMT3A và DNMT3B, sự methyl transferases histone SUVAR39H1 và G9a và histon bị bỏ đi nhóm methyl (LSD1), cho thấy một cách khác mà HDAC2 quy định biểu hiện gen và sửa chữa nhiễm sắc

HDAC2 cũng quy định biểu hiện gen thông qua sự deacetyl của yếu tố phiên mã cụ thể bao gồm STAT3 và SMAD7 HDAC2 là một chìa khóa quan trọng của gen điều hòa chu kỳ tế bào, quá trình tế bào tự tiêu diệt, kết dính tế bào và di cư Cùng với HDAC1, HDAC2 quy định việc phiên mã của các gen liên quan đến quá trình tạo máu, biệt hóa tế bào biểu mô, phát triển tim và tế bào thần kinh [34]

Các đột biến có thể có ở HDAC2 xuất hiện ở tế bào soma HDAC2 bị đột biến trong các khối u lẻ tẻ và trong các khối u phát sinh ở người có ung thư biểu mô đại trực tràng không polyp di truyền Đột biến này do sự cắt bỏ 9 adenin ở exon1 tạo thành protein không hoạt động Sự biểu hiện các dạng đột biến của HDAC2 gây ra sự kháng với tác dụng của các chất ức chế HDAC Việc thiếu các biểu hiện và chức năng HDAC2 tạo nên sự tăng điều chỉnh gen

th c đẩy tăng trưởng khối u [5,25]

HDAC2 liên quan đến nhiều bệnh ung thư khác nhau:

Việc điều hòa về biểu hiện hoạt động HDAC2 có liên quan đến sự phát triển ung thư HDAC2 biểu hiện quá mức trong các loại ung thư khác nhau bao gồm cả đại tràng, dạ dày, cổ tử cung, ung thư tuyến tiền liệt, ung thư phổi không tế bào nhỏ và ung thư biểu mô tế bào gan HDAC2 biểu hiên quá mức liên quan đến ung thư một phần thông qua việc chọn lọc sai lầm của nó và sự

im lặng của các gen ức chế khối u Sự ức chế của gen p21WAF1 ức chế khối

u ở vùng khởi động và có thể được đảo ngược bởi việc điều trị bằng thuốc ức chế HDAC [31] Biểu hiện HDAC2 tương quan với tiên lượng xấu khi bệnh ở giai đoạn tiên triển trong ung thư đại trực tràng, tuyến tiền liệt, dạ dày và biểu

mô tế bào gan

Ung thư đại tràng: Có một số nghiên cứu cho thấy HDAC2 biểu hiện quá mức trong ung thư đại tràng Sự gia tăng các biểu hiện HDAC2 đã được

Trang 19

tìm thấy ở mức độ protein và mRNA chỉ ra rằng HDAC2 quá mức là do hoạt hóa phiên mã Các nghiên cứu cho thấy trong loại khối u này sự phiên mã HDAC2 được điều chỉnh bởi tín hiệu beta-catenin-TCF-myc đã bị xóa bỏ trong bệnh ung thư đại tràng HDAC2 biểu hiện quá mức tương quan với tiên lượng xấu và bệnh ở giai đoạn tiến triển trong ung thư đại trực tràng Tuy nhiên, Ropero và các cộng sự tìm thấy một sự đột biến bất hoạt của HDAC2 trong ung thư đại tràng với bất ổn microsatellite [29]

Ung thư v : Các nghiên cứu khác nhau cho thấy vai trò quan trọng của HDAC2 trong ung thư v HDAC2 gây lão hóa trong tế bào ung thư v Hơn nữa sự mất hoạt tính của HDAC2 kéo theo quá trình chết tế bào (apoptosis) của tamoxifen trong estrogen/ progesterone tế bào ung thư v dương tính [27]

Bệnh ung thư tuyến tiền liệt: Theo nghiên cứu của Weichert và các cộng sự thấy rằng HDAC2 được biểu hiện mạnh mẽ trong hơn 70% các trường hợp phân tích ung thư tuyến tiền liệt Sự gia tăng trong biểu hiện HDAC2 có liên quan với tăng cường tăng sinh tế bào khối u [5]

Ung thư biểu mô tế bào gan: HDAC2 quy định chu kỳ tế bào và sự phân chia của HDAC2 gây ra ngừng chuyển pha G1/S trong chu kỳ tế bào Trong quá trình chuyển đổi G1/S, sự phân chia đích của HDAC2 có tính chọn lọc gây ra các biểu hiện của p16 (INK4a) và p21 (WAF1/Cip1), và đồng thời ức chế sự biểu hiện của cyclin D1, CDK4 và CDK2 Do đó, sự ức chế HDAC2 dẫn đến sự giảm điều chỉnh của gen đích E2F/DP1 thông qua việc giảm sự phosphoryl hóa protein PRB [5]

Ung thư phổi: HDAC2 được điều chỉnh lên cao trong ung thư phổi HDAC2 bất hoạt dẫn đến thoái hoá tăng trưởng tế bào khối u và kích hoạt các quá trình chết tế bào (apoptosis) qua p53, kích hoạt Bax và ức chế BCL2 Trong điều chỉnh chu kỳ tế bào, HDAC2 bất hoạt gây ra cảm ứng biểu hiện p21WAF1/Cip1, đồng thời ức chế sự biểu hiện của cyclin E2, cyclin D1, và CDK2, tương ứng Do đó, điều này dẫn đến việc giảm quá trình phosphoryl hóa của protein PRB trong chuyển pha G1/S và do đó bất hoạt phiên mã gen

Trang 20

đích E2F/DP1 của các tế bào A549 HDAC2 trực tiếp điều chỉnh biểu hiên p21WAF/Cip1 không phụ thuộc p53 [5]

Bệnh phổi tắc nghẽn mãn tính (COPD): giảm hoạt động và biểu hiện HDAC2 được tìm thấy trong bệnh phổi tắc nghẽn mãn tính (COPD) Việc giảm hoạt động của HDAC2 làm tăng điều hòa các gen liên quan đến phản ứng viêm và kháng corticosteroid trong COPD [5]

1.3.4 Các chất ức chế HDAC

Yoshida và cộng sự (1990), đã phát hiện ra dẫn chất hydroxamat tự nhiên đầu tiên có tác dụng ức chế trực tiếp HDAC là Trichostatin A (TSA), vốn là chất có tác dụng chống nấm [41] Sau đó, dựa trên hiểu biết về mối liên quan giữa HDAC và ung thư đồng thời xác định được cấu trúc 3D của các HDAC, một số chất ức chế HDAC đã được nghiên cứu và thử nghiệm trên lâm sàng để ứng dụng trong điều trị ung thư Cho đến nay, nhiều chất ức chế HDAC (UHDAC) đã được công bố Chúng có thể có nguồn gốc tự nhiên hay tổng hợp Trong các nhóm chất ức chế HDAC, các acid hydroxamic là nhóm chất được quan tâm chú ý và tập trung nghiên cứu nhiều nhất Do các acid hydroxamic có cấu tr c đơn giản, dễ tổng hợp và có nhóm -NHOH tạo được phức bền với Zn+ ở trung tâm hoạt động của HDAC mang lại có hoạt tính ức chế enzym mạnh Hiện nay, FDA đã phê duyệt một acid hydroxamic UHDAC điển hình là vorinostat (suberoylanilide hydroxamic acid, Zolinza) vào năm

2006 sử dụng trong điều trị u lympho da tế bào [cutaneous T-cell lymphoma

(CTCL)] Một hợp chất UHDAC khác là depsipeptide (romidepsin, Istodax) cũng được FDA cấp phép lưu hành vào năm 2009 để điều trị CTCL và điều

trị ung thư hạch tế bào T ngoại vi [peripheral T-cell lymphoma (PTCL)] Đây

chính là nguồn động lực để các nhà nghiên cứu tiếp tục tìm kiếm các chất ức chế HDAC mới Nhiều chất ức chế enzym HDAC khác cũng đang được thử nghiệm lâm sàng nhằm phát triển liệu pháp điều trị ung thư dựa trên đích này, bao gồm nhóm hydroxamat, benzamid, peptid vòng, acid carboxylic (Bảng

1.2) [4,30]

Trang 21

Bảng 1.2 Các chất ức chế HDAC đang thử nghiệm lâm sàng

Acid carboxylic Butyrat

AN-9 (tiền thuốc) Acid valproic

mô Thể rắn, AML/MDS Acid hydroxamic SAHA

PXD101 NVP-LAQ824 LBH-589 ITF-2357 SB-939 CRA 024781 JNJ-16241199

Thể rắn, ung thư máu Thể rắn, AML, ALL, MDS

U lympho Hodgkin Thể rắn, ung thư máu

Các benzamid SNDX-275

(MS-275)

CI-994 MGCD-0103

I, II

I, II

II

Thể rắn, u lympho, AML, u hắc sắc tố ác tính di căn tiến triển

Thể rắn, NSCLC, tế bào thận, tuỵ

Thể rắn, ung thư bạch cầu, MDS

Peptid vòng Depsipeptid

(FK228)

I, II Thể rắn, CLL, AML, CTCL,

u đa tuỷ xương, NHL tế bào

T ngoại vi, RAI kháng thyroid, ung thư đại tràng tiến triển

Trang 22

Trong đó:

NSCLC (Non-Small Cell Lung Cancer) : Ung thư phổi không tế bào nhỏ AML (Acute Myeloid Leukemia): Bệnh bạch cầu myeloid cấp tính MDS (Myelodysplastic Syndrome ): Hội chứng rối loạn sinh tủy CTCL (Cutaneous T Cell Lymphoma): U lympho tế bào T da NHL (non-Hodgkin's lymphoma): Ung thư hạch không Hodgkin RAI (Radioactive iodine): Iod phóng xạ

Tuy nhiên, mỗi nhóm nêu trên đều có những hạn chế nhất định như: các acid hydroxamic bị chuyển hoá nhanh, ức chế không chọn lọc lên các loại enzym HDAC; các benzamid và acid béo có hiệu lực kém; các peptid vòng khó tạo thành về mặt hoá học và FK-228 có phần gắn kết với ion Zn2+ chứa thiol [26]

1.3.5 Cơ chế tác dụng của các chất ức chế HDAC

Các chất ức chế HDAC có tác dụng chống ung thư do tác động lên nhiều giai đoạn quan trọng của chu trình tế bào làm mất sự điều hòa trong

tế bào ác tính Trong đó, yếu tố then chốt quyết định hoạt tính chống ung thư của ch ng là th c đẩy sự biệt hóa, ức chế chu trình tế bào và th c đẩy

sự chết tế bào Ngoài ra, hoạt hóa đáp ứng miễn dịch và ức chế sự tạo mạch cũng là vai trò rất quan trọng của các UHDA, gián tiếp ức chế sự phát triển của các khối u Ngoài ra các chất ức chế HDAC ngăn cản các đuôi histon có nhóm acetyl tiến đến vị trí xúc tác [7,9]

Vai trò sinh học của HDAC và các nghiên cứu về các chất UHDA cho thấy nó là một mục tiêu quan trọng cần hướng tới trong điều trị ung thư Do

đó, việc tìm kiếm các hợp chất mới có tiềm năng ức chế HDAC là một hướng

đi nhằm tìm kiếm các hợp chất mới với khả năng ức chế cao hơn, ít độc tính

hơn đang là một hướng đi được nhiều nhà khoa học quan tâm [21]

1.4 Tổng quan phương pháp QSAR

1.4.1 Lịch sử QSAR

Lịch sử phát triển của phương pháp QSAR có thể nói khởi nguồn từ những nghiên cứu của Crum-Brown và Frasher (1868) khi nhận xét rằng tác dụng sinh học là hàm số của cấu trúc hóa học Đến năm 1893, Richet đã cho

Trang 23

rằng sự khác nhau về tác dụng sinh học là do sự thay đổi về tính chất lí hóa Đến năm 1935, một phương trình quan trọng của Hammett được coi là mô hình đầu tiên biểu diễn mối quan hệt hoạt tính và cấu trúc:

Log (1/C) = k1+ k22+ k3 Trong đó: C là nộng độ mol mà tại đó hoạt chất thể hiện hoạt tính sinh học, : hằng số kỵ nước, : hằng số thế Hammett, k1,k2,k3 là các hệ số hồi quy

Kể từ đây, đã có nhiều phương trình QSAR cùng với những phương pháp xây dựng đa dạng đã ra đời và chiếm một vai trò quan trọng trong nghiên cứu và phát triển dược phẩm

1.4.2 Đại cương về QSAR

Về mặt toán học, mô hình QSAR (Quantitative Structure-Activity Relationships) biểu diễn mối tương quan định lượng giữa cấu trúc phân tử và hoạt tính thông qua phương trình:

Y = f(x 1 ) + f(x 2 ) + + f(x n ) (1.4.2) Trong đó, Y là biến phụ thuộc, phản ánh hoạt tính sinh học của các hợp chất Giá trị của Y được xác định thông qua các nghiên cứu thực nghiệm, ví

dụ như nồng độ ức chế 50% hoạt tính của enzym (IC50), MIC (Minimum Inhibitory Concentration): nồng độ ức chế tối thiểu, hay nồng độ kìm khuẩn tối thiểu (dùng trong vi sinh); MBC (Minimum Bactericidal Concentration): nồng độ diệt khuẩn tối thiểu; EC 50 (Effective Concentration): nồng độ 50%

Trang 24

tác dụng tối đa Y cũng có thể nhận giá trị rời rạc, ví dụ như có hay không có hoạt tính, hoạt tính mạnh hay yếu Các biến x trong mô hình QSAR được gọi

là các tham số phân tử (TSPT), mô tả một đặc điểm cấu tr c nào đó của phân

tử hóa học Hàm f là một hàm mô tả mối tương quan giữa Y và các biến x Để

xây dựng được hàm f, cần áp dụng các thuật toán thống kê (statistical) hoặc

học máy (machine learning) Một số kỹ thuật thống kê thường được sử dụng trong xây dựng mô hình QSAR có thể kể đến như bình phương tối thiểu từng phần (Partial Least Squares), hồi quy đa biến tuyến tính (Multiple Linear Regression), phân tích thành phần chính (Principal Component Analysis)

1.4.3 Quy trình xây dựng mô hình QSAR

Các bước để xây dựng mô hình QSAR [19] gồm:

1) Xây dựng cơ sở dữ liệu (CSDL); 2) Tính toán tham số mô tả phân tử đặc trưng cho cấu trúc; 3) Xây dựng mô hình QSAR: Sử dụng các phương pháp xác suất thống kê và các kỹ thuật của trí tuệ nhân tạo để xây dựng mối liên hệ giữa các tham số phân tử (TSPT) và các giá trị đại lượng biểu diễn hoạt tính; 4) Đánh giá mô hình; 5) Giải thích các kết quả và sử dụng mô hình trong quá

trình sàng lọc ảo (nếu có thể)

Xây dựng cơ sở dữ liệu: CSDL thường là cấu trúc của các hợp chất

hoá học đã được chứng minh hoạt tính sinh học in vitro Để hạn chế các yếu

tố gây sai số cho mô hình, CSDL thường sẽ được làm sạch dựa trên sự tương đồng về cấu trúc, về protocol,

Tính toán tham số mô tả phân tử đặc trưng cho cấu trúc:

Tham số mô tả phân tử là một số thu được từ một quá trình toán học và lôgic chuyển đổi thông tin được mã hóa trong cấu trúc hóa học [37] Trong nghiên cứu này, các tham số được tính toán sử dụng phần mềm Dragon [37]

Xây dựng mô hình QSAR: sử dụng các phương pháp xác suất thống kê

và các kỹ thuật của trí tuệ nhân tạo để xây dựng mối liên hệ giữa các TSPT và giá trị đại lượng biểu diễn hoạt tính

Trang 25

Đánh giá mô hình: Đánh giá mô hình là giai đoạn quan trọng liên quan

đến khả năng ứng dụng của mô hình Đánh giá mô hình thường sử dụng 5 nguyên tắc của OECD [28]

- Nguyên tắc 1: Có đích xác định (defined end-points)

Đích là những giá trị thực nghiệm về hoạt tính sinh học thu được từ CSDL Nếu toàn bộ CSDL đều sử dụng một protocol để xác định giá trị của đích, thì mô hình xây dựng được có độ tin cậy cao, có thể dùng để dự đoán hoạt tính các hợp chất mới (nếu thực nghiệm dùng theo quy trình này) Còn nếu CSDL sử dụng nhiều protocol khác nhau thì mô hình sẽ không có độ tin cậy cao

- Nguyên tắc 2: Các thuật toán sử dụng được mô tả rõ ràng

Các thuật toán sử dụng để xây dựng mô hình cần được mô tả rõ ràng,

có khả năng ứng dụng để xây dựng các mô hình khác

- Nguyên tắc 3: Có miền cấu trúc ứng dụng xác định

Miền cấu trúc ứng dụng là khoảng không gian cấu tr c được xác định bởi các hợp chất trong tập huấn luyện để xây dựng mô hình Những hợp chất thuộc tập huấn luyện nếu có cấu trúc nằm ngoài miền cấu trúc ứng dụng sẽ ảnh hưởng đến độ chính xác của mô hình Những hợp chất thuộc tập dự đoán, nếu có cấu trúc nằm ngoài miền này sẽ cho kết quả dự đoán không chính xác Các phương pháp xác định miền ứng dụng thường gặp như: phương pháp đòn bẩy, phương pháp ba lân cận gần nhất,

- Nguyên tắc 4: Có độ khớp, độ ổn định, và khả năng dự đoán tốt

 Độ khớp hay độ tuyến tính được đánh giá thông qua giá hệ số xác định

R2, R2 càng cao thì mức độ khớp (tuyến tính) của mô hình với các giá trị thực nghiệm càng tốt R2> 0,6 thì mô hình mới có nghĩa Công thức tính hệ số xác định như sau:

R 2 = 1-

y iy^i

∑ (y iy)

Trang 26

Trong đó n là số các quan sát của tập huấn luyện; yi,y i, lần lượt là giá trị thực tế, giá trị dự đoán của biến phụ thuộc ở quan sát thứ i; ylà giá trị thực

tế trung bình của biến phụ thuộc

 Độ ổn định được đánh giá thông qua hệ số tương quan chéo Q2

, Q2 được đánh giá dựa trên phương pháp tham số chéo (cross validation leave one out) bằng cách lần lượt loại 1 quan sát ra khỏi tập huấn luyện, giữ nguyên các biến đã lựa chọn và tính toán lại các thông số của mô hình Q2 càng gần 1, tính tổng quát hóa của mô hình càng cao, mô hình càng ổn định Thông thường, yêu cầu Q2

> 0,5 thì mô hình mới bền vững Công thức hệ số tương quan chéo tính như sau:

mô hình đã loại biến i; ylà giá trị thực tế trung bình của biến phụ thuộc

 Khả năng dự đoán ngoại

Khả năng dự đoán ngoại được đánh giá thông qua giá trị Q2ext, Q2ext

càng lớn mô hình càng cho thấy độ tuyến tính của tập kiểm tra và do vậy chứng tỏ khả năng dự đoán của mô hình cao

Trong đó n là số các quan sát tập kiểm tra; yi, y^ , lần lượt là giá trị thực

tế, giá trị dự đoán của biến phụ thuộc ở quan sát thứ i; ylà giá trị thực tế trung bình của biến phụ thuộc

- Nguyên tắc 5: Giải thích được cơ chế (nếu có thể)

Mô hình cần được giải thích về vai trò của các biến trong mô hình, qua

đó gi p định hướng thiết kế các hợp chất mới Tuy nhiên việc giải thích các biến này nhiều khi gặp phải khó khăn vì cơ chế của chúng phức tạp đòi hỏi

Trang 27

những hiểu biết chuyên sâu về hóa lượng tử Bên cạnh đó có nhiều biến chưa

có các tài liệu tham khảo, do đó chưa đủ cơ sở để giải thích

Trang 28

Chương 2 - NGUYÊN LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU 2.1 Nguyên liệu

NHOH O Cl

(7) (1-6)

O

H N

O

N O

CH3

OH X

O2S X

HOHN

N O

O2S OCH3

(26)

N O

H O

N O

H O

F

N O

H O

(27)

(29)

(30) (28)

N O O O

NHOH O

NHOH O Cl

(31-37) (38)

N S S O NHOH O

N S S O NHOH O

H3C

N H

NHOH O

O

O H

NHOH O

O

NHOH O

O

H

NHOH O

O

H

NHOH O

Trang 29

Bảng 2.1 Giá trị IC 50 thực nghiệm của 45 hợp chất trong CSDL

1 ChemDraw phiên bản 10.0 2 Dragon 6.0

3 Mobydigs 1.0 4 Microsoft Excell 2007

5 STATISTICA 10.0

2.2 Phương pháp nghiên cứu

2.2.1 Tính toán tham số mô tả phân tử

Tham số mô tả phân tử là kết quả của một quá trình toán học và logic chuyển đổi thông tin được mã hóa trong cấu trúc hóa học thành một số có khả năng đặc trưng cho phân tử đấy [37] Để thực hiện tính toán, tất cả các cấu trúc của CSDL được chuyển đổi thành hệ thống đơn giản hóa với đầu vào được biểu diễn dưới dạng dòng SMILES (Simplified Molecular Input Line

Trang 30

Entry System) bằng việc sử dụng phần mềm ChemDraw phiên bản 10.0 [33] Căn cứ vào các mã code, hơn 2000 mô tả phân tử thuộc họ 0D, 1D và 2D được tính toán bằng phần mềm Dragon phiên bản 6.0 [3]

2.2.2 Phân chia tập huấn luyện / Tập kiểm tra

Sau khi tính toán mô tả phân tử, CSDL được chia ngẫu nhiên thành tập huấn luyện (Tr - training set) và tập kiểm tra (Te – test set) Tập huấn luyện (chiếm 75% CSDL) được sử dụng cho việc xây dựng (huấn luyện) mô hình Tập huấn luyện cho phép phát hiện mối quan hệ có khả năng dự đoán Còn tập kiểm tra bao gồm các phân tử mà mô hình chưa bao giờ gặp được sử dụng

để đánh giá độ mạnh và khả năng ngoại suy của các mô hình xây dựng được

2.2.3 Xây dựng mô hình QSAR

Tập huấn luyện gồm 75% số hợp chất trong CSDL được lựa chọn ngẫu nhiên để xây dựng mô hình QSAR Các hợp chất còn lại được xếp vào tập kiểm nghiệm để đánh giá mô hình Các mô hình được xây dựng bằng các phương pháp hồi quy đa biến tuyến tính (MLR) sử dụng phần mềm STATISTICA 10.0, lựa chọn TSPT bằng phương pháp thuật giải di truyền (Genetic algorithm) sử dụng phần mềm Mobydigs 1.0, sau đó đánh giá để lựa chọn mô hình tốt nhất

2.2.4 Sàng lọc và dự đoán hoạt tính một số dẫn xuất HDAC2 sử dụng mô hình QSAR đã xây dựng được

Dựa trên công thức hóa học của một chất đã có tác dụng ức chế HDAC2 mạnh là SAHA (Suberoylanilide hydroxamic acid hay còn gọi là Vorinostat), chúng tôi tìm kiếm và dự đoán hoạt tính cho các hợp chất có tính tương đồng về cấu trúc với SAHA mà chưa được nghiên cứu tác dụng ức chế HDAC2 Để làm được điều này, chúng tôi tiến hành sàng lọc dựa trên 2 bước:

- Bước 1 Lấy SAHA làm khuôn, tìm kiếm trên CSDL PubChem các hợp

chất có tính tương đồng cao về cấu trúc với SAHA, sử dụng công cụ “tìm kiếm đồng dạng” (Similarity searching) tích hợp trên CSDL PubChem: Dán công thức SMILES của SAHA vào thanh công cụ tìm kiếm Sau đó chọn tiêu chí tương đồng, sử dụng tùy biến hệ số Tanimoto ≥ 0,85 Kết

Trang 31

quả thu được dãy các dẫn xuất của hydroxamic, lựa chọn các hợp chất chưa từng được nghiên cứu tác dụng ức chế HDAC2

- Bước 2 Tính toán TSPT cho các hợp chất được lựa chọn và sử dụng mô

hình QSAR đã xây dựng được để dự đoán hoạt tính cho chúng

Trang 32

Chương 3 – KẾT QUẢ VÀ BÀN LUẬN

3.1 Kết quả

3.1.1 Mô hình toán học thu được

Mô hình QSAR là mô hình biểu thị mối liên hệ định lượng giữa cấu trúc và hoạt tính của các hợp chất Mô hình QSAR được biểu diễn dưới dạng

một phương trình toán học (1.4.2) QSAR sử dụng các TSPT, các kỹ thuật xác

suất thống kê và trí tuệ nhân tạo để xây dựng các mô hình QSAR được xây dựng dựa trên giả thuyết là cấu trúc của một phân tử phải chứa những đặc điểm cấu trúc liên quan tới tính chất hóa học, vật lý, sinh học và dựa trên khả năng các mô tả phân tử Bởi các mô hình QSAR, hoạt tính sinh học của một phân tử mới hoặc chưa được kiểm nghiệm có thể được suy ra từ cấu trúc của các hợp chất tương tự trong đó tính chất của ch ng đã được kiểm nghiệm [37]

Phương pháp QSAR xây dựng các mô hình toán học nhằm dự đoán hoạt tính của các hợp chất dựa trên cấu trúc hóa học của chúng, là các kỹ thuật nhằm dự đoán các kết quả trước khi các thử nghiệm được tiến hành trong phòng thí nghiệm QSAR cung cấp thông tin dự đoán về kết quả có thể

có của một thử nghiệm nào đó và khả năng mới này cung cấp các yếu tố liên quan để thiết lập thứ tự ưu tiên cho một chất mới cho các thử nghiệm [35]

Như vậy, để có thể xây dựng được các mô hình này thì cả cấu trúc và hoạt tính đều phải được định lượng hóa Trong nghiên cứu này, các cấu trúc được định lượng thông qua các TSPT (biến x), biến Y là giá trị logIC50 với

IC50 là nồng độ ức chế 50% hoạt tính của enzym HDAC2, được đánh giá bằng các phương pháp nghiên cứu thực nghiệm sử dụng Kit định lượng Bioscence®) Giá trị logIC50 thu được bằng cách xử lí dữ liệu IC50 bằng phần mềm Microsoft Excell 2007 IC50 càng nhỏ hoạt tính ức chế enzym HDAC2 của chất đó càng mạnh

- Tính toán TSPT: Tham số mô tả phân tử là một số thu được từ một

quá trình toán học và lôgic chuyển đổi thông tin được mã hóa trong cấu trúc hóa học [37] Trong nghiên cứu này, các tham số được tính toán sử dụng phần

Trang 33

mềm Dragon [37] Dragon là một phần mềm được phát triển bởi công ty Talete của Italia vào năm 1993, được sử dụng rất rộng rãi hiện nay trong các nghiên cứu hóa tin và thiết kế thuốc Dragon tính toán được hơn 5000 TSPT khác nhau Các mô tả phân tử thường được phân loại dựa vào chiều thông tin mô tả cấu trúc (i) Tham số 0D mô tả thành phần cấu tạo nên cấu trúc, còn được gọi là các tham số đếm nguyên tử, như số lượng C, N (ii) Tham số 1D

mô tả cấu tr c dưới dạng chuỗi, như vân tay cấu trúc (fingerprint), hay số lượng các mảnh cấu tr c, như số lượng nhân thơm, nhóm carboxylic (iii) Tham số 2D mô tả cấu tr c dưới dạng hình học topo, cho phép xác định chính xác thứ tự, vị trí của nguyên tố hay mảnh cấu trúc trong phân tử Các tham số 2D thường được tính toán dựa trên lý thuyết về graph (iii) Tham số 3D mô tả đặc điểm cấu trúc của phân tử trong không gian Các tham số 3D có thể được tính toán dựa trên các phương pháp l thuyết như MoRSE, GETAWAY, tính toán lượng tử, mô tả bề mặt hoặc thể tích phân tử

Trong nghiên cứu này chúng tôi lựa chọn tham số phân tử 2D để mô tả cấu trúc các hợp chất Bởi so với các mô tả phân tử 3D thì mô tả phân tử 2D không cần tới các thông tin về cấu trúc 3D của phân tử, có tính ổn định cao hơn do các hợp chất được mô tả dưới dạng 3D thường có độ linh động về cấu dạng

Kết quả: Sử dụng phần mềm Dragon 6.0 tính toán được 3764 TSPT cho mỗi phân tử trong CSDL Sau khi xử lí loại bỏ TSPT gây nhiễu, 1632 TSPT còn lại được kiểm tra quan hệ phi tuyến với biến đáp ứng LogIC50 Cuối cùng các hợp chất được tính toán với 534 TSPT 2D và lưu dưới dạng file.txt

- Phân chia tập huấn luyện / tập kiểm tra

Sử dụng phương pháp phân chia ngẫu nhiên chia 45 hợp chất trong CSDL thành 34 hợp chất được phân vào tập huấn luyện, 11 hợp chất được phân vào tập kiểm tra

- Xây dựng mô hình: Lựa chọn tham số phân tử bằng phương pháp

thuật giải di truyền sử dụng phần mềm Mobydigs 1.0 Sau đó xây dựng mô hình QSAR trên tập huấn luyện bằng phương pháp MLR sử dụng phần mềm

Trang 34

STATISTICA 10.0 để xác định tương quan hoạt tính ức chế với tham số mô

tả phân tử Dragon

 Lựa chọn TSPT thích hợp: tất cả các biến không phải được đưa hết vào mô hình Mặc dù việc thêm biến độc lập vào làm tăng hệ số tương quan R2, nhưng nó chỉ tốt khi chúng có liên hệ mạnh với biến phụ thuộc Mô hình được chọn ứng với mô hình có Q2

cao nhất Thực hiện thuật giải di truyền để chọn mô hình có các biến tối ưu bằng phần mềm Mobydigs 1.0

Thuật giải di truyền dựa trên cơ chế của chọn lọc tiến hóa trong tự nhiên: “Trong mọi thế hệ, một tập mới các sinh vật được tạo ra bằng cách lai ghép những nhân tố thích hợp nhất với môi trường của những sinh vật trong thế hệ cũ cùng với sự xuất hiện đột biến ngẫu nhiên của các cá thể trong thế

hệ mới” Vận dụng cơ chế này, đầu tiên thuật toán sẽ mã hoá tất cả các tham

số của cấu tr c ban đầu trong một nhiễm sắc thế - biểu diễn bằng một vec tơ

Từ nhiễm sắc thể ban đầu này, tạo ngẫu nhiên một quần thể Quần thể này được đánh giá và từ đó các nhiễm sắc thể thích nghi nhất (tức là có hàm mục tiêu Q2 cao nhất) được chọn làm khung để tạo ra quần thể tiếp theo Quy trình này làm tăng Q2

của toàn bộ nhiễm sắc thể bằng cách truyền các đặc tính cấu trúc thuận lợi từ một quần thể này sang một quần thể khác Sau một số chu kỳ tìm kiếm và đánh giá, cuối cùng ta sẽ tìm được một nhiễm sắc thể (mô hình) phù hợp với giá trị Q2 cao nhất

Các bước thực hiện thuật giải di truyền:

(1) Khởi tạo một quần thể ban đầu (file đầu vào được lưu dưới dạng file.mdd chứa các dữ liệu về tên, các mô tả phân tử được tính toán bằng phần mềm Dragon 6.0, giá trị log IC50 của các hợp chất trong tập huấn luyện)

(2) Xác định hàm mục tiêu (fitness) cho mỗi cá thể trong quần thể Hàm mục tiêu trong nghiên cứu này là giá trị Q2

(3) Tạo ra quần thể mới bằng cách lai ghép chéo (crossver) từ các cá thể hiện tại có chọn lọc (selection), đồng thời tạo ra các đột biến (mutation) trong quần thể mới theo một xác suất nhất định Quá trình này thực hiện thông qua cài đặt giải thuật di truyền (Genetic Algorithm set up)

Trang 35

(4) Các cá thể trong quần thể mới được sinh ra thay thế cho các cá thể trong quần thể cũ

(5) Nếu điều kiện dừng, giải thuật dừng lại và trả về cá thể tốt nhất cùng với giá trị hàm mục tiêu của nó

Kết quả đã lựa chọn được 6 tham số mô tả phân tử có thể xây dựng mô hình tốt nhất Đó là ATS8m, JGI10, SM15_AEA(bo), SM08_AEA(dm), SM09_AEA(dm), B06[N-O]

 Lập mô hình với số biến đã chọn bằng phương pháp hồi qui đa biến tuyến tính (MLR) bằng phần mềm STATISTICA 10.0 MLR là một trường hợp rất phổ biến trong thực tế, là tổ hợp tuyến tính giữa các biến phụ thuộc (Y) với nhiều biến độc lập (x) Trong nghiên cứu này x chính là các TSPT đặc trưng cho cấu trúc các hợp chất trong CSDL, Y là giá trị logIC50

với IC50 là nồng độ ức chế 50% hoạt tính của enzyme HDAC2 Phân tích hồi qui bao hàm cả nghĩa “ước tính” (Estimating) hay “dự đoán” (Predictive) vì sau khi sự tương quan tuyến tính giữa x và Y được thiết lập bởi một biểu thức toán học cụ thể người ta có thể ước tính hay dự đoán giá trị của Y từ một giá trị của x Đường biểu diễn biểu thức toán học ấy được gọi là đường hồi qui của Y theo x

Kết quả mô hình MLR xây dựng được gồm 6 biến TSPT như sau:

LogIC50 = 2.808 + 0.064×ATS8m – 230.167×JGI10 –

1.072×SM15_AEA(bo) – 2.821×SM08_AEA(dm) + 3.519×SM09_AEA(dm) – 0.700×B06[N-O]

(3.1) Trong đó ATS8m, JGI10, SM15_AEA(bo), SM08_AEA(dm), SM09_AEA(dm), B06[N-O] là các biến tham số phân tử 2D Hệ số của biến mang dấu (+), giá trị biến TSPTcàng lớn thì logIC50 càng lớn, IC50 càng lớn chứng tỏ hoạt tính ức chế enzyme HDAC2 của chất đó càng nhỏ Và ngược lại, hệ số biến mang dấu (-), giá trị biến TSPTcàng lớn thì logIC50 càng nhỏ,

IC50 càng nhỏ, hoạt tính ức chế enzyme HDAC2 càng lớn

Trang 36

3.1.2 Đánh giá mô hình theo các tiêu chí của OECD

Đánh giá mô hình QSAR là công việc quan trọng nhất quyết định việc

mô hình xây dựng được có thể sử dụng để dự đoán sàng lọc hay không Để sử dụng và được thông qua mô hình QSAR bởi các cơ quan quản lý, mô hình phải thỏa mãn các nguyên tắc, tiêu chí của OECD (Tổ chức kinh tế thế giới):

Tiêu chí 1: Toàn bộ CSDL đều sử dụng đích xác định là nồng độ ức

chế 50% (IC50) enzym HDAC2 được tiến hành theo cùng một điều kiện thí nghiệm là sử dụng Kit định lượng Bioscence®

Tiêu chí 2: Thuật toán áp dụng rõ ràng: Các phương pháp xây dựng mô

hình trong nghiên cứu chúng tôi đã nêu rõ trong mục 2.2 Do tính rõ ràng và

đ ng đắn của phương pháp mà mô hình có thể được sử dụng lặp lại để phát hiện các hợp chất mới ức chế HDAC2

Tiêu chí 3: Xác định miền ứng dụng của mô hình

Để đạt được khả năng dự đoán tốt trong sàng lọc ảo, việc xác định được miền ứng dụng của mô hình QSAR là vô cùng cần thiết Miền ứng dụng là khoảng không gian cấu trúc bao gổm trong mô hình Chỉ những dự đoán đối với các hợp chất có cấu trúc nằm trong miền cấu trúc này mới đáng tin cậy

Miền ứng dụng được xây dựng dựa trên mối quan hệ giữa phần dư

chuẩn (Standardized Residual) và giá trị “đòn bẩy” (Leverage) (ký hiệu là h)

tính được cho từng hợp chất Biểu đồ dưới đây (Hình 3.1) cho thấy mối quan

hệ giữa phần dư chuẩn và giá trị h Chỉ số h cho biết một chất có ảnh hưởng

tới không gian cấu trúc của biến như thế nào Giá trị giới hạn của h gọi là h*,

h* là một ngưỡng quan trọng để tham chiếu các dự đoán bởi mô hình QSAR

cho hợp chất trong Tr và Te được tính toán theo công thức: h* = 3p/N, trong

đó p là số biến độc lập trong mô hình (3.1), N là số lượng quan sát trong tập

huấn luyện Miền ứng dụng được xác định là phần giới hạn bởi khung vuông

± 3 phần dư chuẩn đối và h* bằng 0.6

Ngày đăng: 14/05/2021, 16:21

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w