1. Trang chủ
  2. » Luận Văn - Báo Cáo

Bước đầu xây dựng cơ sở dữ liệu các hợp chất thiên nhiên việt nam phục vụ cho việc sàng lọc ảo

57 103 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 57
Dung lượng 3,84 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ2.1 CSDL ban đầu với các thông tin được thu thập và trình bày trên 15 Exel 3.1 Biểu đồ biểu thị sự phân bố của các nhóm phân loại chính của các 22 ghi nhận đư

Trang 1

ĐẠI HỌC QUỐC GIA HÀ NỘI

KHOA Y – DƯỢC

NGUYỄN THỊ THU HÀ

BƯỚC ĐẦU XÂY DỰNG CƠ SỞ DỮ LIỆU CÁC HỢP CHẤT THIÊN NHIÊN VIỆT NAM PHỤC VỤ CHO VIỆC SÀNG LỌC ẢO

KHÓA LUẬN TỐT NGHIỆP DƯỢC SĨ ĐẠI HỌC

Hà Nội – 2017

Trang 2

ĐẠI HỌC QUỐC GIA HÀ NỘI

KHOA Y DƯỢC

NGUYỄN THỊ THU HÀ

BƯỚC ĐẦU XÂY DỰNG CƠ SỞ DỮ LIỆU CÁC HỢP CHẤT THIÊN NHIÊN VIỆT NAM PHỤC VỤ CHO VIỆC SÀNG LỌC ẢO

KHÓA LUẬN TỐT NGHIỆP DƯỢC SĨ ĐẠI HỌC Khóa: QH.2012.Y

Người hướng dẫn:

Hà Nội – 2017

Trang 3

viên Bộ môn Dược lý - Dược lâm sàng, Khoa Y-Dược, Đại học Quốc gia Hà Nội đã giao

đề tài và luôn ở bên tôi trong suốt quá trình làm luận văn, chỉ bảo tôi về chuyên môn cũng như động viên tôi trong cuộc sống, giúp tôi hoàn thành tốt đề tài nghiên cứu.

Tôi xin chân thành cảm ơn TS Đặng Thanh Hải, giảng viên Khoa Công nghệ

thông tin, trường Đại học Công nghệ, Đại học Quốc gia Hà Nội đã giúp tôi đưa CSDL

ra giao diện web Bên cạnh đó tôi xin gửi lời ơn tới ban quản lý thư viện Quốc gia, thư viện đại học Dược Hà Nội, thư viện Viện hàn lâm Khoa học Công nghệ, tạp chí Dược học… các nhà sáng lập và quản lý của ChemAxon, ChemMine Tools, ClassyFire - The Metabolomics Innovation Centre (TMIC)… đã tận tình giúp đỡ tôi trong suốt thời gian thực hiện luận văn.

Cuối cùng, xin bày tỏ lòng biết ơn sâu sắc nhất tới gia đình, người thân và bạn

bè là những người đã luôn quan tâm, chăm sóc và động viên tôi trong suốt thời gian học tập và làm việc.

Xin trân trọng cảm ơn!

Hà nội, ngày tháng năm

Sinh viên

DANH MỤC CÁC KÍ HIỆU, CHỮ VIẾT TẮT

Trang 4

International Union of Pure and Applied Chemistry

(Liên minh Quốc tế về Hóa học thuần túy và Hóa học ứng dụng)

National Institute of Standards and Technology

(Viện Tiêu chuẩn và Công nghệ Mỹ)

Simplified Molecular Identification and Line Entry System

(Hệ thống đơn giản hóa với đầu vào dưới dạng dòng để biểu diễnphân tử)

IUPAC International Chemical Identifier

(Nhận dạng hóa học quốc tế theo IUPAC)

IUPAC International Chemical Identifier Key

(Dạng rút gọn của nhận dạng hóa học quốc tế theo IUPAC)

Molecular ACCess System (Hệ thống truy cập phân tử) National Cancer Institute (Viện ung thư quốc gia Mỹ) Vietnam Natural Products Database _Identification

(Định danh của hợp chất trong cơ sở dữ liệu các hợp chất tự nhiênViệt Nam)

Trang 5

MỤC LỤC

DANH MỤC CÁC KÍ HIỆU, CHỮ VIẾT TẮT

DANH MỤC CÁC BẢNG

DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ

ĐẶT VẤN ĐỀ 1

CHƯƠNG 1 TỔNG QUAN TÀI LIỆU 3

1.1 Nghiên cứu các hợp chất thiên nhiên 3

1.1.1 Vai trò hợp chất thiên nhiên trong quá trình nghiên cứu và phát triển thuốc hiện đại 3

1.1.2 Y học cổ truyền 4

1.1.3 Tổng quan về quá trình nghiên cứu phát triển thuốc mới 6

1.2 Tổng quan về CSDL các hợp chất có nguồn gốc tự nhiên 7

1.2.1. Trên thế giới 7

1.2.2. Tại Việt Nam 8

1.3 Cơ sở dữ liệu các hợp chất 9

1.3.1 Biểu diễn và nhận dạng các hợp chất hóa học bởi máy tính 9

1.3.2 Thông tin liên quan về hợp chất được phân lập 11

1.3.3 Các đặc tính vật lý và hóa hoc của hợp chất 11

1.4 Khai thác CSDL 11

1.4.1. Sử dụng CSDL 12

1.4.2 Ứng dụng CSDL cho quá trình sàng lọc ảo in silico 12

1.4.3 Xây dựng các hệ thống để xác định mục tiêu phân tử của các hợp chất 13

CHƯƠNG 2 ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU 14

2.1 Đối tượng nghiên cứu 14

2.2 Phương pháp, thiết bị nghiên cứu 14

2.2.1 Phương pháp thu thập số liệu 14

2.2.2 Phương pháp xử lý số liệu 14

2.2.3 Thiết lập giao diện website 17

2.2.4 Thiết bị nghiên cứu 19

CHƯƠNG 3 KẾT QUẢ VÀ THẢO LUẬN 20

3.1. Nội dung CSDL các hợp chất có nguồn gốc thiên nhiên Việt Nam 20

3.1.1 Số lượng các hợp chất 20

3.1.2 Phân loại các hợp chất theo đặc điểm cấu trúc hóa học 20

Trang 6

3.1.3 Phân loại các hợp chất theo nhóm tác dụng sinh học 27

3.1.4 Đánh giá mức độ giống thuốc theo quy tắc số 5 của Lipinski 30

3.2 VNPD website 31

KẾT LUẬN VÀ KIẾN NGHỊ 35

Tài liệu tham khảo

Phụ lục 1

Phụ lục 2

Phụ lục 3

Phụ lục 4

Phụ lục 5

Trang 7

DANH MỤC CÁC BẢNG

thiên nhiên

Trang 8

DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ

2.1 CSDL ban đầu với các thông tin được thu thập và trình bày trên 15

Exel

3.1 Biểu đồ biểu thị sự phân bố của các nhóm phân loại chính của các 22

ghi nhận được trong CSDL

theo quy tắc số 5 của Lipinski

3.6 Giao diện VNPD cung cấp các thông tin về hợp chất Barlupulin A 32

VNPD

VNPD

Trang 10

ĐẶT VẤN ĐỀ

Thuốc có nguồn gốc tự nhiên đóng góp một phần quan trọng trong hệ thốngchăm sóc sức khỏe trên toàn thế giới Theo ước tính của tổ chức Y tế Thế giới (WHO),80% dân số trên toàn thế giới sử dụng thuốc có nguồn gốc tự nhiên như một lựa chọnhàng đầu trong việc phòng và chữa bệnh Gần đây, do xu hướng toàn cầu của việc sửdụng các sản phẩm tự nhiên trong phòng ngừa và điều trị các bệnh về thể chất và tinhthần, thảo dược ngày càng được chú ý trong các điều tri lâm sàng trên toàn thế giới

Trong kỷ nguyên thống trị của hóa học tổ hợp hiện đại, người ta có thể sửdụng phương pháp tổng hợp, bán tổng hợp để tạo ra các phân tử mới, thiết kế cáccấu trúc thuốc mới Nhưng theo một số nghiên cứu đã được công bố, các hợp chất

có nguồn gốc tự nhiên có các đặc tính hóa học giống thuốc hơn so với các hợp chấttổng hợp được từ hóa tổ hợp [41] Để tổng hợp một số lượng lớn các dữ liệu hóasinh và rút ngắn thời gian phát minh thuốc mới, các CSDL phân tử đã được xâydựng và trở thành một công cụ hữu ích cho các nhà thiết kế thuốc Trong số đó,CSDL cấu trúc của các hợp chất được phân lập từ thảo dược tự nhiên mang lạinhiều ứng dụng hiệu quả trong thực tế, các thảo dược tự nhiên có thể được xem như

là một nguồn phong phú và tiềm năng, là các ứng viên làm thuốc [20]

Khoa học hiện đại giúp chúng ta có thể phân tích sâu hơn về dược liệu, từ cácthành phần hóa học cấu thành đến các tác dụng dược lý liên quan qua những nghiêncứu thực nghiệm Hàng năm có rất nhiều báo cáo về phân lập và chiết tách cácthành phần hóa học của cây được công bố trên các tạp chí khoa học ở quy mô quốcgia, quy mô quốc tế Nhưng các báo cáo này chỉ dừng lại ở mức độ công bố màchưa thực sự đem lại được một giá trị thực tiễn Các báo cáo cung cấp cho chúng tanhững thông tin tương đối đầy đủ và đáng tin cậy về các hợp chất hóa học đượcphân lập từ cây thảo dược với cấu trúc hóa học, định danh, tác dụng dân gian, tácdụng dược lý đã được chứng minh, nguồn dược liệu làm thí nghiệm …

Mặc dù ta có được một lượng thông tin lớn và đa dạng về các hợp chất, nhưngchỉ có một tỷ lệ nhỏ trong sự đa dạng đó được khai thác nghiêm túc cho tiềm năngdược lý của nó Những thông tin này đã được nghiên cứu và công bố rộng rãi nhưngchưa có một sự quy tụ hay quản lý chung, là một vấn đề khó khăn trong công tác tìmkiếm và chọn lựa đối với các nhà khoa học Do vậy, việc đưa ra các giải pháp thu thập

và quản lý một cách hiệu quả là vấn đề rất cần thiết hiện nay, đặc biệt là những đề xuất,giải pháp mang tính công nghệ ứng dụng Đối với vấn đề quản lý hiệu quả

Trang 11

thì việc đề xuất các giải pháp ứng dụng công nghệ thông tin vào xây dựng CSDL và

hệ thống phần mềm giúp cho việc thu thập, quản lý và tra cứu là hết sức cần thiết

Trên thế giới, một số quốc gia phát triển như Trung Quốc, Nam Phi, Brasil đã

xây dựng thành công hệ CSDL về các hợp chất phân lập từ thảo dược thiên nhiên ởđất nước họ [1, 8, 22] Và đã có một số báo cáo ghi nhận các trường hợp thiết kếthuốc thành công dựa trên các tìm kiếm CSDL cấu trúc đó Ngày nay, việc tìm kiếmcác hoạt chất tự nhiên có hoạt tính sinh học cao để làm thuốc là một xu thế được rấtnhiều các nhà khoa học quan tâm Việt Nam là một trong những quốc gia thuộc cácvùng nhiệt đới – nơi chứa đựng giá trị đa dạng sinh học cao chưa được khám phá,đây như là một tiềm năng và cũng là một thách thức lớn cho việc xây dựng và khaithác CSDL một cách tối ưu nhất

Do đó, chúng tôi tiến hành đề tài: “Bước đầu xây dựng cơ sở dữ liệu các hợp chất thiên nhiên Việt Nam phục vụ cho việc sàng lọc ảo” với các mục tiêu chính

Trang 12

CHƯƠNG 1 TỔNG QUAN TÀI LIỆU 1.1 Nghiên cứu các hợp chất thiên nhiên

1.1.1 Vai trò hợp chất thiên nhiên trong quá trình nghiên cứu và phát triển thuốc

hiện đại

Hợp chất thiên nhiên (hay hợp chất tự nhiên, natural products) là các chất hóa

học có nguồn gốc từ thiên nhiên hoặc được chiết xuất từ các mô của động vật, thựcvật trên cạn; sinh vật biển; vi khuẩn lên men; vi sinh vật [35] Hầu hết các hợp chất

tự nhiên có hoạt tính sinh học là các chất chuyển hóa thứ cấp có cấu trúc rất phứctạp Điều này làm chúng có tính ưu trội hơn vì chúng là các hợp chất cực kỳ mới.Thực vật được cấu thành bởi một hệ thống lớn và đa dạng các chất hóa học, chúng

có thể cung cấp những hợp chất với cấu trúc có độ phức tạp cao mà không thể tổng hợpđược trong các phòng thí nghiệm Những phân tử nhỏ này cung cấp nguồn hoặc là tiềnchất cho phần lớn các hoạt chất được FDA chấp thuận và hiện đang là một trong nhữngnguồn cảm hứng chính cho việc nghiên cứu và phát hiện thuốc mới

Có nhiều chất dẫn đường có nguồn gốc từ thực vật [46] (ví dụ morphin, cocain,digitalis, quinin, tubocurarin, nicotin, muscarin…) Một số đóng vai trò trực tiếp lànhững loại thuốc hữu ích (ví dụ morphin và quinin), và một số khác là cơ sở chotổng hợp các hoạt chất làm thuốc (ví dụ như thuốc gây mê cục bộ phát triển từcocain) Gần đây trong lâm sàng, một số loại thuốc mới đã được phân lập từ thực

vật bao gồm thuốc chống ung thư paclitaxel (Taxol) từ cây thủy tùng, và thuốc

chống sốt rét artemisinin từ câu thanh hao hoa vàng

Nhiều thực vật bậc cao chứa các chất chuyển hóa mới có tính kháng khuẩn vàkháng virus [33] Ở những nước phát triển, các ca lâm sàng có dử dụng hóa trị liệu

thường dùng các thuốc đã được sản xuất bằng hóa tổng hợp in vitro; nhưng taxol và

vincristin là ngoại lệ [42], chúng là các chất chuyển hóa có cấu trúc phức tạp, rấtkhó tổng hợp trong ống nghiệm Nhiều loại thuốc tổng hợp và bán tổng hợp gây racác phản ứng phụ nghiêm trọng, nhất là các thuốc dùng điều trị cho bệnh nhân ungthư với các tác dụng phụ biểu hiện trên da một cách rất nghiêm trọng Các chấtchuyển hóa được phát hiện trong một số loài thực vật có thể tránh tác dụng phụ củathuốc tổng hợp vì chúng đã từng tích tụ trong các tế bào sống [36]

Việc khám phá và phân lập nhiều hợp chất dược liệu từ các nguồn tự nhiên mộtphần là do các đặc tính đã biết của các sinh vật chứa các chất này Một trong nhữnghợp chất tinh khiết được phân lập đầu tiên trong lịch sử y học là morphin vào khoảng

năm 1804 bởi Friedrich Serturner từ thuốc phiện [49] Vào thời điểm đó, thuốc phiện

được gọi là thuốc gây nghiện, mặc dù nó đã được sử dụng nhiều trong điều trị giảm

Trang 13

đau vào thời Trung cổ Thuốc kháng sốt rét, quinin đã được Pelletier và Caventou phân lập từ cây vỏ cây cinchona vào năm 1820 [47] Loại vỏ cây này đã được sử dụng để

điều trị sốt rét từ những năm 1600 và cũng là một phần của y học cổ truyền Nam Mỹ đểđiều trị bệnh sốt Sự gia tăng tính kháng thuốc đối với quinin và dẫn chất của nó dẫnđến nhu cầu về thuốc sốt rét thay thế và ta có artemisinin được phân lập từ cây thanhhao hoa vàng [44] Một thuốc giảm đau tự nhiên khác, và là một trong những loại thuốcđược sử dụng rộng rãi nhất mọi thời đại [51], là axit acetylsalicylic, được đăng ký dướitên "Aspirin" [23] Tiền thân của nó là axit salicylic từ vỏ cây liễu, lá của cây này đượcngười Ai Cập cổ đại sử dụng với tác dụng giảm đau và chống viêm

Sự khám phá ngẫu nhiên penicillin vào năm 1928 đã đánh dấu một mốc quan

trọng cho nền Y học hiện đại Alexander Fleming đã nghiên cứu và quan sát được vi khuẩn Staphylococcus không thể phát triển xung quanh một khu vực nhỏ xung quanh khuôn của chi Penicillium [6] Fleming đã thử nghiệm ảnh hưởng này lên các

vi sinh vật khác nhau và suy luận rằng nó có tính kháng khuẩn

1.1.2 Y học cổ truyền

Theo Tổ chức Y tế Thế giới (WHO), định nghĩa Y học cổ truyền bao gồm các kỹnăng, kiến thức và thực hành được sử dụng trong chăm sóc sức khoẻ dựa trên kinhnghiệm hoặc tín ngưỡng của các nền văn hoá khác nhau [52]

Từ ngàn năm xưa, sự hình thành và phát triển các nền văn minh cổ đại phụ thuộcrất nhiều vào hệ thực vật và động vật bản địa Họ đã thử nghiệm với nhiều quảmọng, lá, rễ, các bộ phận động vật hoặc khoáng chất để tìm ra những thứ có lợi cho

họ Do đó, nhiều thuốc thô đã được quan sát bởi các thầy lang tại địa phương hoặcthầy pháp sư và được sử dụng để chữa bệnh Mặc dù một số chế phẩm có thể gâynguy hiểm nhưng các phương pháp chữa bệnh truyền thống đã thu được những hiệuquả đáng kể, và thực tế hầu hết các loại thuốc tây cho đến những năm 1920 đượcphát triển theo cách này [26] Nền Y học cổ truyền phương Đông đã trải qua hàngnghìn năm hình thành và phát triển, dù là cách thức hay phương tiện khác nhaunhưng sự kết hợp của nền Y học cổ truyền với Y học hiện đại đã đem lại nhiều hiệuquả cao trong công tác chăm sóc sức khỏe con người [37]

Các tài liệu của Y học Trung Quốc về phản ứng của artemisia đối với bệnh sốtrét cũng là nguồn gốc của artemisinin chống sốt rét ngày nay [40] Các đặc tính trịliệu của cây thuốc phiện (hoạt chất gốc - morphin) đã được biết đến ở Ai Cập cổ

đại Các nền văn hoá Aztec và Maya của Mesoamerica đã sử dụng chiết xuất từ nhiều loại cây bụi bao gồm gốc rễ ipecacuanha (hoạt chất emetin), cây coca (hoạt chất cocain) và vỏ cây cinchona (hoạt chất quinin).

Trang 14

Trên thế giới, nhu cầu về các lựa chọn chăm sóc sức khoẻ theo YHCT đã tănglên trong những năm gần đây với xu hướng quay về với thiên nhiên của con ngườihiện nay [13] Ở nhiều vùng nông thôn, người dân không có điều kiện được hưởngnhững chăm sóc y tế hiện đại, YHCT lại đóng vai trò quan trọng trong công tácchăm sóc và bảo vệ sức khỏe cho con người nơi đây [37] Y học cổ truyền cũngđược coi là một phần của một số nền văn hoá.

1.1.2.1 Nền Y học cổ truyền Việt Nam

Từ xa xưa các lý luận triết học duy vật cổ đại (thuyết âm dương, ngũ hành )

đã được các nhà y học cổ phương Đông vận dụng vào y học trong mọi lĩnh vực từphòng bệnh đến chẩn trị, bào chế thuốc men, làm phong phú thêm cho kho tàng lýluận của y học cổ truyền

Đặc biệt dưới thời nhà Trần, trong lúc triều đình và giới quan lại quyền quýsính dùng thuốc Bắc thì thầy thuốc Tuệ Tĩnh với tinh thần độc lập tự chủ đã đềxướng lên quan điểm “Nam dược trị Nam nhân” qua tác phẩm Nam dược thần hiệu(được bổ sung và in lại năm 1761) Tuy nhiên, phải đến thời Hậu Lê, thì toàn bộnhững lý luận, học thuật của Trung Quốc và Việt Nam mới được tổng kết ở mức độuyên thâm nhất qua tác phẩm Hải Thượng Y Tôn Tâm lĩnh của Lê Hữu Trác (1720 -1791) Ngoài tác phẩm kinh điển vĩ đại của Hải Thượng Lãn ông Lê Hữu Trác còn

có thêm: Nam Dược của Nguyễn Hoành (Tây Sơn) giới thiệu 500 dược thảo và 130dược liệu từ khoáng vật và động vật Trong thế kỷ 20 các vị danh y Việt Nam cũng

đã biên soạn trên 200 tập sách có giá trị về Đông y bằng tiếng Quốc ngữ

Ngày nay dược liệu nói chung và thuốc YHCT nói riêng đã có trong danhmục thuốc thiết yếu

1.1.2.2 Tiềm năng nguồn dược liệu Viêt Nam

Theo kết thống kê của Viện Dược liệu, tính đến năm 2017 đã ghi nhận được5.117 loài thực vật và nấm lớn, 52 loài tảo biển, 408 loài động vật và 75 loài khoángvật có công dụng làm thuốc Trong số đó, có khoảng 70 loài có tiềm năng khai thácvới tổng trữ lượng khoảng 18.000 tấn/năm như diếp cá (5.000 tấn), cẩu tích (1.500tấn), lạc tiên (1.500 tấn), rau đắng đất (1.500 tấn)…Đặc biệt, Việt Nam sở hữunhiều loài dược liệu quý, hiếm, đặc hữu như: Sâm Ngọc Linh, Ba kích, Châu thụ,Ngân đằng… Kết quả này cho thấy nguồn dược liệu ở nước ta rất phong phú Con

số này còn có thể sẽ tăng thêm, nếu đi sâu điều tra cụ thể hơn một số nhóm động –thực vật tiềm năng, mà trong đó số loài Tảo, Rêu, Nấm và Côn trùng làm thuốc mớiđược thống kê còn quá ít

Trang 15

Chiến lược quốc gia phát triển ngành dược đến năm 2020 đã đặt mục tiêuphấn đấu sản xuất được 20% nhu cầu nguyên liệu cho sản xuất thuốc trong nước;thuốc sản xuất trong nước chiếm 80% tổng giá trị thuốc tiêu thụ trong năm, trong đóthuốc từ dược liệu chiếm 30%.

1.1.3 Tổng quan về quá trình nghiên cứu phát triển thuốc mới

Con đường phát triển thuốc là một con đường rất dài và gặp nhiều khó khăn,tốn kém Tỷ lệ thành công thấp, rủi ro cao và chi phí ngày càng nhiều là những điềuchúng ta thường nghe thấy khi đề cập đến quá trình nghiên cứu và phát triển thuốctrong thời gian gần đây Quá trình phát triển đó thể hiện qua biểu đồ dưới đây:

Hình 1.1: Quá trình nghiên cứu và phát triển thuốc mới

Toàn bộ giai đoạn chiếm thời gian khoảng 15 – 25 năm, từ khoảng 10.000 hoạtchất tiềm năng ở bước 1 đến duy nhất 1 thuốc ở bước 4, và chi phí khoảng 2 tới 3 tỷUSD Chi phí này bao gồm cả các thử nghiệm thất bại trong quá trình nghiên cứu Dovậy, số lượng thuốc mới trên thị trường ngày càng giảm sút Đối với các thuốc đượccấp phép bởi FDA cứ 10 thuốc thì chỉ có khoảng 2 thuốc có khả năng bù đắp lại đượcchi phí nghiên cứu ban đầu Theo hướng này, các ngành công nghiệp dược toàn cầu đã

sử dụng phương pháp mới trợ giúp bởi máy tính để tối ưu hóa quá trình này

Các phương pháp trợ giúp bởi máy tính được ứng dụng vào nhiều khâu củaquá trình nghiên cứu và phát triển thuốc, từ khâu tìm kiếm các hợp chất hóa học có

Trang 16

tác dụng sinh học, đến tối ưu hóa cấu trúc các hợp chất này nhằm tăng hoạt tính sinhhọc, giảm độc tính, tăng các tính chất dược động học của thuốc, đến các khâunghiên cứu tiền lâm sàng và lâm sàng [10, 18] Chúng được gọi chung là các

phương pháp “in silico”.

Các khái niệm về sàng lọc in silico (sàng lọc ảo) xuất hiện vào những năm 60 của thế kỷ XX với các mô hình của Hansch Thế nhưng, chỉ từ năm 1990 thì lĩnh

vực này mới có nhiều bước tiến và từ đó đến nay, ngày càng phát triển mạnh mẽ

Mô hình in silico không những bổ sung cho các mô hình thực nghiệm mà còn giúp định hướng quá trình tổng hợp/phân lập các chất Ngoài ra sau khi được xây dựng,

việc sử dụng các mô hình này tương đối rẻ (tiết kiệm nguyên liệu thử), nhanh vàcho phép làm việc với số lượng lớn lên tới hàng triệu hợp chất, một điều không thểlàm được trong các mô hình thực nghiệm Các kỹ thuật sàng lọc ảo có nhiều ứngdụng trong nghiên cứu về thiết kế thuốc, phát triển các hợp chất ức chế trên đíchsinh học khác nhau, điển hình như các đích phân tử cho những bệnh đang đượcquan tâm hiện nay như ung thư, bệnh do ký sinh trùng, bệnh HIV,…

1.2 Tổng quan về CSDL các hợp chất có nguồn gốc tự nhiên

1.2.1 Trên thế giới

Ngày nay trên thế giới, đặc biệt là ở các nước phát triển như Mỹ, Trung Quốc,các nước châu Âu… đã xây dựng và đưa vào ứng dụng thành công các CSDL, các ngânhàng cấu trúc về các hợp chất Các hợp chất hóa học được biểu diễn dưới các định dạngkhoa học thống nhất, bằng ngôn ngữ máy tính được tập hợp và lưu trữ trong các kho dữ

liệu phục vụ hữu ích cho các nhà nghiên cứu; đặc biệt trong quá trình sàng lọc in silico

để tìm ra hợp chất dẫn đường, có tiềm năng làm thuốc [11, 19] Bảng 1.1 và Phụ lục 1

tổng hợp một số CSDL lớn và được dùng phổ biến hiện nay, chúng gồm các hợp chất

có nguồn gốc tự nhiên và các hợp chất tổng hợp bán tổng hợp nhân tạo Ngày nay cácngân hàng cấu trúc được biệt lập và phát triển hơn với những CSDL đặc thù về các hợpchất có nguồn gốc tự nhiên, hầu hết các CSDL này có tính chất phi thương mại và đượcxây dựng dưới dạng một giao diện web Người dùng có thể tìm kiếm thông tin về hợpchất dựa trên nhiều lựa chọn tìm kiếm khác nhau theo tên thông thường, tên IUPAC,SMILES, InChi, tính chất phân tử… [8, 22] Một số CSDL còn hỗ trợ cho phép ngườidùng tải về cấu trúc hợp chất dưới dạng molfile hoặc sdffile Một số CSDL lớn cungcấp cho người truy cập thêm thông tin về các dự đoán với mục tiêu phân tử của hợpchất tiềm năng trong Y học hiện đại hay ước tính hoạt động phân tử theo tác dụng cổtruyền của thảo dược

Trang 17

Bảng 1.1: Một số CSDL công cộng có chứa các hợp chất có nguồn gốc thiên nhiên [29].

Tên CSDL Địa chỉ website Số lượng Số lượng hợp chất có

hợp chất nguồn gốc thiên nhiên ChEBI www.ebi.ac.uk/chebi >6.800 ~3.500

ChemBank chembank.broad.harvard.edu >1.100.000 Chưa có thông tin

ChemID chem.sis.nlm.nih.gov/chemidplus >379.000 ∼2.000

NCI cactus.nci.nih.gov/ncidb3/downl >260.000 Chưa có thông tin

oad_ncidb3.html

PubChem pubchem.ncbi.nlm.nih.gov >5.000.000 Chưa có thông tin

TCMDatabase@Taiwan [8] được coi là hệ CSDL lớn nhất hiện nay CSDL

chứa 37.170 hợp chất (32.364 không trùng lặp) được phân lập từ 352 loài thảo dượcTrung Quốc

Bảng 1.3: Một số CSDL về hợp chất có nguồn gốc tự nhiên trên thế giới

CSDL Địa chỉ website Số lượng Đơn vị hỗ trợ và quản

TCM Database@Taiwan

http://tcm.cmu. Đại học y Trung Quốc,

Database@Taiwan)

Chem-TCM database http://www.timt Đại học Hoàng gia

ec.net/natural- London, Vương quốc

NuBBE database http://nubbe.iq.

(A database of natural products unesp.br/portal/ 640 Đại học Sao Paulo

associated with Brazil) nubbedb.html

SANCDB

https://sancdb.r

Trang 18

compound database)

1.2.2 Tại Việt Nam

Thảo dược và các sản phẩm của chúng ngày càng nhận được sự quan tâm từcác nhà khoa học và các đề xuất nghiên cứu hiện nay Từ xu hướng chung cùng nhu

Trang 19

cầu thực tế, các công trình nghiên cứu về hợp chất thiên nhiên đã nở rộ và phát triểnmạnh ở nhiều đơn vị Đặc biệt trong một số dự án nghiên cứu tìm kiếm các hợp chấtdẫn đường, các đơn vị nghiên cứu đã tiến hành xây dựng được một số CSDL hợp chấtthiên nhiên phục vụ cho quá trình nghiên cứu của mình Tuy nhiên quy mô và phạm

vi quản lý của các CSDL còn nhiều hạn chế, các CSDL này mới dừng ở mức độ sử dụng nội bộ

1.3 Cơ sở dữ liệu các hợp chất

CSDL là một hệ thống các thông tin có cấu trúc được lưu trữ trên các thiết bịlưu trữ thứ cấp nhằm thoả mãn yêu cầu khai thác thông tin đồng thời của nhiềungười sử dụng hay nhiều chương trình ứng dụng với nhiều mục đích khác nhau.CSDL giúp tổ chức/quản lý thông tin một cách hiệu quả hơn; giảm sự trùng lặpthông tin xuống mức thấp nhất và do đó bảo đảm được tính nhất quán và toàn vẹn

dữ liệu; giúp tìm kiềm thông tin một cách hiệu quả hơn; dữ liệu có thể được truyxuất theo nhiều cách khác nhau; khả năng chia sẻ thông tin cho nhiều người sử dụng

và nhiều ứng dụng khác nhau

CSDL các hợp chất có nguồn gốc tự nhiên Việt Nam được xây dựng với mụcđích tập hợp và quản lý các hợp chất được phân lập từ các thảo dược Việt Namnhằm phục vụ cho việc sàng lọc ảo thuốc và là nguồn tham chiếu cho một số mụcđích nghiên cứu khoa học khác Các hợp chất được biểu diễn trong CSDL chứa cácthông tin về định dạng biểu diễn dòng (SMILES, InChi, InChiKey); số đăng ký tênhợp chất VNPD_ID; tên thông thường; tên IUPAC; công thức; thông tin về nguồndược liệu (tên nguồn dược liệu, tên khoa học, họ thực vật, địa điểm thu mẫu, thờigian thu mẫu, bộ phận dùng, tác dụng dân gian, tác dụng dược lý được chứngminh); phân loại nhóm cấu trúc; thông tin về các thông số lý hóa của hợp chất (khối

lượng phân tử, XlogP, Số liên kết cho Hydro, Số liên kết nhận Hydro, Số vi phạm quy tắc Số 5 của Lipinski, Số liên kết xoay đồng vị, Diện tích bề mặt hạt mang điện

và MACCS); tài liệu tham khảo

1.3.1 Biểu diễn và nhận dạng các hợp chất hóa học bởi máy tính

1.3.1.1 SMILES

SMILES (Simplified Molecular Identification and Line Entry System) là một

dạng ký hiệu ngôn ngữ hóa học được thiết kế đặc biệt để sử dụng trên máy tính [17].SMILES cho phép biểu diễn chính xác các đặc điểm cấu trúc bằng ngôn ngữ đơngiản và tự nhiên hơn Nó dễ dàng được truy cập và sử dụng trong các chương trìnhmáy tính hiện đại Tương tự như ký hiệu hóa học, nhưng nó được cải thiện vềphương pháp phần mềm do đó tốc độ nhanh hơn và sử dụng tốt hơn trên máy tính

Trang 20

Được phát triển như là một sự thay thế cho ký hiệu công thức dòng để biểudiễn cấu trúc hợp chất hóa học theo ngôn ngữ máy tính Nó cho phép một hợp chấtđược viết như một chuỗi văn bản theo năm quy tắc [30].

Cấu trúc phân tử là duy nhất và xác định, có thể được sử dụng với CSDL hóachất, hệ thống SMILES được thiết kế để có thể tương tác tốt hơn với máy tính Sự

mã hóa một cách nghiêm ngặt các hợp chất đầu vào giúp đơn giản hóa việc sử dụngSMILES trên các chương trình máy tính Hệ thống ký hiệu SMILES [10] rất thíchhợp để chạy trong các chu trình sàng lọc hiệu năng cao

1.3.1.2 InChI

InChi [38] (IUPAC International Chemical Identifier) được thiết kế là một định

danh không độc quyền, duy nhất cho một cấu trúc hóa học, được thiết kế để tạo thuận

lợi cho việc tìm kiếm và sử dụng các thông tin trong CSDL và trên web [3] Ban đầu

được phát triển bởi IUPAC và NIST 2000-2005, định dạng và các thuật toán là khôngđộc quyền, mã nguồn mở, được sử dụng tự do Miễn phí truy cập vào các chương trìnhmáy tính phát triển Nó được mô tả là một loại mã vạch chứa thông tin cấu trúc InChigồm nhiều lớp, mỗi lớp được phân tách bằng một dấu gạch chéo, mô tả các loại thôngtin khác nhau InChI có thể chứa một số lớp khác nhau cùng xác định công thức, kết

nối, đồng vị, cấu trúc và các tautomers của cấu trúc hóa học [3].

Các thuật toán Inchi chuyển đổi thông tin đầu vào thành một định dạng Inchiduy nhất trong một quá trình ba bước [38]: tiêu chuẩn hóa (để loại bỏ thông tin dựphòng), hợp quy (để gán số duy nhất cho mỗi nguyên tử), và tuần tự (đưa ra một chuỗi

ký tự) Định danh mô tả các chất hóa học dựa trên các thông tin về nguyên tử và cácliên kết của chúng, đồng phân, đồng vị, lập thể, và thông tin điện tích điện tử…Chúng

có thể thể hiện nhiều thông tin hơn so với ký hiệu SMILES đơn giản Mỗi cấu trúc cómột chuỗi Inchi đặc trưng, đó là yếu tố quan trọng đối với các CSDL

1.3.1.3 InChIKey

InChiKey [4] (IUPAC International Chemical Identifier Key) là một biểu diễn

27 ký tự của một InChI, có thể được sử dụng dễ dàng hơn để tìm một cấu trúc hóa

học trong cơ sở dữ liệu hoặc một công cụ tìm kiếm trên Internet [4].

Dựa trên các cuộc trao đổi với các nhà phát triển công cụ tìm kiếm, InChIKeyđáp ứng được tất cả về các chữ cái viết hoa và chiều dài mà các công cụ tìm kiếm sẽchấp nhận, không cần cắt ngắn hoặc sửa đổi Tìm cấu trúc tương ứng với mộtInChIKey cụ thể cần tìm kiếm trên web hoặc truy vấn ở các phần mềm chuyên dụng (ví

dụ như ChemSpider và NCI: cả hai đều miễn phí sử dụng) Tất nhiên, đối với CSDL

mục tiêu cụ thể, một dịch vụ tra cứu có thể được bổ sung bởi các nhà phát triển

Trang 21

(ví dụ như trong Unichem và dịch vụ CSDL web).

CSDL này 1.3.2 Thông tin liên quan về hợp chất được phân lập

Các hợp chất trong CSDL được thu thập và tổng hợp lại với các thông tinliên quan về tên thông thường (tên được định danh bởi tác giả khi hợp chất đó đượcphân lập), tên IUPAC, công thức; thông tin về nguồn phân lập: tên nguồn dược liệu(tên thông thường, tên khoa học), địa điểm thu hái mẫu, thời gian thu hái mẫu, bộphận sử dụng, tác dụng dân gian, tác dụng dược lý được chứng minh (nếu có)…Mỗi hợp chất được trích dẫn với nguồn tham khảo của nó để người sử dụng có thể

dễ dàng truy cập và đánh giá tính chính xác của thông tin về hợp chất

Thông tin về nguồn phân lập các hợp chất được thu thập một cách chi tiết vềthời gian, địa điểm thu mẫu; bộ phận sử dụng; các tác dụng dân gian và tác dụngdược lý được chứng minh (nếu có) Đối với các nhà nghiên cứu dược liệu, các thôngtin trên là hết sức quan trọng và cần thiết để xác định chính xác hợp chất được đềcập tới Các thành phần hóa học của dược liệu vốn rất đa dạng và phức tạp; như vớicùng một cây, thời gian thu hái khác nhau hoặc địa điểm thu hái ở các vùng khácnhau, khi phân lập ra có mẫu sẽ thu được hợp chất này, nhưng có mẫu sẽ không thuđược; điều này do cấu tạo sinh học kỳ diệu của các loài CSDL tập hợp đầy đủ cácthông tin liên quan nhất có thể về nguồn phân lập giúp cho người sử dụng có thể dễdàng tiếp cận và có cơ sở để nghiên cứu thêm về các hợp chất

1.3.3 Các đặc tính vật lý và hóa hoc của hợp chất

Thông tin về các đặc tính hóa, lý của hợp chất [14] được cung cấp về phân loại

nhóm cấu trúc; khối lượng phân tử; XlogP; Số liên kết cho Hydro; Số liên kết nhận Hydro; Số vi phạm quy tắc số 5 của Lipinski; Số liên kết xoay đồng vị; Diện tích bề mặt hạt mang điện và MACCS trong tính toán vân tay điện tử (Fingerprints).

CSDL cung cấp một vài thông số cơ bản về đặc tính lý, hóa đặc trưng củamỗi hợp chất, những dữ liệu này có thể được sử dụng như nguồn tham khảo hữu íchphục vụ cho các nghiên cứu khoa học hiện đại Đặc biệt là các nghiên cứu về tìmkiếm hợp chất dẫn đường, hợp chất giống thuốc, hợp chất có tiềm năng làm thuốc

bằng các phương pháp sàng lọc ảo “insilico”.

1.4 Khai thác CSDL

Trang 22

1.4.1 Sử dụng CSDL

CSDL được thiết kế dưới hình thức một giao diện web dễ tiếp cận và truycập Người dùng có thể dễ dàng tìm kiếm được các thông tin về một hợp chất vớinhều cách thức truy vấn khác nhau [1] Có thể tìm kiếm hợp chất theo tên thôngthường, tên IUPAC, theo SMILES, InChi, InChiKey…

Khi tìm kiếm một hợp chất có trong CSDL, hệ thống sẽ trả về cho người sửdụng tất cả thông tin liên quan về hợp chất đó, từ thông tin liên quan đến cấu trúc,thông tin về nguồn dược liệu đến các thông tin về một số hợp chất tương tự…

Các hợp chất trong CSDL đều được liên kết với một hệ thống các tài liệutham khảo riêng Các tài liệu tham khảo này chính là những báo cáo khoa học đãđược thu thập và chọn lọc trong quá trình xây dựng và phát triển hệ CSDL lớn [1, 9,21] Người sử dụng có thể tham khảo thêm lượng thông tin sâu hơn về hợp chất quacác tài liệu trích dẫn kèm theo này

CSDL có thể hỗ trợ người dùng với các tiện ích tải về cấu trúc hợp chất dướiđịnh dạng molfile và sdffile CSDL hướng tới được thiết kế dưới hình thức mộtphần mềm máy tính, giúp cho người dùng có thể khai thác một cách tối ưu nhất tùyvào từng mục đích sử dụng

CSDL cung cấp với mục đích phi thương mại, là nơi chia sẻ và tham luậncủa các nhà nghiên cứu Các nhà nghiên cứu có thể chia sẻ, cập nhập các hợp chấtcủa mình lên hệ CSDL với sự kiểm soát và hợp tác từ tổ chức sáng lập và quản trịCSDL Có sự tương tác giữa người sử dụng và CSDL theo hai chiều, tạo điều kiện

bổ xung và hoàn chỉnh tốt hơn nữa về mặt chất lượng và số lượng

1.4.2 Ứng dụng CSDL cho quá trình sàng lọc ảo in silico

Các quốc gia phát triển trên thế giới (Mỹ, Đức, Trung Quốc, Anh, Ấn Độ,Pháp ) là những quốc gia dẫn đầu các nghiên cứu ứng dụng máy tính vào việc thiết kếthuốc Hàng ngàn công trình trong lĩnh vực này đã được công bố trên các tạp chí uy tín.Không chỉ các trường đại học, viện nghiên cứu, các công ty Dược phẩm lớn cũng ứngdụng rất nhiều các kỹ thuật máy tính trong các khâu nghiên cứu và phát triển thuốc

So với các phương pháp thực nghiệm truyền thống các phương pháp in silico

giúp thiết kế những phân tử thuốc mới với những ưu thế vượt trội, giải thích bảnchất phân tử của các tương tác thuốc [11, 19] Thêm vào đó, chúng còn cho phép dựđoán hoạt tính sinh học sử dụng các mô hình toán học, nghiên cứu dự đoán cơ chếtác dụng, cơ chế gây độc của các hợp chất CSDL chứa các tham số cấu trúc - dạngbiểu diễn của các hợp chất có nguồn gốc tự nhiên là một nguồn dữ liệu đầy tiềm

năng, phục vụ cho quá trình sàng lọc in silico, để tìm ra các hợp chất dẫn đường, các

hợp chất làm thuốc tiềm năng

Trang 23

1.4.3 Xây dựng các hệ thống để xác định mục tiêu phân tử của các hợp chất

Y học hiện đại có xu hướng tập trung nhiều vào phân tích các thành phần hóasinh của thực vật để lý giải các tác dụng dược lý của chúng Các loài thực vật có chứa mộtlượng lớn các hợp chất khác nhau trong thành phần của mình, các hợp chất ấy có những hoạttính riêng và rất khó để kết luận là tác dụng dược lý gây ra bởi hợp chất nào [33] Từ cácnghiên cứu thực nghiệm, các nhà khoa học đã phân lập và định danh

được nhiều hợp chất với các đặc tính hóa sinh được ghi nhận

Từ các hệ CSDL đa dạng trên thế giới, các thông tin về các hợp chất đượctập hợp, có tính chất mở rộng và đầy đủ hơn Cùng là một hợp chất hóa học phânlập từ một loài thảo dược nhưng với các điều kiện địa lý (nơi thu hái mẫu) hay bộphận sử dụng khác nhau đã mang lại những tính chất khác biệt Qua sự liên kết,tổng hợp và chia sẻ từ các CSDL trên thế giới với nhau, cùng với các CSDL, cácngân hàng dữ liệu về các chất hóa học, sinh học, protein, genome… các nhà nghiêncứu sẽ có được một hệ thống tri thức phong phú và tương đối đầy đủ Từ đây việcxác định mục tiêu phân tử của các hợp chất dần trở lên đơn giản hơn

Trang 24

CHƯƠNG 2 ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU

2.1 Đối tượng nghiên cứu

Những bài báo về các hợp chất có nguồn gốc thiên nhiên Việt Nam, đã đượcphân lập và công bố trên các tạp chí hay ấn phẩm khoa học uy tín trong nước vàquốc tế từ năm 1992 đến năm 2016

Các tạp chí quốc gia: tạp chí Dược học, Dược liệu, Khoa học công nghệ, Hóahọc, Nghiên cứu dược và thông tin thuốc…

Các tạp chí quốc tế : Phytochemistry, American Chemical Society and

American Society of Pharmacognosy, Chem Pharm Bull (Tokyo), Pharmaceutical Society of Japan, Archives of Pharmacal Research, Bioorganic & Medicinal Chemistry Letters…

2.2 Phương pháp, thiết bị nghiên cứu

2.2.1 Phương pháp thu thập số liệu

Việc thu thập số liệu được tiến hành theo phương pháp thủ công Thông tintrong CSDL được thu thập tại thư viện Quốc gia, thư viện đại học Dược Hà Nội, thưviện Viện hàn lâm Khoa học Công Nghệ Việt Nam, tạp chí Dược học ngoài cáctạp chí có ở thư viện, quá trình nghiên cứu còn tham khảo thêm các số báo qua hệthống thông tin CSDL nội bộ của thư viện để thu thập đầy đủ nhất các số đã đượcxuất bản của các tạp chí Dược học, Dược liệu, Hóa học, Khoa học công nghệ,Nghiên cứu dược và thông tin thuốc

Đối với các bài báo quốc tế, thông tin được tìm kiếm sử dụng hệ thống tìm

kiếm của Pubmed (http://www.ncbi.nlm.nih.gov/pubmed), và trang chủ của các nhà

xuất bản (Taylor & Francis, Wiley Interscience, Springerlink, ACS Publications, Sience Direct, Oxford Journals, Nature Journals).

Mục tiêu các thông tin cần thu thập: tên hợp chất, công thức cấu tạo, cấu trúchóa học dạng 2D, tên nguồn phân lập (tên dân gian, tên khoa học), họ, tên bộ phậndùng, thông tin địa điểm thu hái, thời gian thu hái, tác dụng dân gian, tác dụng dược

lý đã được chứng minh, tài liệu tham khảo

2.2.2 Phương pháp xử lý số liệu

2.2.2.1 Tổ chức CSDL

CSDL ban đầu đã được phát triển bằng cách tổng hợp và lưu trữ các thôngtin từ dữ liệu thực nghiệm trong một định dạng bảng Các thông tin được nhập trựctiếp, chỉnh sửa và bổ xung vào CSDL một cách thủ công CSDL được tổ chức theo

các bước sau (mô phỏng theo Hình 2.1):

Trang 25

Bước 1: Thống kê các hợp chất trên Excel về những thông tin sau: tên hợpchất (tên thông thường, tên IUPAC); công thức; tên nguồn dược liệu (tên thôngthường, tên khoa học); địa điểm và thời gian thu hái mẫu; bộ phận sử dụng; tácdụng dân gian; tác dụng dược lý đã được chứng minh (nếu có); tài liệu tham khảo.

Bước 2: Biểu diễn hợp chất hóa học dưới dạng biểu diễn dòng (Line

Notation) Vì dạng SMILES, InChi, InChikey cho mỗi hợp chất không có sẵn trong

các bài báo đã được công bố nên cấu trúc hóa học của hợp chất được biểu diễn lại

một cách thủ công trên phần mềm ChemBioDraw 13.0 Với mỗi hợp chất hóa học ta

thu được 1 SMILES, 1 InChi, 1 InChikey

Bước 3: Trong CSDL, mỗi hợp chất sẽ được chỉ định gán cho một địnhdanh (số đăng ký) để cho việc tìm kiếm và quản lý các hợp chất trong CSDL đượcthuận tiện hơn Chuỗi số định danh duy nhất cho các hợp chất hóa học trong CSDL

được đặt tên là số VNPD_ID (Vietnam Natural Products Database_Identification).

Bước 4: Sử dụng phần mềm Endnote để trích xuất các tài liệu tham khảo

tương ứng của mỗi hợp chất hóa học trong CSDL, mỗi hợp chất đều được liên kết vớimột tài liệu tham khảo để đảm bảo độ chính xác của thông tin

Hình 2.1: CSDL ban đầu với các thông tin được thu thập và trình bày trên Excel

Phân loại các nhóm chất bằng ClassyFire, một ứng dụng để phân loại cấu trúc

tự động của các hợp chất hóa học ClassyFire giúp phân loại hóa học theo phân cấp của

các cấu trúc Các phân loại hóa học và phân cấp cấu trúc của nó được cung cấp

Trang 26

bằng cách sử dụng định dạng Ontology sinh học và Biomedical mở (OBO) [5, 16].

Định dạng chính được sử dụng để biểu diễn cấu trúc hóa học trong thuật toán phân

loại là định dạng SMARTS (SMiles ARbitrary Target Specification) [12] SMARTS

là một định dạng phù hợp với ngôn ngữ phân tử SMILES, có thể được sử dụng để

xác định mô hình cấu trúc tiểu phân trong các phân tử ClassyFire kết hợp nhiều

phương pháp để phát hiện mẫu kết cấu Hầu hết các tính năng được phát hiện thôngqua tìm kiếm cấu trúc thượng tầng, được thực hiện trên thư viện của hơn 9.000 mẫuthiết kế SMARTS theo cách thủ công [50] Mỗi thuật ngữ đã được xác nhận quaviệc lặp lại các thử nghiệm và cải tiến (nếu cần) đối với các bộ hợp chất nhỏ Thư

viện được tích hợp vào cơ sở JChem của ChemAxon Việc xác định các phân loại

mới được hỗ trợ bởi lược đồ phân loại được cung cấp bởi các cơ sở dữ liệu khác

như LIPID MAPS [32], ChEBI [24] và DrugBank [27] Kết quả thu được khi tiến

hành phân tích một hợp chất được mô tả trong Phụ lục 2.

2.2.2.4 Tính toán một số thông số lý hóa

Sử dụng phần mềm CDK Descriptor Calculator [15] để tính toán một số thông

số lý hóa của các hợp chất: Khối lượng phân tử; XlogP; Số liên kết cho Hydro; Số liên kết nhận Hydro; Số vi phạm quy tắc Số 5 của Lipinski; Số liên kết xoay đồng vị; Diện

tích bề mặt hạt mang điện và MACCS, được mô tả trong Phụ lục 3.

Trang 27

2.2.3 Thiết lập giao diện website

Nguồn dược liệu

-Tên thông thường

- Tên khoa học

- Họ

- Địa điểm thu hái mẫu

- Thời gian thu hái mẫu

- Bộ phận sử dụng

- Tác dụng dân gian

- Tác dụng dược lý đã được chứng minh

Hình 2.2: Mô tả nội dung và các trường lớn của CSDL

Trang 28

CSDL được xây dựng trên ứng dụng MySQL server – một dạng mã nguồn

mở MySQL là cơ sở dữ liệu tốc độ cao, ổn định và dễ sử dụng, hoạt động trên

nhiều hệ điều hành cung cấp một hệ thống lớn các hàm tiện ích rất mạnh Với tốc độ

và tính bảo mật cao, MySQL rất thích hợp cho các ứng dụng có truy cập CSDL trên

internet MySQL quản lý dữ liệu thông qua các cơ sở dữ liệu, mỗi cơ sở dữ liệu có

thể có nhiều bảng quan hệ chứa dữ liệu

CSDL được xây dựng được bằng ngôn ngữ lập trình Python và framework

Django với web server: Apache.

Câu hỏi truy vấn Phân tích dữ liệu đầu vào Phản hồi thông tin từ CSDL

Hệ thống câu trả lời

Kết quả sàng lọc

Hình 2.3 Quá trình đưa ra dữ liệu hiển thị cho thông tin truy vấn

Giao diện web được xây dựng dựa trên các trường lớn được mô tả ở Hình

2.2 Từ CSDL được thống kê ban đầu trên các tệp file Exel, mỗi tệp quản lý một

trường thông tin nhỏ được tổng hợp lại và được kiểm soát bằng một hệ thống quản

lý dữ liệu web Giao diện đưa ra cho người tương tác các khả năng khai thác dữ liệu qua những thanh tìm kiếm thông tin được hiển thị trên màn hình Nếu muốn tìm

kiếm ở dạng dữ liệu nào, người dùng có thể kích vào thanh dữ liệu đấy, hệ thốngweb sẽ tự động đưa ra một trường tìm kiếm thông minh và có hướng dẫn định dạngtìm kiếm hợp lý ở mỗi khung tìm kiếm Với mỗi truy vấn, hệ thống CSDL sẽ đưa ra

kết quả một cách nhanh chóng thông qua các bước như Hình 2.3.

Ngày đăng: 25/09/2019, 15:14

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[2]. Ahmed. A Fadda, and El-Sayed, Refat (2016), "Synthesis of Pharmacological Heterocyclic Derivatives Based Surfactants", Journal of Oleo Science, 65 (11), 929-940 Sách, tạp chí
Tiêu đề: Synthesis of PharmacologicalHeterocyclic Derivatives Based Surfactants
Tác giả: Ahmed. A Fadda, and El-Sayed, Refat
Năm: 2016
[3]. Alan McNaught, Dmitrii Tchekhovskoi, Igor Pletnev, Stephen R Heller, and Stein, Stephen (2015), "InChI, the IUPAC International Chemical Identifier", Journal of Cheminformatics, 7, 23 Sách, tạp chí
Tiêu đề: InChI, the IUPAC International Chemical Identifier
Tác giả: Alan McNaught, Dmitrii Tchekhovskoi, Igor Pletnev, Stephen R Heller, and Stein, Stephen
Năm: 2015
[4]. Andrey Erin, Alan McNaught, Dmitrii Tchekhovskoi, Igor Pletnev, Kirill Blinov, and Heller, Steve (2012), "InChIKey collision resistance: an experimental testing", Journal of Cheminformatics, 4, 39 Sách, tạp chí
Tiêu đề: InChIKey collision resistance: an experimental testing
Tác giả: Andrey Erin, Alan McNaught, Dmitrii Tchekhovskoi, Igor Pletnev, Kirill Blinov, and Heller, Steve
Năm: 2012
[5]. Ashburner M, Bard J, Bug W, Ceusters W, Rosse C, and B, Smith (2007), "The OBO foundry: coordinated evolution of ontologies to support biomedical data integration", Nat Biotechnol 25 (11), 1251-1255 Sách, tạp chí
Tiêu đề: TheOBO foundry: coordinated evolution of ontologies to support biomedical data integration
Tác giả: Ashburner M, Bard J, Bug W, Ceusters W, Rosse C, and B, Smith
Năm: 2007
[6]. BL, Ligon (2004), "Penicillin: Its Discovery and Early Development", Semin Pediatr Infect Dis, 15, 52-57 Sách, tạp chí
Tiêu đề: Penicillin: Its Discovery and Early Development
Tác giả: BL, Ligon
Năm: 2004
[7]. Boccardo F1, Guglielmini P, Puntoni M, and A, Rubagotti (2006), "Enterolactone as a risk factor for breast cancer: a review of the published evidence", Clin Chim Acta, 365 (1), 58-67 Sách, tạp chí
Tiêu đề: Enterolactone as a risk factor for breast cancer: a review of the published evidence
Tác giả: Boccardo F1, Guglielmini P, Puntoni M, and A, Rubagotti
Năm: 2006
[8]. C Y Ung, H Li, H Zhou, J F Wang, L Y Han, X Chen, Y, B Liu, Y, Z Chen, and Cao, Z, W (2006), "Database of traditional Chinese medicine and its application to studies of the mechanism and to prescription validation", British Journal of Pharmacology, 149 (8), 1092-1103 Sách, tạp chí
Tiêu đề: Database of traditional Chinese medicine and its application to studies of the mechanism and to prescription validation
Tác giả: C Y Ung, H Li, H Zhou, J F Wang, L Y Han, X Chen, Y, B Liu, Y, Z Chen, and Cao, Z, W
Năm: 2006
[9]. Chen, X, Zhou, H, Liu, YB, Wang, JF, Li, H, Ung, CY, Han, LY, Cao, ZW, and Chen, YZ (2006), "Database of traditional Chinese medicine and itsapplication to studies of mechanism and to prescription validation", British Journal of Pharmacology 149, 11 Sách, tạp chí
Tiêu đề: Database of traditional Chinese medicine and its application to studies of mechanism and to prescription validation
Tác giả: Chen, X, Zhou, H, Liu, YB, Wang, JF, Li, H, Ung, CY, Han, LY, Cao, ZW, and Chen, YZ
Năm: 2006
[10]. Cheng F, Liu H, Luo X, Shen J, and X, Xu (2003), "Virtual screening on natural products for discovering active compounds and target information", Curr Med Chem, 10, 15 Sách, tạp chí
Tiêu đề: Virtual screening on natural products for discovering active compounds and target information
Tác giả: Cheng F, Liu H, Luo X, Shen J, and X, Xu
Năm: 2003
[12]. Chepelev LL, Dumontier M, Ennis M, Hastings J, and Steinbeck C (2012), "Self-organizing ontology of biochemically relevant small molecules", BMC Bioinform, 13 (3) Sách, tạp chí
Tiêu đề: Self-organizing ontology of biochemically relevant small molecules
Tác giả: Chepelev LL, Dumontier M, Ennis M, Hastings J, and Steinbeck C
Năm: 2012
[13]. Choon Nam Ong, Barry Halliwell, Lester Packer, and Wachtel-Galor, Sissi (2004), Herbal and Traditional Medicine: Biomolecular and Clinical Aspects, New York, Marcel Dekker Sách, tạp chí
Tiêu đề: Herbal and Traditional Medicine: Biomolecular and Clinical Aspects
Tác giả: Choon Nam Ong, Barry Halliwell, Lester Packer, and Wachtel-Galor, Sissi
Năm: 2004
[14]. Christoph Steinbeck, Edgar Luttmann, Egon Willighagen, Oliver Horlacher, Stefan Kuhn, and Han, Yongquan (2002), "The Chemistry Development Kit (CDK): An Open-Source Java Library for Chemoand Bioinformatics", J.Chem. Inf. Comput. Sci., 43, 493-500 Sách, tạp chí
Tiêu đề: The Chemistry Development Kit(CDK): An Open-Source Java Library for Chemoand Bioinformatics
Tác giả: Christoph Steinbeck, Edgar Luttmann, Egon Willighagen, Oliver Horlacher, Stefan Kuhn, and Han, Yongquan
Năm: 2002
[15]. Christoph Steinbeck, Edgar Luttmann, Egon Willighagen, Oliver Horlacher, Stefan Kuhn, and Han, Yongquan (2003), "The Chemistry Development Kit (CDK): An Open-Source Java Library for Chemoand Bioinformatics", J Chem Inf Comput Sci, 43, 493-500 Sách, tạp chí
Tiêu đề: The Chemistry Development Kit(CDK): An Open-Source Java Library for Chemoand Bioinformatics
Tác giả: Christoph Steinbeck, Edgar Luttmann, Egon Willighagen, Oliver Horlacher, Stefan Kuhn, and Han, Yongquan
Năm: 2003
[16]. Clark JI, Day-Richter J, Haendel M, Harris MA, Ireland A, and J, Lomax (2007), "OBO-edit—an ontology editor for biologists", Bioinformatics, 23 (16), 2198–2200 Sách, tạp chí
Tiêu đề: OBO-edit—an ontology editor for biologists
Tác giả: Clark JI, Day-Richter J, Haendel M, Harris MA, Ireland A, and J, Lomax
Năm: 2007
[18]. David J. Barlow, Peter J. Hylands, and Ehrman, Thomas M. (2007), "Phytochemical Databases of Chinese Herbal Constituents and Bioactive Plant Compounds with Known Target Specificities", J. Chem. Inf. Model., 47, 254-263 Sách, tạp chí
Tiêu đề: Phytochemical Databases of Chinese Herbal Constituents and Bioactive Plant Compounds with Known Target Specificities
Tác giả: David J. Barlow, Peter J. Hylands, and Ehrman, Thomas M
Năm: 2007
[19]. David J. Barlow, Peter J. Hylands, and Ehrman, Thomas M. (2007), "Virtual Screening of Chinese Herbs with Random Forest", J. Chem. Inf. Model., 47, 264-278 Sách, tạp chí
Tiêu đề: Virtual Screening of Chinese Herbs with Random Forest
Tác giả: David J. Barlow, Peter J. Hylands, and Ehrman, Thomas M
Năm: 2007
[20]. David J. Newman, and Cragg, Gordon M. (2013), "Natural products: a continuing source of novel drug leads", Biochimica et Biophysica Acta (BBA) - General Subjects, 1830 (6), 3670-3695 Sách, tạp chí
Tiêu đề: Natural products: a continuing source of novel drug leads
Tác giả: David J. Newman, and Cragg, Gordon M
Năm: 2013
[21]. David K Brown, David L Penkler, Ngonidzashe Faya, Rowan Hatherley, and Musyoka, Thomas M (2015), "SANCDB: a South African natural compound database", J Cheminform 7 (29), 9 Sách, tạp chí
Tiêu đề: SANCDB: a South African natural compounddatabase
Tác giả: David K Brown, David L Penkler, Ngonidzashe Faya, Rowan Hatherley, and Musyoka, Thomas M
Năm: 2015
[22]. David K Brown, David L Penkler, Kevin A Lobb, Ngonidzashe Faya, Bishop, ệzlem Tastan, Rowan Hatherley, and Musyoka, Thomas M (2015),"SANCDB: a South African natural compound database", Journal of Cheminformatics, 29 (7) Sách, tạp chí
Tiêu đề: SANCDB: a South African natural compound database
Tác giả: David K Brown, David L Penkler, Kevin A Lobb, Ngonidzashe Faya, Bishop, ệzlem Tastan, Rowan Hatherley, and Musyoka, Thomas M
Năm: 2015
[23]. DB, Jack (1997), "One hundred years of aspirin", Lancet Infect Dis, 350, 437-439 Sách, tạp chí
Tiêu đề: One hundred years of aspirin
Tác giả: DB, Jack
Năm: 1997

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w