Trong nghiên cứu phát triển thuốc, các kỹ thuật thông minh thông qua các phần mềm thông minh được áp dụng trong lĩnh vực xây dựng công thức sản phẩm ở quy mô phòng thí nghiệm, dự đoán nâ
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO BỘ Y TẾ
ĐẠI HỌC Y DƯỢC THÀNH PHỐ HỒ CHÍ MINH
CHUNG KHANG KIỆT
NGHIÊN CỨU VÀ PHÁT TRIỂN THUỐC
BẰNG HỆ THỐNG PHẦN MỀM THÔNG MINH
TỰ THÀNH LẬP
LUẬN ÁN TIẾN SĨ DƯỢC HỌC
Thành phố Hồ Chí Minh - 2018
Trang 2BỘ GIÁO DỤC VÀ ĐÀO TẠO BỘ Y TẾ
ĐẠI HỌC Y DƯỢC THÀNH PHỐ HỒ CHÍ MINH
CHUNG KHANG KIỆT
NGHIÊN CỨU VÀ PHÁT TRIỂN THUỐC
BẰNG HỆ THỐNG PHẦN MỀM THÔNG MINH
TỰ THÀNH LẬP
Ngành: Công nghệ Dược phẩm và Bào chế thuốc
Mã số: 9720202
LUẬN ÁN TIẾN SĨ DƯỢC HỌC
Người hướng dẫn khoa học:
GS.TS Đặng Văn Giáp PGS.TS Đỗ Quang Dương
Thành phố Hồ Chí Minh – Năm 2018
Trang 3LỜI CAM ĐOAN
Tôi cam đoan đây là công trình nghiên cứu của tôi Các số liệu và những kết quả nêu trong luận án là trung thực và chưa từng được ai công bố trong bất kỳ công trình nghiên cứu nào khác
Chung Khang Kiệt
Trang 43.3 Kiểm chứng Phasolpro RD bằng cơ sở dữ liệu dã công bố 95
4.4 Áp dụng Phasolpro RD trong nghiên cứu và phát triển thuốc 145
Trang 5DANH MỤC CÁC TỪ VIẾT TẮT
ADL Angle Driven Learning
ASTM American Society for Testing and
Materials
Hiệp hội của Mỹ về Thử nghiệm
và Vật liệu BIC Bayesian Information Criterion -
BPL Back Propagation Learning -
EDQM European Directorate for the
GAMP Good Automated Manufacturing
Practice
Thực hành tốt Sản xuất tự động hóa
GCP Good Clinical Practices Thực hành tốt Lâm sàng
GLP Good Laboratory Practices Thực hành tốt Kiểm nghiệm GMP Good Manufacturing Practice Thực hành tốt Sản xuất thuốc
ICH The International Conference for
Harmonisation
Hội nghị quốc tế về sự hòa hợp
IEEE The Institute of Electrical and
Electronics Engineers
Viện kỹ nghệ điện và điện tử
LOOCV Leave One Out Cross Validation -
Trang 6MDL Minimum Description Length -
MLP Multilayer Perceptron Networks Mạng thần kinh nhiều lớp
OQ Operation Qualification Đánh giá vận hành
Phasolpro* Pharmaceutical Solution Provider Nhà cung cấp các giải pháp trong
ngành Dược PIC/S Pharmaceutical Inspection Co-
operation Scheme
Tổ chức hợp tác thanh tra Dược
PQ Performance Qualification Đánh giá hiệu năng
Tiêu chuẩn kỹ thuật
URS User’s Requirement Specification Yêu cầu kỹ thuật
WHO World Health Organization Tổ chức Y tế Thế giới
* Nhãn hiệu đăng ký số 106247 do Cục sở hữu trí tuệ - Bộ KHCN cấp theo quyết định số 1495/QĐ-SHTT ngày 31/07/2008
Trang 7DANH MỤC CÁC HÌNH
Hình 1.1 Nguyên lý hoạt động của tối ưu hóa và dự đoán thông minh 8Hình 1.2 Minh họa tổng quát về cấu trúc mạng thần kinh đa lớp 9Hình 1.3 Quy trình xử lý của hệ thống logic mờ - thần kinh 20
Hình 3.4 Phác thảo giao diện Khởi động của Phasolpro RD 53
Hình 3.5 Phác thảo giao diện Đầu vào của Phasolpro RD 54
Hình 3.6 Phác thảo giao diện Tùy chọn của Phasolpro RD 55
Hình 3.7 Phác thảo giao diện Luyện mạng của Phasolpro RD 56
Hình 3.8 Phác thảo giao diện Mối liên quan của Phasolpro RD 57
Hình 3.9 Phác thảo giao diện Quy luật của Phasolpro RD 58
Hình 3.10 Phác thảo giao diện Biểu đồ của Phasolpro RD 59
Hình 3.11 Phác thảo giao diện Điều kiện của Phasolpro RD 61
Hình 3.12 Phác thảo giao diện Tối ưu hóa của Phasolpro RD 62
Hình 3.13 Phác thảo giao diện Dự đoán của Phasolpro RD 63
Hình 3.14 Phác thảo giao diện Báo cáo kết quả của Phasolpro RD 64
Hình 3.15 Phác thảo giao diện Thiết kế mô hình của Phasolpro RD 65
Hình 3.17 Giao diện Giới thiệu của Phasolpro RD sau khi khởi động 66
Hình 3.20 Giao diện Tùy chọn biến số của Phasolpro RD 67
Hình 3.21 Giao diện Tùy chọn thông số của Phasolpro RD 68
Hình 3.23 Giao diện Mối liên quan của Phasolpro RD 70
Trang 8Hình 3.27 Giao diện Tối ưu hóa của Phasolpro RD 71
Hình 3.29 Giao diện Báo cáo kết quả của Phasolpro RD 72
Hình 3.30 Giao diện Thiết kế mô hình của Phasolpro RD 73Hình 3.31 Mối liên quan y1 = f(x1, x2) đối với CSDL A bởi FormRules 92
Hình 3.33 Mối liên quan y1 = f(x1, x2) đối với CSDL B bởi FormRules 92Hình 3.34 Mối liên quan y1 = f(x1, x2) đối với CSDL bởi Phasolpro RD 92Hình 3.35 Mối liên quan đối với CSDL viên nén glimepirid 2 mg 96Hình 3.36 Mối liên quan đối với CSDL viên nén loratidin 99Hình 3.37 Mối liên quan đối với CSDL của viên nén gliclazid 102Hình 3.38 Mối liên quan đối với CSDL của Rau Diếp cá 105Hình 3.39 Mối liên quan đối với CSDL của Cao khô Diệp hạ châu 108Hình 3.40 Mối liên quan đối với CSDL của quy trình HPLC 114Hình 3.41 Mối liên quan đối với CSDL của viên nén chứa meloxicam 119Hình 3.42 Mối liên quan đối với CSLD viên gliclazid cải thiện độ hòa tan 124Hình 3.43 Mối liên quan đối với CSDL của quy trình tổng hợp metformin 129
Trang 9DANH MỤC CÁC SƠ ĐỒ
Sơ đồ 1.2 Tóm tắt quá trình tối ưu hóa bằng thuật toán di truyền 19
Sơ đồ 1.3 Minh họa nguyên lý hoạt động của quá trình tối ưu hóa thông minh 21
Sơ đồ 1.4 Mô hình chữ V’- thử nghiệm và đánh giá phần mềm (Arnold L.) 30
Sơ đồ 1.5 Mô hình chữ V’- thử nghiệm và đánh giá phần mềm (PIC/S) 30
Sơ đồ 1.6 Mô hình chữ V’- nhấn mạnh về đánh giá phần mềm 31
Trang 10DANH MỤC CÁC BẢNG
Bảng 1.1 Yêu cầu của FDA (Mỹ) chứng nhận thuốc gốc và generic 5Bảng 1.2 So sánh các kỹ thuật cải tiến thuật toán lan truyền ngược 14Bảng 1.3 Phân loại phần mềm và thẩm định theo PIC/S trong môi trường GxP 29Bảng 3.4 Đặc điểm của phần mềm tối ưu hóa thông minh INForm (a) 46Bảng 3.5 Đặc điểm của phần mềm tối ưu hóa thông minh INForm (b) 47Bảng 3.6 Đặc điểm của phần mềm phân tích liên quan nhân quả FormRules 48Bảng 3.7 Đặc điểm của hệ thống thông minh Phasolpro RD (a) 50Bảng 3.8 Đặc điểm của hệ thống thông minh Phasolpro RD (b) 51
Bảng 3.9 Đặc điểm các công cụ trong giao diện Khởi động của Phasolpro RD 53
Bảng 3.10 Đặc điểm các công cụ trong giao diện Đầu vào của Phasolpro RD 54
Bảng 3.11 Đặc điểm các công cụ trong giao diện Tùy chọn của Phasolpro RD 55
Bảng 3.12 Đặc điểm công cụ trong giao diện Luyện mạng của Phasolpro RD 57
Bảng 3.13 Đặc điểm các công cụ trong giao diện Mối liên quan 58
Bảng 3.14 Đặc điểm các công cụ trong giao diện Quy luật của Phasolpro RD 59
Bảng 3.15 Đặc điểm các công cụ trong giao diện Biểu đồ của Phasolpro RD 60
Bảng 3.16 Đặc điểm các công cụ trong giao diện Điều kiện của Phasolpro RD 61
Bảng 3.17 Đặc điểm các công cụ trong giao diện Tối ưu hóa của Phasolpro RD 62 Bảng 3.18 Đặc điểm các công cụ trong giao diện Dự đoán của Phasolpro RD 64
Bảng 3.19 Đặc điểm công cụ trong giao diện Báo cáo kết quả 64
Bảng 3.20 Đặc điểm công cụ trong giao diện Thiết kế mô hình 65
Bảng 3.21 Kết quả nhận dạng giao diện Đầu vào của Phasolpro RD 75
Bảng 3.22 Kết quả nhận dạng giao diện Luyện mạng của Phasolpro RD 76
Bảng 3.23 Kết quả nhận dạng giao diện Tối ưu hóa của Phasolpro RD 78
Bảng 3.24 Kết quả nhận dạng giao diện Dự đoán của Phasolpro RD 78
Bảng 3.25 Kết quả nhận dạng giao diện Báo cáo kết quả của Phasolpro RD 79
Bảng 3.26 Kết quả nhận dạng giao diện Thiết kế thí nghiệm của Phasolpro RD 79
Trang 11Bảng 3.27 Kết quả kiểm tra vận hành luyện mạng của Phasolpro RD 80Bảng 3.28 Kết quả vận hành phân tích nhân quả đối với Phasolpro RD 81Bảng 3.29 Kết quả kiểm tra vận hành tối ưu hóa của Phasolpro RD 81Bảng 3.30 Đánh giá về đóng gói và cài đặt Phasolpro RD 82Bảng 3.31 Kết quả lựa chọn nhóm thử của Phasolpro RD - CSDL A 83Bảng 3.32 Kết quả lựa chọn nhóm thử của INForm - CSDL A 83Bảng 3.33 Các giá trị R2 sử dụng thuật toán mặc định - CSDL A 83Bảng 3.34 Kết quả lựa chọn nhóm thử của Phasolpro RD – CSDL B 84Bảng 3.35 Kết quả lựa chọn nhóm thử của INForm - CSDL B 84Bảng 3.36 Các giá trị R2 sử dụng thuật toán mặc định - CSDL B 84Bảng 3.37 Các giá trị R2 thử sử dụng thuật toán QP - CSDL A 85Bảng 3.38 Các giá trị R2 sử dụng thuật toán QP - CSDL A 85Bảng 3.39 Các giá trị R2 thử sử dụng thuật toán QP - CSDL B 86Bảng 3.40 Các giá trị R2 sử dụng thuật toán QP - CSDL B 86Bảng 3.41 Kết quả chọn thuật toán của Phasolpro RD - CSDL A 86Bảng 3.42 Kết quả chọn thuật toán của INForm - CSDL A 87Bảng 3.43 Các giá trị R2 sử dụng thuật toán phù hợp - CSDL A 87Bảng 3.44 Kết quả chọn thuật toán của Phasolpro RD – CSDL B 87Bảng 3.45 Kết quả chọn thuật toán của INForm - CSDL B 88Bảng 3.46 Các giá trị R2 sử dụng thuật toán phù hợp - CSDL B 88Bảng 3.47 Các xu hướng và mức độ liên quan của Phasolpro RD - CSDL A 89Bảng 3.48 Các xu hướng và mức độ liên quan của FormRules - CSDL A 89Bảng 3.49 Các xu hướng và mức độ liên quan của Phasolpro RD - CSDL B 90Bảng 3.50 Các xu hướng và mức độ liên quan của FormRules - CSDL B 90Bảng 3.51 So sánh kết quả tối ưu của 2 phần mềm - CSDL A 93Bảng 3.52 So sánh kết quả tối ưu của 2 phần mềm - CSDL B 94Bảng 3.53 So sánh kết quả dự đoán của 2 phần mềm - CSDL A 94Bảng 3.54 So sánh kết quả dự đoán của 2 phần mềm - CSDL B 95Bảng 3.55 Xu hướng và mức độ liên quan giữa x và y 96
Trang 12Bảng 3.56 So sánh kết quả tối ưu bởi Phasolpro RD và INForm v4.0 97Bảng 3.57 So sánh kết quả dự đoán bởi Phasolpro RD và INForm v4.0 97Bảng 3.58 Kết quả dự đoán bởi Phasolpro RD so với thực nghiệm kiểm chứng 98Bảng 3.59 Xu hướng và mức độ liên quan giữa x và y 98Bảng 3.60 So sánh kết quả tối ưu bởi Phasolpro RD và INForm v3.4 100Bảng 3.61 So sánh kết quả dự đoán bởi Phasolpro RD và INForm v3.4 100Bảng 3.62 Kết quả dự đoán bởi Phasolpro RD so với thực nghiệm kiểm chứng 101Bảng 3.63 Xu hướng và mức độ liên quan giữa x và y 101Bảng 3.64 So sánh kết quả tối ưu của Phasolpro RD và INForm v3.4 103Bảng 3.65 So sánh kết quả dự đoán của Phasolpro RD và INForm v3.4 104Bảng 3.66 Kết quả dự đoán của Phasolpro RD so với thực nghiệm kiểm chứng 104Bảng 3.67 Xu hướng và mức độ liên quan giữa x và y 105Bảng 3.68 So sánh kết quả tối ưu của Phasolpro RD và INForm v3.7 106Bảng 3.69 So sánh kết quả dự đoán của Phasolpro RD và INForm v3.7 106Bảng 3.70 Kết quả dự đoán của Phasolpro RD và thực nghiệm kiểm chứng 107Bảng 3.71 Xu hướng và mức độ liên quan giữa x và y 107Bảng 3.72 So sánh kết quả tối ưu của Phasolpro RD và INForm v3.6 109Bảng 3.73 So sánh kết quả dự đoán của Phasolpro RD và INForm v3.6 109Bảng 3.74 Kết quả dự đoán của Phasolpro RD so với thực nghiệm kiểm chứng 110Bảng 3.75 Xu hướng và mức độ liên quan giữa x và y 111Bảng 3.76 So sánh kết quả tối ưu của Phasolpro RD và INForm v4.0 115Bảng 3.77 So sánh kết quả dự đoán của Phasolpro RD và INForm v4.0 115Bảng 3.78 Kết quả dự đoán của Phasolpro RD so với thực nghiệm kiểm chứng 116Bảng 3.79 Dữ liệu thực nghiệm đầu vào cho Phasolpro RD 117Bảng 3.80 Các giá trị R2 thử và R2luyện đối với CSDL viên nén rã nhanh 118Bảng 3.81 Xu hướng và mức độ liên quan giữa y và x 118Bảng 3.82 Kết quả tính chất sản phẩm của 3 lô kiểm chứng 121Bảng 3.83 So sánh kết quả thực nghiệm với dự đoán của Phasolpro RD 121Bảng 3.84 Dữ liệu thực nghiệm đầu vào cho phần mềm Phasolpro RD 122
Trang 13Bảng 3.85 Các giá trị R2 thử và R2luyện đối với CSDL viên chứa gliclazid 123Bảng 3.86 Xu hướng và mức độ liên quan giữa y và x 123Bảng 3.87 Kết quả tính chất sản phẩm của 3 lô kiểm chứng 125Bảng 3.88 So sánh kết quả thực nghiệm với dự đoán của Phasolpro RD 125Bảng 3.89 Dữ liệu thực nghiệm đầu vào cho Phasolpro RD 127Bảng 3.90 Giá trị R2 thử và luyện đối với CSDL quy trình tổng hợp metformin 128Bảng 3.91 Xu hướng và mức độ liên quan giữa y và x 128Bảng 3.92 Kết quả hiệu suất và tạp chất của 3 lần thực nghiệm 131Bảng 3.93 So sánh kết quả thực nghiệm với dự đoán của Phasolpro RD 131Bảng 4.94 Tóm tắt kết quả luyện mạng của 6 CSDL kiểm chứng 143Bảng 4.95 Tóm tắt kết quả phân tích nhân quả của 6 CSDL kiểm chứng 144Bảng 4.96 Tóm tắt kết quả tối ưu của 6 CSDL kiểm chứng 144Bảng 4.97 Tóm tắt kết quả dự đoán của 6 CSDL kiểm chứng bởi Phasolpro RD 145
Trang 14MỞ ĐẦU
Theo nguyên tắc GMP, chất lượng của thuốc cần được thiết kế và xây dựng ngay từ giai đoạn nghiên cứu và phát triển Trong giai đoạn này, trước đây việc thành lập công thức được thực hiện dựa trên kinh nghiệm nên thường tốn nhiều thời gian, chi phí và công sức Giữa thành phần công thức và/ hoặc điều kiện sản xuất (là các nguyên nhân mà trong toán thống kê gọi là biến số độc lập) với tính chất sản phẩm (là các kết quả mà trong toán thống kê gọi là biến số phụ thuộc) có các mối liên quan biện chứng với nhau Mối liên hệ này thường phức tạp, do có nhiều nguyên nhân (loại tá dược, lượng tá dược, phương pháp điều chế, thiết bị sản
xuất…) và nhiều kết quả (các chỉ tiêu kiểm nghiệm lý hóa, tác dụng in vitro, in vivo…) Đôi khi các kết quả này lại mâu thuẫn lẫn nhau (viên có độ cứng cao nhưng
lại cần độ rã thấp), có trường hợp một nguyên nhân cho nhiều kết quả (HPMC cho
độ nhớt và chỉ số khúc xạ), một kết quả do nhiều nguyên nhân (độ cứng do lực nén,
tá dược dính…) Ngày nay, việc xây dựng công thức bào chế hay quy trình sản xuất
có thể được thực hiện một cách khoa học hơn Một mặt, nhà bào chế phải cân nhắc nhiều yếu tố liên quan đến thành phần công thức (loại và lượng của mỗi nguyên liệu) cũng như điều kiện sản xuất (loại thiết bị và thông số, phương pháp điều chế) Mặt khác nhà bào chế cũng phải xem xét nhiều tính chất đối với mỗi dược phẩm
(các chỉ tiêu kiểm nghiệm, tác dụng in vitro ) Từ đó, nhà bào chế sẽ thiết kế mô
hình thực nghiệm, tiến hành bào chế và kiểm nghiệm để có dữ liệu về bào chế và kiểm nghiệm làm đầu vào cho việc phân tích dữ liệu Các phương pháp phân tích
dữ liệu truyền thống (toán học, toán thống kê) bị hạn chế đối với các dữ liệu phức tạp, thiếu trị số hay có giá trị định tính; nhất là có nhiều biến số độc lập và nhiều biến số phụ thuộc Việc tối ưu hóa với nhiều biến phụ thuộc thì các phương pháp truyền thống càng không thể thực hiện được
Ngày nay, trí tuệ nhân tạo đã phát triển nhanh chóng và đa dạng Sự ra đời của các kỹ thuật thông minh như mạng thần kinh nhân tạo, thuật toán di truyền, logic
Trang 15mờ-thần kinh… là cơ sở của các phần mềm thông minh, đã đóng góp trong nghiên cứu và phát triển thuốc Trên thế giới đã có nhiều nghiên cứu áp dụng các phần mềm thông minh trong ngành Dược Trong nghiên cứu phát triển thuốc, các kỹ thuật thông minh (thông qua các phần mềm thông minh) được áp dụng trong lĩnh vực xây dựng công thức sản phẩm ở quy mô phòng thí nghiệm, dự đoán nâng cấp
cỡ lô, xây dựng quy trình sản xuất, dự đoán tình huống xấu nhất trong quá trình sản xuất….Ngoài ra, chúng cũng được áp dụng trong các lĩnh vực nghiên cứu phát triển khác như chiết xuất dược liệu, bán tổng hợp hóa dược, xây dựng quy trình định lượng bằng sắc ký lỏng hiệu năng cao…
Trên thế giới đã có một số phần mềm thông minh cho mục đích phân tích liên quan nhân quả như FormRules (Intelligensys, UK), tối ưu hóa công thức/quy trình như CADChem (AI Ware, USA), INForm (Intelligensys, UK) Trong đó, FormRules sử dụng logic mờ - thần kinh để phân tích liên quan nhân quả về xu hướng, mức độ và quy luật; CADChem hay INForm kết hợp hai kỹ thuật thông minh mạng thần kinh nhân tạo (thiết lập mô hình liên quan và dự đoán) và thuật toán di truyền (tối ưu hóa) Cả hai quá trình gồm phân tích liên quan nhân quả và tối ưu hóa thông minh đều cần giai đoạn chung là luyện mạng với dữ liệu thực nghiệm đầu vào
Trong nghiên cứu phát triển thuốc, giai đoạn phân tích liên quan nhân quả giúp nhà bào chế biết được các biến số độc lập (thành phần công thức và/ hoặc điều kiện sản xuất) nào có liên quan đến các biến số phụ thuốc tương ứng (chỉ tiêu kiểm
nghiệm lý hóa, tác dụng in vitro/ in vivo…), nhờ đó có thể khảo sát biến số cần thiết
và không bỏ sót, không mất công thăm dò biến số không cần Giai đoạn tối ưu hóa bởi phần mềm thông minh (kết hợp mạng thần kinh và thuật toán di truyền) kế thừa kết quả phân tích liên quan nhân quả (với cùng dữ liệu thực nghiệm đầu vào) có thể ước tính có hiệu quả về thành phần và/ hoặc điều kiện sản xuất để có tính chất sản phẩm như mong muốn, đồng thời có thể dự đoán tính chất sản phẩm từ công thức hay điều kiện sản xuất biết trước Nhờ đó, các phương pháp thông minh có hiệu quả
và tiết kiệm được thời gian và công sức hơn các phương pháp truyền thống
Trang 16Hiện nay, ở Việt nam chưa có phần mềm thông minh để phân tích liên quan nhân quả và tối ưu hóa trong nghiên cứu phát triển thuốc Bên cạnh đó, các phần mềm thông minh nước ngoài chỉ có từng chức năng riêng lẻ như phân tích liên quan nhân quả (FormRules) hay tối ưu hóa công thức/ quy trình (CADChem, INForm) Với mong muốn tích hợp các kỹ thuật thông minh của 2 chức năng chính (Phân tích liên quan nhân quả và Tối ưu hóa/ dự đoán) như các phần mềm nước ngoài trở thành 2 giai đoạn trong 1 hệ thống thông minh, với giao diện hoàn toàn bằng tiếng
Việt, đề tài “Nghiên cứu và phát triển thuốc bằng hệ thống phần mềm thông minh tự thành lập” được thực hiện với các mục tiêu:
1 Xây dựng hệ thống phần mềm thông minh Phasolpro RD có 2 chức năng chính
là phân tích nhân quả và tối ưu hóa/ dự đoán
2 Đánh giá hệ thống phần mềm thông minh Phasolpro RD theo GMP
3 Kiểm chứng hệ thống phần mềm thông minh Phasolpro RD với cơ sở dữ liệu đã công bố trên các tạp chí chuyên ngành
4 Áp dụng hệ thống phần mềm thông minh Phasolpro RD trong nghiên cứu và phát triển thuốc
Trang 17CHƯƠNG 1 TỔNG QUAN TÀI LIỆU
1.1 Nghiên cứu và phát triển thuốc
1.1.1 Khái niệm nghiên cứu và phát triển
Vai trò nghiên cứu và phát triển
Chất lượng của thuốc không phải chỉ được chứng nhận bởi giai đoạn kiểm tra chất lượng mà phải được xây dựng trong mọi giai đoạn của quá trình sản xuất, bao gồm giai đoạn nghiên cứu và phát triển thuốc Mỗi sản phẩm thuốc đều có một vòng đời nhất định từ bắt đầu, tiến triển, đỉnh cao, suy giảm và kết thúc Vì thế nhà sản xuất cần phải liên tục đổi mới về sản phẩm Đổi mới một sản phẩm có liên quan đến việc thành lập công thức, có thể được tiến hành theo hai hướng: cải tiến sản phẩm cũ (về công thức, dạng bào chế ) hoặc thay bằng sản phẩm mới (với hoạt chất khác) [29]
Xây dựng công thức/ quy trình
Theo FDA (Mỹ), một thuốc gốc hay thuốc của nhà phát minh (innovator drug) muốn được phép sản xuất phải nộp hồ sơ đầy đủ, trong đó có việc đánh giá sinh khả dụng và thử lâm sàng giai đoạn I-III mất nhiều thời gian và tốn kém Đối với thuốc generic nhà sản xuất có thể làm hồ sơ miễn giảm, tức là không cần làm các mục số
7, số 8 và số 9 nhưng phải đánh giá về tương đương sinh học [29] – Bảng 1.1
Để thành lập một công thức, nhiều thông tin liên quan cần được xác định như: tính chất của nguyên liệu, điều kiện thiết bị và nhà xưởng, tiêu chuẩn và phương pháp kiểm nghiệm, yêu cầu kinh tế - thị trường Thông thường, công thức được thành lập theo kinh nghiệm qua 4 giai đoạn:
- Xây dựng tiêu chuẩn: Phân tích tiêu chuẩn, xây dựng tiêu chuẩn
- Thành lập công thức theo truyền thống: tham khảo công thức cũ, chọn thành phần, tỉ lệ
- Kiểm tra chất lượng sản phẩm: Chọn phương pháp kiểm nghiệm, tiến hành thử nghiệm, phân tích kết quả
- Hoàn thiện công thức: Thay đổi nguyên liệu, điều chỉnh tỷ lệ
Trang 18Bảng 1.1 Yêu cầu của FDA (Mỹ) chứng nhận thuốc gốc và generic
“Nguồn: FDA-US, Office of Generic Drugs, 2000” [29]
Thành lập công thức bằng con đường truyển thống không cho nhà bào chế biết yếu tố nào ảnh hưởng trên tính chất sản phẩm, sự ảnh hưởng tuân theo những quy luật nào, làm sao tối ưu hóa công thức theo yêu cầu và dự đoán tính chất sản phẩm nếu thay đổi công thức Từ đó dẫn đến các sai sót như khảo sát yếu tố không cần mà
bỏ sót yếu tố cần thiết, gây mất nhiều thời gian và công sức mà không đạt được yêu cầu về chất lượng Công thức được thành lập một cách khoa học hơn bằng cách trước tiên thiết kế công thức nhằm xây dựng mô hình thực nghiệm, xem xét các yếu
tố ảnh hưởng như thành phần và/ hoặc điều kiện pha chế (nhân) đối với tính chất của sản phẩm (quả); Sau đó sẽ tối ưu hóa để xác định giá trị tối ưu của thành phần/ điều kiện pha chế sao cho sản phẩm có thể hoàn thiện hơn về tiêu chuẩn chất lượng, hiệu quả hơn về tính sinh khả dụng, đạt yêu cầu về giá thành
1.1.2 Mô hình thực nghiệm
Ý nghĩa của mô hình thực nghiệm
Mô hình thực nghiệm là bảng thiết kế gồm các yếu tố khảo sát cũng như định hướng thu thập thông tin hay dữ liệu Dữ liệu thu thập được là đầu vào cho quá trình phân tích liên quan nhân quả và tối ưu hóa Trong mô hình thực nghiệm có 2 biến: biến độc lập (nhân) ký hiệu là X, các giá trị là xi (Thí dụ: loại nguyên liệu, lượng nguyên liệu, dung môi ) và biến phụ thuộc (quả) ký hiệu là Y, các giá trị là
yi (Thí dụ: độ cứng, độ hòa tan, hiệu suất chiết )
Trang 19Phân loại mô hình thực nghiệm
Có 3 mô hình thực nghiệm thường gặp trong ngành Duợc:
- Mô hình công thức
- Mô hình quy trình
- Mô hình kết hợp (công thức và quy trình)
Mô hình thực nghiệm có thể là mô hình đầy đủ cần nhiều thí nghiệm hay mô hình phân đoạn cần số thí nghiệm tối thiểu Trong các mô hình phân đoạn có mô hình tối ưu, thí dụ: D-Optimal [4]
Trong sản xuất thuốc, với mỗi lô thuốc sản xuất, ngoài bào chế, thì cần kiểm nghiệm bán thành phẩm, thành phẩm Nên tốn nhiều công sức và chi phí để hoàn thành 1 công thức từ bào chế đến kiểm nghiệm thành phẩm Vì thế mô hình thí nghiệm trong bào chế thuốc thường được thiết kế dựa trên các mô hình phân đoạn tối ưu như mô hình D-Optimal, để đảm bảo vẫn đủ không gian thiết kế nhưng số lượng thí nghiệm tối thiểu
1.1.3 Phân tích liên quan nhân - quả
Mối liên quan là sự tương ứng giữa 2 biến số X và Y Trường hợp đơn giản trong toán thống kê gọi là tương quan, khi phức tạp được gọi là mối liên quan nhân quả Mối liên quan nhân quả này có tính biện chứng và đôi khi rất phức tạp Mối liên quan nhân quả có thể xảy ra trong nhiều lĩnh vực trong ngành Dược, như trong Bào chế và Công nghiệp Dược thì nhân là thành phần công thức (loại tá dược, nồng độ…) và/ hay điều kiện sản xuất (quy trình xát hạt, dập viên ) còn quả là tính chất sản phẩm (độ rã, độ hòa tan,…); Trong chiết xuất dược liệu thì nhân có thể là đặc tính của dược liệu (nguồn gốc, thời vụ, bộ phận xử lý…), dung môi, phương pháp chiết…, còn quả là hiệu suất chiết, hàm lượng hoạt chất, tỉ lệ tạp… Trong kiểm nghiệm thì nhân là loại cột, thành phần pha động, tốc độ dòng, kỹ thuật (đồng đẳng, gradient)…, còn quả là thời gian lưu, đỉnh hấp thu, độ phân giải, hệ số đối xứng Trong hóa dược thì nhân có thể là chất tham gia, nhiệt độ, thời gian phản ứng, phương pháp tổng hợp…, còn quả là hiệu suất tổng hợp, tỉ lệ tạp chất…
Trang 201.1.4 Tối ưu hóa thông minh
1.1.4.1 Ý nghĩa và phân loại tối ưu hóa
Tối ưu hóa một công thức là xác định giá trị tối ưu của thành phần/ điều kiện (nhân) sao cho sản phẩm đạt tính chất như mong muốn (quả) Tùy theo số lượng biến phụ thuộc y mà có các khái niệm "tối ưu hóa đơn giản" (ychỉ có một giá trị) hay "tối ưu hóa đồng thời nhiều đáp ứng" (y có nhiều giá trị) Trong thực tế, đặc biệt ở ngành Dược, lúc nào cũng có nhiều biến y và các giá trị này có thể mâu thuẫn lẫn nhau Khi biến độc lập X có giới hạn về giá trị ta có khái niệm "tối ưu hóa có ràng buộc", ngược lại ta có khái niệm "tối ưu hóa không ràng buộc" [50]
1.1.4.2 Tối ưu hóa và dự đoán thông minh
Các phương pháp tối ưu hóa truyền thống (toán thống kê, đơn hình…) chỉ áp dụng với các dữ liệu đơn giản và tuyến tính, không phù hợp với dữ liệu phức tạp và phi tuyến Ngoài ra, phương pháp truyền thống không tối ưu hóa được đồng thời nhiều biến phụ thuộc (đa đáp ứng) trong khi sản phẩm thường có rất nhiều tính chất Ngày nay, việc xây dựng công thức thuốc có thể được thực hiện một cách khoa học bằng cách sử dụng các kỹ thuật thông minh như: Logic mờ-thần kinh (neuro-fuzzy) cho phép thiết lập mối liên quan nhân quả giữa nhân (X) và quả (Y), để xác định được xu hướng, mức độ và quy luật liên quan Hay sự kết hợp mạng thần kinh
để thiết lập mô hình liên quan nhân quả và dự đoán quả (Y) từ nhân (X) biết trước; Với thuật toán di truyền nhằm tối ưu hóa dựa trên mô hình liên quan nhân quả đã được thiết lập bởi mạng thần kinh; Và logic mờ làm cho mạng thần kinh có hiệu quả hơn trong việc thiết lập mô hình liên quan nhân quả đối với các dữ liệu phức tạp đồng thời giúp cho thuật toán di truyền được thuận tiện hơn trong sự tối ưu hóa với các hàm mục tiêu trực quan
Sau khi thiết lập mô hình liên quan nhân quả thông qua quá trình luyện mạng, nhà bào chế có thể ấn định các giá trị của nhân (X) để từ đó dự đoán được quả (Y)
Ví dụ: Trong bào chế công thức mới, thông qua mô hình nhân quả đã thiết lập, dễ dàng biết được tính chất sản phẩm (độ hòa ta, độ cứng…) khi thay đổi thành phần/
Trang 21điều kiện pha chế (loại tá dược, nồng độ tá dược…) Quá trình dự đoán hoàn toàn phụ thuộc vào mô hình liên quan nhân quả Nó có thể được áp dụng nhằm: dự đoán các tính chất của sản phẩm từ công thức tối ưu, dự đoán giá thành sản phẩm từ công thức tối ưu (nếu trong mô hình thực nghiệm có tính đến chi phí của nguyên liệu và điều kiện sản xuất), dự đoán một số tình huống xấu (worst cases) có thể xảy ra nếu như nhà bào chế sử dụng các thông số vượt quá những giới hạn đã được thiết lập đối với công thức tối ưu [50]
1.1.4.3 Nguyên lý hoạt động của tối ưu hóa thông minh
Nguyên lý hoạt động của phần mềm tối ưu hóa thông minh là sự kết hợp hài hòa giữa 2 kỹ thuật thông minh gồm mạng thần kinh và thuật toán di truyền Mạng thần kinh giúp thiết lập mô hình liên quan nhân quả và dự đoán kết quả (Y) từ nhân (X) biết trước Thuật toán di truyền giúp tối ưu hóa thông số dựa trên mô hình liên quan nhân quả đã được thiết lập bởi mạng thần kinh Sự phối hợp mạng thần kinh với thuật toán di truyền làm cho sự phản hồi các giá trị thích hợp một cách nhanh chóng từ mô hình liên quan nhân quả
Hình 1.1 Nguyên lý hoạt động của tối ưu hóa và dự đoán thông minh
1.2 Các kỹ thuật thông minh
1.2.1 Khái niệm kỹ thuật thông minh
Trí tuệ nhân tạo dựa trên nhiều ngành khoa học (ngôn ngữ học, tâm lý học, kỹ thuật học, triết học, tin học…) và được áp dụng rộng rãi trong nhiều lĩnh vực (máy
sản phẩm
Mô hình hóa
Dự đoán
Tối ưu hóa
“Nguồn: Đặng Văn Giáp, 2002” [14]
Trang 22móc, tự động hóa, thiết lập mô hình, tối ưu hóa, xử lý ảnh, nhận dạng…) Trong lĩnh vực tối ưu hóa công thức, trí tuệ nhân tạo ngày càng được áp dụng sâu rộng vì tốc độ xử lý của máy tính luôn tăng lên và chi phí luôn giảm xuống [50] Một số công cụ trí tuệ nhân tạo thường được kết hợp để áp dụng trong lĩnh vực tối ưu hóa công thức: Mạng thần kinh, logic mờ và thuật toán di truyền Ngày nay, lĩnh vực phân tích liên quan nhân quả thường sử dụng logic mờ-thần kinh
1.2.2 Các kỹ thuật thông minh liên quan
1.2.2.1 Mạng thần kinh nhân tạo
Mạng thần kinh nhân tạo là sự mô phỏng toán học của mạng thần kinh sinh học, được tạo thành bởi sự liên kết giữa nhiều đơn vị thần kinh nhân tạo Những đơn vị này có thu thập các tín hiệu, trọng số, tổng cộng và chuyển các tín hiệu ấy sang đơn
vị thần kinh khác Các tín hiệu ở đây thuộc dạng vector và ma trận đại số Cấu trúc mạng thần kinh có nhiều loại khác nhau Trong đó, cấu trúc mạng thần kinh đa lớp thường gặp nhất là mạng bao gồm một lớp vào, một hay nhiều lớp ẩn và một lớp ra
Cấu trúc mạng với một lớp ẩn (Hình 1.2) hay được dùng trong việc thiết lập mô
hình và tối ưu hóa công thức [56], [72]
Hình 1.2 Minh họa tổng quát về cấu trúc mạng thần kinh đa lớp
“Nguồn: Schiffmann W., Joost M., Werner R , 1994” [72]
Trang 23Thuật toán lan truyền ngược [11], [56], [68], [72]:
Năm 1986 Rumelhart và McClelland giới thiệu thuật toán lan truyền ngược cho
mô hình mạng phức tạp, nhiều lớp Thông thường mô hình mạng lan truyền ngược thường dùng có dạng: 1 lớp nhập – 1 lớp ẩn – 1 lớp xuất Giả sử cho một tập luyện
k mẫu: {xi(k), yi(k)}, thuật toán lan truyền ngược cung cấp kỹ thuật hiệu chỉnh các trọng số Wij trong mạng nhằm phân lớp các giá trị đầu vào một cách chính xác, hay nói cách khác: mạng có thể “học” và “hiểu” được dữ liệu đưa vào
Sai số trung bình bình phương E thường được dùng để đo lường sự trùng khớp
giữa ánh xạ cần xây dựng với hàm đích cho trước (hay nói cách khác là dùng đánh giá khả năng “học” của mạng)
Cho tập mẫu gồm N mẫu {(Xk, T)}= {x1, x2, , xk, t}(n); n = 1, , N; gọi Z = NN(Xk) = {z1, z2, , zN} là giá trị ước tính qua mạng thần kinh, thì sai số trung bình bình phương E được tính:
Công thức 1.1
Trong trường hợp mô hình mạng neuron là hàm phi tuyến, việc xác định được tập trọng số W để mô hình đạt được sai số ít nhất là rất khó Phương pháp giảm gradient thường được sử dụng trong các trường hợp phức tạp này
Phương pháp giảm gradient có các bước chính sau:
- Chọn ngẫu nhiên một điểm x0 trong không gian trọng số
- Tính độ dốc của mặt lỗi tại x0
- Cập nhật các trọng số theo hướng dốc nhất của mặt lỗi
- Xem điểm này như điểm x0 mới
Lặp lại quá trình từ bước (2) đến (4) thì đến một lúc nào đó các giá trị của bộ trọng số sẽ tiếp cận được điểm thấp nhất trong mặt lỗi
Biến thiên trọng số ở mỗi bước (bước t) sẽ được tính theo công thức:
Công thức 1.2
2 1
1 2
Trang 24với ε, α là hai hằng số dương đặc trưng cho tốc độ học và moment của quá trình học (giảm lỗi) Tuy nhiên, có một số cải tiến cho phép thay đổi các hệ số ε, α trong từng giai đoạn học, cũng như theo từng mẫu học để việc luyện mạng đạt hiệu quả cao nhất Như vậy, thuật toán lan truyền ngược có thể được tóm tắt thành hai quá trình chính: lan truyền tiến, lan truyền ngược
Lan truyền tiến: là quá trình tính giá trị đầu ra {z1, z2, , zN} dựa trên những
trọng số có sẵn Giả sử tại một nút mạng như Hình 2.1.4, giá trị xuất zj được tính: zj
= f(u);
với u = x1.w1j + x2.w2j + + xn.wnj + w0 (Công thức 1.3)
Hàm f() được gọi là hàm truyền có dạng chữ S nếu có các tính chất sau: bị chặn, đơn điệu tăng, hàm liên tục trơn Mọi hàm thỏa các tính chất trên đều có thể sử dụng làm hàm truyền trong mạng Các hàm thường được dùng trong mạng lan truyền ngược:
Lan truyền ngược: là quá trình cập nhật lại các trọng số mạng W dựa trên sai số
trung bình bình phương Gọi wt là trọng số tại bước thứ t, công thức cập nhật trọng
số là:
Công thức 1.6
t t
w = −1+Δ
1 ( )
f u
e−
= +
1( )1
u u
Trang 25Δwt được tính theo Công thức 1.2, công thức này cần xác định giá trị:
Công thức 1.7
trong đó u là giá trị đưa vào hàm truyền f(u) tương ứng ở mỗi nút
Với mạng đang xét là mạng 3 lớp, tại nút xuất z theo qui tắc chuỗi:
Trong Công thức 1.7 giá trị diễn tả sự thay đổi của u vào sự thay đổi
trọng số w Tóm lại, giá trị tại nút xuất được tính:
Công thức 1.12
Tương tự cho nút ẩn thứ j:
Công thức 1.13
với p = (z-t)z(1-z); bj là trọng số cung nối từ nút ẩn thứ j đến nút xuất
Như vậy, khi quá trình lan truyền ngược thực hiện, các trọng số sẽ được cập nhật sao cho sai số trung bình bình phương có xu hướng giảm dần Quá trình lan truyền tiến và lan truyền ngược được thực hiện xen kẽ nhiều lần cho đến khi đạt được giá trị sai số trung bình bình phương E mong muốn
Vì các trọng số được điều chỉnh cho phù hợp với dữ liệu của nhóm luyện, có thể mạng thần kinh trải qua sự luyện quá mức (overtraining) Khi ấy mạng thần
)1( z z u
u u
E w
E
∂
∂ δ
E u
,
pb j E
f x
pb i w
Trang 26kinh có thể chỉ dự đoán tốt cho nhóm luyện mà không dự đoán chính xác đối với các trường hợp mới Do đó, dữ liệu nghiên cứu nên được chia thành hai nhóm: luyện và thử Sau khi dùng nhóm luyện để luyện mạng, người ta sẽ dùng nhóm thử
để đánh giá về mạng Nếu các giá trị dự đoán gần đúng với các giá trị quan sát thì khả năng dự đoán của mạng thần kinh được xem là tốt Khi luyện mạng với nhóm luyện và nhóm thử, mô hình được thiết lập từ nhóm luyện sẽ được dùng để dự đoán các tính chất của những công thức trong nhóm thử Hai giá trị R2 luyện và R2 thử được tính bởi phần mềm thông minh:
y: giá trị thực nghiệm
: giá trị dự đoán nội (R2 luyện) hoặc giá trị dự đoán ngoại hay chéo (R2 thử)
Mạng thần kinh nhân tạo có các ưu điểm: có thể được áp dụng rộng rãi với dữ liệu phức tạp hay phi tuyến, có khả năng luyện các dữ liệu đầu vào để thiết lập mối liên quan nhân quả nhằm dự đoán chính xác “quả” của “nhân”, không đòi hỏi dữ liệu đầu vào phải thật đầy đủ, ít bị lỗi vì mạng thần kinh có nhiều đơn vị và áp dụng
dễ dàng, xử lý nhanh chóng và bảo trì thuận tiện
Có thuật toán được phát triển nhằm cải tiến quá trình luyện như: khởi tạo và cố định tốc độ học (Fixed calculation of the learning rate), giảm tốc độ học theo quá trình học (Decreasing learning rate), điều chỉnh tốc độ học theo mỗi mẫu luyện (learning rate adaptation for each training pattern), tiến hóa tốc độ học (Evolutionary adapted learning rate), điều chỉnh tốc độ học bằng thay đổi tín hiệu gradient (Learning rate adaptation by sign changes), ngăn lỗi bão hòa (Error Saturation Prevention) Trong đó, một số kỹ thuật được phát triển dựa trên kỹ thuật điều chỉnh tốc độ học bằng thay đổi tín hiệu gradient thường được sử dụng như: điều chỉnh tốc độ học bằng thay đổi tín hiệu (Learning rate adaptation by sign changes), SuperSAB, Quickprop, RPROP, Backprop + kỹ thuật giảm tộc độ học (Decreasing learning rate), Delta-Bar-Delta [72]
yˆ
Công thức 1.14
100)yy(
)yˆy(1
1
2 i
n
1
2 i 2
Trang 27Bảng 1.2 So sánh các kỹ thuật cải tiến thuật toán lan truyền ngược
Sơ đồ 1.1 Minh họa quá trình xử lý của logic mờ
Hàm thành viênđầu ra
Trang 28Trong logic cổ điển hàm thành viên chỉ có một trong hai giá trị là 1 (Đúng) hay
0 (Sai) Điều này không phản ánh đầy đủ thế giới khách quan, vì giữa hai màu
“trắng” và “đen” còn có màu “xám” Trong logic mờ, hàm thành viên có thể cho các giá trị ở giữa 0 và 1 Hàm thành viên càng tiến đến 1 thì giá trị của nó càng gần Đúng Nhờ đó, logic mờ có tính hiện thực hơn logic cổ điển
c x b b c
x c
b x a a b
a x
a x c
b a x triangle
0
0)
,,
;(
;(
b c
x c a b
a x c
b a x triangle
1.0
Trang 29d x c c d
x d
c x b
b x a a b
a x
a x
d c b a x trapezoid
01
0
),,,
;(
,,
;(
c d
x d a b
a x c
b a x trapezoid
e c
x gaussian
1.0
Trang 30Hàm Bell: Hàm Bell được xác định bởi 3 giá trị {a, b, c} theo công thức:
1.2.2.3 Thuật toán di truyền
Thuật toán di truyền được xây dựng và phát triển từ 1970 Thuật toán di truyền dựa trên nguyên tắc cơ bản của sinh học về biến dị, di truyền và chọn lọc tự nhiên Đến nay, thuật toán di truyền được sử dụng để giải quyết vấn đề trong các lĩnh vực khác nhau: tối ưu hóa, lập trình tự động, di truyền học cộng đồng,…
b
a
c x c
b a x
1
1)
,,
;(
−+
Trang 31Các bước tiến hành trong quá trình tối ưu của thuật toán di truyền [11]
- Bước 1: Chọn mô hình cho giải pháp của vấn đề, chọn một số tượng trưng cho
toàn bộ các giải pháp có thể có cho vấn đề
- Bước 2: Chỉ định cho mỗi giải pháp một ký hiệu Ký hiệu có thể là dãy của
những số 0, 1 thuộc hệ nhị phân, hay dãy số thập phân, dãy của chữ hay hỗn hợp của số và chữ
- Bước 3: Tìm hàm số thích nghi cho vấn đề và tính hệ số thích nghi cho từng
giải pháp
- Bước 4: dựa trên hệ số thích nghi của các giải pháp để thực hiện sự tạo sinh (reproduction) và biến hoá các giải pháp Các phương thức biến hóa gồm: lai ghép (cross over), đột biến (mutation)
- Bước 5: Tính các hệ số thích nghi cho các giải pháp mới và loại bỏ những giải pháp kém nhất để chỉ còn giữ lại một số nhất định các giải pháp tốt
- Bước 6: Nếu chưa tìm được giải pháp tối ưu hay tương đối khá nhất hay chưa hết hạn kỳ ấn định, trở lại Bước 4 để tìm giải pháp mới
- Bước 7: Tìm được giải pháp tối ưu hoặc nếu thời gian cho phép đã chấm dứt thì
báo cáo kết quả tính được
Cách biểu diễn các biến [11]
Bước đầu tiên trong thuật toán di truyền là mã hóa, ánh xạ các biến Hai cách thông dụng cho việc mã hóa: vectơ nhị phân, vectơ điểm thực
- Vectơ nhị phân: các biến sẽ được mã hóa thành chuỗi nhị phân 0, 1 Quá trình
tính toán sẽ thực hiện trên chuỗi nhị phân này
- Vectơ số thực: có sự cải tiến trong việc mã hóa, việc xử lý diễn ra trong không
gian thực, mỗi biến sẽ được mã hóa thành vectơ điểm thực Mỗi số thực sẽ đảm nhận vai trò một cá thể trong quần thể, các phép toán trên cá thể (lai ghép, đột biến) đều trên không gian số thực
Sơ đồ 1.2 trình bày tóm lược các bước trong tiến trình tối ưu hóa bằng thuật
toán di truyền Từ quần thể ban đầu, nhà bào chế sẽ ấn định hàm mục tiêu và thực hiện tối ưu hóa để tìm ra công thức Với những kết quả xử lý không đạt, dữ liệu sẽ
Trang 32được lặp lại qua các bước chọn lọc, tạp giao và biến dị để tạo quần thể mới Quần thể mới được tiếp tục chuyển qua bước đánh giá hàm mục tiêu và tối ưu hóa cho đến khi chọn được phần tử tốt nhất
Sơ đồ 1.2 Tóm tắt quá trình tối ưu hóa bằng thuật toán di truyền
Thuật toán di truyền có các ưu điểm như: vận hành dựa vào các yếu tố phần tử ngẫu nhiên thay gì quy luật rất hiệu quả đối với trường hợp có nhiều đỉnh tối ưu hay
bị nhiễu; Có thể thăm dò nhiều giải pháp trong cùng một lúc, có ích khi tìm đỉnh tối
ưu toàn phần; Khó bị ảnh hưởng bởi điểm bắt đầu của quá trình thăm dò Tuy nhiên, thuật toán di truyền cần kết hợp với mạng thần kinh vì nó đòi hỏi sự phản hồi các giá trị thích hợp một cách nhanh chóng [11]
1.2.2.4 Logic mờ - thần kinh
Khái niệm: Logic mờ-thần kinh là hệ trí tuệ nhân tạo lai, kết hợp giữa khả năng
suy luận của logic mờ cùng với khả năng học và cấu trúc kết nối của mạng thần kinh nhân tạo Trong hệ thống này, mạng thần kinh nhân tạo được đưa vào làm tăng khả năng tự điều chỉnh các biến trong các luật mờ và hàm thành viên của hệ thống [54]
Quá trình xử lý: Với sự kết hợp giữa logic mờ và mạng thần kinh nhân tạo, khả
năng học và suy diễn của hệ thống sẽ tốt hơn so với mạng thần kinh nhân tạo thông thường và tốc độ học cũng nhanh hơn Quá trình này được thực hiện bằng cách hiện thực hóa hàm mờ, luật mờ và giải mờ thông qua mạng nhiều lớp lan truyền thẳng
Tạo quần thể mới
Biến
dị
Chọn lọc
Tạp giao không
Bắt đầu
Kết thúc Đạt
Tạo quần thể ban đầu
Trang 33Quá trình gồm các giai đoạn chính: không gian cho các dữ liệu đầu vào, các hàm
thành viên liên hợp, đánh giá các trọng số và truy xuất dữ liệu đầu ra (Hình 1.3)
Hình 1.3 Quy trình xử lý của hệ thống logic mờ - thần kinh
Logic mờ - thần kinh có những ưu điểm nổi bật sau: khả năng học và suy diễn của hệ thống tốt hơn so với mạng thần kinh nhân tạo thông thường; tốc độ học dữ liệu nhanh hơn, có thể xử lý mọi dữ liệu (mơ hồ, định tính, ngôn ngữ, thiếu trị số );
có khả năng tự học, tự tổ chức và tự định hướng; không cần biết trước mô hình liên quan của dữ liệu; có thể được áp dụng dễ dàng và linh hoạt; có thể xử lý nhanh chóng nhờ các toán tử mờ [51], [54], [69]
1.2.2.5 Kết hợp 3 kỹ thuật cho tối ưu hoá công thức, quy trình
Các bước tiến hành tối ưu (tìm giá trị biến độc lập theo biến phụ thuộc)
Bước 1: với dữ liệu thực nghiệm ban đầu, làm dữ liệu cho mạng neuron Tìm
mô hình nhân quả giữa các biến độc lập x và các biến phụ thuộc y Kiểm tra lại độ chính xác của mô hình nhân quả bằng các bộ dữ liệu thử và các đánh giá thống kê
Bước 2: xác định các khoảng giá trị các biến phụ thuộc theo yêu cầu người
dùng, dùng thuật toán di truyền kết hợp logic mờ tìm ra các giá trị biến độc lập tốt nhất Ở bước này có sử dụng logic mờ với mục đích là tìm những giá trị biến độc lập sao cho các giá trị biến phụ thuộc gần với giá trị được yêu cầu nhất Thuật toán
di truyền sử dụng mô hình nhân quả ở Bước 1 làm hàm thích nghi để tìm các giá trị
biến độc lập tốt nhất Quá trình tìm kiếm trong quần thể sẽ lặp lại cho đến khi tìm ra
Trang 34giá trị biến độc lập thỏa các yêu cầu biến phụ thuộc hoặc hết thời gian cho phép Kết quả xuất ra sẽ là giá trị biến độc lập tốt nhất đáp ứng được yêu cầu đặt ra đối với biến phụ thuộc
Sơ đồ 1.3 Minh họa nguyên lý hoạt động của quá trình tối ưu hóa thông minh
1.2.3 Phần mềm thông minh
Các kỹ thuật thông minh thường được phát triển như 1 công cụ trong 1 phần mềm như công cụ Netlab Toolbox của phần mềm MatLab (công ty MathWorks) hay phần mềm về thống kê JMP (công ty SAS), rất ít được phát triển thành 1 phần mềm chuyên dụng, độc lập, đặc biệt cho ngành Y Dược Hiện nay, trên thế giới có 1 vài phần mềm chuyên dụng cho Y Dược như:
Phần mềm CAD/Chem
- Nhà sản xuất: AI Ware Inc., USA
- Chức năng: chuyên dụng trong lĩnh vực tối ưu hóa công thức và quy trình
- Kỹ thuật sử dụng: Mạng thần kinh nhân tạo, thuật toán di truyền
Trang 35- Thuật toán: AB (Accelerated BackProp)
- Ưu điểm: đơn giản, có chức năng tối ưu hóa thông minh và dự đoán
- Nhược điểm: chỉ có chức năng tối ưu hóa và dự đoán, không có công cụ dừng trong quá trình mô hình hóa, không ràng buộc biến độc lập, chỉ có 1 thuật toán
Phần mềm INForm
- Nhà sản xuất: Intelligensys, Ltd, UK
- Chức năng: chuyên dụng trong lĩnh vực tối ưu hóa công thức và quy trình
- Kỹ thuật sử dụng: Mạng thần kinh nhân tạo, thuật toán di truyền, logic mờ
- Thuật toán: SB, SI, RP, QP và ADL
- Ưu điểm: có chức năng tối ưu hóa thông minh và dự đoán, nhiều thuật toán lựa chọn, có công cụ dừng khi luyện mạng, có ràng buộc biến độc lập và phụ thuộc
- Nhược điểm: chỉ có chức năng tối ưu hóa và dự đoán bằng phương pháp số học
Phần mềm FormRules
- Nhà sản xuất: Intelligensys, Ltd, UK
- Chức năng: chuyên dụng trong lĩnh vực tối ưu hóa công thức và quy trình
- Kỹ thuật sử dụng: logic mờ- thần kinh
- Thuật toán: AIC, FPE, GCV, MDL, SRM
- Ưu điểm: có chức năng phân tích liên quan nhân quả, đồ thị nhân quả, biểu đồ 3D
- Nhược điểm: chỉ có chức năng phân tích liên quan nhân quả, không tối ưu hóa
và dự đoán, luyện mạng không được lựa chọn nhóm thử
1.2.4 Nghiên cứu - phát triển với phần mềm thông minh
Các công cụ thông minh như mạng thần kinh nhân tạo và/ hoặc thuật toán di truyền, logic mờ-thần kinh được ứng dụng trong nhiều lĩnh vực của ngành Dược trên thế giới, còn ở Việt nam cũng bắt đầu phát triển trong những năm gần đây
1.2.4.1 Một số nghiên cứu trên thế giới
Trong lĩnh vực bào chế: Áp dụng để thành lập công thức như: nghiên cứu và
tối ưu hóa độ hòa tan của hệ phân tán rắn chứa tibolone (chất kém tan), sử dụng hỗn hợp PVP/ PEG làm chất mang, bằng kỹ thuật làm nóng chảy hỗn hợp [65]; Thiết kế
và tối ưu hóa hệ phân phối tiểu phân nano chứa fingolimod dựa trên chất phân hủy
Trang 36sinh học poly(3-hydroxybutyrate-Co-3-hydroxyvalerate) [70]; Tối ưu hóa công thức viên nén nimodipin phóng thích có kiểm soát [64]; Tối ưu hóa thành phần hỗn hợp PVP/PEG được sử dụng là chất mang để bào chế thuốc phân tán rắng bằng kỹ thuật trộn nóng [66]; Mô hình hóa và tối ưu hóa công thức tiểu phân nano dạng polymer thân dầu chứa hoạt chất verapamil hydrochlorid phóng thích có kiểm soát [53] Áp
dụng để đánh giá tương quan như: đánh giá tương quan in vivo/ in vitro trong phân phối thuốc qua phổi dùng bình xịt [57]; Đánh giá tương quan in vivo/ in vitro trong
bào chế thuốc bột khô sử dụng qua đường hô hấp [59] Áp dụng để tối ưu hóa quy trình: Xác định các yếu tố của quy trình bào chế kiểm soát cỡ hạt của nhũ tương nano [26]; Tối ưu hóa quy trình kết tinh một số dược chất (với thông số đầu vào: nhiệt độ, thể tích, nồng độ và thời gian thêm dung môi, pH, và tốc độc khuấy) [76]
Áp dụng để dự đoán tính chất sản phẩm như: dự đoán tỉ lệ hạt mịn trong công thức thuốc bột dạng hít [47]; Dự đoán sự phóng thích của thuốc từ các khung matrix thân dầu dạng rắn [41]
Trong lĩnh vực kiểm nghiệm: Phân tích đồng thời 2 hoạt chất levodopa and
benserazide HCl sử dụng phương pháp phổ ký động [74]; Tối ưu hóa điều kiện sắc
ký (pH và thành phần pha động) trong quy trình phân tích bằng Sắc ký lỏng hiệu năng cao đối với các hỗn hợp salbutamol - guaiphenesin và acid ascorbic – paracetamol – guaiphenesin [62]; Định tính và định lượng các thành phần acid
chlorogenic, acid caffeic và rutin trong Calendula officinalis sử dụng phương pháp
sắc ký lớp mỏng hiệu năng cao [25]; Tối ưu hóa thành phần tạo vi nhũ tương (nồng
độ chất diện hoạt, phần trăm chất đồng diện hoạt, phần trăm dung môi dầu hữu cơ, nhiệt độ và pH) hỗ trợ phương pháp sắc ký lỏng để phân tích đồng thời các vitamin tan trong dầu [34]; Dự đoán thời gian lưu của terbipenem pivoxyl và sản phẩm phân hủy của nó bằng phương pháp sắc ký lỏng hiệu năng cao [60]
Trong lĩnh vực chiết xuất dược liệu: Mô hình hóa và tối ưu hóa quy trình chiết
xuất epigallocatechin-3-gallate từ trà xanh bằng phương pháp dòng CO2 siêu tới hạn (yếu tố tối ưu: áp suất, nhiệt độ, tốc độ dòng chảy CO2, và thời gian chiết [40]; Mô hình hóa, tối ưu hóa và dự đoán quy trình chiết xuất β-carotene từ Aloe barbadensis
Trang 37Miller bằng phương pháp chiết xuất dòng CO2 siêu tới hạn [35]; Mô hình hóa, tối
ưu hóa quy trình chiết xuất Ferulago angulata bằng phương pháp chiết xuất dòng
CO2 siêu tới hạn (các thông số: áp suất, nhiệt độ, cỡ hạt và thời gian chiết) [39]
Trong các lĩnh vực khác: Tối ưu hóa quy trình lên men (điều kiện: pH, nhiệt
độ và tốc độ khuấy) sản xuất catechol-O-methyltransferase bởi Escherichia coli
[71]; Mô hình hóa và dự đoán mối liên quan cấu trúc tác dụng của hoạt tính chống sốt rét của dẫn xuất urea [24]; Xác định mối liên quan cấu trúc tác dụng của of naratriptan hydrochlorid lên thụ thể serotonin 5-HT1 trong điều trị bệnh đau đầu cấp tính [61]; Dự đoán hiệu quả trên lâm sàng của bệnh nhân suyễn khi sử dụng salbutamol dạng khí dung [58]
1.2.4.2 Một số nghiên cứu trong nước
Ở Việt nam, ứng dụng kỹ thuật thông minh vào nghiên cứu và phát triển thuốc chủ yếu là sử dụng phần mềm INForm và FormRules (Công ty Intelligensys – Anh Quốc) Công cụ thông minh bao gồm mạng thần kinh nhân tạo, kết hợp thuật toán
di truyền, với sự hỗ trợ của logic mờ-thần kinh
Trong lĩnh vực bào chế: Thiết kế và tối ưu hóa công thức viên nhân chứa
amoxicillin và acid clavulanic dùng phần mềm thông minh [12]; Tối ưu hóa quy trình sản xuất viên nén chứa phức piroxicam-beta-cyclodextrin bằng thiết kế thực nghiệm [17]; Nghiên cứu xây dựng công thức điều chế viên nén rã nhanh chứa loratadin 10 mg [13]; Xây dựng công thức thuốc bột cefuroxim pha hỗn dịch uống [2]; Xây dựng công thức viên nén chứa perindopril erbumine 4 mg với sự trợ giúp của phần mềm thông minh [8]; Tối ưu hóa thành phần công thức viên nén gliclazlid phóng thích kéo dài [23]
Trong lĩnh vực kiểm nghiệm: Xây dựng quy trình định lượng đồng thời một số
thuốc kháng HIV trong huyết tương người bằng phương pháp sắc ký lỏng hiệu năng cao [10] Tối ưu hóa quy trình định lượng chì trong Đông dược – Mỹ phẩm bằng phương pháp phổ hấp thu nguyên tử [3] Tối ưu hóa quy ttrình thủy phân flavonoid
và xây dựng quy trình định lượng flavonoid từ dịch thủy phân lá trinh nữ hoàng cung bằng phương pháp HPLC [22]
Trang 38Trong lĩnh vực chiết xuất dược liệu: Xây dựng công thức viên nang Gilanka
chứa cao Bạch quả chuẩn hóa dùng một lần trong ngày [16]; Nghiên cứu tối ưu hóa
quy trình chiết xuất cao rau má (Centella asiatica (L.) URB.) [21]; Xây dựng quy trình chiết xuất cao khô Diệp hạ châu (Phyllanthus amarus Schum & Thonn.) [6]; Xây dựng quy trình chiết xuất cao nghệ (Curcuma longa L.) [7]; Nghiên cứu tối ưu hóa quy trình chiết xuất cao Diếp cá (Houtuynia cordata Thunb.) [20]
Trong lĩnh vực khác: Tối ưu hóa quy trình tổng hợp nifedipin [1]; Xây dựng
quy trình pha chế bộ KIT định lượng creatinin huyết thanh [15]; Tối ưu hóa quy trình điều chế felodipin từ (E)-methyl 2 (2,3-diclorobenzyliden)-3-oxobutanoat [5]
1.3 Thẩm định phần mềm trong GxP
1.3.1 Hệ thống được kiểm soát bởi máy tính
Hệ thống được kiểm soát bởi máy tính
Hệ thống được kiểm soát bởi máy tính (computerized System) bao gồm máy tính và chức năng được kiểm soát Trong đó, máy tính bao gồm phần cứng và phần mềm (điều khiển quá trình vận hành của máy tính), chức năng được kiểm soát bao gồm thiết bị và quy trình Trong GMP, quy trình phải được kiểm tra hay thẩm định, thiết bị phải được đánh giá Phần cứng của máy tính chuẩn cũng được kiểm tra trước khi sử dụng lần đầu; phần còn lại là phần mềm ứng dụng Do đó, thẩm định
“hệ thống được kiểm soát bởi máy tính”, hay còn gọi thẩm định “phần mềm” [44]
Môi trường GxP
Hiện nay, Thực hành tốt được triển khai ở nhiều lĩnh vực trong ngành Dược:
− Trong sản xuất: Thực hành tốt sản xuất, Thực hành tốt kiểm nghiệm, Thực
hành tốt bảo quản, Thực hành tốt phân phối, Thực hành tốt nghiên cứu - phát triển
− Trong bệnh viện: Thực hành tốt bảo quản, Thực hành tốt nhà thuốc, Thực hành
tốt lâm sàng
Ngày nay, sự phát triển của khoa học và công nghệ khiến cho hệ thống được kiểm soát bởi máy tính không thể thiếu trong các lĩnh vực Thực hành tốt (GxP)
Trang 391.3.2 Khái niệm thẩm định
1.3.2.1 Thẩm định theo GMP
Thẩm định là sự áp dụng những nguyên tắc khoa học và thống kê để thiết lập những chứng cớ bằng tài liệu, đảm bảo ở mức độ cao rằng quá trình sản xuất cho ra những sản phẩm đạt chất lượng mong muốn một cách ổn định [14]
Theo GMP-WHO, có ba loại hình thẩm định [14]:
a Kiểm định/ Hiệu chuẩn (calibration): Có đối tượng là các thiết bị phân tích như thiết bị phân tích, thiết bị đo lường và thiết bị chỉ thị
b Thẩm định (validation): Có đối tượng là các quy trình (sản xuất, kiểm nghiệm, thao tác chuẩn…) hoặc môi trường (không khí, bề mặt tiếp xúc, nhân viên,…)
c Đánh giá (qualification): Có đối tượng là các thiết bị sản xuất hoặc hệ thống thiết bị (thiết bị sản xuất HVAC, RO,…), trong đó có phần mềm
Về nguyên tắc, cần thẩm định tất cả hệ thống máy tính liên quan đến hoạt động GxP Theo WHO, trong 7 phần của chuyên đề thẩm định trong GMP, phần 5 là chuyên đề về thẩm định các phần cứng và các phần mềm liên quan đến hoạt động thực hành tốt sản xuất (GMP), kiểm ngiệm (GLP)…]: Thẩm định hệ thống được kiểm soát bởi máy tính [14], [38], [55], [75]
1.3.2.2 Thẩm định phần mềm
Thẩm định phần mềm là cung cấp bằng chứng một cách khoa học rằng phần mềm sẽ thực hiện lặp lại và tin cậy những gì đã dự kiến, phù hợp với mục đích và tuân theo các quy luật ứng dụng [36], [52]
Thẩm định phần mềm gồm 2 nội dung:
− Thử nghiệm phần mềm (software testing): là một trong những hoạt động về
kiểm chứng phần mềm Thử nghiệm phần mềm căn cứ theo Tiêu chuẩn kỹ thuật
của phần mềm (SRS: software requirements specification), gọi tắt là Tiêu chuẩn
kỹ thuật, bao gồm các giai đoạn thử nghiệm: đơn vị, tích hợp và hệ thống
− Đánh giá phần mềm (software qualification): là giai đoạn thẩm định tiếp sau
thử nghiệm Đánh giá phần mềm căn cứ theo Yêu cầu kỹ thuật của người dùng
(URS: user requirements specification), gọi tắt là Yêu cầu kỹ thuật, bao gồm các
giai đoạn: đánh giá cài đặt, đánh giá vận hành và đánh giá hiệu năng
Trang 401.3.3 Tư liệu thẩm định phần mềm trong GxP
1.3.3.1 Cơ sở khoa học
Năm 1987, Elizabeth H Brown đã đưa ra vấn đề, xây dựng “Quy trình thao tác chuẩn cho việc thẩm định phần mềm” Phần mềm máy tính cần thiết phải được thẩm định, bởi vì: phải xác nhận được rằng các chương trình ứng dụng phải đúng và cho kết quả như mong muốn; các hướng dẫn của FDA yêu cầu dữ liệu của các quá trình tự động thường sử dụng làm đầu vào và đầu ra từ máy tính, các quy trình phải được thiết kế và thực hiện để tránh dữ liệu không đúng cho đầu vào và đầu ra, và gây lỗi chương trình [28]
Năm 1993, David L Deitz và cộng sự đã nêu vấn đề liên quan giữa “Thẩm định phần mềm và quá trình phát triển phần mềm” Thẩm định phần mềm nên được xác định là một phần tích hợp trong quá trình phát triển phần mềm, hơn là một hệ thống hồ sơ sau khi kết thúc dự án thiết kế phần mềm, cũng như sau khi hoàn thành các bước xây dựng phần mềm [33]
Năm 1998, Hoffmann A và cộng sự đã định nghĩa và phân biệt “Yêu cầu và
tiêu chuẩn phần mềm” [44]: Yêu cầu (requirement): bất cứ nhu cầu hay kỳ vọng nào
về một hệ thống hay phần mềm Yêu cầu đối với một phần mềm có thể bao gồm: thiết kế, chức năng, giao diện, triển khai/ ứng dụng, hiệu năng, phần cứng Yêu cầu có thể phản ánh nhu cầu của người dùng, thị trường, luật pháp hay chủ ý công
ty Tiêu chuẩn kỹ thuật theo yêu cầu người dùng – (URS: user requirements
specification), gọi tắt là Yêu cầu kỹ thuật, được thành lập trước khi xây dựng một phần mềm và sau này để đánh giá nó Tiêu chuẩn (specification): văn bản chính
thức về các yêu cầu Nó đề cập đến các bản vẽ, các mẫu mã, các tài liệu phù hợp, phương cách tiến hành, tiêu chí cho phép dựa vào đó đối tượng có thể được thử nghiệm/đánh giá rằng có đạt tiêu chuẩn hay không Có nhiều dạng tiêu chuẩn: tiêu chuẩn kỹ thuật của hệ thống (system requirements specification), Tiêu chuẩn kỹ
thuật của phần mềm (SRS: software requirements specification)– gọi tắt là Tiêu chuẩn kỹ thuật