Nghiên cứu tiến hành ứng dụng hai kỹ thuật: Mạng thần kinh mờ (NeuroFuzzy - NF) và tọa độ song song (Parallel Coordinate) trong mô hình hóa và khảo sát quy trình chiết xuất cao diệp hạ châu. Trong đó kỹ thuật mạng thần kinh mờ hỗ trợ mô hình hóa dữ liệu, trong khi kỹ thuật tọa độ song song cho phép khảo sát mối liên quan nhân quả một cách trực quan.
Trang 1ỨNG DỤNG MẠNG THẦN KINH MỜ VÀ KỸ THUẬT
TỌA ĐỘ SONG SONG KHẢO SÁT MỐI LIÊN QUAN NHÂN QUẢ TRONG QUY TRÌNH CHIẾT XUẤT CAO DIÊP HẠ CHÂU
Chung Khang Kiệt*, Đỗ Quang Dương*
TÓM TẮT
Mục tiêu: Ứng dụng hai kỹ thuật: mạng thần kinh mờ (NeuroFuzzy - NF) và tọa độ song song
(Parallel Coordinate) trong mô hình hóa và khảo sát quy trình chiết xuất cao diệp hạ châu Trong đó kỹ thuật mạng thần kinh mờ hỗ trợ mô hình hóa dữ liệu, trong khi kỹ thuật tọa độ song song cho phép khảo sát mối liên quan nhân quả một cách trực quan.
Phương pháp: Ứng dụng công cụ máy tính kết hợp giữa 2 kỹ thuật mạng thần kinh mờ và tọa độ
song song khảo sát mối liên quan nhân quả của quy trình chiết xuất cao diệp hạ châu trong công trình
đã được công bố trước đây Kỹ thuật mạng thần kinh mờ được áp dụng cho mô hình hóa dữ liệu, kỹ thuật tọa độ song song hỗ trợ trực quan hóa mối liên quan nhân quả
Kết quả: Từ kết quả nghiên cứu cho thấy việc ứng dụng mạng thần kinh mờ và tọa độ song song
tìm quy luật nhân quả trong quy trình chiết xuất cao diệp hạ châu đạt độ chính xác hơn so với việc thực hiện bằng phương pháp khác như luật kết hợp hay thống kê Mặc khác kỹ thuật tọa độ song song cho phép khảo sát mối liên quan nhân quả một cách trực quan
Kết luận: Kết quả nghiên cứu cho thấy việc ứng dụng mạng thần kinh mờ và tọa độ song song tìm
quy luật nhân quả trong quy trình chiết xuất cao diệp hạ châu đạt được kết quả có độ chính xác cao hơn, nhanh chóng hơn so với việc thực hiện bằng phương pháp thống kê truyền thống Ngoài ra, việc thể hiện trực quan mô hình nhân quả bằng đồ thị kết hợp song song cung cấp cho người dùng sự khảo sát cụ thể hơn so với tập luật “Nếu … thì …” và biểu đồ 3 chiều
Từ khóa: mạng thần kinh mờ, kỹ thuật tọa độ song song, quy trình chiết xuất, cao diệp hạ châu
ABSTRACT
APPLICATION OF NEURO-FUZZY SYSTEM COMBINED TO VISUALIZATION TECHNIQUE FOR EXAMNING CAUSE-EFFECT RELATIONSHIPS FROM HERBAL EXTRACTION PROCESS
Chung Khang Kiet, Do Quang Duong
* Y Hoc TP Ho Chi Minh * Vol 15 - Supplement of No 1 - 2011: 1 - 5
Objectives: In this study, the performance of combined computational methods: neuro-fuzzy and parallel
coordinates was examined in generating predictive cause-effect relationships for a published data of herbal extraction process of Phyllanthus amarus Schum & Thonn
Material and Methods: This study was a systematic combination of two methods: neuro-fuzzy and parallel
coordinates in order to examine the cause-effect relationships of herbal extraction process of Phyllanthus amarus Schum & Thonn
Results: The approach was successful in extracting invaluable knowledge from this data, whilst neural
networks demonstrated a high capability in modelling unseen data, parallel coordinates supported a visualising
* Đại học Y Dược Thành phố Hồ Chí Minh
Trang 2observation to analyse multivariate data The generated results of studied data illustrated that the performance of the employed methods was superior when compared to common methods using associate rules or 3D graphs Moreover, with the visualised cause-effect relationships predicted from parallel coordinates for a published data of herbal extraction process of Phyllanthus amarus Schum & Thonn, it was obviously that this study could be an invaluable computational approach for examining cause-effect relationships from pharmaceutical data
Conclusion: Study presented in this paper evaluated the performance of neuro-fuzzy combined to parallel
coordinates for extracting cause-effect knowledge from herbal extraction process Predictive results showed that both methods were successful in modelling quality models of extraction properties as well as visualising the cause-effect relationships between conditions and properties of extraction This study also will help the pharmacist easily in choosing the techniques and tools to extract knowledge from herbal extraction process
Keywords: neurofuzzy, parallel coordinates, herbal extraction process, Phyllanthus amarus Schum &
Thonn
ĐẶT VẤN ĐỀ
Chiết xuất dược liệu là một kỹ thuật dùng
dung môi để chiết tách một hoặc nhiều hoạt
chất có tác động sinh học (alkaloid, flavonoid,
anthraquinon…) từ pha rắn là các bộ phận của
dược liệu có thể là thân, rễ, quả, hoa, lá… bởi
pha lỏng là dung môi nước, cồn… Có rất nhiều
yếu tố ảnh hưởng đến quá trình chiết xuất
dược liệu: nguyên liệu, chất tan, dung môi, kỹ
thuật chiết …(2,3)
Mối liên quan giữa điều kiện chiết xuất với
tính chất của sản phẩm được gọi là mối liên quan
giữa nhân và quả Trong đó, nhân là điều kiện
sản xuất hay biến độc lập x (thông số) và quả là
tính chất sản phẩm hoặc biến phụ thuộc y Theo
con đường dò dẫm, nhà chiết xuất khó biết biến
số nào ảnh hưởng tính chất sản phẩm và quy luật
nào chi phối nên có thể khảo sát cái không cần
mà bỏ sót cái cần nghiên cứu(2)
Mạng thần kinh mờ (Neuro-Fuzzy System):
Neuro-fuzzy systems (NFS) là một hệ suy diễn
mờ được tăng cường thêm khả năng học của
mạng thần kinh Trong hệ thống này, mạng thần
kinh được đưa vào làm tăng khả năng tự điều
chỉnh các biến nhờ các luật mờ Với sự kết hợp
này, khả năng mô hình hóa dữ liệu của hệ thống
sẽ tốt hơn so với mạng thần kinh thông thường
và tốc độ học cũng nhanh hơn Các dạng NFS đã
được giới thiệu: GARIC, FALCON, ANFIS,
NEFCON, FUN, SONFIN, FINEST, EFuNN,
dmEFuNN(5,6)
Hình 1 Đồ thị song song biểu diễn mối quan hệ giữa
X và Y
Tọa độ song song (Parallel coordinates): Khái niệm tọa độ song song (Parallel Coordinates) được đưa ra đầu tiên bởi Maurice d'Ocagne, năm 1885, sau đó được giới thiệu rộng rãi bởi Alfred Inselberg, năm 1959 và được sử dụng như một công cụ trực quan hóa (visualization)(1) Thực chất đồ thị kết hợp song song chỉ là đồ thị ở dạng thanh, trong đó có những trục Y với các miền giá trị khác nhau liên kết với trục X, tại một thời điểm giá trị trên các trục X được nối lại với nhau để biểu diễn mối quan hệ giữa X và giá trị trên trục Y (Hình 1) Bài báo là kết quả nghiên cứu giới thiệu ứng dụng kỹ thuật mạng thần kinh mờ và kỹ thuật tọa độ song song trong việc khảo sát trực quan mối liên quan nhân-quả giữa các thành phần
trong quy trình chiết xuất cao khô diệp hạ châu
(Phyllanthus amarus Schum & Thonn.) – dược liệu đang được nghiên cứu và sử dụng rộng rãi
Trang 3với tác dụng trị viêm gan và bảo vệ tế bào gan
hiệu quả Trong những nghiên cứu trước đó của
nhóm tác giả cho thấy kỹ thuật mạng thần kinh
mờ và tọa độ song song khá hiệu quả trong việc
mô hình hóa dữ liệu dạng công thức(4) Nghiên
cứu này hy vọng sẽ giúp cho nhà chiết xuất có
một cách nhìn tổng quát hơn trong việc lựa chọn
phương pháp khảo sát mối liên quan giữa điều
kiện chiết xuất với tính chất của sản phẩm
PHƯƠNG PHÁP
Công cụ máy tính
Công cụ sử dụng trong bài báo này là những
nghiên cứu và ứng dụng kết hợp hai kỹ thuật
mạng thần kinh mờ ANFIS và kỹ thuật toạ độ
song song của tác giả tại khoa Dược – Đại học Y
Dược Hồ Chí Minh cho việc xây dựng mô hình
dữ liệu và khảo sát mối liên quan nhân quả
Trong đó kỹ thuật mạng thần kinh mờ được
dùng mô hình hóa dữ liệu, trong khi kỹ thuật
tọa độ song song sẽ trực quan hóa mối liên quan
nhân quả trong dữ liệu
Để đánh giá chất lượng của một mô hình
hóa, hệ số R2 (công thức 1) được sử dụng Giá trị
của R2 càng cao, mô hình dữ liệu càng tương thích
100 x ) y y (
) yˆ y ( 1
1 i
2 i
n
1 i
2 i i 2
⎟
⎟
⎟
⎟
⎠
⎞
⎜
⎜
⎜
⎜
⎝
⎛
−
−
−
=
∑
∑
=
=
(1) với yi: biến phụ thuộc với từng dữ liệu; y: giá trị trung bình của biến phụ thuộc; yˆ: giá trị
dự đoán từ mô hình; n: số lượng dữ liệu
Dữ liệu thực nghiệm
Quy trình chiết xuất cao khô diệp hạ châu sử dụng trong bài báo được tham khảo từ nghiên cứu của Nguyễn Đức Hạnh và các đồng sự(3) Dữ liệu khảo sát bao gồm 14 thí nghiệm: 3 biến độc lập: x1: độ cồn, x2: tỷ lệ dược liệu: dung môi, x3:
số lần chiết; 3 biến phụ thuộc: y1: hàm lượng curcumin I (trong cao Nghệ) hay hàm lượng phyllanthin (trong cao Diệp hạ châu đắng) (%),
y2: hiệu suất chiết cao từ dược liệu (%) (xem Bảng 1)
Bảng 1 Dữ liệu thực nghiệm quy trình chiết xuất cao Diệp hạ châu đắng
KẾT QUẢ VÀ BÀN LUẬN
Kết quả mô hình dự đoán cho 3 biến độc lập
từ dữ liệu quy trình chiết xuất cao Diệp hạ châu
đắng được trình bày trong Bảng 2 Trong Bảng 2
có sự so sánh khả năng dự đoán của mô hình
mạng thần kinh mờ trong nghiên cứu này (A) và kết quả mô hình từ nghiên cứu của Nguyễn Đức Hạnh và các đồng sự (B)(3)
Bảng 2 So sánh R 2 luyện giữa mạng thần kinh mờ (A) và nghiên cứu trước đó (B)
Trang 4R 2 luyện (A) R 2 luyện (B)
Từ Bảng 2 cho thấy mạng thần kinh mờ trong
nghiên cứu này đưa ra mô hình dự đoán tương
đối tốt, mạng thần kinh mờ cho kết quả khá cao
(trên 99,83%) so với nghiên cứu trước đó
Đối với nghiên cứu trước đó, các tác giả đã
rút ra được một số luật khảo sát mối liên quan
giữa điều kiện chiết và tính chất của cao chiết
như sau(3):
- Hàm lượng phyllanthin chỉ bị ảnh hưởng
đáng kể bởi độ cồn Hiệu suất chiết bị ảnh
hưởng bởi 3 yếu tố khảo sát: độ cồn, tỷ lệ dược
liệu: dung môi và số lần chiết Độ ẩm của cao
chỉ bị ảnh hưởng bởi độ cồn nhưng không
đáng kể
- Đối với hàm lượng phyllanthin: Nếu x1
thấp thì y1 sẽ thấp; nếu x1 cao thì y1 sẽ cao (R1)
- Đối với hiệu suất chiết: các quy luật phức
tạp hơn Thí dụ: nếu x1 thấp thì y2 sẽ thấp; nếu x1
trung bình thì y2 sẽ cao Nếu x2 là 1:15 thì y2 sẽ
cao; nếu x2 là 1:9 hay 1:12 thì y2 sẽ thấp Nếu x3
thấp thì y2 sẽ thấp; nếu x3 cao thì y2 sẽ cao (R2)
Hình 2 Ảnh hưởng của độ cồn, số lần chiết trên
HSC cao Diệp hạ châu đắng (3)
Rõ ràng với các luật được rút ra ở trên, nhà
chiết xuất chỉ có thể dễ dàng hiểu được luật nếu
luật đơn giản (R1), nếu luật phức tạp sẽ rất khó
khăn hơn rất nhiều để có thể phân tích được mối liên quan nhân-quả (R2)
Trong nghiên cứu của các tác giả trước đó, ngoài việc dùng luật dạng “Nếu … thì …” các tác giả còn sử dụng biểu đồ 3 chiều để khảo sát mối liên quan nhân quả (Hình 2), tuy nhiên với dạng biểu đồ này chỉ khảo sát được 2 biến độc lập và 1 biến phụ thuộc Việc khảo sát này sẽ gây hạn chế vì với dữ liệu thực nghiệm 3 yếu tố khảo sát dù ít hay nhiều đều có ảnh hưởng lên tính chất cao chiết
Trong nghiên cứu này, kết quả khảo sát mối liên quan nhân-quả với kỹ thuật tọa độ song song được minh họa trong Hình 3 cho thấy rõ sự liên quan giữa tất cả các điều kiện chiết xuất được khảo sát và tính chất của cao chiết Với công cụ sử dụng mạng thần kinh mờ và kỹ thuật tọa độ song song, người sử dụng có thể thay đổi giá trị của biến x để theo dõi sự thay đổi của y một cách trực quan, từ đó có một cái nhìn tổng quát về mối liên quan nhân-quả giữa các biến x
và y Bên cạnh đó phương pháp này còn khắc phục yếu điểm của dạng luật “Nếu … thì …” là với giá trị x cụ thể công cụ sẽ dự đoán giá trị y
cụ thể mà không đưa ra dạng dự đoán không thật sự rõ ràng (cao, trung bình hoặc thấp), ví dụ nếu so sánh với tập luật R1 của nghiên cứu trước
đó mối liên quan giữa x1 và y1 thì Hình 3a cho thấy: y1 không thực sự đạt giá trị tối đa với x1 tối
đa, y1 chỉ đạt tối đa với x1 và x2 cùng tối đa như Hình 3c hay x1 và x3 cùng tối đa và x2 có giá trị 1:12 như Hình 3b Tương tự cho Hình 3d, giá trị
y2 liên quan các giá trị x được minh họa một cách rất cụ thể
Bên cạnh đó với việc sử dụng kỹ thuật song song, người sử dụng có thể thao tác trực tiếp trên đồ thị song song bằng cách di chuyển các nút giá trị x ( ) để theo dõi sự thay đổi của giá trị y ( ) một cách trực quan
Trang 5a b
Hình 3 Kết quả khảo sát mối liên quan nhân quả dùng kỹ thuật song song
KẾT LUẬN
Kết quả nghiên cứu cho thấy việc ứng dụng
mạng thần kinh mờ và tọa độ song song tìm quy
luật nhân-quả trong quy trình chiết xuất cao
diệp hạ châu đạt được kết quả có độ chính xác
cao hơn, nhanh chóng hơn so với việc thực hiện
bằng phương pháp thống kê truyền thống
Ngoài ra, việc thể hiện trực quan mô hình
nhân-quả bằng kỹ thuật tọa độ song song cung cấp
cho người dùng sự khảo sát mối liên quan một
cách tổng quát hơn so với dạng luật “Nếu … thì
…” hay biểu đồ 3 chiều
TÀI LIỆU THAM KHẢO
1 Alfred Inselberg (2009), Parallel Coordinates, Tel Aviv
University, Israel, Springer
2 Dang Van Giap Extraction process development assisted by intelligent software systems Proceedings of the Sixth Indochina Conference on Pharmaceutical Sciences in Hue
2009, 1-6
3 Nguyễn Đức Hạnh, Nguyễn Minh Đức và Đặng Văn Giáp Xây dựng quy trình chiết xuất cao khô diệp hạ châu Tạp chí Y học Tp Hồ Chí Minh 2009;13, 263-267
4 Nguyễn Đăng Khoa, Đỗ Quang Dương Ứng dụng các kỹ thuật Neuro-fuzzy và Visualization khảo sát quy luật nhân quả trong công thức dược phẩm Tạp chí Phát triển Khoa học - Công nghệ, ĐH Quốc Gia TP.HCM 2010; 1(13), 35-42
5 Lin, C.T and Lee, C.S.G, Neural Fuzzy Systems, A Neuro-Fuzzy Synergism to Intelligent Systems, Prentice Hall International, 1996
6 P.P Bonissone, Adaptive Neural Fuzzy Inference Systems (ANFIS): Analysis and Applications, GE CRD, Schenectady,
NY USA, 1997