Các hệ thống mờ có ứng dụng rộng rãi trong nhiều lĩnh vực, đặc biệt là trong lĩnh vực mô phỏng quá trình và điều khiển. Các hệ thống mờ có thể được thiết kế từ tri thức chuyên gia hoặc từ dữ liệu. Mỗi phương pháp thiết kế đều có những thuận lợi và hạn chế riêng của nó. Trong bài báo này chúng tôi trình bày quá trình xây dựng hệ luật mờ cho hệ mờ từ dữ liệu trong nhận dạng các hệ động lực học. Có nhiều cách tiếp cận khác nhau nhưng bài báo tập trung vào phân tích phương pháp phân cụm trừ để tạo ra các luật mờ.
Trang 1ỨNG DỤNG PHÂN CỤM TRỪ MỜ
CHO BÀI TOÁN NHẬN DẠNG HỆ ĐIỀU KHIỂN TỰ ĐỘNG TỪ DỮ LIỆU
Trần Mạnh Tuấn 1* , Lê Bá Dũng 2
1 Trường ĐH Công nghệ thông tin và Truyền thông - ĐHTN
2 Viện Công Nghệ Thông tin
TÓM TẮT
Các hệ thống mờ có ứng dụng rộng rãi trong nhiều lĩnh vực, đặc biệt là trong lĩnh vực mô phỏng quá trình và điều khiển Các hệ thống mờ có thể được thiết kế từ tri thức chuyên gia hoặc từ dữ liệu Mỗi phương pháp thiết kế đều có những thuận lợi và hạn chế riêng của nó Trong bài báo này chúng tôi trình bày quá trình xây dựng hệ luật mờ cho hệ mờ từ dữ liệu trong nhận dạng các hệ động lực học Có nhiều cách tiếp cận khác nhau nhưng bài báo tập trung vào phân tích phương pháp phân cụm trừ để tạo ra các luật mờ
Từ khóa: phân cụm trừ mờ, hệ nhận dạng, điều khiển mờ
PHẦN MỞ ĐẦU*
Sự phát triển nhanh chóng các hệ thống thông
tin như hiện nay, thì hệ mờ được áp dụng
thành công trong nhiều lĩnh vực như điều
khiển tự động, phân lớp dữ liệu, phân tích
việc ra quyết định, các hệ chuyên gia, các cơ
sở dữ liệu mờ Hệ luật mờ xây dựng từ tri
thức nói chung hay hệ suy luận mờ nói riêng
được xây dựng theo suy diễn của con người,
là một phần quan trọng trong ứng dụng logic
mờ cũng như trong lý thuyết tập mờ vào thực
tế Có nhiều tác giả đã sử dụng các phương
pháp dựa theo phân lớp dữ liệu, phân cụm dữ
liệu, xây dựng cây quyết định [2,3,4,5] vào
xây dựng hệ mờ của các hệ thống thông minh,
hệ hỗ trợ ra quyết định Hệ mờ được thực
hiện từ các luật mờ và các luật mờ này được
xây dựng từ tri thức của các chuyên gia trong
một lĩnh vực cụ thể
Phân cụm dữ liệu đang là một vấn đề quan
tâm nghiên cứu của các tác giả trong và ngoài
nước [2,3,4,5] và có nhiều thuật toán phân
cụm được đề xuất Trong đó, một số thuật
toán phân cụm được sử dụng kết hợp với giải
thuật di truyền trong quá trình thực hiện Một
cách tiếp cận khác mà bài báo nêu ra đó là xây
dựng hệ luật mờ từ dữ liệu cho nhận dạng hệ
điều khiển Bài báo trình bày theo các phần:
*
Tel: 0983 668841, Email: tmtuan@ictu.edu.vn
i) Mở đầu, ii)Tiếp cận hệ thống: đưa ra cái nhìn khái quát của bài toán trong quá trình xây dựng luật từ dữ liệu Đề xuất một phương pháp tiếp cận là phân cụm trừ mờ iii) Mô hình
mờ và Kết quả thực nghiệm iv) Kết luận TIẾP CẬN HỆ THỐNG
Hệ điều khiển mờ
Giả sử chúng ta có tập dữ liệu với cỡ p đầu vào và q đầu ra trong hệ điều khiển mờ có hệ
luật mờ có các luật như dưới đây Theo
Sugeno ở luật thứ i trong hệ luật được viết
theo[2]:
R i : If x 1 is A1i and x 2 is A2i and and x p is
i p
A then y i is p 0
i +p 1 i
x 1 + +p p
i
x p (1)
Trong đó:
x i là các biến vào i
j
A là giá trị ngữ nghĩa của biến đầu vào
y i là hàm tuyến tính
i j
p là các thông số của hàm tuyến tính đầu ra
Các biến đầu vào x 1 , x 2 là các biến thể hiện các đại lượng vật lý của hệ thống, cũng có thể
là thời gian xử lý và độ ưu tiên (hoặc trọng
số) trong khi biến đầu ra y k (với k = 1, 2, …,
K) là đại lượng vật lý của đầu ra, có thể là chỉ
số khả năng lựa chọn (hoặc chỉ số tuần tự)
của luật k k
A1 và A2k (với k = 1, 2, …, K) là
các giá trị ngữ nghĩa của phần điều kiện của
luật k nhận được bằng cách chiếu các cụm
vào các miền của các đại lượng vật lý đầu vào
Trang 2hoặc là thời gian xử lý và độ ưu tiên tương
ứng và k
i
p (với i = 1, 2; k = 1, 2, …, K) là
các hằng của hàm tuyến tính đầu ra theo
Sugeno
Phân cụm trừ
Phân cụm trừ (subtractive clustering - SC)
xác định các tâm cụm dựa trên mật độ các
điểm lân cận Xét một tập hợp dữ liệu gồm n
điểm [3]:
1, 2, , n
Hàm tính mật độ cho một điểm dữ liệu là:
n
j
x x r
i
j i a
e
P
1
2
(3) Trong đó:
P i : Mật độ các điểm bao quanh điểm dữ liệu
thứ i
r a : là một hằng số dương hay còn gọi là bán
kính cụm
Chuẩn . : Khoảng cách Euclide giữa điểm
dữ liệu thứ i với các điểm bao quanh
Khi mật độ của tất cả các điểm dữ liệu đã
được tính, lựa chọn điểm có mật độ lớn nhất
làm tâm cụm thứ nhất Gọi *
1
x là vị trí tâm cụm đầu tiên, có mật độ là *
P thì *
P được xác định theo
*
1
1
ax
n
i i
Tính lại mật độ cho các điểm dữ liệu theo
1 2 4
*
i b
x x r
Và r b thường được chọn là rb 1 5 ra, tiếp
tục chọn điểm có mật độ lớn nhất làm tâm
cụm thứ 2
Trong trường hợp tổng quát khi đã có k tâm
cụm thì mật độ của các điểm dữ liệu còn lại
được tính theo công thức:
2
* 2 4
*
; 1, ,
i k b
r
Sử dụng 2 điểm cận là cận dưới ef
*P r
*P r
, với P ref
là mật độ của tâm
cụm thứ k, trong đó và lần lượt được gọi là hằng số chấp nhận và hằng số từ chối, thường được chọn lần lượt là 0.5 và 0.15 Một tâm cụm mới được chọn nếu điểm đó có mật độ lớn hơn cận trên Nếu điểm có mật độ lớn nhất nhỏ hơn cận dưới thì thuật toán dừng Phân cụm trừ bao gồm các thông số chủ yếu sau ,, ,ra Các thông số đó thường được chọn như sau: 0.3≥ra≥0.15; 1.5≥ ≥1.25
Biểu diễn thuật toán: Các bước của thuật toán
như sau
Bước 1: Khởi tạo ra , với b
a
r r
,
và
Bước 2: Tính mật độ cho các điểm dữ liệu
theo công thức (3) Chọn điểm có mật độ lớn nhất làm tâm cụm thứ nhất
i n
P
1
*
1 max và
* 1
x là tâm cụm thứ nhất
Bước 3: Tính toán lại mật độ cho các điểm dữ
liệu còn lại theo công thức (4)
Bước 4: Gọi x * là điểm có mật độ lớn nhất là
P *
- Nếu P* P ref : x* là một tâm cụm mới và tiếp tục bước 3
- Ngược lại nếu * ref
: chuyển sang bước 5
- Ngược lại:
+ dmin khoảng cách nhỏ nhất giữa x* và các tâm cụm trước đó
* min
ref
P r
d
: x* là một tâm cụm mới và tiếp tục bước 3
+ Ngược lại: Thiết lập P(x*) 0
Chọn x* có mật độ P* lớn nhất và tiếp tục
bước 4
Bước 5: Đưa ra các cụm kết quả Khi đó, độ
thuộc của điểm x i đối với một tâm cụm thứ k
được xác định theo công thức (6):
Trang 32 2
4
a
x x r
Nhận dạng hệ thống mờ
Giả sử các tâm cụm c của các cụm được thể
hiện M *
= {m 1
* , m 2
* , m c
*
} trong không
gian L chiều, với N chiều đầu vào, ta sẽ có
L-N chiều đầu (hình 1a) Từ đó tâm cụm M * sẽ
được chia ra theo (hình 1b)
a) Các hàm thuộc hình thành qua phân cụm
b) Các tâm điểm của các giá trị ngữ nghĩa
Hình 1 Dạng hàm thuộc cho phân cụm
Định lý: Giả sử hệ thống suy diễn mờ f(x) với
số lượng bất kỳ các giá trị ngữ nghĩa, có thể là
dạng tam giác, dạng chuông…có tâm điểm m j
trên a i , b i i=1…N và trên khoảng đó ít nhất
một và nhiều nhất là hai các giá trị ngữ nghĩa
khác không Cũng giả sử là g(x): R NR là
hàm chưa biết bất kỳ, và nếu g(x) là hàm liên
tục và khả vi trên U =[a 1 , b 1 ]x[a 2 ,
b 2 ]x….x[a N , b N] thì hệ mờ f(x) có thể xấp xỉ
hàm g(x) với độ chính xác bất kỳ ε với ε> 0 ,
ε được gọi là sai số chấp nhận được
||g(x)-f)x)|| ∞ ≤ ε
Khi đó ||.||∞ được định nghĩa ||e(x)||∞=supx U
|e(x)|
QUÁ TRÌNH THỰC NGHIỆM
Mô hình nhận dạng hệ phi tuyến
Giả sử mô hình động học của hệ điều khiển
có dạng mô tả toán học như sau:
)) ( ( ) 1 ( 6 0 ) ( 3
0
)
1
(k y k y k f u k
(7)
Với y(k) và u(k) là các tín hiệu ra và vào của
hệ thống tại thời điểm thứ k
Hàm f(.) không được biết trước có dạng:
) 5 ( 1 0 ) 3 ( 3 0 ) ( 6 0 )
Để có thể nhận dạng được hệ động lực học trên, ta sử dụng một hệ mô hình mẫu dạng:
)) ( ( ) 1 ( 6 0 ) ( 3 0 ) 1
y
(9) trong đó y (k 1), y (k), y (k 1)là các giá
trị ước lượng ở thời điển thứ k-1, k, k+1
F(u(k)) là hàm ước lượng qua quá trình phân cụm trừ mờ cho các dữ liệu vào ra hình 2, hệ luật mờ được hình thành với các luật như trên
H3, tín hiệu điều khiển u(k) với
) 250 / 2 ( ) (k Sin k
từ thời k=1 đến thời điển k=250 sau đó thay đổi đến k=500:
) 25 / 2 ( 5 0 ) 250 / 2 ( 5 0 )
u
Hình 2 Dữ liệu vào ra của hệ thống
Hệ luật mờ cho nhận dạng hệ điều khiển trên Hình 3
Hình 3 Hệ luật qua phân cụm
Hình 4 Kết quả mô phỏng
0 50 100 150 200 250 300 350 400 450 500 -10
-5 0 5 10
0 50 100 150 200 250 300 350 400 450 500 -10
-5 0 5 10
0 50 100 150 200 250 300 350 400 450 500 -10
-5 0 5 10 TIN HIEU THUC xanh, TIN HIEU MO HINH do
0 50 100 150 200 250 300 350 400 450 500 -1
-0.5 0 0.5 1
Sai so mo hinh
Trang 4Kết quả mô phỏng cho thấy sự hội tụ giữa hai
mô hình toán học và mô hình nhận dạng hệ
thống qua phân cụm Kết quả mô phỏng trên
cũng cho thấy sự hội tụ nhanh của mô hình
nhận dạng, một điều quan trọng thể hiện tính
xấp xỉ của các mô hình tính toán mềm có độ
chính xác tùy ý với các mô hình thực
KẾT LUẬN
Bài báo trình bày một thuật toán nhận dạng hệ
điều khiển theo phân cụm trừ mờ từ dữ liệu
Các kết quả của thuật toán được mô phỏng
cho hệ Các kết quả mô phỏng cho thấy thuật
toán nhận dạng hay hệ luật đề xuất đáp ứng
được các chỉ tiêu của quá trình nhận dạng hệ
thống Việc thiết kế các hệ điều khiển nói
chung hay các hệ thống mờ nói riêng từ dữ
liệu là một trong những quan tâm rộng lớn
trong thời gian gần đây và rất phù hợp với
thực tế và đây cũng là một hướng nghiên cứu
mới cần được quan tâm
Ký hiệu
Ký hiệu Ý nghĩa
i
A1, A2i Các giá trị ngôn ngữ
Y hàm tuyến tính đầu ra
i
j
p Các thông số hàm tuyến
tính đầu ra
x 1, x 2… Tập các điểm dữ liệu
a
r 1 5 Thông số chọn theo r a
* giá trị đặt, giá trị cần
TÀI LIỆU THAM KHẢO
1 Trần Mạnh Tuấn, Lê Bá Dũng, (2013) Markov
model in proving the convergence of fuzzy genetic
algorithm, tạp chí Khoa học và Công nghệ - Viện
Hàn lâm Khoa học và Công nghệ Việt Nam, tập 51,
số 3, , trang 267-277
2 S L Chiu, (1994), Fuzzy Model Identification Based on Cluster Estimation, Journal on Intelligent Fuzzy Systems, vol 2, pp.267_278
3 S L Chiu, (1997) Extracting Fuzzy Rules from Data for Function Approximation and Pattern Classification, Fuzzy Information Engineering: a Guide Tour of Applications, pp.149_162 (Chapter 9) D.Dubois, H Prade, R.R Yager (Eds.), Wiley, New York
4 Demirli, K., S X Cheng, and P Muthukumaran, (2003) Subtractive Clustering Based Modeling of Job Sequencing with Parametric Algorithm, Information Technology Journal 7 JunYing Chen, Zheng Qin and Ji Jia,A Weighted Mean Subtractive Clustering (2): 356-360, ISSN 1812-5638, 2008.Search, Fuzzy Sets
and Systems 137: 235-270
5 Mohammad GhasemiGol, Hadi Saoghi Yazdi, Reza Monsefi, (2010) A New Hierarchical Clustering Algorithm on Fuzzy Data (FHCA), International Journal of coputer and electrical engineering, Vol.2, No.1, February
6 Agus Priyono, Muhammad Ridwad Jais Alias, Riza AtiQ O.K.Rahmat, Azmi Hassan, Mohd.Alauddin Mohd.Ali, Generation of fuzzy rules with subtractive clusterring, Universiti Teknologi Malaysia, Jurnal Teknologi, 43(D) Dis.2005:143-153
7 Siamak Tafazoli, Mathieu Leduc and Xuehong Sun, (September 2006) Hysteresis Modeling using Fuzzy Subtractive Clutering, International Journal of Computational Cognition, Vol.4, No.3
8 C.D.Doan, S.Y.Liong and Dulakshi S.K.Karunasinghe, (07.4.2005) Derivation of effective and effcient data set with subtractive clustering method and genetic algorithm, Journal of Hydroinfomatics
9 Lothar M.Schmitt, (2001), Fundamental Study Theory of genetic algorithms, Theoretical Computer Science 59 1-61
10 Gunter Rudolph, (January 1994) Convergence Analysis of Canonical Genetic Algorithms, IEEE transaction on neural networks, vol.5, No.1
11 Mohanad Alata, Mohammad Molhim, and Abdullah Ramini, (2008), Optimizing of Fuzzy C-Means Clustering Algorithm Using GA, World Academy of Science, Engineering and Technology, pages 224-229, 39
Trang 5SUMMARY
AN APPLICATION OF FUZZY SUBSTRACTIVE CLUSTERING
FOR IDENTIFICATION CONTROLLED SYSTEMS FROM DATA
Tran Manh Tuan 1* , Le Ba Dung 2
1
College of Information and Communication Technology – TNU,
2
Institute of Information Technology
Fuzzy system is applied in various fields, in which fuzzy control fuzzy identification is widely focussed Usually, fuzzy system designed from knowledge of experts in the certain application fields or from data Each approach has some advantages and some limitations In this paper, we describe substractive clustering method to create fuzzy rules
Keywords: Fuzzy substractive clustering, identification system, fuzzy control
Ngày nhận bài:25/01/2014; Ngày phản biện:10/02/2014; Ngày duyệt đăng: 26/02/2014
Phản biện khoa học: TS Vũ Đức Thái – Trường ĐH Công nghệ Thông tin & Truyền thông - ĐHTN
*
Tel: 0983 668841, Email: tmtuan@ictu.edu.vn