1. Trang chủ
  2. » Kỹ Thuật - Công Nghệ

Proceedings VCM 2012 16 phân cụm trừ mờ và giải thuật di truyền ứng dụng cho bài toán thiết

6 332 0

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 6
Dung lượng 294,86 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Tóm tắt Các hệ thống mờ có ứng dụng rộng rãi trong nhiều lĩnh vực, đặc biệt là trong lĩnh vực mô phỏng quá trình và điều khiển. Thông thường việc thiết kế các hệ thống mờ có thể được thiết kế từ tri thức chuyên gia hoặc từ dữ liệu. Tiếp cận mỗi một phương pháp thiết kế đều có những thuận lợi và hạn chế riêng của nó. Bài báo được trình bày theo hướng xây dựng hệ luật mờ cho điều khiển từ dữ liệu. Có nhiều cách tiếp cận khác nhau nhưng bài báo tập trung vào phân tích phương pháp phân cụm trừ dữ liệu để tạo ra các luật mờ kết hợp sử dụng giải thuật di truyền để tối ưu hóa các thông số của hệ luật. Từ khóa: phân cụm trừ mờ, giải thuật di truyền, hệ điều khiển mờ. Abstract Fuzzy system is applied in various fields, in which fuzzy control is widely focussed. Usually, fuzzy control designed from knowledge of experts in the certain application fields or from data. Each approach has some advantages and some limitations. This paper is described a method for substractive clustering of application data to create fuzzy rules and then, parameters of fuzzy rules are optimised by genetic algorithm

Trang 1

Phân cụm trừ mờ và giải thuật di truyền ứng dụng cho bài toán thiết

kế hệ điều khiển tự động từ dữ liệu

An Application of Fuzzy substructive clustering for designing automatic s ystem from data

Nguyễn Phương Huy, Trần Mạnh Tuấn, Lê Bá Dũng*

Đại học Thái Nguyên

*Viện Công Nghệ Thông tin e-Mail: nguyenphuonghuy1979@gmail.com; tranmanhtuan.dhtn.cntt@gmail.com

Tóm tắt

Các hệ thống mờ có ứng dụng rộng rãi trong nhiều lĩnh vực, đặc biệt là trong lĩnh vực mô phỏng quá trình

và điều khiển Thông thường việc thiết kế các hệ thống mờ có thể được thiết kế từ tri thức chuyên gia hoặc từ dữ liệu Tiếp cận mỗi một phương pháp thiết kế đều có những thuận lợi và hạn chế riêng của nó Bài báo được trình bày theo hướng xây dựng hệ luật mờ cho điều khiển từ dữ liệu Có nhiều cách tiếp cận khác nhau nhưng bài báo tập trung vào phân tích phương pháp phân cụm trừ dữ liệu để tạo ra các luật mờ kết hợp sử dụng giải thuật di truyền để tối ưu hóa các thông số của hệ luật

Từ khóa: phân cụm trừ mờ, giải thuật di truyền, hệ điều khiển mờ

Abstract

Fuzzy system is applied in various fields, in which fuzzy control is widely focussed Usually, fuzzy control designed from knowledge of experts in the certain application fields or from data Each approach has some advantages and some limitations This paper is described a method for substractive clustering of application data to create fuzzy rules and then, parameters of fuzzy rules are optimised by genetic algorithm

Ký hiệu

Ký hiệu Đơn vị Ý nghĩa

i

A1,A2i Các giá trị ngôn ngữ

i

j

tính đầu ra

x1, x2… Tập các điểm dữ liệu

a

r  1 5 Thông số chọn theo r a

Chữ viết tắt

1 Phần mở đầu

Sự phát triển nhanh chóng của các hệ thống điều khiển, các hệ thống thông tin như hiện nay, thì hệ

mờ được áp dụng thành công trong nhiều lĩnh vực như điều khiển tự động, phân lớp dữ liệu, phân tích việc ra quyết định, các hệ chuyên gia Hệ luật

mờ xây dựng từ tri thức nói chung hay hệ suy luận

mờ nói riêng được xây dựng theo suy diễn của con người, là một phần quan trọng trong ứng dụng logic mờ cũng như trong lý thuyết tập mờ vào thực

tế Trong nhiều ứng dụng cho thiết kế các hệ thống điều khiển thông minh cũng như trong xây dựng các hệ trợ giúp quyết định, hệ mờ được xây dựng theo phân lớp dữ liệu, phân cụm dữ liệu, xây dựng cây quyết định [2,3,4,5] Hệ điều khiển mờ được

Trang 2

Phân cụm dữ liệu đang là một vấn đề quan tâm

nghiên cứu của các tác giả trong và ngoài nước

[2,3,4,5] và có nhiều thuật toán phân cụm được đề

xuất Trong đó, không ít thuật toán phân cụm kết

hợp với việc sử dụng giải thuật di truyền trong quá

trình thực hiện Tuy nhiên các thuật toán được đưa

ra mới chỉ xét đến khía cạnh phân chia dữ liệu

thành các cụm với độ chính xác cao mà chưa để

tâm đến sự tối ưu các luật sử dụng, ví dụ giải thuật

GA K-means được sử dụng trong bài toán thị

trường mua sắm trực tuyến do Kyoung-jae Kim và

Hyunchul Ahn đưa ra là thuật toán sử dụng

K-means kết hợp với giải thuật di truyền và được

chứng tỏ có sự cải thiện đáng kể trong việc thực

hiện phân nhóm so với các thuật toán phân cụm

điển hình khác Hoặc phương pháp phân cụm bán

giám sát (Semi- Supervisor Clustering) dùng giải

thuật di truyền do Ayhan Demiriz; Kristin P

Bennett và Mark J Embrechts thuộc Rensselaer

Polytechnic Institute - Troy, NY 12180 đề xuất

năm 1999 là sự kết hợp các ưu điểm của các

phương pháp học có giám sát và học không giám

sát; giải thuật di truyền được sử dụng để tối ưu hóa

hàm mục tiêu cho thủ tục phân cụm Bằng các kết

quả thực nghiệm, phương pháp này chỉ ra lợi thế

trong trường hợp có ít mẫu huấn luyện

Trong các yêu cầu đặt ra cho quá trình phân cụm

thì yêu cầu về độ chính xác luôn được đặt lên hàng

đầu, ngoài ra với sự kết hợp các thuật toán phân

cụm và giải thuật di truyền còn thỏa mãn được tính

chất tối

ưu của các luật được sử dụng Vì vậy một cách

tiếp cận khác mà bài báo nêu ra đó là xây dựng hệ

luật mờ cho hệ điều khiển mờ từ dữ liệu sử dụng

giải thuật di truyền và là một vấn đề thực tế Trong

hệ điều khiển mờ có rất nhiều thông số, các thông

số của hàm thuộc, các điều kiện cũng như kết luận

của luật…cần phải tinh chỉnh và cần phải tối ưu

hóa Để thực hiện mục tiêu trên, bài báo trình bày

theo các phần:

i) Mở đầu, ii)Tiếp cận hệ thống: đưa ra cái nhìn

khái quát của bài toán trong quá trình xây dựng

luật từ tri thức Đề xuất một phương pháp tiếp cận

là phân cụm trừ mờ, sử dụng giải thuật di truyền

để tối ưu hóa các luật được hình thành sau quá

trình phân cụm iii) Kết quả thực nghiệm và iv)

Kết luận

Trong quá trình thực hiện, độ tin cậy của các luật

trong giải thuật di truyền được hiệu chỉnh cho phù

hợp thể hiện tính linh hoạt của thuật giải đưa ra

2 Tiếp cận hệ thống 2.1 Hệ điều khiển mờ

Giả sử chúng ta có tập dữ liệu với cỡ p đầu vào và

q đầu ra trong hệ điều khiển mờ có hệ luật mờ như sau Theo Sugeno ở luật thứ i trong hệ luật được viết theo: R i : If x 1 is A1i and x 2 is A2i and and x p

is A i p then y i is p 0

i

+p 1 i

x 1 + +p p

i

x p (1)

Trong đó:

x i là các biến vào

i j

A là giá trị ngữ nghĩa của biến đầu vào

y i là hàm tuyến tính

i j

p là các thông số của hàm tuyến tính đầu ra

Các biến đầu vào x 1 , x 2 .là các biến thể hiện các đại lượng vật lý của hệ thống, cũng có thể là thời gian xử lý và độ ưu tiên (hoặc trọng số) trong khi

biến đầu ra y k (với k = 1, 2, …, K) là đại lượng vật

lý của đầu ra, có thể là chỉ số khả năng lựa chọn

(hoặc chỉ số tuần tự) của luật k A1kA2k (với k =

1, 2, …, K) là các giá trị ngữ nghĩa của phần điều kiện của luật k nhận được bằng cách chiếu các

cụm vào các miền của các đại lượng vật lý đầu vào hoặc là thời gian xử lý và độ ưu tiên tương ứng và

k i

p (với i = 1, 2; k = 1, 2, …, K) là các hằng của

hàm tuyến tính đầu ra theo Sugeno

2.2 Phân cụm trừ

Phân cụm trừ (subtractive clustering) xác định các tâm cụm dựa trên mật độ các điểm lân cận Xét

một tập hợp dữ liệu gồm n điểm:

 1, 2, , n

Hàm tính mật độ cho một điểm dữ liệu là:

n j

x x r i

j i a e P

1

2

(3)

Trong đó:

P i : Mật độ các điểm bao quanh điểm dữ liệu thứ i

r a : là một hằng số dương hay còn gọi là bán kính

cụm

: Khoảng cách Euclid giữa điểm dữ liệu thứ i

với các điểm bao quanh

Trang 3

Khi mật độ của tất cả các điểm dữ liệu đã được

tính, lựa chọn điểm có mật độ lớn nhất làm tâm

cụm thứ nhất Gọi x1* là vị trí tâm cụm đầu tiên, có

mật độ là P1* thì *

1

1

a x

n i i

Tính lại mật độ cho các điểm dữ liệu theo công

thức:

2 1 2

4

*

1 ; 1, ,

i b

x x r

Và r b thường được chọn là rb  1 5 ra, tiếp tục

chọn điểm có mật độ lớn nhất làm tâm cụm thứ 2

Trong trường hợp tổng quát khi đã có k tâm cụm

thì mật độ của các điểm dữ liệu còn lại được tính

theo công thức:

2

* 2

4

*

; 1, ,

b

x x r

Sử dụng 2 điểm cận là cận dưới e*P re f và cận

trên e*P re f , với P ref là mật độ của tâm cụm thứ

k, trong đó ee lần lượt được gọi là hằng số

chấp nhận và hằng số từ chối, thường được chọn

lần lượt là 0.5 và 0.15 Một tâm cụm mới được

chọn nếu điểm đó có mật độ lớn hơn cận trên Nếu

điểm có mật độ lớn nhất nhỏ hơn cận dưới thì

thuật toán dừng Phân cụm trừ bao gồm các thông

số chủ yếu sau e ,e,h,ra Các thông số đó

thường được chọn như sau: 0.3≥ra≥0.15;

1.5≥h≥1.25

Biểu diễn thuật toán: Các bước của thuật toán như

sau

Bước 1: Khởi tạo ra , h với b

a

r r

h  ,e

e

Bước 2: Tính mật độ cho các điểm dữ liệu theo

công thức (3) Chọn điểm có mật độ lớn nhất làm

tâm cụm thứ nhất

i n

P

1

*

 và x1* là tâm cụm thứ nhất

Bước 3: Tính toán lại mật độ cho các điểm dữ liệu

còn lại theo công thức (4)

Bước 4: Gọi x * là điểm có mật độ lớn nhất là P *

- Nếu * re f

Pe P : x* là một tâm cụm mới và

- Ngược lại:

+ dmin  khoảng cách nhỏ nhất giữa x* và các tâm cụm trước đó

* min

P r

d

: x* là một tâm cụm mới

và tiếp tục bước 3

+ Ngược lại:

Thiết lập P(x*)  0

Chọn x* có mật độ P* lớn nhất và tiếp tục bước 4 Bước 5: Đưa ra các cụm kết quả Khi đó, độ thuộc của điểm x i đối với một tâm cụm thứ k được xác

định theo công thức (6):

2 2

4

i k a

r

 

2.3 Tối ưu các thông số cho luật điều khiển mờ

Các tham số tối ưu từ (1) được xác định bằng cách

sử dụng bộ dữ liệu (x 1t , x 2t , y t ) với t = 1, 2, …, m

dữ liệu ra có thể được viết:

k

k t k t K

k

k t

K k

k t k t

w

y w y

1 1

k k

w ( 1 1   t

k

x

A2 2 ) và

 

k

k t k

t k

Dưới dạng ma trận, đầu ra hệ thống là [2]:

     Y  X P (8)

Ma trận đầu vào X được xác định ở từng luật là:

m K m m m m K m m m K m m

K K

K

x x

x x

x x x x X

2 2

1 1 1

1 1

21 1 21 1 1 11 1 11 1 1 1 1 1

, , ,

, , ,

, ,

, , , , , , , ,

(9)

Với ma trận đầu ra được biết là:  T

m

y y

Y  1, ,

Khi đó ma trận P xác định theo bình phương cực

tiểu là:

Trang 4

Các thông số của (1) cũng có thể xác định tối ưu

theo phương pháp sử dụng giải thuật di truyền (H

3.)

3 Quá trình tực nghiệm

3.1 Áp dụng cho điều khiển con lắc ngược

Quá trình thực nghiệm được thực hiện trên tập dữ liệu đặc trưng của các bộ điều khiển được thu thập qua dữ liệu thu nhận được từ sai lệch điều khiển và tác động điều khiển H1

Phương trình con lắc ngược có dạng (11):

1 2 2 2 2 1

1 1 2 2 2 2 1 2

2

1

cos cos

sin cos

m M

L m mL I u m M

x mL x x n M

L m x x mgL

x

x

x

(11)

và được biểu diễn theo các thành phần sau: :

2 2 2

cos x m M

L m mL

I

f(x) = [mgLsin x1-x2

2

m2L2cos x1sin x1/M+m]/B

b = [mLcosx1/(M + m)]/B

Với L = 0.5 m, m = 50 g, M = 1 kg, xd = 0;

0

d

x ; g = 9.8 m/s

-0.2

0

0.1

0

0.2

0.6

H 1 Tập dữ liệu cho phân cụm

H 2 Các luật được hình thanh qua phân cụm

H 3 Sơ dồ thuật tóan cho tìm kiếm tối ưu thông

số

Khởi tạo ngẫu nhiên quần thể

Chấp nhận

Đạt

Chọn lọc

Lai tạo

Dột biến

Kết thúc

Bắt đầu

Yes

No

Trang 5

-0.1 -0.05 0 0.05

0 0.05 0.1

0.15

-0.5

0

0.5

in1 in2

0 0.2 0.4 0.6 0.8 1

in1

in1c luster1

Ham thuoc dau vao 1 c ho phan c um tru

0

0.2

0.4

0.6

0.8

1

in2

in2cluster3

Ham thuoc dau vao 2 c ho phan cum tru

H 4 a) Ma trận suy diễn và b) Các hàm thuộc đầu vào in1,

in2 theo cụm

b)

H 5 a) Tín hiệu ra tiệm cận với tín hiệu yêu cầu

b) Tác động điều khiển và sai lệch điều khiển

Trên các hình 1 là tập dữ liệu đầu vào, Các dữ liệu

đó đwojc phân cụm trừ mờ theo các luật ở hình 2a

Hàm thuộc của các luật và mặt suy diễn thể hiện

trên hình 4a,b Hình 5a là kết quả mô phỏng đáp

ứng ra bám tín hiệu yêu cầu điều khiển

3.2 Áp dụng cho điều khiển một hệ thống nhiệt

Phương trình hệ thống nhiệt có dạng như sau (12):

y(k+1)=ay(k)+b/(1+exp(0.5y(k)-r))u(k)+(1-a)y0

(12)

với a=exp(-pTs) ; b=(q/p)(1-exp(pTs))

Ts=25;r=40;y0=25;p=1.00151*10(-4);q=8.6797*10(-3)

a)

20

30

40

50

60

0

1

2

3

4

5

30 35 40 45 50 55 30

40

50

-200

0

200

in1 in2

30 40 50 0

0.2 0.4 0.6 0.8 1

in1

in1cluster1 in1cluster5 in1cluster6 in1cluster3 in1cluster4 in1cluster2 in1cluster7 in1cluster12 in1cluster10 in1cluster15 in1cluster14 in1cluster17 in1cluster8 in1cluster18 in1cluster19 in1cluster21 in1cluster20 Ham thuoc dau vao 1 cho phan cum tru

30 40 50

0

0.2

0.4

0.6

0.8

1

in2

in2cluster1 in2cluster5 in2cluster3in2cluster4 in2cluster2

in2cluster7 in2cluster12 in2cluster10 in2cluster15 in2cluster14 in2cluster17 in2cluster8 in2cluster18

in2cluster19 in2cluster21 in2cluster20

Ham thuoc dau vao 2 cho phan cum tru

0 10 20 30 40 50 60 70 80

H 7 a) Tín hiệu ra tiệm cận với tín hiệu yêu cầu

b) Tác động điều khiển

Trên các hình 6a là các dữ liệu đầu vào, 6b là các hàm thuộc được phân theo cụm Trên hình 7a (trên) là tín hiệu điều khiển bám quỹ đạo và 7b (dưới) là tín hiệu điều khiển

4 Kết luận

Bài báo trình bầy một phương pháp thiết kết hệ điều khiển theo phân cụm trừ mờ và giải thuật di truyền từ dữ liệu Các kết quả của thuật toán được

mô phỏng cho hai đối tượng điều khiển là con lắc ngược và lò nhiệt Các kết quả mô phỏng cho thấy thuật toán điều khiển đề xuất đáp ứng được các chỉ tiêu của quá trình điều khiển Việc thiết kế các hệ điều khiển từ dữ liệu là một trong những quan tâm rộng lớn trong thời gian gần đây và rất phù hợp với thực tế và đây cũang là một hướng nghiên cứu mới cần được quan tâm

Tài liệu tham khảo

[1] Trần Mạnh Tuấn, Lê Bá Dũng, Markov model

in proving the convergence of fuzzy genetic algorithm, accepted for presentation at the

2012 International Conference on Systems and Informatics (ICSAI2012) to be held from 19 to

20 May 2012, Yantai, China và Báo cáo tại Hội nghị CNTT và truyền thông, Cần thơ 10/2011 [2] S L Chiu, Fuzzy Model Identification Based

on Cluster Estimation,Journal on Intelligent Fuzzy Systems, vol 2, pp.267_278, 1994

[3] S L Chiu, Extracting Fuzzy Rules from Data for Function Approximation and Pattern Classification, Fuzzy Information Engineering:

a Guide Tour of Applications, pp.149_162 (Chapter 9) D.Dubois, H Prade, R.R Yager (Eds.), Wiley, New York, 1997

[4] Demirli, K., S X Cheng, and P Muthukumaran, Subtractive Clustering Based Modeling of Job Sequencing with Parametric

Trang 6

Algorithm, Information Technology Journal 7

(2): 356-360, ISSN 1812-5638, 2008

[6] Mohammad GhasemiGol, Hadi Saoghi Yazdi,

Reza Monsefi, A New Hierarchical Clustering

International Journal of coputer and electrical

engineering, Vol.2, No.1, February, 2010

[7] Agus Priyono, Muhammad Ridwad Jais Alias,

Riza AtiQ O.K.Rahmat, Azmi Hassan,

Mohd.Alauddin Mohd.Ali, Generation of fuzzy

rules with subtractive clusterring, Universiti

Teknologi Malaysia, Jurnal Teknologi, 43(D)

Dis.2005:143-153

[8] Siamak Tafazoli, Mathieu Leduc and Xuehong

Sun, Hysteresis Modeling using Fuzzy

Subtractive Clutering, International Journal of

Computational Cognition, Vol.4, No.3,

September 2006

S.K.Karunasinghe, Derivation of effective and effcient data set with subtractive clustering method and genetic algorithm, Journal of Hydroinfomatics, 07.4.2005

[10] Lothar M.Schmitt, Fundamental Study Theory

of genetic algorithms, Theoretical Computer Science 59 (2001) 1-61

[11] Gunter Rudolph, Convergence Analysis of

transaction on neural networks, vol.5, No.1, January 1994

[12] Mohanad Alata, Mohammad Molhim, and Abdullah Ramini, Optimizing of Fuzzy C-Means Clustering Algorithm Using GA, World Academy of Science, Engineering and Technology, pages 224-229, 39 2008,

Ngày đăng: 05/08/2015, 07:40

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w