ngày nay hệ thống thông minh đã trở thành thông dụng trong việc giải quyết các bài toán thực tế phức tạp và nó cũng đảm bảo đáp ứng đầy đủ các yêu cầu thực tiễn của bài toán
Trang 1Chuong 3 KET HOP BA KY THUAT: THUAT GIAI DI TRUYEN, MANG NORON
vA LOGIC MO
Chương 1 tổng kết các kỹ thuật kết hợp giữa Thuật giải di truyền, mạng Nơron
va Logic mo đã có của các nhà nghiên cứu trong và ngoài nước Chương 2 đã để
xuất một số mô hình kết hợp cặp đôi riêng: mô hình Di :ruyễn- Mờ, mô hình Nơron-
Mo va mé hinh Di truyén- Noron và chi ra tính khả thi của nó trong lớp bài toán phân loại mẫu không mất mát thông tin: chứng thực mẫu, phân lớp mẫu(mẫu là 1 véc tơ) và phân lớp mẫu (mẫu gồm M véc ta)
Tuy nhiên, trong thực tế xuất hiện nhiều bài toán khá phức tạp, muốn giải quyết hiệu quả chúng, đôi khi phải thiết kế những mô hình liên kết cả ba phương pháp: Thuật giải di truyền, mạng Nơron và Logic mờ Ba thành phần cơ bản của kỹ thuật tính toán mềm này sẽ hỗ trợ bổ xung cho nhau trong quá trình giải quyết một ứng dụng cụ thể Mô hình kết hợp cả ba thành phần: D¡ ¿ruyên- Nơron- Mờ được
xây dựng với mục tiêu giải quyết hiệu quả một số bài toán tổng quát phức tạp trong
thực tế
Trong phạm vi chương này, luận án để xuất việc ứng dụng kỹ thuật két hợp Di truyền- Nơron- Mờ để giải quyết các vấn dé sau (xem chỉ tiết trong mục 3.1):
- _ Mạng Kohonen ấn định Trị số thích nghỉ mờ cho Thuật giải di truyền
-_ Mô hình kết hợp Di truyền- Nơron- Mờ và chuẩn bị dữ liệu cho mạng Nơron
- _ Kết hợp nhiều mạng Nơron mờ bằng Thuật giải di truyền: cho phân lớp mẫu
Trang 2Tiến tới, để xuất mô hình kết hợp ba kỹ thuật: Di truyễn - Nơron - Mờ để giải uyết bài toán tổng quát: phân loại mẫu mất mát thông tin về không gian mẫu cho trước Q,;¡ e {I,2, n}(xem chỉ tiết mục (3.2))
31 Một số kỹ thuật kết hợp Di truyền- Nơron- Mờ
3.1.1 Mạng Kohonen ấn định trị số thích nghỉ mờ cho Thuật giải di truyền
Các khái niệm cơ bản
Định nghĩa 3.1 (véc tơ đặc trưng)
Mẫu Ƒ được định nghĩa là một véc to đặc trưng có L phần tử:
F=(fi, fis fd Trong 46, f; € {0, Max}; gid tri Max tay thuộc vào bài todn cu thé; i=1 L Dinh nghia 3.2 (mdu trung binh)
Véc tơ đặc trưng biểu diễn mẫu trưng bình O được định nghĩa:
O=(O;, O2, , Or)
Lúc đó PÍ được gọi là mẫu đại diện của không gian ©,
Định nghĩa 3.4 (Khoảng cách ràng buộc)
Cho trước 2 mẫu A, 8 Khoảng cách ràng buộc giữa A và 8 được định nghĩa
ị
_ như sau:
Trang 3a(A,B)= ZAOB= COS A0x BO d(A,O) x d(B,O) ——~ (3.3)
Xét bai todn sau
Cho trước mẫu đại diện PÍ<Q, (định nghia 3.3) va quan thé Nc thể F;, j =I,M tại lần tạo sinh thứ ø của Thuật giải di truyền Vấn đề đặt ra là: Cần xác định mức
độ đông dạng giữa cá thể F; trong lần tạo sinh thứ g với mẫu đại diện P'
Để giải quyết vấn để này, chúng tôi đưa ra một kỹ thuật xây dựng hàm thích nghỉ mờ cho Thuật giải di truyền sao cho:
ø: Lần tạo sinh thứ ø của Thuật giải di truyền
Phương pháp tạo tri số thích nghỉ mờ
Xây dựng một hệ thống mờ (FS) với ba đầu vào: Khoảng cách (2), Góc (2), và Lần tạo sinh thif (g), FS sẽ tra vé tri so thich nghỉ ƒ(d,a,g)<1 cho cá thể #; tương ứng
trong quần thể kích thước (công thức trên)
Như vậy, đầu tiên phải biểu diễn mờ cho các đầu vào
Trang 4A Cách biểu diễn mờ cho các đầu vào
Các đầu vào: Khoảng cách (2), Géc (a), Lan tạo sinh thứ (ø) có những giá trị được nhắc đến dưới dạng ngôn ngữ như: Nhỏ, Trung_ bình, Lớn
Mỗi giá trị ngôn ngữ của từng đại lượng đầu vào được xác định bằng một tập
mờ [1,TLTK], [7,TLTK] định nghĩa trên cơ sở là tập các số thực dương chỉ giá trị vật lý của từng đại lượng đầu vào (Khoảng cách (2), Góc (a), Lần tạo sinh thứ (ø)) Các hàm thành viên của chúng được ký hiệu: wna(Tên_đại_lượng_đầu_vào),
trang bnn(Tên_ đại lượng, đầu_ vào), uan(Tên_ đại_lượng_đâu_vào)
Như vậy, mỗi đại lượng đầu vào có hai miễn giá trị khác nhau:
-_ Miễn giá trị ngôn ngữ
Trang 5HLon()
Trang 6Sau khi mờ hóa các đầu vào, bước tiếp theo xây dựng bộ luật mờ để xác định trị số thích nghi- TSTN của FS từ ba đầu vào (Khoảng cách (đ), Góc (a), Lần tạo
sinh thứ (ø))
B Xây dựng bô luật mờ cho các đầu vào[9.CTNC
Đầu tiên, định nghĩa một vài /rị số thích nghỉ riêng giữa trị số thích nghỉ cao nhất và thấp nhất để ấn định cho tập số lượng xác định các mẫu
Ví dụ:
Lớn:1.0 Trung bình _lớn: 0.7 Trung bình: 0.4 Trung bình_nhỏ: 0.1 Nhỏ: 0.02 Sau đó, xây dựng tập luật mờ từ các đầu vào: Khoảng cách (đ), Góc (a), Lan tao sinh thứ (g) để xác định rrị số thích nghỉ tưởng ứng dựa trên nguyên tắc:
Uu tiên đầu tiên là khoảng cách: đ càng nhỏ= Trị số thích nghỉ càng lớn
Ưu tiên thứ hai là Góc(z): Nếu hai mẫu có đ trùng nhau (so với mẫu đại diện P) thì Góc⁄ F,OP' càng nhỏ = Trị số thích nghỉ càng lớn
Hình 3.4 Minh họa góc ⁄FOP trong trường hợp d trùng nhau (Ó là mẫu
trung bình; P' là mẫu đại diện eQ,); F¡, F; là các mẫu số 1 và số 2 trong
quần thể các N cá thể của Thuật giải di truyền)
Nhận xét thấy: F,P' = F;P' nhưng Ƒ; lại gần với OP hơn so với Ƒ) vì ⁄ F;ÓPÍ
nhé hon Z F,OP’
Cuối cùng, là yếu tố Lần tạo sinh thứ (g): g càng nhỏ = Thuật giải càng tốt Tập luật được xây dựng gồm 3Ÿ=27 luật mờ
Trang 7Vi dụ một vài luật:
R1: Nếu (2=Nhỏ) và (a=Nhỏ) Thì TSTN=Lớn
R2: Nếu (đ=Nhỏ) va (a=Trung_binh) và (g= Nh6) Thi TSTN=Trung binh_Lén
R3: Néu (d=Nhé) va (a=Trung_binh) va (g= Trung_binh) Thi TSTN=Trung_binh
R4: Nếu (đ=Nhỏ) và (a=Trung_binh) va (g= Lén) Thi TSTN=Trung bình_nhỏ
R5: Néu (d=Nhd) va (a=L6n) va (g= Trung_binh) Thi TSTN=Trung bình_nhỏ
Ta biểu diễn vế trái của các luật bằng các hàm thành viên tương ứng của nó
Với 27 luật, chúng ta có 27 giá trị của hàm thành viên ở vế trái Như vậy, từ
các đầu vào: Khoảng cách(2), Góc(2), và Lần tạo sinh thứ(ø), sẽ xác định được 27
giá trị hàm thành viên tương ứng pj; (i=1 27) trong khoảng [0,1]
Trang 8Bài toán trở thành: Bằng cách nào để phân lớp các véc tơ ụ gồm 21 phần tử
u=(M\, Hạ, , Mại) tính được từ các đâu vào: (Khoảng cách(đ), Góc(a), và Lần tạo
sinh thứ(g)) về năm nhóm ứng với các trị số thích nghỉ- TSTN (Lén(1), Trung
bình _Lớn(0.7), Trung_bình(0.4), Trung bình_nhỏ(0.1), Nhỏ(0.02))
Để giải quyết vấn để này, chúng tôi đã sử dụng Thuật giải học cạnh tranh
không giám sát của mạng Nơron Kohonen
C Ứng dung Thuật giải học cạnh tranh không giám sát mạng Kohonen để xác
định trị số thích nghỉ
e _ Hoạt động của Thuật giải học cạnh tranh không giám sát Kohonen Các bước thực hiện: [9,CTNC], [23,TLTK]
BI: Khởi tạo bộ trọng số (W¡;} với các giá trị ngẫu nhiên nhỏ trong khoảng [0,1]
B2: Thiết lập tập các mẫu nhập {uu} tại lớp đầu vào
B3: Tính khoảng cách Euclid {(u¡} và (W¡} cho Nơron thứ j
B4: Chọn ra Nơron có khoảng cách nhỏ nhất (Nơron trọng tâm)
B5: Điều chỉnh bộ trọng số (Wn} của Nơron trọng tâm và các láng giềng của nó sao cho gân với bộ mẫu nhập {}
B6: Trở lại bước 2 với bộ mẫu nhập mới
° Ứng dung mang Noron Kohonen
1 Quá trình học để tạo lớp
Nhận xét: Luật đúng nếu giá trị hàm thành viên {Ò;} trong vế trái = 1 và Luật
sai nếu giá trị hàm thành viên {u;} trong vế trái =0 Như vậy, chúng tôi thu được tập các Luật rõ ứng với từng lớp j của TS7N, je (Lớn, Trung bình Lớn, Trung_bình, Trung bình_nhỏ, Nhỏ) Bộ véc tơ Luật này là bộ mẫu học cho từng lớp
Trang 9Sau khi học theo Thuật giải Kohonen, chúng tôi có được 5 lớp mẫu ban đầu
ứng với 5 7STN tương ứng (Lớn, Trung bình lớn, Trung_bình, Trung bình nhỏ, Nhỏ)
2 Định vị TSTN cho một mẫu bất kỳ
Bất cứ từ một đầu vào (Khoảng cách(2), Góc(2), Lần tạo sinh thứ (g)) nào,
chúng tôi đều xây dựng được một véc tơ trực thuộc {u¡} tương ứng và dễ dàng sử dụng mạng Kohonen để nhóm nó vào một trong 5 lớp 7S7N được tạo ở bước học
Như vậy, từ một đầu vào (Khoảng cách(2), Góc(a), và Lần tạo sinh thứ (g)) bat ky,
đều dinh vi duoc TSTN twong tng (Hinh 3.5)
D Kế luận
Mục 3.1.1 để xuất một kỹ thuật ấn định trị số thích nghỉ mờ: Xóc định mức độ đông dạng giữa hai mẫu (véc tơ) A và B bất kỳ Ba đại lượng: Khoảng cách(2),
Trang 10Géc(a) va Lan tao sinh thứ(g) là cơ sở để đánh giá mức độ đồng dạng này Trong
đó, ưu tiên số 1 là Khoảng cách(2): phan ánh sự sai khác về giá trị giữa các phần tử của hai véc tơ A và Ö Ưu tiên số 2 là Góc(4):phảẩn ánh độ lệch giữa hai véc tơ _ thông qua mẫu trung bình O Cuối cùng là Lần tạo sinh thứ(g) để đánh giá mức độ
tối ưu của Thuật giải Ba đại lượng là đầu vào để xác định mức độ đồng dạng của hai mẫu A và Ö trên nguyên tắc: (đ) và( a) càng nhỏ thì A và càng giống nhau và (g) nhỏ thì thuật giải càng tối ưu Kỹ thuật này được sử dụng để xây dựng một không gian các mẫu đồng dạng với một mẫu đại diện chọn trước (mục 3.1.2) tiến
tới áp dụng cho bài toán chuẩn bị dữ liệu học (mục 3.1.3)
3.1.2 Ứng dụng Thuật giải di truyền với hàm thích nghỉ mờ được ấn định trong mục 3.1.1 để tạo ra quần thể mẫu #,,k=1,M đồng dạng với P' <9,
Định nghĩa 3.6 (ngưỡng trị số thích nghỉ ©)
Cho trước mẫu đại diện PeO, (định nghĩa 3.3) và quần thể M cá thể
FJ =1N, Ngưỡng trị số thích nghỉ ee[0,1] là ngưỡng qui định cần thiết để đánh
giá mức độ đồng dạng giữa Ƒ; và mẫu đại diện P' (mức độ F;e©))
Nếu trị số thích nghỉ của F,> e thì kết luận: F;eQ,
Ngược lại kết luận: F;£Q,
Trang 11(3) Thuật giải di truyền tìm M mẫu đồng dạng với Pi
3.1 Khéi tao ngdu nhién N mau #,„ j=1,N;nguyên>1 Đặt g=1;
3.2 Với từng mẫu F tại lần tạo sinh thứ ø, thực hiện:
- Tính “Khoảng cách (đ)” và “Góc (a)” của mẫu F; với P° theo định
nghĩa 3.4 và 3.5
- Xác định ứrị số thích nghi- TSTN của mẫu F; với 3 đầu vào ”Khoảng
cách (đ)”, “Góc (a)” và “Lần tạo sinh thứ (ø)” (mục 3.1.1 )
Nếu mẫu F; có TSTN >e thì (k=k+1; F,=F;}
3.3 Biến hóa tạo lập quần thể mới
Trên cơ sở TS7N thu được của từng cá :hể, chọn ra những cá thể tốt nhất trong quân thể hiện tại và ứng dung các toán tử di truyền của EA(phu luc A) tạo ra quân thể mới Đặt lại số lần tạo sinh: g=g+1
Ở đây, dùng cdc todn ti di truyén sau:
- Todn ttt lai: Poros
- _ Toán tử đột biến: Pmuanon-
Sau khi tạo ra qudn thể mới quay lại bước 3.2 để thực hiện
Thuật giải kết thúc khi k= M Hoặc nếu sau số lượng ø=G lớn lần tạo sinh mà k<M thì cũng dừng Thuật giải
3.1.3 Hiệu quả của mô hình kế? hợp Di truyền- Kohonen- Mờ trong xác định mẫu đồng dạng
Mệnh để 3.1
Cho trước mẫu đại điện P'eQ, (định nghĩa 3.3) và quần thể khởi tạo gồm N cá
thể Tpj =LN; Nnguyén=1 Cho trước ngưỡng trị số thích nghỉ e (định nghĩa 3.6) và
Trang 12số lượng các lần tạo sinh G Giả thiết quần thể chứa các cá thể phân biệt và biết hệ
số của các toán tử di truyền Lúc này, số lượng mẫu đồng dạng với P'eQ; là M(G)
được xác định theo công thức :
G
gal Trong đó,
m(g) là số lượng mẫu đồng dạng với PÍ (có TSTN > e) tại lần tạo sinh thứ g
Chứng minh mệnh đề 3.1:
Xuất phát từ quần thể khởi tạo Z; 7 =1, , xác định được /rị số thích nghỉ của
cá thể Ƒ; trong lần tạo sinh thứ g:
TSTN, (g) = ƒ; (đ,a,g);(mục 3.1.1)
Trong đó,
đlà Khoảng cách giữa Ƒ; và P' (định nghĩa 3.4),
alà Góc ⁄F,OP* (định nghĩa 3.5)
Trang 13hệ số của các toán tử di truyền Lúc này, số lần tạo sinh G được xác định:
Trang 14Hé qua 3.1
G
Néu t6n tai G lan tao sinh sao cho )" m(g) = M ( ménh dé 3.2) thì chắc chắn sẽ
=
có tối thiểu A mẫu đồng dạng với P’ cho truéc (tối thiéu M mau F,,k =1,M €Q)
(Chứng minh hiển nhiên)
3.1.4 Phân tích, đánh giá việc xác định bộ mẫu đồng dạng bằng mô hình kết hợp
Di truyền- Kohonen- Mờ
Nhu câu
Một số kỹ thuật tính toán thong minh (vi du: mang Noron) yéu cau qué trình
hoc, huấn luyện, dẫn đến cần thiết phải có một bộ dữ liệu huấn luyện chuẩn Từ
đó, phát sinh nhu cầu: phải có phương pháp tìm kiếm, xây dựng bộ dữ liệu huấn luyện chuẩn ban đầu Giai đoạn này được gọi là Chuẩn bị dữ liệu Thông thường, các phương pháp chọn lọc thủ công được sử dụng để tàm ra Bộ đữ liệu huấn luyện
ban đầu (thông qua ý kiến các chuyên gia) Tuy nhiên, với phương pháp này có
những hạn chế sau: Rất tốn thời gian; gặp nhiều khó khăn khi phải tìm kiếm một cơ
sở dữ liệu các mẫu huấn luyện lớn; việc chọn lọc bộ mẫu huấn luyện bằng phương pháp thủ công mang nặng tính cẩm tính, dễ xuất hiện nhiều sai sót Để khắc phục những hạn chế trên, cần thiết phải thiết kế một hệ thống tự động cho việc chuẩn bị _ đữ liệu Luận án đề xuất hệ thống kết hợp Di truyền- Kohonen- Mờ Hệ thống đề _ xuất cho phép # đông xây dựng không gian bộ mẫu huấn luyên đông dạng với những
mẫu huấn luyện được chọn lọc bằng phương pháp thủ công Hệ thống đạt được những ưu điểm sau: Hạn chế bớt những sai sót trong quá trình chọn lọc mẫu bằng phương pháp thủ công (giảm số lượng mẫu tìm kiếm bằng phương pháp thủ công); tiết kiệm thời gian và sức lực khi phải tìm kiếm một cơ sở dữ liệu huấn luyện lớn
Trang 15So sénh mé hinh dé xudt voi phương pháp thủ công
Cho trước 4 nhóm vân tay: Vòng trái, vòng phải, vòng tròn, vòng cung Cho
trước mẫu vân tay đại diện thuộc một trong 4 nhóm trên Mẫu vân tay này sẽ được chuyển về ma trận định hướng 6x5 (xem mục 4.3.2) Như vậy, chúng ta có véc tơ đặc trưng có chiều dài 30 biểu diễn mẫu vân tay cho trước Từ véc tơ này, hệ thống
kết hợp sẽ phát sinh thêm 15 véc tơ đồng dạng với nó (mục 3.1.2) Các véc tơ phát
sinh biểu diễn cho 15 mẫu vân tay thuộc cùng một nhóm với mẫu vân tay đại diện (chỉ tiết trong chương 4- mục 4.3)
Hệ thống kết hợp đề xuất được thực hiện trên máy PentiumII-PC 266 MHz với
30 vòng lặp và thời gian tạo ra 15 mẫu là 3 giây
Cùng với bài toán trên, 7 người tìm kiếm 15 mẫu vân tay thuộc cùng một
nhóm trong cơ sở dữ liệu máy tính gồm 1000 mẫu vân tay đặt xen kẽ nhau tốn thời
gian trung bình là 9 phút (cũng thực hiện trên máy PentiumlI-PC 266 MHz)
Điều này chứng té ring: Hé thdng kết hợp đề xuất rất hiệu quả so với phương pháp tìm kiếm thủ công trong quá trình chuẩn bị dữ liệu ban đầu
Bình luận
Với lớp bài toán xây dựng một cơ sở dữ liệu lớn chứa một hoặc nhiều nhóm
mẫu Đồng thời, mỗi nhóm lại chứa một không gian lớn các mẫu đồng dạng Lúc này, hệ thống kết hợp Di ruyễn- Kohonen- Mờ đề xuất là thích hợp
Với lớp bài toán xây dựng một cơ sở dữ liệu nhỏ, việc tìm kiếm mẫu bằng
phương pháp thủ công không khó khăn gì và tốn ít thời gian Lúc này, không cần
thiết phải sử dụng hệ thống để xuất