DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT Các kí hiệu, ĐSGT Đại số gia tử Α Tổng độ đo tính mờ của các gia tử âm Β Tổng độ đó tính mờ của các gia tử dương AX Đại số gia tử AX Đại số gia t
Trang 1LỜI CAM ĐOAN
Tên tôi là : Đặng Thị Thu
Sinh ngày 05 tháng 8 năm 1983
Học viên cao học lớp: CK11G - trường Đại học CNTT&TT Thái Nguyên
Xin cam đoan : Đề tài luận văn “Xây dựng hệ luật mờ từ cơ sở dữ liệu - cách tiếp cận theo lý thuyết Đại số gia tử” do TS.Trần Thái Sơn
hướng dẫn là công trình nghiên cứu của riêng tôi Tất cả tài liệu tham khảo đều có nguồn gốc, xuất xứ rõ ràng
Tôi xin cam đoan tất cả những nội dung trong luận văn đúng như nội dung trong đề cương và yêu cầu của thầy giáo hướng dẫn Nếu sai tôi xin hoàn toàn chịu trách nhiệm trước Hội đồng khoa học và trước pháp luật
Thái Nguyên, ngày 25 tháng 8 năm 2014
Người cam đoan
Đặng Thị Thu
Trang 2LỜI CẢM ƠN
Trong quá trình làm luận văn vừa qua, dưới sự giúp đỡ và chỉ bảo nhiệt tình của TS Trần Thái Sơn - Viện Công nghệ thông tin - Viện khoa học Việt Nam, luận văn của tôi đã được hoàn thành Mặc dù đã cố gắng không ngừng cùng với sự tận tâm của thầy hướng dẫn nhưng do thời gian
và khả năng vẫn còn hạn chế nên luận văn khó tránh khỏi những thiếu sót
Để hoàn thành luận văn này, em xin bày tỏ lòng biết ơn sâu sắc đến
TS Trần Thái Sơn - Người thầy đã tận tình giúp đỡ em trong suốt quá trình làm luận văn
Em cũng xin bày tỏ lòng biết ơn đến ban lãnh đạo và các thầy giáo,
cô giáo trong Trường Đại học Công Nghệ Thông Tin & Truyền Thông Đại học Thái Nguyên đã giúp đỡ, tạo điều kiện tốt nhất cho em học tập và thực hiện luận văn này
Thái Nguyên, ngày 25 tháng 8 năm 2014
Tác giả
Đặng Thị Thu
Trang 3MỤC LỤC
MỤC LỤC i
DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT iii
DANH MỤC CÁC HÌNH iv
PHẦN MỞ ĐẦU 1
Chương 1:NHỮNG KIẾN THỨC CƠ BẢN VỀ LÝ THUYẾT TẬP MỜ 3 1.1 Lý thuyết về tập mờ 3
1.1.1 Kiến thức cơ sở về tập mờ ([5]) 3
1.1.2 Biến ngôn ngữ 8
1.2 Lý thuyết về Đại số gia tử ([1-3]) 14
1.2.1 Những khái niệm cơ bản về đại số gia tử 14
1.2.2 Vấn đề định lượng ngữ nghĩa trong đại số gia tử 17
Chương 2:GIẢI THUẬT DI TRUYỀN 25
2.1 Những khái niệm cơ bản về giải thuật di truyền 25
2.2 Các tính chất đặc thù của thuật giải di truyền 28
2.3 Các bước quan trọng trong việc áp dụng giải thuật di truyền 29
2.4 Các phương thức biến hoá của giải thuật di truyền 29
Chương 3: XÂY DỰNG HỆ LUẬT MỜ VÀ GIẢI BÀI TOÁN HỒI QUY MỜ THEO CÁCH TIẾP CẬN CỦA ĐẠI SỐ GIA TỬ 32
3.1 Bài toán hồi quy mờ 32
3.1.1 Bài toán hồi quy mờ 32
3.1.2 Chuyển đổi CSDL số sang hệ luật mờ dựa trên lý thuyết tập mờ cổ điển 36
3.1.3 Xây dựng hệ luật mờ theo cách tiếp cận ĐSGT 40
3.2 Bài toán thiết kế tối ưu hệ luật mờ 56
3.2.1 Đặt bài toán 56
3.2.2 Tìm kiếm hệ luật tối ưu dựa trên giải thuật di truyền lai 57
Trang 43.3 Chương trình thử nghiệm 60
3.3.1 Cài đặt chương trình 60
3.3.2 Giao diện của chương trình 60
KẾT LUẬN CHUNG 69
TÀI LIỆU THAM KHẢO 70
Trang 5DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT
Các kí hiệu,
ĐSGT Đại số gia tử
Α Tổng độ đo tính mờ của các gia tử âm
Β Tổng độ đó tính mờ của các gia tử dương
AX Đại số gia tử
AX Đại số gia tử tuyến tính đầy đủ
CSDL Cơ sở dữ liệu
GA Giải thuật di truyền
Khoảng tính mờ của giá trị ngôn ngữ
X k Tập các hạng từ có độ dài đúng k
I k Hệ khoảng tính mờ mức k của các giá trị ngôn ngữ
IFRG1 Initial Fuzzy Rules Generation 1
IFRG2 Initial Fuzzy Rules Generation 2
HAFRG Hedge Algebras based Fuzzy Rules Generation
FPO-SGA Fuzzy Parameters Optimization - SGA
RBO-SGA Rule base Optimization - SGA
Trang 7PHẦN MỞ ĐẦU
Trong cuộc sống hàng ngày hay trong công việc giảng dạy tại trường, chúng ta thường xuyên phải đưa ra những quyết định Chẳng hạn, với một học sinh kém, ta cần có chế độ bồi dưỡng các kiến thức cơ sở mà thông thường học sinh đó bị rỗng Với một học sinh giỏi, ta cũng cần bồi dưỡng các kiến thức, nhưng là các kiến thức mới, đòi hỏi phải tư duy tốt và tính sáng tạo trong suy nghĩ Nói chung, cách tiến hành cụ thể là phụ thuộc vào từng học sinh và căn cứ vào kinh nghiệm giảng dạy cũng như kinh nghiệm sống của từng giáo viên và kinh nghiệm học được của đồng nghiệp, của người xung quanh Các kinh nghiệm này, trong tư duy của con người, có thể khái quát dưới dạng mệnh đề kiểu “ Nếu thì ” Thí dụ “Nếu Học lực của học sinh là Kém và Ý thức học tập của học sinh là trung bình Thì Dạy kèm theo phương
án C1”; Thí dụ “Nếu Học lực của học sinh là Khá và Ý thức học tập của học sinh là Tốt Thì Dạy kèm theo phương án C2”
Hiện tại, người ta nhận thấy, các mệnh đề dạng như trên có thể bắt gặp rất nhiều trong những lĩnh vực nghiên cứu khác nhau như điều khiển tối ưu, phân loại tự động, hồi quy Và một hướng nghiên cứu, thuộc về khai phá dữ liệu, liên quan đến việc xây dựng các mệnh đề như vậy, mà người ta gọi là luật, để giải các bài toán khác nhau, đã và đang phát triển rất mạnh mẽ Cụ thể, vấn đề đặt ra là từ một Cơ sở dữ liệu số (CSDL số), sử dụng các thuật toán để sinh tự động một hệ luật tối ưu (theo nghĩa gọn nhất có thể và đạt độ chính xác theo yêu cầu đặt ra) Nếu một hệ M luật được tạo ra, có dạng:
các biến ngôn ngữ (như “tuổi”, “học lực” ) và Ai,j là các giá trị biến ngôn ngữ
Trang 8(như “khá”, “kém” ) thì người ta gọi đó là hệ luật mờ Mamdani (Mamdani fuzzy rule-based system:
MFRBS) MFRBS có đặc điểm khác các mô hình khác là các biến đầu vào và ra đều là mờ dưới dạng từ của ngôn ngữ tự nhiên Đặc điểm này mang lại tính “thân thiện” với con người vì suy luận trên các từ của ngôn ngữ tự nhiên là đặc điểm của con người Các luật cũng được biểu diễn dưới dạng quen thuộc với suy nghĩ và lập luận của con người Ngoài ra, việc có những
số liệu chính xác để xây dựng một hệ luật (không mờ) trong thời gian tính toán chấp nhận được là điều không dễ dàng Để xây dựng MFRBS có thể có nhiều cách tiếp cận khác nhau Trong luận văn này sử dụng cách tiếp cận của Đại số gia tử (ĐSGT), một cách tiếp cận tương đối mới và hứa hẹn cho những kết quả khả quan so với một số cách tiếp cận khác
Được sự đồng ý của trường Đại học Công nghệ thông tin và Truyền
thông với sự hướng dẫn của Thầy giáo em xin mạnh dạn nhận đề tài: “Xây dựng hệ luật mờ từ cơ sở dữ liệu - cách tiếp cận theo lý thuyết Đại số gia tử” làm đề tài luận văn của mình
Luận văn có bố cục như sau:
Chương 1: Tổng quan về tập mờ và đại số gia tử
Trong chương này trình bày những kiến thức cơ bản về lý thuyết tập
mờ và lý thuyết Đại số gia tử
Chương 2: Giải thuật di truyền
Trong chương này nêu khái niệm cơ bản về giải thuật di truyền, các tính chất đặc thù của thuật giải di truyền
Chương 3: Xây dựng hệ luật mờ và giải bài toán hồi quy mờ theo cách tiếp cận của đại số gia tử
Trong chương này trình bày việc chuyển đổi CSDL số sang hệ luật mờ
và áp dụng giải bài toán hồi quy
Trang 9Chương 1 NHỮNG KIẾN THỨC CƠ BẢN VỀ LÝ THUYẾT TẬP MỜ
1.1 Lý thuyết về tập mờ
1.1.1 Kiến thức cơ sở về tập mờ ([5])
Là người đầu tiên nghiên cứu lý thuyết tập mờ, L A Zadeh đã có rất nhiều công trình nghiên cứu cho sự phát triển và ứng dụng Ý tưởng nổi bật của Zadeh là từ những khái niệm trừu tượng về ngữ nghĩa của thông tin mờ,
không chắc chắn như trẻ-già, nhanh-chậm, cao-thấp,… Ông đã tìm cách biểu
diễn chúng bằng một khái niệm toán học, được gọi là tập mờ và được định nghĩa như sau
Định nghĩa 1 Cho một tập vũ trụ U với các phần tử ký hiệu bởi x, U={x} Một tập mờ A trên U là tập được đặc trưng bởi một hàm A (x) mà nó
liên kết mỗi phần tử x∈U với một số thực trong đoạn [0,1] Giá trị hàm A (x)
biểu diễn mức độ thuộc của x trong A A (x) là một ánh xạ từ U vào [0,1] và
được gọi là hàm thuộc của tập mờ A
Như vậy, giá trị hàm A (x) càng gần tới 1 thì mức độ thuộc của x trong
A càng cao Khi A là một tập hợp kinh điển, hàm thuộc của nó, A (x), chỉ
nhận 2 giá trị 1 hoặc 0, tương ứng với x có nằm trong A hay không Rõ ràng,
tập mờ là sự mở rộng của khái niệm tập hợp kinh điển Các khái niệm, phép toán trong lý thuyết tập kinh điển cũng được mở rộng cho các tập mờ
Họ tất cả các tập mờ trên miền cơ sở U là không gian các hàm từ U vào
đoạn [0,1], tức là F ( ,[0,1]) U = {A : U[0,1]}, một không gian tương đối
giàu về cấu trúc tính toán mà nhiều nhà nghiên cứu đã sử dụng cho việc mô phỏng các phương pháp suy luận của con người
Trang 10Chúng ta có thể biểu diễn tập mờ bằng các cách sau, tùy theo tập U là
hữu hạn, đếm được hay vô hạn liên tục:
- Trường hợp U hữu hạn, U={u i : 1 i n}, ta có thể viết
A = A (u 1 )/u 1 + A (u 2 )/u 2 + … + A (u n )/u n = 1 i nA (u i )/u i
- Trường hợp U vô hạn đếm được, U={u i : i=1,2,… }, ta viết:
Sau đây ta định nghĩa một số khái niệm đặc trưng liên quan đến tập mờ
Định nghĩa 2 Cho một tập mờ A trên tập vũ trụ U và [0,1] Tập lát cắt của A là một tập kinh điển, ký hiệu A, được xác định như sau :
A = {u U : A (u)}
Tập A còn gọi là tập mức của A
Định nghĩa 3 Cho một tập mờ A trên tập vũ trụ U,
i) Giá của tập mờ A, ký hiệu support(A), là tập con của U trên đó
A (u)0, tức là support(A) = {u U : A (u)0}
ii) Độ cao của tập mờ A, ký hiệu high(A), là cận trên đúng của hàm
thuộc A (u) trên U, tức là high(A) = sup{A (u) : uU}
iii) A được gọi là tập mờ chuẩn nếu high(A)=1 Ngược lại gọi là tập mờ
Trang 11Định nghĩa 4 Cho một tập mờ A trên tập vũ trụ U,
i) Lực lượng vô hướng hay bản số của tập mờ A, ký hiệu count(A),
được xác định là:
count(A) = uUA (u), nếu U là hữu hạn hay đếm được,
= UA (u)du, nếu U là vô hạn liên tục
ii) Lực lượng mờ hay bản số mờ của tập mờ A, ký hiệu card(A), là một
tập mờ trên tập các số nguyên không âm N, được xác định như sau:
card(A) = N card(A) (n)dn , trong đó, card(A) (n) được xác định theo công
thức sau, với |A| là lực lượng tập mức A,
card(A) (n) = sup{t[0,1] : |A| = n}
Ví dụ 1 Cho tập vũ trụ chỉ tuổi tính chẵn năm U={u : 0 u 120}, A là
một tập mờ chỉ tuổi già (old) được xác định bởi hàm thuộc sau (hình 1):
2 1 60 6
( )(1 ( ) ) [61,120]
u u
support(A) = {u : 61 u 120} ; high(A) = 1.01-1; core(A) = {120}
Hình 1 Đồ thị biểu diễn hàm thuộc của tập mờ già (old)
Tiếp theo chúng ta định nghĩa một số phép toán cơ bản trên tập mờ, các phép này làm cơ sở cho việc phát triển lôgíc mờ sau này
Trang 12Định nghĩa 5 Cho hai tập mờ A và B trên tập nền U có hàm thuộc
tương ứng là A và B, ba phép toán cơ bản là hợp, giao của hai tập mờ và lấy
phần bù của tập mờ A là một tập mờ C, được viết là
C = A B, hoặc C = A B, hoặc C = A ~ với hàm thuộc được xác định như sau:
AB (u) = max(A (u), B (u)), u U,
AB (u) = min(A (u), B (u)), u U,
A~ (u) = 1- A (u), u U
Hay viết ở dạng thu gọn là:
AB (u) = A (u) B (u)),
AB (u) = A (u) B (u))
Ví dụ 2 Xét tập nền U = {1,2,3,4,5,6,8,9,10,11} là tập các giá trị trong thang điểm 10 đánh giá kết quả học tập của học sinh Hai tập mờ G và K
tương ứng là hai khái niệm mờ về năng lực học giỏi và học kém, với hàm thuộc được cho dưới dạng bảng như sau:
Trang 13Một lớp đặc biệt các tập mờ là lớp các quan hệ mờ, chúng là các tập mờ trên không gian tích Đề-các các miền cơ sở Như tên gọi, quan hệ mờ mô tả mối quan hệ mờ giữa các đối tượng trong miền cơ sở Về mặt hình thức chúng
ta định nghĩa quan hệ mờ như sau
Định nghĩa 6 Cho U là tích Đề-Các của n miền cơ sở U i , i=1, ,…, n
Khi đó mỗi một tập mờ trên U được gọi là một quan hệ mờ n-ngôi và được kí
hiệu là R, gọi là tên của quan hệ đó, và nó được biểu thị bằng công thức sau:
Trong đó (u 1 ,…,u n ) là hàm thuộc của tập mờ R Dấu biểu diễn hình
thức của hàm thuộc, có thể một trong ba trường hợp là hữu hạn hoặc đếm được hoặc liên tục
Quan hệ mờ cũng có các phép tính cơ bản như trên tập mờ vì bản thân
nó cũng là tập mờ Ngoài ra, quan hệ mờ có những phép tính đặc thù riêng mà trên tập mờ không có, đó là phép hợp thành dưới đây
Định nghĩa 7 Cho R là một quan hệ mờ trên UV và S là quan hệ mờ trên VW Khi đó, phép hợp thành của hai quan hệ này là một quan hệ trên UW, được ký hiệu là RS và được định nghĩa như sau:
RS = vV [R (u,v)S (v,w)]/(u,w)
Trong đó là một phép tính 2 ngôi trong [0,1] có tính giao hoán, kết
hợp và phân phối đối với phép max Nếu là phép min , thì ta có phép hợp thành max-min, nếu là phép nhân số học thì ta có phép hợp thành
max-product
Ví dụ 3 Cho U = {u 1 , u 2 , u 3 }, V = {v 1 , v 2 } và W = {w 1 , w 2}, với quan
hệ mờ R trên UV và S trên VW được cho hàm thuộc dưới dạng ma trận
Trang 14w w
v S v
Trong hầu hết các ứng dụng, tri thức được biểu diễn dưới dạng luật
“if-then” và mỗi luật được xem như một quan hệ mờ
Ta thấy rằng lý thuyết tập mờ với mục tiêu mô hình hóa toán học ngữ nghĩa của các khái niệm mờ và, hơn nữa, mô hình hóa cách lập luận của con người Tuy nhiên, những vấn đề này thuộc loại có cấu trúc yếu, khó có thể có một cấu trúc toán duy nhất mô hình hóa trọn vẹn những vấn đề đó
1.1.2 Biến ngôn ngữ
L A Zadeh đã viết “Khi thiếu hụt tính chính xác bề ngoài của những
vấn đề phức tạp cố hữu, một cách tự nhiên là tìm cách sử dụng các biến ngôn ngữ, đó là các biến mà giá trị của chúng không phải là số mà là các từ hoặc các câu trong ngôn ngữ tự nhiên hoặc nhân tạo Động lực cho việc sử dụng các từ, các câu hơn các số là ở chỗ đặc trưng ngôn ngữ của các từ và các câu thường ít xác định cụ thể hơn của các số” và ông đã đưa ra một lớp khái
niệm rộng hơn có thể mô hình qua các tập mờ, đó là biến ngôn ngữ
Trang 15Định nghĩa 8 Biến ngôn ngữ là một bộ năm (X,T(X),U,R,M), trong đó
X là tên biến, T(X) là tập các giá trị ngôn ngữ của biến X, U là không gian
tham chiếu hay còn gọi là miền cơ sở của biến X, R là một quy tắc ký pháp sinh các giá trị ngôn ngữ cho T(X), M là quy tắc gán ngữ nghĩa biểu thị bằng tập mờ trên U cho các từ ngôn ngữ trong T(X)
Ví dụ 4 Cho X là biến ngôn ngữ có tên AGE, miền tham chiếu của X
là U=[0,120] Tập các giá trị ngôn ngữ T(AGE)={very old, old, possible old,
less old, less young, quite young, more young,…} Chẳng hạn với giá trị ngôn
ngữ old, quy tắc gán ngữ nghĩa M cho old bằng tập mờ cho bởi ví dụ 1:
M(old) = {(u,old (u)) : u[0,120]}
Biến ngôn ngữ được cấu trúc theo hướng mà trong đó có hai quy tắc cơ bản Thứ nhất là quy tắc cú pháp, qui định cách thức để sinh các giá trị ngôn ngữ Thứ hai là quy tắc ngữ nghĩa, qui định thủ tục tính toán ngữ nghĩa của các giá trị ngôn ngữ Ngoài các giá trị sinh nguyên thủy, các giá trị ngôn ngữ
có thể gồm các từ liên kết như and, or, not,… và các gia tử ngôn ngữ như
very, possible, less, quite, more,….Zadeh cũng nêu ra một vài thí dụ về cách
sinh ra các hàm thuộc từ các hàm thuộc đã có như nếu A là nhãn ngôn ngữ
mờ có hàm thuộc là μA thì veryA có hàm thuộc là (μA)2 còn lessA có hàm
thuộc là căn bặc hai của μA
Trong thực tế có nhiều biến ngôn ngữ khác nhau về giá trị sinh nguyên thủy, tuy nhiên cấu trúc miền giá trị của chúng tồn tại một “đẳng cấu” sai khác nhau bởi giá trị sinh nguyên thủy này Đây gọi là tính phổ quát của biến ngôn ngữ
Khác với giá trị nguyên thủy của các biến ngôn ngữ phụ thuộc vào ngữ cảnh, ngữ nghĩa của các gia tử và các từ liên kết hoàn toàn độc lập với ngữ cảnh Đây là tính độc lập ngữ cảnh của gia tử và liên kết
Trang 16Chúng ta thấy rằng lý thuyết tập mờ với mục tiêu mô hình hóa toán học ngữ nghĩa của các khái niệm mờ và hơn nữa mô hình hóa cách lập luận của con người Tuy nhiên, những vấn đề này thuộc loại có cấu trúc yếu, khó có thể có một cấu trúc toán duy nhất mô hình hóa trọn vẹn những vấn đề đó
1.1.3 Lôgic mờ
Cùng với khái niệm biến ngôn ngữ, L A Zadeh đã phát triển lôgic mờ
mà các giá trị chân lý nhận trong T(Truth) = {true, very true, more false,
possible false, very very false,…}, tập các giá trị của biến ngôn ngữ Truth
Khi đó, một mệnh đề dạng “X is A”, với A là một khái niệm mờ, sẽ có giá trị
chân lý thuộc T(Truth) và được biểu thị bởi một tập mờ có hàm thuộc A trên
không gian tham chiếu U
Lý thuyết tập mờ là cơ sở toán học cho việc phát triển các phương pháp
mô phỏng lập luận của con người Về nguyên tắc, vấn đề tư duy, lập luận của con người rất phức tạp và do đó không thể sử dụng một cấu trúc toán học duy nhất để mô phỏng Vì vậy, mục tiêu của chúng ta là càng xây dựng được nhiều cấu trúc đại số các tập mờ càng tốt để linh hoạt trong tiếp cận các vần đề ứng
dụng Ở đây, chúng ta sẽ định nghĩa một họ các cặp đối ngẫu norm và
t-conorm cùng với phép phủ định làm cơ sở cho lôgic mờ và lập luận xấp xỉ
Định nghĩa 9 Một hàm 2-biến T : [0,1][0,1] [0,1] được gọi là
phép t-norm nếu nó thỏa các tính chất sau với a,a’,b,c [0,1]:
i) Tính chất điều kiện biên: T(a,1) = a ii) Tính giao hoán: T(a,b) = T(b,a) iii) Tính đơn điệu: a a’ T(a,b) T(a’,b) iv) Tính kết hợp: T(a,T(b,c)) = T(T(a,b),c)
Ngoài ra, một số tính chất khác cần đòi hỏi phải có trong nhiều ứng
dụng đối với phép t-norm bao gồm:
v) Tính liên tục: T là hàm hai biến liên tục
Trang 17vi) Tính lũy đẳng dưới: T(a,b) < a vii) Tính đơn điệu chặt: a a’ và b b’ T(a,a’) < T(b,b’)
Định nghĩa 10 Một hàm 2-biến S : [0,1][0,1] [0,1] được gọi là
phép t-conorm nếu nó thỏa các tính chất sau với a,a’,b,c [0,1]:
i) Tính giới nội: S(a,0) = a ii) Tính giao hoán: S(a,b) = S(b,a) iii) Tính đơn điệu: a a’ S(a,b) S(a’,b) iv) Tính kết hợp: S(a,S(b,c)) = S(S(a,b),c)
Như vậy, chỉ có hai tính chất điều kiện biên và giới nội làm nên sự khác
biệt giữa hai họ phép tính t-norm và t-conorm
Chúng ta cũng có thể mở rộng định nghĩa cho phép t-norm và t-conorm này đối với trường hợp nhiều biến vào, tức là T ex : [0,1]n [0,1] và S ex : [0,1]n
[0,1], bằng cách áp dụng liến tiếp các phép t-norm và t-conorm ở trên
Định nghĩa 11 Hàm N : [0,1] [0,1] được gọi là phép phủ định
(negation) nếu nó thỏa các tính chất sau với a,a’ [0,1]:
i) Tính đơn điệu giảm: a a’ N(a) N(a’) iv) Tính lũy đẳng: N(N(a)) = a
Ví dụ 5: Các phép t-norm, t-conorm và phép phủ định hay được sử
Trang 18Định nghĩa 12 Ba phép tính t-norm T, t-conorm S và phép phủ định N
được gọi là một hệ đối ngẫu (T,S,N) nếu chúng thỏa điều kiện sau:
N(S(a,b)) = T(N(a),N(b)), a,b[0,1]
Việc áp dụng các phép t-norm, t-conorm và phép phủ định cho việc
tính toán các toán tử hội, tuyển và phủ định trong lôgic mờ làm tăng tính mềm
dẻo trong ứng dụng Thực vậy, khi hai mệnh đề “X is A” và “X is B” có giá trị
chân lý được biểu thị bởi hai hàm thuộc tương ứng A và B trên không gian
tham chiếu U và V thì mệnh đề mờ “X is A and B” có hàm thuộc biểu thị giá
trị chân lý là AB = T(A ,B ), với T là một t-norm nào đó Tương tự, mệnh đề
“X is A or B” có hàm thuộc là AB = S(A ,B ) và mệnh đề “X is not A” có
hàm thuộc là ~A = N(A ), ở đây S là một t-conorm và N là một phép phủ định
được chọn nào đó
Các mệnh đề mờ cùng với giá trị chân lý của chúng là những đối tượng nghiên cứu chính của lôgíc mờ Trong đó, một dạng mệnh đề mờ thường biểu diễn cho tri thức dạng luật trong lập luận xấp xỉ và ứng dụng, đó là mệnh đề
mờ có điều kiện dạng “If X is A then Y is B” và được biểu diễn bằng toán tử
Trang 19x z I(x,y) I(z,y), y[0,1]
ii) Tính đơn điệu tăng đối với biến thứ hai
y u I(x,y) I(x,u), x[0,1]
iii) Tính chi phối của giá trị chân lý sai
I(0,x) = 1 iv) Tính trung tính của giá trị chân lý đúng
I(1,x) = x v) Tính đồng nhất
I(x,x) = x vi) Tính chất hoán đổi
I(x,I(y,z)) = I(y,I(x,z)) vii) Tính chất về điều kiện giới nội
I(x,y) = 1 nếu và chỉ nếu x y viii) Tính chất khái quát hóa của phép kéo theo kinh điển I(x,y) = I(N(y),N(x)), trong đó N là phép phủ định ix) I là hàm liên tục theo cả hai biến
Rõ ràng mệnh đề điều kiện ở dạng “If X is A then Y is B” thể hiện mối
quan hệ giữa hai khái niệm mờ A và B Vì vậy, chúng cảm sinh một quan hệ
mờ R thể hiện bởi một tập mờ trên không gian tích Đề-Các UV được xác
định bởi hàm thuộc thông qua một phép kéo theo được chọn
Ví dụ 6 Một số dạng phép kéo theo thường dùng
Mamdani
I(x,y) = min{x,y}
Dạng khái quát từ phép kéo theo kinh điển
I(x,y) = S(N(x),y), hoặc
I(x,y) = S(N(x),T(x,y)), hoặc
I(x,y) = S(T(N(x),N(y)),y), với T, S và N là các phép
Trang 20t-norm, t-conorm và phép phủ định
Reichenbach
I(x,y) = 1-x+x.y
Lukasiewicz
I(x,y) = min{1, 1-x+y}
Định lý sau đây cho chúng ta xem xét liệu phép kéo theo như thế nào sẽ thỏa mãn tất cả các tính chất trong định nghĩa 13
Định lý 1 Một hàm 2-biến I : [0,1]2 [0,1] thỏa các tính chất từ i) đến ix) trong định nghĩa 13 nếu và chỉ nếu có tồn tại một hàm liên tục đơn điệu tăng thực sự f : [0,1] [0,+) sao cho f(0) = 0 và
I(x,y) = f -1 (f(1)-f(x)+f(y)), với x,y [0,1], và
N(x) = f -1 (f(1)-f(x)), với x [0,1]
Tuy nhiên, bản chất ngữ nghĩa của phép kéo theo mờ trong lập luận của con người rất phức tạp, khó có một hệ tiên đề chung cho mọi tình huống Vì vậy, các tính chất ở định nghĩa 13 không bắt buộc mọi phép kéo theo mờ đều phải thỏa mãn Hơn nữa, cũng không có quyền đặt ra các yêu cầu về một tính chất nào đó khác mà một phép kéo theo cần phải có Chỉ có ứng dụng thực tiễn là tiêu chuẩn cuối cùng chứng minh tính phù hợp của một định nghĩa phép kéo theo mờ
1.2 Lý thuyết về Đại số gia tử ([1-3])
1.2.1 Những khái niệm cơ bản về đại số gia tử
Phương pháp lập luận tính toán nhằm giải quyết vấn đề mô phỏng tư duy, lập luận của con người chính là việc chúng ta mượn cấu trúc tính toán rất phong phú của tập tất cả các hàm F(U,[0,1]) để mô phỏng các cách lập luận của con người mà chúng ta thường được thực hiện trên nền ngôn ngữ tự nhiên Tuy nhiên, các tác giả đã chỉ ra rằng tập các giá trị ngôn ngữ của một biến ngôn ngữ sẽ là một cấu trúc đại số đủ giàu để tính toán và
Trang 21nghiên cứu các phương pháp lập luận Như vậy thay vì mượn cấu trúc của F(U,[0,1]), chúng ta có một khả năng lựa chọn khác là sử dụng cấu trúc đại số của chính các tập các giá trị ngôn ngữ
Đại số gia tử (ĐSGT) được ra đời do đề xuất của N.C Ho và W Wechler vào năm 1990, đến nay đã có nhiều nghiên cứu phát triển và ứng dụng thành công
Các tác giả đã chứng minh miền ngôn ngữ X = Dom(X) của một
biến ngôn ngữ X có thể được tiên đề hóa và được gọi là đại số gia tử
và được ký hiệu là AX = (X, G, H, ≤) trong đó G là tập các phần tử sinh, H là tập các gia tử (hedge) còn “≤” là quan hệ cảm sinh ngữ nghĩa trên X Giả thiết trong G có chứa các phần tử hằng 0, 1, W với ý
nghĩa là phần tử bé nhất, phần tử lớn nhất và phần tử trung hòa (neutral) trong
X Ta gọi mỗi giá trị ngôn ngữ x ∈ X là một hạng từ (term) trong ĐSGT
Nếu tập X và H là các tập sắp thứ tự tuyến tính, khi đó AX = (X, G, H,
≤) là ĐSGT tuyến tính Hơn nữa, nếu được trang bị thêm hai gia tử tới hạn là
∑ và Φ với ngữ nghĩa là cận trên đúng và cận dưới đúng của tập H(x) khi tác động lên x, thì ta được ĐSGT truyến tính đầy đủ, ký hiệu AX = (X, G, H, ∑,
Φ, ≤) Vì trong luận án chỉ quan tâm đến ĐSGT tuyến tính, kể từ đây nói
ĐSGT cũng có nghĩa là ĐSGT tuyến tính
Khi tác động gia tử h ∈ H vào phần tử x ∈ X, thì thu được phần tử ký
hiệu hx
Với mỗi x ∈ X, ký hiệu H(x) là tập tất cả các hạng từ u ∈ X sinh từ x
bằng cách áp dụng các gia tử trong H và viết u = h n …h 1 x, với h, …, h 1∈ H
Tập H gồm các gia tử dương H + và gia tử âm H - Các gia tử dương làm tăng ngữ nghĩa của một hạng từ mà nó tác động, còn gia tử âm làm giảm ngữ
Trang 22nghĩa của hạng từ Không mất tính tổng quát, ta luôn giả thiết rằng
H - = {h -1 < h -2 < < h -q } và H + = {h 1 < h 2 < < h p }
Để ý rằng biểu thức h n h 1 u được gọi là một biểu diễn chính tắc của
một hạng từ x đối với u nếu x = h n h 1 u và h i h 1 u ≠ h i-1 h 1 u với i nguyên và
i ≤ n Ta gọi độ dài của một hạng từ x là số gia tử trong biểu diễn chính tắc
của nó đối với phần tử sinh cộng thêm 1, ký hiệu l(x)
Ví dụ 1.2 Cho biến ngôn ngữ TRUTH, có G = {0, FALSE, W, TRUE,
1}, H - = { Possible < Little } và H + = { More < Very } Khi đó
TRUE < More TRUE < Very TRUE, Little TRUE < TRUE,
Bây giờ chúng ta xét một số tính chất của đại số gia tử tuyến tính Định
lý sau cho thấy tính thứ tự ngữ nghĩa của các hạng từ trong ĐSGT
Định lý 1.1 Cho tập H - và H + là các tập sắp thứ tự tuyến tính của
ĐSGT AX = (X, G, H, ≤) Khi đó ta có các khẳng định sau:
(1) Với mỗi u ∈ X thì H(u) là tập sắp thứ tự tuyến tính
(2) Nếu X được sinh từ G bởi các gia tử và G là tập sắp thứ tự tuyến
tính thì X cũng là tập sắp thứ tự tuyến tính Hơn nữa nếu u < v, và u, v là độc
lập với nhau, tức là u H(v) và v H(u), thì H(u) ≤ H(v)
Định lý tiếp theo xem xét sự so sánh của hai hạng từ trong miền ngôn
ngữ của biến x
Định lý 1.2 Cho x = h n …h 1 u và y = k m …k 1 u là hai biểu diễn chính
tắc của x và y đối với u Khi đó tồn tại chỉ số j ≤ min{n, m} + 1 sao cho
h j’ = k j’ với mọi j' < j (ở đây nếu j = min {n, m} + 1 thì hoặc h j là toán tử đơn
vị I, h j = I, j = n + 1 ≤ m hoặc k j = I, j = m + 1 ≤ n) và
(1) x < y khi và chỉ khi h j x j < k j x j , trong đó x j = h j-1 h 1 u
(2) x = y khi và chỉ khi m = n và h j x j = k j x j
(3) x và y là không so sánh được với nhau khi và chỉ khi h j x j và k j x j là
không so sánh được với nhau
Trang 23Trong phần tiếp theo, chúng ta trình bày một số vần đề của đại số gia tử làm cơ sở cho việc nghiên cứu và phát triển một số mô hình lập luận
và ứng dụng về sau
1.2.2 Vấn đề định lượng ngữ nghĩa trong đại số gia tử
Trong phần này chúng ta xem xét ba vấn đề cơ bản đó là độ đo tính mờ của các giá trị ngôn ngữ (hạng từ), phương pháp định lượng ngữ nghĩa và khoảng tính mờ của các khái niệm mờ
Tính mờ của các giá trị ngôn ngữ xuất phát từ thực tế rằng một giá trị ngôn ngữ mang ý nghĩa mô tả cho nhiều sự vật và hiện tượng trong thế giới thực, với lý do tập hữu hạn các giá trị ngôn ngữ không đủ để phản ánh thế giới vô hạn các sự vật hiện tượng Như vậy khái niệm tính mờ và độ
đo tính mờ của một giá trị ngôn ngữ được hình thành và nó là một khái niệm rất khó xác định, đặc biệt trong lý thuyết tập mờ Tuy nhiên, trong ĐSGT các tác giả đã cho thấy độ đo tính mờ được xác định một
cách hợp lý: “tính mờ của một hạng từ x được hiểu như là ngữ nghĩa của nó
vẫn có thể được thay đổi khi tác động vào nó bằng các gia tử” Do đó, tập các
hạng từ sinh từ x bằng các gia tử sẽ thể hiện cho tính mờ của x và do đó, H(x)
có thể sử dụng như là một mô hình biểu thị tính mờ của x và kích
thước tập H(x) được xem như độ đo tính mờ của x Ta có định nghĩa sau về
Trang 24(3) ∀x,y ∈ X, h ∈ H,
) (
) ( ) (
) (
y fm
hy fm x
fm
hx fm
= , tỷ số này không phụ thuộc vào
x và y, vì vậy nó được gọi là độ đo tính mờ của các gia tử và được ký hiệu bởi µ(h)
Trong đó, điều kiện (1) thể hiện tính đầy đủ của các phần tử sinh và các gia tử cho việc biểu diễn ngữ nghĩa của miền thực đối với các biến (2) thể hiện tính rõ của các hạng từ và (3) có thể được chấp nhận vì chúng ta đã chấp nhận giả thiết rằng các gia tử là độc lập với ngữ cảnh và, do vậy, khi áp dụng một gia tử h lên các hạng từ thì hiệu quả tác động tương đối làm thay đổi ngữ nghĩa của các hạng từ đó là như nhau Các tính chất của độ đo tính mờ của các hạng từ và gia tử được thể hiện qua mệnh đề sau:
Mệnh đề 1 Với độ đo tính mờ fm và µ đã được định nghĩa trong Định
(5) Cho fm(c - ), fm(c + ) và µ(h) với ∀h∈H, khi đó với x = h n h 1 c ε
Little True
Poss
True
More True
fm(LVTr)
Trang 25Thông thường, ngữ nghĩa của các hạng từ thuần túy mang tính định tính Tuy nhiên, trong nhiều ứng dụng, chúng ta cần giá trị định lượng của các hạng từ này cho việc tính toán và xử lý Theo tiếp cận của tập mờ, việc định lượng hóa các khái niệm mờ được thực hiện qua các phương pháp khử mờ Đối với ĐSGT, giá trị định lượng của các hạng từ được định nghĩa dựa trên cấu trúc thứ tự ngữ nghĩa của miền giá trị của các biến ngôn ngữ, cụ thể là độ
đo tính mờ của các hạng từ và gia tử
Trước hết chúng ta xét định nghĩa về dấu của các hạng từ như sau
Định nghĩa 15 Một hàm dấu Sign: X → {-1,0,1} là một ánh xạ được định nghĩa đệ qui như sau, trong đó h, h' ∈ H và c ∈ {c - , c + }:
(1) Sign(c - ) = -1, Sign(c +) = 1;
(2) Sign(hc) = -Sign(c) nếu h âm đối với c; Sign(hc) = Sign(c)
nếu h dương đối với c;
(3) Sign(h'hx) = -Sign(hx), nếu h'hx ≠ hx và h' âm đối với h;
Sign(h'hx) = Sign(hx), nếu h'hx ≠ hx và h' dương đối với h;
(4) Sign(h'hx) = 0, nếu h'hx = hx
Mệnh đề 2 Với bất kỳ h và x, nếu Sign(hx)=1 thì hx > x; nếu Sign (hx)=-1
thì hx < x và nếu hx = x thì hx = x
Định nghĩa 16 Cho AX là một ĐSGT tuyến tính đầy đủ và fm là một
độ đo tính mờ trên X Ta nói ánh xạ υ : X → [0,1] được cảm sinh bởi độ đo
tính mờ fm nếu được định nghĩa bằng đệ qui như sau:
( υ ) (
j Sign
x j h Sign x
x j h
Trang 26với mọi j, –q ≤ j ≤ p và j ≠ 0, trong đó:
[1 ( ) ( )(β α)]∈{α,β}
2
1)(
) ( h fm x Sign h x h fm x x
h
j Sign
) ( h fm x Sign h x h fm x x
h
j Sign
Một khái niệm rất quan trọng làm cơ sở cho việc nghiên cứu và xây dựng các mô hình ứng dụng về sau đó là khoảng tính mờ (fuzziness
interval) của các khái niệm mờ Trong ĐSGT, dựa trên độ đo tính mờ fm, chúng ta sẽ định nghĩa khoảng tính mờ của các hạng từ Gọi Itv ([0,1]) là họ
các đoạn con của đoạn [0,1], ký hiệu |•| là độ dài của đoạn “•”
Định nghĩa 17 Khoảng tính mờ của các hạng từ x ∈ X, ký hiệu fm (x), là
một đoạn con của [0,1], fm (x) ∈ Itv ([0,1]), nếu nó có độ dài bằng độ đo tính mờ,
| fm (x)| = fm(x), và được xác định bằng qui nạp theo độ dài của x như sau:
(1) Với độ dài của x bằng 1 (l(x)=1), tức là x ∈ {c - , c +}, khi đó:
| fm (c - )| = fm(c -), | fm (c + )| = fm(c +) và fm (c -) ≤ fm (c +);
(2) Giả sử x có độ dài n (l(x)=n) và khoảng tính mờ ffm (x) đã được định
nghĩa với | ffm (x)| = fm(x) Khi đó tập các khoảng tính mờ { fm (h j x): -q ≤ j ≤ p
và j ≠ 0}⊂ Itv([0,1]) được xây dựng sao cho nó là một phân hoạch của fm (x),
và thỏa mãn | fm (h j x)| = fm(h j x) và có thứ tự tuyến tính tương ứng với thứ tự
của tập {h -q x, h -q+1 x, , h p x}, tức là nếu h -q x > h -q+1 x > > h p x thì fm (h -q x) >
Trang 27fm (h -q+1 x) > > fm (h p x) và ngược lại (xem Hình 3) Dễ dàng thấy rằng hệ
phân hoạch như vậy luôn tồn tại dựa vào tính chất (1) trong Mệnh đề 1
Hình 3 : Khoảng tính mờ của các hạng từ của biến TRUTH
Trường hợp độ dài của x bằng k, l(x) = k, ta ký hiệu k (x) thay cho
fm (x), khi đó ta nói khoảng tính mờ của x có độ sâu k (hay khoảng tính mờ
mức k) Để thuận tiện về sau, ta ký hiệu:
khoảng tính mờ đóng một vai trò quan trọng trong việc xem xét quan hệ
tương tự đối với dữ liệu trong miền tham chiếu của các biến Ở đây, ta sử dụng khái niệm tựa phân hoạch tức là phân hoạch mà hai tập bất kỳ của nó
có nhiều nhất một điểm chung
Mệnh đề 3 Cho AX = (X, G, H, ∑, Φ, ≤) là một ĐSGT tuyến tính đầy đủ:
Trang 28(1) Nếu Sign (h p x') = 1, thì ta có (h -q x') ≤ (h -q+1 x′) ≤ ≤ (h -1 x′) ≤ (h 1 x′) ≤ (h 2 x′) ≤ ≤ (h p x′), và nếu Sign(h p x′) = -1, thì ta có (h p x′) ≤ (h p-1 x′) ≤ ≤ (h 1 x′) ≤ (h -1 x′) ≤ (h -2 x′) ≤ ≤ (h -q x′);
(2) Tập I k = { (x): x ∈ X k } là một tựa phân hoạch của đoạn [0,1];
(5) Với x< y và l(x) = l(y), thì (x) ≤ (y) và (x) ≠ (y)
Chứng minh Các tính chất (2) đến (5) đã được chứng minh, ở đây ta
chứng minh (1) Theo Mệnh đề 2, nếu Sign(h p x′) = 1 thì ta có x′ ≤ h p x′ Vì
các gia tử trong H + là so sánh được và H + và H - là đối ngược nhau, nên h -q x′
≤ h -q+1 x′ ≤ ≤ h -1 x′ ≤ x′ ≤ h 1 x′ ≤ h 2 x′ ≤ ≤ h p x′ Từ Định nghĩa 17 của khoảng
tính mờ ta suy ra (h -q x′) ≤ (h -q+1 x′) ≤ ≤ (h -1 x′) ≤ (h 1 x′) ≤ (h 2 x′)
≤ ≤ (h p x′) Chứng minh tương tự với trường hợp Sign(h p x′) = -1
Dễ dàng suy ra từ mệnh đề trên trong trường hợp các khoảng tính mờ
được xét ở dạng nửa đóng, tức là (x) = (lmp( (x)), rmp( (x))], và
khoảng tính mờ của hạng từ bé nhất trong phân hoạch ở dạng đóng thì các tựa phân hoạch trong (2), (3) trở thành các phân hoạch thực sự Trong đó,
lmp và rmp là điểm mút trái và điểm mút phải của khoảng tính mờ
Để ý rằng dựa trên cấu trúc thứ tự của X, phần tử x nằm ở giữa hai tập
{h -i x: -q ≤ i ≤ -1} và {h j x: 1 ≤ j ≤ p}, hơn nữa ta có
∑ i∈[-q,-1 ]| (h i x)| = fm(x) ∑ i∈[-q,-1] µ(h i ) = α.fm(x)= α.| (x)|
Điều này cho thấy điểm cuối chung của hai khoảng tính mờ (h -1 x) và (h 1 x) chính là giá trị định lượng ngữ nghĩa υ(x) của hạng từ x Giá trị này
Trang 29chia đôi khoảng tính mờ (x) theo tỷ lệ α: β nếu Sign(hpx) = 1, hoặc
tỷ lệ β: α nếu Sign(hpx) = -1 (xem (1) của Mệnh đề 3)
Theo Định nghĩa 16 và 17, có một mối liên hệ giữa ánh xạ định lượng ngữ nghĩa và khoảng tính mờ của của hạng từ trong một ĐSGT, được thể hiện bằng định lý sau
Định lý 1.3 Cho AX = (X, G, H, ∑, Φ, ≤) là một ĐSGT tuyến tính đầy
đủ và hàm υ được định nghĩa trong Định nghĩa 1.6 Khi đó υ là một ánh xạ định lượng ngữ nghĩa và tập các giá trị của υ đối với H(x), viết là υ(H(x)), trù mật trong đoạn [υ(Φx), υ(∑x)], ∀x ∈ X Hơn nữa,
υ(Φx) = infimum υ(H(x)), υ(∑x) = supremum υ(H(x)) và
fm(x) = υ(∑x) - υ(Φx),
và như vậy fm(x) = d(υ(H(x))), trong đó d(A) là đường kính của A
⊆[0,1] Kết quả, υ(H(G)) trù mật trong đoạn [0,1]
Định lý này cũng khẳng định rằng ĐSGT AX cùng với hàm định
lượng ngữ nghĩa υ có thể ứng dụng trong mọi quá trình thực
Từ những kết quả trên cho thấy giá trị định lượng ngữ nghĩa υ(x)
của một hạng từ x cũng như khoảng tính mờ (x), ∀x ∈ X, phụ thuộc đầy
đủ vào các tham số mờ gia tử fm(c - ), fm(c + ), µ(h) ∀h ∈ H
Trang 31Chương 2 GIẢI THUẬT DI TRUYỀN 2.1 Những khái niệm cơ bản về giải thuật di truyền
Thế giới mà chúng ta thấy ngày hôm nay, trong đó có rất nhiều loài khác nhau, với sự thích nghi cao theo môi trường sống và sự cân bằng sinh thái, là sản phẩm của 3 tỷ năm tiến hóa, một quá trình dựa trên sự sinh sản hữu tính và vô tính, chọn lọc tự nhiên, đột biến,… Nếu nhìn vào bên trong chúng ta thấy sự phức tạp và khả năng thích nghi của các loài có được bằng việc cải tiến và kết hợp các gen qua một quá trình rất dài Giải thuật di truyền (genetic algorithm – GA), được đề xuất bởi J H Holland (1967), là sự mô phỏng quá trình tiến hóa Tuy nhiên, ở một góc độ khác, giải thuật di truyền chính là phương pháp tối ưu theo xác suất dựa trên nguyên lý tiến hóa Xét ở góc độ GA là một phương pháp tối ưu, khi đó, một bài toán tối ưu được phát biểu tổng quát như sau:
Tìm một x 0 ∈ X sao cho f đạt max tại x 0 , trong đó f : X → R là một hàm thực bất kỳ, tức là : f(x 0 ) = max x∈X f(x)
Thực tế, một số trường hợp việc tối ưu toàn cục là rất khó và đôi khi là không thể theo cách giải quyết toán học thông thường Vì vậy, tùy theo bài
toán mà chúng ta quan tâm đến giá trị của x sao cho hàm mục tiêu f càng cao càng tốt Không gian tìm kiếm X được xem như môi trường (hay còn gọi là
quần thể) bao gồm các cá thể (individuals) cạnh tranh với nhau, trong đó hàm
f ánh xạ mỗi cá thể một độ phù hợp (fitness)
Với việc mô phỏng quá trình tiến hóa, GA duy trì một quần thể các lời giải có thể của bài toán tối ưu và khi thực thi, các lời giải này tiến gần đến lời giải mong muốn Thông thường, các lời giải được mã hóa dưới dạng chuỗi
Trang 32gen theo một cú pháp cho trước và được gán một giá trị độ phù hợp thông qua
hàm f
Định nghĩa Giả sử S là tập các chuỗi dưới dạng không tầm thường và
có cú pháp Đặt X là không gian tìm kiếm của bài toán tối ưu, khi đó hàm
được gọi là hàm giải mã
Như vậy, thông qua mã hóa, mỗi phương án trong X thành một cá thể trong S, chúng ta tìm một s 0 ∈ S sao cho f = f 0c càng lớn càng tốt
Hình 4: Mã hóa cá thể từ không gian các lời giải của bài toán
c
Trang 33Thuật toán : Cấu trúc cơ sở của một giải thuật di truyền
Theo thuật toán, mỗi lần tiến hóa là việc chuyển từ một thế hệ này sang
một thế hệ khác, với hy vọng tốt hơn dựa trên hàm đánh giá f Quá trình này
bao gồm 4 phép cơ bản (gọi là toán tử gen) sau:
Chọn lọc: Kỹ thuật chọn lọc các cá thể trong quần thể hiện tại làm bố
mẹ để lai ghép tạo ra các cá thể con, dựa trên hàm đánh giá độ phù hợp f
Lai ghép: Phương pháp trộn thông tin gen của hai cá thể bố mẹ, với mã
hóa được chọn phù hợp, hai cá thể bố mẹ tốt sẽ sinh ra hai cá thể con tốt
Đột biến: Trong tiến hóa tự nhiên, các gen bị thay đổi một cách ngẫu
nhiên làm cho biến dạng, dưới tác động của bức xạ gama chẳng hạn Trong
GA, phép đột biến được tự nhiên hóa theo cách biến dạng ngẫu nhiên chuỗi gen với một xác suất cho trước Tác dụng tích cực của đột biến là đảm bảo được tính đa dạng của của gen và tránh khỏi tối ưu địa phương
Tái tạo: Tạo ra một thế hệ mới gồm những cá thể tốt hơn từ các cá thể
bố mẹ và con sau khi đã đột biến
Bước 1) Đặt t = 0 và tính toán quần thể xuất phát B 0
Bước 2) Kiểm tra điều kiện dừng theo hàm đánh giá fitness f, nếu chưa
thỏa mãn sang bước tiếp theo, ngược lại dừng thuật toán
Bước 3) Chọn lọn (selection) các cá thể trong B t làm bố mẹ (parent) để lai ghép
Bước 4) Thực hiện lai ghép (crossover) các cá thể bố mẹ tạo thành các
cá thể con (offspring)
Bước 5) Đột biến (mutation) trên các cá thể con
Bước 6) Tái tạo (reproduction) từ các cá thể con và bố mẹ tạo ra quần
thể mới
Bước 7) Tăng chỉ số thế hệ t lên 1, và lặp lại bước 2
Trang 34Nằm trong lớp các bài toán tối ưu, giải thuật di truyền có những khác biệt cơ bản, so với các phương pháp truyền thống như phương pháp Niu-tơn hoặc giảm gradient, như sau:
- GA thao tác trên các chuỗi gen đã được mã hóa từ các lời giải, tức là
tìm kiếm trên không gian S thay cho X
- Trong khi hầu hết các phương pháp truyền thống tìm kiếm theo đơn điểm, GA luôn luôn thực hiện trên một lượng lớn các điểm (hay cá thể) gọi là quần thể Điều này sẽ làm tăng cơ hội đạt đến tối ưu toàn cục, và ngược lại, làm giảm độ rủi ro rơi vào một điểm tối ưu cục bộ
- Các giải thuật di truyền thông thường không sử dụng bất kỳ thông tin
bổ trợ nào từ hàm mục tiêu, như giá trị đạo hàm chẳng hạn Vì vậy, nó có thể được ứng dụng cho mọi bài toán tối ưu kể cả liên tục hoặc rời rạc
- GA sử dụng các phép toán gen dựa trên xác suất, khác với phương pháp truyền thống dựa trên các phép dịch chuyển tất định Và như vậy, cách tạo ra một thế hệ mới có chứa những ngẫu nhiên
2.2 Các tính chất đặc thù của thuật giải di truyền
1 GA lập luận mang tính chất ngẫu nhiên (stochastic), thay vì xác định
(deterministic) như toán học giải tích
2 GA duyệt xét toàn bộ các giải pháp, sau đó chọn lấy giải pháp tương đối tốt nhất dựa trên hệ số thích nghi
3 GA không để ý đến chi tiết vấn đề, trái lại chỉ chú ý đến giải pháp đặc biệt là dãy số tượng trưng cho giải pháp
4 GA rất thích hợp cho việc tìm kiếm giải pháp cho vấn đề hay tìm điều kiện tối ưu cho việc điều hành, và phân nhóm những giải pháp có được
Trang 352.3 Các bước quan trọng trong việc áp dụng giải thuật di truyền
Để giải quyết vấn đề bằng thuật giải di truyền chúng ta cần thực hiện các bước sau:
Bước 1: Chọn mô hình cho giải pháp của vấn đề: Chọn một số tượng
trơng cho toàn bộ các giải pháp có thể có cho vấn đề
Bước 2: Chỉ định cho mỗi giải pháp một ký hiệu Ký hiệu có thể là dãy
của những số 1 và 0 thuộc hệ nhị phân hay dãy số thập phân, dãy của chữ hay dãy hỗn hợp của số và chữ Trong giai đoạn mới làm quen với GA, chỉ nên dùng hệ nhị phân để làm ký hiệu cho giải pháp
Bước 3: Tìm hàm số thích nghi cho vần đề và tính hệ số thích nghi cho
từng giải pháp
Bước 4: Dựa trên hệ số thích nghi của các giải pháp để thực hiện sự tạo
sinh (reproduction) và biến hoá các giải pháp Các phương thức biến hoá gồm: lai ghép (cross over), đột biến (mutation)
Bước 5: Tính các hệ số thích nghi cho các giải pháp mới và loại bỏ
những giải pháp kém nhất để chỉ còn giữ lại một số nhất định các giải pháp
Bước 6: Nếu chưa tìm được giải pháp tối ưu hay tương đối khá nhất
hay chưa hết hạn kỳ ấn định, trở lại bước thứ tư để tìm giải pháp mới
Bước 7: Tìm được giải pháp tối ưu hoặc nếu thời gian cho phép đã
chấm dứt thì báo cáo kết quả tính được
2.4 Các phương thức biến hoá của giải thuật di truyền
Ba phương thức sau dùng để biến hoá:
- Tạo sinh (reproduction)
- Lai ghép (cross over)
- Đột biến (mutation)
a, Tạo sinh: Tạo sinh là dùng những thành phần của thế hệ trước để tạo
thêm thành phần của thế hệ sau Vậy thành phần nào sẽ được chọn cho việc
Trang 36tạo sinh? Cũng giống như trong thiên nhiên, những thành phần nào có hệ số thích nghi lớn hơn sẽ có cơ hội được chọn để thực hiện việc tạo sinh
b, Lai ghép: Các ví dụ dưới đây thể hiện các hình thức của lai ghép: VD1:
Trước khi lai ghép 1001110(A)
0100011(B)
Sau khi lai ghép tại vị trí giữa số thứ 3 và thứ 4, chúng ta sẽ có:
(A) 1001 110 0100 011 (B’) (B) 0100 011 1001 110 (A’)
c, Đột biến: Là việc thay đổi trị số của một số trong dãy số, thí dụ 0
thành 1 hoặc 1 thành 0, cho trường hợp dùng dãy số theo nhị phân So với lai ghép phương thức biến hoá dựa trên đột biến rất ít xảy ra Theo kết quả nghiên cứa của Kenneth De Jong thì tỷ lệ lai ghép trung bìn là 0.6 trong khi tỷ
lệ đột biến là 0.001, phần còn lại 0.399 là tạo sinh
Trang 37Lai ghép dùng lại những tin tức có sẵn trong các thành phần của thế hệ trước và truyền lại cho thế hệ sau; trong khi đó đột biến tạo ra những tin tức hoàn toàn mới
Ví dụ về đột biến:
VD4:
11011 sẽ được biến đổi thành 110010, trong đó số 1 ở hàng cuối (tính
từ trái) đã được đổi thành 0
VD5:
11011 sẽ được biến đổi thành 110010, trong đó số 0 ở hàng thứ tư (tính
từ trái) đã được đổi thành 1
Trang 38Chương 3 XÂY DỰNG HỆ LUẬT MỜ VÀ GIẢI BÀI TOÁN HỒI QUY MỜ THEO
CÁCH TIẾP CẬN CỦA ĐẠI SỐ GIA TỬ 3.1 Bài toán hồi quy mờ
3.1.1 Bài toán hồi quy mờ
Phân tích hồi quy là một bài toán cổ điển đã được nghiên cứu từ lâu Bản chất ban đầu của phân tích hồi quy là một phân tích thống kê để xác định xem các biến độc lập quy định các biến phụ thuộc như thế nào, qua đó căn cứ vào dữ liệu đầu vào dự đoán số liệu đầu ra tương ứng nhằm phục vụ cho các yêu cầu về quản lý, lên kế hoạch
Dạng đơn giản nhất của mô hình hồi quy chứa một biến phụ thuộc Y và một biến độc lập đơn X Ví dụ sự phụ thuộc của huyết áp Y theo tuổi tác X của một người hay sự phụ thuộc của tỉ lệ sinh của dân số Y theo các biện pháp tránh thai được áp dụng X Sự phụ thuộc này được gọi là hồi quy của Y lên X
Có hồi quy tuyến tính, hồi quy lôgic, hồi quy Poisson, học có giám sát , trong đó hồi quy tuyến tính là mô hình được nghiên cứu nhiều vì khá phổ biến trong thực tế Mô hình hồi quy tuyến tính có dạng:
yi = β0+β1xi1+ +βkxik+ ϵi i=1, ,n trong đó yi là các biến phụ thuộc, xik là các biến độc lập, βi là tham số thực và
ϵi là sai số của mô hình, với giả thiết ϵi là biến số theo luật phân bố chuẩn với
kì vọng toán học E(ϵi) = 0 và phương sai σ2
Để xác định các giá trị βi và ϵi, người ta căn cứ vào các số liệu quan sát và giải bài toán tối ưu, cụ thể là cực tiểu hóa sai số giữa số liệu thật và số liệu ước lượng của mô hình Mặc dù đã có những kết quả trong nhiều ứng dụng khác nhau,
mô hình hồi quy cổ điển vẫn còn những tồn tại cần khắc phục Đó là: