Song nhiều khi các mục tiêu cần đạtđược có hàm biểu diễn tương tự nhau mà mục tiêu cần đạt lại ngược nhau.Một cách tổng quát có thể nói không có lời giải tối ưu cho những bài toándạng nà
Trang 1MỞ ĐẦU
Nhiều vấn đề cần giải quyết trong đời sống hàng ngày dẫn đến bài toántối ưu, chẳng hạn như trong sản xuất cần giảm chi phí, tăng giá trị sử dụng,lập lịch sản xuất, Vì vậy, lớp bài toán tối ưu đã được quan tâm nghiên cứu
từ lâu và đã đạt được nhiều kết quả Tuy vậy, các kết quả đạt được chủ yếu làlớp bài toán tối ưu một mục tiêu; đối với lớp bài toán tối ưu đa mục tiêu còngặp nhiều khó khăn
Các bài toán tối ưu đa mục tiêu là những bài toán có ứng dụng thực tiễntrong rất nhiều lĩnh vực của cuộc sống Song nhiều khi các mục tiêu cần đạtđược có hàm biểu diễn tương tự nhau mà mục tiêu cần đạt lại ngược nhau.Một cách tổng quát có thể nói không có lời giải tối ưu cho những bài toándạng này, một cách đơn giản vì các lời giải không so sánh được với nhau Cóthể lời giải này tốt ở mục tiêu này lại kém ở mục tiêu kia Từ đó xuất hiệnkhái niệm “trội” đối với các lời giải và dẫn đến khái niệm “tối ưu Pareto”
Đề tài này hướng tới việc phát triển những kỹ thuật tính toán, chủ yếu
là tính toán tiến hoá và các thuật toán lai trong tối ưu đa mục tiêu và cố gắnggắn nó với các mô hình bài toán cụ thể
Được sự đồng ý của Hội đồng Khoa học trường Đại học Công NghệThông Tin và Truyền Thông – Đại học Thái Nguyên, cùng sự hướng dẫn
của TS Vũ Mạnh Xuân, em chọn đề tài khóa luận “Kết hợp một số
phương pháp Heuristic giải bài toán tối ưu đa mục tiêu” nhằm nghiên
cứu một phương pháp tiếp cận khác để giải bài toán tối ưu đa mục tiêu đó
là kết hợp một số phương pháp như giải thuật di truyền kết hợp với chiếnlược tiến hoá và giải thuật mô phỏng tôi luyện
Mục đích nghiên cứu: tìm hiểu bài toán, một số phương pháp giải bài
toán tối ưu đa mục tiêu, tìm hiểu giải thuật di truyền, chiến lược tiến hoá và
Trang 2giải thuật mô phỏng tôi luyện trên cơ sở đó kết hợp các phương pháp này đểgiải bài toán tối ưu đa mục tiêu
Nội dung của đề tài: gồm 3 chương
1) Chương 1 Tổng quan về bài toán tối ưu đa mục tiêu
2) Chương 2 Tìm hiểu một số phương pháp Heuristic
3) Chương 3 Kết hợp các phương pháp Heuristic giải bài toán tối ưu đa mục tiêu
Để tiến hành nghiên cứu đề tài này, em đã sử dụng phối hợp một sốphương pháp như: phương pháp nghiên cứu tài liệu (nghiên cứu tài liệu về cácgiải thuật di truyền (GA), chiến lược tiến hoá (ES), giải thuật mô phỏng tôiluyện (SA), bài toán tối ưu đa mục tiêu, ngôn ngữ lập trình matlab 7.0);phương pháp lấy ý kiến chuyên gia (giáo viên hướng dẫn, tham khảo trênmạng)
Khi thực hiện đề tài này, bước đầu em đã tìm hiểu được một số phươngpháp giải bài toán tối ưu đa mục tiêu, một số vấn đề về giải thuật di truyền, chiếnlược tiến hoá, giải thuật mô phỏng tôi luyện Kết quả là đã nghiên cứu một kỹthuật kết hợp giữa giải thuật di truyền, chiến lược tiến hoá và giải thuật môphong tôi luyện để giải bài toán tối ưu đa mục tiêu và đã lập trình thử nghiệmtrên một số bài toán cụ thể
Trang 3CHƯƠNG 1 TỔNG QUAN VỀ BÀI TOÁN TỐI ƯU ĐA MỤC TIÊU
Chương này trình bày những nghiên cứu cơ bản về bài toán tối ưu đamục tiêu; những khái niệm cần thiết và điểm qua một số phương pháp giải đãbiết làm cơ sở cho những chương sau
1.1 Bài toán tối ưu đa mục tiêu
Trong nhiều ứng dụng thực tế gắn liền với việc thiết kế và kế hoạchhóa trong các ngành kinh tế - kĩ thuật, điều khiển các hoạt động sản xuất,chúng ta thường gặp những bài toán liên quan đến việc phân tích, lựa chọnphương án tốt nhất thoả mãn nhiều mục tiêu khác nhau Đó là bài toán tối
ưu đa mục tiêu Có thể mô tả mô hình toán học của bài toán đa mục tiêu là:
Có k hàm mục tiêu ký hiệu là Y1, Y2, …, Yk với Yi : D R là nhữnghàm; mỗi X = (x1, …, xn) D (D Rn) gọi là một phương án; D gọi là tậpcác phương án chấp nhận được; Vấn đề đặt ra là phải tìm được một X0 làmtối ưu hoá (cực đại hoặc cực tiểu) đồng thời các giá trị hàm Y1, Y2, …, Yk.Nếu tìm được X0 như vậy thì X0 gọi là phương án tối ưu Song khả năngtồn tại X0 như vậy là rất hiếm vì các hàm mục tiêu Yi thường không hoàntoàn độc lập với nhau Chính vì vậy việc nghiên cứu lớp bài toán tối ưu đamục tiêu là rất kho khăn mặc dù có ý nghĩa thực tiễn cao
Y( ) ( 1( ), , ( )) gọi là vectơ mục tiêu
x gọi là phương án (vectơ quyết định)
D gọi là tập các phương án.
k
Y
Y , ,1 gọi là các hàm mục tiêu
Trang 4Các bài toán tối ưu đa mục tiêu thường có nhiều hàm mục tiêu với cácràng buộc khác nhau và các lời giải khác nhau Các lời giải này thường không
so sánh được với nhau Vì vậy người ta đưa ra tập lời giải tối ưu Pareto
Tập nghiệm tối ưu Pareto
Các bài toán tối ưu đa mục tiêu hầu hết đều liên quan đến tập các lờigiải tối ưu Pareto, nó xuất phát từ việc bài toán đa mục tiêu có nhiều hàm mụctiêu với các ràng buộc khác nhau, thậm chí các mục tiêu đôi khi đối lập nhau.Nhiều lời giải không thể so sánh được với nhau, vì có lời giải tốt cho mục tiêunày nhưng lại xấu cho mục tiêu khác Có thể minh hoạ điều này trong bài toáncần cực tiểu tỷ lệ rủi ro và giá trong hình 1.1 sau:
Trong hình trên, với các điểm A và B không thể nói điểm nào tốt hơn,
A có giá trị nhỏ hơn song lại có tỷ lệ rủi ro cao hơn B Các điểm như vậy tạothành tập lời giải tối ưu Pareto Tuy nhiên cũng có những lời giải mà có thể sosánh và chọn được lời giải tốt hơn, chẳng hạn như điểm B tốt hơn so với Ctrong hình trên Như vậy trong tối ưu đa mục tiêu thường tồn tại nhiều lời giảichứ không duy nhất như trường hợp một mục tiêu
Dễ dàng thấy bài toán tìm max có thể chuyển tương ứng về bài toán tìmmin Vì vậy sau đây ta chỉ xét bài toán tìm min
Định nghĩa 1.1
(a) Cho hai phương án quyết định x,y D Khi đó, phương án x được
gọi là trội hơn phương án y ( kí hiệu xp y ), nếu ta có: Y( x ) Y( y ) và
Hình 1.1 Minh hoạ tập Pareto
Trang 5Y( x ) Y( y ) , y còn được gọi là bị trội bởi x Nếu ngược lại, y được gọi là không bị trội bởi x.
(b) Một phương án x Rn được gọi là nghiệm Pareto tối ưu ( hay điểm Pareto) nếu không có y R mà y trội hơn x Tập tất cả các nghiệm n
Pareto tối ưu gọi là tập Pareto tối ưu.
(c) Một phương án x Rn là nghiệm Pareto tối ưu yếu nếu không tồn
tại y R mà n Y( y ) Y( x ) .
Nếu bài toán tối ưu đa mục tiêu có nghiệm được gọi là tối ưu theo mộtcách định nghĩa nào đó thì không phụ thuộc vào cách định nghĩa đã chọn,nghiệm tối ưu đó phải là một phương án Pareto tối ưu (tức là, nghiệm đó phảithuộc tập Pareto tối ưu)
Trên thực tế, việc tìm tập lời giải Pareto của các bài toán tối ưu đa mụctiêu là khó khăn và thường ít thực hiện được Vì vậy, một số chiến lược tìmkiếm ngẫu nhiên (như thuật toán tiến hóa, phương pháp vùng cấm, mô phỏngluyện kim,…) đã được phát triển Măc dù các chiến lược này thường khôngđảm bảo xác định chính xác tập tối ưu Pareto, nhưng đều cố gắng tìm ra mộttập xấp xỉ tốt, tức là 1 tập các phương án mà vectơ mục tiêu không quá xamục tiêu tối ưu Pareto
Trang 6(c) Một tập F*R được gọi là một tập n Pareto nếu F* là một tập
xấp xỉ Pareto và mọi điểm thuộc F* đều là điểm Pareto.
Nói chung việc giải bài toán tối ưu đa mục tiêu thường hướng đến haiđiều sau:
1) Đưa ra được nhiều phương án tối ưu Pareto
2) Các phương án này càng đa dạng và phủ tương đối đều khắc miền Dcàng tốt
Sau đây ta sẽ trình bày một số phương pháp giải bài toán tối ưu đa mụctiêu đã biết
1.3 Một số phương pháp giải
Có nhiều phương pháp để giải bài toán tối ưu đa mục tiêu như: phươngpháp nhượng bộ dần, phương pháp tìm nghiệm có khoảng cách ngắn nhất đếnnghiệm lý tưởng, phương pháp giải theo dãy mục tiêu đã được sắp xếp,phương pháp trọng số, , nhưng trong phạm vi nghiên cứu của đề tài chỉ trìnhbày một số phương pháp giải sau:
1.3.1 Phương pháp nhượng bộ dần
Phương pháp này dẫn đến việc tìm một lời giải thỏa hiệp tốt nhất tức là
tìm nghiệm x* mà theo ý thích của người nhận lời giải thì x D: x* x hoặc x* ~ x.
Thuật toán giải:
Bước 0: Giải k bài toán l mục tiêu riêng rẽ Sau đó lập bảng thưởng phạt
(trong đó x i là phương án tối ưu 0
i
Y là giá trị tối ưu).
Trang 7
Bước 1: Căn cứ vào bảng thưởng phạt và Y 1 0 , người nhận lời giải bắt Y 1
phải nhượng bộ một lượng Y 1 và giải bài toán:
Max Y 2 (x)
x D
Y 1 (x)Y 1 0 - Y 1
Giả sử Y 2 * là giá trị tối ưu của bài toán, chuyển sang bước 2
Bước 2: Người nhận lời giải căn cứ vào Y 2 0 và Y 2 * , bắt Y 2 nhượng bộ 1
lượng Y 2 và giải bài toán:
Max Y 3 (x)
x D
Y 1 (x)Y 1 0 - Y 1
Y 2 (x) Y 2 * - Y 2
Giả sử Y 3 * là giá trị tối ưu của bài toán, chuyển sang bước tiếp theo:
Bước k: Căn cứ vào Y k-1 0 và Y k-1 * , bắt Y k-1 nhượng bộ 1 lượng Y k-1 và giải:
Trang 8Nghiệm cuối cùng của bài toán này lấy làm nghiệm cho bài toán xuất phát.
1.3.2 Phương pháp tìm nghiệm có khoảng cách ngắn nhất đến nghiệm lý tưởng
Ở đây giá trị hàm lợi ích tỉ lệ với khoảng cách từ phương án x D đến
cái gọi là nghiệm lý tưởng Phương án x1 x2 khi và chi khi x 1 gần nghiệm lý
1
2 1
Giả sử Y* là các giá trị tối ưu của từng mục riêng rẽ (Y* i = max Y( x )).
Khi đó giá trị của hàm mục tiêu Y tại x* là : (Y* 1 ,…,Y* k) và khoảng cách từ
một phương án x đến nghiệm lý tưởng xác định bởi:
1
* )
1
* ) ( (1.3)
Trang 9x D (1.4)
Ở đây vấn đề xác định α nói chung phụ thuộc vào các bài toán cụ thể vàcác kết quả về mặt lý thuyết để tìm ra một thuật toán giải bài toán quy hoạch(1.3) và (1.4)
Với trường hợp α=1 việc cực tiểu hoá :
1 1
x D i
i
i x Y x Y
1
2 1
xD (1.6)
Nếu x* là nghiệm của (1.5), (1.6) thì nó là nghiệm thoả hiệp tốt nhất
theo nghĩa x D: x* x hoặc x* ~ x (trường hợp sau xảy ra khi x cũng là
nghiệm tối ưu)
Ở đây 1= Y* 1 - W ta hiểu là nhượng bộ của mục tiêu thứ 1, như thế
quan điểm nhượng bộ ở đây là dựa trên nhượng bộ đồng đều theo tất cả cácchỉ tiêu, phương án X* là trội nhất nếu nhượng bộ “đều ” của nó là nhỏ nhất
Trong trường hợp chung, tập các nghiệm của (1.5), (1.6) là tập các nghiệmthoả hiệp tốt nhất Người ta cũng chứng minh được rằng tập các nghiệm thỏa hiệptốt nhất là một tập con của tập các nghiệm không cải tiến được
Trang 10Zeleny (1974) đã chứng minh: Tập các nghiệm thoả hiệp ứng với dα(1
α ∞) nằm trong khoảng nghiệm ứng với d1 và dα
Còn trong trường hợp α = ∞ Xalucvatde có nêu ra một thuật toán thoảhiệp Ở đây các quan hệ , ~ được dựa trên các metric dα:
1
1 ) (
1
2 ) (
1
1 ) (
1
2 ) (
1.3.3 Phương pháp giải theo dãy mục tiêu đã được sắp xếp
Theo phương án này hàm lợi ích được thể hiện dưới dạng ẩn Còn việc
xác định quan hệ , ~ dựa trên thứ tự dãy tiêu chuẩn <Y 1 …, Y k>
Ở đây thứ tự của dãy thể hiện mức độ quan trọng của dãy tiêu chuẩn, có
sự ưu tiên tuyệt đối cho các mục tiêu đứng trước
Thuật toán:
Bước 0: Sắp xếp thứ tự các mục tiêu Y 1 ,…,Y k
Bước 1: Giải bài toán: max 1
Trang 11Phương pháp có hai biến dạng như sau:
- Các độ lệch tương đối của hàm mục tiêu thì được gắn với một bộ trọng
số tương ứng Trọng số này được xác định dựa trên khoảng biến động củatừng mục tiêu
- Miền chấp nhận được của nó có thể thay đổi qua các bước giải
Hàm “lợi ích” và các quan hệ xác định như phương pháp tìm nghiệm cókhoảng cách nhất đến nghiệm lý tưởng
Bài toán cơ bản mà phương pháp này xét
k I d
x Y
Ta viết d' là metric đã thay đổi
D i là miền chấp nhận được Khi i = 0 thì D 0 D.
Thuật toán giải như sau:
Bước 1: Xây dựng bảng “thưởng phạt” xác định M I và m I (giá trị max
I I I
C
M
m M
1
2
) (
Trang 12Bước 4: Giả sử nghiệm của bài toán I là x(i) Đưa cho người nhận lời
giải nghiệm x(i) Người nhận lời giải phân tích kết quả và xảy ra:
1) Nếu người nhận lời giải (NNLG) chấp nhận x(i) thì thuật toán kết thúc.
2) Nếu NNLG không chấp nhận x(i) và nếu chỉ số i < k-1 thì sang bước 5.
3) Nếu NNLG không thoả mãn x(i) và i = k – 1 thì chọn cách giải khác.
Bước 5 : NNLG phân tích kết quả và tìm ra mục tiêu I* có thể nhượng
bộ NNLG cho một nhượng bộ I* và sang bước 6
Bước 6 : Xác nhận miền chấp nhận mới D (i+1)
| ) (
) ( )
I I
I
I I
i
Y i x Y x Y
I I i
x Y x Y
D X
Thuật toán kết thúc sau không quá k lần lặp
1.3.5 Thuật toán thích nghi ổn định tối ưu hoá vectơ
Bài toán quy hoạch đa mục tiêu được hiểu như là bài toán tối ưu hoávectơ:
) ( ), , (
Y
R D x
k
n
Các Y 1 (x) biểu hiện độ tốt xấu của x theo nghĩa nào đó.
Ta xét bài toán max
Giả thiết x 0 D là vectơ tối ưu đối với người nhận lời giải Yêu cầu
người nhận lời giải ước lượng giá trị mà mình thích nhất: Y 0
v , ( v 1 ,k ) với
điều kiện:
)( 0
Y Y
Trang 13D x
x Y Y
E v v
( ) } min { 0
( { 0
Người ta mở rộng bài toán trên và đưa ra một thuật toán giải nó
Hàm lợi ích trong trường hợp này không thể hiện một cách tường minh
mà người nhận lời giải ngụ ý rằng trên D có một hàm ý thích Còn quan hệ
~
,
được rút ra thông qua việc so sánh các hàm mục tiêu
1.3.6 Phương pháp trọng số.
Xét bài toán (1.1), giả sử các hàm mục tiêu fi có độ quan trọng lần
lượt là w i (i=1 k) Khi đó, bài toán (1.1) có thể chuyển về bài toán một
w=(w 1 , ,w k ) còn được gọi là véc tơ trọng số của các hàm mục tiêu
tương ứng Thông thường, người ta chọn các trọng số w i thoả mãn
1
Vấn đề cốt lõi ở đây là làm thế nào để chọn trọng số cho các hàm mục
Trang 14tiêu Đã có nhiều nhà nghiên cứu phát triển các cách tiếp cận để lựa chọntrọng số, như: Eckenrode (1965), Hobbs (1980), Hwang và Yoon (1981), vàVoogd (1983) Trong đó đều có tư tưởng chung là gắn trọng số dựa theo độquan trọng của mục tiêu Rato và Roy (1989) đã thảo luận về phương phápxác định trọng số dựa trên lý thuyết tập mờ Về sau, có một số nghiên cứu
đã chỉ ra rằng trọng số có thể được lựa chọn một cách ngẫu nhiên (theo xácsuất) trong quá trình tiến hoá Sau đây trình bày về hai cách chọn trọng số
* Chọn trọng số dựa theo độ quan trọng
Với cách này, các trọng số thường được cho trước theo ý đồ củangười quyết định hoặc theo ý kiến chuyên gia Do vây các trọng số là cốđịnh trong suốt quá trình thực hiện và bài toán (2.1) được đưa về bài toán
tối ưu môt mục tiêu
1
) (
*
(cực tiểu W)
Ví dụ: Với bài toán thiết kế hồ chứa nước, theo ý người sử dụng, tổng
giá thành f 1 và dung tích f 3 là quan trọng hơn, có đô quan trọng được cho
cùng là 0.4, còn lượng tổn thất bay hơi f 2 có đô quan trọng được cho là 0.2
Như vây, véc tơ trọng số ở đây là ( = = (0.4,0.2,0.4), các trọng số này là cố
định trong suốt quá trình tiến hóa Khi đó bài toán đã cho chuyển về bài
toán min{0.4 f1 + 0.2f 2 + 0.4f 3}
Trang 15* Trọng số được chọn một cách ngẫu nhiên (theo xác suất)
Các trọng số w i của các hàm mục tiêu tương ứng được chọn một cách
ngẫu nhiên Thường các w i cũng là các trọng số không âm và w i 1 (i
= 1, ,k).
Ở đây quan hệ trội được rút ra thông qua việc so sánh hàm mục tiêu (1.7).
Kết Luận: phần trên giới thiệu những vấn đề tổng quan và một số
phương pháp giải bài toán tối ưu đa mục tiêu
Trang 16Chương 2: MỘT SỐ PHƯƠNG PHÁP HEURISTIC
Chương này giới thiệu những vấn đề khái quát về giải thuật di truyền(GA), chiến lược tiến hoá (ES) và giải thuật mô phỏng tôi luyện (SA) làm cơ
sở cho việc ứng dụng giải bài toán tối ưu đa mục tiêu
2.1 Giải thuật di truyền (GA - Genetic Algorithm)
2.1.1 Khái quát chung
Giải thuật di truyền GA(GENETIC ALGORITHM) do D.E Goldberg
đề xuất, sau đó được L Davis và Z Michalevicz phát triển, đây cũng chính làmột trong các thuật toán tiến hóa Thuật toán tiến hóa là các chương trình máytính có dùng các thuật toán tìm kiếm, tối ưu hóa dựa trên nguyên lý tiến hóa
tự nhiên
Giải thuật di truyền được hình thành dựa trên quan niệm: quá trình tiếnhóa tự nhiên là quá trình hoàn hảo và hợp lý nhất, tự quá trình này đã mangtính tối ưu Quan niệm này là một tiên đề đúng, không chứng minh đượcnhưng phù hợp với thực tế khách quan Tính tối ưu của quá trình tiến hóa thểhiện ở đặc điểm, thế hệ sau bao giờ cũng tốt hơn (phát triển hơn, hoàn thiệnhơn) thế hệ trước Tiến hóa tự nhiên được duy trì nhờ hai quá trình cơ bản làsinh sản và chọn lọc tự nhiên, trong suốt quá trình tiến hóa tự nhiên, các thế
hệ mới luôn được sinh ra để bổ sung thay thế thế hệ cũ Cá thể nào phát triểnhơn, thích ứng hơn với môi trường sẽ tồn tại, cá thể nào không thích ứng đượcvới môi trường sẽ bị đào thải Sự thay đổi của môi trường là động lực thúcđẩy quá trình tiến hóa, ngược lại tiến hóa cũng tác động trở lại góp phần thayđổi môi trường
Giải thuật di truyền (GA-Genetic Algorithms) là giải thuật tìm kiếm,chọn lựa các giải pháp tối ưu để giải quyết các bài toán thực tế khác nhau, dựatrên cơ chế chọn lọc của tự nhiên: từ tập lời giải ban đầu, thông qua nhiềubước tiến hoá, hình thành tập lời giải mới phù hợp hơn, và cuối cùng dẫn đếnlời giải tối ưu toàn cục
Trang 17Trong tự nhiên, mỗi cá thể muốn tồn tại và phát triển phải thích nghivới môi trường, cá thể nào thích nghi hơn thì tồn tại, cá thể nào kém thíchnghi thì bị tiêu diệt Trong mỗi cá thể, các gen liên kết với nhau theo cấu trúcdạng chuỗi, gọi là nhiễm sắc thể (NST) Mỗi NST đặc trưng cho mỗi loài vàquyết định sự sống còn của cá thể đó Do môi trường tự nhiên luôn biến đổinên cấu trúc NST cũng thay đổi để thích nghi với môi trường và thế hệ sauluôn thích nghi hơn thế hệ trước Cấu trúc này có được do sự trao đổi thôngtin có tính ngẫu nhiên với môi trường bên ngoài hoặc giữa các NST với nhau.
2.1.2 Các vấn đề cơ bản của giải thuật di truyền
2.1.2.1 Mã hóa
Việc mô tả di truyền cho lời giải cho bài toán gồm hai phần cơ bản:+ Xây dựng cấu trúc gen cho mỗi lời giải của bài toán để từ mỗi lời giải
ta có thể mã hoá thành một NST (chuỗi các gen)
+ Giải mã các NST để nhận được lời giải
Đây là vấn đề cần giải quyết trước khi giải bài toán với GA Tuỳ thuộcvào nội dung của mỗi bài toán mà ta có cách mã hoá khác nhau
Sau đây là phương pháp mã hoá hay được sử dụng:
Mã hoá dạng chuỗi nhị phân: đây là phương pháp thông dụng và cơ
bản nhất được sử dụng ngay từ bước ban đầu khi nghiên cứu GA Trongphương pháp này mỗi NST là một chuỗi các bit 0 và 1
Mã hoá thứ tự: được sử dụng trong bài toán có sắp xếp thứ tự Ở đây mỗi
NST là một chuỗi các số nguyên thể hiện thứ tự phân bố lời giải của bài toán
Mã hoá theo giá trị: được sử dụng trong các bài toán mà mỗi lời giải là
tập các giá trị (ví dụ tập số thực) Trong phương pháp này, mỗi NST là mộtchuỗi các giá trị có mối quan hệ tương ứng với bài toán
Mã hoá dạng cây: được sử dụng chủ yếu trong các biểu thức toán học,
trong phương pháp mã hoá này mỗi NST là một cây của một nhóm đối tượngnào đó
Trang 18Ví dụ: Biểu thức sau x+(y / 5) được mã hoá thành:
Mã hoá số thực : Mỗi NST được mã hoá là một véc tơ trong không
gian Rm chẳng hạn X = (a1, a2, , am) với các ai R Cách mã hoá này thường
tự nhiên đối với các bài toán tối ưu số và được phát triển rất mạnh trong thời
gian gần đây
2.1.2.2 Tạo lập lời giải ban đầu (khởi tạo quần thể)
Tập lời giải ban đầu thường được khởi tạo ngẫu nhiên từ miền xác địnhcủa các lời giải Cách tạo lập tập lời giải ban đầu phụ thuộc rất nhiều vào cách
2.1.2.4 Các toán tử di truyền
a Toán tử chọn lọc
+
/x
Trang 19Trong quá trình thực hiện của giải thuật di truyền, sau mỗi lần tiến hoá
ta chỉ giữ lại các cá thể có độ phù hợp cao còn các cá thể phù hợp thấp bị loại
bỏ Toán tử chọn lọc thường giữ lại 50% các cá thể phù hợp nhất Tuy nhiênngười ta cũng phát triển nhiều sơ đồ chọn khác nhau nhằm là tăng tính đadạng của quần thể, tránh sự hội tụ sớm
b Toán tử lai ghép là toán tử di truyền cơ bản trong GA, tiến trình lai
ghép như sau :
Bước 1: Tạo ra tập NST để tạo sinh từ quần thể bằng cách chọn ngẫu
nhiên N NST từ M NST (M là kích cỡ quần thể)
Có nhiều cách chọn:
Chọn ngẫu nhiên theo thứ tự: lặp N lần việc tạo ngẫu nhiên ra một số
nguyên i thuộc khoảng [1, M] để chọn NST thứ i
Chọn theo trọng số: tạo trọng số tích luỹ cho M NST theo công thức:
1
1
(với bài toán tìm max)Sau khi có trọng số tích luỹ cho NST, ta lần lượt tạo các xác suất ngẫunhiên r và duyệt từ NST đầu tiên đến khi gặp NST có trọng số tích luỹ lớnhơn r thì chọn nó
Bước 2: Sau khi chọn được N NST, lần lượt lấy ra từng cặp NST để lai
ghép tạo ra hai NST mới Một số dạng toán tử lai ghép hay dùng là :
Lai ghép 1 điểm: chọn ngẫu nhiên một vị trí sau đó hoán vị phần đứng
sau vị trí vừa chọn giữa hai NST cha và mẹ để nhận được hai NST con
Lai ghép hai điểm: chọn ngẫu nhiên hai vị trí trong một NST, sau đó
hoán vị các giá trị đứng giữa hai điểm đã chọn của hai NST cha mẹ để nhậnđược hai NST con
Trang 20Lai ghép mặt nạ: tạo một mặt nạ ngẫu nhiên có số bit bằng chiều dài
của NST Ta sẽ hoán vị các giá trị của hai NST cha và mẹ ở những vị trítương ứng với vị trí bit 1 của mặt nạ
c Toán tử đột biến: Toán tử đột biến được xây dựng để tránh việc nhận
được giá trị tối ưu cục bộ Đột biến gây ra thay đổi ngẫu nhiên trên từng bitcủa NST để tạo ra một NST mới
d Tạo sinh: Chọn các cá thể từ quần thể hiện thời làm quần thể mới
cho lần lặp kế tiếp
2.1.3 Thuật toán di truyền
Giải thuật di truyền giải một bài toán cần có các thành phần sau:
1 Một cấu trúc dữ liệu biểu diễn không gian lời giải của bài toán
2 Cách khởi tạo quần thể ban đầu
3 Hàm định nghĩa độ thích nghi eval(), đóng vai trò môi trường
4 Các phép toán di truyền ( phép lai, phép đột biến, phép tái sinh
Trang 21Đột biến các cá thể trong P(t) theo xác suất p m ; Đánh giá độ phù hợp các cá thể trong tập P(t);
Until (thoả điều kiện dừng);
End;
Giải thích:
Tại lần lặp thứ t, GA xác định một tập hợp các lời giải có thể (các cáthể hay NST) gọi là quần thể P(t) = { xt 1,,x t 2, ,x t n } Mỗi lời giải x t i được đánhgiá nhằm xác định độ phù hợp của nó Sau đó, một tập hợp các lời giải đượchình thành nhờ sự lựa chọn các lời giải phù hợp hơn Một số phần tử của tậphợp này được tái sản xuất thông qua lai ghép và đột biến Từ đó hình thànhquần thể mới P(t+1) với hy vọng chứa các cá thể phù hợp hơn quần thể trướcđó
Toán tử “lai ghép” kết hợp các đặc trưng của hai NST cha và mẹ hình
thành hai NST con tương ứng chẳng hạn bằng cách hoán vị các đoạn thích hợpcủa hai NST cha và mẹ Ví dụ, nếu cặp nhiễm sắc thể cha mẹ được biểu diễndưới dạng hai véc tơ:
(a1, b1, c1, d1, e1 ) và (a2, b2, c2, d2, e2)
thì cặp véc tơ con cháu nhận được sau khi lai ghép có thể là:
(a1, b1, c1, d2, e2) và (a2, b2, c2, d1, e1)
Toán tử “đột biến” thay đổi một hay một số gen của NST được chọn
theo quy tắc thay đổi ngẫu nhiên với xác suất bằng tỷ lệ đột biến
GA kinh điển mã hoá các gen là các chuỗi nhị phân Cách mã hoá này
là phương pháp thông dụng và cơ bản nhất được sử dụng ngay từ bước banđầu khi nghiên cứu GA Trong phương pháp này mỗi NST là một chuỗi cácbit 0 và 1 Ngoài ra GA còn có một số những cách mã hoá khác như mã hoáthứ tự, mã hoá theo giá trị, mã hoá dạng cây Trong phạm vi nghiên cứu của
đề tài này em nghiên cứu phương pháp mã hoá số thực Theo cách mã hoá
Trang 22này, mỗi NST được mã hoá là một véc tơ trong không gian Rm chẳng hạn X
= (a1, a2, , am) với các ai R Cách mã hoá này thường tự nhiên đối với các
bài toán tối ưu số và được phát triển rất mạnh trong thời gian gần đây
2.1.4 Giải thuật di truyền mã hóa số thực (RCGA - Real–Code Genetic Algorithm)
Trong GA mã hoá số thực, mỗi cá thể được biểu diễn như một véc tơthực n chiều: b = (x1 , x2, , xn), xi R
Như vậy một quần thể kích cỡ m là một tập hợp có m véctơ trong Rn
Ta cũng có thể xem một quần thể kích cỡ m như một ma trận thực cấp (mxn),đây là cách mã hoá tự nhiên và thuận tiện trong việc thực hiện các toán tử tiếnhóa Sau đây ta sẽ xem xét cụ thể hơn các toán tử này trong giải thuật ditruyền mã hoá số thực
2.1.4.2 Các toán tử của RCGA
a Toán tử chọn lọc
Trong quá trình thực hiện của giải thuật di truyền, sau mỗi lần tiến hoá
ta chỉ giữ lại các cá thể có độ phù hợp cao còn các cá thể phù hợp thấp bị loại
bỏ Toán tử chọn lọc thường giữ lại 50% các cá thể phù hợp nhất Tuy nhiên
Trang 23người ta cũng phát triển nhiều sơ đồ chọn khác nhau nhằm là tăng tính đadạng của quần thể, tránh sự hội tụ sớm.
Sử dụng bánh xe Roulette
Có nhiều cách để thực hiện toán tử chọn lọc, nói chung đều theo tưtưởng cá thể có độ thích nghi cao hơn thì khả năng được chọn nhiều hơn.Nhưng có lẽ đơn giản và hiệu quả nhất là sử dụng bánh xe Roulette (roulettewheel), mỗi cá thể trong quần thể chiếm một khe có độ rộng tỷ lệ thuận vớigiá trị phù hợp Độ rộng của khe được tính bằng tỷ lệ % giá trị phù hợp củamột cá thể trên tổng giá trị phù hợp toàn quần thể
Gọi f i là độ phù hợp của cá thể thứ i trong quần thể gồm N cá thể khi đó
cá thể i sẽ được chọn với xác suất
N
i i
i i
f
f p
1
Trên vòng tròn Roulette mỗichuỗi trong quần thể chiếm một khe có độ rộng tỷ lệ với độ phù hợp củachuỗi Độ rộng của khe được tính theo tỷ lệ phần trăm độ phù hợp của chuỗivới tổng độ phù hợp của toàn quần thể là 100% Ví dụ với quần thể gồm 4 cáthể cho trong bảng sau chúng ta có vòng tròn Roulette như bảng 2.1
16957664
361
14.449.25.530.9
1697458091170
Các bước tiến hành thủ tục quay Roulette :
- Đánh số các cá thể trong quần thể Tính tổng độ phù hợp của toànquần thể sumfitness, và ứng với mỗi cá thể tính một tổng chạy subtotal bằngtổng độ phù hợp của cá thể đó với độ phù hợp của các cá thể đứng phía trước
Trang 24- Sinh một số ngẫu nhiên r trong khoảng từ 0 đến tổng độ phù hợpsumfitness.
- Cá thể đầu tiên trong quần thể có tổng chạy subtotal lớn hơn hoặcbằng r sẽ được chọn
Ví dụ xét bảng 1.1, với số ngẫu nhiên r = 654 thì chuỗi thứ 2 sẽ đượcchọn
Trên thực tế, người ta thường sử dụng toán tử chọn lọc tỷ lệ được mô tảnhư sau:
b f r
) (
+ Lai số học (Arithmetic Crossover)
Phép lai này chọn một số thực a (0<a<1); các con X' và Y' được tính bởi:
x'i = a*xi + (1-a)*yi ;y'i = a*yi + (1-a)*xi
Trang 25+ Lai ghép Heuristic
Giả sử với cặp bố mẹ (X, Y) đã chọn, trong đó cá thể X có độ thíchnghi (giá trị hàm mục tiêu) tốt hơn cá thể Y thì toán tử này tạo một con duynhất X' từ cặp X, Y bởi:
x'i = *(xi - yi) + xi với 0 < < 1
+ Lai đơn giản
Phép lai này tương tự như lai 1 điểm của GA kinh điển Với một vị trí kchọn ngẫu nhiên (1 < k < n); các cá thể con được sinh ra như sau :
c 1 = (x 1 , , x k , y k+1 , , y n ); c 2 = (y 1 , , y k , x k+1 , , x n );
+ Lai ghép mặt nạ
Phép lai này khởi tạo một véc tơ ngẫu nhiên r = (r1, r2, , rn ) trong đócác ri chỉ là 0 hay 1 Sau đó cá thể con được sinh ra như sau :
c 1 = (z 1 , z 2 , , z n ) trong đó zi = xi nếu ri = 1 và zi = yi nếu ri = 0
Các thể con c2 được tính ngược lại
+ Lai ghép BLX- (Blend Crossover)
Ký hiệu cặp nhiễm sắc thể đã chọn lai ghép là
X = (x1, , xk , xk+1 , , xn ) và Y = (y1, , yk , yk+1 , , yn )Với các ký hiệu cá thể cha mẹ chọn lai ghép như trên, đặt
I = max(xi , yi ) - min(xi , yi ) với mỗi i, Khi đó thành phần thứ i của cá thể con tạo ra là một số ngẫu nhiên chọntrong khoảng [min(xi , yi ) – I* , max(xi , yi ) + I* ]
Parent 2
Parent 1
Hình 2.1 BLX- trường hợp 2 chiều
Trang 26Toán tử BLX- đã được thử nghiệm và chứng minh tính hiệu quả của
nó, giá trị tốt nhất là 0.5
+ Lai ghép SBX (Simulated Binary Crossover)
Toán tử SBX là toán tử lai ghép áp dụng cho giải thuật di truyền mã hóa số thực (RCGA), tạo hai cá thể con từ một cặp cá thể cha mẹ đã chọn SBX được Deb và Agrawal giới thiệu năm 1995 và đã được chọn làm toán tử tạo sinh cơ bản trong nhiều nghiên cứu khác
Giải thuật được trình bày chi tiết như sau:
Giả sử x = (x1, x2 , xn) và y = (y1, y2 , , yn) là hai cá thể cha mẹ đãchọn để tạo sinh Khi đó hai cá thể con c1 = (c1 1, , c 1 n) và c 2 = (c2 1, , c 2 n )được sinh ra theo công thức:
u if u
1 1 1 1
) ) 1 (
* 2
1 (
5 0 )
* 2 (
Bước 1 Chọn ngẫu nhiên số thực u [0, 1]
Bước 2 Tính theo công thức (2.3)
Bước 3 Tính các con c1 và c2 theo công thức (2.1) và (2.2)
Lưu ý là có thể tính các thành phần của cá thể con với cùng một giá trị
hoặc với mỗi i, tính ứng với thành phần thứ i một cách độc lập
Từ các công thức (2.1) và (2.2), ta thấy ngay khoảng cách mỗi thànhphần của các cá thể con sinh ra tỷ lệ với khoảng cách tương ứng của cha mẹchúng Thật vậy trừ theo từng vế (2.1) và (2.2) ta được:
Trang 27c1 i – c 2 i = *(xi – yi)Kết quả này rất quan trọng vì ở đây chúng ta quan tâm đến việc cá thểcon sinh ra gần hay xa nhau nhằm đảm bảo tính đa dạng của quần thể Giá trị
ở đây được tính theo tham số điều khiển , ví dụ với = 2 thì khoảng 99%
tỷ lệ [0.215,4.64] Chẳng hạn với cặp cha mẹ là x=2 và y=5, với =5 thì cócon là 1.464, còn với =2 thì có con là 1.911 so với một cha mẹ là x=2 (vớicùng một số ngẫu nhiên u)
Như vậy toán tử SBX có hai tính chất quan trọng:
i) Phạm vi các cá thể con sinh ra tỷ lệ với cha mẹ chúng theo hệ số .ii) Các con gần với cha mẹ có khuynh hướng được chọn nhiều hơn cáccon ở xa cha mẹ
Việc điều chỉnh tham số khoảng cách này làm cho giải thuật mềm dẻo,tăng tính đa dạng của quần thể và tỏ ra hiệu quả hơn các giải thuật kinh điểntrong hầu hết các thử nghiệm Hơn nữa, khi đưa các dạng khác nhau của toán
tử về cùng một biểu thức toán học sẽ làm cho việc phân tích cũng như thiết kếchương trình thuận lợi và dễ dàng
,
(x1 x2 x N
b , thành phần x i được thay thế bởi một số ngẫu nhiên trongkhoảng xác định l , i u i của x i
Đột biến biên: Từ cá thể cha đã chọn đột biến x và vị trí chọn đột biến
k, thành phần thứ k (xk) của x được thay bởi lk hay uk trong đó [lk , uk] làkhoảng xác định của xk Trong những bài toán mà biên của các biến khônglớn và giải pháp cần tìm nằm gần biên thì phép đột biến này tỏ ra rất hữu ích
Trang 28Đột biến không đều:
Giả sử tmax là một số cực đại định nghĩa trước, thành phần xi được thaythế bởi một trong 2 giá trị tính theo các công thức sau :
x’i = xi + (t, bi – xi) x”i = xi - (t, xi – ai)Việc chọn giá trị nào được tiến hành tuỳ theo giá trị ngẫu nhiên khởitạo với xác suất 1/2 Biến ngẫu nhiên (t, x) xác định một bước đột biếntrong khoảng [0, x] theo công thức sau :
)(1 max)
1 (
) ,
Trong công thức này, thường là số ngẫu nhiên phân bố đều trongkhoảng đơn vị Tham số xác định ảnh hưởng của lần tạo sinh thứ t trên phân
bố của đột biến trong miền [0, x]
2.2 Chiến lược tiến hoá (ES - Evolution Strategies)
2.2.1 Khái quát chung
Chiến lược tiến hóa là một phát triển của thuật toán di truyền cổ điểncòn có tên gọi là phương pháp tính toán tiến hóa
Chiến lược tiến hóa (ES) được phát triển tại trường đại học Kỹ ThuậtBerlin vào những năm 1960 và 1970 bởi Ingo Rechenberg (Rechenberg1973) Hans Peter Schwefel (Schwefel 1981), giới thiệu sự lai ghép và nhữngquần thể với nhiều hơn một cá thể, và cung cấp được sự so sánh của ESs với
kỹ thuật tối ưu hóa truyền thống hơn
Trong khoa học máy tính, chiến lược tiến hóa (ES) là một kỹ thuật tối
ưu hóa dựa trên những ý tưởng của sự thích nghi và tiến hóa
Chiến lược tiến hóa là một lớp con của việc tìm kiếm trực tiếp rất tựnhiên (và tối ưu), là những phương thức thuộc vào lớp của những thuật toántiến hóa (EAs) Nó sử dụng sự đột biến, sự lai ghép, và sự lựa chọn thích ứngtới một quần thể của những cá thể chứa những giải pháp được đề xuất theotrình tự để tiến hóa lặp lại tốt hơn và những giải pháp tốt hơn