SVTH : CH1301074 – Nguyễn Hải Yến 2 Thuật toán & PP giải quyết vấn đề PGS.TS Đỗ Văn Nhơn MỤC LỤC LỜI NÓI ĐẦU 2 Chương 1 4 TÌM HIỂU VỀ HUERISTIC VÀ META HUERISTIC TRONG GIẢI QUYẾT VẤN
Trang 1Thuật toán & PP giải quyết vấn đề PGS.TS Đỗ Văn Nhơn
LỜI NÓI ĐẦU
Bài toán tìm kiếm được xem là bài toán được nhiều người quan tâm, đặc
biệt là tìm kiếm tối ưu toàn cục Có nhiều phương pháp để giải các bài toán tìm kiếm tối ưu toàn cục như : phương pháp trực tiếp (áp dụng các công thức, định lý, thuật giải đã có sẵn ), các phương pháp gián tiếp hoặc tìm kiếm lời giải thông dụng (phương pháp thử sai, phương pháp vét cạn, phương pháp quay lui) Ngoài các phương pháp nêu trên thì trong học phần “ Thuật toán và phương pháp giải quyết vấn đề em còn được tiếp cận với các phương pháp hueristic và meta hueristic
Và sau đây là bài thu hoạch của em : “Tìm hiểu về hueristic -
metahueristic - Giải pháp hueristic theo nguyên lý tham lam giải bài toán người đưa thư ”
Em xin gửi lời cảm ơn chân thành đến trường Đại học Công Nghệ Thông
Tin TP.HCM đã tạo điều kiện cho em được tiếp cận với môn học “Thuật toán và phương pháp giải quyết vấn đề ”
Em xin cảm ơn Thầy PGS.TS Đỗ Văn Nhơn đã tận tình truyền đạt kiến
thức và có những định hướng giúp em hoàn thành bài thu hoạch
Mặc dù đã rất cố gắng nhưng bài thu hoạch của em khó tránh khỏi thiếu
sót em mong Thầy góp ý nhận xét để bài thu hoạch hoàn thiện hơn
SVTH : CH1301074 – Nguyễn Hải Yến 2
Thuật toán & PP giải quyết vấn đề PGS.TS Đỗ Văn Nhơn
MỤC LỤC
LỜI NÓI ĐẦU 2
Chương 1 4
TÌM HIỂU VỀ HUERISTIC VÀ META HUERISTIC TRONG GIẢI
QUYẾT VẤN ĐỀ NP 4
Xác suất lai ghép cho biết tính thường xuyên của việc lai ghép tạo ra thế hệ mới được thực hiện như thế nào Nếu xác suất lai ghép là pc , khi đó khả năng để một cá thể được lai ghép là pc Nếu không thực hiện lai ghép, con sinh ra sẽ giống hoàn toàn bố mẹ Nếu được lai ghép, con sinh ra sẽ có một phần giống bố và một phần giống mẹ 15
Xác suất đột biến cho biết tính thường xuyên của việc các gen của NST thay đổi như thế nào Nếu xác suất đột biến là pm, khi đó khả năng để mỗi gen của một NST bất kỳ bị đột biến là pm Tác dụng của toán tử đột biến là ngăn ngừa giải thuật di truyền rơi vào tình trạng cực trị địa phương, tuy nhiên nếu thực hiện đột biến với xác suất quá cao sẽ biến giải thuật di truyền thành giải thuật tìm kiếm ngẫu nhiên 15 LocalSearch() là hàm tìm kiếm địa phương, giúp tìm ra tối ưu cục bộ 22
22
Sơ đồ thuật toán bầy kiến 22
Chương 2: 23
ỨNG DỤNG HUERISTIC GIẢI QUYẾT BÀI TOÁN NGƯỜI ĐƯA THƯ .23 TÀI LIỆU THAM KHẢO 32
SVTH : CH1301074 – Nguyễn Hải Yến 3
Trang 2Thuật toán & PP giải quyết vấn đề PGS.TS Đỗ Văn Nhơn
Chương 1
TÌM HIỂU VỀ HUERISTIC VÀ META
HUERISTIC TRONG GIẢI QUYẾT VẤN ĐỀ
NP
1.1 Khái niệm về lớp bài toán P và NP
1.1.1 Khái niệm các loại thời gian tính
• Thời gian tính tốt nhất: là thời gian tính tối thiểu cần thiết để thực hiện
thuật toán với mọi bộ dữ liệu đầu vào kích thước n
• Thời gian tính tồi nhất: là thời gian tính tối đa cần thiết để thực hiện thuật
toán với mọi bộ dữ liệu đầu vào có kích thước n
• Thời gian tính trung bình: là thời gian tính cần thiết để thực hiện thuật toán trên một tập hữu hạn các bộ dữ liệu đầu vào có kích thước n Thời gian tính
trung bình được tính theo công thức sau:
• Thời gian tính trung bình=(Tổng thời gian tính tất cả các bộ dữ liệu có thể)/
Số bộ dữ liệu
Định nghĩa: Bài toán quyết định là bài toán mà đầu ra chỉ có thể là ‘yes’ hoặc
‘no’(đúng/sai, 0/1)
Đối với một bài toán quyết định, có những bộ dữ liệu vào cho ra câu trả lời(đầu ra)
là ‘yes’, chúng ta gọi đây là bộ dữ liệu ‘yes’, nhưng cũng có những bộ dữ liệu vào cho ra câu trả lời là ‘no’, chúng ta gọi những bộ dữ liệu này là bộ dữ liệu ‘no’ 1.1.2 Bằng chứng ngắn gọn dễ kiểm tra
Rất nhiều các bài toán quyết định có một đặc điểm chung, đó là để xác
nhận câu trả lời ‘yes’ đối với bộ dữ liệu vào ‘yes’ của chúng, chúng ta có thể đưa
ra bằng chứng ngắn gọn dễ kiểm tra xác nhận câu trả lời ‘yes’ cho bộ dữ liệu vào
‘yes’ đó Tính ngắn gọn dễ kiểm tra ám chỉ việc thời gian kiểm tra để đưa ra kết SVTH : CH1301074 – Nguyễn Hải Yến 4
Thuật toán & PP giải quyết vấn đề PGS.TS Đỗ Văn Nhơn
quả chỉ mất thời gian đa thức Ví dụ về những bài toán quyết định kiểu này rất nhiều, sau đây là một số ví dụ:
• Bài toán kiểm tra tính hợp số: “Có phải số n là hợp số?”, để xác nhận câu
trả lời ‘yes’ cho đầu vào n, chúng ta có thể đưa ra một ước số b (1<b<n)
của n Để kiểm tra xem b có phải là ước số của n chúng ta có thể thực hiện
phép chia n cho b sau thời gian đa thức Trong ví dụ này , b là bằng chứng
ngắn gọn (vì b<n) và dễ kiểm tra (có thuật toán đa thức để kiểm tra b đúng
là ước số của n không)
• Đối với bài toán Hamilton, để xác nhận câu trả lời là ‘yes’ cho đồ thị đã
cho G, chúng ta có thể đưa ra một chu trình Hamilton của đồ thị:
v
1
, v
2
, v
3
Trang 3v
n
, v
1
Việc kiểm tra dãy đỉnh nói trên có là chu trình Hamilton của đồ thị đã cho
hay không có thể thực hiện sau thời gian đa thức Khi đó chúng ta nói dãy
đỉnh nói trên là bằng chứng ngắn gọn dễ kiểm tra để xác nhận câu trả lời
‘yes’ của bài toán Hamilton
Một cách tương tự, có thể đưa ra khái niệm bằng chứng ngắn gọn dễ kiểm
tra để xác nhận câu trả lời ‘no’ Đối với một số bài toán, việc đưa ra bằng chứng ngắn gọn dễ kiểm tra để xác nhận câu trả lời ‘no’ là dễ hơn so với việc đưa ra bằng chứng ngắn gọn xác định câu trả lời là ‘yes’
1.1.3 Khái niệm quy dẫn
Định nghĩa Giả sử chúng ta có hai bài toán quyết định A và B Chúng ta nói A
có thể quy dẫn về B nếu như sau một thời gian tính đa thức nếu tồn tại một thuật toán thời gian đa thức R cho phép biến đổi bộ dữ liệu x của A thành bộ dữ liệu vào R(x) của B sao cho x là bộ dữ liệu yes của A khi và chỉ khi R(x) là dữ liệu vào yes của B
Nếu A quy dẫn về được B sau thời gian đa thức và B có thể giải được sau thời gian
đa thức thì A cũng có thể giải được sau thời gian đa thức
SVTH : CH1301074 – Nguyễn Hải Yến 5
Thuật toán & PP giải quyết vấn đề PGS.TS Đỗ Văn Nhơn
1.1.4 Lớp bài toán P
Định nghĩa Chúng ta gọi P là lớp các bài toán có thể giải được trong thời gian
đa thức
Ví dụ: Bài toán cây khung nhỏ nhất giải được nhờ thuật toán Prim với thời gian 0(n
2
) thuộc lớp bài toán P
1.1.5 Lớp bài toán NP
Định nghĩa Ta gọi NP là lớp các bài toán quyết định mà để xác nhận câu trả lời
‘yes’ của nó ta có thể đưa ra bằng chứng ngắn gọn dễ kiểm tra
Ví dụ: Bài toán kiểm tra tính hợp số: “Có phải n là hợp số không?”, để xác nhận câu trả lời ‘yes’ cho đầu vào n ta có thể đưa ra một ước số b (1< b < n) của n Để kiểm tra xem b có phải là ước số của n hay không ta có thể thực hiện phép chia n cho b sau thời gian đa thức Trong ví dụ này dễ thấy b là bằng chứng ngắn gọn (b<n) và dễ kiểm tra (có thuật toán thời gian tính đa thức để kiểm tra xem b có là ước số của n)
1.1.6 Lớp bài toán Co- NP
Định nghĩa Ta gọi Co-NP là lớp các bài toán quyết định mà để xác nhận câu trả lời ‘no’ của nó ta có thể đưa ra bằng chứng ngắn gọn dễ kiểm tra
Ví dụ: Bài toán kiểm tra tính nguyên tố: “Có phải n là số nguyên tố không?”, để đưa ra bằng chứng ngắn gọn dễ kiểm tra xác nhận câu trả lời ‘no’ cho đầu vào n ta
có thể đưa ra một ước số b của n
1.1.7 Lớp bài toán NP- đầy đủ (NP- complete)
Trang 4Định nghĩa Một bài toán quyết định A được gọi là NP-đầy đủ (NP-Complete) nếu như:
• A là một bài toán trong NP
• Mọi bài toán trong NP đều có thể quy dẫn về A
Bổ đề Giả sử bài toán A là NP-đầy đủ, bài toán B thuộc NP, và bài toán A qui dẫn được về bài toán B Khi đó bài toán B cũng là NP-đầy đủ
SVTH : CH1301074 – Nguyễn Hải Yến 6
Thuật toán & PP giải quyết vấn đề PGS.TS Đỗ Văn Nhơn
1.1.8 Lớp bài toán NP-khó (NP- Hard)
Một cách ngắn gọn có thể hiểu bài toán NP-khó là bài toán mà không có
thuật toán thời gian tính đa thức để giải nó trừ khi P = NP, mà chỉ có các thuật toán giải trong thời gian hàm mũ Sau đây là định nghĩa chính thức của bài toán NP-khó
Định nghĩa Một bài toán A được gọi là NP- khó (NP-hard) nếu như sự tồn tại thuật toán đa thức để giải nó kéo theo sự tồn tại thuật toán đa thức để giải mọi bài toán trong NP
Một số bài toán NP-khó tiêu biểu như:
Bài toán bè cực đại (MaxClique): Cho một đồ thị vô hướng G = (V, E) V là tập các đỉnh, E là tập các cạnh tương ứng các đỉnh trong V Cần tìm bè lớn nhất của G
Bè là tập các đỉnh trong đồ thị mà đôi một có cạnh nốivới nhau (là một đồ thị con đầy đủ trong đồ thị G)
Bài toán tập độc lập (Independent set): Cho đồ thị vô hướng G = (V, E) và số nguyên K, hỏi có thể tìm được tập độc lập S với |S| ≥ K Tập độc lập là tập các đỉnh trong đồ thị mà chúng đôi một không có cạnh nối với nhau
Bài toán phủ đỉnh (Vertex cover): Ta gọi một phủ đỉnh của đồ thị vô hướng G = (V, E) là một tập con các đỉnh của đồ thị S
⊆
V sao cho mỗi cạnh của đồ thị có ít
nhất một đầu mút trong S Bài toán đặt ra là: Cho đồ thị vô hướng G = (V, E) và số nguyên k Hỏi G có phủ đỉnh với kích thước k hay không?
Một cách không hình thức, có thể nói rằng nếu ta có thể giải được một
cách hiệu quả một bài toán NP-khó cụ thể, thì ta cũng có thể giải hiệu quả bất kỳ bài toán trong NP bằng cách sử dụng thuật toán giải bài toán NP-khó như một chương trình con
SVTH : CH1301074 – Nguyễn Hải Yến 7
Thuật toán & PP giải quyết vấn đề PGS.TS Đỗ Văn Nhơn
Từ định nghĩa bài toán NP-khó có thể suy ra rằng mỗi bài toán NP-đầy đủ
đều là NP-khó Tuy nhiên một bài toán NP-khó không nhất thiết phải là NP-đầy
đủ
Cũng từ bổ đề nêu trên, ta có thể suy ra rằng để chứng minh một bài toán A
nào đó là NP-khó, ta chỉ cần chỉ ra phép qui dẫn một bài toán đã biết là NP-khó
về nó
Sau đây là mô hình phân lớp các bài toán đã nêu trên
Từ phần trình bày trên, ta thấy có rất nhiều bài toán ứng dụng quan trọng
Trang 5thuộc vào lớp NP-khó, và vì thế khó hy vọng xây dựng được thuật toán đúng hiệu quả để giải chúng Do đó, một trong những hướng phát triển thuật toán giải các bài toán như vậy là xây dựng các thuật toán gần đúng
1.2 Mở rộng khái niệm thuật giải
Trong quá trình nghiên cứu giải quyết các vấn đề - bài toán, người ta đã đưa
ra những nhận xét như sau :
• Có nhiều bài toán cho đến nay vẫn chưa tìm ra một cách giải theo kiểu
thuật toán và cũng không biết là có tồn tại thuật toán hay không
SVTH : CH1301074 – Nguyễn Hải Yến 8
Thuật toán & PP giải quyết vấn đề PGS.TS Đỗ Văn Nhơn
• Có nhiều bài toán đã có thuật toán để giải nhưng không chấp nhận được vì thời gian giải theo thuật toán đó quá lớn hoặc các điều kiện cho thuật toán
khó đáp ứng
• Có những bài toán được giải theo những cách giải vi phạm thuật toán
nhưng vẫn chấp nhận được
Từ những nhận định trên, người ta thấy rằng cần phải có những đổi mới cho khái niệm thuật toán Người ta đã mở rộng hai tiêu chuẩn của thuật toán : tính xác định và tính đúng đắn Việc mở rộng tính xác định đối với thuật toán đã được thể hiện qua các giải thuật đệ quy và ngẫu nhiên Tính đúng của thuật toán bây giờ không còn bắt buộc đối với một số cách giải bài toán, nhất là các cách giải gần đúng Trong thực tiễn, có nhiều trường hợp người ta chấp nhận các cách giải thường cho kết quả tốt (nhưng không phải lúc nào cũng tốt) nhưng ít phức tạp và hiệu quả Chẳng hạn nếu giải một bài toán bằng thuật toán tối ưu đòi hỏi máy tính thực hiện nhiều năm thì chúng ta có thể sẵn lòng chấp nhận một giải pháp gần tối
ưu mà chỉ cần máy tính chạy trong vài ngày hoặc vài giờ
Các cách giải chấp nhận được nhưng không hoàn toàn đáp ứng đầy đủ các
tiêu chuẩn của thuật toán thường được gọi là các thuật giải Khái niệm mở rộng này của thuật toán đã mở rộng cửa cho chúng ta trong việc tìm kiếm phương pháp
để giải quyết các bài toán được đặt ra
Một trong những thuật giải thường được đề cập đến và sử dụng trong khoa
học trí tuệ nhân tạo là các cách giải theo kiểu Heuristic
1.3 Khái niệm hueristic và meta hueristic
1.3.1 Hueristic
Hueristic là những tri thức được rút tỉa từ những kinh nghiệm, “trực giác” của con người (mẹo)
Hueristic có thể là những tri thức “đúng” hay “sai”
Hueristic là những meta knowledge và thường “đúng”
Hueristic thường được dùng trong các bài toán tìm kiếm trong trường hợp:
SVTH : CH1301074 – Nguyễn Hải Yến 9
Thuật toán & PP giải quyết vấn đề PGS.TS Đỗ Văn Nhơn
− Vấn đề có thể không có nghiệm chính xác do các mệnh đề không phát biểu chặt chẽ hay thiếu dữ liệu để khẳng định kết quả
− Vấn đề có nghiệm chính xác nhưng phí tổn tính toán để tìm ra nghiệm là
quá lớn ( hệ quả của bùng nổ tổ hợp)
Hueristic giúp tìm kiếm đạt kết quả với chi phí thấp hơn
Trang 61.3.2 Meta hueristic
Meta hueristic là các thủ tục mang tính hướng dẫn Meta heuristic là loại heuristic tổng quát có thể áp dụng cho nhiều lớp bài tóan.Gần đây meta heuristic là một lãnh vực nghiên cứu phát triển mạnh mẽ, với sự ra đời của nhiều meta heuristic như:- giải thuật di truyền (GA) - giải thuật mô phỏng luyện kim (SA) – giải thuật kiến (ACO)
1.4 Thuật giải hueristic
Thuật giải Heuristic là một sự mở rộng khái niệm thuật toán Nó thể hiện cách giải bài toán với các đặc tính sau :
− Thường tìm được lời giải tốt (nhưng không chắc là lời giải tốt nhất)
− Giải bài toán theo thuật giải Heuristic thường dễ dàng và nhanh chóng đưa
ra kết quả hơn so với giải thuật tối ưu, vì vậy chi phí thấp hơn
− Thuật giải Heuristic thường thể hiện khá tự nhiên, gần gũi với cách suy
nghĩ và hành động của con người
Có nhiều phương pháp để xây dựng một thuật giải Heuristic, trong đó người ta thường dựa vào một số nguyên lý cơ sở như sau:
− Nguyên lý vét cạn thông minh :
Trong một bài toán tìm kiếm nào đó, khi không gian tìm kiếm lớn, ta
thường tìm cách giới hạn lại không gian tìm kiếm hoặc thực hiện một kiểu
dò tìm đặc biệt dựa vào đặc thù của bài toán để nhanh chóng tìm ra mục
tiêu
− Nguyên lý tham lam (Greedy):
SVTH : CH1301074 – Nguyễn Hải Yến 10
Thuật toán & PP giải quyết vấn đề PGS.TS Đỗ Văn Nhơn
Lấy tiêu chuẩn tối ưu (trên phạm vi toàn cục) của bài toán để làm tiêu
chuẩn chọn lựa hành động cho phạm vi cục bộ của từng bước (hay từng giai đoạn) trong quá trình tìm kiếm lời giải
− Nguyên lý thứ tự :
Thực hiện hành động dựa trên một cấu trúc thứ tự hợp lý của không gian
khảo sát nhằm nhanh chóng đạt được một lời giải tốt
− Hàm Heuristic:
Trong việc xây dựng các thuật giải Heuristic, người ta thường dùng các
hàm Heuristic Ðó là các hàm đánh giá thô, giá trị của hàm phụ thuộc vào
trạng thái hiện tại của bài toán tại mỗi bước giải Nhờ giá trị này, ta có thể
chọn được cách hành động tương đối hợp lý trong từng bước của thuật giải
1.5 Thuật giải di truyền (GA)
1.5.1 Giới thiệu
Giải thuật di truyền là một kỹ thuật của khoa học máy tính nhằm tìm kiếm
giải pháp thích hợp cho các bài toán tối ưu tổ hợp (combinatorial optimization) Giải thuật di truyền là một phân ngành của giải thuật tiến hóa vận dụng các
nguyên lý của tiến hóa như di truyền, đột biến, chọn lọc tự nhiên, và trao đổi chéo Giải thuật di truyền thường được ứng dụng nhằm sử dụng ngôn ngữ máy tính để
mô phỏng quá trình tiến hoá của một tập hợp những đại diện trừu tượng (gọi là những nhiễm sắc thể) của các giải pháp có thể (gọi là những cá thể) cho bài toán
Trang 7tối ưu hóa vấn đề Tập hợp này sẽ tiến triển theo hướng chọn lọc những giải pháp tốt hơn
Giải thuật di truyền (Genetic Algorithm - GA): Dựa vào quá trình di truyền trong tự nhiên để cải tiến lời giải qua các thế hệ bắt nguồn từ một tập các lời giải ban đầu
Giải thuật di truyền cũng như các thuật toán tiến hoá đều được hình thành
dựa trên một quan niệm được coi là một tiên đề phù hợp với thực tế khách quan
Đó là quan niệm "Quá trình tiến hoá tự nhiên là quá trình hoàn hảo nhất, hợp lý SVTH : CH1301074 – Nguyễn Hải Yến 11
Thuật toán & PP giải quyết vấn đề PGS.TS Đỗ Văn Nhơn
nhất và tự nó đã mang tính tối ưu" Quá trình tiến hoá thể hiện tính tối ưu ở chỗ thế hệ sau bao giờ cũng tốt hơn thế hệ trước
Ngày nay giải thuật di truyền càng trở nên quan trọng, đặc biệt là trong lĩnh vực tối ưu hoá, một lĩnh vực có nhiều bài toán thú vị, được ứng dụng nhiều trong thực tiễn nhưng thường khó và chưa có giải thuật hiệu quả để giải
1.5.2 Các khái niệm
1.5.2.1 Cá thể, nhiễm sắc thể
Một cá thể trong giải thuật di truyền, biểu diễn một giải pháp của bài toán Tuy nhiên không giống với trong tự nhiên, một cá thể có nhiều nhiễm sắc thể (NST),có 1 thì gọi là thể đơn bội ,còn nếu có nhiều thì là thể đa bội, ở đây để giới hạn trong giải thuật di truyền ta quan niệm một cá thể có một nhiễm sắc thể Do đó khái niệm cá thể và nhiễm sắc thể trong giải thuật di truyền coi như
là tương đương
Một NST được tạo thành từ nhiều gen, mỗi gen có thể có các giá trị khác
nhau để quy định một tính trạng nào đó Trong GA, một gen được coi như một phần tử trong chuỗi NST
1.5.2.2 Quần thể
Quần thể là một tập hợp các cá thể có cùng một số đặc điểm nào đấy Trong giải thuật di truyền ta quan niệm quần thể là một tập các lời giải của một bài toán
1.5.2.3 Các toán tử di truyền
• Chọn lựa
Trong tự nhiên, quá trình chọn lọc và đấu tranh sinh tồn đã làm thay
đổi các cá thể trong quần thể Những cá thể tốt, thích nghi được với điều
kiện sống thì có khả năng đấu tranh lớn hơn, do đó có thể tồn tại và sinh
sản Các cá thể không thích nghi được với điều kiện sống thì dần mất đi
Dựa vào nguyên lý của quá trình chọn lọc và đấu tranh sinh tồn trong tự
SVTH : CH1301074 – Nguyễn Hải Yến 12
Thuật toán & PP giải quyết vấn đề PGS.TS Đỗ Văn Nhơn
nhiên, chọn lựa các cá thể trong GA chính là cách chọn các cá thể có độ
thích nghi tốt để đưa vào thế hệ tiếp theo hoặc để cho lai ghép, với mục
đích là sinh ra các cá thể mới tốt hơn Có nhiều cách để lựa chọn nhưng
cuối cùng đều nhằm đáp ứng mục tiêu là các cá thể tốt sẽ có khả năng được chọn cao hơn
• Lai ghép
Trang 8Lai ghép trong tự nhiên là sự kết hợp các tính trạng của bố mẹ để
sinh ra thế hệ con Trong giải thuật di truyền, lai ghép được coi là một sự tổ hợp lại các tính chất (thành phần) trong hai lời giải cha mẹ nào đó để sinh
ra một lời giải mới mà có đặc tính mong muốn là tốt hơn thế hệ cha mẹ
Đây là một quá trình xảy ra chủ yếu trong giải thuật di truyền
• Đột biến
Đột biến là một sự biến đổi tại một ( hay một số ) gen của nhiễm sắc
thể ban đầu để tạo ra một nhiễm sắc thể mới Đột biến có xác suất xảy ra
thấp hơn lai ghép Đột biến có thể tạo ra một cá thể mới tốt hơn hoặc xấu
hơn cá thể ban đầu Tuy nhiên trong giải thuật di truyền thì ta luôn muốn
tạo ra những phép đột biến cho phép cải thiện lời giải qua từng thế hệ
1.5.3 Mô hình giải thuật
SVTH : CH1301074 – Nguyễn Hải Yến 13
Thuật toán & PP giải quyết vấn đề PGS.TS Đỗ Văn Nhơn
[Bắt đầu ] Nhận các tham số cho thuật toán
[Khởi tạo ] Sinh ngẫu nhiên một quần thể gồm n cá thể ( là n lời giải cho bài toán) [Quần thể mới ] Tạo quần thể mới bằng cách lặp lại các bước sau cho đến khi quần thể mới hoàn thành
a.[Thích nghi] Ước lượng độ thích nghi eval(x) của mỗi cá thể
b.[Kiểm tra ] Kiểm tra điều kiện kết thúc giải thuật
c.[Chọn lọc] Chọn hai cá thể bố mẹ từ quần thể cũ theo độ thích nghi
của chúng (cá thể có độ thích nghi càng cao thì càng có nhiều khả năng
được chọn)
d.[Lai ghép] Với một xác suất lai ghép được chọn, lai ghép hai cá thể
bố mẹ để tạo ra một cá thể mới
e.[Đột biến] Với một xác suất đột biến được chọn, biến đổi cá thể mới
[Chọn kết quả] Nếu điều kiện dừng được thỏa mãn thì thuật toán kết thúc và trả
về lời giải tốt nhất trong quần thể hiện tại
1.5.4 Các tham số
SVTH : CH1301074 – Nguyễn Hải Yến 14
Thuật toán & PP giải quyết vấn đề PGS.TS Đỗ Văn Nhơn
• Xác suất lai ghép
Xác suất lai ghép cho biết tính thường xuyên của việc lai ghép tạo ra thế hệ mới được thực hiện như thế nào Nếu xác suất lai ghép là p
c
, khi đó khả năng để
một cá thể được lai ghép là p
c
Nếu không thực hiện lai ghép, con sinh ra sẽ giống
hoàn toàn bố mẹ Nếu được lai ghép, con sinh ra sẽ có một phần giống bố và một phần giống mẹ
• Xác suất đột biến
Xác suất đột biến cho biết tính thường xuyên của việc các gen của NST
thay đổi như thế nào Nếu xác suất đột biến là pm, khi đó khả năng để mỗi gen
Trang 9của một NST bất kỳ bị đột biến là p
m
Tác dụng của toán tử đột biến là ngăn ngừa
giải thuật di truyền rơi vào tình trạng cực trị địa phương, tuy nhiên nếu thực hiện đột biến với xác suất quá cao sẽ biến giải thuật di truyền thành giải thuật tìm kiếm ngẫu nhiên
• Kích thước quần thể
Kích thước quần thể cho biết có bao nhiêu cá thể trong một quần thể (trong
một thế hệ) Qua các nghiên cứu cũng như các thử nghiệm đã cho thấy kích thước quần thể không nên quá bé cũng như không quá lớn Nếu có quá ít cá thể thì ít có khả năng thực hiện lai giống và chỉ một phần nhỏ không gian tìm kiếm được dùng Như vậy sẽ dễ xảy ra trường hợp bỏ qua các lời giải tốt Nhưng quá nhiều cá thể cũng không tốt vì GA sẽ chạy chậm đi, ảnh hưởng đến hiệu quả của giải thuật Các nghiên cứu cũng đã chỉ ra không có lợi khi tăng kích thước quần thể lên quá một giới hạn cho phép
1.5.5 Các cách mã hóa NST
• Mã hoá nhị phân
Mã hoá nhị phân là phương pháp mã hoá nhiễm sắc thể phổ biến nhất
Trong mã hoá nhị phân, mỗi nhiễm sắc thể là một chuỗi nhị phân, mỗi bit trong nó
có thể biểu diễn một đặc tính của nghiệm
Ví dụ: hai nhiễm sắc thể 1 và 2 có chiều dài là 16
Nhiễm sắc thể 1: 1101100100110110
SVTH : CH1301074 – Nguyễn Hải Yến 15
Thuật toán & PP giải quyết vấn đề PGS.TS Đỗ Văn Nhơn
Nhiễm sắc thể 2: 1101111000011110
Mã hoá nhị phân thường hay dùng trong các bài toán tối ưu các hàm một
biến hay nhiều biến Khi đó, mỗi chuỗi nhị phân sẽ biểu diễn hàm tại một (tập) giá trị của (các) biến Ngoài ra nó còn được áp dụng trong nhiều loại bài toán khác nữa
Mã hoá nhị phân tuy là phổ biến nhưng nó có một nhược điểm là có thể tạo
ra không gian mã hoá lớn hơn so với không gian giá trị của nhiễm sắc thể Do đó, với nhiều bài toán thì biểu diễn nhị phân là không hữu hiệu
• Mã hoá hoán vị
Mã hoá hoán vị có thể được sử dụng trong các bài toán liên quan đến thứ tự
như bài toán du lịch hay bài toán lập lịch
Trong mã hoá hoán vị, mỗi nhiễm sắc thể là một chuỗi các số biểu diễn một trình
tự
Ví dụ :
Nhiễm sắc thể 1: 1 5 4 3 2 6 7 9 8
Nhiễm sắc thể 2: 9 1 7 3 8 5 6 4 2
Mã hoá hoán vị phù hợp cho các bài toán liên quan đến thứ tự Đối với các
bài toán này, việc thao tác trên các nhiễm sắc thể chính là hoán vị các số trong chuỗi đó làm thay đổi trình tự của nó
• Mã hoá theo giá trị
Mã hoá trực tiếp theo giá trị có thể được dùng trong các bài toán sử dụng
Trang 10giá trị phức tạp như trong số thực Trong đó, mỗi nhiễm sắc thể là một chuỗi các giá trị Các giá trị có thể là bất cứ cái gì liên quan đến bài toán, từ số nguyên, số thực, kí tự cho đến các đối tượng phức tạp hơn
Ví dụ:
Nhiễm sắc thể 1: 1.23 5.32 0.34 2.98 3.54
Nhiễm sắc thể 2: (back), (back), (right), (forward), (left)
SVTH : CH1301074 – Nguyễn Hải Yến 16
Thuật toán & PP giải quyết vấn đề PGS.TS Đỗ Văn Nhơn
Mã hoá theo giá trị thường dùng cho các bài toán đặc biệt Trong cách mã hoá này
ta thường phải phát triển các toán tử đột biến và lai ghép cho phù hợp với từng bài toán
1.5.6 Khởi tạo quần thể
Khởi tạo quần thể ban đầu là ta tạo ra một cách ngẫu nhiên các lời giải có
thể (thường là các lời giải thỏa mãn ràng buộc của bài toán nhưng chưa biết là đại lượng cần tối ưu đã là tối ưu hay chưa) Tuỳ vào từng bài toán cụ thể mà ta có các phương pháp khởi tạo khác nhau
Chất lượng của quần thể ban đầu càng cao thì lời giải mà giải thuật di
truyền đưa ra càng tốt Trong nhiều giải thuật di truyền, thường sử dụng các giải thuật đã có để giải bài toán mà cho kết quả khá tốt để khởi tạo quần thể ban đầu Xây dựng hàm thích nghi sao cho giá trị thích nghi phải phản ánh được giá
trị thực của NST trong việc đáp ứng yêu cầu của bài toán Ví dụ như trong các bài toán về cây khung nhỏ nhất thì hàm thích nghi sẽ là hàm tính tổng trọng số các cạnh trên các cây khung
Trong giải thuật di truyền thì hàm tính độ thích nghi là một trong hai yếu tố quan trọng nhất quyết định sự thành công hay thất bại của GA
Có nhiều cách để lựa chọn các cá thể từ quần thể: lựa chọn theo tỉ lệ, lựa
chọn theo xếp hạng, lựa chọn theo cơ chế lấy mẫu ngẫu nhiên, lựa chọn tranh đấu 1.5.7 Các toán tử di truyền
• Mã hoá nhị phân
1.5.7.1 Toán tử lai ghép
Lai ghép đơn điểm cắt :
− Một điểm cắt được chọn tại một vị trí thứ k trên NST
− Từ đầu NST đến vị trí k, NST con sao chép từ cha, phần còn lại sao
chép từ mẹ
SVTH : CH1301074 – Nguyễn Hải Yến 17
Thuật toán & PP giải quyết vấn đề PGS.TS Đỗ Văn Nhơn
Lai ghép hai điểm cắt :
− Hai điểm cắt được chọn
− Từ đầu cho đến điểm cắt thứ nhất được sao chép từ cha, từ điểm cắt
thứ nhất đến điểm cắt thứ hai sao chép từ mẹ và phần còn lại sao
chép từ cha
SVTH : CH1301074 – Nguyễn Hải Yến 18
Thuật toán & PP giải quyết vấn đề PGS.TS Đỗ Văn Nhơn
Lai ghép đồng nhất :