Biểu diễn bài toán Một biểu diễn trạng thái cho phép mô tả trạng thái và mục tiêu của bài toán: ML, CL, B ML: số lượng thầy tu ở bờ trái CL: số lượng quỷ ở bờ tráiB: vị trí của con thuy
Trang 1Giải quyết vấn đề bằng tìm kiếm
Russell and Norvig 3rd ed., chap 3.1-3.2
Trang 2Các trò chơi đố!
Trang 3Bài toán ba thầy tu và ba con quỷ
Mục tiêu: đưa tất cả người và quỷ sang bờ phải của con sông an toàn.
Trang 4Biểu diễn bài toán
Một biểu diễn trạng thái cho phép mô tả trạng thái và
mục tiêu của bài toán:
(ML, CL, B)
ML: số lượng thầy tu ở bờ trái
CL: số lượng quỷ ở bờ tráiB: vị trí của con thuyền
Trang 5Tác nhân giải quyết bài toán
Biểu diễn bài toán
□ Các t rạng thái và hành động (hàm kế vị).
Biểu diễn mục tiêu
Tìm kiếm
□ Xác định chuỗi các hành động có thể có để dẫn tới các trạng thái
đã biết giá trị và sau đó chọn chuỗi tốt nhất.
Thực thi
□ Căn cứ vào giải pháp, thực hiện các hành động
Giả định:
□ Môi trường là có thể quan sát đầy đủ, xác định trước
biết ảnh hưởng của các hành động của nó
Trang 6Biểu diễn đồ thị của bài toán
Các nút: Tất cả các trạng thái có thể có
Các cạnh: có cạnh từ trạng thái u tới trạng thái v nếu v là
có thể đạt đến từ u (bằng một hành động của tác nhân)
Các cạnh của bài toán 3 thầy tu và 3 con quỷ?
Bài toán bây giờ là tìm một đường đi từ (3,3,L) tới
(0,0,R)
Thông thường, các đường đi sẽ có thông tin chi phí đikèm, do vậy bài toán sẽ là tìm đường đi có chi phí thấpnhất từ trạng thái ban đầu đến đích
Trang 7Biểu diễn vấn đề như
một bài toán tìm kiếm
Không gian trạng thái S (các nút)
Hàm kế vị: các trạng thái có thể di chuyển tới bằng cách thực hiện mộthành động (cạnh) từ trạng thái hiệntại
Trạng thái ban đầu
Kiểm tra mục tiêu
liệu trạng thái x có phải là đíchkhông?
Chi phí
Trang 8Quay trở lại bài toán ban đầu
Các hành động (các thao tác):
CCR – chuyển hai con quỷ sang bờ phải
MCL – chuyển một thầy tu và một con quỷ sang bờ trái
Trang 1030R 31R 22R
32L 31L
Trang 11Tìm kiếm không gian trạng thái
Thông thường việc xâydựng một biểu diễn hoànchỉnh của đồ thị trạng
thái là không khả thi(hoặc quá đắt)
Một bộ giải quyết vấn đềphải tìm ra một giải phápbằng cách khám phá mộtphần nhỏ của đồ thị
Trang 12Tìm kiếm không gian trạng thái
Cây tìm kiếm
Trang 13Tìm kiếm không gian trạng thái
Cây tìm kiếm
Trang 14Tìm kiếm không gian trạng thái
Cây tìm kiếm
Trang 15Tìm kiếm không gian trạng thái
Cây tìm kiếm
Trang 16Tìm kiếm không gian trạng thái
Cây tìm kiếm
Trang 17Trò chơi 8 miếng ghép
Các trạng thái?
Trạng thái ban đầu?
Các hành động?
Kiểm tra mục tiêu?
Chi phí đường đi?
Trang 18Trò chơi 8 miếng ghép
Các t rạng thái? Vị trí của mỗi quân
Trạng thái ban đầu? Bất kỳ trạng thái nào
trong đó hướng là một trong {Trái, Phải, Trên, Dưới}
Kiểm tra mục tiêu? Kiểm tra liệu đã đạt được cấu hình đích hay chưa
Trang 21Nhưng đã không có ai thắng giải !!
Trang 22Tại sao?
Trang 23Giải pháp cho bài toán tìm kiếm
Một giải pháp là một đường đi kết nối nút ban đầu với
một nút đích (bất kỳ nút đích nào)
G
Trang 24Giải pháp cho bài toán tìm kiếm
Một giải pháp là một đường đi kết nối nút ban đầu tới
Trang 25Chi phí đường đi
Chi phí cạnh là một số dương đại diện cho chi phí thực hiện hành động tương ứng với cạnh, ví dụ:
□ 1 trong ví dụ trò chơi 8 miếng ghép
Chúng ta giả sử rằng với bất kỳ bài toán nào chi phí c của một cung luôn luôn thỏa mãn:
𝑐 ≥ 𝜀 > 0, trong đó 𝜀 là một hằng
□ Tại sao? Phải làm việc được với chi phí của các
đường đi dài tùy ý
Trang 26Trạng thái đích
Nó có thể được mô tả một cách rõ ràng:
hoặc được mô tả một phần:
hoặc được mô tả bởi một điều kiện,
ví dụ, tổng các số trên tất cả các hàng, tất cả các cột, vàtất cả các đường chéo đều bằng 30
Trang 27Ví dụ khác: Bài toán quân 8 hậu
Biểu diễn gia tăng và biểu diễn trạng thái hoàn chỉnh:
□ Biểu diễn gia tăng bắt đầu với một trạng thái trống vàbao gồm các thao tác làm gia tăng mô tả trạng thái
□ Biểu diễn trạng thái hoàn chỉnh bắt đầu với tất cả 8 quân hậu trên bàn cờ và di chuyển chúng vòng
quanh
Trang 28Bài toán 8 quân hậu:
sự biểu diễn là chìa khóa!
Biểu diễn gia tăng
Các t rạng thái? Bất kỳ sự sắp xếp nào gồm từ 0 đến 8 quân hậu
nhau
Trang 29Một biểu diễn tốt hơn
Một biểu diễn gia tăng khác:
Các t rạng thái? n (giữa 0 và 8) quân hậu trên bàn cờ, mỗi quân nằm trên mỗi cột trong n cột bên trái; các quân hậu không ăn lẫn nhau.
cho nó không ăn bất kỳ quân hậu nào đã có trên bàn cờ.
Trang 30Bài toán n quân hậu
Một giải pháp là một nút đích, không phải là một đường đi tới nút này (đặc trưng của bài toán
Tuy nhiên tồn tại các kỹ thuật để giải các bài
toán n quân hậu hiệu quả cho các giá trị n lớn
Trang 31Lập kế hoạch đường đi
Không gian trạng thái là gì?
Trang 32Các giả định trong tìm kiếm
căn bản
Thế giới là tĩnh
Thế giới là có thể rời rạc hóa
Thế giới là có thể quan sát đầy đủ
Các hành động là xác định trước
Tuy nhiên nhiều giả định này có thể bị loại bỏ, và tìm kiếm tiếp tục là một công cụ giải quyết vấn
đề quan trọng
Trang 33Tìm kiếm và AI
Các phương pháp tìm kiếm có mặt mọi chỗ trong các hệ
thống AI Chúng thường là xương sống cho cả các mô đun lõi
và các mô đun ngoại vi
Một rô bốt tự hành sử dụng tìm kiếm để quyết định thực hiện hành động nào và thi hành thao tác cảm biến nào, để nhanh chóng lường trước sự va chạm, để lập kế hoạch đường đi,
Các công ty hậu cần sử dụng tìm kiếm để định vị các tài
nguyên, lập kế hoạch lộ trình, sắp lịch cho nhân viên…
Các tác nhân hoặc các thành phần trong trò chơi sử dụng tìm kiếm để điều hướng, lựa chọn nước đi, lường trước các hành động của tác nhân khác, và quyết định các hành động của
b ản thân nó.
Trang 34□ Điều hướng rô bốt
□ Thiết kế dược phẩm, thiết kế protein
□ Các trò chơi video