Bài giảng Trí tuệ nhân tạo: Chương 2a do Lý Anh Tuấn biên soạn nhằm mục đích phục vụ cho việc giảng dạy. Nội dung bài giảng gồm: Tác nhân giải quyết bài toán, biểu diễn đồ thị của bài toán, biểu diễn vấn đề như một bài toán tìm kiếm, quay trở lại bài toán ban đầu,...
Trang 1Giải quyết vấn đề bằng tìm kiếm
Russell and Norvig 3rd ed., chap 3.1-3.2
Trang 2Các trò chơi đố!
Trang 3Bài toán ba thầy tu và ba con quỷ
của con sông an toàn
Trang 4Biểu diễn bài toán
Một biểu diễn trạng thái cho phép mô tả trạng thái và
mục tiêu của bài toán:
(ML, CL, B)
ML: số lượng thầy tu ở bờ trái
CL: số lượng quỷ ở bờ trái B: vị trí của con thuyền
Trang 5Tác nhân giải quyết bài toán
Biểu diễn bài toán
□ Các trạng thái và hành động (hàm kế vị)
Biểu diễn mục tiêu
□ Trạng thái mong muốn của thế giới
Tìm kiếm
□ Xác định chuỗi các hành động có thể có để dẫn tới các trạng thái
đã biết giá trị và sau đó chọn chuỗi tốt nhất
Thực thi
□ Căn cứ vào giải pháp, thực hiện các hành động
Giả định:
□ Môi trường là có thể quan sát đầy đủ, xác định trước
□ Tác nhân biết ảnh hưởng của các hành động của nó
Trang 6Biểu diễn đồ thị của bài toán
Các nút: Tất cả các trạng thái có thể có
Các cạnh: có cạnh từ trạng thái u tới trạng thái v nếu v là
có thể đạt đến từ u (bằng một hành động của tác nhân)
Các cạnh của bài toán 3 thầy tu và 3 con quỷ?
Bài toán bây giờ là tìm một đường đi từ (3,3,L) tới
(0,0,R)
Thông thường, các đường đi sẽ có thông tin chi phí đi kèm, do vậy bài toán sẽ là tìm đường đi có chi phí thấp nhất từ trạng thái ban đầu đến đích
Trang 7Biểu diễn vấn đề như
một bài toán tìm kiếm
Không gian trạng thái S (các nút)
Hàm kế vị: các trạng thái có thể di chuyển tới bằng cách thực hiện một hành động (cạnh) từ trạng thái hiện tại
Trạng thái ban đầu
Kiểm tra mục tiêu
liệu trạng thái x có phải là đích không?
Chi phí
Trang 8Quay trở lại bài toán ban đầu
Các hành động (các thao tác):
CCR – chuyển hai con quỷ sang bờ phải
MCL – chuyển một thầy tu và một con quỷ sang bờ trái
Trang 9con quỷ sang bờ trái
Trang 1032L
30R 31R 22R
32L 31L
Trang 11Tìm kiếm không gian trạng thái
Thông thường việc xây dựng một biểu diễn hoàn chỉnh của đồ thị trạng
thái là không khả thi (hoặc quá đắt)
Một bộ giải quyết vấn đề phải tìm ra một giải pháp bằng cách khám phá một phần nhỏ của đồ thị
Trang 12Tìm kiếm không gian trạng thái
Cây tìm kiếm
Trang 13Tìm kiếm không gian trạng thái
Cây tìm kiếm
Trang 14Tìm kiếm không gian trạng thái
Cây tìm kiếm
Trang 15Tìm kiếm không gian trạng thái
Cây tìm kiếm
Trang 16Tìm kiếm không gian trạng thái
Cây tìm kiếm
Trang 17Trò chơi 8 miếng ghép
Các trạng thái?
Trạng thái ban đầu?
Các hành động?
Kiểm tra mục tiêu?
Chi phí đường đi?
Trang 18Trò chơi 8 miếng ghép
Các trạng thái? Vị trí của mỗi quân
Trạng thái ban đầu? Bất kỳ trạng thái nào
Các hành động? (quân, hướng)
trong đó hướng là một trong {Trái, Phải, Trên, Dưới}
Kiểm tra mục tiêu? Kiểm tra liệu đã đạt được cấu hình đích hay chưa
Chi phí đường đi? Số lượng các hành động để đạt tới đích
Trang 21Nhưng đã không có ai thắng giải !!
Trang 22Tại sao?
Trang 23Giải pháp cho bài toán tìm kiếm
Một giải pháp là một đường đi kết nối nút ban đầu với một nút đích (bất kỳ nút đích nào)
I
G
Trang 24Giải pháp cho bài toán tìm kiếm
Một giải pháp là một đường đi kết nối nút ban đầu tới
Trang 25Chi phí đường đi
phí thực hiện hành động tương ứng với cạnh, ví dụ:
□ 1 trong ví dụ trò chơi 8 miếng ghép
phí c của một cung luôn luôn thỏa mãn:
𝑐 ≥ 𝜀 > 0, trong đó 𝜀 là một hằng
□ Tại sao? Phải làm việc được với chi phí của các
đường đi dài tùy ý
Trang 26Trạng thái đích
Nó có thể được mô tả một cách rõ ràng:
hoặc được mô tả một phần:
hoặc được mô tả bởi một điều kiện,
ví dụ, tổng các số trên tất cả các hàng, tất cả các cột, và tất cả các đường chéo đều bằng 30
Trang 27Ví dụ khác: Bài toán quân 8 hậu
Trang 28Bài toán 8 quân hậu:
sự biểu diễn là chìa khóa!
Biểu diễn gia tăng
Các trạng thái? Bất kỳ sự sắp xếp nào gồm từ 0 đến 8 quân hậu trên bàn cờ
Trạng thái bắt đầu? Không có quân hậu nào
Các hành động? Thêm các quân hậu vào các ô trống
Kiểm tra mục tiêu? 8 quân hậu trên bàn cờ và không ăn lẫn
nhau
Chi phí đường đi? Không có
Trang 29Một biểu diễn tốt hơn
Một biểu diễn gia tăng khác:
Các trạng thái? n (giữa 0 và 8) quân hậu trên bàn cờ, mỗi quân nằm trên mỗi cột trong n cột bên trái; các quân hậu không ăn lẫn nhau
Trạng thái ban đầu? Không có con hậu nào
Các hành động? Thêm hậu vào cột bên trái nhất còn trống sao cho nó không ăn bất kỳ quân hậu nào đã có trên bàn cờ
Kiểm tra mục tiêu? 8 quân hậu trên bàn cờ
có 2057 chuỗi để khám phá
Trang 30Bài toán n quân hậu
đường đi tới nút này (đặc trưng của bài toán
Tuy nhiên tồn tại các kỹ thuật để giải các bài
toán n quân hậu hiệu quả cho các giá trị n lớn
Trang 31Lập kế hoạch đường đi
Không gian trạng thái là gì?
Trang 32Các giả định trong tìm kiếm
căn bản
Thế giới là tĩnh
Thế giới là có thể rời rạc hóa
Tuy nhiên nhiều giả định này có thể bị loại bỏ, và tìm kiếm tiếp tục là một công cụ giải quyết vấn
đề quan trọng
Trang 33Tìm kiếm và AI
Các phương pháp tìm kiếm có mặt mọi chỗ mọi nơi trong các
hệ thống AI Chúng thường là xương sống cho cả các mô đun lõi và các mô đun ngoại vi
Một rô bốt tự hành sử dụng tìm kiếm để quyết định thực hiện hành động nào và thi hành thao tác cảm biến nào, để nhanh chóng lường trước sự va chạm, để lập kế hoạch đường đi,
Các công ty hậu cần sử dụng tìm kiếm để định vị các tài
nguyên, lập kế hoạch lộ trình, sắp lịch cho nhân viên…
Các tác nhân hoặc các thành phần trong trò chơi sử dụng tìm kiếm để điều hướng, lựa chọn nước đi, lường trước các hành động của tác nhân khác, và quyết định các hành động của
bản thân nó
Trang 34□ Điều hướng rô bốt
□ Thiết kế dược phẩm, thiết kế protein
□ Các trò chơi video