Function TABLE-DRIVEN-AGENTpercept returns action static: percepts, một dãy cảm nhận, khởi đầu rỗng table, bảng các hành động ứng với chuỗi cảm nhận Thêm percept vào cuối dãy percepts
Trang 1TRƯ NG Đ I H C Ờ Ạ Ọ
SƯ PH M K THU T THÀNH PH H CHÍ MINH Ạ Ỹ Ậ Ố Ồ
HCMC University of Technology and Education
KHOA ĐÀO T O CH T L Ạ Ấ Ư NG CAO Ợ
CÁC AGENT THÔNG MINH
Trang 20
CÁC LOẠI AGENT
CÁC LOẠI MÔI TRƯỜNG
Trang 3Agent là gì ? Môi trường là gì ? Hàm Agent ?
Các agent tương tác với môi trường thông qua sensor và các effector
Định nghĩa
OKE
YY
Trang 4Function TABLE-DRIVEN-AGENT(percept)
returns action static: percepts, một dãy cảm
nhận, khởi đầu rỗng table, bảng các hành động ứng với chuỗi cảm nhận Thêm percept vào cuối dãy percepts
action LOOKUP(percepts, table)
Return action
01 AGENT VÀ MÔI
TRƯỜNG
Agent là gì ? Môi trường là gì ? Hàm Agent ?
Các agent tương tác với môi trường thông qua sensor và các effector
Định nghĩa
OKE
YY
Trang 501 AGENT VÀ MÔI
TRƯỜNG
Ba hình thức được mô tả như sau:
Human Agent: Agent con người sử dụng Mắt, Mũi, Lưỡi và các cơ quan cảm giác khác làm cảm biến để cảm nhận thông tin từ môi trường và sử dụng chân tay và đường thanh âm làm cơ quan truyền động để thực hiện một hành động dựa trên thông tin
Robotic Agent: Robotics Agent sử dụng máy ảnh và radar hồng ngoại làm cảm biến để ghi lại thông tin từ Môi trường và nó sử dụng động cơ phản xạ làm bộ truyền động để đưa đầu ra trở lại môi trường
Software Agent: Tác nhân phần mềm sử dụng các thao tác trên bàn phím, lệnh âm thanh làm cảm biến đầu vào và màn hình hiển thị làm thiết bị
truyền động
Hình thức
Trang 601 AGENT VÀ MÔI
TRƯỜNG
Agent có cấu trúc gồm 2 phần:
Kiến trúc (Architecture): Kiến trúc là
bộ máy mà Agent thực hiện hành động của nó. Về cơ bản, nó là một thiết bị có
bộ truyền động và cảm biến nhúng
Chương trình (Program): Việc thực
hiện Chức năng Agent được thực hiện bởi Chương trình Agent Việc thực thi xảy ra trên Kiến trúc tác nhân và tạo ra chức năng mong muốn
Cấu trúc
Trang 7E: Đường xá, giao thông, người đi bộ, thời tiết…
A: Hệ thống lái, phanh, máy gia tốc…
S: GPS, động cơ cảm biến, video…
Trang 801 AGENT VÀ MÔI
TRƯỜNG
Môi trường (environment) là một tổ hợp các yếu tố tự nhiên và xã hội bao quanh bên ngoài của một hệ thống hoặc một cá thể, sự vật nào đó
Các ví dụ về quan hệ giữa Agent và môi trường:
Môi trường
Trang 9 Nhận thức (percept) để chỉ tín hiệu tri giác
nhận được của Agent
Mỗi thời điểm Agent chọn tác động phụ
thuộc vào chuỗi nhận thức có được lúc đó
Dựa trên chuỗi nhận thức, Agent chọn ứng
xử được mô tả như là hàm Agent (Agent
function) và có thể biểu diễn bởi bảng
Bảng là đặc trưng ngoài của hàm Agent
còn bên trong là một chương trình
● If trạng_thái = Bẩn then return Hút_Bụi
● Else if vị_trí = A then return Qua_Phải
● Else if vị_trí = B then return Qua_Trái
● End Function
Trang 1102 CÁC AGENT HỢP LÝ
Đối với mỗi chuỗi nhận thức có thể, một Agent hợp
lý sẽ chọn tác động hướng tới cực đại độ đo thực
hiện dựa vào biểu hiện của chuỗi nhận thức và tri
thức đã có
Ví dụ xét Agent máy hút bụi và giả sử:
1 Độ đo: thưởng một điểm cho mỗi ô sạch ở mỗi bước
và có 1000 bước
2 Tri thức: Chưa biết phân phối bụi và vị trí làm sạch
3 Tác động: Chỉ có các tác động sang phải, trái, hút và
không làm gì
4 Chuỗi nhận thức: Agent chưa nhận thức đúng vị trí
của nó và chưa biết còn bụi hay không
Agent này chưa hợp lý vì phần tri thức và chuỗi nhận thức biểu hiện
chưa tốt để đưa đến độ đo cực đại
Kiểm tra
Trang 1202 CÁC AGENT HỢP LÝ
Đặc tính
• Biết được kết quả hiện thời về tác động và
cho được các tác động phù hợp Quán thông (Omniscience)
• Tính khám phá và thu nhập thông tin
Học (Learning)
• Có nhiều nhận thức mới hơn là dựa vào tri
thức người thiết kế
Tự trị (Autonomy)
Trang 13Agent hợp lý thứ ba:
Sự thông suốt mọi thứ = Biết tất cả
mọi thứ, với tri thức vô hạn
Vì các nhận thức có thể không cung
cấp tất cả các thông tin liên quan
Các tác tử có thể thực hiện các hành
động nhằm thay đổi các nhận thức trong tương lai, với mục đích thu được các thông tin hữu ích (ví dụ: thu thập thông tin, khám phá tri thức)
Tác tử tự trị (autonomous agent) là
một tác tử mà các hành động của nó được quyết định bởi chính kinh
nghiệm của tác tử đó (cùng với khả năng học và thích nghi)
Một hành động đúng (hợp lý) là hành
động giúp cho tác tử đạt được thành công cao nhất đối với mục tiêu đặt ra
Đánh giá hiệu quả hoạt động: là tiêu
chuẩn để đánh giá mức độ thành công trong hoạt động của một tác tử
Ví dụ: Tiêu chí đánh giá hiệu quả
hoạt động của một tác tử máy hút bụi
có thể là: mức độ làm sạch, thời gian hút bụi, mức độ điện năng tiêu tốn, mức độ tiếng ồn gây ra, …
Dựa trên các thông tin được cung
cấp bởi chuỗi nhận thức và các tri thức được sở hữu bởi tác tử đó
Trang 14THIẾT LẬP ĐỘ ĐO, MÔI
TRƯỜNG
03
Một độ đo thực hiện làm tiêu chuẩn cho
thành công của hành vi của một Agent
Khi một Agent được thả vào một môi
trường, nó phải tạo ra một chuỗi tác động
phù hợp với các nhận thức mà nó tiếp
nhận
Không có một độ đo chung nào cho mọi
Agent
Cần có độ đo khách quan đặt ra cho người
thiết kế mỗi Agent
Lựa chọn độ đo là vấn đề khó…
Ví dụ với Agent hút bụi có thể đo bằng số bụi hút được hoặc diện tích sạch
=> Cần thiết kế độ đo phù hợp với môi trường muốn có hơn là phù hợp với Agent.Định nghĩa
Trang 15THIẾT LẬP ĐỘ ĐO, MÔI
Trang 16Artificial Environment Môi trường nhân tạo: Gồm các yếu tố nhân tạo có tính chất vật lý, hóa học… do con người tạo
dựng và chịu sự chi phối của con người
Trang 17 Một số loại môi trường tác nghiệp:
Trang 184 CÁC LOẠI MÔI TRƯỜNGCác thuộc tính của môi trường
tác nghiệp
Hòa hợp và Không hòa hợp (Accessible vs Inaccessible)
Nếu cơ cấu giác quan của agent đem đến cho nó một trạng thái đầy đủ của môi trường thì chúng ta nói rằng môi trường hòa hợp với agent Một môi trường là thực sự hòa hợp nếu các sensor phát hiện ra tất cả các khía cạnh liên quan đến sự lựa chọn hành động
Trang 19 Nếu trạng thái tiếp theo của môi trường là hoàn toàn
xác định thông qua trạng thái hiện thời và hành động
mà agent đã lựa chọn, thì ta nói môi trường là xác
định
Theo nguyên tắc, agent mong muốn không phải lo nghĩ
về một môi trường có thể không chắc chắn xác định Tuy nhiên, nếu một môi trường là không thể thì nó có thể được xem như không xác định
Môi trường xác định hoặc môi trường không xác định
đối với điểm nhìn của agent thường được cho là tốt
nhất
Trang 20 Trong mỗi đoạn gồm có sự nhận biết của agent và
hành vi khi có được nhận biết đó
Đặc tính của hành động phụ thuộc vào chính đoạn
đó, bởi vì các đoạn tiếp theo không phụ thuộc vào các hành động trong đoạn trước đó
Môi trường phân đoạn là rất đơn giản.
Trang 214 CÁC LOẠI MÔI TRƯỜNGCác thuộc tính của môi trường
tác nghiệp
Tĩnh và Động (Static vs Dynamic)
Nếu môi trường có thể thay đổi trong khi agent đang cân nhắc,
thì chúng ta nói rằng môi trường là động đối với agent, ngược lại môi trường là tĩnh
Môi trường tĩnh rất dễ giao tiếp bởi vì agent mong muốn không
phải theo dõi thế giới xung quanh trong khi đang quyết định lựa chọn hành động và cũng mong muốn không phải lo nghĩ thời gian đã trôi qua
Nếu môi trường không thay đổi theo thời gian nhưng sự thực
hiện của agent thành công, thì chúng ta nói rằng môi trường
phần nào là động
Trang 224 CÁC LOẠI MÔI TRƯỜNGCác thuộc tính của môi trường
tác nghiệp
Rời rạc và Liên tục (Discrete vs Continuous)
Nếu có một số lượng giới hạn nhất định các tri
giác và hành động rõ ràng thì ta nói rằng môi trường là rời rạc
Môi trường “Chơi cờ” là rời rạc - có một số lượng
cố định “nước đi có khả năng” trong mỗi lần đi
Môi trường “Lái taxi” là liên tục - tốc độ, vị trí
của taxi và các xe cộ khác nhận giá trị trong một khoảng giá trị liên tục
Trang 234 CÁC LOẠI MÔI TRƯỜNGCác thuộc tính của môi trường
tác nghiệp
Đơn và Đa (Single vs Multi)
Nếu môi trường có một agent hoạt động là Single.
Nếu môi trường có nhiều agent hoạt động là Multi.
Trang 24Môi trường tác nghiệp Hòa hợp Xác định Phân đoạn Tĩnh Rời
rạc Đơn
Chess with a clock Yes Yes No Semi Yes No
Medical diagnosis system No No No No No Yes Image analysis system Yes Yes Yes Semi No Yes Part- picking robot No No Yes No No Yes Chess without a clock Yes Yes No Yes Yes No
Interactive English tutor No No No No Yes No
Trang 25AGE NT
Simpl
e Reflex Agent
Model-Based Agent
Based Agent
Goal-Utility Agent
Learni
ng Agent
Các Agents được phân
thành 5 loại dựa trên
phạm vi năng lực và
mức độ thông minh của
chúng
Phân loại
Trang 26Example: a robotic vacuum
cleaner that deliberate in an infinite
loop, each percept contains a state of
a current location [clean] or [dirty] and, accordingly, it decides whether
AGENT(percept) returns an action
static: rules, a set of
condition-action rules
state INTERPRET-INPUT(percept) rule RULE-MATCH(state, rules) action RULE-ACTION[rule]
return action
Là dạng cơ bản của các Agent và chỉ hoạt động ở trạng thái hiện tại
Chúng có khả năng thông minh rất thấp
Các loại Agent này phản ứng dựa trên các quy tắc được xác định trước
được lập trình
Chúng chỉ hoạt động tốt khi môi trường hoàn toàn có thể quan sát được.
Trang 27Example: the self-steering mobile
vision, where it's necessary to check
the percept history to fully understand
how the world is evolving
Đây là phiên bản nâng cao của Agent Phản xạ đơn giản.
Nó còn có khả năng lưu trữ trạng thái bên trong (thông tin quá khứ) dựa
trên các sự kiện trước đó
Để thực hiện bất kỳ hành động nào, nó dựa vào cả trạng thái bên
trong và cảm nhận hiện tại
Trang 28 Hành động mà những tác nhân này thực hiện phụ thuộc vào khoảng cách
với mục tiêu của chúng
Các hành động nhằm mục đích giảm khoảng cách giữa trạng thái hiện tại
và trạng thái mong muốn Để đạt được mục tiêu, nó sử dụng thuật toán tìm kiếm và lập kế hoạch
Một hạn chế của Agent dựa trên mục tiêu là không phải lúc nào cũng
chọn con đường tối ưu hóa nhất để đạt được mục tiêu cuối cùng
function
MODEL-GOAL-BASED-AGENT(percept) return an action
persistent: state, what the current
agent sees as the world state model, a
description detailing how the next state
is a result of the current state and
action
goals, a set of goals the agent needs to
accomplish
action, the action that most recently
occurred and is initially null
Example: Any searching
robot that has an initial location
and wants to reach a destination
Trang 29 Hành động được thực hiện bởi các Agent
này phụ thuộc vào mục tiêu cuối cùng nên chúng được gọi là Agent tiện ích
Agent Tiện ích được sử dụng khi có nhiều
giải pháp cho một vấn đề và phải chọn giải pháp thay thế tốt nhất có thể
Giải pháp thay thế được chọn dựa trên tiện
ích của từng state Thực hiện phân tích chi phí – lợi ích của từng giải pháp và chọn giải pháp có thể đạt được mục tiêu với chi phí tối thiểu
0
Agent tiện ích (Utility Agent)
Phân loại
Example: the route
recommendation system which
solves the 'best' route to reach a
destination.
Trang 30 Agent học tập (Learning Agent)
Agent Học tập có khả năng học tập để có thể học hỏi từ những kinh
nghiệm trong quá khứ của chúng Những loại Agent này có thể bắt đầu từ đầu và theo thời gian có thể thu được kiến thức đáng kể từ môi trường của chúng
Các Agent học tập có 4 thành phần chính cho phép nó học hỏi từ kinh
nghiệm trong quá khứ:
CỐ
Phân loại
The human is an example of a
learning agent For example, a
human can learn to ride a bicycle,
even though, at birth, no human
possesses this skill
Trang 32BẮT ĐẦU
Trang 33Câu 1: Cấu trúc của Agent là gì?
Trang 34Câu 2: Yếu tố nào dưới đây không phải là yếu tố của Agent hợp lý?
Trang 35Câu 3: Đáp án nào dưới đây sai?
Agent
thành công của hành vi Agent
Trang 36Câu 4: Môi trường nào dưới đây có thuộc tính phân đoạn?
Trang 37Câu 5: Agent nào dưới đây được sử dụng khi có nhiều giải pháp cho một vấn đề và phải chọn giải pháp thay thế tốt nhất có thể?