Tiểu luận Trình bày về hệ tri thức Tác tử thông minh Intelligent Agents

INTELLIGENT AGENTS Là GÌ? Hệ công nghệ tri thức Tác tử thông minh là gì? Hệ đa tác tử là hệ như thế nào? Hiện nay, khi máy tính, mạng và hệ thống máy tính phát triển, tính dễ sử dụng không theo kịp rất nhiều chức năng tiên tiến hiện có sẵn. Kết quả là máy tính đang trở thành ngày càng gây khó khăn cho người mới bắt đầu, và thậm chí cả những người dùng lâu năm. Thông tin và xử lý nên có sẵn chỉ đơn giản là không thể truy cập được. Trong cuộc sống của chúng ta, khi chúng ta thấy mình ở một vị trí mà thời gian và các hoạt động vượt qua chúng ta, chúng ta tìm kiếm sự giúp đỡ dưới dạng như 1 trợ lý. Tác tử thông minh là phần mềm hỗ trợ mọi người và hành động thay mặt họ. Tác tử thông minh làm việc bằng cách cho phép mọi người ủy quyền công việc mà họ có thể đã làm, cho phần mềm tác tử. Tác tử cũng như các trợ lý có thể tự động hóa các công việc lặp đi lặp lại, ghi nhớ những điều bạn đã quên một cách thông minh tóm tắt dữ liệu phức tạp, học hỏi từ bạn và thậm chí đưa ra các đề xuất cho bạn. Mục tiêu của Tiểu luận là trình bày được khái niệm căn bản về tác tử thông minh, phân loại và các ứng dụng của tác tử thông minh trong thực tế

Trang 1

TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP HÀ NỘI

BÁO CÁO TIỂU LUẬN

Trang 2

Hiện nay, khi máy tính, mạng và hệ thống máy tính phát triển, tính dễ

sử dụng không theo kịp rất nhiều chức năng tiên tiến hiện có sẵn Kết quả làmáy tính đang trở thành ngày càng gây khó khăn cho người mới bắt đầu, vàthậm chí cả những người dùng lâu năm Thông tin và xử lý nên có sẵn chỉ đơngiản là không thể truy cập được Trong cuộc sống của chúng ta, khi chúng tathấy mình ở một vị trí mà thời gian và các hoạt động vượt qua chúng ta,chúng ta tìm kiếm sự giúp đỡ dưới dạng như 1 trợ lý Tác tử thông minh làphần mềm hỗ trợ mọi người và hành động thay mặt họ Tác tử thông minhlàm việc bằng cách cho phép mọi người ủy quyền công việc mà họ có thể đãlàm, cho phần mềm tác tử Tác tử cũng như các trợ lý có thể tự động hóa cáccông việc lặp đi lặp lại, ghi nhớ những điều bạn đã quên một cách thông minhtóm tắt dữ liệu phức tạp, học hỏi từ bạn và thậm chí đưa ra các đề xuất chobạn

Mục tiêu của bài tiểu luận là trình bày được khái niệm căn bản về tác tửthông minh, phân loại và các ứng dụng của tác tử thông minh trong thực tế

Trong quá trình làm bài tiểu luận do còn hạn chế về mặt thời gian vàkinh nghiệm còn nhiều hạn nên không thể tránh khỏi còn nhiều thiếu sót Rấtmong được sự đóng góp ý kiến của Thầy, Cô để chúng em có thể học hỏiđược nhiều kinh nghiệm và hoàn thành các bài tiểu luận khác tốt hơn

Đặc biệt em xin gửi lời cảm ơn đến cô TS Nguyễn Thị Mỹ Bình đãnhiệt tình giảng dạy trong các buổi học, và hỗ trợ chúng em hoàn thiện bàibáo cáo được tốt hơn

Hà nôi, 26 tháng 10 năm 2022

Sinh viên thực hiệnNhóm 5

Trang 3

LỜI MỞ ĐẦU _iMỤC LỤC _iiDANH MỤC HÌNH VẼ ivCHƯƠNG I: TÁC TỬ THÔNG MINH _11.1 Khái niệm 11.1.1 Khái niệm tác tử _11.1.2 Khái niệm tác tử thông minh 21.2 Đặc trưng cơ bản của tác tử thông minh 31.3 Mô hình tác tử thông minh 41.3.1 Chức năng nghiệp vụ 41.3.2 Tri thức 51.3.3 Liên tác 51.4 Lợi ích của tác tử 5CHƯƠNG II: PHÂN LOẠI TÁC TỬ THÔNG MINH _82.1 Tác tử phản xạ đơn giản (Simple reflex agents) 82.2 Tác tử phản xạ dựa trên mô hình (Model based reflex agents) 102.3 Tác tử phản xạ dựa trên mục tiêu (Goal-based agents) 122.4 Tác tử hướng lợi ích (Utility based agents) _142.5 Tác tử học tập (Learning Agents) 15CHƯƠNG III: HỆ THỐNG ĐA TÁC TỬ 173.1 Khái niệm _173.2 Phân loại hệ thống đa tác tử _193.2.1 Kiến trúc bên trong (Internal Architecture) 203.3 Tổ chức tác tử _213.3.1 Tổ chức phân cấp (Hierarchical Organization) _213.3.2 Tổ chức tác tử Holonic (Holonic Agent Organization) _233.3.3 Liên minh các tác tử (Coalitions multi-agents) _243.3.4 Nhóm tác tử (Teams) _26

Trang 4

Agent System) 283.4.1 Giao tiếp cục bộ (Local Communications) 283.4.2 Blackboards 293.4.3 Ngôn ngữ giao tiếp giữa các tác tử(Agent CommunicationLanguage) _303.5 Ra quyết định trong hệ thống đa tác tử 333.5.1 Trạng thái cân bằng Nash (Nash Equilibrium) _343.6 Điều phối trong hệ thống đa tác tử (Coordination in Multi-AgentSystem) _353.6.1 Điều phối thông qua giao thức _363.6.2 Điều phối qua đồ thị (Coordination via Graphs) 383.6.3 Điều phối thông qua mô hình Belief _393.7 Khả năng học tập trong hệ thống đa tác tử (Learning in a Multi-AgentSystem) _393.7.1 Active learning _403.7.2 Reactive Learning _413.7.3 Learning Based on Consequence 42Kết luận 44Tài liệu tham khảo 45

Trang 5

Hình 1 1 Kiến trúc tác tử thông minh 5Hình 1 2 Mô hình tác tử thông minh _6YHình 2 1 Sơ đồ hoạt động tác tử phản xạ đơn giản _12Hình 2 2 Sơ đồ hoạt động của tác tử phản xạ dựa trên mô hình _13Hình 2 3 Sơ đồ hoạt động của tác tử phản xạ dựa trên mục tiêu _15Hình 2 4 Sơ đồ hoạt động của tác tử hướng lợi ích _17Hình 2 5 Sơ đồ hoạt động của tác tử học tập 18YHình 3 1 Phân loại Hệ thống đa tác tử theo thuộc tính 22Hình 3 2 Kiến trúc phân cấp tác tử 24Hình 3 3 Một ví dụ về Superholon với các holon lồng nhau như MAS phâncấp 26Hình 3 4 Kiến trúc liên minh đa tác tử sử dụng các nhóm chồng nhau. _27Hình 3 5 Các đội/ nhóm tác tử điển hình dựa trên kiên trúc với chế độ xem từcác nhóm khác. _29Hình 3 6 Thông điệp được truyền đến với nhau giữa các tác tử _31Hình 3 7 a, Kiểu giao tiếp thông qua blackboard giữa các tác tử b, Giao tiếpblackboard sử dụng giao tiếp từ xa giữa các tác tử. _32Hình 3 8 KQML – Cấu trúc ngôn ngữ phân lớp _35

Trang 6

CHƯƠNG I: TÁC TỬ THÔNG MINH 1.1 Khái niệm

1.1.1 Khái niệm tác tử

Khái niệm tác tử có nguồn gốc từ những nghiên cứu và phát triển củalĩnh vực trí tuệ nhân tạo và Robot Ý tưởng ban đầu gắn với quan niệm tác tửnhư thực thể phần mềm có khả năng thực thi các nghiệp vụ thay thế chongười dùng dựa trên biểu diễn tri thức, khả năng suy luận và học Sau đó, cáctác tử là thực thể phần mềm có khả năng di động, tương tác, phối hợp, cộngđồng, thích nghi, uỷ thác, tự trị, vv , được sử dụng để xây dựng và phát triểnứng dụng trong các lĩnh vực cơ bản như sau:

 Giải pháp để phát triển kỹ thuật tương tác người-máy và liên tác giữacác thành phần trên môi trường phân tán

 Sử dụng tác tử để xây dựng chương trình ứng dụng và dịch vụ theo cácyêu cầu, sở thích và mục đích của người dùng

 Công cụ để quản lý, thu nhận, lọc, phổ biến và truyền tải thông tin trêncác mạng máy tính Tăng cường hiệu năng của ứng dụng trên mạng,đặc biệt là mạng Internet

 Sử dụng công nghệ tác tử để phát triển thương mại điện tử theo nhiềudạng khác nhau

 Tác tử là công cụ quản lý trong sản xuất và kinh doanh (Robot)

Khái niệm tác tử trong từ điển Thế giới mới của Webster được trình bàynhư sau: Tác tử là một thực thể phần mềm, đại diện cho người sử dụng đểthực hiện các nhiệm vụ được giao trong hệ thống cục bộ hoặc trong một hệthống ở nơi khác

Khái niệm về tác tử nêu trên thể hiện được hai đặc trưng chủ yếu sau:

 Tác tử hoạt động nhân danh một người hay một hệ thống

Trang 7

Có thể phân loại và thiết kế cài đặt tác tử dựa trên 3 đặc trưng chủ yếu,gồm môi trường, nhiệm vụ và kiến trúc của tác tử:

 Môi trường: Các tác tử được thiết kế để thực hiện trong một môi trường

cụ thể, chẳng hạn: hệ điều hành máy tính, hệ ứng dụng, mạng máy tính,môi trường Internet, môi trường Web, vv

 Nhiệm vụ: Chức năng nghiệp vụ được tác tử đại diện thực thi thườngthể hiện ở tên của tác tử Chẳng hạn, tác tử lọc thông tin, tác tử truyxuất thông tin, tác tử tìm kiếm, tác tử giám sát hệ thống, vv

 Kiến trúc: Các tác tử cũng được đặt tên theo kiến trúc tri thức bêntrong Chẳng hạn, tác tử học gán với quá trình học của tác tử, tác tử chỉdẫn, tác tử tư vấn, vv

1.1.2 Khái niệm tác tử thông minh

Tác tử thông minh (Intelligent Agent): là một thực thể phần mềm thực

thi nhiệm vụ đại diện cho người dùng với khả năng tự trị

Tác tử thông minh là một thực thể phần mềm có khả năng thu nhận nhữngyêu cầu, sự kiện từ người dùng, môi trường và dựa trên cơ sở những phươngthức, cơ chế lựa chọn, suy diễn và học để tạo ra những quyết định trả lời haytác động trở lại môi trường và tác tử có khả năng tự trị khi hoạt động trongmôi trường phân tán (Hình 1.1)

Trang 8

Hình 1 1 Kiến trúc tác tử thông minhHiện nay, công nghệ tác tử thông minh được tích hợp từ những nghiêncứu của ba lĩnh vực chủ yếu gồm: Trí tuệ nhân tạo, công nghệ phần mềm vàtương tác người- máy Khả năng thông minh của tác tử được nghiên cứu dựatrên các lý thuyết suy luận, hệ thống luật và khả năng học Công nghệ phầnmềm xây dựng tác tử thông minh dựa trên các lĩnh vực: Tiếp cận hướng đốitượng, phát triển ứng dụng phân tán, kiểm soát trực tuyến (on-line), triệu gọi

từ xa, suy diễn dựa trên các sự kiện và quá trình hành động Tương tác máy thể hiện tác tử thông minh được rút ra từ lĩnh vực: Tâm lý học nhận thức,

người-mô hình người dùng, kinh nghiệm chuyên gia và các hệ thống trợ giúp thôngminh

1.2 Đặc trưng cơ bản của tác tử thông minh

Tác tử thông minh có những đặc trưng cơ bản như : Được ủy quyền, khảnăng tương tác, tự trị, giám sát và quản lý môi trường, thông minh

 Được ủy quyền: Tác tử thực thi một tập các nhiệm vụ (tasks) thay mặt

cho người dùng, hệ thống hay tác tử khác

 Khả năng tương tác: Các tác tử có khả năng tương tác với người dùng

để nhận được những chỉ dẫn về các công việc được ủy quyền và cungcấp thông tin, trạng thái về công việc Công việc này được thực hiệnthông qua giao diện giữa người dùng và tác tử hoặc bằng ngôn ngữ giaotiếp dùng cho tác tử

 Tự trị: Các tác tử thực thi không cần sự can thiệp trực tiếp của người

dùng, sau khi trao các quyền thực thi cho tác tử Khả năng thực thi tựđộng của tác tử có thể chỉ là khởi động một chương trình cho đến việcliên tác, đàm phán trên mạng để thực thi nhiệm vụ

 Giám sát và quản lý môi trường: Các tác tử có khả năng giám sát và

quản lý môi trường hoạt động của mình nhằm thực thi các công việc

Trang 9

 Thông minh: Tính thông minh thể hiện qua việc thu nhận và diễn giải

các sự kiện (thông tin về môi trường) và đưa ra quyết định thích hợpnhất phục vụ cho các hoạt động tự trị của tác tử

Ngoài ra, tác tử thông minh còn có thể có những đặc trưng khác như: Tính

di động, bảo mật, tính cá nhân, phối hợp, cộng đồng, thích nghi, vv

1.3 Mô hình tác tử thông minh

Trên cơ sở tập các đặc trưng của tác tử thông minh, A.Caglayan vàC.Harrison đã đưa ra mô hình tổng quát của tác tử gồm 3 thành phần cơ bản:chức năng nghiệp vụ, tri thức và liên tác (Hình 1.2)

Hình 1 2 Mô hình tác tử thông minh1.3.1 Chức năng nghiệp vụ

Các chức năng nghiệp vụ bao gồm các qui trình nghiệp vụ nhằm đạtmục tiêu khi thực hiện nhiệm vụ, chỉ rõ chức năng của tác tử, dịch vụ của tác

tử thông minh, chẳng hạn như: cung cấp thông tin, lọc thông tin, các truy vấn

cơ sở dữ liệu, kiểm soát, hướng dẫn, vv Các chức năng nghiệp vụ thể hiệnkhả năng nhận thức về môi trường của tác tử thông qua các bộ cảm biến vàhành động dựa theo môi trường để thực hiện các nhiệm vụ

Trang 10

1.3.2 Tri thức

Tri thức của tác tử mô tả tập các luật tác tử sử dụng để hoàn thànhnhiệm vụ Các tác tử (tự trị và bán tự trị) cần có tri thức về môi trường Như ở

Hình 1.2, tri thức có thể có được thu nhận thông qua nhiều nguồn khác nhau.

Tri thức trong mỗi tác tử có thể được thu nạp trực tiếp theo những cáchnhư sau:

 Từ người phát triển tác tử: Bao gồm tri thức về lĩnh vực ứng dụng, trithức hướng người dùng làm nền tảng xây dựng cơ chế suy diễn trong

cơ sở tri thức Tri thức được tổ chức dưới dạng luật hay các cấu trúckhung Điểm bất lợi của các tri thức loại này là thiếu khả năng tuỳ biếntrong quá trình thực thi nhiệm vụ

 Từ người dùng: Bao gồm các luật, các cơ chế suy diễn do người sửdụng thiết lập, hỗ trợ tác tử thực hiện được các nhiệm vụ trong các tìnhhuống khác nhau Khi đó, hệ thống phải cho phép người dùng dõi vếtcác hành động của tác tử Điểm bất lợi chính của các tri thức loại này là

sự áp đặt khi thiết lập tác tử từ phía người dùng

 Thông qua trao đổi tri thức giữa các tác tử: Để làm được điều này cần

có ngôn ngữ cho phép trao đổi tri thức trong cộng đồng các tác tử.1.3.3 Liên tác

Các kỹ năng giao tiếp giữa tác tử và người dùng được thể hiện dướidạng các giao diện thu nhận thông tin, câu hỏi khảo sát, các báo cáo,……

Trong quá trình thực thi nhiệm vụ, thành phần liên tác của tác tử chịutrách nhiệm thu nhận, trao đổi thông tin với các tác tử bên trong và bên ngoài

hệ thống Trong môi trường đa tác tử phân tán, các thủ tục giao tiếp và tươngtác giữa các tác tử rất phức tạp và chịu sự kiểm soát của người thiết kế hệthống

Trang 11

Xuất phát từ nghiên cứu về đặc trưng và mô hình kiến trúc, tác tử thôngminh là một trong những giải pháp khả thi để phát triển ứng dụng phức tạptrong môi trường phân tán Đặc biệt, để phát triển ứng dụng theo yêu cầu củangười dùng công nghệ tác tử có những thuận lợi cơ bản như sau:

Khả năng tự động: Tác tử có khả năng tự động thực thi các nhiệm vụ, đại

diện cho người sử dụng như:

 Hành vi lặp đi lặp lại của một người sử dụng

 Hành vi tương tự của một nhóm những người sử dụng

 Hành vi liên tục lặp đi lặp lại của một số người sử dụng trong luồngcông việc

Khả năng tùy biến theo yêu cầu người dùng: Một tác tử có khả năng

tuỳ biến khi cung cấp thông tin theo yêu cầu của người dùng, chẳng hạn tác tửtìm kiếm và cung cấp thông tin theo chủ đề cụ thể người dùng quan tâm trênmôi trường Internet

Khả năng thông báo và hướng dẫn cho người dùng: Một tác tử có khả

năng cung cấp các dịch vụ dưới dạng các thông báo đến một người sử dụng

về việc thay đổi của các sự kiện quan trọng được các cá nhân quan tâm.Chẳng hạn, một tác tử có thể kiểm soát các thay đổi của các trang Web đượcchú ý và báo cáo các thay đổi này cho người sử dụng Thay cho việc đào tạotruyền thống, tác tử có thể hướng dẫn người dùng thực hiện công việc theomột qui trình cụ thể, thông qua quá trình suy luận và kiểm soát

Khả năng học: Tác tử có khả năng học để thực thi nhiệm vụ một cách tự

động Ngoài ra, tác tử có thể học để xác định các khả năng tuỳ biến theo yêucầu người dùng: Học nhằm tự động hóa các nhiệm vụ lặp đi lặp lại của người

sử dụng Các khía cạnh về nhiệm vụ (cái gì, khi nào, như thế nào) sẽ được tác

tử thực thi một cách tự động; Học các đặc trưng, yêu cầu tương tự của nhómngười sử dụng, trên cơ sở đó có thể tùy biến thông tin theo yêu cầu; Học các

Trang 12

hành vi tương tự của nhóm người sử dụng, trên cơ sở đó tăng cường hiệu quảcông việc trong tổ chức; Học những hành vi thường xuyên, có tính định kỳcủa nhóm người sử dụng trong một luồng công việc.

Khả năng di động: Tác tử cho phép người sử dụng hoàn thành công việc

ở xa, không trực tuyến (off-line), chẳng hạn, di chuyển từ nơi này đến nơikhác, tương tác với các tác tử khác để thực hiện các nhiệm vụ nhân danhngười sử dụng

Trang 13

CHƯƠNG II: PHÂN LOẠI TÁC TỬ THÔNG MINH

Dựa trên mức độ thông minh và mức độ nhận thức, tác tử thông minhđược phân loại như sau:

 Tác tử phản xạ đơn giản (Simple reflex agents)

 Tác tử phản xạ dựa trên mô hình (Model-based reflex agents)

 Tác tử dựa trên mục tiêu (Goal-based agents)

 Tác tử dựa trên lợi ích (Utility-based agents)

 Tác tử học tập (Learning-agents)

2.1 Tác tử phản xạ đơn giản (Simple reflex agents)

Tác tử phản xạ đơn giản là tác tử cơ bản nhất trong số các tác tử thôngminh hiện có Nó thực hiện các hành động dựa trên tình huống hiện tại Khi

có điều gì đó xảy ra trong môi trường của tác tử phản xạ đơn giản, tác tử sẽnhanh chóng quét cơ sở kiến thức của mình để biết cách ứng phó với tìnhhuống hiện tại dựa trên các quy tắc được xác định trước

Hiểu đơn giản là tác tử có 1 tập luật và có lưu trữ (biết) 1 loạt các trạngthái của môi trường, nếu gặp trạng thái này thì có luật này, luật này sẽ trả ra 1hành động tương ứng

Các tác tử phản xạ đơn giản là: Đơn giản Nó không thể tính toán cácphương trình phức tạp hoặc giải quyết các vấn đề phức tạp Chúng chỉ hoạtđộng trong môi trường hoàn toàn có thể quan sát được theo cảm nhận hiện tại,

bỏ qua bất kỳ lịch sử nhận thức nào

Ví dụ: Nếu bạn có bóng đèn thông minh, hãy đặt để bật lúc 6 giờ chiều.

Mỗi đêm, bóng đèn sẽ không nhận ra và đèn không cần thiết cho đến sau này

Nó sẽ tiếp tục bật đèn lúc 6 giờ chiều Bởi vì đó là quy tắc nó tuân theo cáctác tử phản xạ đơn giản được xây dựng dựa trên quy tắc điều kiện - hànhđộng

Trang 14

Những tác tử này chỉ đơn giản là quyết định các hành động dựa trênnhận thức hiện tại của nó Bằng cách xác định rằng các hành động nhất địnhđược đảm bảo trong các điều kiện nhất định, tác tử có thể xây dựng danh sáchcác quy tắc hành động theo điều kiện và sử dụng chúng để quyết định hànhđộng nào cần thực hiện.

Quy tắc điều kiện-hành động có hai khía cạnh Nó trình bày điều kiệnhoặc môi trường hiện tại, yêu cầu hành động mà tác tử đã được yêu cầu thựchiện Nếu điều kiện cụ thể không được đáp ứng, hành động - bất kể cần thiếtnhư thế nào - sẽ không xảy ra Nó có thể tuân theo công thức '' nếu cái này, thìcái kia '', chẳng hạn như, '' Nếu nhiệt độ trong thiết bị đạt 75 độ, máy điều hòakhông khí sẽ bật ''

Trang 15

Nguyên lý:

Function SIMPLE-REFLEX-AGENT (percept) -> return action:

static: rules, a set of condition-action rules

state ← INTERPRET-INPUT (percept)

rule ← RULE-MATCH (state, rules)

action ← RULE-ACTION [rule]

return action

Hình 2 1 Sơ đồ hoạt động tác tử phản xạ đơn giản

2.2 Tác tử phản xạ dựa trên mô hình (Model based reflex agents)

Tác tử phản xạ dựa trên mô hình là tác tử sử dụng lịch sử cảm nhận và

bộ nhớ trong của nó để đưa ra quyết định về ''mô hình'' bên trong của thế giớixung quanh nó Bộ nhớ trong cho phép các tác tử này lưu trữ một số lịch sửđiều hướng của họ và sau đó sử dụng lịch sử bán chủ quan đó để giúp hiểu

Trang 16

mọi thứ về môi trường hiện tại của họ - ngay cả khi không thể quan sát trựctiếp mọi thứ họ cần biết Bạn yêu cầu một nhận thức là gì? Nhận thức là kếtquả lâu dài của một cái gì đó chúng ta đã nhận thức được, mà thay vì nhậnthức ngay lập tức, là cái mà chúng ta biết rằng chúng ta có thể nhận thứcđược.

Tác tử lưu internal states dựa trên chuỗi percept, phản ánh ít nhất mộtvài khía cạnh không quan sát được môi trường

Nguyên lý:

Function SIMPLE-REFLEX-AGENT (percept) -> return action:

static: rules, a set of condition-action rules

state, a description of the current world state

action, the most recent action, initially none

state ← UPDATE-STATE (state, action, percept)

rule ← RULE-MATCH (state, rules)

action ← RULE-ACTION [rule]

return action

Trang 17

Hình 2 2 Sơ đồ hoạt động của tác tử phản xạ dựa trên mô hình

Đầu tiên sensors của tác tử nhận input từ môi trường nhưng ngoài việcnhận input, đối sánh luật và đưa ra hành động, tác tử này thông minh hơn 1 tí,

nó kiểm tra state của môi trường, đối chứng xem môi trường thay đổi như thếnào và xem lại nó đã làm gì trước đó để đưa ra 1 hành động thích hợp nhất(hay tìm 1 luật phù hợp nhất trong trường hợp này) Tác tử dạng này tiến hóahơn tác tử dạng trước một chút, đó là thay vì chỉ nhận input từ môi trường vàđối chiếu luật đưa ra hành động, tác tử này biết thêm thông tin về môi trường(cụ thể là sự thay đổi của môi trường) và sử dụng hành động trước đó để đưa

ra hành động hiện thời phù hợp

Đây là nơi mà '' mô hình '' về cách mọi thứ xảy ra trên thế giới xungquanh nó phát huy tác dụng trong loại tác tử này Nó sử dụng khả năng họctập nội bộ của nó (và mô hình tự xây dựng của một thế giới mà nó hiểu rằng

nó là một phần của nó) để đưa ra quyết định của mình Nó có thể sử dụng lịch

sử quan sát của nó (lưu trữ nội bộ các khái niệm trước đó) để điền vào nhữngđiều nó cần biết để hiểu rõ hơn về những thứ hiện tại không thể quan sát đượcthường là một phần vật lý của hệ thống mà nó vận hành Có nhiều bằng chứng

Trang 18

cho thấy con người có thể sử dụng một phương pháp tương tự để hiểu thế giớimới của chúng.

2.3 Tác tử phản xạ dựa trên mục tiêu (Goal-based agents)

Tác tử dựa trên mục tiêu là tác tử trí tuệ nhân tạo phản ứng với môitrường của nó và điều chỉnh cho phù hợp để đạt được mục tiêu Kiểm tra địnhnghĩa, ví dụ và mở rộng các tác tử dựa trên mục tiêu

Hình 2 3 Sơ đồ hoạt động của tác tử phản xạ dựa trên mục tiêu

Các dạng đích:

 Một trạng thái

 Tập các trạng thái thỏa mãn một số tính chất nào đó

 Một phép thử áp dụng vào trạng thái và thông báo có thỏa đích haykhông

 Đích khiến tác tử phải suy luận về tương lai hoặc các trạng thái khác

Có thể có trường hợp không có hành động nào đưa đến đích

Trang 19

Thiết lập mục tiêu: Trong trí tuệ nhân tạo, các tác tử thông minh cũng có

thể là người đặt mục tiêu Thay vì chỉ phản ứng với môi trường hiện tại, loạitác tử mà chúng ta đang thảo luận trong bài học này thực sự có thể đưa raquyết định tiến gần hơn đến mục tiêu đã định Đây là, được đặt tên thích hợp,

là một tác tử dựa trên mục tiêu

Xác định tác tử dựa trên mục tiêu: Nó hoạt động dựa trên một mục tiêu

phía trước và đưa ra quyết định dựa trên cách tốt nhất để đạt được mục tiêu

đó Không giống như tác tử phản xạ đơn giản chỉ đưa ra quyết định dựa trênmôi trường hiện tại, tác tử dựa trên mục tiêu có khả năng suy nghĩ xa hơn thờiđiểm hiện tại để quyết định những hành động tốt nhất cần thực hiện để đạtđược mục tiêu Về mặt này, tác tử dựa trên mục tiêu hoạt động như một chứcnăng tìm kiếm và lập kế hoạch, có nghĩa là nó nhắm đến mục tiêu phía trước

và tìm ra hành động phù hợp để đạt được mục tiêu đó Điều này giúp ngườiđại diện dựa trên mục tiêu chủ động hơn là chỉ phản ứng trong quá trình raquyết định

Bạn có thể áp dụng cách tiếp cận dựa trên mục tiêu cho các nhiệm vụ tại

nơi làm việc Ví dụ: bạn có thể đặt mục tiêu trở thành một nhân viên đánh

máy hiệu quả hơn, điều này sẽ giúp bạn hoàn thành bài tập nhanh chóng hơn.Sau đó, một bước để đạt được mục tiêu đó có thể là đăng ký một khóa họcđánh máy hoặc dành 15 phút mỗi ngày để luyện tập nhằm tăng số lượng từmỗi phút của bạn Các quyết định của bạn rất linh hoạt, là dấu hiệu của nhữngtác tử dựa trên mục tiêu, nhưng trọng tâm luôn là đạt được mục tiêu phíatrước

Mở rộng tác tử dựa trên mục tiêu: Tác tử dựa trên mục tiêu mở rộng

trên khái niệm tác tử dựa trên mô hình vì sự hiện diện của chính mục tiêu Tác

tử dựa trên mô hình sử dụng lịch sử cảm nhận và bộ nhớ trong để hiểu thếgiới xung quanh Tác tử dựa trên mục tiêu sẽ đưa mô hình này tiến thêm một

Trang 20

bước nữa bằng cách triển khai một kết quả hoặc mục tiêu mong muốn, sau đóđưa ra quyết định về cách tốt nhất để tiến tới mục tiêu đó.

2.4 Tác tử hướng lợi ích (Utility based agents)

Tác tử dựa trên tiện ích là tác tử hành động không chỉ dựa trên mục tiêu

là gì, mà còn là cách tốt nhất để đạt được mục tiêu đó Nói tóm lại, tính hữudụng (hay tiện ích) của tác tử làm cho nó trở nên khác biệt với các đối tác củanó

Các tác tử thực hiện hành động sao cho có lợi nhất về lâu dài

Các tác tử muốn thực hiện hành động đem lại lợi ích lớn hơn

Có thể suy luận về các nhiệm vụ có nhiều đích, về sự xung đột giữa cácđích, và về các tình huống không chắc chắn

Ví dụ: Bài toán robot lau nhà, thừa nhận rằng robot ưu tiên lau gạch

bẩn nhất là 1 mục tiêu nhỏ, lau sạch toàn bộ căn phòng là mục tiêu lớn, nhưng

đi theo viên gạch nào sẽ làm cho việc lau nhà hiệu quả nhất (tiết kiệm pin,thời gian, ít viên gạch bị lau lại lần 2 là 1 trong các tiêu chí đánh giá hiệuquả của robot) Từ đó, ta sinh ra hàm đánh giá lợi ích của tác tử

Trang 21

Hình 2 4 Sơ đồ hoạt động của tác tử hướng lợi ích

2.5 Tác tử học tập (Learning Agents)

Tác tử học hỏi trong AI là loại tác tử có thể học hỏi từ những kinhnghiệm trong quá khứ của nó hoặc nó có khả năng học hỏi Nó bắt đầu hànhđộng với kiến thức cơ bản và sau đó có thể hành động và thích ứng tự độngthông qua học tập

Các thành phần giúp tạo nên tác tử có khả năng học tập:

 Learning element: Giúp cái thiện hiệu quả hoạt động dựa trên các

đánh giá, để thay đổi cải thiện các thành phần hành động

 Critic: Để đánh giá hiệu quả hoạt động

 Problem generator: Có trách nhiệm đề xuất các hành động giúp sản

sinh dẫn đến có kinh nghiệm mới

 Performance element: Đảm nhiệm việc lựa chọn các hành động

Trang 22

Hình 2 5 Sơ đồ hoạt động của tác tử học tập

CHƯƠNG III: HỆ THỐNG ĐA TÁC TỬ 3.1 Khái niệm

Trong thế giới thực, tiềm năng tồn tại để phát triển các hệ thống phầnmềm được tạo thành các tác tử thông minh hợp tác để đạt được mục tiêuchung và trong quá khứ vài năm một số nghiên cứu đã được thực hiện tronglĩnh vực này Một ứng dụng rõ ràng cho công nghệ này sẽ là sự phát triển của

Trang 23

những người lính robot nơi một trung sĩ sẽ tổ chức và quản lý một đội các tưnhân Trong khi trung sĩ sẽ phát hành hướng dẫn cho nhóm, các rô bốt riêng

lẻ sẽ vẫn đưa ra các quyết định tự chủ phù hợp với vai trò của họ trong nhóm.Làm việc với tư cách một nhóm sẽ yêu cầu mục tiêu chung và khả năng tươngtác và giao tiếp

Hệ thống đa tác tử đã được áp dụng rộng rãi trong nhiều lĩnh vực ứngdụng vì những lợi thế có lợi mang lại Một số lợi ích có sẵn bằng cách sửdụng Công nghệ MAS trong các hệ thống lớn là:

 Tăng tốc độ và hiệu quả của hoạt động do song song tính toán và hoạtđộng không đồng bộ

 Sự xuống cấp của hệ thống khi một hoặc nhiều tác tử bị lỗi Nó do đólàm tăng độ tin cậy và mạnh mẽ của hệ thống

 Khả năng mở rộng và tính linh hoạt- Có thể thêm các tác tử khi cầnthiết

 Giảm chi phí- Điều này là do các tác tử riêng lẻ có chi phí thấp hơnnhiều so với kiến trúc tập trung

 Các tác tử tái sử dụng có cấu trúc mô-đun và chúng có thể dễ dàng thaythế trong hệ thống khác hoặc được nâng cấp dễ dàng hơn hệ thốngnguyên khối

Mặc dù hệ thống đa tác tử có các tính năng có lợi hơn tác tử đơn lẻ

hệ thống, chúng cũng đưa ra một số thách thức quan trọng

Môi trường (Environment): Trong một hệ thống nhiều tác tử, hànhđộng của một tác tử không chỉ sửa đổi môi trường của riêng mình mà còn củacác nước láng giềng Điều này đòi hỏi mỗi tác tử phải dự đoán hành động củacác tác tử khác để quyết định hành động tối ưu sẽ được hướng đến mục tiêu.Kiểu học đồng thời này có thể dẫn đến hành vi và có thể gây ra hỗn loạn Vấn

đề còn phức tạp hơn, nếu môi trường năng động Sau đó, mỗi tác tử cần phải

Trang 24

phân biệt giữa các tác động gây ra do các hành động tác tử khác và các biếnthể trong chính môi trường.

Nhận thức (Perception): Trong một hệ thống nhiều tác tử phân tán, cáctác tử nằm rải rác trên Môi trường Mỗi tác tử có một khả năng cảm biến hạnchế vì phạm vi hạn chế và phạm vi phủ sóng của các cảm biến được kết nốivới nó Điều này giới hạn chế độ xem có sẵn cho mỗi các tác tử trong môitrường Do đó, các quyết định dựa trên các quan sát từng phần được thực hiệnbởi mỗi tác tử có thể là tối ưu dưới mức tối ưu và đạt được giải pháp toàn cầubằng cách điều này có nghĩa là trở nên khó chữa

Abstraction: Trong hệ thống tác tử, giả định rằng một tác tử biết toàn

bộ không gian hành động của nó và ánh xạ của không gian trạng thái sangkhông gian hành động có thể được thực hiện bằng kinh nghiệm Trong MAS,mọi tác tử không trải qua tất cả các trạng thái Để tạo một bản đồ, nó phải cókhả năng học hỏi kinh nghiệm của các tác tử khác có khả năng tương tự hoặc

ra quyết định quyền hạn Trong trường hợp các tác tử hợp tác với các mụctiêu tương tự, điều này có thể được thực hiện dễ dàng bằng cách tạo thông tinliên lạc giữa các tác tử Trong trường hợp các tác tử cạnh tranh thì không cóthể chia sẻ thông tin vì mỗi tác tử cố gắng tăng cơ hội của chính mình củachiến thắng Do đó, điều cần thiết là phải định lượng bao nhiêu thông tin địaphương và các khả năng của tác tử khác phải được biết đến để tạo ra một môhình cải tiến của Môi trường

Giải quyết xung đột (Conflict resolution): Xung đột bắt nguồn từ việc thiếucái nhìn toàn cầu cho mỗi các tác tử Một hành động được chọn bởi một tác tử

để sửa đổi một trạng thái nội bộ cụ thể có thể là ảnh hưởng cho một tác tửkhác Trong những trường hợp này, thông tin về các ràng buộc, sở thích hànhđộng và ưu tiên mục tiêu của các tác tử phải được chia sẻ giữa các tác tử đểcải thiện sự hợp tác Một vấn đề chính là biết khi nào nên truyền đạt thông tinnày và cho tác tử nào

Trang 25

Suy luận (Inference): Một suy luận của hệ thống tác tử đơn lẻ có thể dễ dàngrút ra bằng cách ánh xạ Trạng thái Không gian đến Không gian Hành độngdựa trên các phương pháp thử và sai Tuy nhiên trong MAS, điều này rất khó

vì môi trường đang được sửa đổi bởi nhiều tác tử có thể hoặc có thể khôngtương tác với nhau Hơn nữa, MAS có thể bao gồm tác tử không đồng nhất,

đó là các tác tử có các mục tiêu và khả năng khác nhau Này có thể không hợptác và cạnh tranh với nhau Xác định một phù hợp cơ chế suy luận phù hợpvới khả năng của từng tác tử là rất quan trọng trong đạt được giải pháp tối ưutoàn cầu

⇨ Không nhất thiết phải sử dụng hệ thống đa tác tử cho tất cả các ứng dụng.Một số cụ thể các miền ứng dụng có thể yêu cầu tương tác với những ngườikhác hoặc các tổ chức có các mục tiêu xung đột hoặc chung có thể có thể sửdụng những ưu điểm được MAS trình bày trong thiết kế của nó

3.2 Phân loại hệ thống đa tác tử

Việc phân loại MAS là một nhiệm vụ khó khăn vì nó có thể được thựchiện dựa trên một số các thuộc tính khác nhau như Kiến trúc , Học tập, Giaotiếp, Phối hợp Một phân loại chung bao gồm hầu hết các tính năng này

được thể hiện trong hình 3.1

Trang 26

Hình 3 1 Phân loại Hệ thống đa tác tử theo thuộc tính3.2.1 Kiến trúc bên trong (Internal Architecture)

Dựa trên kiến trúc bên trong của các tác tử riêng lẻ cụ thể hình thành hệthống đa tác tử, nó có thể được phân thành hai loại:

 Cấu trúc đồng nhất (Homogeneous structure)

 Cấu trúc không đồng nhất (Heterogeneous structure)

A, Cấu trúc đồng nhất (Homogeneous structure)

Trong một kiến trúc đồng nhất, tất cả các tác tử tạo thành hệ thống đatác tử đều có cùng một kiến trúc bên trong Kiến trúc bên trong đề cập đếnMục tiêu cục bộ, Cảm biến Khả năng, trạng thái bên trong, Cơ chế suy luận

và các hành động có thể xảy ra Các sự khác biệt giữa các tác tử là vị trí vật lý

Định dạng
Số trang	52
Dung lượng	755,31 KB