1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Báo cáo chuyên đề học phần môn hệ chuyên gia đề tài hệ chyên gia nhận dạng động vật

23 16 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Hệ Chuyên Gia Nhận Dạng Động Vật
Tác giả Nguyễn Quang Trung, Nguyễn Thạc Ánh
Người hướng dẫn Nguyễn Thị Thanh Tân
Trường học Trường Đại học Điện lực
Chuyên ngành Công nghệ Thông Tin
Thể loại Báo cáo chuyên đề học phần
Năm xuất bản 2023
Thành phố Hà Nội
Định dạng
Số trang 23
Dung lượng 3,52 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Hệ chuyêngia là một hệ thống thời gian thực real time system  Độ tin cậy cao good reliability: Không thể xảy ra sự cố hoặc giảm sút độtin cậy khi sử dụng  Dễ hiểuunderstandable: Hệ chu

Trang 1

TRƯỜNG ĐẠI HỌC ĐIỆN LỰC

KHOA CÔNG NGHỆ THÔNG TIN

BÁO CÁO CHUYÊN ĐỀ HỌC PHẦN MÔN

Hà Nội, tháng 1 năm 2023

Trang 2

PHIẾU CHẤM ĐIỂMSinh viên thực hiện:

Nguyễn Quang Trung

Trang 3

MỤC LỤC

L I M ĐẦẦU Ờ Ở 2

CH ƯƠ NG 1: GI I THI U VỀẦ H CHUYỀN GIA Ớ Ệ Ệ 3

1.1 Khái niệm 3

1.2 Vai trò của hệ chuyên gia trong đời sống 3

1.3 Đặc trưng và ưu điểm của hệ chuyên gia 4

1.4 Biểu diễn tri thức bằng mạng ngữ nghĩa 4

1.5 Biểu diễn tri thức bằng Ontology 5

1.6 Biểu diễn bằng cây quyết định 6

1.7 Mô hình m ng Bayer ạ 7

1.8 Thuật toán suy diễn 7

1.9 Thuật toán logic mờ (Fuzzy-logic) 9

CH ƯƠ NG 2: PHẦN TÍCH BÀI TOÁN VÀ THU T TOÁN S D NG Ậ Ử Ụ 10

2.1 Giới thiệu đề tài 10

2.2 Thuật toán 10

2.2 Ví dụ 11

2.3 Entropy trong cây quyếết đ nh ị 12

2.4 Data bài toán 14

2.5 L p đích ớ 15

2.6 Cây quyếết đ nh ị 15

CH ƯƠ NG 3: CH ƯƠ NG TRÌNH 17

3.1 From nh p thông tn ậ 17

3.2 Kếết quả 18

KẾẾT LU N Ậ 19

TÀI LI U THAM KH O Ệ Ả 20

Trang 4

LỜI MỞ ĐẦU

Trong thời đại ngày nay, tin học đã trở nên phổ biến với mọi người từ mọi cấphọc, từ mọi ngạch - bậc của xã hội như: giáo dục, thương mại, du lịch, y tế …Tinhọc giúp cho con người quản lý, điều hành công việc một cách nhanh hơn, hiệuquả hơn, và quan trọng là độ chính xác cao hơn

Chính vì lí do trên mà em đã lựa chọn đề tài cho đồ án tốt nghiệp cuối khóa là

Trang 5

CHƯƠNG 1: GIỚI THIỆU VỀ HỆ CHUYÊN GIA

1.1 Khái niệm

Hệ chuyên gia (Expert System) là một chương trình máy tính thông minh sửdụng tri thức (knowledge) và các thủ tục suy luận (inference procedures) để giảinhững bài toán tương đối khó khăn đòi hỏi những chuyên gia mới giải được» Hệchuyên gia là một hệ thống tin học có thể mô phỏng (emulates) năng lực quyếtđoán (decision) và hành động (making abilily) của một chuyên gia (con người) Hệchuyên gia là một trong những lĩnh vực ứng dụng của trí tuệ nhân tạo (ArtificialIntelligence) như hình dưới đây

Hình 1.1: Vai trò hệ chuyên gia1.2 Vai trò của hệ chuyên gia trong đời sống

Về điều khiển: Các hệ thống quản lý theo các phù hợp với hành vi của hệthống Chẳng hạn như quá trình sản xuất hay điều trị bệnh nhân Một hệ chuyên gia

về điều khiển lấy dữ liệu về các thao tác hệ thống, diễn giả dữ liệu này để hiểu vềtrạng thái hệ thống trong tương lai

Về thiết kế: Hệ thống có nhiệm vụ xây dựng các đối tượng theo các ràngbuộc Chẳng hạn như thiết kế máy tính theo các yêu cầu về bộ nhớ, tốc độ Các hệthống này thường thực hiện với các bước công việc, mỗi bước tuân theo một rằngbuộc riêng

Về chuẩn đoán: Các hệ thống chuẩn đoán chỉ ra các chức năng trong hệthống phát hiện lỗi dựa trên quan sát thông tin

Về diễn giả: Các hệ thống cho phép các tình huống bất ngờ từ thông tin cósẵn Điển hình là thông tin rút từ dữ liệu máy rò, thiết bị hay kết quả thí nghiệm

Trang 6

1.3 Đặc trưng và ưu điểm của hệ chuyên gia

Có 4 đặc trưng cơ bản của hệ chuyên gia:

 Hiệu quả cao (High performance): Khả năng trả lời với mức độ tinh thôngbằng hoặc cao hơn so với chuyên gia(người) trong lĩnh vực

 Thời gian trả lời thỏa đáng (adequate response time): Thời gian trả lời hợp

lý, bằng hoặc nhanh hơn so với người để đi đến cùng quyết định Hệ chuyêngia là một hệ thống thời gian thực (real time system)

 Độ tin cậy cao (good reliability): Không thể xảy ra sự cố hoặc giảm sút độtin cậy khi sử dụng

 Dễ hiểu(understandable): Hệ chuyên gia giải thích các bước suy luận mộtcách dễ hiểu và nhất quán

Các ưu điểm của hệ chuyên gia:

 Phổ cập: là sản phẩm chuyên gia, luôn được phát triển không ngừng với hiệuquả sử dụng không thể phủ nhận

 Giảm giá thành

 Tính thường trực: Bất kể lúc nào có thể khai thác sử dụng mà không cần đếnquyền can thiệt của con người

 Giảm rủi ro: Giúp con người tránh tiếp xúc trong các môi trường nguy hiểm

 Khả năng trả lời: Trả lời theo thời gian thực, khách quan

 Tính ổn định, suy luận có lý và đầy đủ

 Khả năng giảng giải: Câu trả lời với mức độ tinh thông được giải thích rất rõràng, dễ hiểu

1.4 Biểu diễn tri thức bằng mạng ngữ nghĩa

Mạng ngữ nghĩa là 1 trong các phương pháp biểu diễn đơn giản và dễ hiểu

để trình bày khá nhiều vấn đề Phương pháp trình bày của chúng dựa trên một đồthị Trong đó, các đỉnh là các đối tượng (Khái niệm), còn cung cấp cho chúng biếtmối quan hệ giữa các đối tượng với nhau

Trang 7

Hình 1.2: Khái niệm về mạng ngữ nghĩa1.5 Biểu diễn tri thức bằng Ontology

Ontolgy trong ngành Khoa Học Máy Tính là một thuật ngữ mang ý nghĩa làcác loại vật và quan hệ giữa chúng trong một hệ thống hay ngữ cảnh cần quan tâm.Các loại vật này còn được gọi là khái niệm, thuật ngữ hay từ vựng có thể được sửdụng trong một lĩnh vực chuyên môn nào đó Ontology cũng có thể hiểu là mộtngôn ngữ hay một tập các quy tắc được dùng để xây dựng một hệ thống Ontology.Một hệ thống Ontology định nghĩa một tập các từ vựng mang tính phổ biến tronglĩnh vực chuyên môn nào đó và quan hệ giữa chúng Sự định nghĩa này có thể đượchiểu bởi cả con người lẫn máy tính Một cách khái quát, có thể hiểu Ontology là

"một biểu diễn của sự khái niệm hoá chung được chia sẻ" của một miền hay lĩnhvực nhất định Nó cung cấp một bộ từ vựng chung bao gồm các khái niệm, cácthuộc tính quan trọng và các định nghĩa về các khái niệm và các thuộc tính này.Ngoài bộ từ vựng, Ontology còn cung cấp các ràng buộc, đôi khi các ràng buộcnày được coi như các giả định cơ sở về ý nghĩa mong muốn của bộ từ vựng, nóđược sử dụng trong một lĩnh vực mà có thể được giao tiếp giữa người và các hệthống ứng dụng phân tán khác

Ontology được sử dụng trong trí tuệ nhân tạo, công nghệ Web ngữ nghĩa(Semantic Web), các hệ thống kỹ thuật, kỹ thuật phần mềm, tin học y sinh và kiếntrúc thông tin như là một hình thức biểu diễn tri thức về thế giới hoặc một số lĩnhvực cụ thể Việc tạo ra các lĩnh vực về Ontology cũng là cơ sở để định nghĩa và sửdụng của cơ cấu một tổ chức kiến trúc (an enterprise architecture framework)

Trang 8

Hình 1.3: Ứng dụng của Ontology trong việc thiết kế từ điển1.6 Biểu diễn bằng cây quyết định

Cây quyết định (Decision Tree) là một cây phân cấp có cấu trúc được dùng

để phân lớp các đối tượng dựa vào dãy các luật (series of rules) Khi cho dữ liệu vềcác đối tượng gồm các thuộc tính cùng với lớp (classes) của nó, cây quyết định sẽ sinh ra các luật để dự đoán lớp của các đối tượng chưa biết (unseen data)

Decision Trees gồm 3 phần chính: 1 node gốc (root node), những node lá(leaf nodes) và các nhánh của nó (branches) Node gốc là điểm bắt đầu của câyquyết định và cả hai node gốc và node chứa câu hỏi hoặc tiêu chí để được trả lời.Nhánh biểu diễn các kết quả của kiểm tra trên nút Ví dụ câu hỏi ở node đầu tiênyêu cầu câu trả lời là “yes” hoặc là “no” thì sẽ có 1 node con chịu trách nhiệm chophản hồi là “yes”, 1 node là “no”

Hình 1.4: Mô hình biểu diễn cây quyết định

Trang 9

1.7 Mô hình mạng Bayer

Mạng Bayesian là một mô hình xác suất đồ thị sử dụng suy diễn Bayesian đểtính toán xác suất Mục đích của mạng Bayesian là mô hình hóa các phụ thuộc cóđiều kiện của các biến ngẫu nhiên bằng cách biểu diễn các phụ thuộc đó dưới dạngcác cạnh của đồ thị Đồ thị của mạng Bayesian biểu diễn các mối quan hệ về xácsuất và ta có thể sử dụng các quan hệ này để suy diễn và tính toán các biến ngẫunhiên của đồ thị một cách hiệu quả

Sử dụng các mối quan hệ xác suất trong mạng Bayesian, ta có thể biểu diễncác phân phối xác suất chung giữa các biến ngẫu nhiên một các trực quan qua việc

sử dụng các mối quan hệ độc lập có điều kiện Dứới đây là một ví dụ của mạngBayesian:

Hình 1.5: Mô hình Bayer

1.8 Thuật toán suy diễn

a) Suy diễn tiến:

 Suy diễn tiến là lập luận từ các sự kiện, sự việc để rút ra các kết luận Vídụ: Nếu thấy trời mưa trước khi ra khỏi nhà (sự kiện) thì phải lấy áo mưa

 Trong phương pháp này, người sử dụng cung cấp các sự kiện cho hệchuyên gia để hệ thống (máy suy diễn) tìm cách rút ra các kết luận có thể

 Kết luận được xem là những thuộc tính có thể được gán giá trị Trong sốnhững kết luận này, có thể có những kết luận làm người sử

Trang 10

dụng quan tâm, một số khác không nói lên điều gì, một số khác có thếvắng

mặt

 Các sự kiện thường có dạng : Attribute = Value

 Lần lượt các sự kiện trong cơ sở trí thức được chọn và hệ thống xem xéttất cả các luật mà các sự kiện này xuất hiện như là tiền đề Theo nguyêntắc lập luận trên, hệ thống sẽ lấy ra những luật thỏa mãn Sau khi gán giátrị cho các thuộc tính thuộc kết luận tương ứng, người ta nói rằng các sựkiện đã được thỏa mãn Các thuộc tính được gán giá trị sẽ là một phầncủa kết quả chuyên gia Sau khi mọi sự kiện đã được xem xét, kết quảđược xuất ra cho người sử dụng dùng

b) Suy diễn lùi:

 Phương pháp suy diễn lùi tiến hành các lập luận theo chiều ngược lại (đốivới phương pháp suy diễn tiến) Từ một giả thuyết (như là một kết luận),

hệ thống đưa ra một tình huống trả lời gồm các sự kiện là cơ sở của giảthuyết đã cho này

 Ví dụ: nếu ai đó vào nhà mà cầm áo mưa và quần áo bị ướt thì giả thuyếtnày là trời mưa Đe củng cố giả thuyết này, ta hỏi người đó xem có phảitrời mưa không? Nếu người đó trả lời là có thì giả thuyết trời mưa làđúng và trở thành một sự kiện Nghĩa là trời mưa nên phải cầm áo mưa

và quần áo bị ướt

 Suy diễn lùi là cho phép nhận được giá trị của một thuộc tính Đó là câutrả lời cho câu hỏi “giá trị của thuộc tính A là bao nhiêu?” với A là mộtđích

 Để xác định giá trị của A, cần có các nguồn thông tin Những nguồn này

có thể là những câu hỏi hoặc có thể là những luật Căn cứ vào các câuhỏi, hệ thống nhận được một cách trực tiếp từ người sử dụng những giátrị của thuộc tính liên quan Căn cứ vào các luật, hệ thống suy diễn có thểtìm ra giá trị sẽ là kết luận của một trong số các kết luận có thể của thuộctính liên quan,

 Ý tưởng của thuật toán suy diễn lùi như sau: Với mỗi thuộc tính đã cho,người ta định nghĩa nguồn của nó:

- Nếu thuộc tính xuất hiện như là tiền đề của một luật (phần đầu củaluật), thì nguồn sẽ thu gọn thành một câu hỏi

- Nếu thuộc tính xuất hiện như là hậu quả của một luật (phần cuối củaluật), thì nguồn sẽ là các luật mà trong đó, thuộc tính là kết luận

Trang 11

- Nếu thuộc tính là trung gian, xuất hiện đồng thời như là tiền đề và như

là kết luận, khi đó nguồn có thể là các luật, hoặc có thể là các câu hỏi màchưa được nêu ra

 Nếu mồi lần với câu hỏi đã cho, người sử dụng trả lời hợp lệ, giá trị trảlời này sẽ được gán cho thuộc tính và xem như thành công Nếu nguồn làcác luật, hệ thống sẽ lấy lần lượt các luật mà thuộc tính đích xuất hiệnnhư kết luận, để có thế tìm giá trị các thuộc tính thuộc tiền đề Nếu cácluật thỏa mãn, thuộc tính kết luận sẽ được ghi nhận

1.9 Thuật toán logic mờ (Fuzzy-logic)

Theo logic truyền thống (traditional logic), một biểu thức logic chỉ nhận mộttrong hai giá trị: True hoặc False Khác với lý thuyết logic truyền thống, một biểuthức logic mờ có thể nhận một trong vô số giá trị nằm trong khoảng số thực từ 0đến 1 Nói cách khác, trong logic truyền thống, một sự kiện chỉ có thể hoặc là đúng(tương đương với True - 1) hoặc là sai (tương đương với False - 0) còn trong logic

mờ, mức độ đúng của một sự kiện được đánh giá bằng một số thực có giá trị nằmgiữa 0 và 1, tuỳ theo mức độ đúng “nhiều” hay “ít” của nó

Giá trị của các biến trong biểu thức logic mờ không phải là các con số mà làcác khái niệm, ví dụ như “nhanh”, “trung bình”, “chậm” hay “nóng”, “vừa”,

“lạnh” Chính vì vậy cách giải quyết các bài toán trong logic mờ rất gần với cách

tư duy con người

Hình 1.6: Hệ suy diễn mờ

Hệ suy diễn mờ (mô tả trong hình 1) có cấu trúc cơ bản như sau:

 Giao diện mờ hóa: chuyển đổi các lớp đầu vào các biên độ phù hợp vớicác giá trị ngôn ngữ

 Cơ sở trí thức bao gồm 2 phần:

 Cơ sở dữ liệu: định nghĩa các hàm thuộc của các tập mờ được sử dụngtrong các luật mờ - Bộ luật: gồm các luật mờ IF – THEN

 Đơn vị thực thi: thực hiện các hoạt động suy diễn trong các luật

 Giao diện giải mờ: chuyển đổi các giá trị kết quả mờ của hệ suy diễn racác lớp đầu ra

Trang 13

CHƯƠNG 2: PHÂN TÍCH BÀI TOÁN VÀ THUẬT TOÁN SỬ DỤNG

2.1 Giới thiệu đề tài

Thừa cân béo phì nghĩa là tình trạng tích lũy mỡ quá mức và không bìnhthường tại một vùng cơ thể hay toàn thân gây ra nhiều nguy hại tới sức khỏe Nhìnchung, bệnh thừa cân béo phì thể hiện trọng lượng cơ thể cao hơn trọng lượngchuẩn ở một người khỏe mạnh Bệnh thừa cân béo phì là bệnh mãn tính do sự dưthừa quá mức lượng mỡ trong cơ thể Trong cơ thể chúng ta luôn có một lượng mỡnhất định và lượng mỡ này cần thiết để lưu trữ năng lượng, giữ nhiệt, hấp thụnhững chấn động và thể hiện các chức năng khác

Để đoán trước và phòng ngừa bệnh béo phì thi sau khi học hệ chuyên gia thì

áp dụng vào phần mềm Phần mềm có giao diện dễ nhìn, dễ sử dụng và thao tác2.2 Thuật toán

Giải thuật ID3 (gọi tắt là ID3) Được phát triển đồng thời bởi Quinlan trong

AI và Breiman, Friedman, Olsen và Stone trong thống kê ID3 là một giải thuậthọc đơn giản nhưng tỏ ra thành công trong nhiều lĩnh vực ID3 là một giải thuậthay vì cách biểu diễn tri thức học được của nó, tiếp cận của nó trong việc quản lýtính phức tạp, heuristic của nó dùng cho việc chọn lựa các khái niệm ứng viên, vàtiềm năng của nó đối với việc xử lý dữ liệu nhiễu

ID3 biểu diễn các khái niệm (concept) ở dạng các cây quyết định (decisiontree) Biểu diễn này cho phép chúng ta xác định phân loại của một đối tượng bằngcách kiểm tra các giá trị của nó trên một số thuộc tính nào đó

Như vậy, nhiệm vụ của giải thuật ID3 là học cây quyết định từ một tập các ví

dụ rèn luyện (training example) hay còn gọi là dữ liệu rèn luyện (training data).Input: Một tập hợp các ví dụ Mỗi ví dụ bao gồm các thuộc tính mô tả mộttình huống, hay một đối tượng nào đó, và một giá trị phân loại của nó

Output: Cây quyết định có khả năng phân loại đúng đắn các ví dụ trong tập

dữ liệu rèn luyện, và hy vọng là phân loại đúng cho cả các ví dụ chưa gặp trong tương lai

Giải thuật ID3 xây dựng cây quyết định được trình bày như sau:

Lặp:

1 Chọn A <= thuộc tính quyết định “tốt nhất” cho nút kế tiếp

Trang 14

2 Gán A là thuộc tính quyết định cho nút

3 Với mỗi giá trị của A, tạo nhánh con mới của nút

4 Phân loại các mẫu huấn luyện cho các nút lá

5 Nếu các mẫu huấn luyện được phân loại hoàn toàn thì NGƯNG,

Ngược lại, lặp với các nút lá mới

Thuộc tính tốt nhất ở đây là thuộc tính có entropy trung bình thấp nhất theo thuộc tính kết quả với Entropy được tính như sau:

 Gọi S là tập các mẫu huấn luyện

 Gọi p là tỷ lệ các mẫu dương trong S

 Ta có H ≡ – p.log p – (1 – p).log (1 – p) Entropy trung bình của một 2 2

thuộc tính bằng trung bình theo tỉ lệ của entropy các nhánh:

Tri thức dạng luật

Tri thức được biểu diễn dưới dạng luật:

 IF Điều kiện 1 ^ Điều kiện 2… THEN Kết luận

 Dễ hiểu với con người, được sử dụng chủ yếu trong cáchệ chuyên gia

 Rút luật từ cây quyết định: đi từ nút gốc đến nút lá, lấycác phép thửlàm tiền đề và phân loại của nút lá làm kết quả

Lưu ý: Một phiên bản khác của thuật toán ID3 sử dụng Informatic Gain thaycho entropy để chọn thuộc tính quyết định Công thức tính Informatic Gain nhưsau:

Gain(A) = Entropy(S) – Entropy(A)

Trong đó: S là tập mẫu và A là một thuộc tính Entropy(S): Độ hỗn loạn củatập S

Entropy(A): Độ hỗn loạn trung bình của thuộc tính A (Cách tính như trên)2.2 Ví dụ

Bạn muốn xem xét sự thành công của một bộ phim thông qua hai yếu tố: diễn viên chính của phim và thể loại phim:

Amitabh Bacchan Action Yes

Ngày đăng: 09/06/2023, 15:40

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w