1. Trang chủ
  2. » Luận Văn - Báo Cáo

Ứng dụng lý thuyết Bayes trong phân lớp để xây dựng hệ thống hỗ trợ chẩn đoán bệnh viêm phế quản

89 61 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 89
Dung lượng 3,44 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Để áp dụng công nghệ thông tin vào giải quyết vấn đề trên, ta cần có một hệ thống thu thập tri thức về các triệu chứng và dấu hiệu nhận biết viêm phế quản, sau đó tổ chức, biểu diễn tri

Trang 1

ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC BÁCH KHOA

TRỊNH QUỐC VIỆT

ỨNG DỤNG LÝ THUYẾT BAYES TRONG PHÂN LỚP ĐỂ XÂY DỰNG

HỆ THỐNG HỖ TRỢ CHẨN ĐOÁN

BỆNH VIÊM PHẾ QUẢN

LUẬN VĂN THẠC SĨ KỸ THUẬT

Đà Nẵng - Năm 2017

Trang 2

ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC BÁCH KHOA

TRỊNH QUỐC VIỆT

ỨNG DỤNG LÝ THUYẾT BAYES TRONG PHÂN LỚP ĐỂ XÂY DỰNG

HỆ THỐNG HỖ TRỢ CHẨN ĐOÁN

BỆNH VIÊM PHẾ QUẢN

Chuyên ngành: Khoa học máy tính

Mã số: 60.48.01.01

LUẬN VĂN THẠC SĨ KỸ THUẬT

Người hướng dẫn khoa học: PGS.TS VÕ TRUNG HÙNG

Đà Nẵng - Năm 2017

Trang 3

i

LỜI CAM ĐOAN

Tôi xin cam đoan :

Những nội dung trong luận văn này là do tôi thực hiện dưới sự hướng dẫn trực

tiếp của PGS.TS Võ Trung Hùng;

Mọi tham khảo dùng trong luận văn đều được trích dẫn rõ ràng và trung thực tên

tác giả, tên công trình, thời gian, địa điểm công bố;

Mọi sao chép không hợp lệ, vi phạm quy chế đào tạo, hay gian trá, tôi xin chịu

hoàn toàn trách nhiệm

Trang 4

TRANG TÓM TẮT

ỨNG DỤNG LÝ THUYẾT BAYES TRONG PHÂN LỚP ĐỂ XÂY DỰNG HỆ THỐNG

HỖ TRỢ CHẨN ĐOÁN BỆNH VIÊM PHẾ QUẢN Tóm tắt – Với thuật toán phân lớp Bayes áp dụng trong các trường hợp tính xác suất

cao nhất để phân lớp cho đối tượng Trong đề tài này áp dụng thuật toán để hỗ trợ chẩn đoán bệnh viêm phế quản nhầm giúp các bác sĩ không chuyên khoa, bác sĩ chưa có kinh nghiêm trong việc khám và chửa bệnh viêm phế quản hoặc trường hợp bác sĩ không có mặt một cách nhanh chống, kịp thời và chính xác Hệ thống hoạt động dựa vào máy suy diễn và tập luật đã được thu thập từ tri thức chuyên gia để đưa ra kết quả chẩn đoán Tri thức của chuyên gia đã trãi qua nhiều năm kinh nghiệm nghiên cứu về bệnh viêm phế quản Tất cả các tri thức thu thập được từ các bệnh án của các bệnh nhân và có sự góp ý của các chuyên gia (các bác sĩ chuyên khoa Hô – Hấp) hoàn toàn chính xác, đáng tin cậy Đề tài cũng đã tìm giải pháp cho việc tin học hóa các vấn đề về chẩn đoán bệnh trên thực tế, tạo điều kiện thuận lợi cho việc khám chữa bệnh, giúp bảo vệ sức khỏe và nâng cao chất lượng sống của cộng đồng

Từ khóa – Phân lớp Bayes, Chẩn đoán bệnh, Viêm phế quản, hỗ trợ bác sĩ, tin học hóa chẩn

đoán bệnh

BAYES 'THEORETICAL APPROACHES IN CLASSIFICATION FOR THE PREPARATION OF DIABETIC ADMINISTRATION SUPPORT SYSTEM Abstract - With the Bayesian classifier algorithm applied in the highest probability cases to

classify objects In this topic, algorithms are used to assist in the diagnosis of bronchitis It is used to help non-specialists, doctors who are not experienced in bronchitis examination and treatment, or who do not have a doctor Quick, timely and accurate way The inference system and the rule set were collected from expert knowledge to provide diagnostic results Expert knowledge has many years of experience in the study of bronchitis All the knowledge gained from the patients' medical records and the opinions of the experts (the respiratory physicians) are completely accurate and reliable The subject has also found a solution for the computerization of the problems of disease diagnosis in practice, facilitate the medical examination and treatment, help protect health and improve the quality of life of the community

Keywords - Bayesian class, Diagnosis, bronchitis, doctor support, computerization diagnosis

Trang 5

MỤC LỤC

LỜI CAM ĐOAN i

TRANG TĨM TẮT ii

MỤC LỤC iii

DANH MỤC CÁC BẢNG vi

DANH MỤC CÁC HÌNH vii

MỞ ĐẦU 1

1 Lí do chọn đề tài 1

2 Mục tiêu đối tượng của đề tài 2

3 Ý nghĩa khoa học và thực tiễn 3

4 Nội dung, phương pháp nghiên cứu 4

4.1 Các nội dung nghiên cứu 4

4.2 Các phương pháp nghiên cứu 5

CHƯƠNG 1 CƠ SỞ LÝ THUYẾT 6

1.1 Cơ sở tri thức 6

1.2 Các phương pháp biểu diễn tri thức 7

1.2.1 Biểu diễn tri thức bằng logic 7

1.2.2 Biểu diễn tri thức bằng hệ luật dẫn 9

1.2.3 Biểu diễn tri thức bằng Frame 10

1.2.4 Biểu diễn tri thức bằng mạng ngữ nghĩa 13

1.2.5 Biểu diễn tri thức bằng mạng các đối tượng tính tốn 14

1.3 Hệ chuyên gia 15

1.3.1 Định nghĩa 15

1.3.2 Cơ sở tri thức của hệ chuyên gia 18

1.3.3 Cấu trúc một hệ chuyên gia 20

1.3.4 Quy trình xây dựng hệ chuyên gia 21

1.3.5 Những thuận lợi và khĩ khăn của hệ chuyên gia 21

1.4 Phương Pháp Phân Loại Nạve Bayes 22

1.4.1 Khái niệm về phân lớp 22

1.4.2 Phương pháp phân lớp Nạve Bayes 23

1.4.3 Thuật tốn Nạve Bayes 24

CHƯƠNG 2 THIẾT KẾ CƠ SỞ TRI THỨC VÀ BỘ SUY DIỄN 26

2.1 Giới thiệu hệ thống 26

Trang 6

2.1.1 Mục đích, đối tượng sử dụng 26

2.1.2 Chức năng của hệ thống 26

2.1.2.1 Yêu cầu chức năng 26

2.1.2.2 Yêu cầu phi chức năng 27

2.2 Tri thức về viêm phế quản 27

2.2.1 Định nghĩa về viêm phế quản 27

2.2.2 Nguyên nhân của viêm phế quản 27

2.2.2.1 Viêm phế quản cấp 27

2.2.2.2 Viêm phế quản mạn 28

2.2.3 Triệu chứng của viêm phế quản 30

2.2.3.1 Viêm phế quản cấp 30

2.2.3.2 Viêm phế quản mạn 30

2.3 Mô hình biểu diễn tri thức viêm phế quản 32

2.4 Tổ chức và lưu trữ tri thức lên máy tính 38

2.5 Quy trình chẩn đoán viêm phế quản 40

2.5.1 Khám lâm sàng 40

2.5.2 Khám cận lâm sàng 40

2.5.3 Quy trình chẩn đoán lâm sàng, cận lâm sàng 41

2.6 Thuật giải trong chẩn đoán viêm phế quản 42

2.6.1 Ý tưởng 42

2.6.2 Thuật giải 43

CHƯƠNG 3 CÀI ĐẶT VÀ KIỂM THỬ 45

3.1 Sơ lược hệ thống 45

3.2 Các Mô-đun của hệ thống 57

3.3 Nền tảng công nghệ sử dụng 66

3.4 Cài đặt hệ thống 67

3.4.1 Các chức năng của hệ thống 67

3.4.2 Các thành phần của hệ thống 67

3.4.2.1 Form chính của hệ thống 67

3.4.2.2 Form đăng nhập hệ thống 68

3.4.2.3 Form cập nhật thông tin về triệu chứng lâm sàng và cận lâm sàng 68

3.4.2.4 Form cập nhật thông tin về danh sách các loại bệnh 69

3.4.2.5 Form cập nhật thông tin về luật 69

3.4.2.6 Form chẩn đoán chọn dữ liệu bình thường 69

3.4.2.7 Form chẩn đoán chọn dữ liệu có định hướng 70

Trang 7

3.5 Kiểm thử hệ thống 71

KẾT LUẬN VÀ KIẾN NGHỊ 72

1 Kết quả đạt được 72

2 Một số hạn chế 72

3 Hướng phát triển 72

TÀI LIỆU THAM KHẢO 73 QUYẾT ĐỊNH GIAO ĐỀ TÀI

BẢN SAO KẾT LUẬN CỦA HỘI ĐỒNG, BẢN SAO NHẬN XÉT CỦA CÁC

PHẢN BIỆN

Trang 9

2.3 Tỉ lệ tử vong giữa nam và nữ do viêm phế quản 29

3.5 Sơ đồ giải thuật thêm triệu chứng vào hệ thống 60 3.6 Sơ đồ giải thuật sửa triệu chứng trong hệ thống 61 3.7 Sơ đồ giải thuật xóa triệu trong hệ thống 62

3.10 Sơ đồ giải thuật xóa bệnh trong hệ thống 65

Trang 10

MỞ ĐẦU

1 Lí do chọn đề tài

Hàng năm trên thế giới có hơn 4 triệu người tử vong do các bệnh liên quan đến đường hô hấp, trong đó phổ biến nhất là viêm phế quản (Bronchitis) Viêm phế quản là bệnh thường gặp ở trẻ em, bất kể lứa tuổi nào và thời tiết nào, đặc biệt là trẻ ở thành thị cũng như ở các nơi tập trung dân cư đông đúc thì tỉ lệ bệnh còn cao hơn Thế giới hiện có khoảng 300 triệu người mắc viêm phế quản và khoảng 250.000 trường hợp tử vong vì viêm phế quản mỗi năm Tỷ lệ mắc viêm phế quản ước tính khoảng 6-8% ở người lớn và khoảng 10-12% ở trẻ em dưới 15 tuổi Ở Việt Nam, các nghiên cứu cho thấy, tỷ lệ mắc viêm phế quản dao động từ 1,1% ở

Đà Lạt cho tới cao nhất là 5,5% ở cư dân một số khu vực Hà Nội[2] Theo bảng thống kê năm 2013 của bộ y tế ta có số liệu sau:

Bảng 1 Thống kê các bệnh mắc cao nhất toàn quốc

Chính vì vậy, hiểu biết một số nguyên nhân và cách đề phòng của căn bệnh này

sẽ làm giảm thiểu số ca bệnh, đề phòng được các biến chứng và nâng cao chất lượng cuộc sống Đồng thời cũng làm giảm nguy cơ dẫn đến các biến chứng do bệnh này gây

ra như hen phế quản, ung thư phế quản, viêm phổi, áp xe phổi, suy hô hấp cấp…

Để áp dụng công nghệ thông tin vào giải quyết vấn đề trên, ta cần có một hệ thống thu thập tri thức về các triệu chứng và dấu hiệu nhận biết viêm phế quản, sau đó

tổ chức, biểu diễn tri thức này bằng lý thuyết Bayes trong phân lớp để xây dựng hệ chuyên gia chẩn đoán bệnh viêm phế quản Chính vì vậy, sau khi tham khảo ý kiến của các chuyên gia về công nghệ thông tin và y khoa, tôi đã chọn nghiên cứu hướng đề tài:

Trang 11

“Ứng dụng Lý thuyết Bayes trong phân lớp để Xây dựng Hệ thống hỗ trợ Chẩn đoán bệnh Viêm phế quản”

Chương trình dựa trên tri thức của các bác sĩ chuyên khoa Nội - Hô hấp tại phòng khám đa khoa trường ĐH Trà Vinh có kiến thức chuyên sâu, có kinh nghiệm lâm sàng

về viêm phế quản để phân tích những dấu hiệu, triệu chứng nhằm đưa ra chẩn đoán chính xác để có cách điều trị nhanh chóng và kịp thời Chương trình có giao diện thân thiện, dễ sử dụng, thể hiện được sự tương tác với người dùng như trong quy trình chẩn đoán bệnh thực tế tại các bệnh viện hay phòng khám Đồng thời chương trình cũng có

ý nghĩa quan trọng trong việc giúp các bác sĩ không chuyên nội hô hấp có thể đưa ra những chẩn đoán chính xác và nhanh chóng trong tình huống chưa có bác sĩ chuyên khoa kịp thời

2 Mục tiêu đối tượng của đề tài

Từ nhu cầu thực tiễn trong cuộc sống về khám chữa bệnh cộng với những động lực đã nêu trên, đề tài mong muốn ứng dụng công nghệ thông tin vào lĩnh vực y khoa

và đặc biệt là chuyên khoa hô hấp để chẩn đoán bệnh viêm phế quản Đề tài cũng sẽ tìm hiểu và nghiên cứu về các mô hình biểu diễn tri thức và những phương pháp, kĩ thuật xây dựng hệ chuyên gia để vận dụng vào việc xây dựng hệ hỗ trợ chẩn đoán bệnh một cách tự động Như vậy, đề tài hướng tới việc xây dựng một hệ hỗ trợ chẩn đoán bệnh viêm phế quản có cơ sở tri thức từ các bác sĩ chuyên khoa Nội - Hô hấp để hỗ trợ cho các bác sĩ chưa có nhiều kinh nghiệm hoặc các bác sĩ không chuyên về Nội - Hô hấp có thể tham khảo kinh nghiệm chẩn đoán và điều trị của các bác sĩ chuyên khoa nhằm đưa ra những quyết định chính xác trong trường hợp chưa có bác sĩ chuyên khoa kịp thời

Hệ hỗ trợ chẩn đoán này đáp ứng một số yêu cầu từ ý kiến của chuyên gia, có giao diện mang tính tương tác và hệ thống thử nghiệm trên các bệnh án thực tế Hệ thống có cơ sở tri thức từ các chuyên gia cấp cao để hỗ trợ cho bác sĩ chưa có nhiều kinh nghiệm hay các bác sĩ tuyến huyện Có thể nói, đây là một chương trình có tính ứng dụng thực tế cao Cụ thể, dữ liệu vào ra của hệ chẩn đoán như sau:

 Input:

- Một số triệu chứng của bệnh nhân có nghi ngờ viêm phế quản

Trang 12

- Một số xét nghiệm cận lâm sàng cần thiết như chụp X- Quang, xét nghiệm máu (chủ yếu về số lượng bạch cầu và tốc độ máu lắng), xét nghiệm cấy đàm (tìm virus), xét nghiệm dịch màn phổi (tìm khuẩn lao), soi phế quản

- Nghiên cứu tri thức và kinh nghiệm thực tế của các bác sĩ chuyên khoa

để thu thập, xây dựng và biểu diễn tri thức về bệnh viêm phế quản lên máy tính

- Xây dựng hệ chẩn đoán nhằm hỗ trợ các bác sĩ không chuyên trong việc đưa ra các kết luận về tình trạng bệnh để có phương pháp điều trị phù hợp Chương trình hỗ trợ cho các bác sĩ không thuộc chuyên khoa Nội – Hô hấp, các bác sĩ đa khoa tuyến huyện chưa có kiến thức chuyên sâu về bệnh viêm phế quản Chương trình hỗ trợ bác sĩ trong việc kết luận bệnh

3 Ý nghĩa khoa học và thực tiễn

3.1 Ý nghĩa khoa học

Đề tài nghiên cứu và áp dụng những phương pháp, kĩ thuật xử lý của chuyên ngành công nghệ thông tin vào y khoa, từ đó ứng dụng vào hệ chuyên gia để hỗ trợ chẩn đoán bệnh như sau:

- Thu thập cơ sở tri thức y khoa về viêm phế quản

- Biểu diễn cơ sở tri thức đã thu thập

- Thiết kế mô hình cơ sở tri thức phù hợp

- Xây dựng phần mềm trên cơ sở tri thức đã có

Như vậy, thông qua ứng dụng này có một số đóng góp về mặt kĩ thuật biểu diễn tri thức và suy luận Dựa trên cơ sở kĩ thuật ứng dụng chương trình giải quyết những

Trang 13

xây dựng mô hình biểu diễn tri thức và đưa ra những kết quả chẩn đoán cho bệnh nhân viêm phế quản Đề tài đã đưa ra một mô hình tri thức áp dụng phương pháp thiết kế hệ

cơ sở tri thức dựa vào hệ chuyên gia, phương pháp biểu diễn và kĩ thuật xử lý tri thức phức tạp trong lĩnh vực y khoa là một đóng góp về mặt khoa học của đề tài

3.2 Ý nghĩa thực tiễn

Vấn đề chẩn đoán và điều trị bệnh viêm phế quản đã được các bác sĩ chuyên khoa

áp dụng thường xuyên trong việc khám bệnh thực tế tại bệnh viện Tuy nhiên việc đưa tri thức của các chuyên gia này vào mô hình biểu diễn tri thức để ứng dụng nó trong tin học thì chưa được tiến hành, vì vậy việc ứng dụng công nghệ tri thức để biểu diễn

và ứng dụng vào lĩnh vực y khoa để xây dựng một hệ thống chẩn đoán tự động có ý nghĩa thực tiễn rất lớn

Đề tài này mang tính ứng dụng thực tế rất cao do nhu cầu của con người cần có một chương trình hỗ trợ cho việc chẩn đoán và phát hiện bệnh sớm để kịp thời chữa trị Trong khi làm ứng dụng này, tôi đã nghiên cứu tìm hiểu một số phương pháp, kĩ thuật để thiết kế chương trình nhằm xây dựng một hệ chuyên gia phù hợp hơn so với chương trình ứng dụng thông thường Sử dụng mô hình mới để xây dựng một hệ chuyên gia hỗ trợ cho việc chẩn đoán bệnh trong lĩnh vực Y khoa là một công cụ giúp nâng cao hiệu quả công việc và mang tính thực tiễn rất cao

4 Nội dung, phương pháp nghiên cứu

4.1 Các nội dung nghiên cứu

Nội dung nghiên cứu của đề tài được chia ra làm 5 chương như sau:

 Chương 1: Cơ sở lý thuyết để thực hiện đề tài: gồm các kiến thức lý thuyết về

hệ chuyên gia, các cơ sở tri thức, các phương pháp biểu diễn tri thức, các mô hình biểu diễn tri thức, các kĩ thuật suy diễn trong việc xây dựng một hệ chuyên gia

 Chương 2: Thiết kế cơ sở tri thức và bộ suy diễn: thu thập tri thức về bệnh viêm phế quản, xây dựng mô hình tri thức thu thập được, tổ chức và lưu trữ tri thức đã có lên máy tính và xây dựng thuật giải theo quy trình chẩn đoán viêm phế quản thực tế

 Chương 3: Cài đặt và kiểm thử: trên cơ sở tri thức đã tổ chức, tiến hành xây dựng hệ chẩn đoán và thử nghiệm trên các mẫu bệnh án đã thu thập

Trang 14

 Kết luận và hướng phát triển: trình bày những kết quả đạt được của đề tài cũng như những mặt hạn chế cần khắc phục, phát triển

4.2 Các phương pháp nghiên cứu

Đề tài này sẽ kết hợp hai phương pháp nghiên cứu:

 Phương pháp phân tích, tổng hợp: thu thập tri thức từ các hồ sơ bệnh án về bệnh viêm phế quản tại phịng khám đa khoa trường ĐH Trà Vinh, đồng thời cũng thu thập tri thức từ các bác sĩ chuyên khoa Nội - Hơ hấp của bệnh viện để phân tích và xử lý

dữ liệu Ngồi việc đọc các tài liệu chuyên ngành cơng nghệ thơng tin để tìm hiểu cách biểu diễn tri thức và các phương pháp suy diễn cịn đọc thêm các tài liệu chuyên ngành y để cĩ kiến thức về bệnh viêm phế quản

 Nghiên cứu thuật tốn Bayes trong phân lớp: nghiên cứu cách biểu diễn tri thức

để xây dựng kho tri thức cho phù hợp với thuật tốn Bayes trong phân lớp (Nạve

Bayes classifiers)

Trang 15

Chương 1 CƠ SỞ LÝ THUYẾT

1.1 Cơ sở tri thức

Tri thức[1]là những gì mà một người có thể biết và hiểu được Tri thức có thể được phân loại thành tri thức có cấu trúc hoặc không có cấu trúc, tri thức rõ ràng hay tri thức ngụ ý, không rõ ràng Những gì mà chúng ta biết được thường là các tri thức rõ ràng Tri thức không có cấu trúc mà vẫn hiểu được, nhưng không được phát biểu rõ ràng là các tri thức ngầm ý, tri thức không rõ Khi tri thức được tổ chức để có thể chia

sẻ thì lúc đó tri thức được gọi là tri thức có cấu trúc Để có thể chuyển đổi từ tri thức không rõ ràng sang tri thức rõ ràng thì tri thức đó cần phải được cấu trúc hóa và định dạng lại Tri thức có thể được phân loại thành các loại như sau:

- Tri thức thủ tục: trong thực tế, nhiều bài toán mà ta có thể gặp là các bài toán mà tri thức không đơn thuần là khái niệm hay mô tả mà là một hành động hay một công thức, thủ tục Ta gọi các tri thức như vậy là các tri thức thủ tục (diễn tả các vấn đề được giải quyết)

- Tri thức mô tả: cho biết một vấn đề được thấy như thế nào

- Tri thức Meta: diễn tả tri thức về tri thức

- Tri thức may rủi: diễn tả các luật may rủi dẫn dắt quá trình suy lý Tri thức này có được dựa trên kinh nghiệm tích lũy nên còn gọi là hueristic

- Tri thức cấu trúc: mô tả mô hình tri thức tổng quát của chuyên gia về một vấn đề

Tùy thuộc vào ứng dụng cụ thể mà tri thức được biểu diễn theo những phương thức khác nhau Ứng với mỗi dạng biểu diễn đó có một cơ chế để xử lý tri thức đó Hệ

cơ sở tri thức là một tập hợp các cơ sở lập luận, các luật, các quy trình, thủ tục được tổ chức thành một lược đồ Đó là tập hợp của tất cả các thông tin cũng như tất cả các kiến thức về một lĩnh vực cụ thể nào đó

Quá trình thu thập tri thức được gọi là quá trình rút trích tri thức và định dạng tri thức được thực hiện từ nhiều nguồn khác nhau, đặc biệt là từ các chuyên gia trong các lĩnh vực cụ thể Công việc này là một trong những bước quan trọng và thường mất rất nhiều thời gian cũng như công sức trong quá trình xây dựng một hệ cơ sở tri thức được sử dụng trong hệ chuyên gia Trong quá trình phát triển một hệ chuyên gia, các

Trang 16

kỹ sư tri thức, những nhà chuyên môn trong lĩnh vực trí tuệ nhân tạo, có nhiệm vụ thu thập tri thức từ các chuyên gia thuộc lĩnh vực chuyên ngành Sau đó “sao chép” các tri thức đó vào cơ sở tri thức và diễn đạt các tri thức đó dưới dạng có thể dùng được trong

hệ chuyên gia

1.2 Các phương pháp biểu diễn tri thức

1.2.1 Biểu diễn tri thức bằng logic

Dựa vào các khái niệm cơ bản về logic mệnh đề và logic vị từ, với một số bài toán, các trạng thái được mô tả qua các biểu thức logic Sử dụng các ký hiệu để mô tả tri thức Mỗi ký hiệu nhằm diễn tả một khái niệm nào đó trong lĩnh vực đang xét, và mỗi ký hiệu này mang 2 giá trị luận lý là đúng hoặc sai Khi đó bài toán được phát biểu dưới dạng: Chứng minh: Từ GT1 GT2 … GTm suy ra một trong các kết luận:

KL1, …,KLn Ở đây: GTi, KLj là các biểu thức logic (mệnh đề hoặc vị từ)

Các phép toán logic được sử dụng phổ biến của dạng là: and (^), or (v), not (~)

và phép kéo theo (→), tương đương (≡) Ví dụ: Tri thức “nếu trời mưa và xe máy hư thì đi xe buýt” được biểu diễn là: s^p → r, trong đó s diễn tả khái niệm trời mưa, p diễn tả khái niệm xe hư, r là đi xe buýt Như vậy mô hình cho phương pháp này bao gồm: tập các ký hiệu và tập các luật để diễn đạt các sự kiện và luật trong hệ cơ sở tri thức

Phương pháp suy luận trong các biểu diễn này là sử dụng suy diễn tiến, suy diễn lùi hoặc kết hợp cả hai Phương pháp suy diễn tiến là suy dẫn từ giả thuyết đi đến kết luận và suy diễn lùi là truy ngược từ kết luận trở về giả thuyết

Cho bài toán suy diễn: Tập luật R={Ri: nếu l(Ri) thì r(Ri), i=1,2, , n}

Ghi chú: l(Ri): vế trái luật Ri

r(Ri): vế phải luật Ri

 Thuật giải suy diễn tiến

- Đầu vào: Tập giả thiết G và tập kết luận K

- Đầu ra: thành công hay thất bại

Bước 1: GT ← G

Trang 17

Bước 3: Từ R chọn luật Ri sao cho l(Ri) G

GT ← GT r(Ri)

Quay lại bước 2

Nếu không chọn được Ri thì dừng thất bại

 Thuật giải suy diễn lùi

- Đầu vào: Tập giả thiết G và tập kết luận K

- Đầu ra: thành công hay thất bại

Bước 1: O ← K: // O là tập các sự kiện kết luận cần chứng minh

Bước 2: nếu O G thì dừng thành công, ngược lại qua bước 3

Bước 2: chứng minh tất cả các sự kiện giả thiết của một luật nào đó trong G

mà có kết luận K

Mô hình biểu diễn này rất khó áp dụng trong thực tế vì các phát biểu (sự kiện) được mô tả quá đơn giản, và giá trị của các phát biểu này là đúng, sai Trong khi đó tri thức của mỗi lĩnh vực thì phức tạp và mô tả trong tri thức là đa dạng

 Logic vị từ và logic mệnh đề có các ưu điểm sau:

- Là ngôn ngữ biểu diễn kiểu mô tả

- Có khả năng suy diễn đối với các cơ chế quen thuộc: Pronens&Tollens

- Khá trực quan với người sử dụng

- Khá gần gũi về cú pháp với các lệnh lập trình logic, chẳng hạn như PROLOG

- Có thể dùng để mô tả cấu trúc mô hình và xử lý động mô hình

- Có thể kiểm tra tính mâu thuẫn trong cơ sở tri thức

- Tính mô đun cao, do vậy các tri thức có thể them bớt sửa đổi khá độc lập với nhau và các cơ chế suy diễn

 Một số điểm yếu của logic:

- Mức độ hình thức hóa cao, dẫn tới khó hiểu ngữ nghĩa của các vị từ khi xét chương trình

Trang 18

- Năng xuất xử lý thấp Một trong những khó khăn cơ bản của quá trình suy diễn là cơ chế hợp và suy diễn vét cạn

- Do các tri thức được biểu diễn nhờ các vị từ, nên ưu thế sử dụng cấu trúc

dữ liệu không được khai thác triệt để

1.2.2 Biểu diễn tri thức bằng hệ luật dẫn

Một hệ luật dẫn được mô tả dưới dạng nếu <giả thiết> thì <kết luận> Đây là dạng biểu diễn tri thức rất phổ biến Mô hình biểu diễn tri thức dạng này thường bao gồm: tập các ký hiệu mô tả các sự kiện (có cấu trúc đơn giản) và tập luật dẫn Trong

đó phần giả thiết và kết luận của luật là tập các sự kiện Mỗi sự kiện được mô tả có cấu trúc đơn giản như (tên đối tượng – thuộc tính – giá trị) Ví dụ: quả cam – màu vàng

Mô hình biểu diễn tri thức dạng này có những ưu điểm là dễ hiểu, dễ giải thích

vì các khái niệm được mô tả có cấu trúc tương đối đơn giản Có thể xây dựng cơ chế suy luận dễ dàng bằng cách áp dụng phương pháp suy diễn tiến hay lùi Ngoài ra, các luật được biểu diễn theo mô hình này thường độc lập nhau nên việc cập nhật luật, hiệu chỉnh và bảo trì hệ thống thuận lợi Tuy nhiên, từ những đặc điểm trong các biểu diễn tri thức dạng này tạo nên ưu điểm thì nó cũng tạo ra các khuyết điểm sau: Chính vì các

sự kiện có cấu trúc đơn giản, trong khi tri thức của một số lĩnh vực lại trừu tượng và phức tạp, các khái niệm của lĩnh vực có quan hệ ràng buộc lẫn nhau nên mô hình biểu diễn này không thể hiện được hết tất cả những yếu tố trừu tượng đó

 Ưu điểm:

- Cách biểu diễn khá đơn giản và trực quan

- Có thể suy diễn theo chiến lược khác nhau: suy diễn tiến, suy diễn lùi và suy diễn hỗn hợp

- Khá gần gũi về cú pháp

- Có thể kiểm tra tính mâu thuẫn giữa các luật

- Tính mô đun cao, có nghĩa là việc thêm, sửa đổi hoặc loại bỏ các luật hoàn toàn không có ảnh hưởng tới các luật khác và cơ chế suy diễn

 Nhược điểm:

- Năng xuất xử lý thấp

Trang 19

- Không sử dụng được các cấu trúc dữ liệu

1.2.3 Biểu diễn tri thức bằng Frame

Frame là một cấu trúc dữ liệu chứa đựng tất cả những tri thức liên quan đến một đối tượng cụ thể nào đó Frames có liên hệ chặt chẽ đến khái niệm hướng đối tượng (thực ra Frame là nguồn gốc của lập trình hướng đối tượng) Ngược lại với các phương pháp biểu diễn tri thức đã được đề cập đến, frame “đóng gói” toàn bộ một đối tượng, tình huống hoặc cả một vấn đề phức tạp thành một thực thể duy nhất có cấu trúc Một frame bao hàm trong đó một khối lượng tương đối lớn tri thức về một đối tượng, sự kiện, vị trí, tình huống hoặc những yếu tố khác Do đó, frame có thể giúp ta mô tả khá chi tiết một đối tượng

Dưới một khía cạnh nào đó, người ta có thể xem phương pháp biểu diễn tri thức bằng frame chính là nguồn gốc của ngôn ngữ lập trình hướng đối tượng Ý tưởng của phương pháp này là “thay vì bắt người sử dụng các công cụ phụ như dao mở để đồ hộp, ngày nay các hãng sản xuất đồ hộp thường gắn kèm các nắp mở đồ hộp ngay bên trên vỏ lon Như vậy, người dùng sẽ không bao giờ phải lo lắng đến việc tìm một thiết

bị để mở đồ hộp nữa” Cũng vậy, ý tưởng chính của frame (hay của phương pháp lập trình hướng đối tượng) là khi biểu diễn một tri thức, ta sẽ “gắn kèm” những thao tác thường gặp trên tri thức này Chẳng hạn như khi mô tả khái niệm về hình chữ nhật, ta

sẽ gắn kèm cách tính chu vi, diện tích

Frame thường được dùng để biểu diễn những tri thức “chuẩn” hoặc những tri thức được xây dựng dựa trên những kinh nghiệm hoặc các đặc điểm đã được hiểu biết cặn kẽ Bộ não của con người chúng ta vẫn luôn “lưu trữ” rất nhiều các tri thức chung

mà khi cần, chúng ta có thể “lấy ra” để vận dụng nó trong những vấn đề cần phải giải quyết Frame là một công cụ thích hợp để biểu diễn những kiểu tri thức này

Phương pháp biểu diễn tri thức bằng Frame có tất cả các tính chất vốn có của một ngôn ngữ biểu diễn tri thức Nghĩa là nó có thể biểu diễn tri thức ở góc độ giao diện người-máy, góc độ mô tả mô hình, điều khiển hệ thống Đồng thời nó cũng là một

cơ sở cho phương pháp xử lý thông tin mới – hướng đối tượng Nếu phương pháp nhờ logic và mạng ngữ nghĩa dùng để biểu diễn tri thức mô tả và phương pháp luật sản xuất dùng để biểu diễn tri thức thủ tục thì các Frame là kết hợp của cả 2 dạng biểu

Trang 20

diễn: mô tả và thủ tục Frame tận dụng các ưu điểm của luật sản xuất, vị từ, cũng như mạng ngữ nghĩa

Cấu trúc của Frame: Mỗi một frame mô tả một đối tượng (object) Một frame bao gồm 2 thành phần cơ bản là slot và facet Một slot là một thuộc tính đặc tả đối tượng được biểu diễn bằng frame Ví dụ: trong frame mô tả xe hơi, có hai slot là trọng lượng

và loại máy Mỗi slot có thể chứa một hoặc nhiều facet Các facet (đôi lúc gọi là slot

“con”) đặc tả một số thông tin hoặc thủ tục liên quan đến thuộc tính được mô tả bởi slot

- Facet có nhiều loại khác nhau, sau đây là một số facet thường gặp

- Value (giá trị): chi biết giá trị của thuộc tính đó (như xanh, đỏ, tím, vàng nếu slot là màu xe)

- Dafault (giá trị mặc định): hệ thống sẽ tự động sử dụng giá trị trong facet này nếu slot là rỗng (nghĩa là chẳng có đặc tả nào!) Chẳng hạn trong frame về

xe, xét slot về số lượng bánh Slot này sẽ có giá trị 4 Nghĩa là, mặc định một chiếc xe hơi sẽ có 4 bánh

- Range (miền giá trị): (tương tự như kiểu biến), cho biết giá trị slot có thể nhận những loại giá trị gì (như số nguyên, số thực, chữ cái )

- If added: mô tả một hành động sẽ được thi hành khi một giá trị trong slot được thêm vào (hoặc được hiệu chỉnh) Thủ tục thường là viết dưới dạng một script

- If needed: được sử dụng khi slot không có giá trị nào Facet mô tả một hàm để tính ra giá trị của slot

Trong thực tế, một hệ thống trí tuệ nhân tạo thường sử dụng nhiều frame được liên kết với nhau theo một cách nào đó Một trong những điểm thú vị của frame là tính phân cấp Đặc tính này cho phép kế thừa các tính chất giữa các frame Hình sau đây cho thấy cấu trúc phân cấp của các loại hình học cơ bản Gốc của cây ở trên cùng tương ứng với mức độ trừu tượng cao nhất Các frame nằm ở dưới cùng (không có frame con nào) gọi là lá Những frame nằm ở mức thấp hơn có thể thừa kế tất cả những tính chất của những frame cao hơn Các frame cha sẽ cung cấp những mô tả

Trang 21

thường, frame cha sẽ bao gồm các định nghĩa của các thuộc tính Còn các frame con sẽ chứa đựng giá trị thực sự của các thuộc tính này

Ví dụ về một Frame mô tả tập HOCSINH

Cấu trúc này cho ta một khung dữ liệu để khoanh vùng các đối tượng là học sinh Trường hợp gặp một người cao 180 cm, nặng 45 kg ta có thể khẳng định rằng đó không phải học sinh, vì không thỏa mãn các ràng buộc đã có

 Ưu điểm:

- Đáp ứng tất cả các yêu cầu về biểu diễn tri thức

- Cho phép người sử dụng khá tự do khi biểu diễn tri thức

- Frame không chỉ sử dụng để mô tả tri thức mà còn được dùng thể hiện các thuật toán suy dẫn

- Tận dụng được những điểm mạnh của biểu diễn thủ tục và mô tả

- Quá trình xử lý trên các Frame độc lập theo nghĩa kế thừa thông tin, không nhất thiết phải tuần tự

 Nhược điểm:

- Phương pháp biểu diễn quá phức tạp và cồng kềnh

- Phương pháp biểu diễn Frame tiện lợi đối với kỹ sư xử lý tri thức cũng như người sử dụng có trình độ cao, nhưng là sự quá tải đối với những người sử dụng thông thường

Trang 22

- Các giá trị của slot có thể gán qua thực hiện các thủ tục, điều này làm cho việc thu nạp và cập nhật tri thức trở nên phức tạp và làm khả năng mềm dẻo, phù hợp với những thay đổi của môi trường bên ngoài bị giảm xuống

- Do cấu trúc của Frame nên khi biểu diễn cần phải sử dụng các biện pháp khá cầu kỳ Vì vậy làm mất đi tính trực quan trong phương pháp biểu diễn

- Đối với các bài toán phức tạp thì việc mô tả và điều khiển hệ thống sử dụng Frame sẽ phức tạp lên rất nhiều so với các phương pháp biểu diễn khác

1.2.4 Biểu diễn tri thức bằng mạng ngữ nghĩa

Trong phương pháp này, người ta sử dụng một đồ thị gồm các nút và các cung nối các nút để biểu diễn tri thức Nút dùng để thể hiện các đối tượng, thuộc tính của đối tượng và giá trị của thuộc tính Còn cung dùng để thể hiện các quan hệ giữa các đối tượng Các nút và các cung đều được gắn nhãn

Ví dụ: để thể hiện tri thức “sẻ là một loài chim có cánh và biết bay”, người ta vẽ

một đồ thị (xem hình 1.1):

Hình 1.1 Mô hình đồ thị biểu diễn tri thức nhờ mạng ngữ nghĩa

Dựa vào mạng ngữ nghĩa ta nhận biết tri thức một cách trực quan giúp thiết kế các xử lý như: thêm bớt các khái niệm/đối tượng, tìm kiếm thông tin Bằng cách thêm vào đồ thị nút mới và các cung mới người ta có thể mở rộng một mạng ngữ nghĩa Các cung mới được thêm thể hiện các đối tượng tương tự (với các nút đã có trong đồ thị), hoặc tổng quát hơn Chẳng hạn để thể hiện “chim là một loài động vật đẻ trứng” và

“cánh cụt là loài chim biết lặn”, người ta vẽ thêm (xem hình 1.2):

Trang 23

Hình 1.2 Mô hình đồ thị thêm vào các nút và cung biểu diễn tri thức nhờ mạng

ngữ nghĩa

Cơ chế thực hiện theo thuật toán “loang” như sau:

- Bước 1: Kích hoạt các nút ứng với giả thiết cho ban đầu (những yếu tố

đã có giá trị)

- Bước 2: Lặp lại bước sau cho đến khi kích hoạt tất cả các đỉnh ứng với

các yếu tố cần tính (thành công) hoặc không thể kích hoạt được bất kỳ đỉnh nào nữa (thất bại)

Mô hình mạng ngữ nghĩa rất linh động, ta dễ dàng thêm các đỉnh hoặc cung để

bổ sung thêm tri thức Cách biểu diễn tri thức dạng đồ thị nên rất dễ hiểu Ngoài ra so với cách biểu diễn này giữa các đỉnh còn thể hiện mối quan hệ “kế thừa” nếu thông qua quan hệ “là” Cùng với những ưu điểm trên thì cách biểu diễn này khá trừu tượng

và khái quát, trong áp dụng phải phát triển các mô hình tri thức cụ thể hơn

1.2.5 Biểu diễn tri thức bằng mạng các đối tượng tính toán

Một mạng tính toán còn gọi là mạng đối tượng tính toán (ký hiệu O) Một mạng các đối tượng tính toán bao gồm: Tập các đối tượng tính toán O = {O1, O2, , On} và tập các quan hệ giữa các đối tượng tính toán F = {f1, f2, , fn}

Đặt M(fi) = Tập các biến có liên quan với nhau bởi quan hệ fi

M là tập hợp những biến được xem xét trên mạng, kể cả các biến thuộc tập M(f )

Mi = M ∩ M(Oi) , i = 1, 2, , m

Trang 24

Theo các ký hiệu trên, Mi là tập hợp các biến của đối tượng Oiđuợc xem xét trên mạng các đối tượng tính toán Ngoài ra ta còn có:

Hay M(O) M M(F)

Mô hình biểu diễn tri thức dạng này cho phép ta thực hiện tính toán các biến của một hay nhiều đối tượng dựa trên tập biến của các đối tượng khác Mạng tính toán cho ta thấy được cấu trúc nội bộ bên trong của một mạng Nhưng nếu xét trên bài toán

có nhiều mạng tính toán thì mô hình này chưa thể hiện một cách đầy đủ các quan hệ liên kết giữa các mạng tính toán này

- Là ngôn ngữ biểu diễn dạng mô tả

- Có thể áp dụng một số cơ chế trên mạng: Cơ chế truyền và thừa hưởng thông tin giữa các đối tượng

Trang 25

procedures) để giải những bài toán tương đối khó khăn đòi hỏi những chuyên gia mới giải được” [3]

Hệ chuyên gia là một hệ thống tin học có thể mô phỏng (emulates) năng lực quyết đoán (decision) và hành động (making ability) của một chuyên gia (con người)

Hệ chuyên gia là một trong những lĩnh vực ứng dụng của trí tuệ nhân tạo (Artificial Intelligence) Hệ chuyên gia sử dụng tri thức của chuyên gia để giải quyết các vấn đề (bài toán) khác nhau thuộc mọi lĩnh vực

Tri thức (knowledge) trong hệ chuyên gia phản ánh sự tinh thông tích tụ từ sách

vở, tạp chí, từ các chuyên gia hay các nhà bác học Các thuật ngữ hệ chuyên gia, hệ thống dựa trên tri thức (knowledge – based system) hay hệ chuyên gia dựa trên tri thức (knowledge – based expert system) thường có cùng nghĩa

Một hệ chuyên gia bao gồm ba thành phần chính là cơ sở tri thức (CSTT - knowledge base), máy suy diễn hay mô-tơ suy diễn (inference engine) và hệ thống giao tiếp với người sử dụng (userinterface) Cơ sở tri thức chứa các tri thức để từ đó máy suy diễn tạo ra câu trả lời cho người sử dụng qua hệ thống giao tiếp

Người sử dụng (user) cung cấp sự kiện (facts) là những gì đã biết, đã có thật hay những thông tin có ích cho hệ chuyên gia và nhận được những câu trả lời là những lời khuyên hay những gợi ý đúng đắn (expertise)

Hình 1.3 Các thành phần của hệ chuyên gia

Hoạt động của một hệ chuyên gia dựa trên cơ sở tri thức được minh họa như sau:

Trang 26

Hình 1.4 Cơ chế hoạt động của hệ chuyên gia

Những chương trình trí tuệ nhân tạo đạt được khả năng giải quyết các vấn đề trong các lĩnh vực cụ thể ở mức độ chuyên gia bằng cách sử dụng một cơ sở tri thức trong lĩnh vực đó gọi là các hệ cơ sở tri thức hoặc hệ chuyên gia Thông thường, thuật ngữ Hệ chuyên gia được dùng riêng cho các chương trình mà cơ sở tri thức của nó chứa đựng các tri thức được dùng bởi các chuyên gia thực thụ, khác với các tri thức được thu thập trong các sách giáo khoa hoặc không phải là tri thức chuyên môn Tuy nhiên, đôi khi 2 thuật ngữ Hệ chuyên gia và Hệ cơ sở tri thức được sử dụng tương tự như nhau Phạm vi của trí tuệ nhân tạo cố gắng để đạt được trong một hệ chuyên gia gọi là lĩnh vực chuyên ngành Nhiệm vụ này có thể là các hoạt động như giải quyết vấn đề, hoặc là các suy luận hướng đích Còn chuyên ngành là phạm vi tri thức mà nhiệm vụ đang thực hiện Các chức năng (nhiệm vụ) thông thường như chẩn đoán bệnh, lập kế hoạch, lập lịch, thiết lập cấu hình và thiết kế Một ví dụ cụ thể là lập lịch bay cho phi hành đoàn trong các chuyến bay của một hãng hàng không, hay phân tích cấu trúc của một tòa nhà và đưa ra các giải pháp hay tư vấn về việc thiết kế tòa nhà đó

Có thể phân loại các hệ chuyên gia như sau:

- ES – phân loại: là các hệ áp dụng trong chẩn đoán hoặc phân loại đối tượng Tri thức thường được tổ chức dưới dạng hệ luật dẫn

- ES – tư vấn: là các hệ thực hiện tư vấn từ các giả thiết có sẵn hoặc từ các giả thiết mới được thiết lập

- ES – phản biện: thực hiện phản biện dựa vào tập phản đề sẵn có hay là tự tạo phản biện

Trang 27

- ES – quyết định: là các hệ trợ giúp quyết định, thường được kết hợp với các công cụ tính toán

Việc xây dựng một hệ chuyên gia được hiểu như là việc ứng dụng các kiến thức khoa học vào việc vận hành và bảo trì tri thức, và người vận hành tri thức này gọi là người thiết kế tri thức Người thiết kế tri thức phải đảm bảo rằng máy tính luôn có đủ tri thức để giải quyết một vấn đề nào đó Người thiết kế tri thức phải chọn một hoặc nhiều hình thức miêu tả các tri thức được yêu cầu dưới dạng các mô hình ký hiệu trong

bộ nhớ của máy tính và như vậy anh ta phải chọn một cách biểu diễn có hiệu quả bằng việc chọn ra một số các biện pháp lập luận

1.3.2 Cơ sở tri thức của hệ chuyên gia

Cơ sở tri thức của hệ chuyên gia bao gồm cả tri thức thực tế và tri thức Heuristic Tri thức thực tế là tri thức chuyên ngành mà được phổ biến và chia sẻ trong phạm vi rộng, có thể tìm thấy dễ dàng trong sách giáo khoa hoặc trong các sách báo và nhìn chung là được chấp nhận dựa trên các kiến thức đúng đắn trong từng lĩnh vực cụ thể Còn tri thức Heuristic mang ít tính nghiêm ngặt hơn, dựa nhiều vào kinh nghiệm

và sự phán đoán hơn Trái với tri thức thực tế, tri thức Heuristic ít khi được thảo luận,

và mang đậm tính cá nhân Nó là kiến thức rút ra từ việc thực hành và phán đoán tốt và

sự lập luận chặt chẽ trong từng lĩnh vực

Biểu diễn tri thức là mô hình hóa và tổ chức tri thức Một phương pháp biểu diễn tri thức được sử dụng rộng rãi là sử dụng hệ các luật dẫn hoặc là dùng các luật đơn giản Một luật bao gồm một phần IF và một phần là THEN (còn gọi là điều kiện

và kết luận) Phần IF liệt kê một tập hợp các điều kiện được liên kết logic với nhau Một mẫu tri thức được biểu diễn bởi luật dẫn có liên quan đến dòng lập luận đang được khai triển nếu như phần IF của luật được thỏa mãn Vì vậy, phần THEN của luật

có thể được kết luận, hoặc là vấn đề của luật có thể được giải quyết

Ví dụ:

(1) Nếu điềukiện P thì kếtluận C

(2) Nếu trạng thái S thì hành động A

(3) Nếu các điều kiện C1, , Cn đúng thì kết luận C đúng

Hệ luật dẫn được sử dụng rộng rãi là do các nguyên nhân sau:

Trang 28

- Tính đơn thể: Mỗi luật định nghĩa một phần nhỏ và độc lập các tri thức

- Dễ thêm: Có thể thêm các luật mới vào CSTT tương đối độc lập với các quy tắc đã có

- Dễ sửa đổi: Có thể sửa đổi các quy tắc trong CSTT tương đối độc lập với các quy tắc khác

- Trong suốt: Hệ thống dựa trên luật dẫn có khả năng giải thích các hành động cũng như các quyết định của nó

Mô hình giải quyết vấn đề tổ chức và điều khiển các bước thực hiện để giải quyết một vấn đề nào đó của hệ chuyên gia Một mô hình thông dụng nhưng hiệu quả

là liên kết các mắt xích của các luật IF-THEN để hình thành một dòng lập luận Nếu như chuỗi mắt xích đó bắt đầu từ một tập hợp các điều kiện và tiến đến các kết luận thì phương pháp này gọi là suy luận tiến Còn nếu như kết luận đã được biết trước nhưng các bước suy luận để dẫn đến kết luận vẫn chưa biết thì khi đó, hàm suy lùi sẽ được gọi, và phương pháp suy luận này gọi là suy diễn lùi Các phương pháp giải quyết vấn

đề này được xây dựng trong các module của chương trình và được gọi là các bộ máy suy diễn hoặc là các thủ tục suy diễn, các module này sẽ điều khiển và sử dụng tri thức trong cơ sở tri thức để hình thành dòng lập luận

Tri thức là thành phần quan trọng nhất trong bất kỳ một hệ chuyên gia nào Sức mạnh của các hệ chuyên gia dựa vào các tri thức cụ thể và có chất lượng mà nó chứa đối với các lĩnh vực chuyên ngành Do tầm quan trọng của tri thức đối với các hệ chuyên gia và vì hiện nay các phương pháp thu thập tri thức còn tốn nhiều chi phí, các

hệ chuyên gia trong tương lai cần phải giải quyết được vấn đề thu thập tri thức và cải tiến việc hệ thống hóa cũng như việc biểu diễn một hệ cơ sở tri thức lớn

Với mục tiêu xây dựng một hệ chuyên gia có những bước suy luận giống như con người thì đòi hỏi trước hết hệ thống cần phải có một cơ sở tri thức phong phú và sâu rộng về vấn đề mà hệ chuyên gia cần giải quyết, quá trình thu thập cơ sở tri thức là một quá trình quan trọng đối với bất cứ một hệ chuyên gia nào, và việc quản lý cơ sở tri thức cũng là một vấn đề quan trọng

Trang 29

1.3.3 Cấu trúc một hệ chuyên gia

Mỗi hệ chuyên gia đều bao gồm 2 thành phần cơ bản là: hệ cơ sở tri thức và bộ máy suy diễn Tùy theo cách biểu diễn tri thức mà ta có thể xây dựng mô tơ suy diễn theo thuật giải suy diễn nào Ngoài ra còn có thể kết hợp phương pháp biểu diễn thừa

số chắc chắn để hệ chuyên gia hoạt động một cách tự nhiên [3] Cấu trúc của một hệ chuyên gia thường được phân ra thành các thành phần nhỏ như sau:

- Giao diện người máy: Thực hiện giao tiếp giữa người dùng và hệ thống nhận dạng các thông tin từ người dùng (các câu hỏi, các yêu cầu về lĩnh vực) và đưa ra các lời khuyên, các câu trả lời, các giải thích về lĩnh vực đó

- Bộ thu nạp tri thức làm nhiệm vụ thu nạp tri thức từ chuyên gia con người, từ kỹ sư tri thức và người sử dụng thông qua các câu hỏi và yêu cầu của

họ sau đó lưu trữ vào cơ sở tri thức

- Bộ giải thích: giải thích những hành động cũng như những quyết định của hệ thống cho người dùng

- Mô tơ suy diễn: thực hiện các cơ chế suy diễn (để biến đổi hoặc tìm ra tri thức), xử lý và điều khiển các tri thức được biểu diễn trong cơ sở tri thức nhằm đáp ứng các câu hỏi và yêu cầu của người sử dụng

- Cơ sở tri thức: Lưu trữ các tri thức trong lĩnh vực mà hệ đảm nhận làm

cơ sở cho mọi hoạt động của hệ Cơ sở tri thức bao gồm các sự kiện và các luật

Hình 1.5 Cấu trúc của hệ chuyên gia

Trang 30

1.3.4 Quy trình xây dựng hệ chuyên gia

Quy trình được chia làm 7 giai đoạn [3] như sau:

- Giai đoạn 1:

Xác định miền tri thức Xác định phạm vi vấn đề Thu thập tri thức

- Giai đoạn 2: Thiết kế cơ sở tri thức

Biểu diễn tri thức

Tổ chức cơ sở tri thức

- Giai đoạn 3: Thiết kế bộ suy diễn

Thu thập và biểu diễn vấn đề chẩn đoán

Thiết kế giải thuật để chẩn đoán

- Giai đoạn 4: Thiết kế giao diện người dùng

- Giai đoạn 5: Cài đặt

- Giai đoạn 6: Xây dựng bảng mẫu để kiểm tra

- Giai đoạn 7: Hiệu chỉnh

1.3.5 Những thuận lợi và khó khăn của hệ chuyên gia

 Thuận lợi:

Tính lâu dài của hệ chuyên gia: các chuyên gia là con người vẫn có thể quên những lập luận hay khái niệm nào đó, nhưng hệ chuyên gia thì không Ngoài ra hệ chuyên gia còn có khả năng tái sử dụng cho các mục đích khác nhau, với các lĩnh vực khác nhau, một cách nhanh chóng và dễ dàng Trong khi đó, quá trình tạo ra một chuyên gia là con người phải mất một khoảng thời gian và công sức không nhỏ

Các hệ chuyên gia có thể dùng các luật hay quy tắc một cách nhanh chóng mà không nhầm lẫn, nếu trong trường hợp có quá nhiều quy tắc hay luật thì một chuyên gia là con người không xử lý nhanh như một hệ chuyên gia được

Về tính hiệu quả, một hệ chuyên gia có thể tăng số lượng được đưa vào hệ và giảm đi các chi phí nhân công Mặc dù các hệ chuyên gia được xây dựng và bảo trì thường tốn kém, nhưng để vận hành các hệ chuyên gia không phải tốn nhiều công sức

Trang 31

và tiền bạc Việc phát triển và duy trì một hệ chuyên gia cĩ thể được trải đều ra cho nhiều người, và tổng chi phí cho việc này sẽ hợp lý hơn rất nhiều so với việc kiếm một chuyên gia thực thụ

Nếu như khơng cĩ sự trục trặc về thiết bị máy mĩc thì một hệ chuyên gia cĩ thể hoạt động rất ổn định, với các tập luật đã được xây dựng và cùng với các khả năng xử

lý khác, hệ cĩ thể đưa ra các quyết định gần như nhau trong các tình huống tương tự nhau Ngồi ra, một hệ chuyên gia cĩ thể cung cấp các giải pháp một cách thường xuyên trong một quá trình giải quyết vấn đề Trong một thời điểm thì một hệ chuyên gia cĩ khả năng giải quyết được nhiều vấn đề hơn so với một chuyên gia là con người Một thuận lợi lớn khác của các hệ chuyên gia đĩ là kiến thức của rất nhiều chuyên gia khác nhau được đưa vào hệ chuyên gia, điều này rõ ràng là làm cho cơ sở tri thức của một hệ chuyên gia rộng và phong phú hơn so với một vài chuyên gia đơn

lẻ Trong lĩnh vực kinh tế, hệ chuyên gia sẽ cĩ thể giảm thiểu được nhiều rủi ro hơn

 Khĩ khăn:

Một điều dễ nhận ra là các hệ chuyên gia khơng cĩ khả năng học như các hệ thống thơng minh khác như Suy luận dựa tình huống (Case-based reasoning) hay Mạng nơron (Neural Networks) Vì vậy nếu cĩ những thay đổi từ phía các chuyên gia

là con người thì hệ chuyên gia cần được cập nhật lập tức Hệ chuyên gia khơng cĩ khả năng sáng tạo và khơng cĩ được các giác quan thơng thường như con người, trong những tình huống bất thường, hệ chuyên gia khơng cĩ khả năng giải quyết

Ngồi ra, các hệ chuyên gia khơng cĩ được những kinh nghiệm, sự nhạy bén, tính sáng tạo như các chuyên gia là con người, và cũng khơng thể nhận ra được vấn đề nếu như vấn đề đĩ khơng thuộc phạm vi “hiểu biết” của hệ thống

1.4 Phương Pháp Phân Loại Nạve Bayes

1.4.1 Khái niệm về phân lớp

- Phân lớp dữ liệu cĩ thể coi là quá trình học một mơ hình mà mơ hình này dùng để mơ tả các lớp dữ liệu khác nhau Các lớp dữ liệu ở đây đã được xác định trước

Trang 32

- Khác với phân cụm dữ liệu, phân lớp dữ liệu được xem là một quá trình

“học cĩ giám sát” Sau khi được xây dựng, mơ hình phân lớp cĩ thể được sử dụng để phân lớp các dữ liệu mới

- Mỗi bản ghi trong tập dữ liệu học cĩ một thuộc tính gọi là nhãn lớp (Class lable) để chỉ ra bản ghi đĩ thuộc lớp nào

- Tiến trình xử lý nhằm xếp các mẫu dữ liệu hay các đối tượng vào một trong các lớp đã được định nghĩa trước Phân lớp là kỹ thuật phổ biến nhất của học máy và khai phá dữ liệu

* Các bước chính để giải quyết bài tốn phân lớp:

Bước 1: Học (Training) Xây dựng mơ hình phân lớp

Bước 2: Phân lớp (classification) Bước này sử dụng mơ hình phân lớp đã được xây dựng ở bước 1 để kiểm tra, đánh giá và thực hiện phân lớp

* Các kỹ thuật phân lớp:

- Phương pháp dựa trên cây quyết định

- Phương pháp dựa trên luật

- Phương pháp Nạve Bayes

- Mạng Nơ-ron và nhiều các phương pháp khác

1.4.2 Phương pháp phân lớp Nạve Bayes

* Định lý Bayes

Tính xác suất xảy ra của một sự kiện ngẫu nhiên A khi biết sự kiện liên quan B

đã xảy ra[5]

- Xác suất này được kí hiệu là P(A\B)

- Đọc là “xác suất của A nếu cĩ B”

Theo định lý Bayes, xác suất xảy ra A khi biết B sẽ phụ thuộc vào 3 yếu tố:

Xác suất xảy ra A của riêng nĩ, khơng quan tâm đến B Ký hiệu

là P(A) và đọc là xác suất của A Đây được gọi là xác suất biên duyên hay xác

Trang 33

suất tiên nghiệm, nĩ là "tiên nghiệm" theo nghĩa rằng nĩ khơng quan tâm đến bất

kỳ thơng tin nào về B

Xác suất xảy ra B của riêng nĩ, khơng quan tâm đến A Ký hiệu

là P(B) và đọc là "xác suất của B" Đại lượng này cịn gọi là hằng số chuẩn hĩa (normalising constant), vì nĩ luơn giống nhau, khơng phụ thuộc vào sự kiện A đang muốn biết

Xác suất xảy ra B khi biết A xảy ra Ký hiệu là P(B|A) và đọc là "xác suất của B nếu cĩ A" Đại lượng này gọi là khả năng (likelihood) xảy ra B khi biết A đã xảy ra Chú ý khơng nhầm lẫn giữa khả năng xảy ra B khi biết A và xác suất xảy ra A khi biết B

Khi biết ba đại lượng này, xác suất của A khi biết B cho bởi cơng thức:

𝑷(𝑨|𝑩) =𝑷(𝑩|𝑨)𝑷(𝑨)

𝑷(𝑩)

Từ đĩ dẫn tới:

1.4.3 Thuật tốn Nạve Bayes

* Mơ hình phân lớp Nạve Bayes

Mơ hình phân lớp Nạve Bayes dựa trên mơ hình xác suất:

Xác định xác suất hay dự đốn xác suất cĩ là thành viên của lớp hay khơng.Nền tảng dựa vào định lý Bayes:

 Cho X, Y là các biến bất kỳ (rời rạc, số, cấu trúc….)

 Dự đốn Y từ X

 Lượng giá các tham số của P(X|Y), P(Y) trực tiếp từ tập dữ liệu đã huấn luyện sau đĩ sử dụng định lý Bayes để tính P(Y|X=x)

* Thuật tốn Nạve Bayes

Áp dụng trong bài tốn phân loại, các dữ kiện gồm cĩ:

- D: tập dữ liệu huấn luyện đã được vectơ hĩa x= (𝑥1, 𝑥2,…,𝑥𝑛)

- Ci: phân lớp i, với i = {1, 2, …, m}

Trang 34

- Các thuộc tính độc lập điều kiện đơi một với nhau

Theo định lý Bayes: 𝑃(𝐶𝑖|𝑋) = 𝑃(𝑋|𝐶𝑖 )𝑃(𝐶𝑖)

𝑃(𝑋)Theo tính chất độc lập điều kiện: 𝑃(𝑋|𝐶𝑖) = ∏𝑛 𝑃

𝑘=1 (𝑥𝑘|𝐶𝑖)) Trong đĩ: (𝑥𝑘|𝐶𝑖) xác suất thuộc tính thứ k mang giá trị xk khi đã biết X thuộc phân lớp i

* Các bước thực hiện thuật tốn phân lớp Nạve Bayes

- Bước 1: Huấn luyện Nạve Bayes (dựa vào tập dữ liệu), tính P(Ci) và P(Xk|Ci)

- Bước 2: Phân lớp Xnew= (x1, x2, …, xn) Xnew ta cần tính xác suất thuộc từng phân lớp khi đã biết trước Xnew Xnew được gán vào lớp cĩ xác suất lớn nhất theo cơng thức: 𝑚𝑎𝑥𝐶𝑖∈𝐶(𝑃(𝐶𝑖) ∐𝑛 𝑃

𝑘=1 (𝑥𝑘|𝐶𝑖))

Trang 35

Chương 2 THIẾT KẾ CƠ SỞ TRI THỨC VÀ BỘ SUY DIỄN

2.1 Giới thiệu hệ thống

2.1.1 Mục đích, đối tượng sử dụng

- Ứng dụng những thành quả của công nghệ thông tin vào lĩnh vực y tế, góp phần phục vụ tốt việc tìm hiểu nghiên cứu đánh giá chất lượng y tế tại các phòng khám bệnh của tỉnh Trà Vinh

- Hỗ trợ công tác khám và chữa bệnh của bệnh nhân và bác sĩ hoàn toàn chính xác, đáng tin cậy

- Triển khai ứng dụng thực tiễn tại các phòng khám bệnh, trạm y tế…

 Dữ liệu vào ra của hệ chẩn đoán như sau:

- Dữ liệu đầu vào:

Một số triệu chứng lâm sàng và cận lâm sàng

- Output:

Đưa ra cho người dùng kết luận bệnh hoặc là đợi xác nhận của chuyên gia và có thể xem chi tiết tỷ lệ xác suất bệnh mắc phải từ những triệu chứng đầu vào dựa trên thuật toán Bayes

- Chức năng lưu trữ luật

- Chức năng lưu trữ triệu chứng bệnh

- Chức năng lưu trữ tên các bệnh

- Chức năng lưu trữ thông tin người sử dụng

Trang 36

2.1.2.2 Yêu cầu phi chức năng

- Tính tiện dụng: Giao diện thân thiện dễ sử dụng

- Tính hiệu quả: Đảm bảo khả năng truy xuất nhanh đến các màn hình và khả năng kiểm soát lỗi tốt

- Tính tương thích: Hỗ trợ các hệ điều hành Window

- Hỗ trợ nhiều người dùng truy cập cùng lúc

- Mã hóa các thông tin cần được bảo mật

- Thiết kế ứng dụng theo mô hình 3 lớp

2.2 Tri thức về viêm phế quản

2.2.1 Định nghĩa về viêm phế quản

Viêm phế quản cấp (Acute Bronchitis) là tình trạng viêm cấp tính niêm mạc cây phế quản Viêm phế quản được tạo thành từ các ống nhỏ hơn (bao gồm phế quản thùy

và tiểu phế quản tận), có chức năng dẫn khí Khi các ống này bị nhiễm trùng, niêm mạc phế quản bị phù nề, xung huyết, bong các biểu mô phế quản, tạo nhiều đờm mủ bao phủ niêm mạc phế quản, khó thông khí dẫn đến khó thở[4]

Bệnh có thể xảy ra ở bất kỳ tuổi nào, nhưng gặp nhiều ở trẻ em và người già, thường vào mùa lạnh và đầu mùa xuân Biểu hiện lâm sàng chính là ho và khạc đờm nhầy mủ, khi khỏi không để lại di chứng, nhưng cũng có thể làm khởi phát cơn hen phế quản nhiễm khuẩn[4]

Viêm phế quản mạn (Chronic Bronchitis) còn gọi là bệnh phổi tắc nghẽn mạn tính và được định nghĩa cụ thể như sau: "Viêm phế quản mạn là tình trạng tăng tiết dịch nhầy của niêm mạc phế quản gây ho và khạc đờm liên tục hoặc tái phát từng đợt (khoảng 3 tuần lễ) ít nhất là ba tháng trong 1 năm và ít nhất là 2 năm liền" Viêm phế quản mạn là bệnh thường gặp, chiếm 5% dân số (Pháp), khoảng 47% người ở độ tuổi

Trang 37

- Do bệnh truyền nhiễm: cúm, sởi, ho gà

- Hít phải hơi độc: Chlore, amoniac, khói thuốc lá, dung môi công nghiệp

- Yếu tố dị ứng: cơ địa dị ứng

- Yếu tố thuận lợi: cơ thể suy yếu, suy tim, ẩm, lạnh, khói bụi…

- Viêm phế quản cũng có thể xảy ra khi axit từ dạ dày luôn trào ngược vào ống thực quản và một vài giọt đi vào đường hô hấp trên, một vấn đề được gọi là bệnh trào ngược dạ dày (GERD)

Hình 2.1 Tỉ lệ tử vong theo số điếu thuốc lá hút

- Bụi trong không khí, khí hậu ẩm ướt

- Nghề nghiệp: công nhân mỏ than, luyện kim, dệt, nhựa: Những chất độc hại có thể gây ra và làm nặng hơn viêm phế quản mạn: khí chlor, phosgen, nitơ, isocyanate có thể gây tổn thương đường hô hấp trung tâm nhưng nếu tiếp xúc kéo dài, đặc biệt có các yếu tố nguy cơ khác như hút thuốc lá hay nhiễm trùng kéo dài dễ gây viêm phế quản mạn

Trang 38

- Nhiễm khuẩn, dị ứng: Nhiễm trùng là yếu tố khởi phát trong 1/3 trường hợp, nhiễm trùng tái đi tái lại sẽ làm giảm chức năng hô hấp Vi khuẩn thường gặp là H influenzae, Streptococcus pneumoniae

- Tuổi: thường trên 40 tuổi Tuổi cao là một yếu tố nguy cơ thật sự, có liên quan đến sự tích tụ độc tính của thuốc lá làm tổn thương đường hô hấp

Hình 2.2 Tỉ lệ tử vong do viêm phế quản theo tuổi

- Giới tính: Viêm phế quản mạn có ưu thế ở nam so với nữ do có liên quan đến thuốc lá

Trang 39

- Yếu tố xã hội: Ở nước công nghiệp, tỉ lệ viêm phế quản mạn cao ở người

có thu nhập thấp, nhóm này tăng rõ rệt khi hút thuốc lúc làm việc, cư trú ở vùng

ô nhiễm nặng, điều kiện sống thấp và ít được chủng ngừa

2.2.3 Triệu chứng của viêm phế quản

2.2.3.1 Viêm phế quản cấp

 Triệu chứng lâm sàng

Bệnh bắt đầu bằng viêm long đường hô hấp trên, sổ mũi, hắt hơi, rát họng, ho khan Khi viêm nhiễm lan xuống đường hô hấp dưới là bệnh toàn phát, gồm 2 giai đoạn:

- Giai đoạn đầu (3 – 4 ngày, còn gọi là giai đoạn viêm khô): Người bệnh

có biểu hiện sốt 38 – 39 độ C, cũng có trường hợp có thể lên tới 40 độ C, mệt mỏi, biếng ăn, đau đầu, nhức mỏi xương khớp, cảm giác nóng rát sau xương ức, tăng lên khi ho Khó thở nhẹ, có thể có tiếng rít, ho khan hoặc ông ổng, ho thành cơn về đêm, khản tiếng Nghe phổi có ran rít, ran ngáy

- Giai đoạn ướt: Cảm giác rát bỏng sau xương ức giảm và hết, khó thở nhẹ, có thể còn sốt ho Nghe phổi có ran rít, ran ngáy, ran ẩm to và vừa hạt Diễn biến 4 – 10 ngày thì khỏi hẳn Ho nhiều đờm, khạc đờm nhầy, hoặc đờm

mủ xanh hoặc vàng (khi bội nhiễm) Có trường hợp ho khan kéo dài vài tuần

Có thể bệnh bắt đầu rầm rộ biểu hiện sốt cao, ho nhiều, ho ra máu… Nghe phổi

có ran ẩm

 Triệu chứng cận lâm sàng

- X- Quang phổi: rốn phổi đậm

- Xét nghiệm máu: số lượng bạch cầu tăng, tốc độ máu lắng tăng

2.2.3.2 Viêm phế quản mạn

 Triệu chứng lâm sàng

Đa số gặp ở độ tuổi 50, nam giới, nghiện thuốc lá, thuốc lào Bệnh thường diễn biến âm thầm, sau đó biểu hiện các triệu chứng sau: Ho và khạc đờm vào buổi sáng, đờm nhầy, trong, dính hoặc xanh vàng, đục mủ Lượng đờm khoảng 200ml Mỗi đợt

Trang 40

kéo dài 3 tuần vào những tháng đông – xuân Đợt cấp của viêm phế quản mạn thường

có các biểu hiện sau:

- Ho, khạc đờm có mủ

- Khó thở như cơn hen

- Phổi có ran rít, ran ngáy, ran ẩm, rì rào phế nang giảm

X- Quang Giãn phổi, tăng sáng Hình ảnh "Phổi bẩn"

 Triệu chứng cận lâm sàng

- X- Quang: rốn phổi đậm, có thể thấy cung động mạch phổi phình ra Nếu

có giãn phế nang còn thấy hình ảnh ứ khí, hình tim dài và bé Nếu chụp phế quản có chất cản quang (Lipiodol) thấy vách phế quản không đều có chỗ tắc Chụp động mạch phế quản thấy giãn

- Soi phế quản: vách phế quản dày, niêm mạc nhạt màu, xung huyết và viêm nhiễm từng vùng Kết hợp hút dịch tìm tế bào, sinh thiết nếu nghi ngờ khối u

- Thăm dò chức năng hô hấp:

VEMS (Volume expiratoire maximum seconde) giảm

VC (Vital capacity) giảm

FEV1/VC (Tiffeneau) giảm

Ngày đăng: 20/06/2020, 16:13

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1]. Đinh Nguyễn Anh Dũng, Hoàng Kiếm (2005), Giáo trình Trí tuệ nhân tạo, Đại học Công Nghệ Thông tin - Đại Học Quốc Gia TPHCM Khác
[2]. Nguyễn Đạt Anh, Ngô Quý Châu, Nguyễn Lân Việt, Phạm Quang Vinh (2012), Bệnh học nội khoa tập 1, Nhà xuất bản Y học Khác
[3]. Giarratano J.C, Riley G.D. (1998), Expert Systems – Principles and Programming Third Edition, PWS, Boston Khác
[4]. Nguyễn Quốc Anh, Ngô Quý Châu (2012), Hướng dẫn chẩn đoán và điều trị Bệnh nội khoa, Nhà xuất bản Y học Khác
[5]. TS Trương Ngọc Châu, Bài Giảng Khai phá dữ liệu, Đại học Bách Khoa, Đại học Đà Nẵng Khác
[6]. Lập trình trình cơ sở dữ liệu Visual Studio, Pham Hữu Khang chủ biên, nhà xuất bản lao động xã hội Khác
[7]. Đỗ Trung Tuấn (1997), Cơ sở dữ liệu (Database), Nxb Giáo dục, Hà Nội Khác

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w