nghiên cứu một số phương pháp của trí tuệ tính toán ứng dụng trong y học

Phỏng theo tư duy suy diễn của hệ chuyên gia, sử dụng lập luận xấp xỉ, thuật toán Fuzzy Logic, trong thời gian thực hiện luận văn về Trí tuệ tính toán ứng dụng trong Y học, tôi đã lựa ch

Trang 1

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI

-

NGÔ THỊ DIỆU THÚY

NGHIÊN CỨU MỘT SỐ PHƯƠNG PHÁP CỦA TRÍ TUỆ TÍNH TOÁN

ỨNG DỤNG TRONG Y HỌC

Chuyên ngành: CÔNG NGHỆ THÔNG TIN

LUẬN VĂN THẠC SĨ KHOA HỌC CÔNG NGHỆ THÔNG TIN

NGƯỜI HƯỚNG DẪN KHOA HỌC:

PGS.TS NGUYỄN HOÀNG PHƯƠNG

Hà Nội - Năm 2012

Trang 2

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI

-

NGÔ THỊ DIỆU THÚY

NGHIÊN CỨU MỘT SỐ PHƯƠNG PHÁP CỦA TRÍ TUỆ TÍNH TOÁN

ỨNG DỤNG TRONG Y HỌC

Chuyên ngành: CÔNG NGHỆ THÔNG TIN

LUẬN VĂN THẠC SĨ KHOA HỌC CÔNG NGHỆ THÔNG TIN

NGƯỜI HƯỚNG DẪN KHOA HỌC:

PGS.TS NGUYỄN HOÀNG PHƯƠNG

Hà Nội – Năm 2012

Trang 3

MỤC LỤC

LỜI CAM ĐOAN 4

LỜI CẢM ƠN 5

DANH MỤC CÁC TỪ VIẾT TẮT 6

DANH MỤC HÌNH VẼ 7

ĐẶT VẤN ĐỀ 9

1 Giới thiệu 9

2 Mục đích của luận văn 10

3 Phương pháp thực hiện luận văn 10

4 Nội dung của luận văn 11

CHƯƠNG 1 GIỚI THIỆU VỀ TRÍ TUỆ TÍNH TOÁN 12

1.1 Trí tuệ tính toán là gì? 12

1.2 Các thành phần cơ bản của trí tuệ tính toán 16

1.2.1 Mạng nơron nhân tạo (ANN) 16

1.2.2 Các giải thuật tính toán tiến hóa và di truyền 19

1.2.3 Tính toán xác suất và mạng tin cậy 22

1.2.4 Hệ chuyên gia (Expert System - ES) 25

1.2.5 Tổng quan về Logic mờ (Fuzzy Logic), xây dựng cơ sở tri thức cho hệ chuyên gia mờ 41

1.3 Áp dụng lý thuyết Fuzzy logic và lý thuyết về độ chắc chắn trong “Hệ chuyên gia chẩn đoán bệnh khớp” 48

1.4 Kết luận 49

CHƯƠNG 2 BỆNH KHỚP VÀ QUY TRÌNH CHẨN ĐOÁN BỆNH KHỚP 50

2.1 Bệnh khớp và Bệnh viêm khớp dạng thấp 50

2.2 Các loại bệnh khớp 52

2.2.1 Bệnh khớp do viêm 52

2.2.2 Bệnh khớp không do viêm 52

2.3 Các kiểu triệu chứng và chẩn đoán trong bệnh khớp 53

2.3.1 Các kiểu triệu chứng 53

2.3.2 Các phương pháp chẩn đoán bệnh khớp 55

Trang 4

2.4 Quy trình làm bệnh án cơ xương khớp 56

2.5 Phương pháp chẩn đoán trong bệnh khớp 60

2.6 Kết luận 62

CHƯƠNG 3 XÂY DỰNG THỬ NGHIỆM HỆ CHUYÊN GIA CHẨN ĐOÁN BỆNH KHỚP 63

3.1 Cơ sở tri thức 63

3.1.1 Triệu chứng 64

3.1.2 Bệnh 65

3.1.3 Các luật sản xuất 66

3.2 Cấu trúc bộ thu nhận tri thức 69

3.3 Xây dựng cơ chế suy diễn sử dụng Fuzzy Logic và lý thuyết độ chắc chắn 70

3.3.1 Quan hệ triệu chứng - bệnh nhân 70

4.3.2 Quan hệ triệu chứng - bệnh 71

4.3.3 Quan hệ bệnh nhân - bệnh về khớp 72

3.3.4 Thuật toán 77

3.4 Kết luận 82

CHƯƠNG 4 PHÂN TÍCH VÀ THIẾT KẾ HỆ THỐNG 83

4.1 Phân tích 83

4.2 Thiết kế hệ thống 84

4.2.1 Biểu đồ UseCase 84

4.2.2 Biểu đồ hoạt động 85

CHƯƠNG 5 CÀI ĐẶT CHƯƠNG TRÌNH THỬ NGHIỆM 94

CHƯƠNG 6 KẾT LUẬN 100

ĐỀ XUẤT HƯỚNG PHÁT TRIỂN 101

TÀI LIỆU THAM KHẢO 102

PHỤ LỤC 104

PHỤ LỤC 1: TRIỆU CHỨNG BỆNH KHỚP 104

PHỤ LỤC 2: CƠ SỞ TRI THỨC NẾU – THÌ 106

PHỤ LỤC 3: CÁC TOÁN TỬ FUZZY LOGIC 108

Trang 5

LỜI CAM ĐOAN

Tôi xin cam đoan đây là công trình nghiên cứu của tôi, dưới sự hướng dẫn của

PGS.TS Nguyễn Hoàng Phương

Các nội dung nghiên cứu và kết quả trong đề tài này là trung thực, những số liệu trong các bảng biểu phục vụ cho việc phân tích, nhận xét được chính tác giả thu thập từ các nguồn khác nhau có ghi trong phần tài liệu tham khảo

Ngoài ra đề tài còn sử dụng một số nhận xét, đánh giá cũng như số liệu của các tác giả, cơ quan tổ chức khác và cũng được thể hiện trong phần tài liệu tham khảo

Hà Nội, ngày 10 tháng 3 năm 2012

Học viên

Ngô Thị Diệu Thúy

Trang 6

LỜI CẢM ƠN

Lời đầu tiên em xin chân thành bày tỏ lòng cảm ơn và kính trọng sâu sắc đối với

người Thầy, PGS TS Nguyễn Hoàng Phương, Phó Vụ trưởng Vụ Khoa học và Đào

tạo, Bộ Y tế, người thầy đã trực tiếp hướng dẫn, giúp em định hướng, tận tình chỉ bảo

và hỗ trợ em trong suốt quá trình nghiên cứu và thực hiện luận văn

Em cũng xin thể hiện sự kính trọng và lòng biết ơn đến Quý Thầy Cô trong Viện Công nghệ thông tin, trường Đại học Bách Khoa Hà Nội, những người đã

trang bị cho em rất nhiều kiến thức chuyên ngành, cũng như sự chỉ bảo, giúp đỡ tận tình của quý Thầy Cô đối với em trong suốt quá trình học tập Tất cả các kiến thức mà

em lĩnh hội được từ bài giảng của các Thầy Cô là vô cùng quý giá

Nhân đây, con xin gửi lời cảm ơn sâu sắc đến Bố, Mẹ và những người thân trong gia đình, những người luôn luôn bên cạnh và tạo mọi điều kiện thuận lợi nhất để

em có thể hoàn thành luận văn

Tôi cũng xin được cảm ơn các bác sỹ, các bạn đồng nghiệp đang công tác tại

Bệnh viện Y học cổ truyền TW, những người đã cung cấp và chia sẻ tài liệu, thông

tin quý báu trong suốt quá trình học tập, nghiên cứu, hoàn thành luận văn này

Hà Nội, ngày 10 tháng 3 năm 2012

Ngô Thị Diệu Thúy

Trang 7

O-A-V Object – Attribute - Value Đối tượng – Thuộc tính –

Giá trị

Trang 8

DANH MỤC HÌNH VẼ

Hình 1 Các thành phần của Trí tuệ tính toán 15

Hình 2 Kiến trúc của một nơron nhân tạo và mạng nơron nhiều lớp 17

Hình 3 Sơ đồ lặp của giải thuật di truyền 21

Hình 4 Gán ma trận xác suất có điều kiện trong cung nối trực tiếp từ A đến B 24

Hình 5 Các thành phần chính của Hệ chuyên gia 25

Hình 6 Cách thức giải quyết vấn đề con người 27

Hình 7 Cách thức giải quyết vấn đề con người 27

Hình 8 Mô hình Hệ chuyên gia 28

Hình 9 Kiến trúc hệ chuyên gia dựa trên luật 34

Hình 10 Nhân tố chắc chắn sử dụng trong MYCIN 38

Hình 11 Đồ thị hàm thuộc thấp(h) 44

Hình 12 Lược đồ chẩn đoán bệnh khớp 59

Hình 13 Đồ thị hàm thuộcSốtcao(t) 65

Hình 14 Cấu trúc bộ thu nhận tri thức 69

Hình 15 Thang đo giá trị ngôn ngữ 75

Hình 16 Ví dụ minh họa về quan hệ RPD 76

Hình 17 Mô hình lập luận 78

Hình 18 Sơ đồ thuật toán tính toán 79

Hình 19 Biểu đồ UseCase "Chẩn đoán bệnh khớp" 84

Hình 20 Biểu đồ cập nhật triệu chứng 85

Hình 21 Biểu đồ cập nhật bệnh 86

Hình 22 Sơ đồ cập nhật tri thức 87

Hình 23 Biểu đồ cập nhật thông tin bệnh nhân 88

Hình 24 Biểu đồ cập nhật thông tin cần khám 90

Hình 25 Biểu đồ chẩn đoán 91

Trang 9

Hình 26 Sơ đồ cơ sở dữ liệu 93

Hình 27 Giao diện form chính 94

Hình 28 Giao diện Cập nhật triệu chứng 95

Hình 29 Giao diện Cập nhật tập luật 96

Hình 30 Giao diện khám lâm sàng 97

Trang 10

ĐẶT VẤN ĐỀ

1 Giới thiệu

Công nghệ thông tin nói chung và Trí tuệ tính toán (Computing Intelligence - CI) nói riêng đã và đang trở thành công cụ đắc lực cho cuộc sống hiện đại Việc áp dụng Công nghệ thông tin vào nhằm làm hiện đại hóa các quy trình làm việc của các ngành nghề đã mang lại hiệu quả cao về chi phí, tiết kiệm thời gian và tăng độ chính xác trong xử lý vấn đề

Y tế là một ngành đặc thù mà ở đó việc áp dụng Công nghệ thông tin sẽ làm tăng cường hiệu quả khám chữa, chăm sóc và điều trị bệnh cho cộng đồng Không những thế, các hệ thống thông tin Y tế thông minh sẽ là giải pháp cho vấn đề chẩn đoán sớm, kiểm soát dịch bệnh và nghiên cứu… Trí tuệ tính toán hứa hẹn sẽ là một trong những công cụ hỗ trợ đắc lực cho vấn đề này

Lý thuyết trí tuệ tính toán có những bước phát triển mạnh mẽ trong những năm qua Chúng cung cấp các kỹ thuật và công cụ hỗ trợ có ích cho các quyết định của con người trong những bối cảnh phức tạp Độ phức tạp ở đây có nghĩa là số lượng lớn các yếu tố, thay đổi tình trạng bệnh, tri thức không chính xác, mơ hồ, thiếu dữ liệu… Sử dụng các kỹ thuật này cho lĩnh vực chăm sóc sức khỏe và y tế có thể có tiềm năng cao nhất Ngày nay, việc sử dụng những kỹ thuật này trong công việc hàng ngày của các bác sỹ đã không còn mới lạ và dự kiến rằng, với những bằng chứng tin cậy thì việc áp dụng mạnh mẽ các kỹ thuật sẽ mang lại những lợi ích thực tế cho bệnh nhân và cho bác

sỹ

Qua khảo sát thực tế cho thấy các phần mềm ứng dụng hiện nay trong ngành Y

tế Việt Nam đã thể hiện được sức mạnh tính toán, lưu trữ, truy xuất nhanh chóng và hiệu quả trong quản lý kinh tế Tuy nhiên, có một thực tế rằng, hàm lượng “thông minh” trong hầu hết các phần mềm ứng dụng trong Y học Việt Nam hiện nay vẫn còn thấp Chẩn đoán bệnh là một nhiệm vụ khó và quan trọng trong y học rất cần có sự trợ

Trang 11

giúp đắc lực của các phương pháp trí tuệ tính toán nhằm tận dụng và kết hợp tối đa tri thức của các chuyên gia trong lĩnh vực cụ thể

Thực tế cho thấy, khi cuộc sống ngày càng trở nên hiện đại thì đời sống nhân dân phải đối mặt với các căn bệnh nguy hiểm hơn Trong đó căn bệnh “Thấp khớp” dường như lại là căn bệnh ngày càng phổ biến nhất Hàng ngày, tại Khoa khám bệnh của Bệnh viện Y học cổ truyền Trung ương vẫn tiếp đón rất nhiều bệnh nhân với các triệu chứng của căn bệnh này, đặc biệt vào những ngày thời tiết nồm, độ ẩm cao Thế nhưng để chẩn đoán và tìm ra đúng bệnh đối với người bác sĩ là vô cùng khó khăn và bệnh nhân cũng phải mất thời gian chờ đợi cùng với đầy đủ các xét nghiệm Tuy nhiên, hiện nay ở Việt Nam vẫn chưa có một phần mềm nào trợ giúp chẩn đoán bệnh khớp

Nguồn tri thức của nhân loại vô cùng rộng lớn và phong phú nhưng làm thế nào

để có thể khai thác và biến những tri thức đó thành những ứng dụng thực tiễn nhằm phục vụ trong đời sống là nhiệm vụ của những người làm khoa học Phỏng theo tư duy suy diễn của hệ chuyên gia, sử dụng lập luận xấp xỉ, thuật toán Fuzzy Logic, trong thời gian thực hiện luận văn về Trí tuệ tính toán ứng dụng trong Y học, tôi đã lựa chọn bài

toán ứng dụng cho bệnh Khớp để xây dựng bản thử nghiệm “Hệ chuyên gia chẩn đoán bệnh khớp”

2 Mục đích của luận văn

Nghiên cứu một số phương pháp của Trí tuệ tính toán ứng dụng trong y học, đề xuất một phương pháp để giải quyết vấn đề thực tế đặt ra ở Việt Nam

3 Phương pháp thực hiện luận văn

Để thực hiện luận văn này, chúng tôi đã phải nghiên cứu các lý thuyết sau đây: Nghiên cứu lý thuyết về các phương pháp tính toán mềm trong Y học, bao gồm các lĩnh vực: Hệ chuyên gia, Logic mờ, Lập luận xấp xỉ…

Trang 12

4 Nội dung của luận văn

Đề tài tập trung vào Nghiên cứu các phương pháp của Trí tuệ tính toán ứng dụng trong Y học nhằm khai thác khả năng áp dụng Trí tuệ tính toán trong việc hỗ trợ chẩn đoán bệnh khớp ở Việt Nam

Luận văn bao gồm các chương:

Chương 1: Giới thiệu Trí tuệ tính toán

Chương 2: Bệnh khớp và Quy trình chẩn đoán bệnh khớp

Chương 3: Xây dựng thử nghiệm Hệ chuyên gia chẩn đoán bệnh khớp Chương 4: Phân tích và thiết kế hệ thống

Chương 5: Cài đặt chương trình thử nghiệm

Chương 6: Kết luận

Chương 7: Đề xuất hướng phát triển Tài liệu tham khảo

Phụ lục

Trang 13

CHƯƠNG 1 GIỚI THIỆU VỀ TRÍ TUỆ TÍNH TOÁN

Lĩnh vực trí tuệ tính toán đã phát triển với mục tiêu phát triển các máy có thể suy nghĩ giống như con người Kết quả là, thành tựu mới nhất của lĩnh vực này có thể bắt chước hoặc vượt xa khả năng nhận thức của con người bao gồm lập luận, hiểu, học… Trí tuệ tính toán (Computational Intelligence - CI) bao gồm logic mờ, mạng nơron, các thuật giải di truyền, lập luận xác suất, …

Chương này giới thiệu các khía cạnh cơ bản của các thành phần chính của trí tuệ tính toán hiện đại Chúng thể hiện cách nhìn toàn diện về các công cụ của trí tuệ tính toán (chẳng hạn, logic mờ, mạng nơron, giải thuật di truyền, mạng tin cậy, lý thuyết hỗn độn, lý thuyết học tính toán, và cuộc sống nhân tạo) Hành vi cộng tác của các công cụ trên vượt xa nhiều lần hiệu suất cá nhân của chúng Chương này cũng bao gồm các thảo luận về hành vi cộng tác của nơron-mờ, các giải thuật nơron-di truyền (GA), nơron-tin cậy, và các mô hình mạng nơron-tin cậy

1.1 Trí tuệ tính toán là gì?

Trí tuệ máy đề cập đến năm 1936, khi Turing đề xuất ý tưởng về máy toán học phổ quát, một khái niệm lý thuyết trong lý thuyết toán học về khả năng tính toán [1,2] Turing và Post đã chứng minh một cách độc lập rằng việc xác định khả năng quyết định các mệnh đề toán học là tương đương với yêu cầu các loại trình tự của một số hữu hạn các biểu tượng có thể nhận biết được bằng một máy trừu tượng với một tập hữu hạn các lệnh

Cơ chế như vậy được biết đến là máy Turing [3] Turing nghiên cứu xác định các tham số với khả năng tạo ra máy trí tuệ tính toán và gợi ý các câu trả lời cho những lập luận, đề xuất các kiểm tra Turing như một bài kiểm tra thực nghiệm về trí thông minh [4]

Trang 14

Kiểm tra Turing, được gọi là trò chơi mô phỏng bởi Turing, đo hiệu năng của máy so với con người Máy và người (A) được đặt ở 2 phòng Người thứ ba, được thẩm vấn, trong một căn phòng khác với hai phòng của người (A) và máy Người thẩm vấn không thể nhìn hoặc nói chuyện trực tiếp đối với (A) hoặc máy, giao tiếp với họ chỉ thông qua một số tin nhắn văn bản hoặc thậm chí chỉ là một cửa sổ trò chuyện Nhiệm vụ của người phỏng vấn là nhằm phân biệt giữa người và máy tính dựa trên các câu hỏi mà anh ta/cô ta có thể đưa ra đối với cả hai thông qua các thiết bị đầu cuối Nếu người thẩm vấn không thể phân biệt máy từ con người sau đó, thì Turing lập luận máy được giả định là thông minh Trong thập niên 1960s, máy tính không thể vượt qua các kiểm tra Turing do tốc độ xử lý chậm của các máy tính

Trong vài thập kỷ gần đây đã thấy rằng thập niên mới của trí tuệ nhân tạo tập trung vào các nguyên tắc, các khía cạnh thuộc về lý thuyết, và phương pháp luận thiết

kế của các thuật toán thu được từ tự nhiên

Các ví dụ là mạng nơron nhân tạo lấy cảm hứng từ hệ thần kinh động vật có vú, tính toán tiến hóa được lấy cảm hứng từ lựa chọn tự nhiên trong sinh học, mô phỏng luyện kim lấy cảm hứng từ các nguyên tắc nhiệt động lực học và trí tuệ bầy đàn lấy cảm hứng từ hành vi tập thể của côn trùng hoặc vi sinh vật, và như vậy, việc tương tác cục bộ với môi trường gây ra mô hình chức năng thống nhất toàn cục để xuất hiện Những kỹ thuật này đã tìm thấy cách riêng để giải quyết các vấn đề thế giới thực trong khoa học, kinh doanh, công nghệ, và thương mại

Trí tuệ tính toán (CI) là một mô hình được thiết lập tốt [5-8], áp dụng lý thuyết mới có liên quan đến hiểu biết về sinh học Các hệ thống thực nghiệm hiện nay có nhiều đặc điểm của các máy tính sinh học (bộ não) và đang bắt đầu được xây dựng với nhiều hiệu năng cho các nhiệm vụ khó hoặc không thể thực hiện với các máy tính truyền thống Điểm tên một số ứng dụng, chúng ta có lò vi sóng, máy giặt, camera số

có thể cài đặt sử dụng nhằm đạt được hiệu năng tối ưu với khả năng lập luận, tạo ra các quyết định thông minh, và học từ kinh nghiệm

Trang 15

Thông thường, định nghĩa CI là một nhiệm vụ không khó Bezdek [5] đã định nghĩa hệ CI theo cách sau:

“Một hệ thống trí tuệ tính toán khi: chỉ xử lý dữ liệu số (mức thấp), có các thành phần nhận dạng mẫu, không sử dụng tri thức theo kiểu trí tuệ nhân tạo; và hơn nữa khi

CI bắt đầu thể hiện:

i) Khả năng tính toán thích nghi

ii) Khả năng chịu lỗi tính toán

iii) Tốc độ tiếp cận giống con người và

iv) Tỷ lệ lỗi gần bằng với thể hiện của con người.”

Định nghĩa trên suy luận rằng một hệ thống trí tuệ tính toán nên được đặc trưng bởi khả năng thích nghi tính toán, chịu lỗi, tốc độ tính toán cao, và lỗi ít bị nhiễu bởi các nguồn thông tin Nó cũng thể hiện rằng tốc độ tính toán cao và tỷ lệ lỗi ít hơn so với con người Điều đó đúng với tốc độ tính toán cao đôi khi có thể mang lại sự thiếu chính xác trong các kết quả

Logic mờ và mạng nơron hỗ trợ mức độ song song cao thường có phản ứng nhanh đối với các kích thích đầu vào Hơn nữa, không giống như hệ suy diễn truyền thống (dựa trên luật), là hệ mà chỉ có luật duy nhất bị kích hoạt tại một thời điểm, logic

mờ cho phép kích hoạt một số lượng lớn các luật đảm bảo cho việc phù hợp với một phần các sự kiện có sẵn với các mệnh đề tiền đề của những luật này Vì thế khả năng lập luận của logic mờ giống con người, và kết quả là nó gây ít lỗi Mạng nơron nhân tạo có tốc độ tính toán cao do nó cho phép kích hoạt đồng thời số lượng lớn các nơron Mạng nơron thường thích nghi với các tham số thỏa mãn tập các ràng buộc có tỷ lệ lỗi cực tiểu Thực hiện song song của GA và mạng tin cậy với cùng lý do là có tốc độ tính toán tốt, và hành vi lọc thông tin vốn có duy trì độ chính xác của các kết quả đầu ra

Khi định nghĩa CI, Marks [9] đã đề cập rõ ràng tên các thành phần cấu thành nên CI:

Trang 16

“… mạng nơron, các thuật giải di truyền, hệ mờ, lập trình tiến hóa và đời sống nhân tạo là những viên gạch tạo thành CI.”

Về điểm này, việc đề cập có ý nghĩa đến đời sống nhân tạo cũng là một nguyên tắc nổi bật dựa trên giả thuyết rằng các luật về hóa học và vật lý là đủ tốt để giải thích trí thông minh của các sinh vật sống Langton [10] định nghĩa đời sống nhân tạo như sau:

“… là một mô hình gộp cố gắng nhận ra hành vi sống động như thật bằng cách bắt chước các quá trình xảy ra trong sự phát triển hoặc các cơ chế của cuộc sống.”

Hình 1 tổng hợp lại chính xác những hiểu biết về cụm từ “Trí tuệ tính toán”, hình vẽ đã phác họa các chủ đề với một số ý tưởng chung về ngành mới này

Các định nghĩa trước đây về trí tuệ tính toán tập trung vào logic mờ, mạng nơron, thuật giải di truyền, và lập luận xác suất cùng với nghiên cứu về sự cộng tác của chúng Hiện nay, trí tuệ tính toán bị ảnh hưởng lớn bởi các mô hình lấy cảm hứng sinh học của trí tuệ máy Nó xử lý các mô hình mờ như tính toán granular (tính toán chia nhỏ), tính toán nơron, và tính toán tiến hóa Mạng tin cậy (BN- Belief Network) và lập luận xác suất (PR - Probabilistic reasoning) là giao điểm của trí tuệ nhân tạo truyền thống và trí tuệ tính toán

Hình 1 Các thành phần của Trí tuệ tính toán

Cuộc sống nhân tạo, Tập thô,

Lý thuyết hỗn độn, Trí tuệ bầy đàn, …

PR

BN

Tính toán mờ và tính toán chia nhỏ Tính toán tiến

hóa Tính toán nơron

Trí tuệ tính toán truyền thống

Trang 17

Bezdek [5], Marks [9], Pedrycz [11-12], và các nhà nghiên cứu khác đã định nghĩa CI theo các cách khác nhau dựa trên các phát triển sau đó về nguyên tắc mới này Một giao điểm của các định nghĩa này sẽ chắc chắn tập trung vào logic mờ, Mạng nơron nhân tạo (ANN), và thuật giải di truyền (GA), nhưng sự thống nhất (và tổng quát hóa) của tất cả các định nghĩa này bao gồm nhiều chủ đề khác (ví dụ: lý thuyết tập thô,

lý thuyết hỗn độn, và lý thuyết tính toán) Hơn nữa, CI đang trở thành một ngành mới nổi bật không được định nghĩa chính xác chỉ đối với số lượng hữu hạn các chủ đề Ngoài ra CI cần có một phạm vi mở rộng theo các hướng khác nhau và kết hợp với các ngành khác hiện có

Xu hướng gần đây là nhằm tích hợp các thành phần khác nhau để tận dụng các tính năng bổ sung và phát triển hệ thống cộng tác Kiến trúc lai như hệ nơron-mờ, hệ tiến hóa - mờ, mạng tiến hóa-nơron, hệ nơron-mờ tiến hóa, … đã được áp dụng rộng rãi trong việc giải quyết các vấn đề của thế giới thực

Các phần tiếp theo sẽ giải thích và nêu các lợi điểm chính của các thành phần chức năng chính trong trí tuệ tính toán và các lĩnh vực ứng dụng

1.2 Các thành phần cơ bản của trí tuệ tính toán

Phần này sẽ cung cấp tổng quát về khái niệm của các mô hình CI thông thường dựa trên các đặc tính cơ bản của nó

1.2.1 Mạng nơron nhân tạo (ANN)

Mạng nơron nhân tạo [13-15] được phát triển khái quát như các mô hình toán học trong các hệ thần kinh sinh học Trong mô hình toán học đơn giản hóa các tế bào thần kinh, ảnh hưởng của các xinap được thể hiện bởi các trọng số kết nối điều chỉnh ảnh hưởng của các tín hiệu đầu vào có liên quan, và đặc điểm phi tuyến thể hiện bởi các tế bào thần kinh được biểu diễn bằng một hàm chuyển đổi (hàm kích hoạt), thường

là hàm sigmoid, Gaussian, hàm lượng giác… Tế bào thần kinh thúc đẩy sau đó được tính toán như tổng trọng số của các tín hiệu đầu vào, được chuyển đổi nhờ hàm kích hoạt Khả năng học của một tế bào thần kinh nhân tạo đạt được bằng việc điều chỉnh

Trang 18

các trọng số phù hợp với giải thuật học đã chọn Hầu hết các ứng dụng của mạng nơron được chia thành các loại sau đây:

 Dự báo Sử dụng các giá trị đầu vào để dự báo một số đầu ra

 Phân loại Sử dụng các giá trị đầu vào để xác định phân loại

 Kết hợp dữ liệu Giống như phân loại, nhưng nó cũng nhận biết dữ liệu có lỗi

 Khái niệm hóa dữ liệu Phân tích các đầu vào để nhóm các quan hệ có thể

được suy luận

Mạng nơron nhiều lớp điển hình và nơron nhân tạo được minh họa trong hình 2

Hình 2 Kiến trúc của một nơron nhân tạo và mạng nơron nhiều lớp

Mỗi nơron được đặc trưng bởi một mức độ hoạt động (đại diện cho trạng thái phân cực của một nơron), một giá trị đầu ra (đại diện cho tỷ lệ kích hoạt của nơron), một tập các kết nối đầu vào (đại diện cho các xinap trên tế bào và các sợi nhành của nó), một giá trị sai lệch (đại diện cho mức độ nghỉ nội bộ của nơron), và một tập các kết nối đầu ra (đại diện cho các phép chiếu của các sợi trục của tế bào) Mỗi khía cạnh của đơn vị được thể hiện bằng toán học bởi các số thực Vì thế mỗi kết nối có một trọng số kết hợp (sức mạnh của xinap), xác định ảnh hưởng của đầu vào ban đầu trên mức độ kích hoạt của đơn vị Các trọng số có thể là dương hoặc âm

Theo hình 2, luồng tín hiệu từ đầu vào x1 … xn được coi là một chiều được chỉ

ra bằng các mũi tên, như một luồng tín hiệu đầu ra của nơron (O) Tín hiệu đầu ra nơron O được cho bởi quan hệ sau:

Trang 19

j x w f net f O

1)

Trong đó wj là vectơ trọng số và hàm f(net) là hàm kích hoạt và được định nghĩa như một kết quả vô hướng của trọng số và các vectơ đầu vào

n n

T x w x w x w

vị, nhưng không thể hiện các kết nối ngược, đó là, việc mở rộng các kết nối từ đầu ra đến đầu vào của các đơn vị ở cùng lớp hay ở các lớp trước

Mạng hồi quy bao gồm các kết nối ngược So với mạng truyền thẳng, các thuộc tính động của mạng là quan trọng Trong một số trường hợp, các giá trị kích hoạt của các đơn vị trải qua một tiến trình nghỉ do mạng sẽ tiến đến một trạng thái ổn định trong

đó các kích hoạt không thay đổi nữa Trong các ứng dụng khác, sự thay đổi các giá trị kích hoạt của các nơron đầu ra là đáng kể, nhờ đó mà hành vi động tạo thành đầu ra của mạng Một số kiến trúc mạng nơron khác (mạng Elman, ánh xạ lý thuyết cộng hưởng thích nghi, mạng cạnh tranh…) phụ thuộc vào các thuộc tính và yêu cầu của ứng dụng

Mạng nơron đã được cấu hình thành ứng dụng của một tập các đầu vào sinh ra tập các đầu ra mong muốn Nhiều phương pháp nhằm tạo ra tập sức mạnh của các kết

Trang 20

nối đang có Một phương pháp nhằm thiết lập các trọng số rõ ràng, bằng việc sử dụng tri thức tiền nghiệm (tri thức đã có từ trước)

Một cách khác để huấn luyện mạng nơron bằng cách đưa các mẫu dạy học và cho phép thay đổi các trọng số theo một số luật học Các tình huống học ở mạng nơron

có thể được phân loại thành 3 loại khác nhau Đó là học có giám sát, học không có giám sát và học tăng cường Trong học có giám sát, vectơ đầu vào được trình bày tại đầu vào cùng với tập các phản hồi mong muốn, một phản hồi cho mỗi nút, tại lớp đầu

ra Những phản hồi này sau đó được dùng để xác định trọng số thay đổi trong mạng theo luật học có ưu thế Các ví dụ nổi tiếng nhất của kỹ thuật này xuất hiện trong thuật giải lan truyền ngược, luật delta, và luật perceptron

Trong học không có giám sát (hay tự tổ chức) một đơn vị (đầu ra) được huấn luyện để đáp ứng lại cụm các mẫu trong đầu vào Trong mô hình này, hệ thống được cho là để khám phá ra các đặc trưng nổi bật của thống kê đầu vào Khác với mô hình học có giám sát, ở đây không có tập tiền nghiệm của các loại mẫu được phân loại; đúng hơn là hệ thống phải phát triển thể hiện của kích thích đầu vào riêng

Trong quá trình học có giám sát, giả thiết rằng đáp ứng đầu ra của mạng đã đạt được giá trị mong muốn Nhưng ở một mẫu vào - ra nào đó bị cho rằng có kết quả không đáng tin cậy, vì vậy cần phải tiến hành kiểm tra lại mẫu nói trên Khi đó chỉ có một bit tín hiệu của mẫu cần kiểm tra đóng vai trò là tín hiệu củng cố được đưa vào mạng để góp phần khẳng định kết quả quá trình học có giám sát đúng hay sai Kiểu học này được gọi là kiểu học củng cố (hay học tăng cường) Kiểu học này cũng có tín hiệu củng cố được lấy từ bên ngoài nên nó chỉ là một trường hợp đặc biệt của kiểu học có giám sát

1.2.2 Các giải thuật tính toán tiến hóa và di truyền

Để giải quyết vấn đề tính toán phức tạp, cũng như nhiều nhiệm vụ tính toán

phức tạp khác, các nhà nghiên cứu về máy tính đã tìm kiếm bản chất trong nhiều năm

(cả như là mô hình và như phép ẩn dụ) cho cảm hứng Việc tối ưu hóa là trọng tâm của

Trang 21

các quá trình tự nhiên (chẳng hạn, thuyết tiến hóa Darwin) Qua hàng triệu năm, mỗi loài đã tối ưu các cấu trúc vật lý để thích nghi với môi trường sống Hiện nay, quá trình thích nghi, việc tối ưu hóa hình thái này là hoàn hảo, sự giống nhau giữa một con cá mập, một con cá heo hay một động vật sống dưới biển là điều đáng chú ý

Một quan sát sắc sảo về mối quan hệ cơ bản giữa tối ưu hóa và tiến hóa sinh học

đã dẫn đến sự phát triển một mô hình CI mới (các kỹ thuật tính toán tiến hóa) để thực hiện tìm kiếm và tối ưu hóa rất phức tạp

Tính toán tiến hóa sử dụng bộ lặp tiến (ví dụ, tăng trưởng hoặc phát triển trong quần thể) Quần thể này sau đó được lựa chọn trong một tìm kiếm ngẫu nhiên có hướng dẫn sử dụng tiến trình song song để đạt được kết quả mong muốn Các tiến trình như vậy thường được lấy cảm hứng từ các cơ chế sinh học của sự tiến hóa Mô hình các kỹ thuật tính toán tiến hóa xuất hiện trở lại vào đầu những năm 1950, khi ý tưởng sử dụng các nguyên tắc Darwin cho vấn đề giải quyết tự động được sinh ra Mãi đến những năm 1960, 3 cách giải thích khác biệt của ý tưởng này bắt đầu được phát triển ở ba địa điểm khác nhau Lập trình tiến hóa (Evolutionary programming - EP) được Lawrence J.Fogel [17] giới thiệu ở Mỹ, khi John Henry Holland đã gọi phương pháp của ông là thuật giải di truyền (Genetic Algorithm - GA) [18] Ở Đức Ingo Rechenberg và Hans-Paul Schwefel đã giới thiệu các chiến lược tiến hóa [19,20] Những chiến lược này đã được phát triển tách biệt trong 15 năm Từ đầu những năm 1990, chúng được thống nhất là các đại diện khác nhau của một công nghệ, được gọi là tính toán tiến hóa Ngoài

ra, đầu những năm 1990, một luồng thứ tư sau những ý tưởng chung đã nổi lên lập trình di truyền (Genetic Programming - GP) [21] Tất cả đều có chung một cơ sở khái niệm về mô phỏng tiến hóa các cấu trúc cá nhân thông qua quá trình lai, đột biến và sinh sản Các quá trình phụ thuộc vào thể hiện nhận thức của các cấu trúc riêng đã được định nghĩa bởi môi trường (vấn đề) GA xử lý các tham số với độ dài hữu hạn, được mã hóa bằng việc sử dụng một bảng chữ cái hữu hạn, hơn là tự thao tác trực tiếp các thông số Điều này có nghĩa là tìm kiếm không bị ràng buộc bởi tính liên tục của

Trang 22

hàm dưới sự kiểm tra hoặc sự tồn tại của một hàm phái sinh Hình 4 minh họa mô hình khối chức năng của GA và các khía cạnh được đề cập dưới đây Giả sử rằng giải pháp tiềm năng cho một vấn đề có thể được biểu diễn như một tập các tham số Những tham

số này (được gọi là gen) được kết hợp cùng nhau để tạo thành một chuỗi các giá trị (được gọi là nhiễm sắc thể) Một gen (cũng được gọi là đặc tính, đặc trưng, hoặc bộ dò)

là một thuộc tính cụ thể được mã hóa trong nhiễm sắc thể Các giá trị gen đặc biệt có thể được gọi là allel

Các vấn đề mã hóa xử lý việc trình bày giải pháp về nhiễm sắc thể và thật không may, không có một kỹ thuật nào làm việc tốt nhất cho mọi vấn đề Một hàm phù hợp phải được sinh ra cho mỗi vấn đề được giải quyết Cho trước một nhiễm sắc thể đặc biệt, hàm phù hợp trả về một giá trị số duy nhất phù hợp hoặc con số cụ thể, sẽ xác định khả năng của mỗi cá thể, mà nhiễm sắc thể đó thể hiện Việc tái sinh là thuộc tính thứ hai của GA ở đó 2 cá thể được chọn lựa từ quần thể được phép giao phối để tạo ra con cái, mà sẽ bao gồm cả thế hệ tiếp theo Có lựa chọn cha mẹ, con cái sẽ được sinh

ra, điển hình bằng việc sử dụng các cơ chế chéo và đột biến

Hình 3 Sơ đồ lặp của giải thuật di truyền

Việc lựa chọn sống còn phù hợp nhất với GA Nó xác định các cá thể nào cho mục đích duy trì nòi giống Giai đoạn lựa chọn bao gồm 3 phần Phần đầu tiên bao gồm xác định sự phù hợp của cá thể bởi hàm phù hợp Hàm phù hợp phải được sinh ra; cho trước nhiễm sắc thể phù hợp, hàm phù hợp trả lại giá trị phù hợp bằng số, là tỷ lệ của khả năng, hoặc tính khả dụng, của cá thể được thể hiện bằng nhiễm sắc thể Phần

Trang 23

thứ hai bao gồm việc chuyển đổi hàm phù hợp thành một giá trị mong muốn sau đó bởi lần cuối cùng mà giá trị mong muốn sau đó được chuyển đổi thành một số con cái

Một số kỹ thuật lựa chọn thường được sử dụng là bánh xe roullette và lấy mẫu ngẫu nhiên Nếu GA đã được thực hiện một các chính xác, thì quần thể sẽ phát triển các thế hệ kế tiếp tốt nhất để phù hợp nhất và cá thể trung bình trong mỗi thế hệ tăng lên theo hướng tối ưu Hiện nay, các kỹ thuật tiến hóa hầu hết bao gồm các giải thuật tối ưu hóa meta-heuristic, như là các giải thuật tiến hóa (bao gồm GA, lập trình tiến hóa, chiến lược tiến hóa, lập trình di truyền, các hệ phân loại học và tiến hóa khác biệt)

1.2.3 Tính toán xác suất và mạng tin cậy

Các mô hình xác suất được xem như giống với một trò chơi, các hoạt động dựa trên các kết quả mong muốn Trung tâm quan tâm chuyển từ xác định các mô hình xác suất bằng việc sử dụng các định giá thống kê và dự đoán Trong quá trình mô hình hóa xác suất, rủi ro có nghĩa là không chắc chắn cho sự phân bố xác suất được biết đến Vì thế, đánh giá rủi ro có nghĩa là nghiên cứu nhằm xác định các kết quả quyết định cùng với xác suất của chúng

Những người ra quyết định thường đối mặt với việc thiếu thông tin nghiêm trọng Việc đánh giá xác suất định lượng khoảng cách thông tin giữa những gì đã được biết đến và những gì cần được biết để có quyết định tối ưu Các mô hình xác suất được

sử đụng để bảo vệ chống lại sự không chắc chắn bất lợi, và khai thác sự không chắc chắn thuận lợi

Một ví dụ hay về mạng nơron xác suất (học Bayesian) trong đó xác suất được sử dụng để biểu diễn sự không chắc chắn về mối quan hệ đã biết

Trước khi thấy dữ liệu, các ý kiến ban đầu về những gì mà mối quan hệ thực sự

có thể được thể hiện trong phân bố xác suất thông qua các trọng số mạng xác định mối quan hệ này Sau đó chúng ta tìm kiếm dữ liệu, kiểm tra lại các ý kiến đã thu thập bởi

sự phân bố trước đây thông qua trọng số mạng Các trọng số mạng trước đó dường như

là chính đáng, nhưng không phù hợp với dữ liệu, giờ đây sẽ được xem như là rất ít khả

Trang 24

năng, trong khi đó xác suất cho các giá trị trọng số thực sự phù hợp với dữ liệu đã tăng lên Điển hình, mục đích huấn luyện là nhằm tạo ra các dự báo cho các trường hợp tương lai trong đó chỉ những đầu vào mạng được biết đến Kết quả của việc huấn luyện mạng thông thường là tập duy nhất của các trọng số có thể được sử dụng cho những dự báo như vậy

Mạng tin cậy Bayesian [23,24] được biểu diễn bằng một đồ thị hoặc cây mạch

hở trực tiếp, ở đó các nút chỉ ra các sự kiện và các cung chỉ ra mối quan hệ nguyên nhân - kết quả giữa các nút cha và các nút con Ở đây, mỗi nút, có thể giả sử một số giá trị có thể Ví dụ, nút A có thể có n số giá trị có thể, biểu diễn bằng A1, A2, …, An Với hai nút bất kỳ, A và B, có tồn tại sự phụ thuộc AB, chúng tôi gán một ma trận xác suất có điều kiện [P(B/A)] đến cung trực tiếp từ nút A đến B Phần tử ở hàng thứ j và cột thứ i của P(B/A), ký hiệu là P(Bj /Ai ), đại diện cho xác suất có điều kiện của Bj giả

sử với sự xuất hiện trước của Ai Điều này được mô tả trong hình 4

Cho trước phân phối xác suất của A, ký hiệu bởi [P(A1)P(A2) ··· P(An)], chúng tôi có thể tính toán phân phối xác suất của sự kiện B bằng cách sử dụng biểu thức sau:

Bây giờ chúng ta minh họa tính toán của P(B) với 1 ví dụ

Pearl [22-24] đã đề xuất một mô hình cho việc truyền tin cậy của bằng chứng trong mạng Bayesian Trước tiên, chúng tôi minh họa mô hình của Pearl với cây Bayesian như trong hình 4 Tuy nhiên, chú ý rằng, mỗi biến giống như cây trong hình

4, A, B… cần có không chỉ 2 giá trị có thể Ví dụ, nếu một nút trong 1 cây chỉ ra bệnh sởi Đức (GM), nó có thể có 3 giá trị như GM-nặng, GM-ít, và GM-vừa phải

Trong mô hình Pearl dùng lập luận bằng chứng, ông xem xét cả ảnh hưởng nguyên nhân và ảnh hưởng chẩn đoán đối với tính toán hàm tin cậy tại một nút cho

Trang 25

trước trong cây tin cậy Bayesian Để tính toán tin cậy tại một nút V, ông chia cây thành

2 phần:

(1): Cây con có gốc tại V và

(2): Phần còn lại của cây

Hình 4 Gán ma trận xác suất có điều kiện trong cung nối trực tiếp từ A đến B

Mô tả tập con bằng chứng, nằm tại cây con của V bởi ev- – và tập con bằng chứng từ phần còn lại của cây bởi ev+ Hàm tin cậy của nút V được biểu diễn bằng Bel(V), định nghĩa như sau:

Bel(V) = P(V/ev+, ev-)

= P(ev -/V) P(V/ev

+)/α

Với λ(V)=P(ev-/V)}

Và α là hằng số chuẩn hóa, được xác định bởi:

α= v∈(true, false)P(ev-/V).P(V/ev+) (1.10)

Từ biểu thức cuối cùng giả sử v chỉ có 2 giá trị: đúng và sai Đó chỉ là ký hiệu minh họa Trong thực tế, v có thể có một số giá trị có thể

Pearl đã thiết kế một giải thuật thú vị về lan truyền tin cậy trong cây nguyên nhân Ông gán xác suất tiền nghiệm của một nút lá không hoàn chỉnh, sau đó truyền độ tin cậy từ nút này đến nút cha của nó, và sau đó, từ nút cha đến nút ông, cho đến khi tiếp cận đến gốc Sau đó, ông xem xét lan truyền ngược độ tin cậy từ gốc đến các con,

và từ mỗi nút con đến con của nó… cho đến khi đến được các lá Lá có độ tin cậy cao nhất sau đó được gán xác suất tiền nghiệm và toàn bộ tiến trình được mô tả ở trên được

Trang 26

lặp lại Pearl đã trình bày rằng sau khi có một số hữu hạn giao cắt lên - xuống trên cây thì đã đạt tới trạng thái ổn định theo một nút lá đặc biệt trong tất cả các giao cắt tiếp theo mang lại niềm tin cực đại cho tất cả các lá trên cây Lá vì thế được chọn lựa được coi như là mục chưa hoàn chỉnh

1.2.4 Hệ chuyên gia (Expert System - ES)

1.2.4.1 Giới thiệu về hệ chuyên gia

1.2.4.1.1 Định nghĩa:

Hệ chuyên gia (HCG) là một hệ thống được xây dựng trên máy tính có khả năng giải quyết các bài toán như một chuyên gia người bằng cách sử dụng những tri thức chuyên môn được mô hình hóa qua các modul của chương trình Một hệ chuyên gia được xây dựng từ 2 thành phần chính: Cơ sở tri thức (knowledge base) và mô tơ suy diễn (hay cơ chế suy diễn) (inference engine)

Hình 5 Các thành phần chính của Hệ chuyên gia

Cơ sở tri thức (knowledge base): Dùng để chứa tri thức trong một lĩnh vực nào

đó, tri thức này do chuyên gia con người chuyển giao Cơ sở tri thức (CSTT) bao gồm: các khái niệm cơ bản, các sự kiện, các luật và quan hệ giữa chúng Ví dụ:

 Tri thức về bệnh nhiễm trùng máu do các bác sĩ chuyên khoa về bệnh nhiễm trùng máu chuyển giao

 Tri thức về chiến lược đầu tư do các nhà cố vấn đầu tư chuyển giao

Mô tơ suy diễn (hay cơ chế suy diễn) (inference engine): Là bộ xử lý cho tri

thức, được mô hình hóa sao cho giống với việc suy luận của chuyên gia con người bộ

Trang 27

xử lý này làm việc dựa trên thông tin mà người dùng mô tả về vấn đề kết hợp với CSTT để đưa ra kết luận hay đề nghị

1.2.4.1.2 Phạm vi ứng dụng HCG:

Người ta đã xây dựng các hệ chuyên gia để giải quyết hàng loạt những vấn đề trong các lĩnh vực như y học, toán học, công nghệ, hóa học, khoa học máy tính, kinh doanh, luật pháp, quốc phòng và giáo dục các chương trình này đã giải quyết một lớp rộng các loại vấn đề như:

 Diễn giải (interpretation): Hình thành những kết luận hay mô tả cấp cao

 Lập kế hoạch (planning): Tìm ra một chuỗi các hành động để đạt được một tập hợp các mục tiêu, khi được cho trước các điều kiện khởi đầu và những ràng buộc trong thời gian chạy (run-time)

 Giám sát (monitoring): So sánh hành vi quan sát được của hệ thống với hành vi mong đợi

 Bắt lỗi và sửa chữa (debuging and repair): Chỉ định và cài đặt những phương pháp chữa trị cho các trục trặc

 Hướng dẫn (instruction): phát hiện và sửa chữa những thiếu sót trong quan niệm của học viên về một chủ đề lĩnh vực nào đó

 Điều khiển (control): chỉ đạo hành vi của một môi trường phức tạp

Trang 28

1.2.4.1.3 Cấu trúc của Hệ chuyên gia

HCG mô phỏng khả năng giải quyết vấn đề của chuyên gia con người Do vậy, chúng ta cần xem xét cách thức giải quyết của chuyên gia con người để từ đó mô phỏng theo

Hình 6 Cách thức giải quyết vấn đề con người

Hình 7 Cách thức giải quyết vấn đề con người

Trang 29

Một hệ chuyên gia có kiến trúc được mô tả như hình vẽ:

Hình 8 Mô hình Hệ chuyên gia

Những người liên quan chủ yếu trong việc xây dựng một HCG là kỹ sư tri thức (knowledge engineer), chuyên gia lĩnh vực (domain expert) và người dùng cuối (end-user)

Kỹ sư tri thức: Là chuyên gia trong lĩnh vực thu thập tri thức kinh nghiệm từ

chuyên gia con người và biểu diễn chúng Kỹ sư tri thức có nhiệm vụ chính là chọn các công cụ phần mềm và phần cứng cho đề án, giúp đỡ chuyên gia phát biểu các tri thức cần thiết, và cài đặt các tri thức đó vào một cơ sở tri thức đúng đắn và hiệu quả

Trang 30

Chuyên gia: Cung cấp tri thức về lĩnh vực ứng dụng Thông thường, đây là một

người đã từng công tác trong lĩnh vực ứng dụng và hiểu biết những kỹ thuật giải quyết vấn đề của nó Chuyên gia chịu trách nhiệm chính trong việc giải thích rõ những kỹ năng này với kỹ sư tri thức

Người sử dụng: Là những người sử dụng và tương tác trực tiếp với HCG thông

qua giao diện người - máy Họ có thể trợ giúp trong việc thết kế giao diện cho HCG, có thể trợ giúp việc thu thập tri thức và trong quá trình phát triển HCG

Các thành phần của một kiến trúc HCG tiêu biểu trong hình 4 được diễn giải cụ thể như sau:

Giao diện người dùng (user interface): Người dùng tương tác với hệ chuyên gia

thông qua một giao diện người dùng, giao diện này đơn giản hóa việc giao tiếp và che giấu phần lớn sự phức tạp của hệ thống (Ví dụ như cấu trúc bên trong của cơ sở các luật) Các HCG sử dụng một số lượng phong phú các kiểu giao diện, bao gồm hỏi và trả lời, điều khiển bởi trình đơn, ngôn ngữ tự nhiên, hay đồ họa,… Việc quyết định sử dụng giao diện như thế nào là sự thỏa hiệp giữa nhu cầu của người dùng với những đòi hỏi của cơ sở tri thức và hệ suy diễn

Cơ sở tri thức (knowledge base): Trái tim của HCG là cơ sở tri thức tổng quát

(general knowledge base), chứa tri thức giải quyết vấn đề của một ứng dụng cụ thể Trong một hệ chuyên gia dựa trên luật, tri thức này được biểu diễn dưới dạng các luật IF… THEN… Cơ sở tri thức bao gồm tri thức tổng quát (general knowledge) cũng như thông tin của một tình huống cụ thể (case-specific)

Mô tơ suy diễn hay cơ chế suy diễn (inference engine): Xử lý, điều khiển các tri

thức được biểu diễn trong cơ sở tri thức nhằm đáp ứng các câu hỏi, các yêu cầu người dùng, áp dụng tri thức cho việc giải quyết các bài toán thực tế Về căn bản nó là một trình thông dịch cho cơ sở tri thức Trong hệ (production system), cơ chế suy diễn thực hiện chu trình điều khiển nhận dạng - hành động (recognize-act control cycle) Việc tách biệt cơ sở tri thức ra khỏi cơ chế suy diễn là rất quan trọng Vì nhiều lý do:

Trang 31

 Sự tách biệt của tri thức dùng để giải quyết vấn đề và cơ chế suy diễn sẽ tạo điều kiện cho việc biểu diễn tri thức theo một cách tự nhiên hơn Ví

dụ các luật IF…THEN… gần với cách con người mô tả những kỹ thuật giải quyết vấn đề của họ hơn so với một chương trình đưa luôn tri thức này vào phần mã máy tính cấp thấp

 Bởi vì cơ sở tri thức được cách ly khỏi các cấu trúc điều khiển cấp thấp của chương trình, các nhà xây dựng HCG có thể tập trung một cách trực tiếp vào việc nắm bắt và tổ chức giải quyết vấn đề hơn là phải thực hiện trên các chi tiết của việc cài đặt vào máy tính

 Sự phân chia tri thức và điều khiển cho phép thay đổi một phần cơ sở tri thức mà không tạo ra các hiệu ứng tới các phần khác của chương trình

 Sự tách biệt này cũng cho phép một phần mềm điều khiển và giao tiếp có thể được sử dụng cho nhiều hệ thống khác nhau Các nhà lập trình có thể

sử dụng HCG lõi và tạo ra một cơ sở tri thức mới thích hợp với ứng dụng của họ

Thu nhận tri thức (knowledge acquisition): Thu nhận tri thức từ chuyên gia con

người thông qua các câu hỏi và yêu cầu của họ Bộ thu nhận tri thức cho phép kỹ sư tri thức có thể bổ sung, sửa đổi hoặc loại bỏ tri thức trong cơ sở tri thức

Bộ giải thích (explanation): Cho phép chương trình giải thích quá trình suy luận

của nó cho người dùng Các giải thích này bao gồm các lập luận biện minh cho các kết luận của hệ thống (trả lời cho câu hỏi HOW), giải thích vì sao hệ thống cần dữ liệu đó (trả lời cho câu hỏi WHY),…

 HOW: Bằng cách nào HCG có thể suy ra kết luận nào đó? Ngoài chức năng cung cấp kết quả suy luận cuối cùng, HCG còn có thể cung cấp cho người dùng quá trình HCG đạt đến kết luận bằng cách nào Khả năng giải thích bằng cách nào rất quan trọng với HCG, nó làm cho HCG khác với các chương trình truyền thống Các chương trình truyền thống làm việc

Trang 32

trên các bài toán được định nghĩa tốt, kết quả của chương trình đã được kiểm nghiệm trước khi chuyển giao HCG làm việc trên bài toán thiếu nhiều thông tin, thậm chí tri thức còn có thể cập nhật khi HCG đã được triển khai - Chính vì vậy mà kết luận của hệ phải được giải thích bằng cách nào để cho kết quả cuối cùng có giá trị hơn

 WHY: Tại sao HCG lại hỏi câu hỏi nào đó? Với khả năng này, người dùng có thể theo vết được luồng suy luận của HCG và yên tâm hơn với kết quả Khi chúng ta hỏi WHY, HCG thường đáp trả bằng cách mô tả cái

gì mà nó có thể kết luận từ câu trả lời Hầu hết các HCG thường đáp trả bằng cách hiện luật mà nó đang quan tâm

Mức độ hiệu quả của một hệ chuyên gia phụ thuộc vào số lượng và chất lượng của cơ

sở tri thức của hệ Công nghệ xử lý tri thức là giải pháp kỹ thuật nhằm phân tích, cài đặt và thử nghiệm các hệ chuyên gia để giải các bài toán cụ thể

1.2.4.1.4 Các đặc trưng cơ bản của HCG

 Phân tách tri thức và điều khiển

 Sở hữu tri thức chuyên gia

 Tính chuyên gia trong lĩnh vực hẹp

 Suy luận trên ký hiệu

 Suy luận có kinh nghiệm (heuristics)

 Cho phép suy luận không chính xác

 Bị giới hạn vào vấn đề giải quyết

 Giải quyết các vấn đề có độ phức tạp vừa phải

 Có khả năng bị lỗi

1.2.4.2 Biểu diễn tri thức nhờ các luật sản xuất

Tri thức tồn tại dưới 2 dạng cơ bản:

 Tri thức định lượng

 Tri thức định tính: Các tri thức định tính lại được chia thành 3 loại:

Trang 33

o Tri thức mô tả (declarative knowledge)

o Tri thức thủ tục (procedural knowledge)

o Tri thức điều khiển (control knowledge)

Có 4 phương pháp biểu diễn tri thức cơ bản là:

- Phương pháp biểu diễn tri thức mô tả: logic, mạng ngữ nghĩa, AOV

- Phương pháp biểu diễn tri thức thủ tục: sản xuất

- Phương pháp biểu diễn hỗn hợp: frame

Như đã trình bày ở mục 2.1, để giải quyết bài toán đã được đặt ra, ta lựa chọn giải phương pháp hệ chuyên gia Các tri thức chuyên gia bác sĩ ở đây có dạng:

Nếu bệnh nhân có triệu chứng viêm khớp đối xứng thì bệnh nhân có khả năng mắc bệnh viêm khớp dạng thấp

Rõ ràng trong các phương pháp biểu diễn tri thức trình bày ở trên, biểu diễn tri thức nhờ các luật sản xuất có thể đáp ứng biểu diễn các tri thức yêu cầu của bài toán xây dựng mô hình lập luận xấp xỉ trong hệ chuyên gia chẩn đoán bệnh khớp

Để có thể tận dụng những điểm mạnh trong suy diễn logic nhờ nguyên lý modus ponens, các chuyên gia trí tuệ nhân tạo đưa ra các luật sản xuất có dạng:

NẾU Điều kiện 1

Điều kiện 2

… Điều kiện m

Trang 34

THÌ Kết luận 1

… Kết luận n Trong đó, các điều kiện và các kết luận có thể có dạng khá thoải mái Trường hợp mỗi điều kiện i, kết luận j là vị từ hay mệnh đề thì ta có một suy dẫn logic thông thường

Ví dụ: Trong ngôn ngữ lập trình, các sản xuất có nghĩa là các câu lệnh:

p1 ^ ^ pk → q không thêm được thông tin gì

Trong biểu diễn IF … THEN , NẾU … THÌ của các luật sản xuất, các điều kiện cũng

có thể là các biểu thức logic Ví dụ:

Nếu Cứng khớp buổi sáng,

Viêm khớp gối, Viêm khớp ngón gần Thì Mắc bệnh Viêm khớp dạng thấp

Trang 35

1.2.4.3 Hệ chuyên gia dựa trên luật

Định nghĩa: HCG dựa trên luật là một chương trình máy tính, xử lý các thông tin

cụ thể của bài toán được chứa trong bộ nhớ làm việc và tập các luật được chứa trong cơ

sở tri thức (CSTT) (knowledge base), sử dụng cơ chế suy diễn để (inference engine) suy ra thông tin mới

HCG dựa trên luật có kiến trúc như sau:

Hình 9 Kiến trúc hệ chuyên gia dựa trên luật

HCG dựa trên luật có nền tảng xây dựng là hệ luật sinh, có những đặc trưng cơ bản như đã nêu trong phần trước cho các HCG tổng quát, ngoài ra còn có các đặc điểm sau:

 Có CSTT chứa các luật (knowledge base)

 Có bộ nhớ làm việc tạm thời (working memory)

 Có cơ chế suy diễn (inference engine)

 Có một giao diện để giao tiếp với người dùng, người phát triển (User interface, develper interface)

 Có tiện ích giải thích (explantation facility)

Trang 36

 Có khả năng giao tiếp với chương trình ngoài như: các hệ quản trị cơ sở

dữ liệu, xử lý bảng tính thông qua bộ giao tiếp chương trình ngoài (external programs)

Một HCG dựa trên luật tồn tại các nhược điểm sau:

 Các sự kiện (fact) muốn đồng nhất, phải khớp nhau hoàn toàn → các sự kiện cùng một ý nghĩa phải giống nhau về cú pháp nhưng thực tế, ngôn ngữ tự nhiên lại không như vậy

 Khó tìm mối quan hệ giữa các luật trong một chuỗi suy luận vì chúng có thể nằm rải rác trong CSTT

 Có thể hoạt động chậm

 Làm cho nhà phát triển phải hình dung mọi sự kiện ở dạng luật trong khi không phải bài toán nào cũng có thể thực hiện được điều này

Các ưu điểm của HCG dựa trên luật:

 Diễn tả được ngôn ngữ tự nhiên thông qua biễu diễn tri thức tự nhiên: IF

… THEN

 Tri thức là tập các luật có tính độc lập cao do vậy dễ thay đổi, chỉnh sửa

 Dễ mở rộng

 Tận dụng được tri thức Heuristic

 Có thể dùng biến trong luật, truy xuất chương trình ngoài

Với các ưu điểm như đã trình bày, HCG dựa trên luật là lời giải thích hợp cho những bài toán mà tri thức đầu vào được cung cấp bởi các chuyên gia bác sĩ trong lĩnh vực y học Với HCG dựa trên luật, các tri thức này có thể được mã hóa, cài đặt vào hệ thống, mô phỏng chính xác theo cách làm việc của các bác sĩ Ví dụ điển hình là hệ MYCIN - thước đo cho nhiều HCG dựa trên luật sau này

MYCIN là HCG chuẩn đoán bệnh nhiễm trùng máu, được phát triển vào khoảng năm 1970, tại đại học standford MYCIN sử dụng cơ sở tri thức với khoảng 500 luật về nhiễm trùng máu, các luật được biểu diễn dưới dạng các luật sản xuất với tiếp cận về lý

Trang 37

thuyết độ chắc chắn (certain theory) MYCIN được viết trên ngôn ngữ interlisp, một nhánh của lisp, sử dụng cơ chế suy diễn lùi trong lập luận

Các đặc điểm chính của hệ MYCIN:

 Sử dụng kỹ thuật suy luận lùi

 Có khả năng phân tách tri thức và điều khiển

 Có tích hợp luật meta (luật chỉ ra cách sử dụng các luật khác)

 Có thể dùng khi thiếu thông tin hay thông tin không chính xác

 Có khả năng nhớ được các thông tin trong một phiên làm việc với người bệnh cụ thể

 Để sử dụng – giao tiếp với bác sĩ bằng ngôn ngữ tự nhiên

 Cung cấp các chức năng giải thích WHY, HOW

Dưới đây là một phiên làm việc cụ thể với MYCIN:

? Một vài thông tin về bệnh nhân:

? MYCIN cố gắng xác định bản chất lây nhiễm

5 MCIN: Có bất kỳ phép cấy vi khuẩn cho Jack durkin liên quan đến bệnh hiện tại?

USER: Có

6 MYCIN: Mẫu vật lấy từ đâu?

user: csf

Trang 38

7 mycin: Ngày, giờ thực hiện cấy?

Những người xây dựng hệ MYCIN sau khi quan sát các bác sĩ làm việc trong lĩnh vực y học, nhận thấy rằng, các bác sĩ thường làm việc với những sự kiện không chắc chắn, thậm chí với những thông tin không rõ ràng Họ đưa ra những nhận định:

“có thể”, “gần như”, “chắc chắn”, thay bằng cách biểu diễn dưới dạng ngôn ngữ tự nhiên như vậy, MYCIN gắn cho mỗi sự kiện một con số, gọi là nhân tố chắc chắn CF (Certain Factor) Con số này có giá trị từ -1 (chắc chắn sai) đến +1(chắc chắn đúng) Giá trị dương thể hiện mức độ tin tưởng, giá trị âm thể hiện mức độ không tin tưởng

CF có thể được tính toán dựa trên một bảng tra trên các từ nhấn

Ví dụ:

Trang 39

Hình 10 Nhân tố chắc chắn sử dụng trong MYCIN

Luật với độ chắc chắn được biểu diễn dưới dạng:

IF E1 AND E2…THEN H CF=CFiTrong đó:

 Ei: Là tiền đề của luật Các tiền đề “Tiền đề” được kết nối với nhau bởi ghép AND hoặc OR và không sử dụng toán tử NOT

 H: Là kết luận của luật

 CF: Là độ chắc chắn của kết luận, cho biết mức độ chắc chắn của kết luận H (liên quan tới sự tin tưởng hay nghi ngờ về sự chính xác của kết luận) với giá trị nằm trong đoạn

 Ví dụ: NẾU “Cứng khớp buổi sáng” THÌ “Mắc bệnh viêm khớp dạng thấp” CF= 0.25

Độ chắc chắn của giả thuyết H dựa trên hiện tượng E - CF(H,E) thu được từ các giá trị:

) – Xác suất không xảy ra giả thuyết H khi sự kiện E đã xuất hiện

 Độ tin cậy MB(H,E) (Measure of Belief): Là con số phản ánh lòng tin vào một

giả thuyết H dựa trên hiện tượng E (0 ≤ MB ≤ 1)

Trang 40

 Độ nghi ngờ MD (H,E) (Measure of Disbelief): Là con số phản ánh sự nghi ngờ

vào một giả thuyết H dựa trên hiện tượng E (0 ≤ md ≤ 1)

Sự liên hệ giữa lý thuyết về độ chắc chắn – lý thuyết xác suất của CF:

Độ chắc chắn kết luận của luật – CF(H,E) được tính như sau:

 Với những luật có tiền đề đơn:

Định dạng
Số trang	109
Dung lượng	3,45 MB