Em cững xin thể hiện sự kinh trong và lòng biết ơn đến Quý Thây Cô trong Viện Công nghệ thông fin, trường Đại học Bách Khna Hà Nội, những người đã trang bị cho em rất nhiều kiển thức chu
Trang 1BO GIAO DUC VA DAO TAO
TRUONG BAI HOC BACH KHOA HA NOL
NGO TIT DIEU THUY
NGHIÊN CỨU MỘT SỐ PHƯƠNG PHÁP CỦA TRÍ TUỆ ‘TINH TOAN
NGUOI HUONG DAN KHOA HOC:
PGS.TS NGUYÊN HOẢNG PHƯƠNG
11ả Nội - Năm 2012
Trang 2
BO GIAO DUC VA BAO TAO
TRUONG DAL HOC BACH KHOA HA NOL
NGO TH] DIEU THUY
NGHIEN CUU MOT SÓ PHƯƠNG PHÁP CỦA TRÍ TUỆ TÍNH TOÁN
UNG DUN IRONG Y HỌC:
Chuyên ngành: CÔNG NGHỆ THÔNG TIN
TIAN VAN THẠC SĨ KHOA HỌC
CONG NGHE THONG TLN
NGƯỜI HƯỚNG DẪN KHOA HỌC:
PGS.TS NGUYỄN HOÀNG PHƯƠNG
Hà Nội — Năm 2012
Trang 3MUC LUC
T.OT CAM BOAN,
LOT CAM ON
1 Giới thiệu
2 Mục dịch của luận văn
3 Phương pháp thực hiện luận vẫn
4 Nội đụng của luận văn
1.2 Các thành phần cơ bản của trí tuế tính toán
1.2.1 Mạng nơron nhân tạo (ANN)
1.2.2 Các giải thuật tỉnh toán tiến hóa và di truy
1.2.3 Tỉnh toán xác suất và mạng tin cậy
1.2.4 Hệ chuyên gia (Expert System - HS)
1.2.5 Tổng quan vé Logic mé (Fuzzy Logic), xy dụng ec cơ sở tr thúc cho hệ
Trang 42.4 Quy trình làm bệnh án eơ xương khớp settee OG
BE XUAT HUONG PHAT TRIE?
TAI LIEU THAM KHAO
PHU LUC
PHU LUC 1: TRIBU CHUNG BENH KHOP
PHỤ LỤC 2: CƠ 8Ó TRI THỨC NỀU - THĨ : —.-
Trang 5
LOI CAM DOAN
Tôi xin cam doan đầy là công trình nghiền cứu của tôi, dưới sự hưởng, đẫn của
PGS.TS Nguyễn Lioàng Phương
Các nội đung nghiên cứu và kết quả trong để tải này la trung thực, những số liệu trong các bảng biểu phục vụ cho việc phân tích, nhận xét được chỉnh tác giả thu thập từ
các nguyên khác nhau có ghỉ trong phân tải liệu tham khảo
Ngoài ra để lãi còn sử dụng một số nhận xét, đánh giá cũng ra số liệu của các tác giã, cơ quan tổ chức khác và cũng dược thẻ hiện trong phần tải liệu tham khảo
Hà Nội, ngày 10 tháng 3 năm 2012
Học viên
Ngô Thị Diệu Thúy
Trang 6LOI CAM ON
Lời đầu tiên em xin chân thành bày tỏ lòng cảm ơn và kinh trọng sâu sắc đối với
người Thấy, PGS TS Nguyễn Hoàng Phương, Phó Vụ trưởng Vụ Khoa học và Dào
tạo, Bộ Y lế, người thây đã trực tiếp hướng dẫn, giúp ert định hướng, tận tỉnh chỉ bão
và hỗ trợ em trong suốt quá trình nghiền cứu vả thực hiện luận văn
Em cững xin thể hiện sự kinh trong và lòng biết ơn đến Quý Thây Cô trong
Viện Công nghệ thông fin, trường Đại học Bách Khna Hà Nội, những người đã trang bị cho em rất nhiều kiển thức chuyên ngành, cũng như sự chỉ bão, giúp đỡ tận
tình của quy Thấy Cô đối với em trong suốt quả trình học tập Tắt cả các kiến thúc mnà
em lĩnh hội được từ bài giáng của các Thấy Cô lá vô củng quý giá
hân đây, con xin gửi lời cảm ơn sâu sắc đến Bố, Mẹ và những người thân trong gìa đình, những người luôn luôn bên cạnh và tạo mọi diều kiện thuận lợi nhất để
em có thể hoàn thánh luận văn
Tôi cững xin được căm em các bác sỹ, cáo bạn đồng nghiệp đang công tác tại
Bệnh viện Y học cổ truyền TW, những người dã cung cắp va chia sé tai liệu, thông,
tin quý báu trong suốt quá trình học tập, nghiên cứu, hoàn thành luận văn này
Hà Nội, ngày 10 tháng 3 năm 2012
gõ Thị Diệu Thủy
Trang 7
Giá trị
Trang 8
DANH MỤC HÌNH VẼ
Hình 1 Các thành phẩn của Trí tuệ tính toán
1Iinh 2, Kiến trúc của một noron nhân tạo vá mạng noron nhiều lớp
Hinh 4, Gan ma tran xdc suit co didu kién trong cung nói trực tiếp từ A đến H 24
Hình 7 Cách thức giải quyết vẫn đẻ con người ¬¬ BT
Hình 10 Nhân tố chắc chắn sử dụng trong MYCIN - ccccccccv222222SSSvsxrccee 38
11inh 17 Mô hình lập luận ào se TB
Hình 19 Biéu dé UseCase "Chan đoán bệnh khớp" - 84
Hình 22 Sơ dỗ cập nhật trị thúc HH2 n2 Hee 87
1Iinh 23, liều để cập nhật thông tin bệnh nhân
Hình 24 Biểu đỗ cập riật thông lin cẩn kháut - 90
Hình 25, Biển đỗ chân đoán
Trang 9
Hình 26 Sơ đỏ cơ sở dữ liệu Hung, HH Hari 93
THỉnh 27 Giao điện form chinh ~ ~ -94
Hình 28 Giao diện Cập nhật triệu chứng in nh tre 95
Hình 30 Giao điện khám lâm sảng ~ Sĩ
Trang 10AT VAN DE
1 Giới thiệu
Cảng nghệ thông tin nói chung va Tri tué tinh toan (Computing Intelligence -
CD) noi riéng đã và đăng trở thành công cụ đắc lực cho cuộc sống hiện đại Việc áp dụng Công nghệ thông tỉa vào nhằm lâm hiện đại hóa các quy trình lảm việc của các ngành nghề đã mang lại hiệu quả cao vẻ chỉ phi, tiết kiệm thời gian và tăng đô chính xác trong xủ lý vấn để
¥ tế là một ngành đặc thu ma ở đó việc áp đụng Công nghệ thông tin sé lam
tăng cường hiệu quả khám chữa, chăm sóc và điều trị bệnh cho công đồng Không những thể, các hệ thông théng tin ¥ tế thông mình sẽ là giải pháp cho van dễ chân
đoán sớm, kiêm soát dịch bệnh và nghiên cứu Trí tuệ tính toán hứa hẹn sẽ là một
trong những công cụ hỗ trợ đắc lục cho vấn dé nay
Lý thuyết tri tuệ tỉnh toán có những bước phát triển mạnh mẽ trong những năm
qua Chúng cưng cấp các kỹ thuật và công củ hỗ trợ có ích cha các quyệt đỉnh của con
người trong những, bói cảnh phức tạp Độ phức tạp ở dây cỏ nghĩa là số lượng lớn các yêu tố, thay đổi tình trạng bệnh, trì thức không chính xác, mơ hẻ, thiếu đữ liệu Sử dụng các kỹ thuật này cho lnh vực chăm sóc sức khỏe và y lễ có thế có tiểm năng cao
nhất Ngảy nay, việc sử dụng những kỹ thuật nảy trong công việc hàng ngày của các
bác sỹ đã không còn mới lạ vả dự kiên rằng, với những bằng chứng tin cậy thì việc áp
dụng mạnh mẽ các kỹ thuật số mang lại những lợi ích thục tổ cho bệnh nhân và cho bác
sỹ
Qua khảo sát thục lễ cho thấy các phần mêm ứng đụng hiện nay trong ngành Y
tế Việt Nam đã thể hiện dược sức mạnh tỉnh toán, lưu trữ, truy xuất nhanh chóng và hiệu quá trong quản ly kinh tế Tuy nhiên, có một thực tế rằng, hảm lượng “thông minh” trong hau hết các phan mêm ứng dung trong Y học Việt Nam hiện nay vẫn con thấp Chân đoán bệnh lả một nhiệm vụ khó va quan trong trong y hoc rat cần có sự tg
Trang 11giúp dắc lực của các phương phap tri tué tinh toan nhằm tận đụng và kết hợp tôi da trí Thức của cáo chuyên gia trong lĩnh vực cụ thể
Thực tổ cho thấy, khi cuộc sóng ngày cảng trở nên hiện đại thì đời sống nhân dân phải đối mặt với các căn bệnh nguy hiểm hơn Trong đó căn bệnh “Thấp khớp”
dường như lại là căn bệnh ngày càng phố biến nhất Hàng ngày, tai Khoa khám bệnh
của Bệnh viên Y học cỗ truyễn Trung ương vẫn tiếp đón rất nhiễu bệnh riần với các triệu chứng của căn bệnh này, đặc biệt vào những ngày thời tiết nấm, độ ấm cao Thế thing để chan đoán và tìm ra đúng bệnh đối với người bác sĩ là vô cùng khó khăn và bệnh nhân cũng phải mắt thời gian chờ doi củng với dây đủ các xét nghiệm Tuy nhiên, tiện nay ở Việt Mam vẫn chưa có một phần mềm nảo trợ giứp chân đoán bệnh khớp
Nguồn trị thức của nhân loại vô cùng rộng lớn và phong phú nhưng làm thé nao
để có thể khai tháo và biến những trí thức đó thành những ửng dụng thực tiến nhằm
phục vụ trong đời sông là nhiệm vụ của những người làm khoa học Phỏng theo tư đuy suy diễn của hệ chuyên gia, sử dụng lập luận xắp xĩ, thuật toán Fuzzy Logic, trong thời gian thực hiện luận văn về Trí tuệ tính toán ứng đụng trong Y học, tôi đã lựa chọn bài toán ứng dung cho bệnh Khớp để xây dựng bản thử nghiệm “Hệ chuyên gia chẩn doan bệnh khớp”
2 Mục đích của luận văn
Nghiên cứu mội số phương phúp của Trí tuệ tính toán ứng dụng trong y học, để
xuất một phương pháp dễ giải quyết vân dễ thực tế đặt ra ở Việt Nam
3 Phương pháp thực hiện luận văn
Để thực hiện luận văn này, chúng tôi dã phẩt nghiên cứu các lý thuyết sau đây:
Nghiên củu lý thuyết vẻ các phương pháp tính toán mẻm trong Y học, bao gềm
các lĩnh vực: Hệ chuyên gia, Logie ma, Lap luận xấp xi
10
Trang 124 Nội dung của luận văn
Tê tải tập trung vào Nghiên cúu các phương pháp của Trí tuệ tính toán ứng dụng trong Y học nhằm khai thác khả năng áp dụng Trí tuệ tính toán trong việc hỗ trợ
chan đoàn bệnh khớp ở Việt Nam
Luận văn bao gồm cáo chương:
Chương 1: Giới thiệu Trí tuệ tính toàn
Chương 2: Bệnh khóp và Quụ trình chẵn đoán bệnh kháp
Chương 3: Xây dựng thử nghiệm Hệ chuyên gia chan đoán bệnh khó Chương 4: Phân tích và thiết kế hệ thông,
Chương 5: Cài đặt chương trình thử nghiệm
Chương 6: Kết luận
Chương 7: Đề xuất hướng phát triển
Tài liệu tham khảo
Phy luc
Trang 13CHUONG 1
GIỚI TIIỆU VẺ TRÍ TIIỆ TÍNH TOÁN
Lĩnh vực trí tuệ tính toán đã phát triển với mục tiêu phát triển các may có thể suy nghĩ giống như con người Kết quả là, thành tựu mơởi nhất của lĩnh vực này có thể bắt chước hoặc vượt xa khả năng nhận thức của con người bao gồm lập luận, hiểu,
học Trí tuệ tính toán (Compttational Intelligenoe - CD bao gềm logic mờ, mạng
1ieron, các thuật giải đị truyền, lập luận xác suất,
Chương nay giới thiệu các khia cạnh cơ bản của các thành phan chính của trí tuệ tính toán hiện đại Chúng thể hiện cách nhin toản điện về các công cu của trí tuệ tính toán (chẳng hạn, logic mở, mạng noron, giải thual di truyén, mang tin cậy, lý thuyết
hến độn, lý thuyết học tính toán, và cuộc sống nhân tạo) Hành vi cộng tác của các
công cụ trên vượt xa nhiều lần hiệu suất cả nhân của chúng, Chương này cũng bao gồm các thảo luận vẻ bành vi cộng tác của nơron-mờ, các giải thuật nơron-di truyền (GA),
TiOron-tin cậy, và cac mé hinh mang noron-tin cay
1.1 Trí tuệ tính toán là gì?
Trí tuệ máy để cập đến năm 1936, khi Turing để xuất ý tưởng về máy toán học
phổ quát, một khái niệm lý thuyết trong lý thuyết toán học về khả năng tính toán [1,2]
Tưng và Post đã chứng múnh một cách dộc lập rằng việc xác dịnh khả năng quyết đính các mệnh để toán học là tương đương với yêu cầu các loại trình tự của mệt số hữu han các biểu lượng có thể nhận biết được bằng một máy trừu tượng với một tập hữu
hạn các lệnh
Ca chế như vậy được biết đến là may Turing [3] Turing nghiên cứu xác định
các tham số với khả năng tạo ra tnáy trí tuệ tính loán và gợi ý các câu trả lời cho những
lập luận, để xuất các kiểm tra ‘Turing nhu một bài kiểm tra thực nghiệm vẻ trí thông
mình [4]
12
Trang 14Kiểm tra Tương, được gọi lả trò chơi mô phòng bởi Turing, do hiệu năng của
máy so với con người Máy và người (A) được đặt ở 2 phòng, Người thứ ba, được
thảm vẫn, trong một căn phòng khác với hai phòng của người (À) và rnáy, Người thâm vấn không thể nhìn hoặc nói chuyện trực tiếp đổi với (A) hoặc máy, giao tiếp với họ chỉ thông qua một số tin nhắn văn bản hoặc thậm chí chỉ là một của số trò chuyện Nhiệm vụ của người phông vận là nhằm phân biệt giữa người và máy tính dựa trên các câu hỏi mà anh ta/cô ta có thể đưa ra đổi với cả hai thông qua các thiết bị đầu cuối Nếu tngười thâm van không thé phan biệt máy từ con người sau đó, thủ Turïng lập luận máy
dược giả định là thông mình Trong thập niên 19603, máy tỉnh không thẻ vượt qua các
kiểm tra Turing đo tốc độ xử lý chậm của các máy tính
Trong vải thập kỹ gần dây dã thấy rằng thập miên mới của trí tệ nhận lạo tập trung váo các nguyên tắc, các khia cạnh thuộc về lý thuyết, và phương pháp luận thiết
kê của các thuật toán thu được từ tự nhiên
Các ví dụ là mạng, nơron nhân tạo lấy câm hứng từ hệ thân kinh động vật cò vú,
tính toán tiến hóa được lấy cảm húng từ lụa chọn tự nhiên trong sinh học, mô phỏng luyện kim lây câm hứng từ các nguyên tắc nhiệt động lực học và trí tuệ bẩy đàn lây căm lưửng từ hành vị tập thể của côn trùng hoặc vi sinh vật, và như vậy, việc tương tác
cục bộ với mồi trường gây ra mô hình chúc năng thống nhất toàn cục đề xuất hiện
Những kỹ thuật này đế tìm thấy cách riêng để giải quyết các vẫn đề thể giới thực trong
khoa học, kinh đoanh, công, nghệ, và thương mai
Trí tuệ tỉnh toán (CD là một mô hình được thiết lập tốt [5-8], áp đụng lý thuyết mới có liên quan dến hiểu biết về sinh học Các hệ thống thực nghiệm hiện nay có nhiều đặc điểm của các máy tính sinh học (bộ não) và đang bắt đầu được xây dựng với nhiều hiệu năng cho các nhiệm vụ khó hoặc không thể thực hiện với các máy tính truyền thống, Điểm tên một số ủng dụng, chúng ta cỏ lò vị sóng, máy giặt, camera số
có thể cài đặt sử đựng nhằm đạt được hiện năng tôi nu với khả năng lập luận, tạo ra các
quyết định thông mảnh, và học từ kinh nghiệm
Trang 15Thông thường, định nghĩa CL là một nhiệm vụ không khó Bezdek [5] dã dinh nghĩa hệ CÍ theo cách sau:
“Một hệ thống trí tuệ tính toán khi: chỉ xử lý dữ liêu số (mức thấp), có các thành
phần nhận dạng mẫu, không sứ dụng trị thức theo kiểu trí tuệ nhân tạo; và hơn nữa khi
CŨ bắt đầu thế hiện:
?— Khả nững tính toán thích nghĩ i) - Khả năng chiulỗitinhtoán
Tốc đó tiếp cân giống con người và
Tỷ lệ lỗi gân bằng với thể hiện của con người.”
Định nghĩa trên suy luận rằng một hệ thông trí tuệ tính toán nên được đặc trưng,
bồi khả năng thích nghỉ tính toán, chịu lỗi, tốc độ tính toán cao, và lỗi íL bị nhiễu bởi
các nguồn thông thì Nó cũng thể hiện rằng tốc độ tính toán cao và tý lệ lỗi ít hen so
với con người Diễu đỏ đúng vái tốc độ tính toán cao đôi khi có thế mang lại sự thiểu
chính xác trong các két quả
Logic ma va mang noron hé tro mức độ song sơng cao thường có phản ứng
nhanh đối với các kích thích đầu vào Hơn nữa, không giếng như hệ suy diễn truyền thống (dựa trên luật), là hệ mã chí có luật duy nhất bị kích hoạt tại một thời điểm, logic
mờ cho phép kích hoạt một số lượng lớn các luật đảm bảo cho việc phù hợp với một
phần các sự kiện có sẵn với các rệnh để liền đề cửa những luật này Vì thế khả răng, lập luận của logic mở giống son người, và kết quả lá nó gây it lỗi Mạng, nơron nhân tạo có tốc độ tính toán cao đo nó cho phép kích hoạt đổng thời số hượng lớn các norơm
Mang noron thưởng thích nghi với các tham số thỏa mãn tập các ràng, buộc có tỷ lệ lỗi
cực tiểu Thực hiện sơng song của GA và mạng tín cậy với cùng lý do là có tốc độ tính
toàn tôi, và hành vị lọc thông 1i vốn có đuy trì độ chính xác của các kết qua dan ra
Khi dịnh nghia CL, Marks [9] dã dễ cap 16 rang tên các thành phần cầu thánh
nén CI:
14
Trang 16mang noron, cac thuat giai di truyen, hệ mờ, lập trình tiền hóa vả đời sông
nhân tạo lä những viên gạch tạo thành CL”
Về điểm nảy, việc đề cập có ý nghĩa đến đời sông nhân tạo cũng là một nguyên tac noi bật dựa trên giả thuyết rằng các luật vẻ hóa học và vật lý là đủ tốt đề giải thích trí thông minh của các sinh vật song Langton [10] dinh nghĩa đời sông nhàn tao nh
sau:
* lä một mô hình gộp cổ gắng nhận ra hành vi sống động như thật bằng cach bắt chước các quá trình xảy ra trong sư phát triển hoặc các cơ chế của cuộc sông.”
Hình 1 tổng hợp lại chỉnh xác những hiểu biết về cụm từ “Trí tuệ tỉnh toán”,
hình vẽ đã phác họa các chủ đẻ với một số ý tưởng chung về ngảnh mới nảy
Các định nghĩa trước đây về trí tuệ tỉnh toán tập trung vảo logie mờ, mạng,
noron, thuật giải di truyền và lập luận xác suất củng với nghiên cứu vẻ sư cộng tác của chúng, Hiện nay, tri tuệ tỉnh toản bị ảnh hưởng lớn bởi các mô hình lầy cảm hứng sinh
học của trí tuệ máy Nó xử lý các mô hình mờ như tỉnh toản granular (tính toán chia
nhỏ), tính toán noron, và tính toán tiền hóa Mạng tin cậy (BN- Belief Network) và
lập luận xác suất (PR - Probabilistic reasoning) 1a giao diém ctia tri tué nhan tao truyen
“Tỉnh toán mờ vá tính
“Tri tué tính toán truy đN toán chia nhỏ Tinh toan tién
<< ‘Tinh toan noron
Cuộc sống nhân tao, Tap tho,
Ly thuyét hn don, Tri tue bay dan,
Hình 1 Các thành phần của Trí tuệ tỉnh toán
Trang 17Bezdek [5], Marks [9], Pedryez [11-12], va cac nha nghién ctu khac dã định
nghĩa CI theo các cách khác nhau dua trén cdc phat trién sau dé về nguyên tắc mới này, Một giao diễm của các định nghĩa này sẽ chắc chắn tập trung vào logic mờ, Mang, neron nhân tạo (ANN), vá thuật giải dị truyền (GA), nhưng sự thống nhất (và tổng quát hóa) của tắt cả các định nghĩa nảy bao gầm nhiều chủ đẻ khác (ví dụ: lý thuyết tập thô,
lý tuyết hỗn độn, và lý thuyết tĩnh toàn) Hơn nữa, ƠI đang trồ thành một ngành mồi
néi bat không được định nghĩa chính xác chỉ đổi với số lượng hữu hạn các chủ đề
Ngoài ra ƠI cần có một phạm vì mỡ rộng theo các hưởng khác nhau và kết hợp với các ngành khác hiện có
Xu hướng gần đây la nhằm tích hợp các thành phần khác nhau đẻ tận dụng các tính năng bd sung va phat triển hệ thống cộng tác Kiến trúc lai như hệ noron-mờ, hệ tiến hóa - mở, mạng tiến hỏa-noron, hệ nơron-mở tiến hóa, đã được áp dụng rộng,
rai trong việc giải quyết các vấn đẻ của thẻ giới thực
Cáo phần tiếp theo sẽ giải thích và nêu các lợi diễm chính của các thành phần
chức năng chính trong trí tuệ tính toán và các lĩnh vực ứng dựng
1.2 Các thành phân cơ bản của trí tuệ tỉnh toán
Phan nảy sẽ cung cấp tổng quát về khái niệm cúa các mô hình C1 thông thường,
dưa trên cáo đặc tỉnh co bản của nó
1.21 Mạng nơron nhân tạo (ANN)
Mạng nơron nhân tạo [13-15] dược phát triển khái quát như các mô hình toàn học trong các hệ thân kinh sinh học Trong mô hình toán học đơn giân hóa các tế bào thân kinh, ảnh hưởng, của các xinap dược thể hiện bởi các trong số kết nổi diễu chỉnh ảnh hướng của cáo tín hiệu đâu vào có liên quan, và đặc điểm phi tuyến thẻ hiện bởi
các tế bào thần kinh được biểu diễn bằng một hàm chuyển đổi (hàm kích hoạt), thường
là ham sigmoid, Gaussian, ham lượng giác Tế bào thân kinh thúc đây sau dó dược tính toán như tổng trọng số của các tin hiệu đầu vào, được chuyên đổi nhờ hàm kích hoại Khả năng học của một tế bảo thân kinh nhan tao đại được bắng việc điều chỉnh
16
Trang 18các trọng, số phủ hợp với giải thuật học dã chọn Hầu hết các ứng dụng của mạng noron
được chia thành các loại sau đây:
«© _ Dự báo Sử đựng các giá trị đầu vào đề đự báo một số đảu ra
»_ Phân loại Sử dụng các giá trị đầu vào để xác định phân loại
» Kết hựp dữ u, Giống như phân loại, nhưng nó cũng nhận biết dữ liêu e
® Khái niệm hóa dữ liệu Phân tích các dầu vào dễ nhóm các quan hệ có thể
được suy luận
Mạng noron nhiều lớp điển hình và nơron nhân tạo được minh họa trong hình 2
Hình 2 Kiển trúc cũa một nơron nhân tao va mang noron nhiều lớp
Mỗi nơron được đặc trưng bởi một mức độ hoạt đông (đại điên cho trạng thái phân cục của muột ngron), một giá trị đầu ra (đại điện cho tỹ lệ kích hoạt của nơron),
một tập các kết nổi dầu vào (đại điện cho các xinap trên tế bảo và các sợi nhành của
né), một giá trị sai lệch (đại điện cho mức độ nghỉ nội bệ của nơron), và một tẬp các
kết nổi dâu ra (đại điện cho các phép chiếu của các sợi trục của tế bào) Mỗi khia cạnh của đơn vị được thé hiện bằng toán học bối các số thực Vì thể mỗi kết nối có một
trong số kết hợp (sức mạnh của xinap), xác định ảnh hưởng của đâu vao ban đâu trên
mức độ kích hoạt của dơn vị Các trọng số có thẻ là đương hoặc âm
Theo hình 2, luồng tín hiệu từ đầu vảo xị x„ được coi là một chiều được chỉ
ra bằng các mữi lên, như tội luống tín hiệu đấu ra cửa noron (O) Tín hiệu đầu ra
noron O duge cho bởi quan hệ sau:
Trang 19x Ầ
Trong đó wị là veolg trọng số và hàm f(net) là hàm kích hoạt và được định nghĩa
như một kết quá vô hướng của trọng số và các vectơ đầu vac
1 lá hoán vị của ma trận và trong ưởng hợp don giãn nhất thị giả trị đầu ra Ö
được tính toán như sau:
(9 ngược lại với 0 được gọi là mức ngưỡng vá kiểu nút
được gọi là dơn vị ngưỡng tuyến thấu
Hành vị của mạng nơron phụ thuộc phần lớn vào tương tác giữa các noron khác
nhau Kiên trúc co bản bao gẻm 3 kiểu lớp noron: lớp đâu vào, lớp ăn, và lớp đầu ra
Trong mạng truyền thẳng, luồng lín hiệu là từ các đơn vị đầu vào đến các đơn vị đầu ra nghiêm ngặt theo hướng truyền thẳng Việc xử lý đữ liệu có thể mở rộng đến nhiều đơn
vị, nhưng không thé hiên các kết nối ngược, đó là, việc mô rộng các kết nổi từ đầu ra
dến dâu vào của các dơn v1 ở cùng lớp hay ô các lớp trước
Mạng hồi quy bao gồm các kết nổi ngược So với mạng truyền thăng, các thuộc
tính động cia uạng là quan trọng Trong một số trường hợp, các giả trị kích hoạt của
các đơn vị trải qua một tiền trình nghĩ do mạng sẽ tiễn đến một trạng thải ổn dịnh trong,
đó các kích hoạt không thay đổi nữa Trong các ứng đựng khác, sự thay đổi các giá trị kích hoạt của các nơron dâu ra là dáng kể, nhờ đó mà hành vị động tạo thành dau ra của mạng Một số kiến trúc mạng noron khac (mang Llman, anh xa lý thuyết cộng
Thường thích nghỉ, ruạng cạnh tranh ) phụ thuộc vào các thuộc tính và yêu cầu của ime dụng
Mạng noron đã được cầu hình thành ứng dụng của một tập các đâu vào sinh ra tập các đầu ra mong muốn Nhiều phương pháp nhầm tạo ra tập sức nuạnh của các kết
18
Trang 20nổi dang có Một phương pháp nhằm thiết lập các trọng số rö ràng, bằng, việc sử dụng, trị thức tiên nghiệm (trị thức đã có từ trước)
Một cách khác đề huẳn luyện mạng nơron bằng, cách dua các mẫu dạy học và cho phép thay đổi các trọng số theo một số luật học Các tỉnh huống học ở mạng nơrơn
có thể được phân loại thành 3 loại khác nhau Đỏ là học có giám sát, học không có
giảm sát và học lăng cường, Trang học có giảm sát, vecL đầu vào được trình bày tại
đầu vào củng với tập các phản hồi mơng muốn, một phân hồi cho mỗi nút, tại lớp dau
ra Những phân hồi này sau đó được đùng để xác định trọng số thay đối trong mang
theo luật học có ưu thế, Các ví dụ nổi tiếng nhất của kỹ thuật này xuất hiện trong thuật giải lan truyền ngược, luật đelta, và luật perceptron
Trong học không có giảm sát (hay tự lô chức) một đơn vị (đâu ra) dược huấn luyện để đáp ứng lại cụm các mẫu trong đầu vào Trong mô hình này, hệ thông được
cho là để khám phá ra cae đặc trung nối bật của thông kê đâu vào Khác với mô hình
học có giám sat, ở dây không có tập tiên nghiệm của các loại mẫu được phân loại; dúng,
hơn là hệ thểi \ạ phải phát triển thẻ hiện của kích thích đầu vào riêng
Trong quá trình học có giám sát, giả thiết rằng đáp img đầu ra của mạng đã đạt được giả tị mong muốn Nhưng ở một mẫu vào - ra nảo đó bị cho rằng có kết quả
không đáng tin cậy, vi vậy cần phải tiên hành kiếm tra lại mẫu nói trên Khi đó chỉ có
một bát tín hiện của mâu cần kiểm tra đóng vai trò là lín hiệu cũng 66 được dua vao mạng dé gop phan khẳng, dịnh kết quả quả trình học có giám sat ding hay sai Kiểu học nảy được gọi là kiến học cũng cổ (hay học tăng cường) Kiến học này cũng có tín hiện củng cổ dược lấy từ bên ngoài nên nó chỉ là một trưởng hợp đặc biết của kiêu học có
giám sát
1.22 Các giải thuật tính toán tiễn hảa và di tuyễn
Để giải quyết vẫn dẻ tính toán phức tạp, cũng như nhiều nhiệm vụ tính toàn phức tạp khác, các nhà nghiên củu về máy tính đã tìm kiểm bản chất trong nhiều năm
(cà như là mô hình và nhụ phép ấn du) cho căm hứng, Việc tối ưu hóa là trọng tâm của
19
Trang 21các quá trinh tự nhién (ching hạn, thuyết tiến hóa Darwin) Qua hảng triệu năm, mỗi loài đã tối ru các câu trúc vật lý để thích nghỉ với môi trường sống THện nay, quá trinh thích nghị, việc tối tu hóa hình thái này là hoàn hảo, sự giống nhau giữa một con cá mập, một con cá heo hay một động vật sông đưởi biển lá điều đáng chủ ý
Một quan sắt sắc sảo về mới quan hệ cơ bản giữa tối tru hóa và tiên hóa sinh học
đã dẫn đến sự phải triển một mô hình CT mới (các kỹ thuật tính toán tiên hóa) để thực
tiện tìm kiếm va tai ưu hỏa rất phức tạp
Tinh loan tién hoa sử đụng bộ lặp tiến (vi đụ, lăng trưởng hoặc phát triển trong quan thể) Quần thể này sau đó được lựa chọn trong một tìm kiểm ngẫu nhiền có hướng, dẫn sử dụng tiền trinh song song để đạt được kết quả mang muốn Các tiến trình như vậy thường dược lây cảm hứng từ các cơ chế sinHt học của sự tiến hóa Mô hình các kỹ thuật tính toán tiến hỏa xuất hiện trở lại vào đầu những năm 1950, khi ÿ tướng sứ dụng, các nguyên tắc Darwin cho vẫn để giải quyết tự động được sinh ra Mãi đến những năm 1960, 3 cách giải thích khác biệt của ý tưởng, này bắt dâu dược phát triển ở ba địa điểm khác nhau Lập trình tién hoa (Evolutionary programming - IP) duge Lawrence
J.Fogel [L7] giỏi thiệu ở Mỹ, khi John Henry Holland đã gọi phương pháp cửa ông là
thuật giải dị truyền (Genetic Algorithm - GA) [18] G Duc Ingo Rechenberg va Hans-
Paul Schwefel da gidi thiệu các chiến lược tiền hóa |19.20] Những chiến lược này đã
được phát triển tách biệt trong 15 mắm Từ đâu những năm 1990, chúng được thống nhất là các đại diện khác nhau của một công nghệ, được gọi là tính toàn tiền hóa, Ngoài
ra, đâu những năm 1990, một luồng thứ tư sau những ÿ tưởng chưng đã nối lên lập trình di truyền (Genetic Programming - GP) |21| Tất cả dễu có chung một cơ sở khải tiệm về mô phỏng tiễn hỏa các cấu trúc cá nhân thông qua quả trính lai, đột biến và sinh sân Các quá trình phụ thuộc vào thê hiện nhận thức của các cấu trúc riêng đã dược định nghĩa bởi môi trường (vẫn để) GA xử lý các tham số với độ dai hữu hạn, được mã hóa bằng việc sử đụng một bảng chữ cái hữu hạn, hem là tự thao tác trực tiếp
các thông số Điều này có nghĩa là tìm kiểm không bị ràng buộc bởi tính liên tục của
20
Trang 22hảm dưới sự kiểm tra hoặc sự tổn tại của một hàm phái sinh Hình 4 minh hoa mé hinh khải chức năng của GA và cáo khía cạnh được để cập đưới đây Giả sử răng giải pháp tiểm năng cho một vẫn dễ có thể dược biểu diễn như một tập các tham số Những tham
số nảy (được gọi la gen) được kết hợp củng nhau đề tạo thành một chuối các giá trị (được goi là nhiễm sắc thể) Một gen (cũng được gọi là đáo tính, đặc trưng, hoặc bộ đà)
là một Huộc tính cụ thể được mưa hóa trong nhiễm sắc thể Các giá trị gen đặc biết có thé duoc goi 1a altel
Cae van đề mã hôa xử lý việc trình bảy giải pháp vẻ nhiềm sắc thể và thật không may, không có một kỹ thuật nảo làm việc tốt nhất cho mọi vẫn đẻ Một hàm phù hợp phải được sinh ra cho mỗi van để được giải quyết Cho trước một nhiễm sắc thê đặc biệt, hàm phủ hợp tả về một giá trị số duy nhất phù hợp hoặc con số cụ thể, sẽ xác định khá năng của mỗi cá thể, mà nhiềm sắc thê đo thể hiện Việc tải sinh là thuộc tỉnh
thứ hai của GA ở đó 2 cá thế được chọn lựa từ quân thế được phép giao phổi đề tạo ra
con cái, mà sẽ bao gồm cả thế hệ tiếp theo Có lựa chọn cha mẹ, con cái sẽ dược sinh
ra, điển hình bằng việc sử dụng cáo cơ chế chéo và đột biến
Trang 23thử hai bao gồm việc chuyển déi ham phù hợp thành một giá trị mong muốn sau đỏ bởi lần cuối cùng mà giá trị mong muốn sau đó đuợc chuyển đôi thành mệt số con cái
Một số kỹ thuật lựa chọn thường được sử dụng là bánh xe roullcttc và lấy mẫu ngẫu nhiên Nếu GA đã được thực hiện một các chỉnh xác, thì quân thể sẽ phát triển các thể hệ kề tiếp tốt nhật để phù hợp nhật vả cá thé tưng bình trong mỗi thê hệ (ăng lên theo hướng lỗi ưu Hiện nay, các kỹ thuật tiến hóa hậu hết bao gầm các giải thuật tối ưu hóa mefa-hetristie, như là các giải thuật tiến hóa (bao gồm GA, lập trình tiến
tiỏa, chiến lược Hiến hóa, lập trình dĩ truyền, các hệ phân loại học và tiêu hóa khác biệt)
1.2.3 Tỉnh toàn xác suẤt tà mạng tin cập
Các mô hình xác suất được xem như giảng với một trỏ chơi, các hoạt động dựa trên các kết quả mơng muốn Trung tâm quan lâu chuyển từ xác dịnh các mồ hình xác suất bằng, việc sử dụng, các định giá thống kê vả dự đoản Trong quả trình mô hình hớa
xác suất, rủi ro có nghĩa là không chắc chắn cho sự phân bồ xác suât được biết đến Vì
thế, đánh giá rủi ro có nghĩa là nghiên cửu nhằm xác định các kết quả quyết dịnh cùng,
với xác suất của chúng,
Những người ra quyết định thường đếi mặt với việc thiếu thông tin nghiêm trọng Việc đánh giá xác suất định lượng khoảng cách thông tin giữa những gì đã được
biết đến va những gi căn được biết để có quyết định tối ưu Các mô hình xác suất được
sử đụng để bão vệ chẳng lại sự không chắc chin bất lợi, và khai thác sự không chắc
chắn thuận lợi
Một vi du hay về mạng norơn xác suất (học Bayesian) trong đó xác suất điược sử dụng dễ biểu điễn sự không chắc chắn vẻ mỗi quan hệ dã biết
Trước khi thấy đữ liệu, các ÿ kiến ban đâu vẻ những gi má mối quan hệ thục sự
có thể được thể hiện Irong phần bổ xác suấi thông qua các trọng số mạng xác định mỗi quan hé nay Sau do chung ta tim kiếm dữ liệu, kiểm tra lại các ÿ kiến dã thu thập bởi
su phan bó trước đây thông qua trọng số mạng Các trọng số mạng trước đó đường như
là chính đáng, nhưng không phù hợp với đữ liêu, giò đây sẽ được xem như là rất ít khả
22
Trang 24năng, trong khi đó xác suất cho các giá trị trọng số thực sự phủ hợp với dữ liệu đã tăng, lên Diễn hình, mục đích huần luyện là nhằm tạo ra các dự báo cho các trường hợp tương lai trong đỏ chỉ những đầu vào mạng dược biết dến Kết quả của việc huản luyện mạng thông thường là tập duy nhất của các trọng số có thể được sử dụng cho những dự
báo như vậy
Mạng tin cậy Bayesian [23,34] được biểu chến bằng một đỏ thị hoặc cây mạch
hở trực tiếp, ở đỏ các nút chỉ ra cáo sự kiện và các cung chỉ ra mỗi quan hệ nguyên
thần - kết quả giữa các nút cha và các mủ cơn Ở đây, mỗi núi, có thế giả sử một số giá tri cd thé Vi dy, aut A có thể có n số giá trị có thể, biểu diễn bằng Aq, A¿, , A„ Với hai mắt bất kỳ, A và B, có tên tại sự phụ thuộc A->B, chúng tôi gắn một ma trận xác suất có diều kiện [P(B/A)| đến cùng trực tiếp từ nút A dến B Phần tử ở hàng thử j và cột thử ¡ của P(B/A), ky hiéu 14 P(B; 4A; }, đại diện cho xác suốt cớ điều kiện của B; giá
sử với sự xuất hiện trước của A; Diễu này được mô tả trong hình 4
Cho trước phân phối xác suất của A, ký hiệu bởi |P(A,)P(A;) P(A,)I, chúng,
tôi có thể tính toán phân phối xác suất của sự kiện T3 bằng cách sử đụng biểu thức sau:
P{E) = [P(B,) P(Bạ) - -‹ PBDI x
= [P(AI) P(A¿)‹ +: PCA„)|t xạ - [P(B/A)]» x ø
Bay giờ chúng {a minh hoa lính toán cũa P(B) với 1 ví dụ
Pearl [22-24] da dé xudt mét mé hinh cho việc truyền tin cậy của bằng chứng,
trong mạng I3ayesian Trước tiên chúng tôi mình họa mỗ hình của Pearl với cây
Baycsian như trong hình 4 Tuy nhiên, chủ ý rằng, mỗi biên giống như cây trong hình
4, A, 13 cin có không chỉ 2 giả trị có thể Ví dụ, nếu một nút trong 1 cây chỉ ra bệnh sởi Đức (GMJ), nó có thế có 3 giá trị như GM-nặng, GM-it, và GM-vừa phải
Trong mô hình Pcarl dùng lập luận bằng chứng, ông xern xét cả ảnh hưởng
nguyễn nhân và ảnh hưởng chân đoán đổi với tỉnh toán hàm tin cậy tại một mút cho
bà 3
Trang 25trước trong cây tin cay Bayesian Đề tính toàn tin cậy tại một nút V, ông chia cây thành
2 phần:
(1): Cây con có góc tại V và
(2): Phần còn lại của cây
P(@/A)
từ A đến R
con bằng
Hình 4 Gin ma trận xúc xuất cô điều liện trong cụng nỗi trực
Mô tả tập con bằng chứng, nằm tại cây con của V bởi ey — và
chứng từ phân còn lại của cây bởi ey' Hàm tin cậy của nút V được biểu điễn bằng
Bai(V), định nghĩa như sau
Bel(V) = P(V/e,", e,)
P/V) P(Viey Wu
Voi MVP}
Và ở lá hằng số chuẩn hóa, được xác định bởi:
Tủ biểu thúc cuối cũng giả sử v chỉ có 2 giá trị: đúng và sai Đó chỉ là ký hiệu
minh hoa Trong thực tế, v có thể có một số giá trị có thể
Pearl đã thiết kê một giải thuật thủ vị về lan truyền tin cậy trong cây nguyên
nhân Ông gán xác suất tiền nghiệm của một nút lá không hoàn chỉnh, sau dé truyền độ tim cậy từ nút nảy đến mút cha của nó, và sau đó, từ nút cha đến nút ông, cho đến khi tiếp cân đến gốc San đó, ông xem xét lan truyền ngược độ tin cậy từ gốc đến các con,
và từ mỗi mút con đến con của nó cho đến khi đến được các lá Lá có dé tin
nhật sau dé duoc gan xác suất tiền nghiệm và toàn bộ tiên trình được mỏ tà ở trên được
24
Trang 26lặp lại Pearl đã trình bảy rằng sau khi có một só hữu hạn giao cắt lên - xuống trên cây thi đã đạt tới trạng thải ôn định theo một nút lá đặc biệt trong tất cả các giao cắt tiếp theo mang lại niềm tin cực đại cho tắt cả các lá trên cây Lá vì thể được chọn lựa được
coi như lä mục chưa hoàn chỉnh
1.2.4 Hé chuyén gia (Expert System - ES)
1.24.1 Gidi thiệu về hệ chuyên gia
1.2.4.1.1 Định nghĩa:
Hệ chuyên gia (HCG) là một hệ thông được xây dựng trên máy tính cỏ khả năng
giải quyết các bải toán như một chuyên gia người bằng cách sử dụng những trí thức
chuyên môn được mô hình hóa qua các modul của chương trình Một hệ chuyên gia
được xây dựng từ 2 thành phan chính: Cơ sở trì thức (knowledge base) vả mô tơ suy
diễn (hay cơ chế suy diễn) (inference engine)
Hinh 5 Cac thanh phan chinh ctia Hé chuyén gia
Co sé tri thức (knowledge base): Dùng đề chữa trì thức trong một lĩnh vực nao
đó, trì thức nảy do chuyên gia con người chuyền giao Cơ sở tri thức (CSTT) bao gồm:
các khải niệm cơ bản, các sự kiện, các luật vả quan hệ giữa chúng Vỉ dụ:
© Trị thức về bệnh nhiềm trùng máu do các bác sĩ chuyên khoa vẻ bệnh nhiềm trùng máu chuyên giao
© Tri thức vẻ chiến lược đầu tư do các nhà cô vẫn đầu tư chuyên giao
Mô tơ suy điễn (hay cơ chế suy dién) (inference engine): Là bộ xử lý cho trì
thức, được mô hình hỏa sao cho giống với việc suy luận của chuyên gia con người bộ
Trang 27xử lý này làm việc dựa trên thông tia mà người dùng mô tả vẻ vấn dé
CSTT để đưa ra kết luận hay đề nghị
142.412 Phạm vi ứng dụng HCG:
Người ta đã xây dụng các hệ chuyên gia để giải quyết hang loạt những vẫn đề
trong các lĩnh vực như y học, toán học, công nghệ, hỏa học, khoa học máy tính, kinh
© Dự đoán (predicHion} Tiên đoán những hậu quả cö thể xảy ra khi cho
trước một Linh huồng,
© Chân đoán (điagnosis): Xác định nguyên nhân của những sự có trong các tinh huồng, phức tạp dựa trên các triệu chứng có thể quan sát được
® Thiết kế (desigr): Tìm ra cáu hình cho các thành phần hệ thông, đáp ứng, được các mục tiêu trong khi vẫn thỏa mãn một tập hợp các ràng buộc về thiết kê
© Lập kế hoạch (planning): Tim ra mét chuỗi các hành động dé đạt được
một tập hợp các mục tiên, khi được cho trước các điều kiện khởi đầu và
những rẻng buộc trong thời gian chay (runtime)
« Giảm sắt (rmonitoring): Sơ sảnh hành vi quan sắt được của hệ thống với
hành vi mong đợi
« Hất lỗi và sửa chữa (debuging and repair): Chỉ định và cải đặt những,
phương phản chữa trị cho các trục trặc
Trang 281.2.4.1.3 Cầu trúc của Hệ chuyên gia
HCG mô phỏng khả năng giải quyết vấn đẻ của chuyên gia con người Do vay,
chúng ta cần xem xét cách thức giải quyết của chuyên gia con người đề từ đó mô
Trí thức của lĩnh vực |#—I Người hỏi
Bộ suy i> Spite
Bộ nhớ ngắn hạn
Cơ chế suy diễn |& | —>| Sự kiện,
Trang 29Một hệ chuyên gia có kiến trúc được mô tả như hình vẽ
Bộ thu nhận trí
thức
Giao diện người dùng
Hình 8 Mô hình Hệ chuyên gia
Những người liên quan chủ yếu trong việc xây dựng một HCG là kỹ sư trí thức
(knowledge engineer), chuyén gia lĩnh vực (domain expert) và người dùng cuối (end- user)
Kỹ sự trí thức: Là chuyên gia trong lĩnh vực thu thập trí thức kh nghiệm từ
chuyên gia con người và biêu diễn chúng Kỹ sư trị thức cỏ nhiệm vụ chính là chọn các công cụ phân mềm vả phản cứng cho đề án, giúp đỡ chuyên gia phát biểu các trí thức cân thiết, và cải đặt các trí thức đó vào một cơ sở trị thức đúng đắn và hiệu quả
Trang 30Chuyén gia: Cung cấp trì thức vẻ lĩnh vực ứng dụng Thông thưởng, dây là một người đã từng công tác trong lĩnh vực ứng dụng và hiểu biết những kỹ thuật giải quyết vận để của nó Chuyên gia chịu trách nhiệm chính trong việc giải thích rõ những kỹ
năng nảy với kỹ sư trí thie
"Người sử đụng: Là những người sử dựng và tương tác trực tiếp với HCG thông qua giao điện người - máy Họ có thể trợ giúp trong việc thết kế giao điện cho HCG, có thể trợ giúp việc thu thập trí thức và trong quá trình phát triên TICG
Các thành phần của một kiến trúc HCG tiêu biểu trong hình 4 được diễn giải cụ
thể như sau
Giao diện người dùng (user mietfaee): Người đừng tương tác với hệ chuyên gia thông qua một giao điện người dùng, giao điện này đơn giản hỏa việc giao tiếp và che
gidu phân lớn sự phức tạp của hệ thông (Ví dụ như câu trúc bên trong của cơ sở các
luật) Các IICG sử đụng một số lượng phong phú các kiểu giao điện, bao gồm hỏi và
trả lời, diễu khiển bởi trình đơn, ngôn ngữ tự nhiên, hay dễ họa, Việc quyết định sử dụng giao điện như thế nào là sự thỏa hiệp giữa rứm cầu của người đùng với những đòi hôi của cơ số tri thức vả hệ suy điễn
Cơ sở trị thức (knowledge base): Trải tìm của HƠG là cơ sỡ trí thức tổng quát (general knowledge base), chứa tri thức giải quyết vẫn đẻ của một ứng, dụng cụ thể Trong một hệ chuyên gia đựa trên luật, trì thức này được biển điển đưới dạng cáo luật
IK THEN Co sở trí thức bao gồm trí thúc tổng quát (general knowledge) cing như thông tin của một tình hnéng cu thé (case-specific)
AMó tơ suy diễn hay cơ ché suy dién (inference engine): Xử lý, diều khiển các trì thúc được biểu điễn trong cơ sở trí thức nhằm đáp img các câu hỏi, cáo yêu cầu người
dùng, áp đụng trì thúc cho việc giất quyết các bài toán thục tổ, Về căn bắn nó là một
trình thông dịch cho cơ sở trí thúc Trong hệ (production system), cơ chế suy diễn thực
hiện chu trình điều khiển nhận đạng - hành động (recognize-act sontrol cyole) Việc
tách biệt cơ sở trì thức ra khỏi cơ chế suy điển là vật quan trọng Vì nhiều lý do:
Trang 31+ Sự tách biệt của trí thức đừng để giải quyết vẫn đề và cơ chế suy điển sẽ tao điều kiện cho việc biểu điển trí thức theo một cách tự nhiên hơn Ví
giải quyết vẫn để c
họ hơn so với một chương trình đưa luôn lĩi thức
nảy vào phản mã máy tính cấp thấp
© Bởi vì có số Wi dite được cách ly khối các câu trúc điều khiển cấp thấp
của chương trinh, cdc nba
thức có thể bỗ sung, sửa đổi hoặc loại bỏ tri thức trong cơ sở trí thúc
Bộ giải thích (explanation): Cho phép chương trình giải thích quá trình suy luận
của nó cho người dàng, Các giải thích này bao gồm các lập luận biện mình cho các kết
luận của hệ thông (trả lời cho câu hỏi HOW), giải thích vì sao hệ thông cân đữ liệu đó (ira lời cho câu hồi WHY),
« HOW: Bing cach nao HCG cd thể suy ra kết luận nào đó? Ngoài chức
nẵng cung cấp kết quả suy luận cuối cũng, HCG củn có thẻ cung cấp chơ người dừng quá trinh TICG đạt đền kết luận bằng cách nào Khả năng giải
thích bằng cách nào rat quan rong với HOG, nó làm cho HOG khác với
các chương trình truyền thống Các chương trình truyền thống làm việc
30
Trang 32trên cac bai toan dược định nghữa tốt, kết quả của chương trình dã dược kiểm nghiệm trước khi chuyên giao IICG làm việc trên bài toán thiếu nhiều thông tin, thậm chí trí thức còn có thể cập nhật khi HCG dã dược triển khai - Chỉnh vì vậy mả kết luận của hệ phải được giải thích bing cách nào dé cho kết quả cuối cùng có giá trị hơn
WILY: Tại sao HCG lại hỏi câu hỏi nào đó? Với khá năng nảy, người
dùng có thể theo vết được luồng suy luận của HƠG và yên lâm hơn với kết quả Khi chúng ta hỏi WHY, HCG thưởng, đáp trả bằng cách mô tã cải
gì ma nd có thế kết luận từ câu trả lời IIầu hết các TICG thường đáp trả
bằng cách hiện luật mà nó dang quan tâm,
Mức độ hiệu quả của một hệ chuyên gia phụ thuộc vào số lượng và chất lượng của cơ
sở trị thức của hệ Công nghê xử lý trí thức là giải pháp kỹ thuật nhằm phân tích, cài
đặt và thử nghiện các hệ chuyên gia để giải các bài toán eu thé
1.2.4.1.4 Các đặc trưng cơ bản của HCCT
Phan tach trị thức và điều khiển
Sở hữu trí thức chuyên gia Tính chuyên gia trong, lĩnh vực hẹp
Suy luận trên ký hiệu Suy luận có kinh nghiệm (heuristics) Cho phép suy luận không chính xác
Tị giới hạn vào vẫn đề giải quyết Giải quyết các vẫn đề có độ phức tạp vừa phải
Có khả năng bị lỗi
124.2 Biẫu diễn trì thức nhờ cúc luật sản xuất
Tri thức tổn tại đưới 2 đạng cơ bản:
Trị thức định lượng
Trí thức định tính: Cáo trí thức định tính lại được chia thành 3 loại:
Trang 33o Tri thie mé ta (declarative knowledge) Tri tite thu tue (procedural knowledge)
9 Tri thuc didu khién (control knowledge)
Có 4 phương pháp biểu diễn trị thức cơ bản là:
Tương ứng với 2 loại trí thức mô tả và trí thúc thủ tục, có 2 lớp phương pháp biểu điển
trí thức: biển điễn mồ fä và biếu điễn thủ tục các co chế điều khiến sẽ được lẻng vào trơng bàn thân cấu trúc ngôn ngữ biểu diễn trị thức Có thể phân loại như sau:
- Phuong pháp biểu diễn trị thức mồ tá: logic, mạng ngữ nghĩa, AOV
-_ Phương pháp biểu điển trị thức thủ tục: sản xuất
- Phuong pháp biểu diễn hén hgp: frame
Như đã trình bảy ở mục 2.1, 48 giải quyết bài toán đã được đặt ra, ta lựa chọn
giải phương pháp hệ chuyên gia Các trí thúc chuyên gia bác sĩ ở đây cö dang,
Néu bệnh nhân có triệu chủng viêm khớp đối xứng thì bệnh nhân có khả năng
,mắc bệnh viêm khớp dạng thấp
Rõ rảng trong cáo phương pháp biểu điển Bì thức trình bảy ở trên, biểu điển trí thức nhờ các luật săn xuất có thể dap tmg biểu diễn cáo trị thức yêu câu của bài toán
xây dựng mê hình lập luận xâp xĩ trong hệ chuyên gia chẵn đoán bệnh khớp
Đề có thể tân dụng những diễm mạnh trong suy điển logic nhờ nguyên lý modus ponens, các chuyển gia tri tuệ nhân tạo đua ra các luật săn xuất có đạng:
NÉẾU Điểukiện
Điều kiện 2
Điều kiện m
32
Trang 34lại, nên qe F, không làm gì cã Trong trường hợp đó, sản xuất:
Đ^ ^pụ >q không thêm được thông tìm gì
‘Trong biéu diéu IF THEN , NBU THI ciia các luật sản xuất, các điễu kiện cũng
có thể là các biếu thức logic Ví đụ:
Nếu — Cứng khớp buổi sảng,
Viêm khớp gối, Viêm khớp ngón gan Thị — Mắc bệnh Viêm khớp dạng thấp
Trang 351.243 Hệ chuyên gia dựa trên luật
Định nghĩa: HCG dựa trên luật là một chương trình máy tính, xử lý các thông tin
cụ thể của bài toán được chửa trong bộ nhớ làm việc và tập các luật được chứa trong cơ
s6 tri thie (CSTT) (knowledge base), str dung cơ chế suy dién dé (inference engine)
suy ra thông tin mới
HCG dựa trên luật có kiên trúc như sau:
Hình 9 Kiển trúc hệ chuyên gia dựa trên luật
HCG dựa trên luật cỏ nên táng xây dựng là hệ luật sinh, cỏ những đặc trưng cơ bản như đã nêu trong phân trước cho cac HCG tong quát, ngoài ra còn có các đặc điểm sau:
® Có CSTT chứa các luật (knowledge base)
®- Có bộ nhớ lảm việc tạm thời (working memory)
«Có cơ chế suy diễn (inference engine)
® Có một giao diện để giao tiếp với người dùng, người phát triển (User
interface, develper interface), C6 tién ich giai thich (explantation facility),
34
Trang 36« Có khả năng giao tiếp với chương trinh ngoài như: các hệ quản trị cơ sở
dữ liệu, xử lý bằng tính thông qua bộ giao tiếp chương trình ngoài
(extemal programs)
M6tHCG dua trên luật tần tại các nhược điểm sau:
+ Cáo sự kiện (fact) muốn đẳng nhất, phải khớp nhau hoàn toàn —> các sự
kiện cùng một ý nghĩa phải giống nhau vẻ cú pháp nhưng thực tế, ngôn
ngữ tự nhiên lại không như vậy
« Khó tim môi quan hệ giữa các luật trong, một chuối suy luận vi chúng có thể nằm rãi rac trong CSTT
+ Có thể hoạt động chậm
® Làm cho nhá phát triển phải hình dung mọi sự kiện ở dạng luật trong khi
không phải bài toán nao cững có thé thuc hiện được điều này
Các ưu diễm của HCG dựa trên luật:
© Diễn tả được ngôn ngữ tự nhiên thông qua biểu diễn trí thúc tự nhiên: TF
THHN
«Tri thức là tập các luật có tính độc lập cao do vậy dễ thay dối, chỉnh sửa
© Dễ mở rộng,
«© Tận dụng được trí thức Heuristic
@ Co thé ding biến trong luật, truy xuất chương trình ngoài
Với các ưu điểm như đã trình bày, HCG đựa trên luật là lời giải thích hợp cho
những bải toán mà trí thức đầu vào được cung cấp bởi các chuyên gia bác sĩ rong lĩnh
vực y học Với HCG dựa trên luậi, các trí thức này có thế được mã hóa, cải đột vào hệ
thống, mô phóng chính xác theo cách làm việc của các bác sĩ Ví dụ điển hình là hệ MYCIN - thước đo cho nhiều IICG đựa trên luật sau này
MYCIN là HCG chuẩn đoán bệnh nhiễm trùng máu, được phát triển vào khoảng,
năm 1970, tai dai hoc standford MYCIN sử dụng cơ sở trị thức với khoảng S00 luật về
nhiễm tring máu, cáo luật được biểu điển đưới dạng các luật sản xuất với tiếp cận về lý
35
Trang 37thuyết độ chiic chin (certain theory) MYCIN duoc viết trên ngôn ngữ interlisp, một nhánh của lisp, sử đựng cơ chế suy diễn lùi trong lập luận
Các dặc diễm chính của hệ MTCIN:
Sữ dụng kỹ thuật suy luận lủi
Có khả năng phân tách trí thức và điều khiến
Có tích hợp luật mneta (luật chỉ ra cách sử đụng, oác luật kháe)
Có thể dùng khi thiếu thông tin hay thông tin không chính xác
Có khả nắng nhớ được các thông tin trong một phiên làm việc với người bệnh cụ thế
D sử dựng — giao tiếp với bác sĩ bằng ngôn ngữ tự nhiên
Củng cấp các chức năng giải thích WHY, HOW Dưới đây là một phiên làm việc cụ thể với MYCTN:
? Một vài thông tin vẻ bệnh nhân:
? MYCIN cổ sắng xáe định bản chất lây nhiễm,
5 MCIN: Có bắt kỳ phép cây vị khuẩn cho Tack dưưkin liên quan đến bệnh hiện
Trang 387, mycin, Nedy, gid thye hién cay?
user: 7- july-7:00
myoin: gân đây Jack Durkin có các triệu chứng như: choảng váng, hôn mê
không?
user: CG
MYCIN duoc xây đựng dựa trên lý thuyết về độ chắc chắn Lý thuyết về độ chắc chan
dược trình bảy ngay sau dây
1.244 Lý thuyết vê độ chắc chẩn, biểu điễn trì thức không chắc chắn ái tiếp cận Tý
thuyết độ chắc chăm
L thuyết về độ chắc chắn (Certai hecry) do Shorliffe và Buchanan đẻ xuất
năm 1975 và được ứng dựng trong hệ chuyên gia MYCIN Dénh giá về độ chắc chắn là
danh giá chủ quan của chuyên gia về sự vật, hiện tượng đốt lập với những đánh giá khach quan đụa trên thông kê Lập luận với độ chắc chăn được xem như một phương pháp Heursitic khác với lập luận chính xác theo 1ôgie toán học cửa tiếp cận xác suất
Những người xây dựng hé MYCIN sau khi quan sat ac bac si lam việc trong
lĩnh vực y hoe, nhan thay ring, cdc bac sf thudng làm việc với những su kiện không
chắc chấn, thậm chỉ với những thông tin không rõ rằng, Họ đưa ra những nhận định
*có thể”, “gân như”, “chắc chắn”, thay bằng cách biểu diễn dưới dạng ngôn ngữ tự nhiên như vậy, MYCTN gắn cho mỗi sự kiện một con số, gọi là nhân tỏ chắc chin CF (Certain Factor) Con số này có giá trị từ -1 (chắc chắn sai) dến +1(chắc chin ching) Giá trị dương thể hiện mức độ tin tưởng, giá trị âm thể hiện mức độ không tin tưởng
CE có thể được lính loán dựa trên một bằng tra trên các từ nhắn
Ví dụ
Trang 39Chic chin Có thể Cothé Chắc chắn
Hinh 10 Nhan ti chic chén ste dung trong MYCIN
Luật với độ chắc chẵn dược biểu diễn dưới dạng:
IF B, AND Ey THEN H CF=CF;
Trong đỏ
Y Ly Lả tiên để của luật Các tiến đề “Tiên dé” được kết nếi với nhau bởi ghép
AND hoặc OR và không sử đụng toán tứ NOT
v H: Là kết luận của lưệt
v CT: La độ chắc chắn của kết luận, cho biết raức độ chắc chắn của kết luận 11
điên quan tới sự lin tưởng hay ngủ ngờ vẻ sự chính xác của kết luận) với giá lai
nim trong doan
Ví dụ: NÊU “Cứng khớp buếi sáng” THÌ “Mắc bệnh viêm khớp dạng thap” CF=
025
tr
« Với
" P() — Xácsnii xảy ra gid thuyét H
TP) “Xác suất xây ra giả thuyế LI khi sự kiện l đã xuất hiện
tóc.) —_ Xác suất không xây ra pia thuyét H khi sự kiện B đã xuất hiện
* Dé fim cậu MB(H,E) (Measure of Belief): La con số phản ánh lòng tin vào một giả thuyết H dựa trên hiện tượng t (0 < MB < 1)
38
Trang 40VD: MBCViém khop dạng thấp”, “Cimg khép budi sang”) = 0.3
Sự liên hệ giữa lý thuyết vẻ độ chắc chắn - lý thuyết xác suất của ME:
o_MB(H,E)- 1 nếuP(Œ)- l
© MB(1L H)= frnante( }, PLD) - PCD} / (L-PGLD) truéng hop còn lại
© D6 nghi ngé MD (H,H) (Measure of Disbelief): La con sé phan anh sự nghĩ ngờ vào một giả thuyết H đựa trên hiên tượng E (0< mđ< 1)
VD: MD(“Viém khớp đạng thấp”, “Cứng khớp buổi sáng”) — 0.05
Sự liên hệ giữa lý thuyết về độ chắc chắn _ lý thuyếtxác suất của MỊ2
2a MD (1, E)= 1 nêu ? (H) =0
ø MD(H,E)= trúngf(CỄ)Ƒ(H)) - P(H)} /(-P(H)) trưởng hợp củn lại
«_ Độ chắc chắn CF (H,E) khi đó dược tỉnh bằng: CE — MB — MD
£1 <CE <1)
VD: CF (“Cứng khóp buổi sáng”, “Viêm khớp dạng thấp”) 03—005 0.25
Sự liên hệ giữa lý thuyết vẻ dộ chắc chắn _ lý thuyết xác suất của CE:
2 CF(HLE) = 1 ki PZ) = 1 (khí khẳng định Hộ
° CFQLE) ~-1 khi re) — 1 Chỉ E phủ định H)
0 CHCLB) = 0 khi P( : }PQT) ( khi không có thông tin)
° CEE) =MBGLE)= ee) - P(H)) /(1- PŒD) ( Ichi E phan nao
khang định I)
> CFCEGR) - -MD(LR)- (POD - rey 2PŒI) ( Khi E phân nảo phú định H)
Độ chắc chân kết luận của luật ` CE(H,E) được tính như sau:
«_ Với những luật có tiên để đơn: