1. Trang chủ
  2. » Luận Văn - Báo Cáo

Hệ thống trợ giúp quyết định trong công tác đào tạo

115 448 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 115
Dung lượng 42,98 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Độ tin cậy được lập ra dựa trẽn quan hệ của các luật phản ánh sự tin tưởng có kiểm chứng của chuyên gia về quan hệ giữa giả thiết và kết luận của luật; và không luật nào đáp ứng chặt chẽ

Trang 1

ĐẠI HỌC QUỐC GIA HÀ NỘI■ • ■ TRƯỜNG ĐẠI HỌC KHOA HỌC Tự NHIÊN

Trang 2

ĐẠI HỌC QUỐC GIA HÀ NỘI■ ■ ■ TRƯỜNG ĐẠI HỌC KHOA HỌC T ự NHIÉN

Quốc gia Hà nội

WUNG TÂM t h c n g j i n thư viên

HÀ NỘI, 2005

Q G -03-01 Trang

Trang 3

LỜI CÁM ƠN

Đê tài QG-03-01 hệ thống trợ giúp quyết định trong công tác đào tạo được sự hồ trợ nhiêu của Ban khoa học công nghệ, Đại học Quốc gia Hà nội, quản lí phòng khoa học, trường Đại học Khoa học Tự nhiên và các đơn vị quân lí trong công tác nghiên cứu tài liệu, thực nghiệm phần mém.

Trong báo cáo này, xin chán thành cám ơn

khai,

■ Khoa Toán Cơ Tin học đã tạo điều kiện đ ể đê tài được thực hiện,

■ Phòng Khoa học công nghệ, phòng tài vụ, trường Đại học Khoa học Tự nhiên,

đã giúp dỡ dê tài trong việc hoàn thành các thủ tục kết thúc đê tài.

■ Các cán bộ khoa học và các học viên, sinh viên công nghệ thõng tin, đã cùng

thực hiện và đóng góp vào kết quả của đẻ tài.

Trang 4

BÁO CÁO TÓM TẮT VỀ ĐỂ TÀI

Quốc gia Hà nộiMỤC TIÊ U VÀ NỘI DUNG NGHIÊN c ứ u

Mục tiêu : nghiên cứu về phương pháp và qui trình xây dựng hệ thống trợ giúp quyết định, cho phép dùng trong công tác đánh giá kết quả học tập

3 Xây dựng phấn mềm thử nghiệm về hệ thống trợ giúp quyết định

CÁC K Ế T QUẢ ĐẠT ĐƯỢC

Đé tài đã thực hiện các nội dung dăng kí, với các kết quả sau

2G -03-0I Trang 3

Trang 5

• Các kết quả nghiên cứu được thể hiện dưới dạng các bài trinh bày trong sinh hoạt khoa học của đề tài Tài liệu về “lí thuyết chắc chắn” được sử dụng như tài liệu tham chiếu, huấn luyện;

đại học và sau đại học về công nghệ thông tin

mềm được viết trên nền VISUAL BASIC, truy cập cơ sở dữ liệu với hệ quản trị SQL SERVER

Trang 6

P R O J E C T O B JE C T IF AND CO NTENT

building a decision support systems for training puipose, particularly for evaluating to student capacities

using in a decision support system;

material for information technology students at the under-graduated and graduated level;

RESULTS

The project achieved some rulsults as followings :

document, reference material;

è tài Q G -03-01 Trang 5

Trang 7

Articles published in journals;

Reports in information technology conferences in Vietnam;

Master thesis on information technology;

Bachelor thesis on information technology and reports of students;

Training course “Decision support systems” for under-graduated and graduated level;

Software for training support The software is based on VISUAL BASIC and access to database management system SQL SERVER

Trang 8

MỤC LỤC

Trang 9

LỜI GIỚI THIỆU

Đề tài cấp Đại học Quốc gia Hà nội, mã số QG-03-01 có mục đích nghiên cứu một số phương pháp xử lí dữ liệu sử dụng trong hệ thống trợ giúp quyết định Việc xử lí

dữ liệu không đầy đủ, không chăc chắn thường gặp trong các bài toán thực tế, đặc biệt trong các bài toán quản lí, cần ra các quyết định dựa vào dữ liệu định lượng lẫn dữ liệu định tính

Trong các năm qua, việc nghiên cứu về hệ thống trợ giúp quyết định đã được triển khai ở mức sinh hoạt khoa học, giảng dạy tại bậc cao học về công nghệ thông tin, và ứng dụng trong các hệ thống loại nhỏ Hệ thống trợ giúp quyết định thường được bao gồm đủ các thành phẩn về quản lí giao diện người dùng, quản trị dữ liệu và tri thức, và quản trị mô hình Việc nhận xct và ứng dụng hệ thống loại này đòi hỏi kiến thức cả về xử lí dữ liệu lẫn

xử lí tri thức Đôi khi hệ thống trở nên phức tạp như hệ chuyên gia

Đề tài QG-03-01 tiếp tục nghiên cứu về hệ thống trợ giúp quyết định, tập trung vào việc xử lí dữ liệu không chắc chắn, thử nghiệm hệ thống trợ giúp quyết định trong cổng tác quản lí đào tạo và chuẩn bị giáo trình phục vụ đào tạo bậc đại học và cao học ngành công nghệ thông tin

Các kết quả đạt được của đề tài là

ìi Q G -03-01 Trang 8

Trang 10

TÀI LIỆU 1

T IẾ P CẬN BAYES ĐỐI VỚI LẬP LUẬN K HÔNG CHÍNH XÁC

Phần này đề cập tiếp cận Bayes đối với lập luận không chính xác Phần đầu là các nguyên tắc cơ bản của lí thuyết xác suất để giới thiệu định lí Bayes Phần tiếp theo hỗ trợ người phát triển hệ chuyên gia theo tiếp cận Bayes để quản lý tốt hơn các vấn đề của thế giới thực Các trợ giúp xuất hiện trong một vài hệ thống, chảng hạn trong hệ chuyên gia PROSPECTOR Phần cuối giới thiệu các đặc tính cần thiết cần trang bị để sử dụng hiệu quả kĩ thuật Bayes trong các hệ chuyên gia

I LÍ T H U Y Ế T XÁC SUẤT

Thông tin không chính xác là đối tượng của lí thuyết xác suất Xác suất là tiếp cận toán học dể xử lý thông tin không chắc chắn, có nguồn gốc từ các trò cá cược từ thế kỉ 17 Năm 1654 Pascal và Fermat đã phát triển lí thuyết xác suất cổ điển để rút ra phép suy luận số học từ các dữ liệu

Lí thuyết xác suất giả sử có số p(E) gọi là xác suất, là khả năng xảy ra sự kiện E trong số các thực nghiệm ngẫu nhiên Đó là khi với số lần thử khá lớn thì tỉ lệ số lẩn xảy

ra E xấp xỉ bằng p(E) Tập tất củ các dầu ra có thể có của thực nghiệm được gọi là không gian mẫu, kí hiệu là s

1.1 K h ô n g g i a n m ẩ u rờ i r ạ c

Nhiều thực nghiệm có kết quả ra rời rạc Chảng hạn với việc gieo súc sắc thì s =

11, 2, 3, 4, 5, 6) Mỗi sự kiện trong s là kết quả mà phép thử có thể nhận được Nếu sau N lần thử, sự kiện E xảy ra W(E) thì p(E) = W(E)/ N Hình thức hơn, khi số lần xuất hiện E

là f ( E) thì p(E) = l i m N_>oof(E)/ N.

suất này được biết như là xác suất sau (posteriori probability), có nghĩa ”sau sự kiện”

Xác suất là số đoán khả năng có thể xảy ra của sự kiện; nó tuân theo ràng buộcsau :

0 < p(E) < 1,

1 p(E,) = 1 với i = l n và n là tấ t cả các sự kiện.

p(E) + p(~E) = 1, trong đó ~E là sự kiện không là E, là phần bù của E.

1.2 K h ô n g g i a n m ẫ u li ê n t ụ c

G -03-01 Trang

Trang 11

Khi các sự kiện hay các phương án có giá trị khoảng chứ không rời rạc, người ta

dùng để dự đoán khả năng xảy ra của việc chọn ngẫu nhiên một người có độ cao cần thiết trong một đám người Xác suất chọn được người cao lm70 là p(lm70) = 0.25

Hình Phân bố tần suất về chiều caoNgười ta thường muốn hỏi câu hỏi phức tạp hơn về khả năng của tình trạng tham gia vào nhiều phân bố Chảng hạn khả nãng chọn được người cao lm70 và nặng 80 cân

Đổ trả lời, người ta cần dùng các luật cơ bản về các phép toán xác suất

1.3 C á c x á c s u ấ t t ổ h ợ p

Thực tế cho thấy có nhiều tình trạng là tổ hợp của nhiều sự kiện Chảng hạn người

ta muốn biết xác suất xảy ra hai suy luận khác nhau

1.3.1 P hép giao

Chẳng hạn xác suất xảy ra của hai sự kiện A và B độc lập là p(A và B) được tính theo :

s> = P(A) * P(B)

Thí dụ

Trong trò tung súc sắc, nếu A = {1, 3, 5}, B = {3, 6} thì A nB = {3} Không gian mẫu s = {1,

2, 3, 4, 5, 6} Các xác suất riêng cho A, cho B là

p(A) = n(A)/ n(S) = 1/ 2;

p(B) = n(B)/ n(S) = 1/ 3, trong đó n(X) là sô’phẩn tử của X.

Một m ặt p(AnB) - n(AnB)/ n(S) = 1/ 6, m ặt khác p(A) * p(B) = 1/ 2 * 1/ 3 = 1/ 6.

Q G -03-01 Trang 1 0

Trang 12

Thí dụ Xác su ấ t xảy ra sự kiện A, tức gieo được mặt 3 của súc sắc là p({3}) = 1/ 6.

Tuy nhiên nếu đã gieo được mặt chia hết cho 3, tức đã có sự kiện B = {3, 6} thi xác suất chỉ là 1/ 2

P(A I B) = [n(AnB)/ n(S)] / [n(B)/ n(S)] = n(AnB)/ n(B) = (1/ 6) / (2/ 6) = 1/ 2

II LÍ TH U Y Ế T BAYES

Xác suất p(AIB) cho người ta khả năng về sự kiện A khi sự kiện B dã xảy ra Xác

suất này được xem như xác suất sau Chẳng hạn người ta quan sát tinh trạng hỏng hóc máy A và chẩn đoán lại liên quan đến sự kiện B xảy ra trước đó Vấn đề bây giờ là liệu có thể biết được khả nãng A đó nếu B sẽ xảy ra sau

Riêng về p(E), người ta thày nó bằng tổng cùa xác suất khi giả thuyết H là đúng

và khi H là không đúng, lức là p(E) = p(EIH) + p(EI~H)

tài Q G -03-01 Trang 11

Trang 13

Khi thiết kế hệ chuyên gia, người ta thể hiện định lí Bayes thông qua cấu trúc của luật IF E THEN H Định lí xác suất có thể được dùng để cung cấp xác suất về giả thuyết

H khi có sự kiện E Định lí này cũng được dùng để quản lí xâu suy diễn có dạng :

Giả sử ông Mỗ có kết quả dương tính và muốn biết khả năng tim đau, tức p(+tld) Chảng hạn có các mẫu về đau ngực :

trên điện tâm đồ.

III CÁC B IẾ N T H Ể CỦA Đ ỊN H LÍ BAYES

Trong các ứng dụng của hệ chuyên gia, những người phát triển hệ thống dùng một biến thể của định lí Bayes Người ta đưa ra hai thuật ngữ mới, là thuận trước (prior odds) của H và thuận sau (posterior odds) của H

O(H) = p(H)/ p(~H) = p(H)/ (1 - p(H));

0(H I E) = p(H I E)/ p(~H I E) = p(H I E)/ (1 - p(H I E))

I I I 1 K h ả n ă n g đ ủ

ài Q G -03-01 Trang 1 2

Trang 14

Người ta dùng khái niệm khả năng đủ để xảy ra, hay gọi là khả năng đù LS(likelihood of sufficiency) trợ giúp cho giả thuyết H khi có sự kiện E LS được gọi là khảnăng đủ bởi lẽ giá trị của nó cho biết cẩn cố gắng để tin vào giả thuyết H ra sao để thấy được sự kiện E.

LS = P(EIH) / p(EI~H)

Do p(~HIE) = (p(~H) * p(EI~H)) / p(E) nên từ đảng thức trên suy được O(HIE) =

LS * 0(H) Biểu thức này được gọi là dạng khả năng thuận lợi của định lí Baves Nếu LS lớn thì nó sẽ chuyển thuận trước trên H, tức 0(H) sang giá trị lớn của thuận sau trên H, tức O(HIE) Thực tế thì khi LS tiến đến vô hạn, O(HIE) cũng tiến đến vô hạn; và do O(HIE) = p(HIE)/ p(~HIE) = P(HIE)/ (1 - p(HIE)) nên :

p(H I E) = 1 và p(~H I E) = 0.

LS có thể được khai triển :

LS = 0(H I E)/ 0(H) = p(E I H)/ p(E I ~H) = (p(H I E)/ p(~H I E)) / (p(H)/ p(~H))

111.2 K h ả n ă n g c ầ n t h i ế t

Người ta gọi LN (likelihood of necessity) là khá năng cần thiết, cho phép do sự không till vào giả thuyết H nếu không có sự kiện E Nó dược gọi như vậy do giá trị của nó thể hiện sự cố gắng đế phát hiện sự kiện vắng mật

LN = 0(HI~E)/ 0(H ) = p(~EIH)/ p(~EI~H) = (p(HI~E)/ p(~HI~E))/ p(H)/ p(~H)) Hay 0(HI~E) = LN * 0(H)

Nếu LN = 0 thì p(HI~E) = 0, có nghĩa H cần sai khi ~E đúng Nếu không có E thì cắn kết luận rằng H là sai, hay nói khác “E là cần thiết cho H”

Trang 15

0 H là sai khi E đúng, hay

~E là cần thiết để kết luận H

III.4 K h ô n g c h ắ c c h ắ n vể s ự k i ệ n h i ế n n h i ê n

Trong cấu trúc IF E THEN H (LS, LN), người ta dùng p(E) để chỉ xác suất xảy ra

E để hỗ trợ giả thuyết H Việc thiết lập p(E) có thể khó khăn dối với nhiều bài toán, bởi người dùng không biết chắc chắn về sự kiện hiển nhiên E, hay dấu hiệu E

Tổng quát hơn, người ta có thể nói rằng dấu hiệu E phụ thuộc vào E', là điều hiển nhiên quan sát Điều này được thể hiện qua p(EIE’) Nhân tố E ’ thể hiện sự tin tưởng về E Nếu người ta biết về E đầy đủ thì E = E ’ và p(EIE’) = p(E)

N (iười ta có thể bổ sung vào xác suất một kháng định vé độ không chắc chán của

sự kiện hiên nhiên Với E ’ là sự kiện tin cậy thì

p(HIE’) = p(HIE)*p(EIE’) + p(HI~E)*p(~EIE’)

Đán” thức này chính xác hóa tiếp cận Baycs thuán tuý và cho phép thiết lặp các quan hệ sau :

>c tài Q G -03-01 Trang 1 4

Trang 16

IF p(E I E’) = p(E) THEN p(H I E’) = p(H)

IF E là đúng THEN p(E IE’) = 1 AND p(H I E’) = p(H I E)

IF E là sai THEN p(~E I E’) = 1 AND p(H I E’) = p(H I ~E)

Các quan hệ này xác định quan hệ tuyến tính giữa p(HIE’) đối với p(EIE’)

Biểu thức về p(HIE’) vừa nêu xảy ra đối với bài toán thực khi p(EIE’) = p(E), lúc dấu hiệu E ’ hỗ trợ toàn bộ cho E Biểu thức được viết lại là

Đôi với vài bài toán, chuyên gia có thổ nói một vài sự kiện là quan trọng, tức LS>1, nhưng việc nó vắng cũng không quan trọng, tức LN = 1, tức vi phạm các quan hệ giữa hai nhân tô" này.

Hinh Quan hệ Bayes giữa p(HIE’) và p(EIE’)

Nếu LS>1 và LN = 1 thì từ biểu thức định nghĩa LN có 0(H I ~E) = LN*0(H) = O(H) Do biểu thức định nghĩa của 0(H), 0(H) = p(H)/ (l-p(H)) nên p(H I E ’) = p(H) Dùng biểu thức này trong biểu thức (a) :

B ổ s u n g cho tín h /ỉ/lông c h ắc ch a n

Để giải quyết vấn để không bổn vững của quan hệ giữa LS và LN, năm 1976 Dudu

đã dề ra phương pháp liên quan đến giả thiốt phu Già thiết thêm rằng p(HIE’) và p(EIE’)

lài Q G -03-01 Trang 1 5

Trang 17

tuyên tính từng đoạn Tiếp cận này không tuân theo lí thuyết xác suất truyền thông, nhưng

đã ứng dụng tốt cho hệ chuyên gia PROSPECTOR

Hình Hàm từng đoạn đối với sự kiện hiển nhiên riêngHàm p(HIE’) được chia thành hai hàm đơn giản là tiện cho xử lý và tránh được vấn

đề đã đề cập

• ĐỐI với 0 < p(E I E’) < p(E) thì p(H I E’) = p(H I ~E) + (p(E I E’)/ p(E)) * (p(H) -p(H I ~E)) Còn p(E) < p(E I E’) < 1 thì p(H I E’) = [(p(H) - p(H I E)*p(E))/ (1- p(E))] + [p(E I E’) * ( p ( H |E ) - p ( H ) ) / ( l - p ( E ) ]

Hai biểu thức này đảm bảo khi LS>1 và LN = 1 thì p(HIE’) van giữ nguyên nếu p(EIE’) < p(E) và tăng nếu p(EIE’) > p(E)

IV H Ệ C H U YÊN GIA P R O S P E C T O R

PROSPECTOR, do Duda đưa ra 1979 là một trong những ứng dụng hệ chuyên gia được biết, đã ra quyết định theo lí thuyết Baves Hệ chưyên gia này trợ giúp các nhà địa chất trong việc khai thác một số loại mỏ Hệ thống đã mã hóa các tri thức chuyên gia của các nhà địa chất về các mỏ khác nhau vào mô hình để xác dịnh khả năng có mỏ tại một vài nơi theo các quan sát Hệ chuyên gia cũns trợ giúp trong việc xác định khoan thăm dò

IV 1 M ạ n g s u y l u ậ n P R O S P E C T O R

Mỗi mỏ hình xử lý tri thức được thể hiện trong hộ thống PROSPECTOR theo một mạng suy luận riêng Mỗi mạng là tập các nút ứng với giả thuyết hay sự kiện hiển nhiên, dược liên kết bàng quan hệ không chắc chắn Một nút sơ khới, hay nút mang các thõng tin

do tương tác với người dùng curm cấp, thổ hiện dấu hiệu mà người dùng nhập vào Chảng hạn “tin cậy bao nhiên về khả năng có chất X tại via đất Y ?” Thõng tin của các nút này lại được dùng dè’ xác định độ tin cậy của các nút trung gian khác

Đồ tài Q G -03-01 Trang 1 6

Trang 18

Hình Mạng suy luận PROSPECTOR

rv.2 C á c l u ậ t P R O S P E C T O R

Trong mạng của hệ thống PROSPECTOR có các liên kết với LS và LN Quan hệ liên kết dược cấu trúc theo luật IF E THEN H (LS, LN) Thuật ngữ E ứng với nút thể hiện dấu hiệu và được nối với nút H ứng với giả thuyết Liên kết này là không chắc chắn và được diễn tả bằng LS và LN Các chuyên gia địa chất curm cấp thõng tin về các nút trong mạng Theo như trong hình thì người ta đã dùng các l u ậ t :

IF kết cấu vỉa là aplitic THEN vỉa là thuận lợi dối với loại mỏ porphyry [68, 0.2], xác suất trước p(E) = 0.001, p(H) = 0.002

Nếu E là núl sơ khởi thì người dùng cung cấp dộ tin cậy vào E Giá trị này dùng

đế xác định giá trị liên kết LS và LN, cũng như để tạo mức tin cậy vào két luận Mức độ tin cậy về giả thuyết H lại dưọc dùng với các thông till tại các nút khác để xác dinh mức

dộ tin cậy của các nút trung gian, tlico cơ chế truyền trong toàn mạng

TiVjhG TÁM \ rj Ĩ HƯvt FN'.r

Trang 19

PROSPECTOR dùng tiếp cận Bayes để truyền xác suất trong mạng suy luận Hình dạng của mạng do các nhà địa chất thiết lập.

IV.3 C á c l u ậ t n h i ề u g iả t h i ế t

Khi xác định xác suất gắn với một nút, mạng đã dùng thông tin từ nhiều nút Thực

ra phải khẳng định từ trước về tính độc lập có điều kiện của các thông tin này Đày là cách đơn giản cho phép tính xác suất sau của giả thuyết Nếu ghép các thõng tin tại các nút, người ta thu được một giả thiết chung, gộp của các giả thiết do thông tin tại các nút cung cấp Khi gộp, người ta có thể thực hiện Ihco chuẩn AND hoặc chuẩn OR

IV.3.1 Các lu â t theo c h u ẩ n AND

Dạng chung của chuẩn AND đối với các luật là IF E, AND E2 AND En THEN

H Vậy để kết luận được H thì các dấu hiệu E, phải đúng Mỗi E, lại dựa vào dấu hiệu E'j

Đổ lan truyền xác suất trong mạng, nhóm PROSPECTOR dùng xấp xỉ mờ p(EIE’)

= mill{pCE.IE'i)} Khi tính được giá trị này, người ta tính p(HIE’) Tiếp cận này là đơngiản Tuy nhiên nó có nhược điểm là không thể hiện được tính nhạy cảm cùa p(EIE’) đối

IV.3.2 Các lu â t theo c h u â n OR

Dạng chung của luật theo chuẩn OR là IF E, OR E2 OR En THEN H Người ta lại dùng xấp xỉ mờ p(EIE’) = max{p(E,IE'1)} Ưu nhược diem trong việc sử dụng các luật theo chuẩn OR này cũng như ưu nhược điểm theo chuẩn AND

IV.4 C ậ p n h ậ t c á c đ i ể u t h u ậ n

PROSPECTOR thay đổi điều thuận của giả thuyết mỗi khi có dấu hiệu được bổ sung vào hệ thống Đối với trường hợp dùng luật một giả thiết, điều thuận đối với H trước

E ’ được tính là O(HIE’) = p(HIE’)/ (l-p(HIE’))

Giả sử các E, là độc lập điều kiện thì trong trường hợp dùng luật đa giả thiết người

ta có 0(HIE',, E'j,— E'n) = n LS, * O(H), i = l n LS, ờ đây là tỉ lệ xảy ra khả năng đúng LS'j = O(HIE’)/ 0(H ) = P(E,IH) / p(E,l~H)

Tương tự, nếu tất cả dấu hiệu dùng cho H là sai thì

0(HI~E'„ ~E'2,.~ ~E'n) = n LN, * 0(H), i = l n, và

LN', = 0(H I ~E',)/ 0(H) = p(~E, I H) / p(~E, I ~H).

IV.5 D ộ d o c h ắ c c h ắ n

lài Q G -03-01 Trang 1 8

Trang 20

PROSPECTOR cho phép người ta nhập độ tin cậy về các phần sự kiện hiển nhiên Thay vì p(EIE’), người ta đưa ra thuật ngữ độ đo chắc chán c(EIE’) Lí do chỉ mang nghĩa tám lí; nhiều người cảm thấy không thuận khi đánh giá các xác suất của sự kiện hiển nhiên, nhưng lại rất muốn thể hiện sự chắc chắn về sự kiện là đúng hay sai Chảng hạn người ta thường nói “tỏi tin chắc rằng đã cảm lạnh” hơn là nói “xác suất tôi cảm lạnh là 90%”.

Trong PROSPECTOR, người ta dùng c(EIE’) là độ chắc chắn về E khi có dấu hiệu quan sát được E ’ Giá trị này thuộc [-5, +5]; - 5 ứng với E chắc chắn sai, +5 chắc chắn đúng và 0 ứng với “không biết” Vậy nên câu “tôi tin chắc rằng đã cảm lạnh” dược gán giá trị c(EIE’) = 4.5

Người ta có thể ánh xạ giá trị đo chắc chắn sang xác suất của sự kiện theo

Để thể hiện quan hệ các đoạn tuyến tính giữa p(HIE’) và p(EIE’), người ta chi tiết hóa như sau :

(p(E I E ’) - p(E)) / p(E); và

(p(E I E’) - p(E)) / (1- p(E)).

Hai đáng thức này có thể xác định p(EIE’) dựa theo tin tường do người dùng cung cấp về dấu hiệu c(EIE’) Nếu c(E!E’) > 0 thì p(EIE’) = [c(EIE’) * (l-p(E)) + 5* p(E)] / 5

và ngược lại thì p(EIE’) = [c(EIE’) * p(E) + 5* p(E)] / 5

H là p(HIE) = LS * 0(H ) / (1 + LS* 0(H)) Tương tự p(HI~E) = LN * 0(H) / (1 + LN* 0(H))

Ngưòi ta ưóc lượng nhân tố chắc chắn được cập nhật với các giả thuyết vừa néu theo cách sau :

■ Nếu 0 < p(E I E’tủ-ng) < p(E) thì c(H IE ’) = 5 * (p(H I E’tỏne) - p(E)) / p(E); và

", 1

1 lỏ n g /

Nếu p(E) < p(E I E’lỏnB) < 1 thì c(H I E’) = 5 * (p(H I E’t6nB) - p(E)) / (1- p(E));

V T H Í DỤ D Ù N G P R O S P E C T O R

3G -03-01 Trang 1 9

Trang 21

Tiêp theo cóng việc của PROSPECTOR, nãm 1981 Reboh đã phát triển ngôn ngữ công nghệ tri thức gọi là KAS Ngôn ngữ này có hệ thống khung về cơ bủn như PROSPECTOR, nhưng không giữ các tri thức về địa lí.

Thí dụ người ta cần quyết định xem có mua ỏ tỏ không Chảng hạn có giả thuyết

“không mua”

Mạng suy luận sử dụng các luật :

1 Rl IF điểu kiện xe tồi (kí hiệu là sự kiện Ej) OR giá cao (kí hiệu là sự kiện E2) THEN không mua xe (kí hiệu là giả thuyết Hị)

2 R2 Xe đi quá 100.000 dặm (E3) AND xe chỉ đi trong thành phô (E4) AND thân xe xấu (E5) t h e n điều kiện xe là tồi (E[)

3 R3 IF xe bị lõm (E6) THEN thân xe xấu (E5) (LS = 1000, LN = 0.001).

4 R4 IF xe gỉ (E7) THEN thán xe xấu (E5) (LS = 100, LN = 1).

Hai luật R3, R4 cùng kết luận nhưng giá trị LS, LN khác nhau Theo R3 thì “xe bị lõm” rất thuận lợi dê’ kết luận “xc xấu” và việc không quan tâm đến vết lõm là rất có lợi

dế ủn11 hò kết luân Còn R4 thì “xe gi” là tạm thuận lợi cho kết luận và khóng thấy gỉ cũng không ảnh hướng gì máy

v l T ư ơ n g t á c h ệ t h ố n g với ng ư ờ i d ù n g

Q G -03-01 Trang

Trang 22

Giả sử các chuyên gia đã cho các xác suất trước của các dấu hiệu là 0.1, tức p (E )

= 0.1 Phiên tương tác hỏi đáp như sau:

• Hệ thông : Với giả thuyêt xe chạy trôn 100.000 dặm, thì mức độ tin là bao nhiêu

c(E5IE'6, E'7) theo các bước nhỏ sau đây :

2.1 0 ( E 5) được tính 0 ( E 5) = p(E5)/ (l- p ( E 5)) = 0.111 2.2 p (E5 I Eg) và p (~E5 I E6) có thể được tính với

LS = 1000 và LN = 0.001 trong EG—>E5

p (E5 I Ec) = LS*0(E5)/ (1+LS*0(E5)) = 0.9911

p (E5|~ E g) = LN*0(E5)/(1+ l n *0(E 5)) = 1.11-' 2.3 Tương tự, p (E5 I E7) = 0.9174; p(E51 ~E7) = 0.1.

2.4 Người dùng xác định c(EG I E'e) = 4 Do giá trị này dương nên

p(Ec I E'g) = [ c (E g I E'6) * (1- p (E6)) + 5* p (E6)] / 5 = 0.82.

2.5 Người dùng xác định c(E71 E'7) Giá trị này âm nên

p(E71 E'7) = [ c (E7 I E'7) * p (E7) + 5* p (E7)] / 5 = 0.08.

2.6 Do 0.1 = p(Etí) < p(E0 I E'g) = 0.82 nên người ta tìm p(E31 E'c) :

p(E51 E'c) = [( p (E,)- p (E5 I E0)*p(Ec))/

/ (l-p(Eo))] + [p(E01 E’o)* ( p (E s I Eo)- p(Es))/ ( l- p ( E c))]

= 0.8129

Q G -03-01 Trang

Trang 23

2.7 Do 0.08 - p (E7 I E'7) < p(E7) = 0.1 nên người ta tính p(E51 E'7) theo :

p(E51 E'7)

= p (E5 I ~ e 7) + ( p (E7 I E'7)/ p (E7))* ( p (E5) - p (E5 I E'7» = 0.1

2.8 Các giá trị thuận được cập n h ậ t :

0 ( E 51 E'c) = p (E5 I E'g)/ (1- p (E5 I E'c)) = 4.34;

0 ( E 6|E '7) = = 0.111 2.9 Giá trị th u ậ n tổng cộng trên E5 theo quan sát E'G và E'7> và lưu ý rằng vì LN

= 1 nên trả lòi ảm tính đôi với E7 không làm giảm các giá trị thuận cập nhật.

0 ( E 8|E '6l E'7) = [0(E5|E 'g)/

/ 0 ( E 6)] * [0(E5| E'v)/ 0 ( E 5)] * 0 ( E 5) = 4.379 2.10 Tiếp theo là p(E5 I E'UJ = 0 (E 51 E'G, E'?) / (1 + 0 ( E 51 E'c, E'7)) = 0.814 2.11 Do 0.814 = p (E5| > p(E5) = 0.1 nên cuối cùng người ta tìm được độ tin cậy vào E5 theo quan sát E'c và E'7 theo :

c (E5 I E'6 i E'7) = 5 * ( p (E6 I E’tóng) - p (E5)) / (1- p (E5)) = 3.97

3 Người ta xác định độ tin tưởng vào Eị theo luật 2 :

Có hai nhân tố dẫn đến kết luận này Thứ nhất từ phía chuyên gia, khi họ cho biết 11S lớn và LN nhỏ đỏì với dấu hiệu “bị lõm” và “bị gỉ” Nhân tố thứ hai là người dùng đã tin tưởng cao vào việc quan sát dấu hiệu “bị lõm”, tức c(Efi = “lõm”l E'fi = “thấy lõm”) =

Đc nhận xét chung, người ta thấy cho dù mô hình PROSPECTOR thực hiện một

số giả thiết tạo nên mô hình, nhưng kết quả khuyến cáo đối với thí dụ nhỏ cho thấy kết luận là thông minh

VI K Ế T QUẢ XÁC SUẤT QUAN TR Ọ N G

Lí thuyết xác suất là kĩ thuật mạnh dối với thông tin không chính xác hay ngẫu nhiên Kĩ thuật này có the dược ciùrm cho dự báo thời tiết, lên kế hoạch tài chính, khai

Q G -03-01 Trang

Trang 24

thác mỏ Tuy nhiên tiếp cận này đúng là kĩ thuật để quản lý lập luận không chính xác trong hệ chuyên gia với một vài điều kiện.

1 Cần biết trước xá c s u ấ t trước

Việc dùng lí thuyết xác suất ngầm một ý cơ bản là không gian mẫu được xác dịnh tốt và xác suất của mỗi sự kiện có thể thu được nhờ tập dữ liệu quá khứ Chảng hạn tiếp cận Bayes trong bài toán chẩn đoán y học sẽ xác định xác suất về căn bệnh D từ dấu hiệu

E có thể được Iheo đảng thức p(DIE) = p(D)*p(EID)/ p(E)

Đảm bảo được các xác suất một cách tin cậy thường là khó hay phức tạp đến mức không thể có, vì người ta xem xét đồng thời nhiều căn bệnh và các triệu chứng Nói chung đối với nhiều bài toán trong thế giới thực thì thõng tin thống kê tin cậy là không sán sàng

và các giả thiết có thể không bền trong tiếp cận Bayes

2 Cẩn cảp n h ả t x ác s u ấ t

Một vài bài toán yêu cấu dữ liệu được thường xuyên thay đổi Với các sự kiện này thì kĩ thuật lập luận không chính xác dựa trên lí thuyết Bayes đòi hòi người ta tính toán lại tất cả các nhân tô xác suất Việc này cũng tiêu tốn thời gian và yêu cầu nhiều hơn đối với công tác bảo trì

3 Tông xác s u ả t

Vấn đề khác thường xảy ra với tiếp cận xác suất chặt chẽ liên quan đến quan hệ giữa xác suất thuận và nghịch đối với giả thuyết đã cho Người ta mong rằng p(HIE) + p(HI~E) = 1, có Iighĩa đối với giả thuyết thì tổng xác suất thuận và nghịch phải bàng 1

IF vết thương trong cơ thể là dương tính AND hình thái của bộ phận là khuẩn AND thể thức phát triển theo chuỗi

THEN có dấu hiệu chỉ định khuẩn chuỗi 0.7.

Luật này phản ánh mức tin của chuyên gia trong kết luận của luật với các dấu hiệunhư trong phđn giả thiết Độ tin cậy trong quan hệ được đánh giá bàng số 0.7, trong [-1, + 1], trong đó -1 ứng với sai và +1 ứng với đúng

Nếu theo quan diểm tổng xác suất bàng 1 thì việc vắng các dấu hiệu mà phần giả thiết ncu lên cũng kết luận được với tin cậy 0.3 Tuy nhiên theo báo cáo của Shortliffe thi chuyên gia không hài lòng dưa ra nhận xét này

Vấn đề cần quan tàm trong thí dụ trên không phái là tính chật chẽ của lí thuyết hay ý kiến của chuyên gia mà là tìm cách đổ tiếp cận Baycs giải quyct dược loại bai toán

tài Q G -03-01 Trang 2 3

Trang 25

này Vấn đề cơ bản là trong khi p(HIE) ngầm định quan hệ nhân quả giữa E và H không

có gì đảm bảo là có quan hệ giữa E và ~H Độ tin cậy được lập ra dựa trẽn quan hệ của các luật phản ánh sự tin tưởng có kiểm chứng của chuyên gia về quan hệ giữa giả thiết và kết luận của luật; và không luật nào đáp ứng chặt chẽ ràng buộc xác suất

4 Cần th iế t của dộc láp diêu kiên

Việc dùng tiếp cận Bayes cũng đòi hỏi giả thiết khác đế đơn giản hóa tiếp cận đối với bài toán thế giới thực PROSPECTOR đã giả thiết có độc lập điều kiện về dấu hiệu để đơn giản hóa định lí Bayes Nếu để nguyên thì định lí này khó áp dụng cho một số bài toán Chảng hạn người ta có thể hỏi về họng đau và sốt cao của bệnh nhân để suy luận ra viêm họng Tất nhiên triệu chứng họng đau và sốt cao có thể không độc lập

Giả thiết về độc lập điều kiện của dấu hiệu cũng được dùng trong PROSPECTOR

để tạo độ tin cậy vào giả thuyết viết theo các luật chuẩn AND hay chuán OR Đối với luật chuẩn AND như IF E, AND E2 AND AND En THEN H thì c(H) = m in{pCE.IE',)}

Tiếp cận này tốt bới lẽ nó đơn giản nhưng không tốt vì không nhạy với thay đổi của piEjlE'j) Với luật chuẩn OR, người ta có nhận xét tương tự

5 Kết lu â n vê các r à n g buộc

Lí thuyết xác suất là thú tục tốt đối với thông tin không chính xác, nhưng cần đám bảo một vài điểu kiện tiên quyết và các giả thiết Một vài điếm đáng lưu ý khi đàm bảo thông tin là :

• Dữ liệu trước vê các sự kiện của lĩnh vực cần sẵn sàng.

• Dữ liệu này cần được cập nhật để mô hình xác suất có thê đáp ứng được bất kì thay đổi trong lĩnh vực.

• Tổng các xác suất th u ậ n và nghịch đôì VỚI giả thuyết trên sự kiện đã cho cần bằng 1.

• Độc lập điểu kiện của dữ liệu cần được tính đên.

VII K Ế T LUẬN VỂ T I Ế P CẬN BAYES

v ể nguyên tắc, kĩ thuật Bayes và các biến thê của nó dùng đê quản lý lập luận không chính xác trong hệ chuyên gia Khi thoá mãn một số điều kiện, tiếp cận này cung cấp cho người dùng một phương pháp đúng

Tuy nhiên trong nhiều hệ chuyên gia, người ta khòng có dữ liệu quá khứ hay mỏ hình để chính xác hóa các câu về xác suất Thực tế cho thấy việc thiếu các dữ liệu khỏng phù hợp với tiếp cận xác suất cổ điển, nhưng vẫn có cách giải quyết Có hai tiếp cận chính dùng để xử lý thông tin không chính xác, là tiếp cận khỏng chắc chắn và tiếp cận mờ

Tài liệu này với nhan đế “tiếp cận Bayes đôi VỚI lập luận không chính xác” đã trình bày

Q G -03-01 Trang

Trang 26

một số’ vấn đề sau :

• Lí thuyết xác suất đảm bảo tiếp cận chính xác để đưa ra suy luận không chính xác

B Định lí Bayes cho phép người ta xác định xác suất cùa sự kiện trước, khi sự kiện sau

Trang 27

TÀI LIỆU 2

LÍ TH U Y Ế T CHẮC CHẮN

Một dạng thông dụng của lí thuyết xác suất để lập luận không chính xác trong hệ chuyên gia là lí thuyét chắc chắn Lí thuyết này phát triển trên MYCIN và liên quan đến các độ đo giám định độ tin cậy, chứ không gắn chặt với các đánh giá xác suất một cách chặt chẽ Các kết quả nghiên cứu và ứng dụng dẫn đến việc phát triển mô hình chắc chắn

Mô hình này cho phép lập luận không chính xác trong nhiều ứng dụng của hệ chuyên gia

Các chuyên gia thường đánh giá, suy xét khi giải vấn đề Thông tin về vấn đề có thể không đấy đủ và một vài tri thức có thể không xác thực Do vậy mà họ cần thích nghi với tình trạng này và tiếp tục lập luận thông minh Đây chỉ là một trong các khó khăn thỏi, vì việc quản lý lập luận không chính xác cũng không dễ dàng

Người ta có thể dùng lí thuyết xác suất Dù rằng chặt chẽ vé toán học, kĩ thuật này đòi hỏi cơ sở thống kê mà ít loại bài toán trong hệ chuyên gia đáp ứng được Chảng hạn khi xác định người bệnh có đau nặng không, người ta thu được kết luận với tin cậy 0.7

Do thiếu cơ sở thống kê nên những thông tin để giúp phán đoán không dùng dược trong các luật của hệ chuyên gia mà chỉ dùng để giải thích; và vì vậy không thể suy luận xác suất bằng kĩ thuật Bayes được

Tuy nhiên nếu xem hệ chuyên gia như cơ chế giải vấn đề may rủi thì người ta có thể dùng các kĩ thuật lập luận không chính xác như trong MYCIN

' 1.1 L ậ p l u ậ n k h ô n g c h í n h x ác t r o n g MYCIN

MYCIN là hệ chuyên gia được phát triển để cho lời khuyên khi chẩn đoán các bệnh nhân nhiễm trùng máu Đây là bài toán điển hình trong nhiều lĩnh vực, nhưng có ý nghĩa đặc biệt trong lĩnh vực y học do các ràng buộc về thời gian Trong phòng cấp cứu cẩn thiết có các hành động đúng và nhanh Đối với các bệnh đe doạ đến tính mạng, thầy

xác và phải có chẩn đoán tốt nhất

Vé suy luận không chính xác trong lĩnh vực y học, người ta thấy có nhiều luật không chính xác Một số ít luật có the giúp chẩn doán tốt cho ca bệnh, nhưng những luật

Q G -03-01 Trang

Trang 28

này ít được dùng đến Phần lớn các luật dùng trong y học ở dạng không chính xác Chảng hạn thầy thuốc phát biểu "nếu thấy triệu chứng A và B thì có vài chí định liên quan đến bệnh này, bệnh nọ".

Nhóm MYCIN ghi nhận rằng kĩ thuật lập luận không chính xác cần được tích hợp vào hệ thống Họ cũng thấy được tính không phù hợp của tiếp cận xác suất vì không đáp ứng được các thõng tin thống kẽ về vấn đề Để quản lý tình trạng này, nhóm MYCIN quyết định nới lỏng các yêu cầu chặt chẽ của kĩ thuật xác suất cổ điển và tìm tiếp cận đơn

giản hơn Trước tiên họ quyết định đặt các câu hỏi liên quan đến diều họ muốn kĩ thuật lập luận không chính xác thực hiện, chứ không hỏi về cách thức thực hiện Họ cảm thấy

việc quan sát cách chuycn gia làm trên thông tin không chính xác sẽ nhìn thấu đù dc phát triển các yêu cầu của kĩ thuật lập luận không chính xác

1.2 T h ể h i ệ n d â u h i ệ u k h ô n g c h ắ c c h ắ n

Nhóm MYCIN quan sát thấy thầy thuốc làm việc với ca cấp cứu thường dùng ihông tin không chắc chắn, thậm chí không rõ Họ ghi nhận rằng dưới điều kiện như vậy, thầy thuốc ihường phân tích thông tin sẩn có với thuật ngữ định tính như "có the", "có vẻ như ", "hầu như chắc chắn ràng "

Đối với dấu hiệu không chắc chắn, nhóm MYCIN quyết định gán một nhân tố chắc chắn "CF" để thể hiện độ tin cậy của thầy thuốc vào dấu hiệu dó Số này chạy từ -1, ứng với sai hoàn toàn, đến +1, ứng với đúng hoàn toàn Số dương thể hiện sự tin cậy, số

âm thể hiện sự không tin cậy Chảng hạn thầy thuốc phát biểu rằng dấu hiệu nào dó có the đúng, thì giá trị CF = 0.6 được gán cho dấu hiệu đó

1.3 T h ể h i ệ n c á c l u ậ t k h ô n g c h ắ c c h ắ n

Nhóm MYCIN cũng quan sát thấy các thầy thuốc thường dùng suy luận không 'chính xác trên các thông tin có sẩn Tức là thầy thuốc chỉ tin một phần vào sự suy xét trên dấu hiệu nào đó Đối với suy luận không chính xác, cần gán giá trị CF cho mỗi luật

Thí dụ

Có luật : IF có dâu hiệu thương tổn AND hình thái khuẩn cấu AND hình thể trên vết thương là chuỗi THEN chỉ định bị khuẩn cáu chuỗi với CF = 0.7

Nếu kết luận chỉ phụ thuộc một phán vào một trong các giả thiết trong luật thì CF

có ihể dùng cho riêng giả thiết đó Khi dó luật có dạng :

IF E, AND E; AND AND En THEN H CF = CF,

1.4 S u y l u ậ n k h ô n g c h ắ c c h á n

tài Q G -03-0I Trang 2 7

Trang 29

Người ta cũng thấy rằng khi độ tin cậy của thày thuốc vào dấu hiệu đang có là nhỏ hơn sự chắc chắn thì độ tin cậy này trong suy luận liên quan cũng giảm đi Chảng hạn luật đầu tiên kết luận về việc chỉ ra tổ chức bị viêm dạng hạt, người ta dùng giả thiết không chắc chắn, CF (E|) <1 và mức độ tin cậy trong kết luận giảm, CF(H) <0.7 Hệ thống MYCIN áp dụng suy luận không chắc chắn theo kĩ thuật này.

1.5 Tô h ợ p d â u h i ệ u t ừ n h i ề u n g u ồ n

Khi thày thuốc nhận thông tin trợ giúp để kết luận từ nhiều nguồn, người ta thấy rằng kết luận có độ tin cậy lớn hơn Do vậy lí thuyết chắc chắn cán tăng độ tin cậy về kết luận khi nhận trợ giúp từ nhiều luật

Trong MYCIN, thay VI dùng công thức, người ta quyết định hỏi Sau đó người ta không dùng công thức chính xác mà áp mộl số thuộc tính để công thức phải thoủ mãn

trong một số trường hợp Hai thuộc tính được chọn là tráo dổi và liệm cận.

Thuộc tính tráo dổi quan trọng ở chỗ tránh được sự phụ thuộc về thứ tự áp dụng

luật Chẳng hạn khi có hai luật có cùng độ tin cậy vổ quyết định cuối cùng, thì áp dụng

luật nào đầu tiên cũng như vậy Còn thuộc tính tiệm cận cho phép tổ hợp theo nghĩa tiệm

cận về kết luận hợp lí, trừ phi người ta có giải pháp đưa ra lời giải đúng Vói cách làm này, kết luận sẽ có độ tin cậy tăng từng phần

1.6 Độ t i n c ậ y t h ự c

Thông thường thày thuốc sẽ cân đối độ tin cậy về giả thuyết cho cả dấu hiệu dương tính và dấu hiệu âm tính Tuỳ theo trường hợp mà dấu hiệu được chấp nhận hay bị loại Vấn đề đặt ra là độ tin cậy thực là bao nhiêu ?

Đối với trường hợp này, MYCIN quyết định tạo độ tin cậy thực trong giả thuyết của luật Trước hết người ta tập hợp tất cả thông tin trợ giúp và gọi nó là độ đo tin cậy

MB (measure of belief) trong giả thuyết Việc tập hợp tiến hành theo cách hoán đổi và tiệm cận Tiếp theo, các thông tin loại bỏ già thuyết dược tập hợp lại theo cách tiệm cận

và hoán đổi và gọi là độ dơ không till MD (measure of disbelief) Độ tin cậy thực hay CF trong giả thuyết được tính bàng dộ lệch giữa hai giá trị dộ do này

Q G -03-01 Trang

Trang 30

Lí thuyết chắc chắn giả thiết rằng xác suất trước của giả thuyết H, p(H) thể hiện

độ tin cậy được giám định của chuyên gia về H Độ không tin p(~H) của chuyên gia được coi là tuỳ theo ràng buộc xác suất truyền thống, tức p(H) + p(~H) = 1 Ngoài ra còn giả thiết rằng nếu chuycn gia quan sát dấu hiệu thấy : xác suất về giả thuyết có dấu hiệu (tức xác suất có điều kiện p(HIE)) lớn hơn xác suất trước (tức p(H)), tức là p(HIE) > p(H) đúng, thì độ tin cậy của chuyên gia về giả thuyết tăng tỉ lệ thuận đến (p(HIE) - p(H))/ (1 - p(H))

Mặt khác nếu p(HIE) < p(H) thì độ tin cậy của chuyên gia về giả thuyết sẽ giảm tỉ

lệ thuận về (p(H) - p(HIE))/ p(H)

Cái chính của lí thuyết này là khi có một chút dấu hiệu, độ tin cậy của chuyên gia

về giả thuyết có thể tăng hay giảm chút ít Ý này được phát triển gắn với độ đo MB và MD

Đ in h nghĩa Đô đo tin cây (m easure o f belief) MB Giá trị bằng sô'thể hiện độ tin cậy tăng lên về giả thuyết H dựa trên dấu hiệu E

Đ in h nghĩa Độ do k h ô n g tin (m easure o f disbelief) AID Giá trị bẳng s ố th ề hiện độ không tin tăng lên về giả thuyết H dựa trẽn dấu hiệu E

xác suất trước có điều kiện theo các công thức sau :

Trang 31

Do người ta quan sát một vài thông tin, thông tin này làm thay đổi độ tin cậy hay

độ không tin vào giả thuyết cho nên người ta kết hợp hai giá trị trên vào giá trị độ tin cậy chung, CF = MB - MD; -1 < CF < 1

Đ in h nghĩa N h ả n tô tin cây (certainty factor) Giá trị bang sô thê hiện mức độ tin cậy thực vào giả thuyết khi có thông tin

Giá trị -1 của CF thể hiện "sai chắc chắn" và +1 thể hiện "đúng chắc chắn" Giá trị 0 cho biết "không biết", giá trị âm thể hiện độ không tin vào giả thuyết trong khi giá trị dương ngược lại

Hình P h a m vi của các g iá tri CF

Tuỳ theo tình huống thực tế, có một số trường hợp điển hình xảy ra như sau :

Trường hợp 1 D ấu h iệu k h ẳ n g định hoàn toàn g iả th uyết

Nếu dấu hiệu đã có E khảng định hoàn toàn giả thuyết H thì p(HIE) = 1 Do vậy MB(H, E) = 1, MD(H, E) = 0, và tính được CF(H, E) = 1 Do vậy khi E hoàn toàn xácđịnh H, theo sơ đồ về giá trị CF thì H là đúng chắc chắn

Trường hợp 2 D ấu h iệ u ho à n toàn k h ô n g xác đ in h g iả thuyết

nên tính được CF (H, E) = -1, tức H sai chắc chắn

Trường hơp 3 Thiếu d ấ u h iêu

Nếu dấu hiệu đã có E là độc lập với giả thuyết thì không khẳng định hay phủ nhận dược H, tức p(HIE) = p(H) Theo công thức tính MB, MD thì MB(H, E) = MD(H, E) = 0, vậy tính được CF(H, E) = 0 Trường hợp này có nghĩa nếu H và E là độc lập thì H được xem như không biết

Trường hơp 4 D ấu h iệ u dương

Nếu dấu hiệu đã có E xác định một phần giả thuyết H thì p(H) < p(HIE) < 1 và tính các độ đo theo MB(H, E) = (p(HIE) - p(H))/ (1 - p(H)); MD(H, E) = 0 Do đó CF (H, E) = MB (H, E)

Q G -03-01 Trung

Trang 32

Vậy khi E xác định H một phần thì theo sơ đồ CF, CF(H, E) thuộc miền dương, tức miền tin cậy vào giả thuyết H.

Trường hơp 5 D âu hiê u ảm

Nếu dấu hiệu đã có E không xác định một phần giả thuyết H thì 0 < p(HIE) < p(H) Do vậy MB(H, E) = 0 và MD(H, E) = (p(H) - p(HIE))/ p(H)

Theo nhiều nguồn xác định giả thuyết thì giá trị MB sẽ hội tụ đến 1, tức MB(H,

Eị, E2, ) -> 1- Nhưng nếu có một nguổn phủ định giả thuyết này thì có i để MD(H, Ej) >

0, chảng hạn MD(H, E,) = 0.8

Giả sử MB(H, E„ E2, ) = 0.999 thì CF(H, E) = 0.199Trong thực tế điều này không phù hợp; nhiéu điều khảng định đã bị một điều áp đảo và giá trị tin cậy về H quá thấp Người ta xử lý trường hợp này bằng cách sử dụng cách tính CF :

CF(H, E) = (MB(H, E)-MD(H, E))/ (l-min{MB(H, E), MD(H, E)}).

Trong thí dụ này người ta thu được CF(H, E) = 0.995 Cách tính này có tác dụng ngược lại so với cách tính trước; nó giảm tác dụng của một số nhỏ ý kiến trái ngược

Trong hầu hết các vấn đề, việc đánh giá CF nhờ các chuyên gia không phải là dễ dàng Việc dùng CF thực chất thay cho độ đo p(H) và p(HIE)

• II N HÂ N TỐ CHẮC CHẮN DƯỚI KH ÍA CẠNH XÁC SUAT

Nhiều năm qua, mô hình chắc chắn đã phát triển thành kĩ thuật thực tế để quản lý lập luận không chính xác trong hệ chuyên gia Tuy các khái niệm MB, MD và CF vẫn được sử dụng, nhưng mới ớ mức đon giản Sau đây là dạng sử dụng hiện thời của mô hình chắc chắn

Trang 33

Hình Miêu tả các g iá tri CF

Người ta đã dùng CF với các giá trị lừ -1 đến +1 đổ thể hiện độ tin cậy trong câu Chảng hạn CF (E) = CF (hôm nay có khả năng mưa") = 0.6 Tiếp cận này đã thay xác suất hình thức p (E) bằng CF (E) Trong bảng là các giá trị CF điển hình

Các nhân tố chắc chắn không phải là xác suất, mà là các độ đo không hình thức về

sự tin tưởng vào một phần dấu hiệu Chúng thể hiện mức độ mà người ta tin rằng dấu hiệu

là đúng Để thể hiện độ tin cậy này trong hệ chuyên gia, người ta viết câu dưới dạng chính xác và thêm giá trị CF phù hợp Chảng hạn "hôm nay có khả năng sẽ mưa" hay "hỏm nay

sẽ mưa CF = 0.6"

Các lu à t k h ô n g chắc c h ắ n

hiệu E trong giả thiết của luật và giả thuyết H trong phần kết luận của luật Cấu trúc cơ bản của luật dùng trong mô hình chắc chắn có dạng IF E THEN H CF (luật), trong đó CF (luật) thể hiện mức độ tin cậy H khi có E Tức là khi E là đúng thì người ta tin H theo CF (H, E) = CF (luật)

Trang 34

Lan truyền n hân tô chắc chắn liên quan đến việc thiết lập mức độ tin cậy vào kết luận của luật trong trường hợp dấu hiệu trong giả thiết là không chắc chắn Đối VỔ 1 luật có phần giả thiết đơn, người ta tính CF (H, E) = CF (E) * CF (luật).

Thí dụ

Theo thí dụ trên nhưng có dâ'u hiệu thuận về E, tức CF (E) = 0.5 thì

CF (H, E) = 0.5 * 0.8 = 0.4 Điều này có nghĩa "Có thể mưa" Nếu người ta có dấu hiệu không th u ậ n vê E, tức CF (E) = -0.5 thì CF (H, E) = -0.4; có nghĩa "có thể không mưa".

Thí dụ cho thấy dấu hiệu bổ sung tính tin cậy hay không tin cậy vê' một giả thuyết.

11.3 L a n t r u y ề n c h ắ c c h ắ n đối với c á c l u ậ t n h i ề u g iả t h i ế t

Trong trường hợp luật có nhiều giả thiết, nhân tố chắc chắn đối với kết luận của luật được lập theo cách tương tự như cách dùng trong hệ thống PROSPECTOR Như nhóm MYCIN thì người ta giả sử có độc lập điều kiện của dấu hiệu theo dạng AND hay

OR khi xét độ tin cậy vào giả thuyết

11.3.1 Các lu ậ t AND

Mô hình chắc chắn dùng các luật có dạng

IF Ej AND E2 a n d a n d En THEN H CF (luật)

CF (H, E[ AND E2 a n d a n d En) = min{CF (EJ) * CF (luật) Thí dụ

IF trời tôi AND gió mạnh dần THEN sẽ mưa CF = 0.8.

Giả thiết rằng CF (trời tôi) = 1.0 và CF (gió mạnh dần) = 0.7 thì

CF (sẽ mưa) = min {1.0, 0.7} * 0.8 = 0.56; có nghĩa "có khả năng mưa".

IF tròi tôi OR gió m ạnh dần THEN sẽ mưa CF = 0.9.

Giả thiết ràng CF (tròi tối) = 1.0 và CF (gió m ạnh dần) = 0.7 thì

CF (sẽ mưa) = max {1.0, 0.7} * 0.9 = 0.9; có nghĩa "hầu chắc chắn là mưa".

11.4 L a n t r u y ề n c h ắ c c h ắ n đ ô i với c á c l u ậ t có c ù n g k ê t l u ậ n

Trong một vài ứng dụng người ta có thể viết nhiều luật về cùng mội két luận Chảng hạn đổ tin rằng trời sắp mưa, người ta căn cứ vào ý kiến của nhà dự báo khí lượng hay vào nông dân

1 Q G -03-01 Trang 3 3

Trang 35

• L uật 1 IF nhà dự báo nói sắp mưa, E t THEN sắp mưa, H với CF (luật 1) = 0.8

• Luật 2 IF nông dân nói sắp mưa, E2 THEN sắp mưa, H với CF (luật 2) = 0.8

Hai luật dựa trên hai nguồn, có cùng giá trị CF v ề tâm lí thì khi có nhiều nguồnkhẳng định một kết luận, người ta sẽ cảm thấy tin tưởng hơn, chảng hạn tin hơn vào trời

sẽ mưa nếu được khẳng định của cả chị dự báo thời tiết và bác nông dân Nhóm MYCIN dùng ý tưởng này trong kĩ thuật "dấu hiệu thu thập nhiều lên" để kết hợp các giá trị tin cậy và phản bác của các luật về cùng một kết luận

Chẳng hạn có luật 1 : IF E, THEN H và luật 2 : IF E2 THEN H, dạng nguyên bản của đẳng thức dùng trong kĩ thuật này do Shortliffe và Buchanan đưa ra năm 1975 là:

MB (H, E,&E2) = MB (H, E.) + MB (H, E2)* (1 - MB (H, E,)) nếu ngược lại

• M D (H, E ị& E 2) = 0 nếu MB (H, Eị&Ei) = 1, hoặc

MD (H, E,&E2) = MD (H, E,) + MD (H, E2)* (1 - MD (H, E,)) nếu ngược lại.Các đảng thức khảng định rằng các dấu hiệu bổ sung E2 sẽ làm tăng các giá trị do dấu hiệu Ej đã xác định Các MD và MB dược cập nhật sẽ cho phép tính nhân tố tin cậy theo CF = MB - MD

Trong một vài ứng dụng, nên tính đến MD và MB như các trợ giúp khi có thêm thông tin Nhưng trong vài ứng dụng khác, người ta chỉ quản lý một bản ghi về giá trị CF được cập nhật Đối với các ứng dụng này, người ta có thể dừng đảng thức :

CFkéth?p = CFj + CF2 (1- C F j ) khi cả hai CF; là dương;

CFkếthỢp = CFj + CF2 (1+CFi) khi cả hai CF, là âm; và CFkết hỢp = (CF, + CF2) / (1 - mm{ I CF, I, I CF21}), trong đó CF, thể hiện tin cậy vào H theo luật thứ i.

Các đảng thức tính MD, MB và CF trong mô hình chắc chắn có thuộc tính hoán đổi, tiệm cận

11.4.1 H oán đôi

Tính chất hoán dổi cho phép thay đổi trật tự sử dụng luật Mô hình chắc chắn cần tính chất này để thu thập các dấu hiệu theo trật tự tuỳ ý Tức là nếu có nhiều luật thu thập thông tin thì giá trị tổng hợp CF không bị lệ thuộc vào thứ tự xử lý luật

11.4.2 Tiêm cán

Tính chất tiệm cận khảng định tri thức càng dược thu thập sẽ càng làm dũng già thuyết Người ta cẩn tính chất tiệm cận bởi hai lí do Trước hết nó phàn ánh cách mà thày

lài Q G -03-01 Trang 3 4

Trang 36

thuốc thu thập độ tin cậy về giả thuyết nào đó từ nhiều nguồn thông tin Trong số nhiều nguồn khẳng định giả thuyết thì người ta cảm thấy tin ở một nguồn nào đó, và ứng với nó

là độ tin cậy cao hơn Thứ hai, tính chất này đảm bảo tổng hợp các độ tin cậy không vượt quá 1, mà chỉ tiệm cận về 1

Giả sử tiếp tục sử dụng hai luật trên về dự báo mưa Người ta thấy có các trường hợp xảy ra như sau :

Trường hơp 1

Cả người dự báo và người nông dân đều chắc chắn về mưa CF (E,) = CF (E^) =1.0 Theo đảng thức tính CF tổng hợp, người ta thu được :

CF, = CFi (H, Ei) = CF (E,) * CF (luật 1) = 1.0 * 0.8 = 0.8.

CF2 = CF2 (H, E2) = CF (E2) * CF (luật 2) = 1.0 * 0.8 = 0.8.

CFkếlhỢp (CF„ CF2) = CF, + CF2 * (1-CF,) = 0.8 + 0.8* (1-0.8) = 0.96.

Trường hợp này cho biết cách tăng nhân tố chắc chấn nhờ dấu hiệu của cả hai luậtđối với cùng một giả thuyết Thực tế cũng cho thấy khi có nhiều khảng định thì người tatin tưởng hơn

Trường hơp 2

Nhà dự báo khẳng định mưa, còn người nông dân thì không Tức là

CF (E,) = 1.0, C F (E 2) = -1.0.

CF, = CF, (H, Eị) = CF (E,) * CF (luật 1) = 1.0 * 0.8 = 0.8.

CF2 = CF2 (H, E2) = CF (E2) * CF (luật 2) = -1.0 * 0.8 = -0.8.

= (0.8 - 0.8) / (1- min{0.8, 0.8» = 0.

Trường hợp này cho biết nhân tố tiên đoán mưa ứng với "không biết" vì một nguồn khảng định mưa bị mất tác dụng bởi nguồn kia ở đây người ta dùng độ tin cậytinh vào giả thuyết

Trường hơp 3

Chị dự báo và bác nông dân tin rằng không mưa theo độ tin cậy khác nhau, chẳnghạn CF (E|) = -0.8 và CF (E2) = -0.6

CFj = CF, (H, E,) = CF (E.) * CF (luật 1) = -0.8 * 0.8 = -0.64.

CF2 = CF2 (H, E2) = CF (E2) * CF (luật 2) = - 0 6 * 0.8 = -0.48.

CFkilhỢp (CF„ CF2) = CF, + CF2 * (1+CF,) = -0.64 - 0.48* (1-0.64) = -0.81.

Kết quả cho thấy dộ tin cậy càng giảm khi có nhiều dấu hiệu phán bác

Trường hơp 4

Q G -03-0I Trung

Trang 37

Các nguồn có cùng độ tin cậy về mưa, nhưne có một nguồn cho rằng không mưa Chẳng hạn CF (mưa) = 0.8, do có nhiều nguồn nên

CFkílhơp (CF„ CF2, ) -> 0.999 = CFtfi

CF này thể hiện độ tin cậy tổng hợp về mưa từ các nguồn thông tin cũ Nếu có nguồn mới có độ tin cậy CFm,„ = -0.8 Theo công thức tính CFkỉlhl(p:

CFkíl hợp (CFcũ, CFmúi) = (CFcũ + CFmúi) / (1 - min {ICFJ, ICFmớịl}) = 0.995

Kết quả cho thấy một dấu hiệu phản bác không tác động nhiều lắm so với nhiều dấu hiệu khẳng định

II.5 L a n t r u y ề n c h ắ c c h ắ n đ ô i với c á c l u ậ t p h ứ c h ợ p

Một số ứng dụng có thể có các luật dùng dạng hỗn hợp AND và OR, chẳng hạn IF

các luật loại này bằng cách kết hợp cách tính đối với luật AND và luật OR, chảng hạn luật trên có CF (H) = max {min {CF (Eị), CF (E2) }, m in{CF (E3), CF (E4) Ị Ị * CF (luật)

III TH Í DỤ VỂ NHÂN T ố CHAC CHAN

Thí dụ này nhầm minh họa việc lan truyền các nhân tố chắc chắn Người ta cần biết thời tiết ra sao trước khi chơi bóng Giả sử có giả thuyết "Mơ không chơi bóng dược"

và tập các luật sau :

• Luật 1 CF (luật 1) = 0.9 IF trời ảm đạm (sự kiện E[) OR Mơ buồn (sự kiện E2) THEN

Mơ không chơi bóng (tức giả thuyết H).

• Luật 2 CF (luật 2) = 0.8 IF Mơ tin là sắp mưa, E3 THEN tròi ảm đạm, Ej.

• Luật 3 CF (luật 3) = 0.9 IF Mơ tin là sắp mưa, E3 AND nhà dự báo nói rằng sắp mưa, E4 t h e n M ơ buồn, E2.

• Luật 4 CF (luật 4) = 0.7 IF nhà dự báo nói rằng sắp mưa, E.t THEN tròi ảm đạm, Eị.

• Luật 5 CF (luật 5) = 0.95 IF trời ảm đạm, Ej THEN Mơ buồn, Eo.

Giả sử rằng người ta nhập vào các nhân tố chắc chắn ban dầu, ờ dạng các sơ khởigồm :

1 Nhà dự báo tin ràng sáp mưa, CF (E.|) = 0.85.

2 Mơ tin sắp mưa, CF (Ea) = 0.95.

Ngoài ra giả sử theo hệ thống thực hiện suy luận quay lui, xuất phát từ đích H|

"Mơ không chơi bóng", và các luật dược sử dụng hết

lài Q G -03-01 Trang 3 6

Trang 38

Bước 1 Xét giả thiết của luật 1 thấy "trời ảm đạm", Ej Các luật 2 và luật 4 đều kết

luận về Ej

Bước 2 Xét luật 2 Có nhận xét ở đây : hộ thống xét luật này trước tiên vì nó có

giá trị CF cao hơn luật 4 Theo đẳng thức đã có, CF (E,, E3) = CF (EO* CF (luật 2) = 0.95*0.8 = 0.76

Bước 3 Xét luật 4 CF (E„ E4) = CF (E4)* CF (luật 4) = 0.85*0.7 = 0.6.

Bước 4 Có hai khẳng định đối với Eị, tức "trời ảm đạm" từ bước 2 và 3 Người ta

kết hợp chúng theo tiếp cận làm tăng các dấu hiệu

CF (E,) = CF (E„ E3) + CF (E„ E J* (1- CF (E„ E3)) = 0.76 + 0.6* (1-0.76) = 0.9

Bước 5 Xét giả thiết 2 trong luật 1 "Mơ buồn", tức E2 Lưu ý luật 3 và luật 5 kếtluận về E2

Bước ổ Xét luật 5 Nhộn xét rằng hệ thống dùng luật này trước do nó có CF cao

hơn

CF (E2, E,) = CF (E,) * CF (luật 5) = 0.9 * 0.95 = 0.86

min{0.95, 0.85} * 0.9 = 0.77

Bước 8 Người ta có hai khẳng định đối với E2, "Mơ buồn" từ bước 6 và 7 Lại

dùng tiếp cận tăng dấu hiệu, người ta có :

0.86) = 0.97

Bước 9 Quay lại luật 1 CF (Hị, E, OR E2) = max{CF (Eị), CF (E2)}*CF (luật 1) =

max (0.9, 0.97} *0.9 = 0.87 Đó chính là CF (Mơ không chơi bóng)

IV MỘT SỐ KĨ TH U Ậ T L IÊ N QUAN T Ớ I CF

IV 1 T ìm k i ế m m a y r ủ i

Việc chọn luật để xét trước tiên trong trường hợp có nhiều luật dựa vào CF Cách này nhạy cảm do hệ thống đã tìm thông tin ở chỗ dẻ phát hiện thấy lời giải nhất Đây là phương pháp tìm phù hợp (best first search) Phương pháp này tìm thông tin tại nơi hy

vọng có độ tin cậ y lớn nhất VC kết luận của luật.

Ngoài ra người ta còn dùng các trợ giúp khác để dạt dược độ tin cậy cao vào đích

Thí dụ

lài Q G -03-01 Trang 3 7

Trang 39

Luật 1 IF A AND B THEN c CF = 0.8 Luật 2 IF D THEN c CF = 0.7.

Kĩ thuật tìm phù hợp sẽ chọn luật 1 trước bởi CF cao hơn Tuy nhiên nếu hệ thống lưu ý rằng CF (A)*0.8 < 0.7 thi cần xét tiếp D trong luật 2 vì bấy giờ CF của luật 2 cao hơn khi kết luận về c

Nói chung người ta dùng luật meta để xử lý nhiều luật và nhiều giá trị CF Hầu hết các công cụ đều có thể dùng giá trị CF trong các luật và có khả nâng thay đổi đích nhờ các luật meta

IV.3 T h ô i t ì m k i ế m

Khi cần chứng tỏ một giả thuyết, hệ chuyên gia thường tìm tất cả các luật trợ giúp cho giả thuyết đó Khi có quá nhiều luật người ta sẽ tốn nhiều thời gian Đỏi khi việc ngừng xét luật là cần thiết Chảng hạn MYCIN không xct đích dang theo đuổi khi CF rơi vào vùng (-0.2, +0.2) Người ta có thể dùng hàm ngưỡng để xác định thời điểm từ bỏ đích đang xét

Thí dụ

Một số công cụ đã dùng phương pháp này : LEVEL5 dùng hàm ngưỡng, VP- EXPERT dùng "ngưỡng đúns", GURU dùng "ngưỡng không rõ" Hầu hết các ngưỡng cho phcp chỉnh lý ngay từ đầu phiên làm việc Chảng hạn người ta chọn ngưỡng ngay trong luật IF THEN ngưỡng = ?

IV.4 Hỏi c á c g iá t r i CF

Khi dùng kĩ thuật lập luận không chắc chắn, người ta cán thiết kế cách thức để người dùng nhập thông tin Chans hạn hệ ihống MYCIN yéu cáu nhập các con số trong vòng (-1, +1) theo cách trực tiếp :

lài Q G -03-01 Trang 3 8

Trang 40

• Hệ thông hỏi : độ tin cậy vào trời mưa là bao nhiêu ?

• Trả lòi : 0.6

Hệ thống khác có thể liệt kê các khả năng mà người dùng có thể trả lời, chảnghạn:

không biết / có thể / có khả năng / đúng

Sau đó hệ thống cần dùng luật để chuyển thông tin nhận được sang dạng số, chảnghạn : IF trời mưa = có khả năng THEN đã có điều kiện về thời tiết AND CF (trời mưa) =

IV.5 C ác t h u ộ c t í n h đ a g iá t r ị v à CF

Người ta có thể dùng O-A-V để xác định nhiều giá trị Kĩ thuật này trong lập luận không chắc chắn được dùng để gán giá trị CF Chảng hạn có các mệnh đề :

1 "điều kiện thời tiết" = "tròi tôi" CF = 0.8,

2 "điều kiện thời tiết" = "trời mù" CF = 0.7, và

3 "điều kiện thời tiết" = "trời sáng" CF = 0.1

dùng để thiết lập đối tượng- thuộc tính "trời - là" bằng ba giá trị Người dùng chọn giá trị ngay từ đầu phiên làm việc hay có thể dùng luật để suy luận ra giá trị đó Các CFnày lại được dùng trong các luật để suy luận ra giá trị CF của các O-A-V đa giá trị khác

Thí dụ

IF trời = tối THEN dự báo thời tiết = mưa CF = 0.6.

IF tròi = mù THEN dự báo thòi tiết = trời quang CF = 0.3.

Hai luật này cháy sẽ suy ra

IY.6 C h ọ n k h í a c ạ n h k h ô n g c h ắ c c h ắ n

Khi dùng kĩ thuật lập luận không chắc chán, người ta thấy rằng không nhất thiếtquản lí tất cả các khía cạnh theo cách không chắc chắn Chảng hạn "sự tối của bẩu trời" làkhông chác chắn, nhưng "nhiệt dộ" till không

Hau hết các công cụ đcu cho phcp người ta xác định loại khía cạnh nào cần xử lý theo cách không chắc chán Chảng hạn hệ thống LEVEL 5 dùng mã "tin tường" về mức

lài Q G -03-01 Trang 3 9

Ngày đăng: 18/03/2015, 13:16

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[2] Sprague H., Carlson E. D.Building Effective Decision Support Systems. Englewood Cliffs, N.J., Prentice-Hall, Inc.: 1982Decision support systems and Expert systems, 4th ed„ Ed. PrenticeHall, 1996 Sách, tạp chí
Tiêu đề: Building Effective Decision Support Systems
Tác giả: Sprague H., Carlson E. D
Nhà XB: Prentice-Hall, Inc.
Năm: 1982
[1] Sprague, R.H.Decision Support System, putting theory into practice, Ed. Prentice Hall 1989 Khác
[4] Borthick A. F. et al.The effeccts of information request ambiguity and construct incongruence on query development, Decision support systems 32 (2001) p. 3-25 Khác
[5] Gray p. H.A problem solving perspective on knowledge management practices, Decision support systems 31 (2001) p. 87-102 Khác
[6] Jimenez A. et al.A decision support system for multiattribute utility evaluation based on imprecise assignments, Decision support system 1025 (2002) 15 p Khác

HÌNH ẢNH LIÊN QUAN

Bảng HOATDONG - Hệ thống trợ giúp quyết định trong công tác đào tạo
ng HOATDONG (Trang 83)
Bảng KHOA - Hệ thống trợ giúp quyết định trong công tác đào tạo
ng KHOA (Trang 84)
Bảng SINHVIEN - Hệ thống trợ giúp quyết định trong công tác đào tạo
ng SINHVIEN (Trang 85)

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm