Mạng ngữ nghĩa làmột phương pháp biểu diễn tri thức đầu tiên và cũng là phương pháp dễ hiểu, để biểu diễnmột mạng ngữ nghĩa thì người ta dùng phương pháp đồ thị, trong đó đỉnh là các đối
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN
-o0o -BÀI TIỂU LUẬN MÔN HỌC BIỂU DIỄN TRI THỨC VÀ ỨNG DỤNG
MẠNG NGỮ NGHĨA VÀ BÀI TOÁN HÌNH HỌC PHẲNG
GIÁO VIÊN HƯỚNG DẪN:
PGS.TS ĐỖ VĂN NHƠN HỌC VIÊN: PHẠM XUÂN BÌNH MSHV: CH1301006
Trang 2TP HỒ CHÍ MINH - THÁNG 3, NĂM 2014
Mục lục
Trang 3I Mạng Ngữ Nghĩa
1. Khái niệm
Mạng ngữ nghĩa là một công cụ trực quan giúp chúng ta biểu diễn được các mối liên hệ giữacác tri thức tổng quát, khái niệm, các sự việc mà chúng có mối liên hệ Mạng ngữ nghĩa làmột phương pháp biểu diễn tri thức đầu tiên và cũng là phương pháp dễ hiểu, để biểu diễnmột mạng ngữ nghĩa thì người ta dùng phương pháp đồ thị, trong đó đỉnh là các đối tượng
(khái niệm, tri thức, sự việc) nào đó, còn các cung giữa các đỉnh nó thể hiện các mối liên hệ
giữa các đối tượng
Người ta có thể nới rộng mạng ngữ nghĩa bằng cách thêm các nút và nối chúng vào đồ thị, các nút mới ứng với các đối tượng bổ sung, thông thường có thể nới rộng mạng ngữ nghĩa theo ba cách:
- Thêm một đối tượng tương tự
- Thêm một đối tượng đặc biệt hơn
- Thêm một đối tượng tổng quát hơn
Do mạng ngữ nghĩa là một loại đồ thị cho nên ta có thể dùng những thuật toán của đồ thị trên mạng ngữ nghĩa như thuật toán tìm liên thông, tìm đường đi ngắn nhất,… để thực hiện các cơ chế suy luận Điểm đặc biệt của mạng ngữ nghĩa so với đồ thị thông thường chính là
Trang 4việc gán một ý nghĩa(có, làm, là, biết, ) cho các cung Cung nối giữa hai đỉnh cho biết giữa
hai khái niệm tương ứng có sự liên hệ như thế nào Việc gán ngữ nghĩa vào các cung của đồ thị đã giúp giảm bớt được số lượng đồ thị cần phải dùng để biễu diễn các mối liên hệ giữa các khái niệm Chẳng hạn như trong ví dụ trên, nếu sử dụng đồ thị thông thường, ta phải
dùng đến 4 loại đồ thị cho 4 mối liên hệ : một đồ thị để biểu diễn mối liên hệ "là", một đồ thị cho mối liên hệ "làm", một cho "biết" và một cho "có".
Tính chất quan trọng của mạng ngữ nghĩa là tính kế thừa, nó cho phép các nút được bổ sung
sẽ nhận các thông tin của các nút đã có trước, và cho phép mã hóa tri thức một cách dễ dàng
Trong mạng ngữ nghĩa trên ta có thể thấy được các mối quan hệ như sau:
- Hình vuông là hình chữ nhật + là tứ giác + có 4 góc Từ đó ta có thể suy luận được là hìnhvuông có 4 góc
- Hình chữ nhật là hình bình hành + hình bình hành có hai cặp cạnh bằng nhau Từ đó có thể suy ra hình chữ nhật có hai cặp cạnh bằng nhau
Dù không có đường liên hệ trực tiếp từ đối tượng “Hình vuông” đến đối tượng “4 góc” nhưng thông qua tính chất kế thừa ta có thể xác định được là đối tượng “Hìnhvuông” có liên
hệ “có” với đối tượng “4 góc”
Trang 5Tương tự với trường hợp của đối tượng “Hình chữ nhật” và đối tượng “Hai cặp cạnh bằng nhau”.
2. Giải thuật lan truyền trên mạng ngữ nghĩa
Cơ chế suy diễn áp dụng trong mạng ngữ nghĩa là thực hiện theo thuật toán lan truyền đơn giản theo hai bước sau:
• Kích hoạt các đỉnh đã cho ban đầu (các đỉnh đã có giá trị)
• Nếu một đỉnh chưa xác định nối với n đỉnh khác (thông qua những mối liên hệ) Và trong đó có n-1 đỉnh đã xác định thì đỉnh đó cũng được xác định Lặp lại bước này cho đến khi xác định được tất cả các đỉnh
Lan truyền kích hoạt (spreading activation) là một phương pháp để tìm kiếm các mạng lưới liên kết, các mạng thần kinh (neural networks) hoặc mạng ngữ nghĩa (semantic networks),
quá trình tìm kiếm được bắt đầu bằng cách ghi nhãn một tập hợp các nút nguồn với kíchhoạt (activation) và sau đó lặp đi lặp lại các lan truyền (spreading) tiếp tục kích hoạt các núttiếp theo liên quan đến nút nguồn Trong kích hoạt lan truyền các nút đã được kích hoạt vàcác nút chưa kích hoạt được lưu lại để phục vụ cho việc tìm nút lan truyền tiếp theo hợp lýhơn
Lan truyền kích hoạt được ứng dụng trong truy suất thông tin, bằng việc sử dụng ngữ nghĩacủa một mạng lưới đại diện cho các nút tài liệu và các từ ngữ có trong văn bản đó
Cho một đồ thị có hướng được thể hiện bởi mảng node [1 n], mỗi kích hoạt liên quan đến giá trị A[i] là một số thực nằm trong khoảng [0.0 1.0], link[i, j] sẽ kết nỗi với nguồn node[i] với mục tiêu là node[j] Mỗi liên kết có một trọng số là w[i, j] thường là một số thực nằm trong dãy [0.0 1.0]
Các tham số:
• Ngưỡng kích hoạt F là một số thực nằm trong khoảng [0.0 1.0]
• Yếu tố suy biến D (Decay factor) là một số thực nằm trong khoảng [0.0, , 1.0]
Các bước thực hiện thuật toán:
Trang 6• Khởi tạo đồ thị, cài đặt tất cả các kích hoạt giá trị A[i] = 0, thiết lập một hoặc thêm các nút gốc để kích hoạt một giá trị ban đầu lớn hơn ngưỡng F Giá trị khởi tạo thông thường là 1.
• Đối với mỗi node[i] chưa được kích hoạt trong đồ thị có một kích hoạt A[i] lớn hơn giá trị node ngưỡng kích hoạt F
• Đối với mỗi Link[i, j] kết nối node[i] với mục tiêu node[j] , điều chỉnh:
o A [j] = A [j] + (A [i] * W [i, j] * D) trong đó D là yếu tố suy biến
• Nếu một nút nhận được một mục tiêu điều chỉnh giá trị kích hoạt của nó sẽ vượt quá1.0, sau đó đặt giá trị kích hoạt mới của nó là 1.0 Tương tự như vậy, duy trì 0.0 như một giá trị ràng buộc kích hoạt thấp hơn, các nút mục tiêu của nó sẽ nhận được giá trị điều chỉnh xuống dưới 0.0
• Khi một nút đã kích hoạt nó có thể kích hoạt lại một lần nữa, mặc dù các biến thể củathuật toán cơ bản cho phép bỏ qua việc lặp đi lặp lại và vòng qua đồ thị
• Các nút nhận được giá trị kích hoạt mới có vượt quá ngưỡng kích hoạt F được đánh dấu để kích hoạt vào chu trình kích hoạt tiếp theo
• Nếu kích hoạt bắt nguồn từ nhiều hơn một nút, một biến của thuật toán sẽ cho phépđánh dấu các kích hoạt đã đi qua để phân biệt với các con đường chưa được kích hoạt trên đồ thị
• Thủ tục chấm dứt khi một trong hai không có thêm các nút để kích hoạt trong trườnghợp các dấu hiệu chuyển từ nhiều nguồn gốc, khi có nhiều hơn một con đường xuất phát từ một nút Các biến sử dụng trong thuật toán cho phép lặp đi, lặp lại hoặc sa thải nút hoặc dòng kích hoạt trong đồ thị, chấm dứt sau khi một trạng thái kích hoạt
ổn định, đối với một số trường, được đạt tới, hoặc số lần lặp vượt quá mức tối đa
3. Ưu nhược điểm
Ưu điểm:
• Mạng ngữ nghĩa rất linh động, có thể thêm vào mạng các đỉnh hoặc cung mới để bổ sung các tri thức cần thiết
Trang 7• Mạng ngữ nghĩa có tính trực quan cao nên rất dễ hiểu
• Mạng ngữ nghĩa cho phép các đỉnh có thể kế thừa các tính chất từ các đỉnh khác thông qua các cung loại “là’ từ đó có thể tạo ra các liên kết “ngầm” giữa những đỉnh không có liên kết trực tiếp với nhau
• Mạng ngữ nghĩa hoạt động khá tự nhiên theo cách thức con người ghi nhận thông tin
Nhược điểm:
• Vẫn chưa có một chuẩn nào quy định các giới hạn cho các đỉnh và cung của mạng Điều đó đồng nghĩa với người dùng có thể gắn bất kỳ khái niệm nào cho đỉnh hoặc cung
• Tính thừa kế trong mạng có thể dẫn đến khả năng mâu thuẩn tri thức
Tuy mạng ngữ nghĩa là một kiểu biểu diễn trực quan đối với con người nhưng khi đưa vào máy tính, các đối tượng và mối liên hệ giữa chúng thường được biểu diễn dưới dạng những phát biểu động từ (như vị từ) Hơn nữa, các thao tác tìm kiếm trên mạng ngữ nghĩa thường khó khăn (đặc biệt đối với những mạng có kích thước lớn) Do đó, mô hình mạng ngữ nghĩa được dùng chủ yếu để phân tích vấn đề
1. Bài toán về tam giác
a) Sơ lược
Có 22 yếu tố liên quan đến cạnh và góc của tam giác Để xác định một tam giác thì ta phải có
3 yếu tố Trong đó phải có yếu tố cạnh Như vậy có khoảng vài ngàn cách để xây dựng hay xác định một tam giác Theo thống kê thì có khoảng trên 200 công thức liên quan đến cạnh
và góc của tam giác
Để giải bài toán này bằng mạng ngữ nghĩa, ta phải sử dụng khoảng 200 đỉnh để chứa công thức và khoảng 22 đỉnh để chứa các yếu tố của tam giác Mạng ngữ nghĩa cho bài toán này
có cấu trúc như sau:
Trang 8Đỉnh của đồ thị bao gồm 2 loại:
- Đỉnh chứ công thức (ký hiệu bằng hình chữ nhật)
- Đỉnh chứa các yếu tố tam giác (ký hiệu bằng hình tròn)
Cung: chỉ nối từ đỉnh hình tròn đến đỉnh hình chữ nhật cho biết yếu tố tam giác xuất hiện trong công thức nào(không có trường hợp cung nối giữa hai đỉnh hình tròn hay nối giữa 2 đỉnh hình chữ nhật)
* Lưu ý : trong một công thức liên hệ giữa n yếu tố của tam giác, ta giả định rằng nếu đã biếtgiá trị của n-1 yếu tố thì sẽ tính được giá trị của yếu tố còn lại Chẳng hạn như trong công thức tổng 3 góc của tam giác bằng 1800thì khi biết được hai góc, ta sẽ tính được góc còn lại
b) Cơ chế thực hiện
Cơ chế suy diễn thực hiện theo thuật toán "lan truyền" được mô tả đơn giản như sau:
Bước 1: Kích hoạt những đỉnh hình tròn đã cho ban đầu (những yếu tố đã có giá trị)
Bước 2: Lặp lại bước sau cho đến khi kích hoạt được tất cả những đỉnh ứng với những yếu
tố cần tính hoặc không thể kích hoạt được bất kỳ đỉnh nào nữa
Trang 9Nếu một đỉnh hình chữ nhật có cung nối với n đỉnh hình tròn mà n-1 đỉnh hình tròn đãđược
kích hoạt thì kích hoạt đỉnh hình tròn còn lại (và tính giá trị đỉnh còn lại này thông qua công
thức ở đỉnh hình chữ nhật).
Ví dụ cho hai góc α, β và chiều dài cạnh a của tam giác Tính chiều dài đường cao
hC, với mạng ngữ nghĩa đã cho trong hình trên, các bước thi hành của thuật toán nhưsau:
Bắt đầu: đỉnh α, β, acủa đồ thị được kích hoạt
- Công thức (1) được kích hoạt (vì α, β,a được kích hoạt) Từ công thức (1)
tính được cạnh b Đỉnh b được kích hoạt
- Công thức (4) được kích hoạt (vì α, β) Từ công thức (4) tính được góc δ
- Công thức (2) được kích hoạt (vì 3 đỉnh β,δ,b được kích hoạt) Từ công thức (2) tính được cạnh c Đỉnh c được kích hoạt.
- Công thức (3) được kích hoạt (vì 3 đỉnh a, b, c được kích hoạt) Từ công thức
(3) tính được diện tích S Đỉnh S được kích hoạt.
- Công thức (5) được kích hoạt (vì 2 đỉnh S, c được kích hoạt) Từ công thức (5)tính được hc Đỉnh hc được kích hoạt
Trang 10(a + b + c)
o Diện tích S =
12
a.ha =
12
b.hb =
12
c.hc
o Nửa chu vi P =
12
b
β = sin
c
δ
Chọn lọc thông tin:
Trong các thông tin đã cung cấp ở các bài toán trên ta có thể thấy một số thông tin thừa
không cần thiết như: 3 đường trung tuyến i a , ib , ic ở bài toán tam giác
Với các thông tin này hệ thống không bị mất đi độ chính xác nhưng sẽ làm cho tốc độ suy luận giảm đi Vậy nên cần được loại bỏ
Biểu diễn thông tin trên mạng ngữ nghĩa:
Trang 11Trong mạng ngữ nghĩa trên, các ô tròn biểu thị cho các đối tượng của bài toán và các ô vuông thể hiện mối quan hệ giữa các đối tượng.
2. Bài toán hình thang
Xác định thông tin:
Xét hình thang ABCD
Trang 12Ta xác định được các thông tin như bên dưới:
Trang 13Chiều dài cạnh b =
h sinδ
Chiều dài cạnh d =
h sinγ
Góc γ = arsin(
h d
)Góc γ = 2π – (α + β + δ )
Góc δ = arsin(
h b
)Góc δ = 2π – (α + β + γ )
Diện tích S = a.h +
12
h
2 2
b −h
Trang 14Chu vi C = a + b + c + d
Chọn lọc thông tin:
Trong mô tả bên ở trên ta có thể thấy các thông tin về cạnh c1 và c2 là dư thừa, vì chúng không cần thiết trong việc tính toán các giá trị còn lại
Thông tin về hai cạnh song song, không giúp ta trong việc tính toán
Những thông tin này có thể lượt bỏ trong sơ đồ mạng ngữ nghĩa cho bài toán hình thangnày
Biểu diễn thông tin trên mạng ngữ nghĩa:
Trang 153. Một số trường hợp khác
a) Tam giác cân
Tam giác cân (không làm mất tính tổng quát, ta giả sử cân tại A) là một tam giác có các tính
Trang 16f29 : pa =
p.(p a)−
f32 : R =
a.b4.S2
f36 : 4.R = ra + 2.rb - r
b) Tam giác vuông
Không làm mất tính tổng quát, ta giả sử tam giác vuông có cạnh huyền là a Như thế, ngoài
những hệ thức đã biết trong tam giác nói chung ta còn có :
Trang 17f28 : 4.mc2 = c2 + 4.b2
c) Tam giác vuông cân
Tam giác vuông cân (với cạnh đáy tam giác cân là a) là một tam giác có :
g1 : b = c,
g2 : α = π/2
Ngoài ra một số (nhóm) quan hệ trong tam giác có thể được thay thế bởi nhóm quan
hệ khác có hiệu quả hơn trong việc sử dụng
Các quan hệ từ f1 đến f10 được thay thế bởi các quan hệ sau :
Trang 18d) Tam giác đều
Tam giác đều là một tam giác có :
f5 : p =
3a2
Trang 20e) Tứ giác lồi
Về mặt tính toán, chúng ta có thể xem tứ giác là một mạng tính toán (hay một đối tượng tínhtoán) bao gồm các biến ghi nhận giá trị của các yếu tố trong tam giác, và các quan hệ là các công thức thể hiện mối liên hệ tính toán giữa các yếu tố đó
Tập các biến thường được xem xét trong tứ giác gồm :
- a, b, c, d : 3 cạnh của tam giác
- A, B, C, D : 4 góc trong của tứ giác
- AC, BD : 2 đường chéo của tứ giác
- S : diện tích tứ giác
- p : chu vi của tứ giác
- R : bán kính đường tròn ngoại tiếp tứ giác (nếu có)
- r : bán kính đường tròn nội tiếp tứ giác (nếu có)
Các hệ thức cơ bản giữa các yếu tố của tứ giác :
f1 : A + B + C + D = 2π
f2 : p = a+b+c+d
f3 : 2.S = a.d.sinA + b.c.sinC
f4 : 2.S = a.b.sinB + c.d.sinD
Trang 21O2.ma = O1.AC / 2// trung tuyến tam giác ABD = nửa đường chéo AC
O3.ma = O1.AC / 2// trung tuyến tam giác CBD = nửa đường chéo AC
O4.ma = O1.BD / 2// trung tuyến tam giác BAC = nửa đường chéo BD
O5.ma = O1.BD / 2// trung tuyến tam giác DAC = nửa đường chéo BD
Trang 23Ngoài ra, 4 tam giác liên kết với hình thoi đều là tam giác cân và ta cũng có các quan hệ tương tự như đối hình bình hành :
O2.ma = O1.AC / 2// trung tuyến tam giác ABD = nửa đường chéo AC
O3.ma = O1.AC / 2// trung tuyến tam giác CBD = nửa đường chéo AC
O4.ma = O1.BD / 2// trung tuyến tam giác BAC = nửa đường chéo BD
O5.ma = O1.BD / 2// trung tuyến tam giác DAC = nửa đường chéo BD
Hình thoi còn có một vòng tròn nội tiếp và một đường cao Gọi bán kính vòng tròn nội tiếp là
r, đường cao là h, ta có các hệ thức :
f15 : h = 2.r
f16 : S = a.h
Giao diện Demo
Áp dụng mạng ngữ nghĩa trên tam giác
Trang 24Tài liệu tham khảo
[1] PGS.TS Đỗ Văn Nhơn, Tài liệu giảng dạy chuyên đề Biễu diễn tri thức và ứng dụng, 2001-2011 [2] PGS.TS Đỗ Văn Nhơn, Model for Knowledge Bases of Computational Objects, 2010
[3] PGS.TS Đỗ Văn Nhơn, Computational Networks for KnowledgeRepresentation, 2009.
[4] [4] Nguyễn Thanh Thủy Trí tuệ nhân tao các phương pháp giải quyết vấn đề và kỹ thuật xử lý
tri thức Nhà xuất bản khoa học và kỹ thuật, 1999.
[5] [5] GS TSKH Hoàng Kiếm, TS Đỗ Phúc, TS Đỗ Văn Nhơn Giáo trình các hệ cơ sở tri thức Nhà
xuất bản Đại Học Quốc Gia TP Hồ Chí Minh, 2009.
[6] [6] GS.TSKH Hoàng Kiếm, Ths Đinh Nguyễn Anh Dũng Giáo trình Trí Tuệ Nhân Tạo Đại học công
nghệ thông tin, 2007.