CÁC KHÁI NIỆM CƠ BẢN1.1 Hệ thống thông tin và tập thô 1.1.1 Hệ thống thông tin Một tập dữ liệu có thể biểu diễn dưới dạng một bảng, trên đó mỗi hàng biểu diễnthông tin ứng với một đối t
Trang 1BÀI THU HOẠCH
TOÁN
Trang 2
Trang 3
Nhóm em xin chân thành cảm ơn thầy TS.Dương Tôn Đảm đã truyền đạt kiến thức cũng như giới thiệu các tài liệu quí báu và tạo điều kiện thuận lợi để cho nhóm em thực hiện xong bài thu hoạch này.
Nhóm học viên CH-08
Trang 4Lý thuyết tập thô đã chứng minh được tiềm năng lớn trong suy diễn, do đó
Bài thu hoạch này, nhóm em thực hiện thuật toán tìm tập rút gọn của một bảngquyết định từ đó chọn được các thuộc tính cần thiết đưa vào xây dựng cấu trúc cây quyếtđịnh để chọn thuộc tính phân nhánh tối ưu, làm cho cây có chiều cao nhỏ nhất
Trang 5LỜI CẢM ƠN 3
LỜI MỞ ĐẦU 4
Chương 1 7
CÁC KHÁI NIỆM CƠ BẢN 7
1.1 Hệ thống thông tin và tập thô 7
1.1.1 Hệ thống thông tin 7
1.1.2 Quan hệ không phân biệt được 7
1.1.3 Tập thô 9
1.1.4 Các tính chất của xấp xỉ 10
1.1.5 Độ chính xác của xấp xỉ 11
1.1.6 Bảng quyết định 12
1.1.7 Rút gọn và nhân 13
1.1.8 Ma trận phân biệt được và hàm phân biệt được 13
1.1.9 Luật quyết định 14
1.1.10 Phụ thuộc độ k 14
Chương 2 16
PHỦ TẬP THÔ 16
2.1 Tính chất của xấp xỉ phủ loại 1, 2, 3 17
2.1.1 Xấp xỉ phủ tập thô loại 1 17
2.1.2 Xấp xỉ phủ tập thô loại 2 18
2.1.3 Xấp xỉ phủ tập thô loại 3 19
2.2 Mối quan hệ giữa ba loại phủ tập thô 21
2.3 Một số tính chất về xấp xỉ phủ loại 2 21
2.4 Tính chất ánh xạ đóng của ba phép xấp xỉ trên dựa vào phủ 22
2.4.1 Tính chất ánh xạ đóng của ba phép xấp xỉ phủ trên ứng với phủ đơn vị
22 2.4.2 Tính chất ánh xạ đóng của ba phép xấp xỉ phủ trên ứng với phủ tựa điểm22 2.5 Mối quan hệ giữa các phép xấp xỉ phủ dựa vào không gian topo 23
2.5.1 Quan hệ hai ngôi và không gian topo 23
Trang 62.5.2 Mối quan hệ giữa các xấp xỉ dựa vào không gian topo 25
2.6 Rút gọn tập thuộc tính dựa vào họ phủ tập thô 28
2.6.1 Một số khái niệm và kết quả cơ sở 30
2.6.2 Rút gọn tập thuộc tính các hệ thống quyết định nhất quán và không nhất quán 31
2.6.3 Một số kết quả liên quan giữa họ phủ và phủ suy dẫn 32
2.7 Thuật toán FC_Reduct rút gọn tập thuộc tính dựa vào họ phủ tập thô 33
2.7.1 Thuật toán FC_Reduct rút gọn thuộc tính của họ quyết định phủ tập thô 35
2.7.2 Đánh giá độ phức tạp thuật toán FC_Reduct 36
Chương 3 41
ỨNG DỤNG 41
3.1 ỨNG DỤNG TÌM LUẬT SUY DIỄN TĂNG GIẢM CHỈ SỐ VN-INDEX 41
3.1.1 Công cụ triển khai 41
3.1.2 VN-Index là gì? 41
3.1.3 Giới thiệu ứng dụng 42
3.1.4 Bảng quyết định thử nghiệm 42
3.1.5 Kết quả thử nghiệm 45
3.1.6 Kiểm chứng 48
3.1.7 Kết luận 50
3.2 ỨNG DỤNG HỖ TRỎ RA QUYẾT ĐỊNH BẰNG CÂY QUYẾT ĐỊNH 50
3.2.1 Giới thiệu 50
3.2.2 Mục tiêu 50
3.2.3 Phương pháp 51
3.2.4 Kết quả 53
3.2.5 Kết luận 55
TÀI LIỆU THAM KHẢO 57
Trang 7CÁC KHÁI NIỆM CƠ BẢN
1.1 Hệ thống thông tin và tập thô
1.1.1 Hệ thống thông tin
Một tập dữ liệu có thể biểu diễn dưới dạng một bảng, trên đó mỗi hàng biểu diễnthông tin ứng với một đối tượng, mỗi cột biểu diễn một thuộc tính có thể đo được
của mỗi đối tượng (do các chuyên gia hay người sử dụng cung cấp) Bảng này
được gọi là một hệ thống thông tin Hình thức hơn, hệ thống thông tin là một cặp S
= (U, A), U là một tập hữu hạn khác rỗng các đối tượng gọi là tập vũ trụ hay là tập phổ dụng, A là một tập hữu hạn khác rỗng các thuộc tính Với mỗi u U và aA,
ta ký hiệu u(a) là giá trị của đối tượng u tại thuộc tính a Nếu gọi I a là tập tất cả giá
trị của thuộc tính a, thì u(a) I a với mọi uU Bây giờ, nếu B = {b 1 , b 2 , ,b k}
A, ta ký hiệu bộ các giá trị u(b i ) bởi u(B) Như vậy, nếu u và v là hai đối tượng, thì ta sẽ viết u(B) = v(B) nếu u(b i ) = v(b i ), với mọi i =1, 2, , k.
1.1.2 Quan hệ không phân biệt được
Xét hệ thống thông tin S = (U, A), với mỗi tập thuộc tính B A tạo ra một quan
hệ hai ngôi trên U, ký hiệu IND(B)
IND(B) = {(u,v) U U | u(a) v(a),a B}
IND(B) được gọi là quan hệ B_không phân biệt được Dễ kiểm chứng đây là mộtquan hệ tương đương trên U Với mọi đối tượng uU, lớp tương đương của utrong quan hệ IND(B) được kí hiệu bởi [u]B Tập thương xác định bởi quan hệIND(B) được ký hiệu U/IND(B) hay U/B, tức là U/IND(B) = U/B = {[u]B |uU}
Trang 8Ví dụ 1.1 Xét hệ thống thông tin cho ở bảng 1.1
Bảng 1.1 Bảng dữ liệu bệnh cúm
Trong đó: U = {x1, x2, x3, x4, x5, x6}
A = {Đau đầu, Đau cơ, Nhiệt độ, Cúm}.
Trong bảng, các bệnh nhân x 2 , x 3 và x 5 không phân biệt được đối với thuộc tính
Đau đầu, bệnh nhân x 3 và x 6 không phân biệt được đối với thuộc tính Đau cơ,
Cúm và bệnh nhân x 2 , x 5 không phân biệt được đối với thuộc tính Đau đầu, Đau
IND({Đau đầu, Đau cơ}) = {{x 1 , x 4 , x 6 }, {x 2 , x 5 }, {x 3}}
Xét hệ thống thông tin S= (U, A), một quan hệ bộ phận p xác định trên họ {U/B| B
A} được định nghĩa:
nếu và chỉ nếu P U / P,Q i j U / Q : P Q i j Khi đó ta nói Q là
Trang 9Lý thuyết tập thô (Rough set) được đề xuất vào năm 1982 bởi Z.Pawlak Lýthuyết này xây dựng phương pháp luận liên quan đến sự phân loại và phântích không chắc chắn, thông tin và tri thức không đầy đủ và được coi là một trongnhững phương pháp tiếp cận đầu tiên không dựa trên thống kê trong phân tích dữliệu.Khái niệm cơ bản của lý thuyết tập thô là xấp xỉ dưới và trên của một tập, sựxấp xỉ của không gian là hình thức phân loại tri thức liên quan đến miền quantâm.
Tập con được tạo ra bởi xấp xỉ dưới mô tả bởi các đối tượng là những thànhphần chắc chắn của một tập, trong khi xấp xỉ trên được đặc trưng bởi các đốitượng có khả năng thuộc tập quan tâm Mỗi tập con xác định thông qua xấp xỉdưới và xấp xỉ trên được gọi là tập thô
Gần đây, lý thuyết tập thô trở thành một công cụ đánh giá trong xử lý các vấn đềkhác nhau như trình bày tri thức không chắc chắn hoặc không chính xác, phântích tri thức, đánh giá chất lượng và tính khả dụng của thông tin đối với tính nhấtquán và sự có mặt các mẫu không theo thời gian, nhận dạng và đánh giá sự phụthuộc thời gian, suy luận dựa trên sự không chắc chắn và thiếu thông tin dữ liệu.Trong lý thuyết tập thô, để biểu diễn một tập hợp bằng tri thức được cho xácđịnh bởi một tập thuộc tính, người ta định nghĩa hai phép xấp xỉ:
Cho một hệ thống thông tin S= (U, A), với mỗi tập con X U và B A, ký hiệu
R = IND(B), ta có 2 tập con sau:
R(X), R(X)lần lượt gọi là R-xấp xỉ dưới và R- xấp xỉ trên của tập X
Tập R(X) bao gồm tất cả các phần tử của U chắc chắn thuộc vào X
Tập R(X) bao gồm các phần tử của U có khả năng được phân loại vào những phần tửthuộc X ứng với quan hệ R
Từ hai tập xấp xỉ người ta định nghĩa các tập:
Trang 10Ký hiệu tập thương của IND(B) trên U là U/B, các xấp xỉ trên và dưới của X có
thể viết lại:
Trong trường hợp BN B (X) , X được gọi là tập thô,
ngược lại X được gọi là tập rõ.
Hình 1.1 Minh họa tập thô
Đối với một hệ thống thông tin S = (U, A), B, D A, ký hiệu R = IND(B), người ta gọi B-miền khẳng định dương của D là tập được xác định như sau:
Rõ ràng POS B (D) là tập tất cả các đối tượng u sao cho với mọi v U
mà u(B) v(B) ta đều có u(D) v(D)
Nói cách khác, POS B (D) {u U | u B u D}
1.1.4 Các tính chất của xấp xỉ
Định lý 1.1 [34] Cho một hệ thống thông tin S = (U, A), X, Y U và B A, đặt R = IND(B) Khi đó:
Trang 11Tính chất (3L), (4L) và (8L) là những tính chất đặc trưng cho phép xấp xỉ dưới,điều đó có nghĩa là những tính chất khác của phép xấp xỉ dưới có thể suy dẫn từ
ba tính chất này Tương tự, (3H), (4H) và (8H) là những tính chất đặc trưng củaphép xấp xỉ trên
1.1.5 Độ chính xác của xấp xỉ
Cho một hệ thống thông tin S = (U, A), với mỗi tập con X U và B A, đặt R = IND(B), đại lượng đo sự chính xác của tập xấp xỉ X đối với phân hoạch trên B là
giá trị :
Trang 12Trong đó card(X) = |X| là lực lượng (số phần tử) của tập X Rõ ràng 0
R (X ) 1 Nếu R (X ) 1, ta nói X là chính xác đối với R, còn R (X )
1, X được gọi là thô đối với R.
1.1.6 Bảng quyết định
Bảng quyết định là một hệ thống thông tin có dạng T= (U, A), trong đó tập thuộc tính A được chia thành hai tập thuộc tính rời nhau C và D, C được gọi là tập thuộc tính điều kiện, còn D là tập thuộc tính quyết định.
Tức là T = (U, CD), với CD = Trong trường hợp không sợ bị nhầm lẫn
người ta còn ký hiệu T= (U,C, D).
Ví dụ 1.2 Hệ thống thông tin S = (U, A) biểu diễn cơ sở tri thức về bệnh cúm
được thể hiện trong bảng 1.1 là một bảng quyết định T = (U, CD)
Trong đó: U = {x 1 , x 2 , x 3 , x 4 , x 5 , x 6}
A = {Đau đầu, Đau cơ, Nhiệt độ, Cúm}.
Tập thuộc tính điều kiện C = {Đau đầu, Đau cơ, Nhiệt độ}
Bảng 1.2 Bảng quyết định
Cho một bảng quyết định T = (U, CD), giả sử U/C = {X 1 , X 2 , , X m } và U/D = {Y 1 , Y 2 , , Y n } Một lớp X i U/C được gọi là nhất quán nếu u(d) = v(d), u,vX i,
Trang 13Một bảng quyết định T = (U, CD) là nhất quán nếu mọi lớp X i U/C là nhất
quán, ngược lại T được gọi là không nhất quán Dễ thấy nếu U/C U/D thì T =
(U,CD) là nhất quán.
Tương tự, nếu U/D U/C, thì Tlà nhất quán ngược
Có thể thấy bảng quyết định là nhất quán khi và chỉ khi POS C (D) = U.
Trong trường hợp bảng không nhất quán thì POS C (D) chính là tập con cực đại của
Ở đây, RED(C) là tập hợp tất cả rút gọn của C.
Ngoài ra, người ta cũng định nghĩa rút gọn C-miền khẳng định dương của D:
Nếu B C thỏa:
1.POS B (D)POS C (D)
POS C{a} (D)
B được gọi là rút gọn C-miền khẳng định dương của D.
1.1.8 Ma trận phân biệt được và hàm phân biệt được
Xét bảng quyết định T = (U, CD), với U = {u 1 , u 2 , , u n} Ma trận phân biệtđược của T ký hiệu M(T) = (mij)nn là một ma trận đối xứng, trong đó mỗi phần tửcủa nó là một tập thuộc tính được xác định như sau :
Trang 14Hàm phân biệt được fΤ là một hàm boole, được xác định từ ma trận phânbiệt M(T) như sau:
trong đó, mỗi thuộc tính được đặt tương ứng một biến logic cùng tên và
1.1.9 Luật quyết định
Cho T= (U, CD) là một bảng quyết định, giả sử U/C = {X 1 , X 2 , , X m } và U/D = {Y 1 , Y 2 , , Y n } Nếu X i Y j ≠, ký hiệu des(X i ), des(Y j) lần lượt là các mô tả của các
lớp tương đương ứng với X i , Y j Một luật quyết định xác định bởi X i , Y j có dạng:
Độ đo độ chắc chắn và độ hỗ trợ của luật quyết định Z ij được định nghĩa nhưsau:
Ở đây |.| là bản số hay lực lượng của một tập hợp Rõ ràng giá trị của (Z ij ),s(Z ij ) luật quyết định Z ij rơi vào đoạn [ 1
|U|,1].Để thuận tiện trong trình bày kýhiệu ta thay |Z xy| bằng |X i ∩Y j|
1.1.10 Phụ thuộc độ k
Cho hệ thống thông tin S = (U, A), X, Y A Chúng ta nói rằng tập thuộc tính Y
phụ thuộc độ k[0,1] vào tập thuộc tính X, ký hiệu X k → Y , với k được xác địnhnhư sau:
Trang 15Khi X 0 → Y, chúng ta viết và X 1 → Y được viết X❑→ Y.
Dễ thấy rằng phụ thuộc độ k là sự tổng quát hóa của phụ thuộc hàm và
X 1
→ Y là phụ thuộc hàm đã biết trong CSDL quan hệ
Trang 16Chương 2
PHỦ TẬP THÔChương này nhóm em tìm hiểu sự mở rộng tập thô theo hướng thay đổi phânhoạch bởi phủ Phương pháp tiếp cận là khảo sát tính chất toán học của các phép xấp xỉứng với ba loại phủ do W Zhu và F.Y Wang đề xuất [37, 38, 40] và các phép xấp xỉdựa vào phủ được tiếp cận bằng công cụ toán học là không gian topo của một số tác giảkhác [6, 18, 39, 44] để chỉ ra mối quan hệ giữa các phép xấp xỉ Cuối chương, bài thuhoạch sẽ trình bày thuật toán rút gọn tập thuộc tính dựa vào họ phủ tập thô FC_Reduct vàứng dụng
Trong các bài báo công bố kết quả nghiên cứu của mình [37, 38], W Zhu vàF.YWang đã đưa ra hệ tiên đề cho phép xấp xỉ phủ dưới và khẳng định tính mở của bài
toán tìm tính chất đặc trưng của các phép xấp xỉ phủ trên (loại 1, 2, 3) Kế thừa, phát
triển những kết quả này, luận án đóng góp một số điều kiện để hai phủ sinh cùng xácđịnh một phép xấp xỉ phủ loại 2 Tính chất ánh xạ đóng của các phép xấp xỉ phủ loại 1,
2, 3 cũng được khảo sát nhằm có thể sử dụng các kết quả ứng dụng của ánh xạ đóng vàocác tập cơ sở dữ liệu
Trang 172.1 Tính chất của xấp xỉ phủ loại 1, 2, 3
2.1.1 Xấp xỉ phủ tập thô loại 1
a Sự phụ thuộc xấp xỉ dưới và xấp xỉ trên loại 1
W Zhu và F.Y Wang [38] đã chỉ ra mối quan hệ giữa xấp xỉ phủ dưới và xấp xỉphủ trên loại 1 thông qua các định lý
Định lý 2.1 [38] Cho C1 và C2 là hai phủ của U, C1 và C2 sinh ra cùng phép
xấp xỉ phủ dưới (loại 1, 2, 3) nếu và chỉ nếu reduct(C1) = reduct(C2).
Định lý 2.2 [38] Cho C1 và C2 là hai phủ của U, C1 và C2 sinh ra cùng phép
xấp xỉ phủ trên loại 1 nếu và chỉ nếu reduct(C1) = reduct(C2).
Định lý 2.3 [38] Cho C1, C2 là hai phủ của U, C1 và C2 sinh ra cùng phép xấp
xỉ phủ dưới loại 1 khi và chỉ khi chúng cùng sinh ra xấp xỉ phủ trên loại 1
b Tiên đề cho phép xấp xỉ phủ dưới
Định lý 2.4 [37, 40] Cho U là một tập khác rỗng Nếu tồn tại 1 phép toán L:
thì tồn tại một phủ C của U mà phép xấp xỉ phủ dưới CL được sinh bởi C là L.
Hơn thế, bốn tính chất trên của phép xấp xỉ phủ dưới là độc lập ((1L)-(7L) là ký hiệu thứ tự các tính chất của phép xấp xỉ phủ dưới được viết ở 1.1.4).
c Tiên đề cho phép xấp xỉ phủ trên loại 1
Trang 18Các tính chất (1L) đến (9H) trong 1.1.4 là cơ bản và đầy đủ cho các phép xấp xỉdưới, phép xấp xỉ trên trong tập thô cổ điển Định lý 2.4 chỉ ra rằng các tính chất(1L), (2L), (3L), (7L) cũng là đầy đủ đối với các phép toán xấp xỉ phủ dưới.Tuy nhiên, các tính chất (1H), (2H), (3H) và (5H) chưa đủ để đặc trưng cho cácphép xấp xỉ trên loại 1 Điều này có thể thấy được qua ví dụ
Ví dụ 2.1 [38, 40] Một phép toán H: P(U) P(U) thỏa các tính chất (1H),(2H), (3H)
và (5H) nhưng không tồn tại một phủ C của U mà H là một phép xấp xỉ phủ trên loại 1 sinh ra bởi C.
Cho U = {a, b, c} Định nghĩa H: P(U) P(U) như sau
Hiển nhiên H thỏa các tính chất (1H), (2H), (3H) và (5H), nhưng không tồn tại phủ C nào của U mà H là phép xấp xỉ phủ trên loại 1 sinh ra bởi C Thật vậy, nếu có thì phủ C
phải có 2 phần tử {a} và {b} Trong trường hợp này, FH({a,b}) = {a,b} ≠{a,b,c}=
H({a,b}) Do đó H không là phép xấp xỉ phủ trên loại 1 sinh ra bởi C.
Bài toán tìm hệ tiên đề cho xấp xỉ phủ trên loại 1 vẫn còn là bài toán mở.
Trang 202.1.3 Xấp xỉ phủ tập thô loại 3
a Sự phụ thuộc xấp xỉ phủ dưới và xấp xỉ phủ trên loại 3
Định lý 2.6 [38, 40] Cho C là phủ của U thì C và reduct(C) sinh ra cùng các phép
xấp xỉ phủ dưới và xấp xỉ phủ trên loại 3
Định lý 2.7 [38, 40] Cho C1, C2 là hai phủ của U, nếu reduct (C1) = reduct(C2), thì C1
và C2 sinh ra cùng xấp xỉ phủ trên loại 3.
Chú ý 2.1: Điều ngược lại định lý trên là không đúng, ta có phản ví dụ
Phản ví dụ 2.3 Cho U = {a, b, c}, K1 = {a, b}, K2 = {b, c}, K3 = {a, c}, K4={a, b,
c}, C1 = {K1, K2, K3} and C2 = {K4}
Nếu X = thì xấp xỉ phủ trên loại 3 sinh ra bởi hai phủ C1 và C2 đều là X# = {a ,b, c}, nhưng reduct(C1) = C1 reduct(C2) = C2
Định lý 2.8 [38, 40] Cho C1, C2 là các phủ của U, nếu C1 và C2 sinh ra cùng xấp xỉ
phủ dưới thì chúng cũng sinh ra cùng xấp xỉ phủ trên loại 3
b Tiên đề cho các phép xấp xỉ phủ trên loại 3
Cũng giống như phép phủ xấp xỉ trên loại 1 và loại 2 Phép phủ xấp xỉ trên loại 3 chưathể tiên đề hóa do nhiều tính chất đặc trưng của phép phủ xấp xỉ trên không thỏa
Phản ví dụ 2.4 [40] Một phép toán thỏa (1H), (2H), (3H), (4H), và (7H) nhưng
không là xấp xỉ phủ trên loại 3 Cho U = {a, b, c} Định nghĩa H: H: P(U) P(U)
như
sau: H() = , H({a}) = {a, b}, H({b}) = {b, c}, H({c}) = {c}, H({a, b}) = U, H({b, c}) = {b, c}, H({a, c}) = U, H(U) = U Hiển nhiên H thỏa (1H), (2H), (3H)
Trang 222.2 Mối quan hệ giữa ba loại phủ tập thô
Hệ quả 2.1 Cho C1, C2 là các phủ của U, C1 và C2 sinh ra cùng xấp xỉ dưới và
xấp xỉ trên phủ loại 2, nếu chúng thỏa các điều kiện sau
1 reduct(C1) = reduct(C2)
2 C1 và C2 là các phủ tựa điểm
Chứng minh: Kết quả được suy dẫn trực tiếp từ định lý 2.12 và 2.13.
Mệnh đề 2.1 Cho C là một phủ của U, C và reduct(C) chưa chắc sinh ra cùng xấp
xỉ trên loại 2 (ngay cả khi reduct(C) là một phân hoạch).
Chứng minh Tính chất trên có thể thấy qua phản ví dụ sau
Phản ví dụ 2.5 Cho U = {a, b, c}, K1 = {a}, K2 = {b}, K3 = {c}, K4 = {a, b, c}, C= {K1,
K2, K3, K4} Ta có reduct(C) = {K1,K2,K3} Nếu X = {c}, thì X C {a,b,c} X reduct(C) K3
Trang 232.4.1 Tính chất ánh xạ đóng của ba phép xấp xỉ phủ trên ứng với phủ
đơn vị
Mệnh đề 2.2 Cho C là một phủ của U, nếu C là (phủ) đơn vị thì FH sinh bởi C
Chứng minh Từ bảng tổng kết 2.1, nếu C là (phủ) đơn vị thì FH = TH Do
TH thỏa tính đồng biến, FH thỏa tính lũy đẳng (bảng 2.2), nên khi C là (phủ)
đơn vịFH thỏa tính đơn điệu và TH thỏa tính lũy đẳng Tuy nhiên, SH chưa
chắc thỏa tínhlũy đẳng nếu C là (phủ) đơn vị.
Mệnh đề 2.3 Cho C là một phủ của U Nếu C là phủ tựa điểm thì FH sinh bởi C
thỏa tính chất: X,Y U, X Y FH(X) FH(Y) (tính đồng biến)
Chứng minh Từ định nghĩa của phủ tựa điểm và FH Nếu C là một phủ tựa
điểm chúng ta có FH(X) = {Md(x)| x X} Dễ dàng thấy rằng
Trang 242.5 Mối quan hệ giữa các phép xấp xỉ phủ dựa vào không gian topo
Nhiều tác giả trên cơ sở lý thuyết không gian topo đã đề xuất các phép xấp xỉ dựa vào phủ Trong phần này, luận án trình bày một số điều kiện để các phép xấp xỉ dựa vào phủ do Y.Yao, W Zhu, và A.M Kozae và cộng sự đề xuất là đồng nhất.
2.5.1 Quan hệ hai ngôi và không gian topo
a Không gian topo được xây dựng từ một quan hệ hai ngôi
Giả sử R là một quan hệ hai ngôi tùy ý xác định trên U, cặp (U, R) được gọi
là một không gian xấp xỉ xác định bởi quan hệ hai ngôi R Ứng với R, có thể định nghĩa láng giềng trái, phải của một phần tử x thuộc U lần lượt như sau
lR(x) = {y | yU, yRx} và rR(x) = {y | yU, xRy}
Xây dựng topo 1 sử dụng R-láng giềng phải (tương tự, topo 2 sử dụng láng giềng trái), chúng ta xem họ S1 = {rR(x) | x U} là một tiền cơ sở của
R-topo 1 và ký hiệu S x = {G S1| x G} Topo 1 đượcgọi là cảm sinh từ quan
hệ hai ngôi R.
b Không gian topo được xây dựng từ một họ phủ
Một hệ thống thông tin S = (U, A), U là một tập hữu hạn khác rỗng các đối tượng, A là một tập hữu hạn khác rỗng các thuộc tính Với mỗi thuộc tính aA
xác địnhmột quan hệ hai ngôi R a trên UxU như sau
u,vU, u R a v khi và chỉ khi u(a)v(a) ≠ Với định nghĩa này, R a xác định một phủ Ca của U là một topo cảm sinh từ quan
hệ hai ngôi R a Với tất cả các thuộc tính thuộc A, chúng ta sẽ có một topo S
được sinh từ tiền cơ sở UaA S a Trong đó, S a là một tiền cơ sở của topo a
Nếu (U, S ) là một không gian topo được xây dựng từ một họ phủ {C a | a A} sinh ra từ tập các quan hệ {R a | a A} thì S đượcgọi là phủ được sản sinh từ
Trang 25c Khái niệm rút gọn không gian topo sản sinh từ một tập các quan hệ hai ngôi
Trong [34] khái niệm rút gọn không gian topo sản sinh từ một tập các quan
hệ hai ngôi được đề xuất:
Xét không gian topo (U, ) sinh ra từ tập các quan hệ hai ngôi RA, ký hiệu RA
là cơ sở của (U, ).
Cho RA là một lớp các quan hệ hai ngôi, P RA, rP, r được gọi là không cần thiết trong P nếu và chỉ nếu: P = (P-r) Tập M được gọi là một rút gọn của P, nếu và chỉ nếu (i) P =M, (ii) P-{r} M , rM
d Danh sách các phép xấp xỉ đã được các tác giả định nghĩa
Cho (U, C) là một không gian xấp xỉ phủ N(x) = {KC | xK} là một lân cận
của x Ký hiệu X C cho phần bù của X đối với U, có nghĩa là X C = U-X
(U, ) là một không gian topo sử dụng các R-láng giềng phải
Bài thu hoạch sẽ khảo sát các phép xấp xỉ sau
Trang 262.5.2 Mối quan hệ giữa các xấp xỉ dựa vào không gian topo
Mệnh đề 2.5 [13] Nếu R, R-1 là 2 quan hệ hai ngôi trên U được định nghĩa:
xRy nếu và chỉ nếu y N(x) và yR-1 x nếu và chỉ nếu xRy thì
(1) R thỏa tính phản xạ và bắc cầu
(2) CX ÒR X và CX ÑR X , XU
(3) Ngược lại, đối với mỗi quan hệ hai ngôi thỏa tính phản xạ và bắc
cầu R trên U thì tồn tại một không gian xấp xỉ phủ (U, C) thỏa
CX ÒR X và CX ÑR X , X U (4) X + = ÒR1 X , X U
(5) CX UxX l R (X ) và XUxX r (x), X U (6) Nếu CX với mọi XU, thì R là một quan hệ tương đương trên U, do đó CX là các phép xấp xỉ trên cổ điển Pawlak
Định lý 2.14 [13] Giả sử C là một phủ đơn vị của U, thì tồn tại R là quan hệ hai
ngôi có tính phản xạ và bắc cầu trên U thỏa Md(x) = {r R (x)}, ở đây r R (x) là R-láng giềng phải của phần tử xU Ngược lại, nếu R là một quan hệ hai ngôi có tính phản
xạ và tínhbắc cầu trên U, thì C = {r R (x)| xU} là một phủ đơn vị của U và
Md(x) = {r R (x)},xU.
Bây giờ xét hai tập con đáng chú ý của P(U):
G= { X | XP(U), ÒR X } và H= {XP(U) | YP(U), X
Mệnh đề 2.6 Nếu R có tính bắc cầu thì
1 ÒR X có tính lũy
R
Trang 27Chứng minh (1) Nếu R có tính bắc cầu, với mọi X U, ta có:
x U : x ÒR X r (x) X y : y r (x) y X
ra, ta còn có một số kết quả sau
Mệnh đề 2.7 Cho (U, ) là một không gian topo cảm sinh bởi quan hệ hai ngôiR Nếu R là một quan hệ hai ngôi có tính phản xạ thì hai phép xấp xỉ Yao (3) và Yao
Mệnh đề 2.8 Cho (U, S) là một không gian topo được xây dựng như trong 2.5.1
b Xét một phủ đặc biệt của U là C =S , chúng ta có X + = X , X U.
Chứng minh Dễ dàng thấy rằng mọi KC, C = S , nên K là mở Kết hợp với định
R
R
R
Trang 28nghĩa của X +, X , ta có điều phải chứng minh.
Hệ quả 2.3 Cho (U,) là một không gian topo được cảm sinh bởi một quanhệ hai
ngôi R có tính phản xạ và bắc cầu Xét phủ đơn vị của U là C={rR(x) | xU},
(1)(2): Theo định lý 2.14 phủ C thỏa điều kiện giả thiết hệ quả 2.3 là tồn tại,
và lúc này Md(x) = {rR(x)}, xU nên (Md(x))X= rR(x)X= Vì vậy, chúng ta có (1)(2) từ định nghĩa của các phép xấp xỉ (bảng 2.4)
(3) Từ định nghĩa của X , ta có thể viết
(X C )C (Ur ( x)X C r (x)) C Ir R (x) X C (r (x)) C IX (r R ( x)) C
(r (x)) C Với mỗi F là tập đóng ứng với topo , F có thể biểu diễn:
F = (U(r (x)) C = I(r (x)) C , với L là một tập con nào đó của U
Nếu X F X (rR(x))C, xL Vì vậy, từ định nghĩa của X = {F
U |
XF F đóng} ta có cũng có thể viết X IX (r R (x)) C (r (x)) C X
Như vậy, chúng ta đã chỉ ra mối quan hệ giữa các phép xấp xỉ Zhu(1), Xu và
Zhang(2), Yao(4) Tuy nhiên, mối quan hệ giữa các xấp xỉ của A.Mkozae và cộng sự (5), Yao(3) và của các tác giả khác chưa được trình bày Điều này có thể thấy qua các tính chất sau
Chú ý 2.2 Trong trường hợp tổng quát, X ,X là khác nhau A.M Kozae
R
Trang 29xỉ của họ làm giảm vùng biên bằng cách tăng xấp xỉ dưới và giảm xấp xỉ trên Tuy nhiên họ đã không chứng minh, ta có thể thấy điều này quan nhận xét:
Cho (U, S) là một không gian topo được xây dựng theo 2.5.1 b Xét một phủ
của U là C = S Mọi tập con X P(U), thì X X Thậy vậy, từ định nghĩa
Với các phủ là các topo được xây dựng từ 2.5.1 b, việc rút gọn phủ là khó
khăn Có thể sử dụng rút gọn được đề xuất bởi Zhu và Wang để giải quyết vấn đềnày [39]
Một ý tưởng khác là trước khi xử lý các xấp xỉ của Yao(3) hay A.M Kozae,A.A Abo Khadra, T Medhat (5), có thể rút gọn không gian topo theo 2.5.1 c
Trong [13], Guilong Liu, Ying Sai có đề xuất khái niệm chuyển đổi phủ Việc
chuyển đổi này có thể xem là một phương pháp rút gọn phủ (do làm giảm số lượng của phủ) Phép chuyển đổi phủ được định nghĩa như sau
Gọi C(U) là tập tất cả các phủ của U, định nghĩa một phép chuyển đổi F
từ C(U)đến C(U): F: C(U) C(U), với C C(U) : F(C) = C’= {N(x) | xU}
Đối với phép chuyển đổi phủ này các phép xấp xỉ phủ trên X ,CX và
xấp xỉphủ dưới CX là không đổi Tuy nhiên, phép chuyển đổi này không bảo
toàn khônggian topo Nói khác hơn, xấp xỉ của Yao(3) và xấp xỉ của A.M Kozae
và cộng sự (5)không bảo toàn với phép chuyển đổi này Có thể thấy qua phản ví dụ
Giả sử U = {a, b, c, d}, topo được định nghĩa trên U: C = = {, U, {d},