1. Trang chủ
  2. » Luận Văn - Báo Cáo

Tiểu luận môn Toán cho khoa học máy tính LÝ THUYẾT TẬP THÔ & ỨNG DỤNG

59 765 6

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 59
Dung lượng 1,12 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

CÁC KHÁI NIỆM CƠ BẢN1.1 Hệ thống thông tin và tập thô 1.1.1 Hệ thống thông tin Một tập dữ liệu có thể biểu diễn dưới dạng một bảng, trên đó mỗi hàng biểu diễnthông tin ứng với một đối t

Trang 1

BÀI THU HOẠCH

TOÁN

Trang 2

Trang 3

Nhóm em xin chân thành cảm ơn thầy TS.Dương Tôn Đảm đã truyền đạt kiến thức cũng như giới thiệu các tài liệu quí báu và tạo điều kiện thuận lợi để cho nhóm em thực hiện xong bài thu hoạch này.

Nhóm học viên CH-08

Trang 4

Lý thuyết tập thô đã chứng minh được tiềm năng lớn trong suy diễn, do đó

Bài thu hoạch này, nhóm em thực hiện thuật toán tìm tập rút gọn của một bảngquyết định từ đó chọn được các thuộc tính cần thiết đưa vào xây dựng cấu trúc cây quyếtđịnh để chọn thuộc tính phân nhánh tối ưu, làm cho cây có chiều cao nhỏ nhất

Trang 5

LỜI CẢM ƠN 3

LỜI MỞ ĐẦU 4

Chương 1 7

CÁC KHÁI NIỆM CƠ BẢN 7

1.1 Hệ thống thông tin và tập thô 7

1.1.1 Hệ thống thông tin 7

1.1.2 Quan hệ không phân biệt được 7

1.1.3 Tập thô 9

1.1.4 Các tính chất của xấp xỉ 10

1.1.5 Độ chính xác của xấp xỉ 11

1.1.6 Bảng quyết định 12

1.1.7 Rút gọn và nhân 13

1.1.8 Ma trận phân biệt được và hàm phân biệt được 13

1.1.9 Luật quyết định 14

1.1.10 Phụ thuộc độ k 14

Chương 2 16

PHỦ TẬP THÔ 16

2.1 Tính chất của xấp xỉ phủ loại 1, 2, 3 17

2.1.1 Xấp xỉ phủ tập thô loại 1 17

2.1.2 Xấp xỉ phủ tập thô loại 2 18

2.1.3 Xấp xỉ phủ tập thô loại 3 19

2.2 Mối quan hệ giữa ba loại phủ tập thô 21

2.3 Một số tính chất về xấp xỉ phủ loại 2 21

2.4 Tính chất ánh xạ đóng của ba phép xấp xỉ trên dựa vào phủ 22

2.4.1 Tính chất ánh xạ đóng của ba phép xấp xỉ phủ trên ứng với phủ đơn vị

22 2.4.2 Tính chất ánh xạ đóng của ba phép xấp xỉ phủ trên ứng với phủ tựa điểm22 2.5 Mối quan hệ giữa các phép xấp xỉ phủ dựa vào không gian topo 23

2.5.1 Quan hệ hai ngôi và không gian topo 23

Trang 6

2.5.2 Mối quan hệ giữa các xấp xỉ dựa vào không gian topo 25

2.6 Rút gọn tập thuộc tính dựa vào họ phủ tập thô 28

2.6.1 Một số khái niệm và kết quả cơ sở 30

2.6.2 Rút gọn tập thuộc tính các hệ thống quyết định nhất quán và không nhất quán 31

2.6.3 Một số kết quả liên quan giữa họ phủ và phủ suy dẫn 32

2.7 Thuật toán FC_Reduct rút gọn tập thuộc tính dựa vào họ phủ tập thô 33

2.7.1 Thuật toán FC_Reduct rút gọn thuộc tính của họ quyết định phủ tập thô 35

2.7.2 Đánh giá độ phức tạp thuật toán FC_Reduct 36

Chương 3 41

ỨNG DỤNG 41

3.1 ỨNG DỤNG TÌM LUẬT SUY DIỄN TĂNG GIẢM CHỈ SỐ VN-INDEX 41

3.1.1 Công cụ triển khai 41

3.1.2 VN-Index là gì? 41

3.1.3 Giới thiệu ứng dụng 42

3.1.4 Bảng quyết định thử nghiệm 42

3.1.5 Kết quả thử nghiệm 45

3.1.6 Kiểm chứng 48

3.1.7 Kết luận 50

3.2 ỨNG DỤNG HỖ TRỎ RA QUYẾT ĐỊNH BẰNG CÂY QUYẾT ĐỊNH 50

3.2.1 Giới thiệu 50

3.2.2 Mục tiêu 50

3.2.3 Phương pháp 51

3.2.4 Kết quả 53

3.2.5 Kết luận 55

TÀI LIỆU THAM KHẢO 57

Trang 7

CÁC KHÁI NIỆM CƠ BẢN

1.1 Hệ thống thông tin và tập thô

1.1.1 Hệ thống thông tin

Một tập dữ liệu có thể biểu diễn dưới dạng một bảng, trên đó mỗi hàng biểu diễnthông tin ứng với một đối tượng, mỗi cột biểu diễn một thuộc tính có thể đo được

của mỗi đối tượng (do các chuyên gia hay người sử dụng cung cấp) Bảng này

được gọi là một hệ thống thông tin Hình thức hơn, hệ thống thông tin là một cặp S

= (U, A), U là một tập hữu hạn khác rỗng các đối tượng gọi là tập vũ trụ hay là tập phổ dụng, A là một tập hữu hạn khác rỗng các thuộc tính Với mỗi u U và aA,

ta ký hiệu u(a) là giá trị của đối tượng u tại thuộc tính a Nếu gọi I a là tập tất cả giá

trị của thuộc tính a, thì u(a) I a với mọi uU Bây giờ, nếu B = {b 1 , b 2 , ,b k}

A, ta ký hiệu bộ các giá trị u(b i ) bởi u(B) Như vậy, nếu u và v là hai đối tượng, thì ta sẽ viết u(B) = v(B) nếu u(b i ) = v(b i ), với mọi i =1, 2, , k.

1.1.2 Quan hệ không phân biệt được

Xét hệ thống thông tin S = (U, A), với mỗi tập thuộc tính B A tạo ra một quan

hệ hai ngôi trên U, ký hiệu IND(B)

IND(B) = {(u,v) U U | u(a) v(a),a  B}

IND(B) được gọi là quan hệ B_không phân biệt được Dễ kiểm chứng đây là mộtquan hệ tương đương trên U Với mọi đối tượng uU, lớp tương đương của utrong quan hệ IND(B) được kí hiệu bởi [u]B Tập thương xác định bởi quan hệIND(B) được ký hiệu U/IND(B) hay U/B, tức là U/IND(B) = U/B = {[u]B |uU}

Trang 8

Ví dụ 1.1 Xét hệ thống thông tin cho ở bảng 1.1

Bảng 1.1 Bảng dữ liệu bệnh cúm

Trong đó: U = {x1, x2, x3, x4, x5, x6}

A = {Đau đầu, Đau cơ, Nhiệt độ, Cúm}.

Trong bảng, các bệnh nhân x 2 , x 3 và x 5 không phân biệt được đối với thuộc tính

Đau đầu, bệnh nhân x 3 và x 6 không phân biệt được đối với thuộc tính Đau cơ,

Cúm và bệnh nhân x 2 , x 5 không phân biệt được đối với thuộc tính Đau đầu, Đau

IND({Đau đầu, Đau cơ}) = {{x 1 , x 4 , x 6 }, {x 2 , x 5 }, {x 3}}

Xét hệ thống thông tin S= (U, A), một quan hệ bộ phận p xác định trên họ {U/B| B

A} được định nghĩa:

nếu và chỉ nếu P U / P,Q i j U / Q : P Q i j Khi đó ta nói Q là

Trang 9

Lý thuyết tập thô (Rough set) được đề xuất vào năm 1982 bởi Z.Pawlak Lýthuyết này xây dựng phương pháp luận liên quan đến sự phân loại và phântích không chắc chắn, thông tin và tri thức không đầy đủ và được coi là một trongnhững phương pháp tiếp cận đầu tiên không dựa trên thống kê trong phân tích dữliệu.Khái niệm cơ bản của lý thuyết tập thô là xấp xỉ dưới và trên của một tập, sựxấp xỉ của không gian là hình thức phân loại tri thức liên quan đến miền quantâm.

Tập con được tạo ra bởi xấp xỉ dưới mô tả bởi các đối tượng là những thànhphần chắc chắn của một tập, trong khi xấp xỉ trên được đặc trưng bởi các đốitượng có khả năng thuộc tập quan tâm Mỗi tập con xác định thông qua xấp xỉdưới và xấp xỉ trên được gọi là tập thô

Gần đây, lý thuyết tập thô trở thành một công cụ đánh giá trong xử lý các vấn đềkhác nhau như trình bày tri thức không chắc chắn hoặc không chính xác, phântích tri thức, đánh giá chất lượng và tính khả dụng của thông tin đối với tính nhấtquán và sự có mặt các mẫu không theo thời gian, nhận dạng và đánh giá sự phụthuộc thời gian, suy luận dựa trên sự không chắc chắn và thiếu thông tin dữ liệu.Trong lý thuyết tập thô, để biểu diễn một tập hợp bằng tri thức được cho xácđịnh bởi một tập thuộc tính, người ta định nghĩa hai phép xấp xỉ:

Cho một hệ thống thông tin S= (U, A), với mỗi tập con X U và B A, ký hiệu

R = IND(B), ta có 2 tập con sau:

R(X), R(X)lần lượt gọi là R-xấp xỉ dưới và R- xấp xỉ trên của tập X

Tập R(X) bao gồm tất cả các phần tử của U chắc chắn thuộc vào X

Tập R(X) bao gồm các phần tử của U có khả năng được phân loại vào những phần tửthuộc X ứng với quan hệ R

Từ hai tập xấp xỉ người ta định nghĩa các tập:

Trang 10

Ký hiệu tập thương của IND(B) trên U là U/B, các xấp xỉ trên và dưới của X có

thể viết lại:

Trong trường hợp BN B (X) , X được gọi là tập thô,

ngược lại X được gọi là tập rõ.

Hình 1.1 Minh họa tập thô

Đối với một hệ thống thông tin S = (U, A), B, D A, ký hiệu R = IND(B), người ta gọi B-miền khẳng định dương của D là tập được xác định như sau:

Rõ ràng POS B (D) là tập tất cả các đối tượng u sao cho với mọi v U

mà u(B) v(B) ta đều có u(D) v(D)

Nói cách khác, POS B (D)  {u U | u B  u D}

1.1.4 Các tính chất của xấp xỉ

Định lý 1.1 [34] Cho một hệ thống thông tin S = (U, A), X, Y U và B A, đặt R = IND(B) Khi đó:

Trang 11

Tính chất (3L), (4L) và (8L) là những tính chất đặc trưng cho phép xấp xỉ dưới,điều đó có nghĩa là những tính chất khác của phép xấp xỉ dưới có thể suy dẫn từ

ba tính chất này Tương tự, (3H), (4H) và (8H) là những tính chất đặc trưng củaphép xấp xỉ trên

1.1.5 Độ chính xác của xấp xỉ

Cho một hệ thống thông tin S = (U, A), với mỗi tập con X U và B A, đặt R = IND(B), đại lượng đo sự chính xác của tập xấp xỉ X đối với phân hoạch trên B là

giá trị :

Trang 12

Trong đó card(X) = |X| là lực lượng (số phần tử) của tập X Rõ ràng 0

R (X )  1 Nếu R (X )  1, ta nói X là chính xác đối với R, còn R (X )

1, X được gọi là thô đối với R.

1.1.6 Bảng quyết định

Bảng quyết định là một hệ thống thông tin có dạng T= (U, A), trong đó tập thuộc tính A được chia thành hai tập thuộc tính rời nhau C và D, C được gọi là tập thuộc tính điều kiện, còn D là tập thuộc tính quyết định.

Tức là T = (U, CD), với CD =  Trong trường hợp không sợ bị nhầm lẫn

người ta còn ký hiệu T= (U,C, D).

Ví dụ 1.2 Hệ thống thông tin S = (U, A) biểu diễn cơ sở tri thức về bệnh cúm

được thể hiện trong bảng 1.1 là một bảng quyết định T = (U, CD)

Trong đó: U = {x 1 , x 2 , x 3 , x 4 , x 5 , x 6}

A = {Đau đầu, Đau cơ, Nhiệt độ, Cúm}.

Tập thuộc tính điều kiện C = {Đau đầu, Đau cơ, Nhiệt độ}

Bảng 1.2 Bảng quyết định

Cho một bảng quyết định T = (U, CD), giả sử U/C = {X 1 , X 2 , , X m } và U/D = {Y 1 , Y 2 , , Y n } Một lớp X i U/C được gọi là nhất quán nếu u(d) = v(d), u,vX i,

Trang 13

Một bảng quyết định T = (U, CD) là nhất quán nếu mọi lớp X i U/C là nhất

quán, ngược lại T được gọi là không nhất quán Dễ thấy nếu U/C U/D thì T =

(U,CD) là nhất quán.

Tương tự, nếu U/D U/C, thì Tlà nhất quán ngược

Có thể thấy bảng quyết định là nhất quán khi và chỉ khi POS C (D) = U.

Trong trường hợp bảng không nhất quán thì POS C (D) chính là tập con cực đại của

Ở đây, RED(C) là tập hợp tất cả rút gọn của C.

Ngoài ra, người ta cũng định nghĩa rút gọn C-miền khẳng định dương của D:

Nếu B C thỏa:

1.POS B (D)POS C (D)

POS C{a} (D)

B được gọi là rút gọn C-miền khẳng định dương của D.

1.1.8 Ma trận phân biệt được và hàm phân biệt được

Xét bảng quyết định T = (U, CD), với U = {u 1 , u 2 , , u n} Ma trận phân biệtđược của T ký hiệu M(T) = (mij)nn là một ma trận đối xứng, trong đó mỗi phần tửcủa nó là một tập thuộc tính được xác định như sau :

Trang 14

Hàm phân biệt được fΤ là một hàm boole, được xác định từ ma trận phânbiệt M(T) như sau:

trong đó, mỗi thuộc tính được đặt tương ứng một biến logic cùng tên và

1.1.9 Luật quyết định

Cho T= (U, CD) là một bảng quyết định, giả sử U/C = {X 1 , X 2 , , X m } và U/D = {Y 1 , Y 2 , , Y n } Nếu X i Y j ≠, ký hiệu des(X i ), des(Y j) lần lượt là các mô tả của các

lớp tương đương ứng với X i , Y j Một luật quyết định xác định bởi X i , Y j có dạng:

Độ đo độ chắc chắn và độ hỗ trợ của luật quyết định Z ij được định nghĩa nhưsau:

Ở đây |.| là bản số hay lực lượng của một tập hợp Rõ ràng giá trị của (Z ij ),s(Z ij ) luật quyết định Z ij rơi vào đoạn [ 1

|U|,1].Để thuận tiện trong trình bày kýhiệu ta thay |Z xy| bằng |X i ∩Y j|

1.1.10 Phụ thuộc độ k

Cho hệ thống thông tin S = (U, A), X, Y A Chúng ta nói rằng tập thuộc tính Y

phụ thuộc độ k[0,1] vào tập thuộc tính X, ký hiệu X k → Y , với k được xác địnhnhư sau:

Trang 15

Khi X 0 → Y, chúng ta viết và X 1 → Y được viết X→ Y.

Dễ thấy rằng phụ thuộc độ k là sự tổng quát hóa của phụ thuộc hàm và

X 1

→ Y là phụ thuộc hàm đã biết trong CSDL quan hệ

Trang 16

Chương 2

PHỦ TẬP THÔChương này nhóm em tìm hiểu sự mở rộng tập thô theo hướng thay đổi phânhoạch bởi phủ Phương pháp tiếp cận là khảo sát tính chất toán học của các phép xấp xỉứng với ba loại phủ do W Zhu và F.Y Wang đề xuất [37, 38, 40] và các phép xấp xỉdựa vào phủ được tiếp cận bằng công cụ toán học là không gian topo của một số tác giảkhác [6, 18, 39, 44] để chỉ ra mối quan hệ giữa các phép xấp xỉ Cuối chương, bài thuhoạch sẽ trình bày thuật toán rút gọn tập thuộc tính dựa vào họ phủ tập thô FC_Reduct vàứng dụng

Trong các bài báo công bố kết quả nghiên cứu của mình [37, 38], W Zhu vàF.YWang đã đưa ra hệ tiên đề cho phép xấp xỉ phủ dưới và khẳng định tính mở của bài

toán tìm tính chất đặc trưng của các phép xấp xỉ phủ trên (loại 1, 2, 3) Kế thừa, phát

triển những kết quả này, luận án đóng góp một số điều kiện để hai phủ sinh cùng xácđịnh một phép xấp xỉ phủ loại 2 Tính chất ánh xạ đóng của các phép xấp xỉ phủ loại 1,

2, 3 cũng được khảo sát nhằm có thể sử dụng các kết quả ứng dụng của ánh xạ đóng vàocác tập cơ sở dữ liệu

Trang 17

2.1 Tính chất của xấp xỉ phủ loại 1, 2, 3

2.1.1 Xấp xỉ phủ tập thô loại 1

a Sự phụ thuộc xấp xỉ dưới và xấp xỉ trên loại 1

W Zhu và F.Y Wang [38] đã chỉ ra mối quan hệ giữa xấp xỉ phủ dưới và xấp xỉphủ trên loại 1 thông qua các định lý

Định lý 2.1 [38] Cho C1 và C2 là hai phủ của U, C1 và C2 sinh ra cùng phép

xấp xỉ phủ dưới (loại 1, 2, 3) nếu và chỉ nếu reduct(C1) = reduct(C2).

Định lý 2.2 [38] Cho C1 và C2 là hai phủ của U, C1 và C2 sinh ra cùng phép

xấp xỉ phủ trên loại 1 nếu và chỉ nếu reduct(C1) = reduct(C2).

Định lý 2.3 [38] Cho C1, C2 là hai phủ của U, C1 và C2 sinh ra cùng phép xấp

xỉ phủ dưới loại 1 khi và chỉ khi chúng cùng sinh ra xấp xỉ phủ trên loại 1

b Tiên đề cho phép xấp xỉ phủ dưới

Định lý 2.4 [37, 40] Cho U là một tập khác rỗng Nếu tồn tại 1 phép toán L:

thì tồn tại một phủ C của U mà phép xấp xỉ phủ dưới CL được sinh bởi C là L.

Hơn thế, bốn tính chất trên của phép xấp xỉ phủ dưới là độc lập ((1L)-(7L) là ký hiệu thứ tự các tính chất của phép xấp xỉ phủ dưới được viết ở 1.1.4).

c Tiên đề cho phép xấp xỉ phủ trên loại 1

Trang 18

Các tính chất (1L) đến (9H) trong 1.1.4 là cơ bản và đầy đủ cho các phép xấp xỉdưới, phép xấp xỉ trên trong tập thô cổ điển Định lý 2.4 chỉ ra rằng các tính chất(1L), (2L), (3L), (7L) cũng là đầy đủ đối với các phép toán xấp xỉ phủ dưới.Tuy nhiên, các tính chất (1H), (2H), (3H) và (5H) chưa đủ để đặc trưng cho cácphép xấp xỉ trên loại 1 Điều này có thể thấy được qua ví dụ

Ví dụ 2.1 [38, 40] Một phép toán H: P(U) P(U) thỏa các tính chất (1H),(2H), (3H)

và (5H) nhưng không tồn tại một phủ C của U mà H là một phép xấp xỉ phủ trên loại 1 sinh ra bởi C.

Cho U = {a, b, c} Định nghĩa H: P(U) P(U) như sau

Hiển nhiên H thỏa các tính chất (1H), (2H), (3H) và (5H), nhưng không tồn tại phủ C nào của U mà H là phép xấp xỉ phủ trên loại 1 sinh ra bởi C Thật vậy, nếu có thì phủ C

phải có 2 phần tử {a} và {b} Trong trường hợp này, FH({a,b}) = {a,b} ≠{a,b,c}=

H({a,b}) Do đó H không là phép xấp xỉ phủ trên loại 1 sinh ra bởi C.

Bài toán tìm hệ tiên đề cho xấp xỉ phủ trên loại 1 vẫn còn là bài toán mở.

Trang 20

2.1.3 Xấp xỉ phủ tập thô loại 3

a Sự phụ thuộc xấp xỉ phủ dưới và xấp xỉ phủ trên loại 3

Định lý 2.6 [38, 40] Cho C là phủ của U thì C và reduct(C) sinh ra cùng các phép

xấp xỉ phủ dưới và xấp xỉ phủ trên loại 3

Định lý 2.7 [38, 40] Cho C1, C2 là hai phủ của U, nếu reduct (C1) = reduct(C2), thì C1

và C2 sinh ra cùng xấp xỉ phủ trên loại 3.

Chú ý 2.1: Điều ngược lại định lý trên là không đúng, ta có phản ví dụ

Phản ví dụ 2.3 Cho U = {a, b, c}, K1 = {a, b}, K2 = {b, c}, K3 = {a, c}, K4={a, b,

c}, C1 = {K1, K2, K3} and C2 = {K4}

Nếu X = thì xấp xỉ phủ trên loại 3 sinh ra bởi hai phủ C1 và C2 đều là X# = {a ,b, c}, nhưng reduct(C1) = C1  reduct(C2) = C2

Định lý 2.8 [38, 40] Cho C1, C2 là các phủ của U, nếu C1 và C2 sinh ra cùng xấp xỉ

phủ dưới thì chúng cũng sinh ra cùng xấp xỉ phủ trên loại 3

b Tiên đề cho các phép xấp xỉ phủ trên loại 3

Cũng giống như phép phủ xấp xỉ trên loại 1 và loại 2 Phép phủ xấp xỉ trên loại 3 chưathể tiên đề hóa do nhiều tính chất đặc trưng của phép phủ xấp xỉ trên không thỏa

Phản ví dụ 2.4 [40] Một phép toán thỏa (1H), (2H), (3H), (4H), và (7H) nhưng

không là xấp xỉ phủ trên loại 3 Cho U = {a, b, c} Định nghĩa H: H: P(U) P(U)

như

sau: H() = , H({a}) = {a, b}, H({b}) = {b, c}, H({c}) = {c}, H({a, b}) = U, H({b, c}) = {b, c}, H({a, c}) = U, H(U) = U Hiển nhiên H thỏa (1H), (2H), (3H)

Trang 22

2.2 Mối quan hệ giữa ba loại phủ tập thô

Hệ quả 2.1 Cho C1, C2 là các phủ của U, C1 và C2 sinh ra cùng xấp xỉ dưới và

xấp xỉ trên phủ loại 2, nếu chúng thỏa các điều kiện sau

1 reduct(C1) = reduct(C2)

2 C1 và C2 là các phủ tựa điểm

Chứng minh: Kết quả được suy dẫn trực tiếp từ định lý 2.12 và 2.13.

Mệnh đề 2.1 Cho C là một phủ của U, C và reduct(C) chưa chắc sinh ra cùng xấp

xỉ trên loại 2 (ngay cả khi reduct(C) là một phân hoạch).

Chứng minh Tính chất trên có thể thấy qua phản ví dụ sau

Phản ví dụ 2.5 Cho U = {a, b, c}, K1 = {a}, K2 = {b}, K3 = {c}, K4 = {a, b, c}, C= {K1,

K2, K3, K4} Ta có reduct(C) = {K1,K2,K3} Nếu X = {c}, thì X C {a,b,c} X reduct(C) K3

Trang 23

2.4.1 Tính chất ánh xạ đóng của ba phép xấp xỉ phủ trên ứng với phủ

đơn vị

Mệnh đề 2.2 Cho C là một phủ của U, nếu C là (phủ) đơn vị thì FH sinh bởi C

Chứng minh Từ bảng tổng kết 2.1, nếu C là (phủ) đơn vị thì FH = TH Do

TH thỏa tính đồng biến, FH thỏa tính lũy đẳng (bảng 2.2), nên khi C là (phủ)

đơn vịFH thỏa tính đơn điệu và TH thỏa tính lũy đẳng Tuy nhiên, SH chưa

chắc thỏa tínhlũy đẳng nếu C là (phủ) đơn vị.

Mệnh đề 2.3 Cho C là một phủ của U Nếu C là phủ tựa điểm thì FH sinh bởi C

thỏa tính chất: X,Y U, X Y FH(X) FH(Y) (tính đồng biến)

Chứng minh Từ định nghĩa của phủ tựa điểm và FH Nếu C là một phủ tựa

điểm chúng ta có FH(X) = {Md(x)| x X} Dễ dàng thấy rằng

Trang 24

2.5 Mối quan hệ giữa các phép xấp xỉ phủ dựa vào không gian topo

Nhiều tác giả trên cơ sở lý thuyết không gian topo đã đề xuất các phép xấp xỉ dựa vào phủ Trong phần này, luận án trình bày một số điều kiện để các phép xấp xỉ dựa vào phủ do Y.Yao, W Zhu, và A.M Kozae và cộng sự đề xuất là đồng nhất.

2.5.1 Quan hệ hai ngôi và không gian topo

a Không gian topo được xây dựng từ một quan hệ hai ngôi

Giả sử R là một quan hệ hai ngôi tùy ý xác định trên U, cặp (U, R) được gọi

là một không gian xấp xỉ xác định bởi quan hệ hai ngôi R Ứng với R, có thể định nghĩa láng giềng trái, phải của một phần tử x thuộc U lần lượt như sau

lR(x) = {y | yU, yRx} và rR(x) = {y | yU, xRy}

Xây dựng topo 1 sử dụng R-láng giềng phải (tương tự, topo 2 sử dụng láng giềng trái), chúng ta xem họ S1 = {rR(x) | x U} là một tiền cơ sở của

R-topo 1 và ký hiệu S x = {G S1| x G} Topo 1 đượcgọi là cảm sinh từ quan

hệ hai ngôi R.

b Không gian topo được xây dựng từ một họ phủ

Một hệ thống thông tin S = (U, A), U là một tập hữu hạn khác rỗng các đối tượng, A là một tập hữu hạn khác rỗng các thuộc tính Với mỗi thuộc tính aA

xác địnhmột quan hệ hai ngôi R a trên UxU như sau

u,vU, u R a v khi và chỉ khi u(a)v(a) ≠  Với định nghĩa này, R a xác định một phủ Ca của U là một topo cảm sinh từ quan

hệ hai ngôi R a Với tất cả các thuộc tính thuộc A, chúng ta sẽ có một topo S

được sinh từ tiền cơ sở UaA S a Trong đó, S a là một tiền cơ sở của topo a

Nếu (U, S ) là một không gian topo được xây dựng từ một họ phủ {C a | a A} sinh ra từ tập các quan hệ {R a | a A} thì S đượcgọi là phủ được sản sinh từ

Trang 25

c Khái niệm rút gọn không gian topo sản sinh từ một tập các quan hệ hai ngôi

Trong [34] khái niệm rút gọn không gian topo sản sinh từ một tập các quan

hệ hai ngôi được đề xuất:

Xét không gian topo (U, ) sinh ra từ tập các quan hệ hai ngôi RA, ký hiệu RA

là cơ sở của (U, ).

Cho RA là một lớp các quan hệ hai ngôi, P RA, rP, r được gọi là không cần thiết trong P nếu và chỉ nếu: P = (P-r) Tập M được gọi là một rút gọn của P, nếu và chỉ nếu (i) P =M, (ii) P-{r} M , rM

d Danh sách các phép xấp xỉ đã được các tác giả định nghĩa

Cho (U, C) là một không gian xấp xỉ phủ N(x) = {KC | xK} là một lân cận

của x Ký hiệu X C cho phần bù của X đối với U, có nghĩa là X C = U-X

(U, ) là một không gian topo sử dụng các R-láng giềng phải

Bài thu hoạch sẽ khảo sát các phép xấp xỉ sau

Trang 26

2.5.2 Mối quan hệ giữa các xấp xỉ dựa vào không gian topo

Mệnh đề 2.5 [13] Nếu R, R-1 là 2 quan hệ hai ngôi trên U được định nghĩa:

xRy nếu và chỉ nếu y N(x) và yR-1 x nếu và chỉ nếu xRy thì

(1) R thỏa tính phản xạ và bắc cầu

(2) CX ÒR X và CX ÑR X , XU

(3) Ngược lại, đối với mỗi quan hệ hai ngôi thỏa tính phản xạ và bắc

cầu R trên U thì tồn tại một không gian xấp xỉ phủ (U, C) thỏa

CX ÒR X và CX ÑR X , X  U (4) X + = ÒR1 X , X  U

(5) CX UxX l R (X ) và XUxX r (x), X  U (6) Nếu CX  với mọi XU, thì R là một quan hệ tương đương trên U, do đó CX là các phép xấp xỉ trên cổ điển Pawlak

Định lý 2.14 [13] Giả sử C là một phủ đơn vị của U, thì tồn tại R là quan hệ hai

ngôi có tính phản xạ và bắc cầu trên U thỏa Md(x) = {r R (x)}, ở đây r R (x) là R-láng giềng phải của phần tử xU Ngược lại, nếu R là một quan hệ hai ngôi có tính phản

xạ và tínhbắc cầu trên U, thì C = {r R (x)| xU} là một phủ đơn vị của U và

Md(x) = {r R (x)},xU.

Bây giờ xét hai tập con đáng chú ý của P(U):

G= { X | XP(U), ÒR X } và H= {XP(U) | YP(U), X

Mệnh đề 2.6 Nếu R có tính bắc cầu thì

1 ÒR X có tính lũy

R

Trang 27

Chứng minh (1) Nếu R có tính bắc cầu, với mọi X U, ta có:

x U : x ÒR X r (x) X y : y r (x) y X

ra, ta còn có một số kết quả sau

Mệnh đề 2.7 Cho (U, ) là một không gian topo cảm sinh bởi quan hệ hai ngôiR Nếu R là một quan hệ hai ngôi có tính phản xạ thì hai phép xấp xỉ Yao (3) và Yao

Mệnh đề 2.8 Cho (U, S) là một không gian topo được xây dựng như trong 2.5.1

b Xét một phủ đặc biệt của U là C =S , chúng ta có X + = X , X U.

Chứng minh Dễ dàng thấy rằng mọi KC, C = S , nên K là mở Kết hợp với định

R

R

R

Trang 28

nghĩa của X +, X , ta có điều phải chứng minh.

Hệ quả 2.3 Cho (U,) là một không gian topo được cảm sinh bởi một quanhệ hai

ngôi R có tính phản xạ và bắc cầu Xét phủ đơn vị của U là C={rR(x) | xU},

(1)(2): Theo định lý 2.14 phủ C thỏa điều kiện giả thiết hệ quả 2.3 là tồn tại,

và lúc này Md(x) = {rR(x)}, xU nên (Md(x))X= rR(x)X= Vì vậy, chúng ta có (1)(2) từ định nghĩa của các phép xấp xỉ (bảng 2.4)

(3) Từ định nghĩa của X , ta có thể viết

(X C )C (Ur ( x)X C r (x)) C Ir R (x) X C (r (x)) C IX (r R ( x)) C

(r (x)) C Với mỗi F là tập đóng ứng với topo , F có thể biểu diễn:

F = (U(r (x)) C = I(r (x)) C , với L là một tập con nào đó của U

Nếu X F X (rR(x))C, xL Vì vậy, từ định nghĩa của X = {F

U |

XF F đóng} ta có cũng có thể viết X IX (r R (x)) C (r (x)) C X

Như vậy, chúng ta đã chỉ ra mối quan hệ giữa các phép xấp xỉ Zhu(1), Xu và

Zhang(2), Yao(4) Tuy nhiên, mối quan hệ giữa các xấp xỉ của A.Mkozae và cộng sự (5), Yao(3) và của các tác giả khác chưa được trình bày Điều này có thể thấy qua các tính chất sau

Chú ý 2.2 Trong trường hợp tổng quát, X ,X là khác nhau A.M Kozae

R

Trang 29

xỉ của họ làm giảm vùng biên bằng cách tăng xấp xỉ dưới và giảm xấp xỉ trên Tuy nhiên họ đã không chứng minh, ta có thể thấy điều này quan nhận xét:

Cho (U, S) là một không gian topo được xây dựng theo 2.5.1 b Xét một phủ

của U là C = S Mọi tập con X  P(U), thì X X Thậy vậy, từ định nghĩa

Với các phủ là các topo được xây dựng từ 2.5.1 b, việc rút gọn phủ là khó

khăn Có thể sử dụng rút gọn được đề xuất bởi Zhu và Wang để giải quyết vấn đềnày [39]

Một ý tưởng khác là trước khi xử lý các xấp xỉ của Yao(3) hay A.M Kozae,A.A Abo Khadra, T Medhat (5), có thể rút gọn không gian topo theo 2.5.1 c

Trong [13], Guilong Liu, Ying Sai có đề xuất khái niệm chuyển đổi phủ Việc

chuyển đổi này có thể xem là một phương pháp rút gọn phủ (do làm giảm số lượng của phủ) Phép chuyển đổi phủ được định nghĩa như sau

Gọi C(U) là tập tất cả các phủ của U, định nghĩa một phép chuyển đổi F

từ C(U)đến C(U): F: C(U) C(U), với C C(U) : F(C) = C’= {N(x) | xU}

Đối với phép chuyển đổi phủ này các phép xấp xỉ phủ trên X ,CX và

xấp xỉphủ dưới CX là không đổi Tuy nhiên, phép chuyển đổi này không bảo

toàn khônggian topo Nói khác hơn, xấp xỉ của Yao(3) và xấp xỉ của A.M Kozae

và cộng sự (5)không bảo toàn với phép chuyển đổi này Có thể thấy qua phản ví dụ

Giả sử U = {a, b, c, d}, topo được định nghĩa trên U: C = = {, U, {d},

Ngày đăng: 22/05/2015, 22:32

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] TS. Dương Tôn Đảm, Bài giảng Lý thuyết tập thô, Trường ĐH CNTT – TP.HCM Sách, tạp chí
Tiêu đề: Bài giảng Lý thuyết tập thô
[2] GS.TSKH. Hoàng Văn Kiếm, Bài giảng cao học môn học cơ sở tri thức và ứng dụng, ĐHKHTN – TP.HCM Sách, tạp chí
Tiêu đề: Bài giảng cao học môn học cơ sở tri thức và ứng dụng
[3] GS.TSKH. Hoàng Kiếm, Thư viện những báo cáo khoa học, bài thu hoạch môn cơ sở tri thức và ứng dụng. Các lớp cao học thuộc khoa CNTT – ĐHKHTN – TP.HCM Sách, tạp chí
Tiêu đề: Thư viện những báo cáo khoa học, bài thu hoạch môn cơ sởtri thức và ứng dụng
[4] GS.TSKH. Hoàng Văn Kiếm, PGS. TS. Đỗ Văn Nhơn, PGS. TS. Đỗ Phúc, Giáo trình Các hệ cơ sở tri thức. Đại Học Quốc Gia TP.HCM – 2002 Sách, tạp chí
Tiêu đề: Giáo trình Các hệ cơ sở tri thức
[5] Nguyễn Văn Chức, Ứng dụng lý thuyết tập thô trong khai phá dữ liệu, http://bis.net.vn, tháng 02/2013 Sách, tạp chí
Tiêu đề: Ứng dụng lý thuyết tập thô trong khai phá dữ liệu, http://bis.net.vn
[6] Phạm Văn Long, Luận văn thạc sĩ: “Khai phá dữ liệu theo tiếp cận tập thô và cây quyết định - ứng dụng trong phân lớp năng khiếu học sinh”, 2012 Sách, tạp chí
Tiêu đề: Khai phá dữ liệu theo tiếp cận tập thô và cây quyết định - ứng dụng trong phân lớp năng khiếu học sinh
[7] Andrzej Skowron, Ning Zhong, Rough Sets in KDD Tutorial Notes [8] Dữ liệu tỷ giá USD, EUR, www.investing.com Sách, tạp chí
Tiêu đề: Rough Sets in KDD Tutorial Notes"[8] Dữ liệu tỷ giá USD, EUR
[12] Dữ liệu VN-Index, giá cổ phiếu HCM, CTG, GAS, http://www.hsx.vn Link

HÌNH ẢNH LIÊN QUAN

Bảng 1.1 Bảng dữ liệu bệnh cúm - Tiểu luận môn Toán cho  khoa học máy tính LÝ THUYẾT TẬP THÔ & ỨNG DỤNG
Bảng 1.1 Bảng dữ liệu bệnh cúm (Trang 8)
Hình 1.1 Minh họa tập thô - Tiểu luận môn Toán cho  khoa học máy tính LÝ THUYẾT TẬP THÔ & ỨNG DỤNG
Hình 1.1 Minh họa tập thô (Trang 10)
1.1.6  Bảng quyết định - Tiểu luận môn Toán cho  khoa học máy tính LÝ THUYẾT TẬP THÔ & ỨNG DỤNG
1.1.6 Bảng quyết định (Trang 12)
Bảng 2.4 Các phép xấp xỉ phủ định nghĩa trên không gian topo - Tiểu luận môn Toán cho  khoa học máy tính LÝ THUYẾT TẬP THÔ & ỨNG DỤNG
Bảng 2.4 Các phép xấp xỉ phủ định nghĩa trên không gian topo (Trang 25)
Hình II.5.1: Bảng dữ liệu quyết định tăng/giảm chỉ số VN-Index - Tiểu luận môn Toán cho  khoa học máy tính LÝ THUYẾT TẬP THÔ & ỨNG DỤNG
nh II.5.1: Bảng dữ liệu quyết định tăng/giảm chỉ số VN-Index (Trang 46)
Bảng II.5.1: Danh sách luật suy diễn - Tiểu luận môn Toán cho  khoa học máy tính LÝ THUYẾT TẬP THÔ & ỨNG DỤNG
ng II.5.1: Danh sách luật suy diễn (Trang 48)
Hình II.5.3: Tập luật suy diễn rút ra được - Tiểu luận môn Toán cho  khoa học máy tính LÝ THUYẾT TẬP THÔ & ỨNG DỤNG
nh II.5.3: Tập luật suy diễn rút ra được (Trang 48)
Bảng II.6.3: Bảng so sánh kết quả dự báo - Tiểu luận môn Toán cho  khoa học máy tính LÝ THUYẾT TẬP THÔ & ỨNG DỤNG
ng II.6.3: Bảng so sánh kết quả dự báo (Trang 51)
Hình 3.2.1: Giao diện chính của ứng dụng - Tiểu luận môn Toán cho  khoa học máy tính LÝ THUYẾT TẬP THÔ & ỨNG DỤNG
Hình 3.2.1 Giao diện chính của ứng dụng (Trang 55)
Bảng 3.2.2: Dữ liệu huấn luyện (đầu vào) - Tiểu luận môn Toán cho  khoa học máy tính LÝ THUYẾT TẬP THÔ & ỨNG DỤNG
Bảng 3.2.2 Dữ liệu huấn luyện (đầu vào) (Trang 57)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w