1. Trang chủ
  2. » Luận Văn - Báo Cáo

Phát hiện tập luật khẳng định và phủ định dựa vào lý thuyết tập thô và ứng dụng

55 468 1
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Phát hiện tập luật khẳng định và phủ định dựa vào lý thuyết tập thô và ứng dụng
Tác giả Hàng Nguyên Huy
Người hướng dẫn TS. Nguyễn Đức Thuần
Trường học Đại học Nha Trang
Chuyên ngành Công nghệ Thông tin
Thể loại Đồ án tốt nghiệp
Năm xuất bản 2011
Thành phố Nha Trang
Định dạng
Số trang 55
Dung lượng 1,04 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Lý thuyết này được phát triển trên một nền tảng toán học vững chắc và cung cấp những công cụ hữu ích để giải quyết các bài toán phân tích dữ liệu, phát hiện luật… Hiện nay, có nhiều công

Trang 1

LỜI CẢM ƠN

Để hoàn thành đồ án này tác giả đã nhận được sự chỉ bảo tận tình,

cùng những yêu cầu nghiêm khắc của thầy giáo TS Nguyễn Đức Thuần

Em xin bày tỏ lòng biết ơn sâu sắc tới thầy vì đã hướng dẫn và chỉ bảo tận tình để em có thể hoàn thành đồ án này

Em xin cảm ơn các thầy cô trong Khoa Công nghệ Thông tin đã giúp

đỡ và tạo điều kiện cho em trong quá trình thực hiện đồ án cũng như trong toàn khóa học

Tác giả cũng xin chân thành cảm ơn tình cảm của bạn bè trong suốt quá trình học tập, rèn luyện tại trường Đại học Nha Trang

Nha Trang, tháng 06 năm 2011

Hàng Nguyên Huy

Trang 2

NHẬN XÉT CỦA GIÁO VIÊN HƯỚNG DẪN

Trang 3

NHẬN XÉT CỦA GIÁO VIÊN PHẢN BIỆN

Trang 4

MỤC LỤC

LỜI CẢM ƠN 1

DANH MỤC BẢNG BIỂU 6

DANH MỤC HÌNH ẢNH 7

LỜI MỞ ĐẦU 8

CHƯƠNG 1 9

TÌM HIỂU LÝ THUYẾT TẬP THÔ 9

1.1) Hệ thống thông tin 9

1.2) Quan hệ không phân biệt được 9

1.3) Tập thô 11

1.4) Các tính chất của xấp xỉ 13

1.5) Độ chính xác của xấp xỉ 14

1.6) Bảng quyết định 15

1.7) Rút gọn và nhân 16

1.8) Ma trận phân biệt được và hàm phân biệt được 17

1.8.1) Ma trận phân biệt được 17

1.8.2) Hàm phân biệt được 18

1.9) Luật quyết định 19

1.10) Phụ thuộc độ k 20

1.11) Kết luận 21

CHƯƠNG 2 22

LUẬT KHẲNG ĐỊNH VÀ LUẬT PHỦ ĐỊNH 22

2.1) Giới thiệu 22

2.2) Các khái niệm cơ bản 23

2.2.1) Công thức 23

2.2.2) Độ chính xác và độ phủ của phân lớp 24

2.2.3) Luật nguyên tố 25

2.2.4) Luật khẳng định 25

Trang 5

2.2.5) Luật loại trừ và luật phủ định 26

2.3) Một số kết quả đạt được 28

2.3.1) Luật khẳng định 28

2.3.2) Luật phủ định 30

2.3.3) Mở rộng luật phủ định 31

2.3.4) Luật tối thiểu 33

2.3.5) Mối tương quan giữa luật khẳng định và phủ định 35

2.4) Bài toán xác định loại luật 39

2.4.1) Phát biểu 39

2.4.2) Các dạng bài toán xác định loại luật 39

2.5) Kết luận 40

CHƯƠNG 3 41

CHƯƠNG TRÌNH THỬ NGHIỆM 41

3.1) Tổ chức dữ liệu 41

3.2) Các kết quả đạt được 42

3.2.1) Luật nguyên tố 42

3.2.2) Luật tối thiểu 43

3.2.3) Xác định luật 45

3.3) Kết luận và hướng phát triển đề tài 45

Tài liệu tham khảo 47

PHỤ LỤC 48

1) Bộ dữ liệu NTU Data 48

2) Các bộ dữ liệu UCI 50

Trang 6

DANH MỤC BẢNG BIỂU

Bảng 1.1: Bảng dữ liệu bệnh cúm 10

Bảng 1.2: Một hệ thông tin đơn giản 12

Bảng 1.3: Bảng quyết định 15

Bảng 1.4: Hệ thông tin dùng để minh họa ma trận phân biệt được 18

Bảng 1.5: Ma trận phân biệt được của hệ thông tin ở bảng 1.4 18

Bảng 1.6: Một hệ thông tin để tìm hàm phân biệt được 19

Bảng 1.7: Ma trận phân biệt được của hệ thông tin ở bảng 1.6 19

Bảng 1.8: Hệ thông tin dùng để minh họa phụ thuộc độ k 21

Bảng 2.1: Một hệ thống thông tin đơn giản 23

Bảng 2.2: Danh sách các thuộc tính của NTU Data 29

Bảng 2.3: Kết quả tìm luật khẳng định nguyên tố trên các bộ dữ liệu 30

Bảng 2.4: Kết quả tìm luật phủ định nguyên tố trên các bộ dữ liệu 31

Bảng 3.1: Bảng 2.1 sau khi được xử lý 41

Bảng 3.2: Kết quả sinh luật nguyên tố trên các bộ dữ liệu 43

Bảng 3.3: Kết quả sinh luật tối thiểu có 2 công thức trên các bộ dữ liệu 44

Trang 7

DANH MỤC HÌNH ẢNH

Hình 1.1: Minh họa tập thô 12

Hình 2.1: Giản đồ Venn cho luật khẳng định .26

Hình 2.2: Giản đồ Venn cho luật loại trừ 26

Hình 2.3: Giản đồ Venn cho luật phủ định .27

Hình 2.4: Giản đồ Venn cho các loại luật .28

Hình 2.5: Giản đồ Venn cho luật phủ định .32

Hình 2.6: Giản đồ Venn cho luật phủ định mở rộng 33

Hình 2.7: Giản đồ Venn cho κ nhỏ nhưng độ trùng lắp lớn .35

Hình 2.8: Giản đồ Venn cho α nhỏ nhưng độ trùng lắp lớn .36

Hình 2.9: Giản đồ Venn cho độ trùng lắp nhỏ 36

Hình 3.1: Sơ đồ lớp lớp MyList 42

Hình 3.2: Giao diện chương trình sinh luật nguyên tố ứng với bộ dữ liệu Nursery 43

Hình 3.3: Giao diện chương trình sinh luật tối thiểu với bộ dữ liệu NTU Data 44

Hình 3.4: Giao diện chương trình kiểm tra luật 45

Trang 8

LỜI MỞ ĐẦU

Lý thuyết tập thô (rough set theory) – do Z Pawlak đề xuất vào

những năm đầu thập niên tám mươi của thế kỷ hai mươi – đã thu hút được nhiều sự quan tâm nghiên cứu và được áp dụng ngày càng rộng rãi trong nhiều lĩnh vực Lý thuyết này được phát triển trên một nền tảng toán học vững chắc và cung cấp những công cụ hữu ích để giải quyết các bài toán phân tích dữ liệu, phát hiện luật… Hiện nay, có nhiều công trình nghiên

cứu nhắm vào các hướng khai thác dữ liệu (data mining) và khám phá tri

thức (knowledge discovery) từ dữ liệu thô để biến thành thông tin, từ thông

tin thành tri thức và vận dụng tri thức đó vào cuộc sống Một trong những hướng khai thác dữ liệu là dựa vào lý thuyết tập thô nhằm làm rõ các mối quan hệ của dữ liệu mang tính mơ hồ, phân lớp theo các thuộc tính quan trọng, tinh giảm dữ liệu thừa, phát sinh các luật quyết định…

“Phát hiện tập luật khẳng định và phủ định dựa vào lý thuyết tập

thô và ứng dụng” là đề tài em nghiên cứu dưới sự hướng dẫn của thầy giáo

TS Nguyễn Đức Thuần Vì thời gian có hạn và kiến thức còn hạn chế nên

đồ án còn nhiều thiếu sót, rất mong nhận được ý kiến đóng góp của thầy cô, bạn bè để em có thể hoàn thiện đề tài này

Đồ án gồm 3 chương: Chương 1 trình bày lý thuyết tập thô, chương

2 trình bày luật khẳng định và luật phủ định, chương 3 trình bày chương trình cài đặt thử nghiệm và cuối cùng là tài liệu tham khảo và phụ lục

Trang 9

CHƯƠNG 1 TÌM HIỂU LÝ THUYẾT TẬP THÔ

1.1) Hệ thống thông tin

Một tập dữ liệu có thể biểu diễn dưới dạng một bảng, trên đó mỗi hàng biểu diễn thông tin ứng với một đối tượng, mỗi cột biểu diễn một thuộc tính có

thể đo được của mỗi đối tượng (do các chuyên gia hay người sử dụng cung

cấp) Bảng này được gọi là một hệ thống thông tin Hình thức hơn, hệ thống

thông tin là một cặp S = (U, A), U là một tập hữu hạn khác rỗng các đối tượng gọi là tập vũ trụ hay là tập phổ dụng, A là một tập hữu hạn khác rỗng các thuộc

tính Với mỗi u U và a ∈ A, ta ký hiệu u(a) là giá trị của đối tượng u tại thuộc tính a Nếu gọi I a là tập tất cả giá trị của thuộc tính a, thì u(a) ∈ Ia với

mọi u ∈ U Bây giờ, nếu B = {b 1, b, , bk } ⊆ A, ta ký hiệu bộ các giá trị u(b i)

bởi u(B) Như vậy, nếu u và v là hai đối tượng, thì ta sẽ viết u(B) = v(B) nếu

u(bi ) = v(b i ), với mọi i =1, 2, , k

1.2) Quan hệ không phân biệt được

Xét hệ thống thông tin S = (U, A), với mỗi tập thuộc tính B ⊆ A tạo ra một quan hệ hai ngôi trên U, ký hiệu IND(B)

IND(B) = {( , )u v ∈ ×U U u a| ( ) =v a( ), ∀ ∈a B}

IND(B) được gọi là quan hệ B_không phân biệt được Dễ kiểm chứng đây

là một quan hệ tương đương trên U Với mọi đối tượng u ∈ U, lớp tương đương của u trong quan hệ IND(B) được kí hiệu bởi [u] B Tập thương xác

định bởi quan hệ IND(B) được ký hiệu U/IND(B) hay U/B, tức là

U/IND(B)= U/B = {[u]B | u ∈ U}

Trang 10

Ví dụ 1.1: Xét hệ thống thông tin cho ở bảng 1.1

A = {Đau đầu, Đau cơ, Nhiệt độ, Cúm}

Trong bảng, các bệnh nhân x 2, x3 và x 5 không phân biệt được đối với

thuộc tính Đau đầu, bệnh nhân x 3 và x 6 không phân biệt được đối với thuộc

tính Đau cơ, Cúm và bệnh nhân x 2, x5 không phân biệt được đối với thuộc tính Đau đầu, Đau cơ và Nhiệt độ

Trang 11

1.3) Tập thô

Trong lý thuyết tập thô, để biểu diễn một tập hợp bằng tri thức được cho xác định bởi một tập thuộc tính, người ta định nghĩa hai phép xấp xỉ:

Cho một hệ thống thông tin S = (U, A), với mỗi tập con X ⊆ U và B⊆ A,

ký hiệu R = IND(B), ta có 2 tập con sau:

[ ] [ ]

B B

R X R X lần lượt gọi là R-xấp xỉ dưới và R- xấp xỉ trên của tập X

Tập R X( )bao gồm tất cả các phần tử của U chắc chắn thuộc vào X

Tập R X( )bao gồm các phần tử của U có khả năng được phân loại vào những phần tử thuộc X ứng với quan hệ R

Từ hai tập xấp xỉ người ta định nghĩa các tập:

BNB (X) = R X( ) −R X( ): B- miền biên của X

POS B (X) = R X( ): B-vùng dương của X

NEG B (X) = UR X( ): B-vùng âm của X

Ký hiệu tập thương của IND(B) trên U là U/B, các xấp xỉ trên và dưới của X có thể viết lại:

Trang 12

Bảng 1.2: Một hệ thông tin đơn giản

Với B = {a, b, c} ta có phân hoạch sau:

Trang 13

Đối với một hệ thống thông tin S = (U, A), B, D ⊆ A, ký hiệu R = IND(B), người ta gọi B-miền khẳng định dương của D là tập được xác định

(3H) R X( ) ⊇ X

(4L) R X( ∩Y) =R X( ) ∩R Y( )

Trang 14

(4H) R X( ∪Y) =R X( ) ∪R Y( )(5L) RR X( ) =R X( )

(5H) RR X( ) =R X( )(6) R U( −X) =URX

R U( −X) =URX(7L) X ⊆ ⇒Y R X( ) ⊆R Y( )(7H) X ⊆ ⇒Y R X( ) ⊆ R Y( )(8L) R U( −R X( )) =UR X( )(8H) R U( −R X( )) =UR X( )(9L) ∀ ∈K U R R K/ , ( ) =K

(9H) ∀ ∈K U R R K/ , ( ) =K

Tính chất (3L), (4L) và (8L) là những tính chất đặc trưng cho phép xấp

xỉ dưới, điều đó có nghĩa là những tính chất khác của phép xấp xỉ dưới có thể suy dẫn từ ba tính chất này Tương tự, (3H), (4H) và (8H) là những tính chất đặc trưng của phép xấp xỉ trên

1.5) Độ chính xác của xấp xỉ

Cho một hệ thống thông tin S = (U, A), với mỗi tập con X ⊆ U và

B⊆A, đặt R = IND(B), đại lượng đo sự chính xác của tập xấp xỉ X đối với

phân hoạch trên B là giá trị

( ) ( ( ))

( )

( ( )) ( )

R

R X Card R X

X

Trong đó card(X) = |X| là lực lượng (số phần tử) của tập X Rõ ràng

0 ≤αR( ) 1X ≤ Nếu αR( ) 1X = , ta nói X là chính xác đối với R, còn ( ) 1

R X

α < , X được gọi là thô đối với R

Trang 15

Ví dụ 1.4: Xét hệ thông tin S = (U, A) ở bảng 1.2

Với B = {a, b, c} và X = {x2, x3, x4} thì độ chính xác của X trên B là:

14

2},,,{

},{

|)(

|

|)(

|

8 4 3 2

4

=

x x x x

x x X

R

X R

1.6) Bảng quyết định

Bảng quyết định là một hệ thống thông tin có dạng T = (U, A), trong đó tập thuộc tính A được chia thành hai tập thuộc tính rời nhau C và D, C được gọi là tập thuộc tính điều kiện, còn D là tập thuộc tính quyết định Tức là

T=(U, C ∪ D), với C ∩ D = ∅ Trong trường hợp không sợ bị nhầm lẫn người

ta còn ký hiệu T = (U, C, D)

Ví dụ 1.5: Hệ thống thông tin S = (U, A) biểu diễn cơ sở tri thức về bệnh

cúm được thể hiện trong bảng 1.1 là một bảng quyết định T = (U, C ∪ D)

Trong đó: U = {x 1, x2, x3, x4, x5, x6},

A = {Đau đầu, Đau cơ, Nhiệt độ, Cúm}

Tập thuộc tính điều kiện C = {Đau đầu, Đau cơ, Nhiệt độ}

Trang 16

Ở đây, RED(C) là tập hợp tất cả rút gọn của C

Ngoài ra, người ta cũng định nghĩa rút gọn C-miền khẳng định

B được gọi là rút gọn C-miền khẳng định dương của D

Ví dụ 1.6: Xét hệ thông tin S = (U, A) ở bảng 1.3

Cho D = {Cúm}, C = {Đau đầu, Đau cơ,Nhiệt độ}

Ta có:

U/D = {{x1, x2, x3, x6}, {x4, x5}}, U/C = {{x1}, {x2, x5}, {x3}, {x4}, {x6}}

=> POSC(D) = {x1, x3, x4, x6}

Đặt R1 = {Đau đầu, Đau cơ} ⊆ C

=> U/R1 = {{x1, x4, x6}, {x2, x5}, {x3}}

=> POSR1(D) = {x3} ≠ POSC(D)

Vậy R1 không phải là rút gọn của C

Đặt R2 = {Đau đầu, Nhiệt độ} ⊆ C

=> U/R2 = {{x1}, {x2, x5}, {x3}, {x4}, {x6}}

=> POSR2(D) = {x1, x3, x4, x6} = POSC(D)

Trang 17

Vậy R6 không phải là rút gọn của C

Do đó: RED(C) = {{Đau đầu, Nhiệt độ}, {Đau cơ, Nhiệt độ}}

=> CORE(C) = {Đau đầu, Nhiệt độ} ∩ {Đau cơ, Nhiệt độ}

1.8) Ma trận phân biệt được và hàm phân biệt được

1.8.1) Ma trận phân biệt được

Xét bảng quyết định T = (U, C ∪ D), với U = {u 1, u2, , un} Ma trận phân biệt được của T ký hiệu M(T) = (mij )n n× là một ma trận đối xứng, trong

đó mỗi phần tử của nó là một tập thuộc tính được xác định như sau:

ij

{ | ( ) ( )} , ( ) ( ) , ( ) ( )

Trang 18

Ví dụ 1.7: Cho hệ thống thông tin S = (U, C ∪ D) ở bảng 1.4 với:

U = {1, 2, 3, 4}, C = {a, b, c}, D = {d}

Bảng 1.4: Hệ thông tin dùng để minh họa ma trận phân biệt được

Hệ thông tin trên sẽ có ma trận phân biệt được kích thước 4 × 4 được

Bảng 1.5: Ma trận phân biệt được của hệ thông tin ở bảng 1.4

1.8.2) Hàm phân biệt được

Hàm phân biệt được fΤ là một hàm boole, được xác định từ ma trận phân biệt M(T) như sau:

trong đó, mỗi thuộc tính được đặt tương ứng một biến logic cùng tên và

(1) ∨m ij là biểu thức tuyển của tất cả các biến c ∈ m ij , nếu m ij ≠∅,

Trang 19

Ví dụ 1.8: Xét hệ thông tin S = (U, C ∪ D) ở bảng 1.6

Bảng 1.6: Một hệ thông tin để tìm hàm phân biệt được

Ma trận phân biệt được của hệ thông tin ở bảng 1.6 như sau:

Bảng 1.7: Ma trận phân biệt được của hệ thông tin ở bảng 1.6

Hàm phân biệt cho hệ thông tin này là:

) (

) ( ) ( ) (

) ( ) (

) ( )

(

d b a b a d a d c b a

c d c a true d

a true d

c a f

Cho T = (U, C ∪ D) là một bảng quyết định, giả sử U/C={X 1, X2, , Xm}

và U/D = {Y 1, Y2, , Yn } Nếu X i ∩ Y j ≠ ∅, ký hiệu des(X i ), des(Y j) lần lượt là

các mô tả của các lớp tương đương ứng với X i , Y j Một luật quyết định xác định

bởi X i, Yj có dạng:

Trang 20

Độ đo độ chắc chắn và độ hỗ trợ của luật quyết định Z ij được định

nghĩa như sau:

( ) ( ( ))

( )

X

card POS Y k

Y U V

POS

/

) ( )

V R k

/

) (

X  →Y là phụ thuộc hàm đã biết trong CSDL quan hệ

Ví dụ 1.9: Xét hệ thống thông tin S = (U, C ∪ D) ở bảng 1.8:

U = {u1, u2, u3, u4, u5, u6, u7, u8, u9},

C = {a, b}, D = {c}

Đặt B = {b}

Trang 22

CHƯƠNG 2 LUẬT KHẲNG ĐỊNH VÀ LUẬT PHỦ ĐỊNH

2.1) Giới thiệu

Các phương pháp sinh luật được phân thành hai lớp: - Lớp các luật

tất định (deteministic rules) và Lớp các luật xác suất (probabilistic rules) Luật tất định và luật xác suất đều có dạng if X then Y Xét U là tập vũ trụ,

ký hiệu tập các đối tượng thỏa điều kiện X là C, tập các đối tượng thỏa kết luận Y của luật là D

Nếu C ⊆ D thì luật if X then Y là luật tất định Trong trường hợp C

không là tập con của D, C ∩ D ≠ ∅ và |C ∩ D| / |C| ≥ δ, δ là ngưỡng thể

hiện độ khít của sự trùng lắp của 2 tập hợp, luật if X then Y là luật xác suất

Cả hai lập luận để rút trích luật tất định và luật xác suất là lập luận khẳng

định (positive reasoning)

Tuy nhiên, trong một số lĩnh vực ngoài lập luận khẳng định còn cần

thiết phải lập luận bác bỏ (negative reasoning), nhất là trong lĩnh vực y tế Mỗi luật phủ định cũng có dạng if X then Y, nhưng Y là một hạng tử phủ

định (negative term) Ví dụ, một bệnh nhân than nhức đầu nhưng không có

triệu chứng tim đập mạnh, thì đau nửa đầu không nên chẩn đoán với độ xác suất cao

Cơ chế của lập luận đưa ra quyết định là một thủ tục gồm 2 giai đoạn: Lập luận loại trừ và lập luận chấp nhận Do đó, luật phủ định đóng một vai trò quan trọng trong việc hạn chế không gian tìm kiếm nghiệm Ngoài ra, luật phủ định còn phản ánh quá trình tư duy của các chuyên gia

và nhanh chóng đưa ra quyết đinh nhờ sự tương tác giữa người và máy

Trong bài viết này, tác giả trình bày một số kết quả mở rộng luật khẳng định và phủ định của Tsumoto [2] Các kết quả được kiểm thử tính

Trang 23

đúng đắn thông qua xử lý một số bộ dữ liệu UCI và dữ liệu hỗ trợ chất lượng dạy và học tại Đại học Nha Trang

Cấu trúc chương 2 gồm các mục: Mục 2 trình bày các khái niệm cơ

sở về tập thô, luật khẳng định, luật phủ định; mục 3 trình bày một số kết quả mới đạt được; mục 4 trình bày cách xác định loại luật; mục 5 là kết luận

2.2) Các khái niệm cơ bản

2.2.1) Công thức

Trong các phần trình bày sau, tác giả sử dụng các ký pháp liên quan đến tập thô do Z Pawlak trình bày trong [1] Các ký pháp này được minh

họa bằng một tập dữ liệu nhỏ thể hiện ở bảng 2.1

Cho U là một tập hữu hạn khác rỗng được gọi là tập vũ trụ, A là tập

khác rỗng hữu hạn các thuộc tính a: U Va với a ∈ A, V a là miền giá trị

thuộc tính a Một bảng quyết định là một hệ thống thông tin S= (U,A∪{d}), với bảng 2.1 ta có: U = {1, 2, 3, 4, 5, 6}, A = {Age, Location, Nature,

Prodrome, Nausea, M1} và d = Class Đối với thuộc tính Location ∈ A,

miền trị của Location được xác định V Location = {Occular, Whole, Lateral}

Persistent Persistent Throbbing Throbbing Radiating Persistent

No

No

No Yes

No

No

No

No Yes Yes

No Yes

Yes Yes

No

No Yes Yes

M.c.h M.c.h Migra Migra M.c.h Pyscho

Bảng 2.1: Một hệ thống thông tin đơn giản

Trang 24

Một công thức nguyên tố (atomic formula) xác định trên B ⊆ A∪{d}

và V là một biểu thức có dạng [a = v], a ∈ B, v ∈ V a Với bảng 2.1 thì [Location = Occular] là 1 công thức Ký hiệu F(B, V) là tập nhỏ nhất chứa

tất cả các công thức nguyên tố xác định trên B và đóng đối với các phép

toán hội, tuyển và phủ định

Với mỗi f ∈ F(B, V), fS là tập các phần tử của S thỏa f, được định

nghĩa như sau:

Định nghĩa 2.1: Cho R, D là các công thức thuộc F(B, V), D là một

công thức xác định trên tập thuộc tính quyết định d Độ chính xác, độ phủ

của phân lớp xác định bởi R → D (không nhầm lẫn ta ký hiệu D thay cho

DS) được biểu diễn lần lượt theo các công thức:

))

| ( (

|

|

|

| )

R

D R D

|

|

|

| )

D

D R

Trang 25

[Age = 50 – 59] [Location = Whole] → [Class = Psycho]

b) Định nghĩa 2.4: Luật khẳng định nguyên tố

Một luật khẳng định đồng thời cũng là luật nguyên tố được gọi là

Trang 26

Hình 2.1: Giản đồ Venn cho luật khẳng định

R → D là luật khẳng định khi và chỉ khi RS là tập con của DS

2.2.5) Luật loại trừ và luật phủ định

a) Định nghĩa 2.5: Luật loại trừ (exclusive rule)

Luật có dạng R → D, trong đó R =

j

[a j = vk] thỏa κR(D) = 1 được gọi là luật loại trừ

Nhận xét: R → D là luật loại trừ ⇔ DS ⊆ RS

Hình 2.2: Giản đồ Venn cho luật loại trừ

Nếu R → D là luật loại trừ, khi đó:

Luật D → R là luật khẳng định, theo đại số mệnh đề:

D → R ⇔ ¬R → ¬D

Trang 27

b) Định nghĩa 2.6: Luật phủ định (negative rule)

được gọi là luật phủ định

Trong trường hợp j = 1, luật phủ định được gọi là luật phủ định nguyên tố

S

S S f

D

D f

S

S S g

D

D g

Hình 2.3: Giản đồ Venn cho luật phủ định

Nếu ¬R → ¬D là luật phủ định thì DS là tập con của RS

Ngày đăng: 29/07/2014, 18:47

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] Pawlak. Z (1991), “Rough sets, Theoretical Aspects of Reasoning about Data”, Kluwer Academic Publishers, London Sách, tạp chí
Tiêu đề: Rough sets, Theoretical Aspects of Reasoning about Data”, "Kluwer Academic Publishers
Tác giả: Pawlak. Z
Năm: 1991
[2] Shusaku Tsumoto, (2005), “Discovery of Positive and Negative Rules from Medical Databases Based on Rough Sets”, Advanced Techniques in Knowledge Discovery and Datamining, 2005, 233-250 Sách, tạp chí
Tiêu đề: Discovery of Positive and Negative Rules from "Medical Databases Based on Rough Sets
Tác giả: Shusaku Tsumoto
Năm: 2005
[3] The UCI machine learning repository , &lt;http://mlearn.ics.uci.edu/MLRepository.html &gt Sách, tạp chí
Tiêu đề: The UCI machine learning repository
[4] Tinghuai Ma, Jiazhao Leng, Mengmeng Cui and Wei Tian (2009), Inducing Positive and Negative Rules Based on Rough Set, Infomation Technology Journal 8(7): 1039-1043 Sách, tạp chí
Tiêu đề: Inducing "Positive and Negative Rules Based on Rough Set
Tác giả: Tinghuai Ma, Jiazhao Leng, Mengmeng Cui and Wei Tian
Năm: 2009
[5] Tihomir Trifono, Tsvetenka Georgieva (2009), “Application for Discovering the Constraint – Based on Assocication Rules in an Archive for Unique Bulgarian Bells”, European Journal of Scientific Research ISSN 1450-216X Vol.31 No.3 Sách, tạp chí
Tiêu đề: Application for Discovering "the Constraint – Based on Assocication Rules in an Archive for Unique "Bulgarian Bells
Tác giả: Tihomir Trifono, Tsvetenka Georgieva
Năm: 2009
[6] Daniel Delic, Hans-J. Lenz and Mattis Neiling, “Improving the Quality of Association Rule Mining by Mean of Rough Sets” Sách, tạp chí
Tiêu đề: Improving the Quality of "Association Rule Mining by Mean of Rough Sets
[7] MA Yu-liang, YAN Wen-jun, “Value reduction algorithm in rough set based on association rules support” Sách, tạp chí
Tiêu đề: Value reduction algorithm in rough set based "on association rules support
[8] Yilong Gao and Liangsheng Qu, “A Reduction Method of Rough Set Model” Sách, tạp chí
Tiêu đề: A Reduction Method of Rough Set Model
[9] Jerzy W. Grzymala-Busse, “Introduction to Rough Set Theory and Applications” Sách, tạp chí
Tiêu đề: Introduction to Rough Set Theory and "Applications
[10] Urszula Stanczyk, “On Construction of Optimised Rough Set - Based Classifier” Sách, tạp chí
Tiêu đề: On Construction of Optimised Rough Set - Based "Classifier
[11] Serkan Narli and Z. Ahmet Ozelik, “Data mining in topology education: Rough Set data Analysis” Sách, tạp chí
Tiêu đề: Data mining in topology education: "Rough Set data Analysis
[12] Jiye Li and Nick Cercone, “A Rough Set Based Model to Rank the Importance of Association Rules” Sách, tạp chí
Tiêu đề: A Rough Set Based Model to Rank the Importance of Association Rules
Tác giả: Jiye Li, Nick Cercone

HÌNH ẢNH LIÊN QUAN

Bảng 1.1: Bảng dữ liệu bệnh cúm - Phát hiện tập luật khẳng định và phủ định dựa vào lý thuyết tập  thô và ứng dụng
Bảng 1.1 Bảng dữ liệu bệnh cúm (Trang 10)
Bảng 1.2: Một hệ thông tin đơn giản - Phát hiện tập luật khẳng định và phủ định dựa vào lý thuyết tập  thô và ứng dụng
Bảng 1.2 Một hệ thông tin đơn giản (Trang 12)
1.6) Bảng quyết định - Phát hiện tập luật khẳng định và phủ định dựa vào lý thuyết tập  thô và ứng dụng
1.6 Bảng quyết định (Trang 15)
Bảng 1.5 : Ma trận phân biệt được của hệ thông tin ở bảng 1.4. - Phát hiện tập luật khẳng định và phủ định dựa vào lý thuyết tập  thô và ứng dụng
Bảng 1.5 Ma trận phân biệt được của hệ thông tin ở bảng 1.4 (Trang 18)
Bảng 1.4: Hệ thông tin dùng để minh họa ma trận phân biệt được - Phát hiện tập luật khẳng định và phủ định dựa vào lý thuyết tập  thô và ứng dụng
Bảng 1.4 Hệ thông tin dùng để minh họa ma trận phân biệt được (Trang 18)
Bảng 1.6: Một hệ thông tin để tìm hàm phân biệt được - Phát hiện tập luật khẳng định và phủ định dựa vào lý thuyết tập  thô và ứng dụng
Bảng 1.6 Một hệ thông tin để tìm hàm phân biệt được (Trang 19)
Bảng 1.7: Ma trận phân biệt được của hệ thông tin ở bảng 1.6. - Phát hiện tập luật khẳng định và phủ định dựa vào lý thuyết tập  thô và ứng dụng
Bảng 1.7 Ma trận phân biệt được của hệ thông tin ở bảng 1.6 (Trang 19)
Bảng 1.8: Hệ thông tin dùng để minh họa phụ thuộc độ k - Phát hiện tập luật khẳng định và phủ định dựa vào lý thuyết tập  thô và ứng dụng
Bảng 1.8 Hệ thông tin dùng để minh họa phụ thuộc độ k (Trang 21)
Bảng 2.1:  Một hệ thống thông tin đơn giản. - Phát hiện tập luật khẳng định và phủ định dựa vào lý thuyết tập  thô và ứng dụng
Bảng 2.1 Một hệ thống thông tin đơn giản (Trang 23)
Hình 2.1: Giản đồ Venn cho luật khẳng định. - Phát hiện tập luật khẳng định và phủ định dựa vào lý thuyết tập  thô và ứng dụng
Hình 2.1 Giản đồ Venn cho luật khẳng định (Trang 26)
Hình 2.2: Giản đồ Venn cho luật loại trừ. - Phát hiện tập luật khẳng định và phủ định dựa vào lý thuyết tập  thô và ứng dụng
Hình 2.2 Giản đồ Venn cho luật loại trừ (Trang 26)
Hình 2.4: Giản đồ Venn cho các loại luật. - Phát hiện tập luật khẳng định và phủ định dựa vào lý thuyết tập  thô và ứng dụng
Hình 2.4 Giản đồ Venn cho các loại luật (Trang 28)
Bảng 2.2: Danh sách các thuộc tính của NTU Data - Phát hiện tập luật khẳng định và phủ định dựa vào lý thuyết tập  thô và ứng dụng
Bảng 2.2 Danh sách các thuộc tính của NTU Data (Trang 29)
Bảng 2.3: Kết quả tìm luật khẳng định nguyên tố trên các bộ dữ liệu  Nhận  xét:  Từ  bảng  trên  ta  thấy  với  bộ  dữ  liệu  của  trường  Đại  học - Phát hiện tập luật khẳng định và phủ định dựa vào lý thuyết tập  thô và ứng dụng
Bảng 2.3 Kết quả tìm luật khẳng định nguyên tố trên các bộ dữ liệu Nhận xét: Từ bảng trên ta thấy với bộ dữ liệu của trường Đại học (Trang 30)

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w