1. Trang chủ
  2. » Giáo Dục - Đào Tạo

DATA MINING AND APPLICATION: BÀI TOÁN KHAI THÁC doc

25 457 3
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 25
Dung lượng 449,82 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

„ Bài toán khai thác WұS SKә ELӃQ là bài toánUҩW quan WUӑQJ OƭQK YӵF KTDL : YҥFK ra tính FKҩW ҭQ quan WUӑQJ FӫD WұS DL 7ҩW Fҧ các WұS con FӫD WұS SKә ELӃQ ÿӅX là WұS SKә ELӃQ 7ұS SKә ELӃ

Trang 2

„ Bài toán khai thác WұS SKә ELӃQ là bài toán

UҩW quan WUӑQJ OƭQK YӵF KTDL : YҥFK ra tính

FKҩW ҭQ quan WUӑQJ FӫD WұS DL

7ҩW Fҧ các WұS con FӫD WұS SKә ELӃQ ÿӅX là

WұS SKә ELӃQ

7ұS SKә ELӃQ WӕL ÿҥL WұS bao SKә ELӃQ

Bài toán khai thác LKH là bài toán WuPW̽WF̻

FiFOXұWGҥQJ X Ÿ Ÿ Y (X, Y  I và X ˆY ={})

WKӓDPmQÿӝSKәELӃQYjÿӝWLQFұ\WӕLWKLӇX

supp (X ŸŸ Y ) tt minsupp

conf (XŸŸ Y ) tt minconf

Trang 3

QKLӅX OҫQ và WҥR OѭӧQJ OӟQ WұS ӭQJ viên

Gө : ĈӇ tìm WұS SKә ELӃQ i1 i2« i100 :

‡ 6ӕOҫQGX\ӋW&6'/

‡ 6ӕOѭӧQJӭQJYLrQ100-1 = 1.27*1030!

9ҩQ ÿӅ : WҥR ӭQJ viên và NLӇP tra

„ &yWKӇWUiQKYLӋFWҥRӭQJYLrQKD\NK{QJ"

Trang 5

(conditional pattern bases) cho PӛL KҥQJ

PөF SKә ELӃQ PӛL nút trên cây FP).

B2 : 7KL͗W OͅS cây FP ÿL͙X NL͟Q (conditional

FP tree) W΃ PͯL F˿ Vͷ P̓X ÿL͙X NL͟Q

B3 : Khai thác ÿӋ qui cây FP ÿLӅX NLӋQ và

phát WULӇQ PүX SKә ELӃQ cho ÿӃQ khi cây FP

Trang 6

TID Items bought (ordered) frequent items

Trang 7

b:1 c:3 a:3 b:1 m:2 p:2 m:1

TID Items bought (ordered) frequent items

Trang 9

c:3 a:3

b:1

m:2 p:2 m:1

Trang 10

c:3 a:3 b:1 m:2 p:2 m:1

b:1

c:3 a:3

b:1

m:2 p:2 m:1

Trang 12

{ (f:3) } | c { (f:3) }

c

{ (f:3, c:3) } | a { (fc:3) }

a

{ } { (fca:1), (f:1), (c:1) }

b

{ (f:3, c:3, a:3) } | m { (fca:2), (fcab:1) }

m

{ (c:3) } | p { (fcam:2), (cb:1) }

p

Conditional FP-tree Conditional pattern-base

Item

9Ë'ͬ 7+,ӂ7/Ұ3&Æ<)3±

ÿLӅXNLӋQ

Trang 13

± Khi ÿy D ‰ E là WͅS SKͭ EL͗Q trong CSDL khi và

FK͡ khi Elà SKͭ EL͗Q trong B.

„ ³abcdef ´O jPүXSKәELӃQNKLYjFKӍNKL

Trang 14

± For PӛLWәKӧSE FӫDFiFÿӍQKWUrQ3

‡ 7ҥRPүXEE ‰‰ DD YӟLsupp = suppmin FiFÿӍQK

Trang 16

Data set T25I20D10K

32

9'/8Ұ7.ӂ7+Ӧ3

Trang 19

ĈӜĈ27Ë1+/é7+Ò

1. 7KӃ nào là OXұW hay, lý thú ?

¾ 7KXұW toán khai thác OXұW NӃW KӧS có xu KѭӟQJ

sinh ra quáQKLӅX OXұW

¾ Trongÿy có QKLӅX OXұW không hay KRһF Eӏ WKӯD

¾ &ҫQ ÿӝ ÿR tính lý thú ÿӇ ORҥL EӟW KҥQ FKӃ OXұW

Trang 20

( )]

( 1 )[

(

) ( ) ( ) , (

) ( ) ( ) ,

(

) ( ) (

) , (

) (

)

| (

Y P Y

P X P X

P

Y P X P Y X P t

coefficien

Y P X P Y X

P

PS

Y P X P

Y X P Interest

Y P

X Y

Trang 21

* 5000 / 3000

5000 / 2000 )

, ( interest B C

33 1 5000 / 1250

* 5000 / 3000

5000 / 1000 )

, ( interest B ™C

‡ 7͹ tính ÿ͡ ÿR interest cho các OX̵W

Trang 22

7Ï07Ҳ7

1 Bài toán khai thác WұS SKә ELӃQ và OXұW

NӃW KӧS: quan WUӑQJ và UҩW ÿѭӧF quan

3 &KXҭQ Eӏ bài 4 : Phân OӟS Gӳ OLӋX

3KҫQ 1.

Trang 24

EL͇Q W̵S SK͝ EL͇Q W͙L ÿ̩L W̵S SK͝ EL͇Q

Trang 25

7¬,/,ӊ87+$0.+Ҧ2

frequent patterns without candidate

generation SIGMOD'00, 1-12, Dallas,

TX, May 2000

&KѭѫQJ 6 - Introduction to Data Mining

50

Q

Ngày đăng: 25/07/2014, 15:21

TỪ KHÓA LIÊN QUAN

w