Bài toán khai thác WұS SKә ELӃQ là bài toánUҩW quan WUӑQJ OƭQK YӵF KTDL : YҥFK ra tính FKҩW ҭQ quan WUӑQJ FӫD WұS DL 7ҩW Fҧ các WұS con FӫD WұS SKә ELӃQ ÿӅX là WұS SKә ELӃQ 7ұS SKә ELӃ
Trang 2 Bài toán khai thác WұS SKә ELӃQ là bài toán
UҩW quan WUӑQJ OƭQK YӵF KTDL : YҥFK ra tính
FKҩW ҭQ quan WUӑQJ FӫD WұS DL
7ҩW Fҧ các WұS con FӫD WұS SKә ELӃQ ÿӅX là
WұS SKә ELӃQ
7ұS SKә ELӃQ WӕL ÿҥL WұS bao SKә ELӃQ
Bài toán khai thác LKH là bài toán WuPW̽WF̻
FiFOXұWGҥQJ X Y (X, Y I và X Y ={})
WKӓDPmQÿӝSKәELӃQYjÿӝWLQFұ\WӕLWKLӇX
supp (X Y ) tt minsupp
conf (X Y ) tt minconf
Trang 3QKLӅX OҫQ và WҥR OѭӧQJ OӟQ WұS ӭQJ viên
Ví Gө : ĈӇ tìm WұS SKә ELӃQ i1 i2« i100 :
6ӕOҫQGX\ӋW&6'/
6ӕOѭӧQJӭQJYLrQ100-1 = 1.27*1030!
9ҩQ ÿӅ : WҥR ӭQJ viên và NLӇP tra
&yWKӇWUiQKYLӋFWҥRӭQJYLrQKD\NK{QJ"
Trang 5(conditional pattern bases) cho PӛL KҥQJ
PөF SKә ELӃQ PӛL nút trên cây FP).
B2 : 7KL͗W OͅS cây FP ÿL͙X NL͟Q (conditional
FP tree) W PͯL F˿ Vͷ P̓X ÿL͙X NL͟Q
B3 : Khai thác ÿӋ qui cây FP ÿLӅX NLӋQ và
phát WULӇQ PүX SKә ELӃQ cho ÿӃQ khi cây FP
Trang 6TID Items bought (ordered) frequent items
Trang 7b:1 c:3 a:3 b:1 m:2 p:2 m:1
TID Items bought (ordered) frequent items
Trang 9c:3 a:3
b:1
m:2 p:2 m:1
Trang 10c:3 a:3 b:1 m:2 p:2 m:1
b:1
c:3 a:3
b:1
m:2 p:2 m:1
Trang 12{ (f:3) } | c { (f:3) }
c
{ (f:3, c:3) } | a { (fc:3) }
a
{ } { (fca:1), (f:1), (c:1) }
b
{ (f:3, c:3, a:3) } | m { (fca:2), (fcab:1) }
m
{ (c:3) } | p { (fcam:2), (cb:1) }
p
Conditional FP-tree Conditional pattern-base
Item
9Ë'ͬ 7+,ӂ7/Ұ3&Æ<)3±
ÿLӅXNLӋQ
Trang 13± Khi ÿy D E là WͅS SKͭ EL͗Q trong CSDL khi và
FK͡ khi Elà SKͭ EL͗Q trong B.
³abcdef ´O jPүXSKәELӃQNKLYjFKӍNKL
Trang 14± For PӛLWәKӧSE FӫDFiFÿӍQKWUrQ3
7ҥRPүXEE DD YӟLsupp = suppminFiFÿӍQK
Trang 16Data set T25I20D10K
32
9'/8Ұ7.ӂ7+Ӧ3
Trang 19ĈӜĈ27Ë1+/é7+Ò
1. 7KӃ nào là OXұW hay, lý thú ?
¾ 7KXұW toán khai thác OXұW NӃW KӧS có xu KѭӟQJ
sinh ra quáQKLӅX OXұW
¾ Trongÿy có QKLӅX OXұW không hay KRһF Eӏ WKӯD
¾ &ҫQ ÿӝ ÿR tính lý thú ÿӇ ORҥL EӟW KҥQ FKӃ OXұW
Trang 20( )]
( 1 )[
(
) ( ) ( ) , (
) ( ) ( ) ,
(
) ( ) (
) , (
) (
)
| (
Y P Y
P X P X
P
Y P X P Y X P t
coefficien
Y P X P Y X
P
PS
Y P X P
Y X P Interest
Y P
X Y
Trang 21* 5000 / 3000
5000 / 2000 )
, ( interest B C
33 1 5000 / 1250
* 5000 / 3000
5000 / 1000 )
, ( interest B C
7 tính ÿ͡ ÿR interest cho các OX̵W
Trang 227Ï07Ҳ7
1 Bài toán khai thác WұS SKә ELӃQ và OXұW
NӃW KӧS: quan WUӑQJ và UҩW ÿѭӧF quan
3 &KXҭQ Eӏ bài 4 : Phân OӟS Gӳ OLӋX
3KҫQ 1.
Trang 24EL͇Q W̵S SK͝ EL͇Q W͙L ÿ̩L W̵S SK͝ EL͇Q
Trang 257¬,/,ӊ87+$0.+Ҧ2
frequent patterns without candidate
generation SIGMOD'00, 1-12, Dallas,
TX, May 2000
&KѭѫQJ 6 - Introduction to Data Mining
50
Q