Mining Association Rules from transaction databases with unequal minimum supports is a problem proposed and reseached by the author [3].. The algorithm for mining closed frequent itemset
Trang 1PH ´ AT HIˆ E N LU A ˆ T K E ˆ ´T HO P M . O ` .
C ´ O D ˆ O H O ˆ ˜ TRO CU . C TI . E ˆ ’ U KH ˆ ONG GI ˆ O ´ NG NHAU
D ˆ O ˜ V˘AN TH`ANH
Bˆo Kˆe´ hoa.ch v`a Dˆa` u tu
Abstract Mining Association Rules from transaction databases with unequal minimum supports
is a problem proposed and reseached by the author [3] The algorithm for mining closed frequent itemsets with unequal minimum supports of each item in transaction databases was called CHARM-NEW This algorithm was indeed improved and developed from the CHARM which is one of the most efficient algorithms for mining closed frequent itemsets with the same minimum support from transaction databases.
The goal of this paper is to propose and to find out measures for mining fuzzy association rules from quantitative databases with unequal minimum supports The paper will concentrate on developing an algorithm for mining closed fuzzy frequent itemsets with unequal minimum supports
of each attribute in quantitative databases.
T´ om t˘ a ´t Ph´at hiˆe.n luˆa.t kˆe´t ho p t`u c´ac co so.’ d˜u liˆe.u t´ac vu v´o.i dˆo hˆo˜ tro cu c tiˆe’u khˆong giˆo´ng nhau l`a vˆa´n dˆe ` du.o c t´ac gia’ dˆe ` xuˆa´t v`a nghiˆen c´u.u ([3]) Thuˆa.t to´an ph´at hiˆe.n c´ac tˆa.p phˆo’ biˆe´n d´ong v´o.i dˆo hˆo˜ tro cu c tiˆe’u khˆong giˆo´ng nhau cu’a mˆo˜i tˆa.p mu.c d˜u liˆe.u trong c´ac co so.’ d˜u liˆe.u t´ac
vu du.o c go.i l`a CHARM-NEW Thˆa.t ra thuˆa.t to´an n`ay du.o c ca’i tiˆe´n v`a ph´at triˆe’n t`u thuˆa.t to´an CHARM, d´o l`a mˆo.t trong nh˜u.ng thuˆa.t to´an hiˆe.u qua’ nhˆa´t dˆe’ t`ım tˆa.p phˆo’ biˆe´n d´ong v´o.i dˆo hˆo˜ tro
cu. c tiˆe’u nhu nhau t`u c´ac co so.’ d˜u liˆe.u t´ac vu
Mu.c d´ıch cu’a b`ai b´ao n`ay l`a dˆe ` xuˆa´t v`a t`ım kiˆe´m gia’i ph´ap dˆe’ ph´at hiˆe.n c´ac luˆa.t kˆe´t ho p m`o t` u c´ac co so ’ d˜u liˆe.u di.nh lu.o ng v´o.i dˆo hˆo˜ tro cu c tiˆe’u khˆong giˆo´ng nhau B`ai b´ao s˜e tˆa.p trung ph´at triˆe’n thuˆa.t to´an ph´at hiˆe.n tˆa.p phˆo’ biˆe´n m`o d´ong v´o.i dˆo hˆo˜ tro cu c tiˆe’u khˆong giˆo´ng nhau cu’a mˆo˜i tˆa.p mu.c d˜u liˆe.u trong c´ac co so.’ d˜u liˆe.u di.nh lu.o ng.
1 GI ´O.I THIˆE U Qu´a tr`ınh ph´at hiˆe.n luˆa.t kˆe´t ho p du.o c chia th`anh hai giai doa.n Mu.c d´ıch cu’a giai doa.n dˆa` u l`a t`ım c´ac tˆa.p phˆo’ biˆe´n c´o dˆo hˆo˜ tro l´o.n ho.n ho˘a.c b˘a`ng mˆo.t gi´a tri chung n`ao d´o (go.i l`a dˆo hˆo˜ tro cu c tiˆe’u, k´y hiˆe.u l`a minSupp), c`on cu’a giai doa.n 2 l`a t`ım c´ac luˆa.t kˆe´t ho p t`u c´ac tˆa.p t`ım du.o c o.’ giai doa.n 1 v`a c´o dˆo tin cˆa.y l´o.n ho.n ho˘a.c b˘a`ng mˆo.t gi´a tri chung kh´ac (go.i l`a dˆo tin cˆa.y cu c tiˆe’u, k´y hiˆe.u minConf) Trong qu´a tr`ınh d´o, giai doa.n t`ım c´ac tˆa.p phˆo’ biˆe´n l`a ph´u.c ta.p v`a tˆo´n nhiˆe` u chi ph´ı nhˆa´t
Nh˜u.ng n˘am qua ngu.`o.i ta d˜a tˆa.p trung nghiˆen c´u.u v`a dˆe` xuˆa´t du.o c nhiˆe`u thuˆa.t to´an t`ım tˆa.p phˆo’ biˆe´n hiˆe.u qua’ t`u c´ac co so.’ d˜u liˆe.u (CSDL) t´ac vu (hay nhi phˆan) theo nhiˆe` u c´ach tiˆe´p cˆa.n kh´ac nhau [1, 9, 15] Nh˜u.ng thuˆa.t to´an m´o.i v`a hiˆe.u qua’ nhˆa´t vˆe` vˆa´n dˆe` d´o cho dˆe´n nay l`a nh˜u.ng thuˆa.t to´an chı’ cˆa` n t`ım c´ac tˆa.p phˆo’ biˆe´n d´ong [3, 9, 14, 15] nh`o ch´u.ng minh du.o c
Trang 2r˘a`ng c´ac luˆa.t kˆe´t ho p du.o c sinh ra t`u c´ac tˆa.p phˆo’ biˆe´n d´ong v`a t`u c´ac tˆa.p phˆo’ biˆe´n l`a nhu nhau, trong khi khˆong gian c´ac tˆa.p phˆo’ biˆe´n d´ong l`a nho’ ho.n rˆa´t nhiˆe` u so v´o.i khˆong gian c´ac tˆa.p phˆo’ biˆe´n
Tuy nhiˆen c´ac thuˆa.t to´an trˆen dˆe` u du.o c xˆay du ng du a trˆen th`u.a nhˆa.n minSupp cu’a c´ac tˆa.p phˆo’ biˆe´n l`a nhu nhau Mˆo.t sˆo´ ha.n chˆe´ cu’a luˆa.t kˆe´t ho p du.o c t`ım t`u c´ac tˆa.p phˆo’ biˆe´n c´o dˆo hˆo˜ tro cu c tiˆe’u nhu nhau d˜a du.o c chı’ ra trong [2—8, 11—13] Hiˆe.n c´o bˆo´n c´ach tiˆe´p cˆa.n dˆe’ kh˘a´c phu.c nh˜u.ng ha.n chˆe´ cu’a viˆe.c t`ım tˆa.p phˆo’ biˆe´n c´o dˆo hˆo˜ tro cu c tiˆe’u chung giˆo´ng nhau [2—8, 11—13]
Th´u nhˆa´t l`a: t`ım c´ac tˆa.p phˆo’ biˆe´n trong mˆo´i quan hˆe c´o su r`ang buˆo.c vˆe` dˆo hˆo˜ tro ([11, 12]) b˘a`ng c´ach dˆe` xuˆa´t mˆo h`ınh biˆe’u diˆe˜n r`ang buˆo.c dˆo hˆo˜ tro cu’a c´ac tˆa.p mu.c d˜u liˆe.u (go.i l`a c´ach tiˆe´p cˆa.n r`ang buˆo.c dˆo hˆo˜ tro ) C´ach tiˆe´p cˆa.n n`ay c´o nhu.o c diˆe’m l`a ta.o ra nhiˆe` u ph´u.c ta.p v´o.i ngu.`o.i su.’ du.ng, d´o l`a d`oi ho’i ho pha’i c´o kiˆe´n th´u.c co so.’ nhˆa´t di.nh trong l˜ınh vu c ´u.ng du.ng ([3])
Th´u hai l`a: g˘a´n tro.ng sˆo´ v`ao mˆo˜i mu.c d˜u liˆe.u dˆe’ do vai tr`o quan tro.ng cu’a n´o v`a ´ap du.ng c´o ca’i tiˆe´n mˆo.t trong c´ac thuˆa.t to´an t`ım tˆa.p phˆo’ biˆe´n d˜a c´o dˆe’ t`ım c´ac tˆa.p phˆo’ biˆe´n c´o g˘a´n tro.ng sˆo´ [2, 13] (go.i l`a c´ach tiˆe´p cˆa.n tro.ng sˆo´) Nhu.o c diˆe’m l´o.n nhˆa´t cu’a c´ach tiˆe´p cˆa.n n`ay l`a khˆong da’m ba’o du.o c t´ınh chˆa´t tˆa.p con cu’a tˆa.p phˆo’ biˆe´n l`a tˆa.p phˆo’ biˆe´n ([1]) m`a trong nhiˆe` u tru.`o.ng ho p ´u.ng du.ng, t´ınh chˆa´t n`ay gˆa` n nhu l`a mˆo.t d`oi ho’i tˆa´t nhiˆen, ch˘a’ng ha.n trong l˜ınh
vu. c thu.o.ng ma.i, nˆe´u mˆo.t nh´om m˘a.t h`ang d˜a du.o c nhiˆe`u ngu.`o.i mua th`ı mˆo.t sˆo´ m˘a.t h`ang thuˆo.c nh´om d´o c˜ung pha’i du.o c xem l`a nhu vˆa.y
Th´u ba l`a: t`ım c´ac tˆa.p phˆo’ biˆe´n theo dˆo hˆo˜ tro cu c tiˆe’u kh´ac nhau tu`y thuˆo.c v`ao t`u.ng m´u.c kh´ai niˆe.m cu’a c´ac tˆa.p mu.c d˜u liˆe.u ([5, 8]) (go.i l`a c´ach tiˆe´p cˆa.n nhiˆe` u m´u.c ho˘a.c phˆan bˆa.c) C´ach tiˆe´p cˆa.n n`ay kh´a th´ıch ho p v´o.i nh˜u.ng thuˆa.t to´an t`ım tˆa.p phˆo’ biˆe´n theo chiˆe` u rˆo.ng cu’a dˆo` thi biˆe’u diˆe˜n khˆong gian t`ım kiˆe´m cu’a c´ac tˆa.p mu.c d˜u liˆe.u theo kiˆe’u nhu thuˆa.t to´an Apriori [1, 2], d´o l`a nh˜u.ng thuˆa.t to´an t`ım k- tˆa.p phˆo’ biˆe´n b˘a`ng c´ach kˆe´t nˆo´i 2 tˆa.p (k − 1)-tˆa.p phˆo’ biˆe´n o.’ m´u.c trˆen d´o C´ach tiˆe´p cˆa.n n`ay c´o nhu.o c diˆe’m ch´ınh, kh´o vu.o t qua, l`a b˘a`ng c´ach n`ao dˆe’ x´ac di.nh du.o c mˆo.t c´ach ho p l´y dˆo hˆo˜ tro cu c tiˆe’u cho t`u.ng m´u.c
Th´u tu l`a: c´ach tiˆe´p cˆa.n du.o c dˆe` xuˆa´t trong [3] (go.i l`a c´ach tiˆe´p cˆa.n dˆo hˆo˜ tro ) O’ d´o vai tr`o. quan tro.ng cu’a c´ac tˆa.p mu.c d˜u liˆe.u du.o c do b˘a`ng dˆo hˆo˜ tro cu c tiˆe’u, xem c´ac tˆa.p mu.c d˜u liˆe.u kh´ac nhau l`a c´o dˆo hˆo˜ tro cu c tiˆe’u kh´ac nhau C´ac c´ach tiˆe´p cˆa.n dˆo hˆo˜ tro v`a theo tro.ng sˆo´ du.o c dˆe` xuˆa´t trong [2, 13] c´o ve’ giˆo´ng nhau v`ı tru.´o.c tiˆen ch´ung c`ung do tˆa` m quan tro.ng cu’a mu.c d˜u liˆe.u b˘a`ng dˆo hˆo˜ tro cu c tiˆe’u ho˘a.c b˘a`ng tro.ng sˆo´ nhu.ng vˆe` ba’n chˆa´t ch´ung kh´ac nhau do theo c´ach tiˆe´p cˆa.n dˆo hˆo˜ tro th`ı c´ac tˆa.p phˆo’ biˆe´n du.o c t`ım theo dˆo hˆo˜ tro cu c tiˆe’u khˆong giˆo´ng nhau dˆo´i v´o.i mˆo˜i tˆa.p mu.c d˜u liˆe.u v`a quan tro.ng ho.n l`a t´ınh chˆa´t Apriori cu’a c´ac tˆa.p phˆo’ biˆe´n nhu tˆa.p con cu’a tˆa.p phˆo’ biˆe´n l`a tˆa.p phˆo’ biˆe´n d˜a du.o c ba’o to`an do d´o qu´a tr`ınh t`ım tˆa.p phˆo’ biˆe´n s˜e du.o c thu c hiˆe.n hiˆe.u qua’ ho.n nhiˆe` u Trong [3] d˜a dˆe` xuˆa´t thuˆa.t to´an CHARM-NEW trˆen co so.’ ca’i tiˆe´n thuˆa.t to´an CHARM [15] dˆe’ t`ım c´ac tˆa.p phˆo’ biˆe´n d´ong cu c da.i t`u co so.’ d˜u liˆe.u t´ac vu (hay nhi phˆan) v´o.i diˆe` u kiˆe.n vˆe` dˆo hˆo˜ tro cu c tiˆe’u nhu vˆa.y Thu. c tˆe´ viˆe.c ph´at hiˆe.n c´ac luˆa.t kˆe´t ho p thu. c su. tro. ’ nˆen c´o ´y ngh˜ıa ´u.ng du.ng to l´o.n khi. gia’i quyˆe´t du.o c vˆa´n dˆe` ph´at hiˆe.n luˆa.t kˆe´t ho p t`u c´ac CSDL di.nh lu.o ng ([10]) Dˆe’ gia’i quyˆe´t vˆa´n dˆe` v`u.a nˆeu ngu.`o.i ta d˜a dˆe` xuˆa´t ´u.ng du.ng l´y thuyˆe´t tˆa.p m`o dˆe’ chuyˆe’n dˆo’i CSDL di.nh lu.o ng th`anh CSDL m´o.i (ta.m go.i l`a CSDL “m`o.”), v`a t`u d´o vˆa´n dˆe` ph´at hiˆe.n luˆa.t kˆe´t ho p
Trang 3m`o du.o c ra d`o.i ([2, 4) Vˆa´n dˆe` n`ay dang du.o c quan tˆam nghiˆen c´u.u, ph´at triˆe’n ma.nh B`ai b´ao tˆa.p trung ph´at triˆe’n mˆo.t sˆo´ kh´ai niˆe.m liˆen quan dˆe´n luˆa.t kˆe´t ho p m`o., thuˆa.t to´an tˆo’ng qu´at ph´at hiˆe.n luˆa.t kˆe´t ho p m`o., d˘a.c biˆe.t l`a thuˆa.t to´an t`ım tˆa.p phˆo’ biˆe´n m`o d´ong cu c da.i v´o.i c´ac tˆa.p mu.c d˜u liˆe.u m`o c´o dˆo hˆo˜ tro cu c tiˆ. e’u khˆong giˆo´ng nhau.
Phˆa` n c`on la.i cu’a b`ai b´ao du.o c cˆa´u tr´uc nhu sau: Mu.c 2 s˜e cung cˆa´p mˆo.t sˆo´ kh´ai niˆe.m
co ba’n tˆo´i thiˆe’u cˆa` n thiˆe´t c´o t´ınh chˆa´t chuˆa’n bi dˆe’ gia’i quyˆe´t vˆa´n dˆe` do b`ai b´ao d˘a.t ra C´ac kh´ai niˆe.m d´o mˆo.t sˆo´ du.o c dˆe` xuˆa´t m´o.i, mˆo.t sˆo´ l`a kˆe´ th`u.a ho˘a.c du.o c ph´at triˆe’n tiˆe´p t`u c´ac kh´ai niˆe.m tu.o.ng tu cu’a mˆo.t sˆo´ nghiˆen c´u.u tru.´o.c d´o Mu.c 3 s˜e tr`ınh b`ay nh˜u.ng vˆa´n dˆe` then chˆo´t nhˆa´t cu’a thuˆa.t to´an ph´at hiˆe.n luˆa.t kˆe´t ho p m`o c´o dˆo hˆo˜ tro cu c tiˆe’u khˆong giˆo´ng nhau Mu.c 4 v`a Mu.c 5 gi´o.i thiˆe.u mˆo.t sˆo´ v´ı du minh ho.a, mˆo.t sˆo´ kˆe´t luˆa.n v`a hu.´o.ng nghiˆen c´u.u tiˆe´p theo cu’a b`ai b´ao
2 KIˆE´N TH ´U.C CHU ˆA’N BI
K´y hiˆe.u III = {i1, i2, , im} l`a tˆa.p c´ac mu.c d˜u liˆe.u di.nh lu.o ng, l`a mu.c d˜u liˆe.u sˆo´ ho˘a.c mu.c d˜u liˆe.u phˆan loa.i; tˆa.p X ⊂ III du.o c go.i l`a tˆa.p thuˆo.c t´ınh; OOO = {t1, t2, , tm} l`a tˆa.p di.nh danh cu’a c´ac t´ac vu Quan hˆe nhi phˆan DDD ⊂ III × OO du.o c go.i l`a co so.’ d˜u liˆe.u di.nh lu.o ng Gia’ su.’ mˆo˜i mu.c d˜u liˆe.u ik (k = 1, , m) c´o mˆo.t sˆo´ tˆa.p m`o tu.o.ng ´u.ng v´o.i n´o K´y hiˆe.u
Fi k = {χ1ik, χ2ik, , χh
i k} l`a tˆa.p c´ac tˆa.p m`o tu.o.ng ´u.ng v´o.i mu.c d˜u liˆe.u ikv`a χjik l`a tˆa.p m`o th´u
j trong Fi k ([2, 3, 4, 7])
Mˆo.t luˆa.t kˆe´t ho p m`o c´o da.ng r = X ∈ A → Y ∈ B (c`on c´o thˆe’ du.o c diˆe˜n gia’i: X l`a
A → Y l`a B) v´o.i X = {x1, x2, , xp}, Y = {y1, y2, , yq} l`a c´ac tˆa.p thuˆo.c t´ınh, X ∩ Y = ∅;
A = {χx1, χx2, , χxp}, B = {χy1, χy2, , χyq} l`a tˆa.p c´ac tˆa.p m`o liˆen kˆe´t v´o.i c´ac mu.c d˜u liˆe.u trong tˆa.p X v`a Y tu.o.ng ´u.ng, ch˘a’ng ha.n mu.c d˜u liˆe.u xk trong X s˜e c´o tˆa.p m`o χx k trong A
´
l`a k tˆa.p mu.c d˜u liˆe.u m`o nˆe´u tˆa.p X ch´u.a k thuˆo.c t´ınh
Gia’ su.’ {minSupi1, minSupi2, , minSupim/minSupij ∈ [0, 1]} v´o.i mo.i j = 1, , m l`a tˆa.p c´ac dˆo hˆo˜ tro cu c tiˆe’u cu’a c´ac mu.c d˜u liˆe.u trong III = {i1, i2, , im} tu.o.ng ´u.ng, n´oi c´ach kh´ac minSupij du.o c go.i l`a dˆo hˆo˜ tro cu c tiˆe’u cu’a thuˆo.c t´ınh ij
Di.nh ngh˜ıa 1 [3] Dˆo hˆo˜ tro cu c tiˆe’u cu’a tˆa.p mu.c d˜u liˆe.u X k´y hiˆe.u l`a minSupX = max{minSupij} v´o.i mo.i mu.c d˜u liˆe.u ij ∈ X
Ta dˆe˜ d`ang thˆa´y nˆe´u X ⊇ Y th`ı minSupX minSupY
D k´y
ti∈ O
Πx j∈X{χx
j(ti[xj])}
O trong d´o,
χx j
(ti[xj]) =
mχx j(ti[xj]) nˆe´u mχx j ωj
0 nˆe´u ngu.o c la.i
χx ∈ A, ΠΠ l`a to´an tu.’ nhˆan (tˆo’ng qu´at ΠΠ c´o thˆe’ l`a ho´an tu.’ T -norm) ti[xj]l`a gi´a tri cu’a mu.c
Trang 4d˜u liˆe.u xj trong t´ac vu (hay di.nh danh) th´u i l`a ti, cu’a OO, mχx j l`a h`am th`anh viˆen cu’a tˆa.p m`o χx j liˆen kˆe´t v´o.i mu.c d˜u liˆe.u xj tu.o.ng ´u.ng, ωj ∈ [0, 1] du.o c go.i l`a ngu.˜o.ng cu c tiˆe’u cu’a tˆa.p m`o χx j
B ⊆ A
minSupX
T´ınh chˆ
v`a
Ch´u.ng minh: Du. a v`ao nhˆa.n x´et r˘a`ng do Y ⊆ X v`a B ⊆ A nˆen
t i∈O
Πy j∈Y{
χx j
(ti[yj])}
t i
Πx j∈X{
χx j
(ti[xj])},
Di.nh ngh˜ıa 5 Luˆa.t kˆe´t ho p m`o X ∈ A → Y ∈ B x´ac di.nh t`u CSDL DD du.o c go.i l`a luˆa.t
Di.nh ngh˜ıa 6 Ta go.i ng˜u ca’nh d˜u liˆe.u m`o (Data Fuzzy Context) l`a bˆo ba DFCDFCDFC = (O, I, FO, I, FO, I, FI II), trong d´o OO l`a tˆa.p h˜u.u ha.n c´ac dˆo´i tu.o ng (object), III l`a tˆa.p tˆa´t ca’ c´ac mu.c d˜u liˆe.u v`a FFFI I I l`a tˆa.p tˆa´t ca’ c´ac tˆa.p m`o liˆen kˆe´t v´o.i c´ac mu.c d˜u liˆe.u trong III
K´y hiˆe.u MM l`a tˆa.p mˆo.t sˆo´ tˆa.p m`o n`ao d´o ´u.ng v´o.i c´ac mu.c d˜u liˆe.u trong III sao cho ´u.ng v´o.i mˆo˜i i ∈ III chı’ c´o mˆo.t tˆa.p m`o trong MMM
Di.nh ngh˜ıa 7 Ta go.i ng˜u ca’nh ph´at hiˆe.n d˜u liˆe.u m`o (Data Fuzzy mining context) l`a bˆo ba DMCDMC = (O, I, MO, I, MO, I, M )
Nhˆa.n x´et:
- Gia’ su.’ λk l`a sˆo´ c´ac tˆa.p m`o liˆen kˆe´t v´o.i mu.c d˜u liˆe.u ik trong tˆa.p I gˆo`m n phˆa`n tu.’, thˆe´ th`ı mˆo˜i ng˜u ca’nh d˜u liˆe.u m`o s˜e tu.o.ng ´u.ng v´o.i λ1.λ2 λn ng˜u ca’nh ph´at hiˆe.n d˜u liˆe.u m`o Viˆe.c ph´at hiˆe.n c´ac luˆa.t kˆe´t ho p m`o hiˆe.n nay ([5, 6, 10]) m´o.i chı’ du.o c thu c hiˆe.n dˆo´i v´o.i mˆo˜i ng˜u ca’nh ph´at hiˆe.n d˜u liˆe.u m`o
- Kh´ai niˆe.m ng˜u ca’nh d˜u liˆe.u v`a ng˜u ca’nh ph´at hiˆe.n d˜u liˆe.u m`o du.o c ph´at triˆe’n v`a c´o
su. kh´ac biˆe.t so v´o.i kh´ai niˆe.m tu.o.ng ´u.ng trong [9]
Trang 5C´ac kh´ai niˆe.m nhu kˆe´t nˆo´i Galoa v`a tˆa.p mu.c d˜u liˆe.u m`o d´ong bˆay gi`o c´o thˆe’ du.o c ph´at triˆe’n t`u c´ac kh´ai niˆe.m c´o liˆen quan nhu sau ([9, 15]):
Di.nh ngh˜ıa 8 (Kˆe´t nˆo´i Galois) Cho DFCDFCDFC = (O, I, MO, I, MO, I, M ) l`a mˆo.t ng˜u ca’nh ph´at hiˆe.n d˜u liˆe.u m`o Kˆe´t nˆo´i Galois cu’a n´o l`a tˆa.p c´ac ´anh xa du.o c x´ac di.nh nhu sau:
V´o.i C ⊆ OO MM
f : 2O → 2III,
o.’ dˆay X = {i ∈ III|∀o ∈ C, mχ j(o[i]) ωχi} ωχ i) l`a ngu.˜o.ng cu. c tiˆe’u cu’a tˆa.p m`o χi liˆen kˆe´t v´o.i c´ac mu.c d˜u liˆe.u i trong X, χi∈ A ⊆ ωx i
g : 2III → 2O
OO|∀i ∈ X, mχi(o[i]) ωχi}
h : 2O → 2O sao cho h = f g
Nhˆa.n x´et:
- C´ac ´anh xa h, f, g du.o c ph´at triˆe’n tiˆe´p t`u c´ac ´anh xa h, f, g tu.o.ng ´u.ng ([9]) cho tru.`o.ng ho p ng˜u ca’nh ph´at hiˆe.n d˜u liˆe.u m`o
- Trong tru.`o.ng ho p CSDL ban dˆa` u l`a CSDL nhi phˆan (mu.c d˜u liˆe.u nhˆa.n gi´a tri nhi phˆan),
xa h du.o c x´ac di.nh nhu trong [9] Viˆe.c ch´u.ng minh n´o l`a rˆa´t do.n gia’n
- Tru.`o.ng ho p CSDL ban dˆa` u l`a CSDL di.nh lu.o ng th`ı n´oi chung khˆong xa’y ra mˆo´i quan hˆe vˆe
du.o c tr`ınh b`ay trong mˆo.t b`ai b´ao kh´ac
Gia’ su
o∈O O
Πx j∈X{
χxj
(o[xj])}
T´ınh chˆa´t sau dˆay du.o c ph´at triˆe’n t`u t´ınh chˆa´t liˆen quan trong [15], l`a co so.’ dˆe’ xˆay du ng thuˆa.t to´an t`ım tˆa.p phˆo’ biˆe´n m`o d´ong
T´ınh chˆa´t 2
ho˘ O ong l`a tˆa.p phˆo’ biˆe´n m`o
O ung l`a tˆa.p phˆo’ biˆe´n m`o
c˜ung l`a tˆa.p phˆo’ biˆe´n m`o
Ch´u.ng minh:
O O
Gia’ su
diˆe
Trang 6Nhˆ ` u l`a nh˜u.ng tˆa.p phˆo’ biˆe´n m`o nhu.ng
dˆe` u d˜a l`a tˆa.p phˆo’ biˆe´n m`o
b) T`
nˆen suy ra
(∗)
- Nˆe´u minSupX minSupY th`ı
minSupX = minSup(X ∪ Y ) (∗∗) T`
biˆe´n m`o
O
l`a tˆa.p phˆo’ biˆe´n m`o
c) Du.o c suy ra tru c tiˆe´p t`u ch´u.ng minh b)
Theo [3], c´o thˆe’ n´oi qu´a tr`ınh ph´at hiˆe.n c´ac luˆa.t kˆe´t ho p m`o v´o.i c´ac tˆa.p thuˆo.c t´ınh c´o dˆo hˆo˜ tro cu c tiˆe’u khˆong giˆo´ng nhau t`u mˆo.t CSDL di.nh lu.o ng bˆa´t k`y c˜ung gˆo`m 3 giai doa.n chu’ yˆe´u l`a:
- Giai doa.n 1: Chuyˆe’n CSDL di.nh lu.o ng th`anh ng˜u ca’nh d˜u liˆe.u m`o (ho˘a.c CSDL m`o.): trong giai doa.n n`ay c´ac kh´ai niˆe.m m`o ´u.ng v´o.i t`u.ng thuˆo.c t´ınh, c´ac h`am th`anh viˆen cu’a c´ac kh´ai niˆe.m m`o., c´ac dˆo hˆo˜ tro cu c tiˆe’u cho t`u.ng mu.c d˜u liˆe.u s˜e du.o c x´ac di.nh tru.´o.c tiˆen bo.’i ngu.`o.i su.’ du.ng, v`a t`u d´o ngu.`o.i su.’ du.ng quyˆe´t di.nh lu a cho.n mˆo.t ng˜u ca’nh ph´at hiˆe.n luˆa.t kˆe´t
ho. p m`o.trong ng˜u ca’nh d˜u liˆe.u m`o d˜a du.o c x´ac di.nh tru.´o.c d´o
minSup(Z, C)
gia’n
Phˆa` n tiˆe´p theo cu’a b`ai b´ao chı’ tˆa.p trung v`ao giai doa.n 2, cu thˆe’ l`a xˆay du ng thuˆa.t to´an t`ım tˆa.p phˆo’ biˆe´n m`o d´ong cu c da.i v´o.i c´ac mu.c d˜u liˆe.u c´o dˆo hˆo˜ tro cu c tiˆe’u khˆong giˆo´ng nhau, b˘a`ng c´ach ph´at triˆe’n tiˆe´p thuˆa.t to´an CHARM-NEW ([3]) cho tru.`o.ng ho p co so.’ d˜u liˆe.u di.nh lu.o ng v´o.i viˆe.c ´u.ng du.ng l´y thuyˆe´t tˆa.p m`o
3 THU ˆA T TO ´AN PH ´AT HIˆE N T ˆA P PH ˆO’ BIˆE´N M`O.D ´ONG
V ´O.I D ˆO H ˆO˜ TRO CU C TIˆ. E’U KH ˆONG GI ˆO´NG NHAU
3.1 ´Y tu.o.’ ng ch´ınh cu’a thuˆa.t to´an
Thuˆa.t to´an du.o c dˆe` xuˆa´t theo c´ach nhu sau: Dˆe’ t`ım c´ac tˆa.p phˆo’ biˆe´n m`o d´ong cu c da.i, tu.o.ng tu. nhu c´ac thuˆa.t to´an CHARM [15] v`a CHARM-NEW [3], thuˆa.t to´an su.’ du.ng phu.o.ng ph´ap duyˆe.t theo chiˆe I, MI, M Tu.o.ng tu..
Trang 7CHARM-NEW mˆo˜i dı’nh cu’a dˆo` thi biˆe’u diˆe˜n khˆong gian t`ım kiˆe´m c´ac tˆa.p phˆo’ biˆe´n d´ong
thi khˆong gian c´ac tˆa.p phˆo’ biˆe´n m`o theo th´u tu t˘ang dˆa` n cu’a dˆo hˆo˜ tro cu c tiˆe’u cu’a n´o t`u tr´ai qua pha’i V´o.i c´ach s˘a´p xˆe´p d´o c´ac tˆa.p k-mu.c d˜u liˆe.u m`o (k > 1) du.o c sinh ra theo phu.o.ng ph´ap duyˆe.t theo chiˆe` u sˆau t`u.ng nh´anh cu’a cˆay dˆo` thi vˆa˜n du.o c s˘a´p xˆe´p theo th´u
tu. t˘ang dˆa` n cu’a dˆo hˆo˜ tro cu c tiˆe’u cu’a ch´ung theo th´u tu t`u tr´ai sang pha’i, tˆa.p sinh ra tru.´o.c c´o dˆo hˆo˜ tro cu c tiˆe’u nho’ ho.n dˆo hˆo˜ tro cu c tiˆe’u cu’a tˆa.p sinh ra sau, c´ac n´ut thuˆo.c nh´anh bˆen tr´ai dˆe` u c´o dˆo hˆo˜ tro cu c tiˆe’u nho’ ho.n c´ac n´ut o.’ nh´anh pha’i Co chˆe´ hoa.t dˆo.ng cu’a thuˆa.t to´an t`ım tˆa.p phˆo’ biˆe´n m`o c˜ung kh´a tu.o.ng tu nhu CHARM-NEW Cu thˆe’, gia’ su.’ dang xu
Khi d´o xa’y ra c´ac tru.`o.ng ho p sau:
c˜
bo
tiˆe´p theo;
cu’a dˆo` thi du.o c s˘a´p theo th´u tu t˘ang dˆa` n cu’a dˆo hˆo˜ tro cu c tiˆe’u cu’a tˆa.p mu.c d˜u liˆe.u trong n´ ung l`a tˆa.p phˆo’ biˆe´n m`o (T´ınh chˆa´t
` m n˘ang sinh ra c´ac tˆa.p phˆo’ biˆe´n m`o kh´ac nˆen ta khˆong thˆe’ loa.i bo’ hay thay thˆe´ ch´ung b˘a`ng n´ut kh´ac du.o c, tuy nhiˆen nˆe´u thˆem diˆe
v`ao tˆa.p c´ac n´ut
nhu tru.`o.ng ho p 3, t´u.c l`a
ra nh˜u.ng tˆa.p phˆo’ biˆe´n m`o m´o.i
Du.´o.i dˆay chı’ gi´o.i thiˆe.u phˆa` n cˆo´t l˜oi nhˆa´t cu’a thuˆa.t to´an t`ım tˆa.p phˆo’ biˆe´n m`o d´ong cu c da.i du.o c ca’i tiˆe´n t`u CHARM [15] v`a du.o c ph´at triˆe’n t`u CHARM-NEW [3] go.i l`a NEW C´ac thu’ tu.c v`a h`am EXTENDED-NEW, FUZZY-CHARM-PROPERTY-NEW c´o ´y ngh˜ıa v`a vai tr`o nhu CHARM-EXTENDED, CHARM-PROPERTY nhu trong thuˆa.t to´an CHARM [15]
K´y hiˆe.u ΩΩl`a tˆa.p tˆa´t ca’ c´ac tˆa.p phˆo’ biˆe´n m`o d´ong, h(i) l`a c´ach d´anh sˆo´ tu nhiˆen cu’a c´ac thuˆo.c t´ınh i ∈ III, v`a quy u.´o.c v´o.i mu.c d˜u liˆe.u in th`ı h(in) = n Ta n´oi i < j nˆe´u h(i) < h(j) v`a j = i + 1 nˆe´u h(j) = h(i) + 1 Gia’ su.’ III l`a tˆa.p gˆo`m m thuˆo.c t´ınh
Trang 83.2 Thuˆa.t to´an FUZZY-CHARM-NEW
1, χik, minSupi1 2, χi2, minSupi2 m, χi m, minSupim}),
i i i minSupi) C´ac dı’nh n`ay du.o c s˘a´p xˆe´p t`u tr´ai sang pha’i theo th´u tu. t˘ang dˆa` n cu’a th`anh phˆa` n th´u hai minSupi;
FUZZY-CHARM-EXTENDED-NEW (Nodes, ΩΩ);
FUZZY-CHARM-EXTENDED-NEW (Nodes, ΩΩ)
i, Ai, minSupXi i, Ai)} in Nodes {
N ewN := ∅; X := Xi; h(j) := h(i) + 1; A := Ai
j, Aj, minSupXj j, Aj} in Nodes) {
X := X ∪ Xj; A := A ∪ Aj i, Ai j, Aj); B = Ai∩ Aj; FUZZY-CHARM-PROPERTY-NEW (Nodes, N ewN )
j ++ }
If N ewN = ∅ then FUZZY-CHARM-EXTEND (N ewN, ΩΩΩ)
ΩΩ := ΩΩ
FUZZY-CHARM-PROPERTY-NEW (Nodes, N ewN )
i, Ai j, Aj)) then
j, Aj, minSupXj j, Aj)} ra khoi Nodes
i, Ai
i, Ai j, Aj)) then
j, Aj, minSupXj j, Aj)} ra khoi Nodes
i, Ai j, Aj)) and (minSupXj i, Ai
i, Ai
i, Ai j, Aj)) and (minSupXj i, Ai
and (minSupXi j, Aj
3.3 Nhˆa.n x´et v`a d´anh gi´a thuˆa.t to´an
- Thuˆa.t to´an FUZZY CHARM-NEW cho ph´ep t`ım c´ac tˆa.p mu.c d˜u liˆe.u m`o d´ong cu c da.i c´o dˆo hˆo˜ tro l´o.n ho.n dˆo hˆo˜ tro cu c tiˆe’u khˆong giˆo´ng nhau ´u.ng v´o.i t`u.ng tˆa.p mu.c d˜u liˆe.u t`u CSDL di.nh lu.o ng bˆa´t k`y Thuˆa.t to´an n`ay du.o c ph´at triˆe’n tiˆe´p t`u thuˆa.t to´an CHARM-NEW [3] t`ım tˆa.p phˆo’ biˆe´n d´ong cu c da.i c´o dˆo hˆo˜ tro cu c tiˆe’u khˆong giˆo´ng nhau t`u c´ac CSDL nhi phˆan (hay t´ac vu.)
- Trong [3] d˜a chı’ ra r˘a`ng khi dˆo hˆo˜ tro cu c tiˆe’u l`a chung nhu nhau cho tˆa´t ca’ c´ac tˆa.p phˆo’ biˆe´n th`ı CHARM-NEW s˜e tro.’ th`anh CHARM, l`a thuˆa.t to´an t`ım c´ac tˆa.p phˆo’ biˆe´n d´ong
cu. c da.i v´o.i dˆo hˆo˜ tro cu c tiˆe’u chung t`u CSDL nhi phˆan hiˆe.u qua’ nhˆa´t cho dˆe´n nay [15]
- Dˆo´i v´o.i FUZZY CHARM-NEW, h`ınh th´u.c kh´a giˆo´ng CHARM-NEW [3]; FUZZY CHARM-NEW c˜ung s˜e tro.’ th`anh thuˆa.t to´an CHARM-NEW khi CSDL di.nh lu.o ng suy
Trang 9biˆe´n th`anh co so.’ d˜u liˆe.u nhi phˆan.
Thˆa.t vˆa.y, c´ac mu.c d˜u liˆe.u cu’a CSDL nhi phˆan do chı’ nhˆa.n mˆo.t trong 2 gi´a tri l`a: 1 ho˘a.c
0 hay “c´o” ho˘a.c “khˆong” khi d´o liˆen kˆe´t mˆo.t c´ach tu nhiˆen ho p l´y v´o.i mˆo˜i mu.c d˜u liˆe.u nhi phˆan x ∈ X c˜ung chı’ c´o thˆe’ c´o c´ac kh´ai niˆe.m m`o c´o v`a khˆong v´o.i c´ac h`am th`anh viˆen chı’ nhˆa.n 2 gi´a tri 1 v`a 0
SupX, T´ınh chˆa´t 2 o.’ trˆen tro.’ th`anh t´ınh chˆa´t dˆe’ xˆay du ng thuˆa.t to´an CHARM-NEW v`a FUZZY CHARM-NEW tro.’ th`anh CHARM-NEW [3]
- Trong [14, 15] d˜a chı’ ra dˆo ph´u.c ta.p cu’a c´ac thuˆa.t to´an ph´at hiˆe.n luˆa.t kˆe´t ho p, n´oi chung l`a NP kh´o, trong d´o thuˆa.t to´an CHARM l`a ´ıt ph´u.c ta.p ho.n nhiˆe` u so v´o.i c´ac thuˆa.t to´an ph´at hiˆe.n luˆa.t kˆe´t ho p kh´ac Trong [3] c˜ung d˜a ra chı’ ra r˘a`ng dˆo ph´u.c ta.p cu’a CHARM-NEW l`a
´ıt ho.n CHARM trong tru.`o.ng ho p dˆo hˆo˜ tro cu’a c´ac tˆa.p phˆo’ biˆe´n l`a thu c su kh´ac nhau So v´o.i CHARM-NEW, thuˆa.t to´an FUZZY CHARM-NEW l`a ph´u.c ta.p ho.n v`a chu’ yˆe´u o.’ viˆe.c
j, Aj)| trong c´ac qu´a tr`ınh t`ım kiˆe´m v`a tı’a b´o.t c´ac tˆa.p khˆong pha’i l`a tˆa.p phˆo’ biˆe´n m`o U.´o.c lu.o. ng ch´ınh x´ac dˆo ph´u.c ta.p cu’a thuˆa.t to´an n`ay dang du.o c nghiˆen c´u.u l`am r˜o
- Tu tu.o.’ ng t`ım kiˆe´m v`a tı’a b´o.t c´ac tˆa.p khˆong l`a phˆo’ biˆe´n cu’a FUZZY CHARM-NEW l`a giˆo´ng CHARM v`a CHARM-NEW, ch´ung chı’ kh´ac nhau o.’ c´ac biˆe’u th´u.c diˆe` u kiˆe.n trong thuˆa.t to´an v`a d˜a du.o c ch´u.ng minh trong T´ınh chˆa´t 2 N´oi c´ach kh´ac t´ınh d´ung d˘a´n cu’a FUZZY CHARM-NEW du.o c kh˘a’ng di.nh thˆong qua T´ınh chˆa´t 2 o.’ trˆen v`a t´ınh d´ung d˘a´n cu’a thuˆa.t to´an CHARM
4 V´I DU MINH HO A CSDL trong Ba’ng 1 du.´o.i dˆay th`u.a nhˆa.n r˘a`ng dˆo hˆo˜ tro cu c tiˆe’u dˆo´i v´o.i c´ac mu.c d˜u liˆe.u Tuˆo’i, Sˆo´ xe m´ay, Thu nhˆa.p, C´o gia d`ınh tu.o.ng ´u.ng l`a: 0,15; 0,1; 0,05; 0,2;
Ba’ng 1 Co so.’ d˜u liˆe.u di.nh lu.o ng mˆa˜u ban dˆa`u Di.nh danh Tuˆo’i Sˆo´ xe m´ay Thu nhˆa.p C´o Gia d`ınh
(triˆe.u dˆo`ng)
Dˆo´i v´o.i mu.c d˜u liˆe.u Tuˆo’i ta c´o kh´ai niˆe.m m`o.: a) tre’, b) trung niˆen, c) gi`a; dˆo´i v´o.i Sˆo´
xe m´ay ta c´o c´ac kh´ai niˆe.m m`o.: d) nhiˆe` u, e) ´ıt; Thu nhˆa.p c´o c´ac kh´ai niˆe.m m`o f) cao, g) trung b`ınh, h) thˆa´p; C´o gia d`ınh c´o c´ac kh´ai niˆe.m m`o.: i) c´o, j) khˆong Qui u.´o.c su.’ du.ng c´ac ch˜u c´ai a, b, c, d, e, f, g, h, i, j dˆe’ biˆe’u thi go.n tu.o.ng ´u.ng cho c´ac kh´ai niˆe.m m`o.: tre’, trung niˆen, gi`a, nhiˆe` u, ´ıt, cao, trung b`ınh, thˆa´p, c´o, khˆong
Gia’ su.’ c´ac h`am th`anh viˆen tu.o.ng ´u.ng cu’a c´ac kh´ai niˆe.m m`o trˆen du.o c cho.n th´ıch ho p, ch˘a’ng ha.n:
Trang 10mb(t) =
0 nˆe´u t 60 ho˘a.c t 20 (t − 20)(60 − t)/400 nˆe´u 20 < t < 60
md(t) =
1 nˆe´u t 5 (5 − t)/5 nˆe´u t < 5
mg(t) =
t/(3 triˆe.u) nˆe´u t 3 triˆe.u
1 nˆe´u 3 triˆe.u < t 4 triˆe.u
5 triˆe.u − t
1 triˆe.u nˆe´u 4 triˆe.u < t 5 triˆe.u
0 nˆe´u t 5 triˆe.u
mi(t) =
1 nˆe´u t = “co”
0 nˆe´u t = “khong”
Khi d´o CSDL di.nh lu.o ng d˜a cho du.o c chuyˆe’n th`anh ng˜u ca’nh d˜u liˆe.u m`o du.o c mˆo ta’ trong Ba’ng 2
Ba’ng 2 Ng˜u ca’nh d˜u liˆe.u m`o cu’a CSDL di.nh lu.o ng trong Ba’ng 1
Di.nh Tuˆo’i a b c Sˆo´ d e Thu f g h C´o i j
t1 60 0,0 0,0 1,0 0 0,0 1,0 0,6 0,12 0,2 1,0 k 0,0 1,0
t2 40 0,5 1,0 0,5 3 0,6 0,4 6,0 1,0 0,0 0,0 c 1,0 0,0
t3 30 0,75 0,75 0,25 0 0,0 1,0 1,5 0,3 0,5 1,0 c 1,0 0,0
t4 25 0,87 0,44 0,12 1 0,2 0,8 3,0 0,5 1 0,66 k 0,0 1,0
t5 70 0,0 0,0 1,0 2 0,4 0,6 0,0 0,0 0,0 1,0 c 1,0 0,0
t6 57 0,08 0,28 0,92 4 0,8 0,2 4,0 0,8 1 0,33 c 1,0 0,0 Gia’ su.’ ng˜u ca’nh ph´at hiˆe.n d˜u liˆe.u m`o.: v´o.i mu.c d˜u liˆe.u Tuˆo’i liˆen kˆe´t v´o.i kh´ai niˆe.m m`o.: b) trung niˆen Sˆo´ xe m´ay liˆen kˆe´t v´o.i d) nhiˆe` u Thu nhˆa.p liˆen kˆe´t v´o.i g) trung b`ınh, v`a C´o gia d`ınh liˆen kˆe´t v´o.i i) c´o Gia’ su.’ ngu.˜o.ng cu c tiˆe’u tu.o.ng ´u.ng dˆo´i v´o.i 4 kh´ai niˆe.m m`o trˆen l`a: 0,3; 0,1; 0,15; 0,5
Khi d´o ng˜u ca’nh ph´at hiˆe.n d˜u liˆe.u m`o tu.o.ng ´u.ng du.o c x´ac di.nh trong Ba’ng 3, o.’ dˆay
O l`a k´y hiˆe.u tˆa.p di.nh danh:
Ba’ng 3 Mˆo.t ng˜u ca’nh ph´at hiˆe.n d˜u liˆe.u m`o
O Tuˆo’i b Sˆo´ XM d Thu nhˆa.p g C´o GD i
0,15 0,3 0,1 0,15 0,05 0,1 0,4 0,6
t1 60 0,0 0 0,0 0,6 0,2 k 0,0
t2 40 1,0 3 0,6 6,0 0,0 c 1,0
t3 30 0,75 0 0,0 1,5 0,5 c 1,0
t5 70 0,0 2 0,4 0,0 0,0 c 1,0