7KXұWWRiQN-medoids : PAM Cho Vͩ k, PͯL nhóm ÿ́ͻF EL͛X GL͝Q E͉QJ PͱW trong các ÿӕL WѭӧQJ JҫQ trung tâm nhóm QK̽W z B1: &KӑQ QJүX nhiên k ÿӕL WѭӧQJ QKѭ là QKӳQJ WUͥQJ tâm FӫD các nhóm.. Ho
Trang 5Sun-DOWN
Technology1-DOWN
2 Apple-Comp-DOWN,Autodesk-DOWN,DEC-DOWN, ADV-Micro-Device-DOWN,Andrew-Corp-DOWN, Computer-Assoc-DOWN,Circuit-City-DOWN, Compaq-DOWN, EMC-Corp-DOWN, Gen-Inst-DOWN, Motorola-DOWN,Microsoft-DOWN,Scientific-Atl-DOWN
Trang 7« In 0.5 0.2 0.3
Trang 9q q
j
x i
x j
x i
x j
x i x j
i
d ( , ) (| | | | | | )
2 2 1
|
|
|
| ) ,
(
2 2 1
1 x j x i x j x ip x jp
i x j
|
|
|(|
)
,
2 2
2 1
1 x j x i x j x i p x j p i
x j
Trang 11%LӇX GLӉQ PӛL nhóm EҵQJ giá WUͣ trung bình FӫD Gӳ
OLӋX trong nhóm ÿy : WKXͅW toán K-means (1967)
trung tâm FӫD nhóm : WKXͅW toán k-medoids, PAM
(1987)
Trang 121
2
) , (
z B3 : Tính OҥL giá WUӏ trung tâm FӫD WӯQJ nhóm
z Cho nhóm K i ={t i1 ,t i2 ,«,t im }, giá WUͣ trung bình FͿD nhóm là
m i = (1/m)(t i1 + « + t im )
z B4 : 1͗X các trung tâm nhóm không có gì thay ÿͭL thì
Trang 17Distance from Nellie
Trang 18Customer Distance A Distance B
Trang 203+ѬѪ1*3+È33+Æ1+2Ҥ&+
3. 7KXұWWRiQN-medoids : PAM
Cho Vͩ k, PͯL nhóm ÿ́ͻF EL͛X GL͝Q E͉QJ PͱW
trong các ÿӕL WѭӧQJ JҫQ trung tâm nhóm QK̽W
z B1: &KӑQ QJүX nhiên k ÿӕL WѭӧQJ QKѭ là
QKӳQJ WUͥQJ tâm FӫD các nhóm
z B2 : gán WQJ ÿͩL ẂͻQJ còn O̹L vào nhóm có
WUͥQJ tâm FͽP J̿Q nó QK̽W
z B3 : &KӑQ PӝW ÿӕL WѭӧQJ EҩW NǤ Hoán ÿәL nó
YӟL WUӑQJ tâm FӫD nhóm 1ӃX FKҩW OѭӧQJ FӫD
các nhóm WăQJ lên thì quay OҥL B2 1JѭӧF OҥL
WLӃS WөF WKӵF KLӋQ B3 cho ÿӃQ khi không còn có
Trang 214 5 6
1
2
5
Trang 22CURE (Clustering Using Representative)
ROCK (Robust Clustering using linKs)
Trang 23Step 2
Step 3
Step 4
Step 2
Step 1
Step 0
7tFKWө
(agglomerative)
&KLDQKӓ (divisive)
2 4 6 8 10
Trang 240 1 2 3 4 5 6 7 8 9 10
0 2 3 4 6 8 9 10
Trang 25 Trong Vӕ các nhóm JӗP PӝW ÿLӇP thì dist(3,6) - min
nên JӝS ÿLӇP P3 và P6 YӟL nhau thành PӝW nhóm
Thu ÿѭӧF các nhóm : {1}, {4}, {2}, {5}, {3,6},
3 Quay OҥL EѭӟF 2 do FKѭD thu ÿѭӧF nhóm ³WRjQ Eӝ´
4 Tính NKRҧQJ cách JLӳD các nhóm Ví Gө :
Dist({3,6},{1}) =min(dist(3,1),dist(6,1))
Trang 274
5
3 6 2 5 4 1 0
0.05 0.1 0.15 0.2
Trang 28&È&&Ð1*9,ʃ&&ɣ1/¬0
1. 7KҧR OXұQ và Wӵ WKӵF KLӋQ các bài WұS FӫD
FKѭѫQJ 5 ± 3KҫQ 1 (không QӝS
2. &KXҭQ Eӏ bài 5 ± 3KҫQ 2 : Gom nhóm Gӳ OLӋX
z Cho WұS DL JӗP 6 ÿLӇP trong không gian 2 FKLӅX
YӟL ma WUұQ NKRҧQJ cách QKѭ sau
z 6ӱ GөQJ WKXұW toán AGNES YӟL Complete link
NKRҧQJ cách JLӳD 2 nhóm là NKRҧQJ cách xa QKҩW
JLӳD 2 ÿLӇP FӫD 2 nhóm) ÿӇ gom nhóm
z 1ͱS bài theo nhóm.
Trang 307¬,/,ӊ87+$0.+Ҧ2
1. J.Han, M.Kamber, &KѭѫQJ 8 ± Data mining :
Concepts and Techniques
http://www.cs.sfu.ca/~han/dmbook
http://www-faculty.cs.uiuc.edu/~hanj/bk2/slidesindex.html : 2 nd
3. P.-N Tan, M Steinbach, V Kumar, &KѭѫQJ 8
- Introduction to Data Mining
2. 7KӃ nào là gom nhóm? Trình bày chi WLӃW
SKѭѫQJ pháp phân KRҥFK phân FҩS Cho ví
Gө Fө WKӇ WӯQJ SKѭѫQJ pháp So sánh ѭX
NKX\ӃW ÿLӇP FӫD 2 SKѭѫQJ pháp
%¬,7Ұ3
Trang 31toán k-means ( YӟL k=3) ÿӇ xác ÿӏQK:
± Ba trung tâm FӫD nhóm sau vòng OһS thi hành ÿҫX tiên Tính
c) 6΅ GͽQJ WKXͅW toán phân F̽S O̿Q ÓͻW YͳL Single link và
Complete link ÿ͛ xác ÿͣQK 3 nhóm W DL trên 9͕ V˿ ÿͫ
Trang 32toán AGNES OҫQ OѭӧW
YӟL Single Link và
Complete link ÿӇ gom
... QKҩWJLӳD ÿLӇP FӫD nhóm) ÿӇ gom nhóm
z 1ͱS theo nhóm.
Trang 307¬,/,ӊ87+$0.+Ҧ2...
3. P.-N Tan, M Steinbach, V Kumar, &KѭѫQJ
- Introduction to Data Mining
2. 7KӃ gom nhóm? Trình bày chi WLӃW
SKѭѫQJ pháp phân KRҥFK phân FҩS Cho ví
Gө... data- page="30">
7¬,/,ӊ87+$0.+Ҧ2
1. J.Han, M.Kamber, &KѭѫQJ ± Data mining :
Concepts and Techniques
http://www.cs.sfu.ca/~han/dmbook