1. Trang chủ
  2. » Công Nghệ Thông Tin

DATA MINING AND APPLICATION: GOM NHÓM DỮ LIỆU ppsx

32 333 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 32
Dung lượng 0,94 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

7KXұWWRiQN-medoids : PAM Cho Vͩ k, PͯL nhóm ÿ́ͻF EL͛X GL͝Q E͉QJ PͱW trong các ÿӕL WѭӧQJ JҫQ trung tâm nhóm QK̽W z B1: &KӑQ QJүX nhiên k ÿӕL WѭӧQJ QKѭ là QKӳQJ WUͥQJ tâm FӫD các nhóm.. Ho

Trang 5

Sun-DOWN

Technology1-DOWN

2 Apple-Comp-DOWN,Autodesk-DOWN,DEC-DOWN, ADV-Micro-Device-DOWN,Andrew-Corp-DOWN, Computer-Assoc-DOWN,Circuit-City-DOWN, Compaq-DOWN, EMC-Corp-DOWN, Gen-Inst-DOWN, Motorola-DOWN,Microsoft-DOWN,Scientific-Atl-DOWN

Trang 7

« In 0.5 0.2 0.3

Trang 9

q q

j

x i

x j

x i

x j

x i x j

i

d ( , ) (| | | | | | )

2 2 1

|

|

|

| ) ,

(

2 2 1

1 x j x i x j x ip x jp

i x j

|

|

|(|

)

,

2 2

2 1

1 x j x i x j x i p x j p i

x j

Trang 11

%LӇX GLӉQ PӛL nhóm EҵQJ giá WUͣ trung bình FӫD Gӳ

OLӋX trong nhóm ÿy : WKXͅW toán K-means (1967)

trung tâm FӫD nhóm : WKXͅW toán k-medoids, PAM

(1987)

Trang 12

1

2

) , (

z B3 : Tính OҥL giá WUӏ trung tâm FӫD WӯQJ nhóm

z Cho nhóm K i ={t i1 ,t i2 ,«,t im }, giá WUͣ trung bình FͿD nhóm là

m i = (1/m)(t i1 + « + t im )

z B4 : 1͗X các trung tâm nhóm không có gì thay ÿͭL thì

Trang 17

Distance from Nellie

Trang 18

Customer Distance A Distance B

Trang 20

3+ѬѪ1*3+È33+Æ1+2Ҥ&+

3. 7KXұWWRiQN-medoids : PAM

Cho Vͩ k, PͯL nhóm ÿ́ͻF EL͛X GL͝Q E͉QJ PͱW

trong các ÿӕL WѭӧQJ JҫQ trung tâm nhóm QK̽W

z B1: &KӑQ QJүX nhiên k ÿӕL WѭӧQJ QKѭ là

QKӳQJ WUͥQJ tâm FӫD các nhóm

z B2 : gán W΃QJ ÿͩL ẂͻQJ còn O̹L vào nhóm có

WUͥQJ tâm FͽP J̿Q nó QK̽W

z B3 : &KӑQ PӝW ÿӕL WѭӧQJ EҩW NǤ Hoán ÿәL nó

YӟL WUӑQJ tâm FӫD nhóm 1ӃX FKҩW OѭӧQJ FӫD

các nhóm WăQJ lên thì quay OҥL B2 1JѭӧF OҥL

WLӃS WөF WKӵF KLӋQ B3 cho ÿӃQ khi không còn có

Trang 21

4 5 6

1

2

5

Trang 22

CURE (Clustering Using Representative)

ROCK (Robust Clustering using linKs)

Trang 23

Step 2

Step 3

Step 4

Step 2

Step 1

Step 0

7tFKWө

(agglomerative)

&KLDQKӓ (divisive)

2 4 6 8 10

Trang 24

0 1 2 3 4 5 6 7 8 9 10

0 2 3 4 6 8 9 10

Trang 25

‡ Trong Vӕ các nhóm JӗP PӝW ÿLӇP thì dist(3,6) - min

nên JӝS ÿLӇP P3 và P6 YӟL nhau thành PӝW nhóm

‡ Thu ÿѭӧF các nhóm : {1}, {4}, {2}, {5}, {3,6},

3 Quay OҥL EѭӟF 2 do FKѭD thu ÿѭӧF nhóm ³WRjQ Eӝ´

4 Tính NKRҧQJ cách JLӳD các nhóm Ví Gө :

‡ Dist({3,6},{1}) =min(dist(3,1),dist(6,1))

Trang 27

4

5

3 6 2 5 4 1 0

0.05 0.1 0.15 0.2

Trang 28

&È&&Ð1*9,ʃ&&ɣ1/¬0

1. 7KҧR OXұQ và Wӵ WKӵF KLӋQ các bài WұS FӫD

FKѭѫQJ 5 ± 3KҫQ 1 (không QӝS

2. &KXҭQ Eӏ bài 5 ± 3KҫQ 2 : Gom nhóm Gӳ OLӋX

z Cho WұS DL JӗP 6 ÿLӇP trong không gian 2 FKLӅX

YӟL ma WUұQ NKRҧQJ cách QKѭ sau

z 6ӱ GөQJ WKXұW toán AGNES YӟL Complete link

NKRҧQJ cách JLӳD 2 nhóm là NKRҧQJ cách xa QKҩW

JLӳD 2 ÿLӇP FӫD 2 nhóm) ÿӇ gom nhóm

z 1ͱS bài theo nhóm.

Trang 30

7¬,/,ӊ87+$0.+Ҧ2

1. J.Han, M.Kamber, &KѭѫQJ 8 ± Data mining :

Concepts and Techniques

http://www.cs.sfu.ca/~han/dmbook

http://www-faculty.cs.uiuc.edu/~hanj/bk2/slidesindex.html : 2 nd

3. P.-N Tan, M Steinbach, V Kumar, &KѭѫQJ 8

- Introduction to Data Mining

2. 7KӃ nào là gom nhóm? Trình bày chi WLӃW

SKѭѫQJ pháp phân KRҥFK phân FҩS Cho ví

Gө Fө WKӇ WӯQJ SKѭѫQJ pháp So sánh ѭX

NKX\ӃW ÿLӇP FӫD 2 SKѭѫQJ pháp

%¬,7Ұ3

Trang 31

toán k-means ( YӟL k=3) ÿӇ xác ÿӏQK:

± Ba trung tâm FӫD nhóm sau vòng OһS thi hành ÿҫX tiên Tính

c) 6΅ GͽQJ WKXͅW toán phân F̽S O̿Q ÓͻW YͳL Single link và

Complete link ÿ͛ xác ÿͣQK 3 nhóm W΃ DL trên 9͕ V˿ ÿͫ

Trang 32

toán AGNES OҫQ OѭӧW

YӟL Single Link và

Complete link ÿӇ gom

... QKҩW

JLӳD ÿLӇP FӫD nhóm) ÿӇ gom nhóm

z 1ͱS theo nhóm.

Trang 30

7¬,/,ӊ87+$0.+Ҧ2...

3. P.-N Tan, M Steinbach, V Kumar, &KѭѫQJ

- Introduction to Data Mining

2. 7KӃ gom nhóm? Trình bày chi WLӃW

SKѭѫQJ pháp phân KRҥFK phân FҩS Cho ví

Gө... data- page="30">

7¬,/,ӊ87+$0.+Ҧ2

1. J.Han, M.Kamber, &KѭѫQJ ± Data mining :

Concepts and Techniques

http://www.cs.sfu.ca/~han/dmbook

Ngày đăng: 25/07/2014, 15:21

HÌNH ẢNH LIÊN QUAN

Hình cây W̹L P΁F thích KͻS. - DATA MINING AND APPLICATION: GOM NHÓM DỮ LIỆU ppsx
Hình c ây W̹L P΁F thích KͻS (Trang 22)
Hình cây Ẃ˿QJ ΁QJ - DATA MINING AND APPLICATION: GOM NHÓM DỮ LIỆU ppsx
Hình c ây Ẃ˿QJ ΁QJ (Trang 31)

TỪ KHÓA LIÊN QUAN

w