1. Trang chủ
  2. » Luận Văn - Báo Cáo

Bài toán Đồ thị con Đẳng cấu trong khai phá dữ liệu Đồ thị và Ứng dụng phát hiện Đồ thị con phổ biến

65 0 0
Tài liệu được quét OCR, nội dung có thể không chính xác
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Bài toán Đồ thị con Đẳng cấu trong khai phá dữ liệu Đồ thị và Ứng dụng phát hiện Đồ thị con phổ biến
Tác giả Tôi
Người hướng dẫn PGS. TS. Đoàn Văn Ban
Trường học Đại học Công nghệ thông tin và truyền thông
Thể loại luận văn
Năm xuất bản 2020
Thành phố Thái Nguyên
Định dạng
Số trang 65
Dung lượng 2,54 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

CHUONG 1: KHAI PHÁ ĐÔ TRỊ Thai phá đỗ th Graph MMining là tập hợp các công cụ và kỹ thuật được cử dạng để phân tích các thuộc tính cña đồ thị trong thể giới thực, G0 dự đoán cấu tric va

Trang 1

thân ôi lập tỉnh, các kết quả à hoàn toàn trong thực Các tài liệu tham kháo được trích dẫn và chủ thích đầy đồ

TÁC GIÁ LUẬN VĂN

Trang 2

LỜICÄMƠN Tôi in bây tô lồi cảm on chia thinh ti tập thé cfc thi c

thông tia ~ Viên Hin lim Khoa học và Công nghệ Việt Nam, các thầy cô giáo Trường Đại học Công nghệ thông tín và truyền thông - Đại học Thấ Nguyên đã đạy đỗ chúng tôi trong suốt quá tình học tập chương tình cao học ti trường

Đặc biệttôi xin bày tổ lòng biết em sâu c tối hầy giáo PGS.TS Đoàn Văn Ban

đã quan tâm, định hướng va đưa ra những gốp ý, chỉnh sửa quý bầu cho tôi trong quá trình làm luận văn tốt nghiệp Cũi 1g như các bạn bê, đẳng nghiệp, gia đình và người

thân đã quan âm, giáp đỡ và chỉa ẽ với tối trong suốt quáuình àm luận văn tốt nghiệp

Tủ đã có nhiễu cổ gắng những chắc chắn sẽ không tránh khỏi những thiểu sốt ỉ

vậy rất mong nhận được sự đông góp Ý kiến của các thấy, cô vã các bạn để luận vin nay được hoàn thiện hơn

“Tối xin chân thành cảm on!

‘Thai Nguyên, thắng 08 năm 2020

Trang 3

1.2 Các đạng biêu diễn cấu trúc đữ liệu đô thị 6

.2.2 Thuật toán kiểm tra dé thị đẳng cấu 24

2.2.1 Thuật toán Dijsktra tim đường đi ngắn nhất 24

2.2.2 Thuật toán tinh khoang cach d(u, v) trong các đỏ thị phụ thêm và đỏ

2.2.3 Thuật toán xác ma trận đầu và đạng chính tắc của nó 25 2.2.4 Thuật toán sắp xếp các đỉnh của hai đồ thị để

của chúng đựa vào dang chính tắc

2.2.5 Mét sé tính chất của đô thị đẳng cấu

2.3 Bài toán đẳng cấu đô thị con SGI

2.3.3 Thuật toán xây đựng cây quyết định 36

2.4.1 Cây các đỗ thị con đạng chính tắc 40

Trang 4

2.4.3 Phép N-Extension 4

.2.5 Thuật toán FFSM cho khai phá đồ thị con phổ biến trong CSDL đồ thị 44 2.6 Kết luận chương 2

CHƯƠNG 3 THỨ NGHIỆM VÀ ĐÁNH GIÁ

3.1 Dữ liệu và môi trường thử nghiệm

3.1.1 Bộ đữ liệu thử nghiệm

3.1.2 Môi trường thử nghiệm

3.2 Cài đặt và thử nghiệm thuật toán tìm kiếm tra đỗ thị đẳng cấu

3.2.1 Mô tả yêu cầu bài toán kiếm tra đồ thị đẳng cầu

3.2.2 Kết quả thử nghiệm

3.3 Thử nghiệm thuật toán FFSM cho khai phá đồ thị con phổ biển

3.3.1 Mô tâ yêu câu bài toán khai phá đồ thị con phổ biến

3.3.2 Phân tích đánh giá kết quả

3.4 Kết luận chương 3

KET LUAN VA HUONG PHAT TRIEN,

TAILIEU THAM KHẢO

Trang 5

Community Social Structure Ì — Cẩmtrúccông đồng mang xi hi

CSDL Ĩ Cơ sở dữ liệu

Sĩ Graph isomorphism - Đăng cấu đề thị

‘Graph isomorphism problem Bai toán đã thị đẳng cấu

‘SGI SubGraph Isomorphism — Ding cấu đỗ

thi con

Trang 6

DANH MỤC CÁC HÌNH VE Hình 1.1 Các đỗ thị vô hướng và có hướng

Hình 1.2 Hợp của hai đỏ thị

Hình 13 Gr’ la phần bù của Gị

Hinh 1.4 Danh sách liên thuộc của đỗ thị

Hình 1.5 Đề thị vô hướng

Hình 1.6 Biểu diễn danh sách liên kề của đồ thị hình 1.5

Tình 1.7 Ma trận liên thuộc của đồ thị vô hướng

‘Hinh 1.8 Ma trận liền kề của đồ thị trong ví đụ 1.6

Hình 2.6 Hai phép toán N-Join va N-Extension

Hình 3.1 Mô tả cấu trúc bộ dữ liệu thử nghiệm với kho

Hình 3.2 Bộ đữ liệu đơn giản thử nghiệm thuật toán kiểm tra 2 đỏ thị đẳng cấu

Hình 3.3 Kết quả đỏ thị đẳng cấu với bộ đữ liệu đơn giản

Hình 3.4 Kết quả đỏ thị đẳng cấu với đồ thi target có kích thước lớn

Hình 3.5 Ví đụ về không tồn tại đẳng cấu đô thị con

Tình 3.6 Thời gian chạy thuật toán FFSM trên bộ dữ liệu 10000 đỏ thị

Trang 7

Bảng 32 Tổng hợp kết quả chạy thuật toán FESM trên 2 bộ đỡ liệu

Trang 8

tạp hơn như cấu trúc cây, đ th, Cho đến nay vẫn chưa cổ lời giải hiệu qua cho

‘ai oán này do độ phúc tạp của bài toán l rất lớn khi đồ thị có số định lớn và mật độ

èn, số thực hoặc các đỡ liệu có cầu trúc phức

các cạnh dây Tuy nhiền, sự phúc tạp của những vấn đề này sẽ giảm kh cơ số đổ liệu (CSDL) đỗ thị c thêm thông tín về các đỉnh và các cạnh đã được gán nhẫn Có thể

sử đọng các nhần để hạn chế các định có thể tạo thành các cặp trong quá trình kiểm, tra sự đẳng cấu của đ thị con

`Và đồ chính fa ý do em lựa chọn đề tài "Bài toán đỗ dĩ con đẳng

3, Đối tượng nghiên cứu

- Bài toần đồ thị con đẳng cầu

- Khai phá đỡ liệu đồ thị

- Bài toần khai phá đồ thị con phổ in trong CSDL 46 thị

- Thuật toán FESM,

- Thuật toán SGI Decision Tree.

Trang 9

~ Tâm hiễu lý thuyết đồ thị và các phương pháp khai phá dỡ liệu đổ thị

~ Nghiên cớu các thuật toần tìm đồ thị con đẳng cấu và các thuật toần khai phá đồ thị con phố biển

+ Thực nghiệm:

- Xây đợng chương tình thực nghiệm thuật toán

~ Ấp đọng chương trình trên một số bộ cơ sở dỡ liệ trong khai phá dỡ liệu để thi

5 Ý nghĩa khoa học

"Đây là một hướng nghiên cứu lý thuyết, xây đợng các thuật toán tìm kiểm đổ thị con đẳng cầu và đồ thị con ps bi va iểm thờ trên các bộ đỡ liệu về đỗ thị

ó Phương pháp nghiên cứu

~ PÄương pháp nghiên cứu lý thuy Sưu tập các tải liệu c liên quan đến đề

tài, nghiên cứu để hiễu sâu các nội dung vấn đề cần nghiên cứu

- PÄương pháp nghiên cứa thực nghiên: Cai đặt chương tình th nghiệm phương phip tim kiểm đổ thị con đẳng cấu và thuật toán FESM để lệt kê các đổ thị con phổ biến trên các bộ đỡ liệu và đánh giá hiệ cuất cũa phương phập,

~ Phương pháp trao đỗt khoa học: Trao đỗi nội dung nghiền cứu với giáo viên tướng dẫn, với các đồng nghiệp đề đề xuất và giải quyết các nội đơng loận văn đềra

1 Cấu trác đề tài

Luin văn được chia thành cấc phần chính như su

Chương 1: Khai phá dỡ liệu đ thị

Chương 2: Đỏ thị đẳng cấu và đồ thị con phổ biến

Chương 3: Thờ nghiệm thuật toán tìm đỗ thị con phổ biển

“Kết luận và hướng phát triển.

Trang 10

CHUONG 1: KHAI PHÁ ĐÔ TRỊ Thai phá đỗ th (Graph MMining) là tập hợp các công cụ và kỹ thuật được cử dạng để () phân tích các thuộc tính cña đồ thị trong thể giới thực, G0 dự đoán cấu tric va tin chit cba đồthị đã cho cổ thể ảnh hưỗng đến một sé mg dung va (ii) phat

triển các mô hình có thể tạo ra biểu đổ thực tế phù hợp với các mô hình được tìm thấy

trong các biễu đổ quan tim trong thé giới thực Chương này tỉnh bay những khái niệm cơ số về đồ thị, các dạng biễu diễn cấu trúc, dạng chỉnh tắc của đỗ th và các

kể thuật khai phá dỡ liệu đỗ thị

11 Cấu trúc đồ thị

"Một dé thị (Graph) là một dạng biểu diễn hình ảnh của một tập các đỉnh (nút)

đại diện cho các đối tượng dữ liệu (hực th, trong đồ các cặp đối tượng được kết nối bối các cạnh (cong) thể hiện mối quan hệ giữa chồng [S]

Định nghĩa L1 Cho trước đổ thị G= (V, E), trong đồ V là tập các định và E

` là tập các cạnh Đường đi cổ độ đã đi từ nốt v đẫn w là đây các cạnh (tn, VŨ, (tt

và (ví) # E, Đường đi đơn là đường đi

không di qua một định nào quá một lần

Hiển nhiên, đường di ngắn nhất đi từ đỉnh s đến đỉnh t là đường đi đơn có độ dài Gố cạnh) ít nhất trong số các đường đi giữa hai đình

Tai cạnh được gọi là cạnh bội hay song song nếu chúng công tương ứng với

"một cặp đỉnh Một cạnh (v, w) của đỗ thị G được gọi là khuyên (loop) nu j thị không cô các cạnh bội được gọi là đơn đồ thị ngược ại gọi là đa đổ tị

Tai định v va v trong đỗ thị G được gọi là liền kề nếu (, v) £ E, hoặc (, )

= E.Néve=(o, v) thie goi la can liên thuộc với các đình vã v Cạnh e cũng được goi là cạnh nối các đình u và v Các đỉnh u và v gọi là các điểm đầu mút của cạnh e

"Một đẳ thị là vô hướng nễ E là tập các cạnh không có thứ ty, ngược lạ là đỗ thị cô hướng Đổ thị cô trọng số nếu trên mỗi cạnh được gắn với một trọng số, ngược lạ là

đỗ thị không trọng số, hay nối chính xác hơn là các cạnh của đổ thị đều cô trọng số lal

Trang 11

MỸ RPPĐ HH

e.Đen để thị có hướng — d Không phải đơn để thịcõ — e Không phải đơn đồ thị có

hướng do có các cặp cạnh hướng do có cạnh nổi một nối còng một cặp dink, định với chính nó,

THình 1.1 Các đỗ thị vô hướng và có hướng Trens luận văn này chúng ta chỉ những đơn đỗ thị võ hướng, không trọng số gợi tắt à đ thị

Định nghĩa L2 Một đỗ thị (cô hướng) được goi là liên thông nếu luôn có đường đi đen giữa mọi cặp đinh phân bit cba đ thị

Tính chất 11 Giða mọi cặp định phân biệt cöa một đổ thị liền thông luôn cổ đường

i don [16]

Các đỗ thị conliên thông rời nhau, được gọi là các hành phần tiên thông cũa

đỗ thị đang xết Như vậy, một đỗ thị là liên thông khi và chỉ khi nổ chỉ cố một thành phần liên thông

"Định nghĩa 1.4 Bậc của đình v trong đỗ thị G, ký hiệu dez(+), là số các cạnh tiên thuộc

với nổ, Đình v được gọi là đnh teø nếu deg) 1 va goi là đính cô lip név deg(x) =0

Bậc của đình là số các định liền kể với định đô

Tính chất L2 Tổng số bậc của các đình trong đỗ thị G bằng ba lần số cạnh [16}

Trang 12

Tinh chat 1.3 Moi don 45 thin dinh (a > 2) cô tổng bậc của hai đình trỷ Ý không

hỗ hơn đều là đổ tị liên thông [16]

Tính chất 1.1 Nến một đỗ thị cô đóng hai đình bậc tì bai đình này phải liên hông

tức là cổ một đường đi nối chúng [16]

Định nghĩa 1 Họp ca bai đơn đồ thi G.= (Vi, E:) va G2

thị con của G›(G: là đổ thị cha của G) khi và chỉkhi Vì € Và và E: © En Trường hợp Vì ~ Và ta nối G là đỗ thị con bao trồm Gà

Trang 13

‘Nhu vay, đỗ thi Gi= (Vi, Ei) là đỗ thị con cam sinh của V¿, E2), nếu Vị

€Vì:,E: E Eovà với mọi cạnh (9, v) £ E: thì, v = Vi

Binh nghia 1.8 Đồ thị G được gọi là đầy đỏ (cigue) nếu mọi cặp đình đi

với nhau, nghữ là Y vụ vị € V ie] thi (ov) © E

12 Các đạng biểu điễn cấu trúc đỡ liệu đồ

Cách biểu diễn đồ thị trực quan nhất là hình vẽ, nhưng kh:

tiếp các ình vẽ đỗ thị rong máy tính Có nhiều cách khác nhau để lơ trở (biễ điển) các đỗ thị trong máy tí (S, 17] Sở đọng cấu trúc dỡ liệu (cách biễu diễn) nào hỉ

lều liên thuộc

ig thé tn trữ trực

tùy theo cấu trúc của đỗ thị và thuật toán đùng để thao tác trên để thị đó, Trong

thuyết người ta thường sử dụng ai cấ trc chính à danh sãch và cấu trúc mẫng (ma

trận) Trong các ứng đụng cụ thê, cấu trúc tốt nhất có thể là kết hợp của cả hai Người

ta hay dòng các cấu trốc danh sách cho các đồ thị thưa (sparse raph), do chúng đồi hồi í bộ nhỏ Trong khi đô, các cấu trúc ma trận cho phép trưy nhập dỡ liệu nhanh: hơn, nhưng lại cần lượng bộ nhớ lớn nễo đỗ thị cổ kích thước lớn [, 4]

41.2.1 Danh sách liên thuộc

anh sich lin thoge (Incidence is) - Mỗi định cô một danh sách các cạnh nổi với định đô Các cạnh của đồ thị được cô hễ được lươtrong một danh sách riêng (cổ thể cải đặt bằng cấ trúc mảng (aray) hoặc danh cách liên kết (inked lis), trong đồ mỗi phần từ ghỉ thông tin về một cạnh, bao gằm: cặp đinh mã cạnh đô nổi (cặp này sẽ cô thứ tr nêu đỗ thị cô hướng), trọng số và các dỡ liệu khác Danh sách tiên thuộc cũa

“mỗi định sẽ chiễo tối vỉ tí của các cạnh tương ứng tại anh sách cạnh nay

'Vĩ âụ 1.4, Cho đỗ thị vô hướng

Trang 14

thể chọn cách sử dụng phần không gian thừa, hoặc có thể liệt kê các quan hệ kề cạnh

chỉ một lẫn Biễu diễn dỡ liệu nây thuận lợi cho việc tờ một định duy nhất tìm mọi đình được nỗi với nỗ, do các định này đã được lt kê tường minh

Định nghĩa L9 Danh sách liên kể Với mỗi đỉnh ¡ của đỗ thịchững ta lưu trổ danh: sách các định kể với nỗ, i hide fa List)

ListG) = {je Vj) = E hoặc (,) = E),

`Với cách biễu diễn này, mỗi đình i cba dé thi, trong ứng với một danh sách

tất cả các định kề với nỗ và được ký hiệu là Le) ĐỂ biễu diễn Li-(), ta có thể

đùng các kiêu dữ liêu kiễu tập hợp, mảng hoặc danh sách liên kết

Vidy 18 Cho trước đồ thị về hướng

>

THình L5 Đề thị vô hướng

Trang 15

Ma tr lin thude (Inctdonce matrix) - BS thi duge biễu diễn bằng một ma

‘rd [by] kich thuge n m trong đồ n là số định và m là số cạnh, trong d6 by = Í nếm định v liên thuộc (à một trong 2 đầu) với cạnh e va bing 0 trong các trường hợp khác

Binh nghia 1.10 Cho đổ thị võ hướng G.= (V, E), với vị và, và lã các định và e, es, eelà các cạnh của G_ Ma trận liên thuộc của G theo thứ tự trên của V và E là sma trén Ag (ay|i= 1.n,j= 1m), trong dé a5 la bing 1 ndu canh e nếi với đình vị

và bằng Ö nếu cạnh e không nỗi với đình vị

`Ví ấy Lổ, Mã trận liên thuộc theo thứ ty các đỉnh vị va, và, vá v5 (xếp theo cổ) và

cat can ee, 3,665 ự (xếp theo hàng) là

Trang 16

Đi với đồ thị không có trọng số chồng tao tinh chit sa:

Tính chất L8 Cho G là một đỗ thị (võ hướng không có trọng số) với ma trận liền kể (A theo thứ tự các định vụ và, ve Khi đồ số các đường đã khác nhau độ đãi r tờ vị

(ri, va, va} thì sẽ có nl ma trên liền kể

cách sắp:

tối trong đồ là một số nguyên đương, bằng giá tị cũa phần tử đồng cột j của ma trận A'[14]

Định nghĩa 1.12 Gia sé A la ma trận liền kề của một đồ thị Ta ký hiệu diag|A] là

‘vector bide didn tit cd cde phin tr trén ding chéo chinh cia A Teoug te, upper[A]

ta vector biểu diễn ắt cả các phân tờ phần tam giác trên của Ä (không kế các phần từ trên đường chéo chính)

Trang 17

41.2.5 Dang chink tie cia 48 thi

Theo các định nghĩa về cchbiễ didn niu tr, thi mgt thio thi bidw ifn iow tn) theo hd nhiéu danh sich vi ma tr khác nhan, điều nấy gây ra nhiễu khó khẩn trong

"việc tính toán và xử lý đồ thị, như xử lý bài toán tìm các đỗ thị con đẳng cấu, đỗ thi con

mấthiện thường xuyên, đỗ tị (nấu) thường xuyên đồng c đ, Vídp,cho tước một

đỗ thịc tập nh (Vi — n đủ sẽ cổ nÌ ma trận lên kỄ tương ứng, bồi vì ứng mỗi cách sắp xếp các định (một hoán vị của V) hìta cô một ma trận liền kể

XMệt trong các vẫn đề quan trọng của khai phá đỗ thị là bài toần đẳng cấu đổ

thi: cho trage hai đỗ thị P, Q, cần kiểm tra xem P có đẳng cấu với Q hay không Chúng ta giải quyết tấn đề này bằng cách chuyển mỗi đ thị về dạng biễu điễn chính tắc (duy nhấ) cña nô rỗi sau đô so sắnh hai dạng chính tắc cũa chống [1 4, 5, 10] Dang chinh tic ofa dé thi la dang biéu diễn của đổ thị sao cho nếu bai đỗ thị đẳng

cấu với nhau tỉ dạng chính tắc của chúng là như nhau và ngược lại [1]

"ĐỂ tên cho tiệc biễu diễn đồ thị một cách thống nhất, chồng ta định nghĩa Tại ma trăn liền kštheo nhân (tên) của các định như ssu

Định nghĩa 1.13 Giả sở G = (V, E) là đổ thị liên thông, vô hướng cô ø định (VÌ 1) Ma tri lin kd (adjacency matrix) cba G la ma trin A = {a9 |i, j= 1a} wi

a= ~ Néviej Nha (én) cia canh ndi wv6i vy

9 Nếu giữa vị và vị không có cạnh nối với nhau

Từ định nghĩa suy ra ma trận liễn kẻ là ma trận đối xóng qua đường chếo chính: Trên đường chéo chính của ma trận tiền kề là nhãn của các định, các phần tử còn lạ là nhấn của các cạnh, nếu cổ

Định nghĩa 1.14 Cho troớc ma trận liền kề A = (aj | j = 1 nỳ và ax là cạnh coối cia A (ax +0, vil < ke ở bên phải nhất trên hằng cuối công trong A), ma trận con coe dai (maximal submatrix) oda A lama trin B= {by |i,j= 1p}, pSa, doge định

"nghĩa như sa:

(8) Nếu bàng cuối của À có hai cạnh (ba giá trì khác 0) thi

Trang 18

u

pen

+ by -{* Nếu (0 <¡, jŠg)^#1^j#k)^A@#k^jD

0 Newoe ai (©) Név hing cudi oda A chỉ cổ một cạnh (một gi t khác 0) thi

~p=a~l

+bụ =aj với 0 <¡, j <p

_Niên xác Ma trận con cực đại của ma trận chính A là một ma trận tho được từ

‘A sau hi loại bộ đi một cạnh coỗi theo cách hoán vi cũ tập định Trường hợp (0) cổ

ai cạnh thì cạnh cuối được bỏ đi (ị trí đó được thay bằng 0), cồn trong trường hợp (®) chỉ cô một cạnh cuối thì định coỗi (đình cuối còng năm trên đường chếo chính) cng được loại bổ, nghĩa là bồ đi hà

pile boy a pix b @ ¥

@ © © @ ©

Hinh 1.9 Các

thị con cực đại Hàng cuối của ma trận À¡ có hai cạnh x, z và z là cạnh cuối, nên ma trận con cực đại của nó là ma trận (a) Ma trận À3 ở hằng cuối chỉ có một cạnh y, do vậy bỏ đi

hàng cuối, cột coối ta thu được ma trận (b) Ma tn (c) la ma trin con eye dai cba

Trang 19

“ma tin (), ma trận (4) là ma trận con cực đại của ma trận (0) và (), ma trận (9 là sma tn con ove di oda ma trận (4)

Định nghĩa 115 Cho trước một ma tận liền kề À của đỗ thị (V,E)cẽjV

tủa mã (code) của A, ký hiệu code(A), là dãy các phần tử của tam giác

Ta sử dung thứ tự từ điễn chính tắc (theo mã ký ty) trên các đãy các nhãn đề

định nghĩa quan hệ thứ ty toàn phần cöa hai mã p và q bắt

Định nghĩa 116 Cho trước đồ thị G, dạng chính tắc côa G là đồ thị cố mã cực đại của ắt cả các mã các ma trận liền kŠ có thể Ma trận tiễn kể có mã là chính tắc (cue đa) được gọi là ma trận liên kể chính tắc CAM (Canonical Adjacency Matrix) cba

G, ký hiệu là CAM(G)

CAM(G)=(A| A = AM(G) ^ Y B © AM(G) > code(A) 2 code(B)}

`Ví ấp Lộ, Xét các côa hai ma trận liền kể ở vi dụ 1.8

code(s) = “axblyoxy0b" va code(A2) = “axbuzb0y0c

Ap dung thứ tự từ điển ta có code(A2) > code(A¡) Bằng cách xây dựng tất cả

các ma trận liền kề theo các hoán vị khác nhau của các định của đổ thị G và so sảnh smi cba ching, ching ta thy CAM(G) = Aa, vi code(A2) la ma cực đại theo định nghĩa

Từ những định nghĩa nêu trên, chúng ta cổ một số tính chất quan trọng được

sử dụng để khai phá tập 45 thị con phổ biển [1], [3], [9]

Tinh chất 1.6 Nếu À là ma trận liễn kề của đỗ thị liên thông G và B là ma trận con cove dai cia A thi code(A) > code(B)

Chieng mink

"Dựa vào định nghĩa của ma trận con cục đại để chứng min.

Trang 20

13

(4) NếuB là matrận con được xắc định theo trường hợp (6) cia Dinh nghia 1-1 11 thì suy ra ngay được cođe(A) > code(E), vỉ nhấn của cạnh cuối ong cods(Â) được thay bằng 0 Biết rằng mọi nhẫn trong tập L đều > 0

(®) _ Trườnghọp thứ hai suyra được trực tiếp tờ thổ tự cổa tiếp đầu ngỡ cũa dãy các nhẫn

Tính chất L7 Nếo À là ma trận liền kể biễo diễn cho dạng chính ắc của đổ thị G (CAM(G) = A) thi moi tiếp đầu ngỡ của code(A) kết thúc bing nhăn cũa một đình

đều biểu diễn cho đỗ thị con của G ở dạng chính tắc

Chứng mờ:

Theo định nghĩa mã cöa ma tri là cc đại và tính chất cục đại của dây mã được bảo toần chọ các tiếp đầu ngữ Mặt khác tờ một tiếp đẫu ngỡ bắt ỷ của code(A) kết thúc bằng nhẫn côa một đình, ta đều xây đợng được một ma trăn liền kŠ cổa một

đỗ thị con của G và đỗ thị đô cũng là dạng chính tắc

Tính chất L8 Cho trước đồ thị G lin thông và đỗ thị con tĩ của G Giá sử CAM(G)

và CAMG) = B, khi đồ ta cô code(A) > code(B)

nia tam giấc đới của ma trin B không cô một bàng nào chỉ chứa toàn số (khổ:

có cạnh nỗi với các đình khác) Chúng ta chững mình điều khẳng định tiên qua hai bước

a/ Trước tiên chủng ta chỉ ra rằng mỗi hàng trong nữa tam giác dưới của ma trân tiền kề À thì luôn có ít nhất một cạnh khắc 0, nghĩa là mỗi đình cổ ít nhất một canh nối vi một đình khác

Trang 21

“Thật vậy, chúng ta gã hit rằng cổ t nhất một hằng ¡ (> 1) mà ví:

0 Theo giả thiết G lñ tên thông nên phải tên ti ít nhất một j ( > i) sao cho max{vy, v3, ., wij) > 0 Nguge li, 38 khdng 06 dinh nio trong i~ 1 đình đầu được nối với n— (— 1) đình còn lại, nghĩa là G không phải liên thông, mâu thuẫn với

gi thiết Nếu tên tại một cặp ( ) như trên, nếu ta hoán vị A sao choi vj adi chỗ che nhau (một hoán vì mới, phần còn lại gif nguyên Khi đồ chúng tasẽ nhận được

“mã của ma trận liền mối cổ cođelớn hơn cods(), mâu thuẫn với giã thiết a code(A)

Tính chất L10 Cho trage để thị G liên thông, CAM(G) = A và B là ma trận con

cực đại của A, khi đó tôn tại một đỗ thị con H của G để CAMŒI) = B

Chứng mờ:

Giả thiết À chỉ cố một cạnh ð hãng cuối thì hiển nhiên coóe(B) sẽ là tiếp đầu

"ngữ (pref) của code(A) Chúng ta không thể tim được đổ thị con nào để có mã lớn

ơn cods(B), Điễu này suy ra code(B) > code(CAMGH), trong đồ CAMỢD) là ma

trận liền kề chính tắc của đổ thị H Nghĩa là B là CAM ofa dé thi H

Tương ty, suy ra đối với trường hợp ở hãng cuối của À cổ ít nhất bai cạnh:

1, Các kỹ thuật khai phá đồ thị

Thai phá (thai thác) đỗ thị được tập trong nghiên cứu và phát tiễn ứng đọng

"ngày cảng tăng do bai lý do: Đầu tiên ắt hiều đỡ liệ ty nhiền xuất hiện dưới dạng

do đồ làm cho biểu đổ trở thành một công cụ tự nhiên để phân tích dỡ liệu đơn lẻ

cũng như đa quan hệ Vĩ dụ, cơ sở dỡ iệu khách bàng và sẵn phẩm (chứa thông tin

về người đã mua cái gì), dễ ding duge sở dụng đưới dạng biễu đỗ trỡng cục hoặc hệ

Trang 22

thống gắn thể hợp tc (hoặc xã hộ), đỡ iệu có thể được mô hình hôa thành biễu để

ba bên céa người đồng, ti nguyên và thể (g3)

Xỹ thuật khai phá đồ thị đã được phân loại thành các nhồm san [$, 11]

+ Phân cụm đồ thị (Graph closteiag): Nhôm các định của đổ thị thành các cum cô tính đẫn cấu trúc cạnh của đổ thị sao cho trong mỗi cụm th có nhiều cạnh nối các đình với nhau và trơng đối giữa các cụm khác nhau Phân cụm đổ thị là nhồm các định của một để thị đầu vào đã cho thành các cụm đợa trên kỹ thuật học không

giám sát Các cụm đồ thì được hình thành dựa trên một số điểm tương đẳng theo một

số độ đo trên đỗ thị như độ cổ kết, vectr đặc trơng, độ đo trong tâm, độ đo trong gian, [I, 3,4,8]

+ Phân lớp để tị (Giaph Classiicaion): nhiệm vụ chính là phân loại các biển biệt trong cơ sở đỡ liệu đỗ thị hành hai hoặc nhiề loại /lớp Phân lớp đựa trên kỹ thuật học có

trước [16]

+ Khai phá đồ thị con (Sub graph mining): đỗ thị con là một đ thị cổ các định

và canh là các tập con của để thị khác Vấn đề khai thắc đ thị cơn thường xuyên là tạo ra tập hợp các đổ thị con xuất hiện trong ít nhất theo một ngưỡng cũa n đổ thị đầu vào đã cho [L, 12]

Lãi Phát hiện cấu trúc cộng đồng mạng xã hội

Thất hiện o trúc cộng đẳng mạng xã hội [1, 5] là một kỹ thuật dién hình

“hôm phân tích đỗ thị theo cách tiếp cận phân cụm 83 thi

‘Mang xã hội là một tập hợp các thực thể được kết nỗi với nhau thông qua các

“mỗi quan hệ, mối liên kết, Phân tích mạng xã hội là nghiền cứu về mỗi quan hệ giữa các cá nhân bao gm phân ích cẫ trúc xã hội, ị trí xã hội, phân ích vai trỏ, về nhiều mỗi quan hệ với những người khác Phân tích mạng xã hội là xem xét các mỗi quan hệ xã hội đợa vào ý thuyết đề thị bao gỗm các định vã các cạnh (còn được gọi

là các liên kết hoặc kết ni) Các định được xem là những công đẳng riềng lẻ tiên

Trang 23

“mạng, và các cạnh là các mối quan hệ giờa các cộng đồng, Cộng đồng mạng xã hội

là một tập hợp các cá nhân (tic abn, thre thé) tương tắc với nhau thông qua các phương tiện truyền thông cụ thể, có khả năng vượt qua những ranh giới địa lý và chính trị để theo đuổi lợi ích hay mục tiêu chung Mục tiêu chính của phân tích mang

xã hội là:

“Xác định những thực thể, tác nhân quan trong nhất trong mạng xã hội: Độ trang tim (Centrality) la mét độ đo để hiệu chỉnh tằm quan trọng của các tắc hân và giếp chẳng ta hiểu được tằm ảnh hướng trong xã hội và quyền lực trong một mạng

xã hội

hát hiện các cộng đồng trên mạng: Một số th thể cổ iên kết chất chế với

“nhau tạo thành từng cum, va giða các cụm 6õ được nổi với nhau chỉ bằng một số ít cạnh khác Nhiệm vụ xác định các cộng đẳng được thực hiện thông qua nghiền cứu cấu trúc mạng và cấu trúc tên kết git cdc the thé trén mang

Cấu trúc công đồng mang xi h5i (Community Social Sưoctore) gọi tắ là công đẳng mạng xã hội là một tập hợp các tác nhân tương tắc thông qua các phương tiện truyền thông cụ thể, có khả năng vượt qua những ranh giới địa lý và chính trị để theo lợi íh hay mục tiêu chung Cộng đng là một nhóm các thực thể cổ những tính

ất tương tự nhau, liên kết chặt chế với nhau hơn và cùng đồng một vai trò nhất định trong mạng xã hội Cộng đẳng mạng xã hội còn được định nghĩa là nhồng cấu trốc

xã hội rất mạnh mễ và được tổ chốc với nhan đựa tiên những mối quan hệ, quan tâm, chúng Nó có th là một sở thích, một nh vực mã các thành viên trong cộng đồng cũng quan tim, hay mot mye tiêu, dự án chung, theo vỉ tí địa lý, hoặc nghiệp

vụ Người tham gia vào công đồng, vì quan tâm đến lợi ích chung này mã gấ kết các thành viên cộng đồng với nhau Một cộng đồng được mổ tả nh một nhôm các định (đổ thị con) cũng chia sẽ các thuộc tính chung hoặc đồng vai trồ tương ty trong một

la là mộttập hợp các đình có mật độ liên

cách

tạng Một cộng đẳng có thể được định nợi

kết giỡa các đình cao và mật độ liên kết thấp với phần còn lại của mang Ne

khác, một công đẳng được tạo ra bối một tập hợp các tác nhân có tương tác thường

"xuyên với nhau hơn so với cá nhân khác ngoài cộng đẳng Do vậy, nó thường là một

Trang 24

1

tập hợp như: bạn bẻ, đồng nghiệp, nhốm những người có cũng sở thích, cũng chuyên tiên, mối quan tâm, 1,3, 5]

Trong mạng xã hội, tiệc trích xuất, phát hiện được những cấu trúc cộng đẳng

là tất hữu ích vì nó giúp chúng ta nghiên edu được cầu trúc tổng thể của mạng, Đồ là siột nhiệm vụ, thách thức rất khổ khăn Khái niệm của khám phá, phất hiện cộng đồng tương tự như phân vùng (phân cụm) đổ thị những có một số khác biệt nh trong phân vũng đỗ thị số lượng nhóm và kích thước của chúng đã được biét trước, những trong trường hợp phát hiện ra cộng đồng, chủng ta khô g biết về số lượng công đẳng trong mạng và công đồng công có thể không công kích cỡ với nhau

THình 110 hiển thị các công đồng của đồ thị mạng lưới công tác nghiền cứu của các nhà khoa học làm việc ại Viện Santa Fe (SED, Đỗ thị bao gém 118 định đại diện cho các nhà khoa học làm việc tại SET và cc công tác viền côa họ Các cạnh được iên kết giữa các nhà khoa học khi họ đã công bổ công với nhau ít nhất một bài

Trang 25

Thay vì việc tìm kiểm những dinh trong đổ thị cổ độ gắn kết cao với nhau phương pháp phát hiện công đồng bằng thuật toán phân chỉa được đơa ra nh một cách giải quyết hữu hiệu ĐỂ trãnh các khuyết điểm của phương phấp phân cụm phân cấp, thay vi cd ging dé nay dựng một giải pháp tìm cạnh trong âm: của cộng đẳng chúng ta di tìm nhông cạnh c độ trong gian (tÿ số các đường đi ngắn nhất trên số các đường đi ngắn nhất đi qua đình đổ) là cao nhất, cạnh đô được goi tên là cạnh nỗi (cẳu nỗ) giữa các công đồng Girran-Newman cho rng khi các công đẳng được gắn kết với nhau thì đường đi giữa công đồng này đẫn công đẳng khác sẽ đi qua các cạnh: nối giða các công đẳng với tần suất cao Mục đích chính cöa thuật toần làm những canh nỗi đó Thay vì việc xây dựng công đẳng bằng cách thêm vào các cạnh có độ

trùng tâm cao nhất, chúng ta sẽ

(cẩu nổ) từ đỗ thị ban đầu Khi đó, các công đồng trong mạng sẽ bị ngất kết nổi với

“hao, ta cổ thể xắc định được cách phân vồng đỗ thị thành các phần nhỏ riêng biệt

"Để làm được việc này, điều quan trọng nhất của thuật toán là việc tỉnh toần như thé

ào, sở đụng tính chất nào để phát hiện ra những cạnh nổi này, từ đồ loại bổ chúng ra khôi đ thị

Thodt ton Girvan-Newman (GN) duyét qua mi dinh (nit) v một lẫn và tinh

shit trv t6i nhồng đỉnh khắc có đi qua tồng cạnh đó Tư tưởng chính cöa thuật toán GN được thực hiện theo kỹ thuật phân cụm phân cấp nh sa Input: BS thi G=(V.G)

Ouipua: Tip cde 43 thi con la cdc céng dong

"Bước 1 Tính độ trung gian của tắt cã các cạnh trong mạng

"Bước 2, Tìm những cạnh có độ trong gian lồn nhất và loại bô chúng,

"Bước 3, Tính lại độ trong gian của tắt cả các cạnh trong các thành phẫn còn li, ước 4, Lip Iai tờ bước 2 cho đến khi đến khi không cổ cạnh não vượt qua

của độ độ trong gian cho trước hoặc không còn cạnh trung

dạng bằng cách loạn bỏ đẫn dẫn các cạnh nối

số đường đi ng:

Trong mang xi hội, iệc trích xuất, phất hiện được những cấu trúc công đồng

là rất hữu ích vĩ nỗ giúp chồng ta nghiên cứu được cấu trúc tổng thể của mạng Khải niệm của khẩm phá, hát hiện công đồng toơng ty nh phân vồng (phân cụm) đỗ thị

Trang 26

1.3.2 Khai phé dé thị con tường xuyên đồng

Thai phá đồ thị con phé bién (Frequent Subgraph Mining) [1, 3, 8, 9] là một

kỹ thuật điễn hình nhôm phân tích đồ thị theo cách tếp cận khai phá đổ thi con cia khai phá đổ thị Phần này giới thiệu một thuật toán PSI.CESM [3] cãi tién thuật toần eSpan vi FFSM

Thuật toán PSI-CFSM

Input: Tập dỡ iệu đồ thị GD và ở = min _sup

Ootpot: CS:, CS:, CSk, tập các đổ thị con thường xuyên đồng tương ứng với số đình các tập đô chứa

Xây dựng một danh sách liên kết được sắp thứ tự theo CAM CƑ chỉ chứa các 2- subgraph;

Wile sink re tng vin mic k trong gi€GD vi FSi va FSP do

Xây dựng danh sách liên kế được sắp chứ cụ theo CAM CP: Foreach ue Cf

Thực hiện tim kiếm nhi phén a2 vim u trong Cf va xéc định sup.>ơ để đưa vào CSỈ và CS;

Xiến tra 0€CSỈ.; nêu sup.= sup chì loại v ra khối S13

GD Công với CAM chúng ta cổ thể chỉa tích vẫn đề khai phá đỗ thị con thường

"uyên thành khai phá đổ thị con thường xuyên theo từng mốc Bất đẫu từ mức đỗ thị

Trang 27

chỉ cĩ 1 cạnh tức à chỉ cĩ 2 đình và gọi các đỗ thị nấy là 2-subgraph Đo tiên sẽ khai phá tất cả các đ tị 2-subgraph, tìm tất cả các đỗ thị 2-subgrsph là thường xuyên và

lu lại Ở đây chẳng ta sử đọng nhiễu tập lưu trổ các 2-subgraph thường xuyên Tập

CS sẽ lưotộn bộ các 2-subgraph thường xuyên đồng của tồn bộ tập đỡ liệu đồ hị (GD và các tập FSi2 sẽ lơơ các 2-subgraph thường xuyên của các đồ thi € GD Cơng

"với đơ chúng ta cũng sẽ dùng CÍ để lơu tồn bộ ứng viên 2.subgraph của dé thi se

GD Tiép theo từ FS! to đi chúng ta chỉ lưu các tập đổ thị con thường xuyên đồng

thay thể bing CS} Tại mỗi bước khai ph đổ thị con thường xuyên đồng

_

mức k:(C >> 2) ta sẽ kết hợp các đồ thị nằm trong FS) va CS đ nh ra các ứng xiên nằm trong Cj, mdi thành viên nằm trong C‡ khi sinh ra sẽ được đưa vào một danh sách tên kết được sắp xếp sẵn tạo thành một danh cách iên kết được sắp thứ ty theo CAM Khi cần xác định một ứng viên trong Cỷ cĩ phải là đỗ thị con thường

"uyên hay khơng th chơng ta ấp dụng chiến thật tìm kiểm nhị phân được co là tối

va nhất hiện nay để tìm sự xuất hiện cơa nơ trong các CẢ thie RS ring, ta thấy ð đầy

“mỗi đỗ thị con ứng viên sẽ được tìm bằng tìm kiếm nhị phân Giả sử mỗi đỗ thị ø: cơ 1m 46 thi con ứng viên mức k thì việc tìm kiểm một đỗ thị con trong nỗ la O(logm)

én dù m cổ lồn đến đâu thì thuật tốn xác định đồ thị con đẳng cầu và đẳm độ hỗ trợ

của một đỗ thị con ống viên vẫn thuộc lớp P tức là giải quyẾ

Trang 28

21

CHƯƠNG 2: BÀI TOÁ (NBO THI DANG CAU

PHO BIEN XMệt trong các phương pháp khai phá đỡ iệu có nhiễu ứng dụng nhất là khai

KHAIPHA DO THT CON

phá các mẫu thường uyên Vấn đề khai phá mẫu thường xuyên là tờ mộttập dỡ liệu các đối tượng, với một ngưỡng độ h trợ ỗi thiểu minsup cho trước, ta đi tìm các đối tương có độ hỗ trợ lớn hơn hoặc ít nhất là bằng với độ hỗ trợ tối thiểu mìnsup Dữ liệu có th rất đa đạng từ dỡ liệu nhị phân, đỡ iệo sổ nguyên, số thực hoặc các dữ liệu có cấu trúc phúc tạp hơn như cây, đ thị, Bài toán khai phá đồ thị con phổ biển

là đi ìm nhồng đổ thị con phố iễ trong một kho đồ thị vi một ngưỡng cho trước Chương này trình bây bài toán đồ thị đẳng cấu, đỗ thị con đẳng cấu và thuật toần tìm các đồ thị con phổ biến

Thai phá đồ thị con thường xuyên là một phương pháp khai phá đỡ liệu hiệu quả Tuy nhiên, các ứng đọng thực tiễn hiện nay với các tập dỡ liệu vữa cổ cấu trúc phúc tạp li vồa cổ kích thước rất lớn đã dẫn đến việc tìm tập ắt c các đổ thị con

thường xuyên cũng là rất lớn Eơn hết, cổ một số đỗ thị thường xuyên lại có độ

trợ bằng với đồ thị thường xuyên cha của nó Vĩ thể, ciệc tìm tập ấtcảcác đồ thị con

thường xuyên đồng có hiệu quả trong các ứng dụng thực tiễn hơn Bởi từ đỗ thị thường xuyên đồng ta có thé tim ra tất cả các đỗ thị là con của đỗ thị đó nên việc liệt

“kê hết ác đỗ thị con thường xuyên của một đỗ thị thường xuyên đồng làm tốn thêm

"bệ nhớ lườ trữ Tụ Tóc cinco thé ìm các đỗ thị con thường xuyên nhanh bơn, hơng

nếu số lượng đỗ thị đầu vào lớn và số lượng đổ thị con thường xuyên l lớn th việc liệt kê hết không hiệu quả bằng chỉ liệt kẽ các đ thị con thường xuyên đông Trong

phin này, giới thiệu một kết quả có thé làm tăng hiệu quả khai phá đỗ thị con thường

"uyên nhất là đỗ thị con thường xuyên đồng

Trang 29

để thị con nào đồ có một tính chất thì toàn bộ đổ thị công có tính chất đó Chẳng hạn như một đồ thịlà không phẳng nễo như nô chứa một đỗ thị hai phía đầy để (complete bipartite graph ) hoặc nếu nô chứa đổ thi diy 6

Sau đây là những khái niệm, tính chất cơ sở tiên quan đến bài toán đỗ thị ding cấu GI (graph isemerphism) [14, 16]

Chúng ta xết đồ thị đơn vô hướng với các đình được gẵn nhấn G = (V, E, N, L), trong đồ

* Vi tập các đình, V

* _E tập các cạnh là tập các cặp định phân biệt, không cổ thứ t, |“

+ Him gin uhin : V —> N, N — tập các số tự nhiễn 1, 2,

Trong dé thi G, đường đi từ định ơ đến là đấy các đình phân bit

{v1 72, me}

vua

y= v sao cho (vi, vit) e E với í = 1, 2, k1, Nếu tên tại đường đi nổi v với u

thita ndi u và v liên thông theo đường đi có độ đãi 1 Đường đi từ u đến kỹ hiệu lips

Định nghĩa 21 Cho trước cặp dinh (o, v) trong G, ta định nghĩa khoảng cách (Gistance) d(x) ni sau:

to,

d(o,v) = Đường đi ngắn nhất tờ u đến v, nếu u vả viên thông, và

0, nếu

ate, v) = S ngược lại

"Định nghĩa 2⁄2 Với mỗi cặp đình (o, x) trong G, Guy là đổ thị phụ thêm (collateral traph) được định nghĩa như sa:

+ Nếu (, v) £ E, tủ Giuy là đỗ thị nhận được từ đồ thị G bằng cách loại bổ canh nỗi v với , trong khi vẫn bão toàn các đình Trong trường hợp này ta sử đọng

ký hiệu + đễ phân biệt hàm khoảng cách

+ Nếu (ø,v) ¢ E, thì Giưy = G Trong trường hợp này ta sử đọng ký hiệu - để phân biệt hâm khoảng cách

Định nghĩa 2.3 Đổ thị ết đổi Ga cho cặp đỉnh (o, v) trong G được định nghĩa nhơ

Trang 30

2

+ w là đình của Gạ khi và chỉ kh w năm trên đường đi ngắn nhất từ đến v trong Guy, và

« (os) là cạnh Gux nếu (w,x) công là cạnh của G

Đi với mỗi cặp đình (o, v) trong G, xá định một bộ đẫu ((o,x)-sien), ký hiệu

là sa, được xắc định như sau

se = * đa #nsếme Treng đề:

+ Dấu ở đầu là + nếu (ø, v) £ E, ngược lạ là-kải (6, x) £ E;

+ đa là khoảng cảch do, v) rong đổ thị thêm Gv;

+ na là số các đình trong đồ thị ết đối Gạ;

+ mạ là số các cạnh trong đồ thị kết đối Ga;

Các bộ gi tr > da #nsemox được gọi là bộ đấu hiệu của ma tiên

Định nghĩa 2 Ma trận dẫu của đỗ thị G, kỷ hiều Sơ (sz)a v V

Lưu ý, đối với đ thị đơn, vô hướng thì cả ma trận liền kd vd ma tn di (ign matis) là ma trận đối sóng

Binh nghin 2.5 Giả thiết tập ắt các bộ đấu hiệu của ma trận đấu được xếp theo thứ

tu tir didn thành e,s, te Vecter tên xuất dẫu của đình v © Va f= (80,82,

&®), trong đồ &® là số lần xuất hiện dấu sự trên hàng v trong ma trận đầu

Định nghĩa 26 Hai địch của đ thị G được gọi à trong đương với nhau nếu chúng

cé cing vector tin mit div

Theo định nghĩa trén, tip céc dinh cba đỗ thị sẽ phân hoạch thành các lớp tương đương Tờ đồ suy ra, dạng chính tắc So* của ma trên dẫu Sơ được định nghĩa chính xác theo hoán vị ca các đình trong mỗi lớp tương đương,

inh nghia 2.7 Dang chink tic (canonical form) So* la ma tn dẫu được xếp ại các

tàng, cột theo thứ tự từ điễn của các vector tin xuất của dầu Nếu hai đỉnh cũng lớp

tương đương tóc à cô công vector tẫn xuất của dẫu tỉ thổ tự không quan trong, ta

có thể thay đối thứ

Trang 31

1:2 Thuật tốn kiểm tra đồ thị

“Thuật tốn kiểm tra tính đẳng cấu của hai đồ thị đơn được thực hiện dựa chủ

giấu

Yến vẫo bốn thuật tốn sau [1]

2.24 Thuge tốn Dịnhươn tim đường đi ngắn nhất

Input: Cho te 68 thi G= (V, E) va dinh = V,

Ouipua: Tip titcé cdc doug đi ngắn uhit ti ti moi inh v trong V

Ta định nghĩa a(o, v)= 1 név (0, v) £ E và s(o, v)=œ nếu (0, v) £ E Ký hiệu

‘Vino li tập các đình v mà đã xắc định được đường đi ngắn nhất

Thodt oan shortestPath (G,u)

While (Visors == VOR 4 (u, w) © véi moi dink Ww Visco?

Lu j: khi d(, w) <= véi moi din w £ Vm« thì các định cơn lạ (nằm

"ngồi Visews ) khng duge két ni vi din v

2.2.2, Thue todn tink khodng cách dịu 9) trong các đỗ

đối

“Thu: Cho trước đỗ thị G=(V, E) và định, v © V,

Ouiput: Khộng cách dịo,v) trong đã thị phụ thêm Gi, và đỗ thị kết đơi Guz Thuật toần diztancePairGraph(G, 9, v)

t

Tỉnh đổ thi phy thém G\uv theo din nghia 2.2;

¡phụ thâm wa đồ thị kết

pathl = shortestPath (G\uv, u); //Tập tất cả các

đường đi ngắn nhất từ u tới mọi đỉnh x trong G\uv //Đường ŒL ngắn nhất từ u đến v trong G\uv

đíu, vị = 1ength(Ps), Ba © pathl;

Trang 32

Tính đổ chị kết đôi Gy theo Định nghĩa 2.3;

>

Nếu đường đi

vi, 0à, và đường đi v vụ và, vụ là bai đường đi

"ngắn nhất trong tập pathÏ sao cho t= v vã tổng độ dài hai đường đi đó bằng dịu, x) trong đỗ thị Giuy thì các định trên cả hai đường đi nấy là các đình trong 43 thi Gu

Dé nhận thấy, mọi đường đi ngắn hất p„ cổ chứa đinh w đều nhận được bằng

cách kết nối đường đi ngắn nhất puw với đường đi ngắn nhất pyy trong Giuv Do

abit 6 path? théa manu:

vậy, phải tẫn tạ ít nhất một cặp đường ding r với

“mọi định w trong Ge:

2.2.3, Thuge toán xác ma trận đấu và đạng chính tắc cũa nổ

Input: Cho trase 48 thi G=(V, E),

Ouapua: Ma rin div So, dang chinh tic So*

Thuật tần signAndForm(G=(V, E))

Se = (s„) với mọi t, ve V;//Ma trận đâu của G

Sắp xếp tập tắt cả s„„ phân biệt thứ tự tử điển thành:

for i'= "I to n do

céc vector tan xudt déu f:, fr,

cla ma trén déu S: theo poan vi i:,

ia cdc đỉnh 1, 2, ., n của đồ chị để nhận được

„ fa theo thứ tự thử

Ngày đăng: 24/12/2024, 14:38

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1]. Đoàn Văn Ban (chủ nhiệm đề tà), PHÂN TÍCH, PHÁT HIEN CẤU TRÚC. CỘNG ĐÔNG TRÊN MẠNG XÃ HỘI, Báo cáo để tài VAST0I.09/14-15, 2015[DI Hoàng Minh Quang, Võ Đức Thị, Phạm Quốc Hòng, MỘT SỐ VAN DE VEKHAI PHA BO THI CON THƯỜNG XUYÊN ĐÓNG, Äỹ yất Hội nght Khoa hoe Quốc gia lần thứ DY “Nghiên cứa cơ bản và ng đụng Công nghệ thông tòn (PAIR'9)"; Cin Tho, ngiy 4-5/8/2016 DOK: 10.15625ivap.2016.00037 Sách, tạp chí
Tiêu đề: Nghiên cứa cơ bản và ng đụng Công nghệ thông tòn (PAIR'9)
[1] ohn Boaz Lee, Ryan Rossi, and Xiangnan Kong. 2018. Graph Classification using Structural Attention. 24th ACM SIGKDD International Conference on Knowledge Discovery &amp; Data Mining, In KDD 2018 Khác
[12]-L. Debaspe, H. Toivonen, and R. D. King. Finding fre-quent substructures in chemical componuds. Proc. of the 4th International Conference on Knowledge Discovery and Data Mining, pages 30-6, 1998 Khác
[13].M. Kuramochi and G. Karypis. Frequent subgraph discovery. Jn JCDM'01, 2001 [14].S. Raghavan and H. Garcia-Molina. Representing web graphs. In Proceedings ofthe IEEE Intl. Conference on Data Engineering, 2003 Khác
[15]. Saif Ur Rehman, Asmat Ullah Khan, Simon Fong, Graph Mining: A Survey of Graph Mining Techniques, https: www esearchgate net‘publication/233801707 [16]. Vincenzo Bonnicilt , Rosalba Giugno2*t , Alifedo Pulvirenti , Dennis ShashaAlffedo Ferro, A subgraph isomorphism algorithm and its application to biochemical data, Bonnici e¢ al. BMC Bioinformatics 2013, 14(Suppl 7)S13 Khác

HÌNH ẢNH LIÊN QUAN

Hình 2.1.  Các  phần  tử hàng - cí - Bài toán Đồ thị con Đẳng cấu trong khai phá dữ liệu Đồ thị và Ứng dụng phát hiện Đồ thị con phổ biến
Hình 2.1. Các phần tử hàng - cí (Trang 40)

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w