Chúng ta lựa chọn độc lập một số k các đỉnh ngẫu nhiên và xác định các cạnh giữa chúng để có được một đồ thị con cảm sinh ngẫu nhiên Đồ thị con H của một đồ thị G được gọi là đồ thị con
Trang 1ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
Trang 2ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
LUẬN VĂN THẠC SĨ KHOA HỌC
Cán bộ hướng dẫn: TS Lê Anh Vinh
Hà nội – 2012
Trang 3Mở đầu 4
Chương I Tổng quan về đồ thị với kích thước rất lớn 6
1.1 Mạng khổng lồ 6
1.2 Chúng ta cần biết gì về chúng? 7
1.3 Làm thế nào để có được thông tin về chúng? 8
1.4 Mô hình chúng thế nào? 10
1.5 Xấp xỉ chúng thế nào? 12
Chương II Đồ thị ngẫu nhiên 17
2.1 Các mô hình cơ bản 17
2.2 Các tính chất của hầu hết tất cả các đồ thị 22
2.3 Các tập con lớn nhất của các đỉnh 24
2.4 Các đồ thị chính quy ngẫu nhiên 27
2.5 Cấu trúc và xây dựng 29
Chương III Mô hình các mạng xã hội trực tuyến 41
3.1 Mô hình ILT 43
3.2 Các kết quả chính 45
Kết Luận 54
Phụ Lục 55
1 Ký hiệu và kết quả cơ bản 55
2 Một vài phân phối xác suất cơ bản 58
3 Hội tụ trong phân bố 60
Tài liệu tham khảo và trích dẫn 63
Trang 4Mở đầu
Ta biết rằng một số lớn các cấu trúc và hiện tượng của thế giới có thể được
mô tả bởi các mạng với các phần tử tách rời và các liên kết hay tác động giữa các cặp phần tử đó Mạng xã hội, với hơn 7 tỷ nút, mạng nơ ron thần kinh trong não con người với số lượng khoảng 100 tỷ nơ ron, mạng Internet với số lượng các trang web hiện nay có thể hơn 30 tỷ…
Mạng khổng lồ đưa ra thách thức cho các nhà toán học Lý thuyết đồ thị - một trong những lĩnh vực toán học phát triển nhanh nhất, phải đối mặt với vấn đề khá mới lạ và độc đáo này Trong các bài toán lý thuyết đồ thị truyền thống, các
đồ thị được đưa ra chính xác và việc tìm kiếm các quan hệ giữa các tham số của
nó hoặc các thuật toán hiệu quả đã được nghiên cứu Nhưng mạng có kích thước khổng lồ (giống như Internet) chưa bao giờ được biết đến đầy đủ Thậm chí, trong hầu hết trường hợp chúng không được xác định rõ ràng
Đồ thị ngẫu nhiên – một đồ thị được sinh ra bởi một quá trình ngẫu nhiên là một công cụ hữu hiệu để mô hình các mạng khổng lồ, các đồ thị có kích thước rất lớn
Luận văn tập trung vào trình bày và tìm hiểu lý thuyết và các kết quả đã có
về các mạng khổng lồ Các mô hình ngẫu nhiên và mô hình các mạng xã hội trực tuyến
Luận văn gồm ba Chương:
Chương I Tổng quan về đồ thị với kích thước rất lớn Giới thiệu về đồ thị với kích thước rất lớn, cách thu thập thông tin, cách mô hình và xấp xỉ các mạng
có kích thước lớn
Trang 5Chương II Các mô hình của đồ thị ngẫu nhiên: giới thiệu các mô hình cơ bản, các tính chất của hầu hết tất cả các đồ thị, các tính chất của đồ thị chính quy, tổng đặc trưng và xây dựng đồ thị Paley
Chương III Mô hình các mạng xã hội trực tuyến
Luận văn hoàn thành được nhờ có sự hướng dẫn, chỉ bảo tận tình của TS Lê Anh Vinh Em xin cảm ơn thầy về những đóng góp bổ ích đó! Em cũng xin cảm
ơn các thầy cô trong bộ môn đã động viên, khích lệ để cho em có thể hoàn thành được luận văn này!
Vì khả năng có hạn nên luận văn không tránh khỏi những thiếu sót Em kính mong các thầy cô xem xét và góp ý!
Hà nội, tháng 05 năm 2012
Học viên: Nguyễn Minh Sáng
Trang 6Chương I Tổng quan về đồ thị với kích thước rất lớn
1.1 Mạng khổng lồ
Ta biết rằng một số lượng lớn cấu trúc và các hiện tượng của thế giới có thể được mô tả bởi các mạng: các phần tử tách rời với các liên kết (hay tác động) giữa các cặp phần tử
Trong số các mạng, được biết đến và nghiên cứu nhiều nhất là Internet Hơn nữa, Internet làm tăng số lượng các mạng: mạng các siêu liên kết (web, Internet toàn cầu), Internet dựa trên các mạng xã hội, phân bố cơ sở dữ liệu,… Kích cỡ Internet phát triển nhanh chóng về số lượng các trang web,…
Một mạng gần gũi hơn là mạng xã hội Mạng xã hội dựa trên sự nghiên cứu các đối tượng thuộc xã hội, lịch sử, kinh tế Mạng xã hội lớn nhất là một đồ thị quen biết của tất cả mọi người, trong đó mỗi người là một nút và hai người quen nhau khi có cạnh nối hai nút đó Mạng xã hội có hơn 7 tỷ nút
Một số mạng lớn nhất trong kỹ thuật xảy ra trong thiết kế chíp Mặc dù các mạng này được con người lập kế hoạch và chế tạo, nhưng nhiều tính chất của chúng rất khó để xác định do kích thước khổng lồ, có thể là hơn một tỷ transitors trên một chíp
Mạng khổng lồ đưa ra thách thức cho các nhà toán học Lý thuyết đồ thị - một trong những lĩnh vực toán học phát triển nhanh nhất, phải đối mặt với vấn đề khá mới lạ và độc đáo này Trong các bài toán lý thuyết đồ thị truyền thống, các
đồ thị được đưa ra chính xác và việc tìm kiếm các quan hệ giữa các tham số của
nó hoặc các thuật toán hiệu quả đã được nghiên cứu Nhưng mạng có kích thước khổng lồ (giống như Internet) chưa bao giờ được biết đến đầy đủ Thậm chí, trong hầu hết trường hợp chúng không được xác định rõ Dữ liệu về chúng chỉ
Trang 7được thu thập qua việc lấy mẫu ngẫu nhiên hoặc bằng cách kiểm tra hoạt động của các quá trình toàn cục khác nhau
Hai đối tượng được nghiên cứu nhiều nhất là mạng dày đặc (trong đó |G| =
(|V|2)) và mạng thưa thớt (trong đó |G| = O(|V|)) (xem [16]) Thực tế, các mạng
thưa thớt thì quan trọng hơn, nhưng hiện nay chúng ta có một hệ thống kết quả lý thuyết đầy đủ hơn cho các mạng dày đặc
Chương I mang tính chất tổng quan, liên quan đến việc thu thập thông tin, cách mô hình và xấp xỉ các mạng có kích thước rất lớn Nội dung chủ yếu được dịch từ các bài báo của L Lova’sz [37]
Q2 Bậc trung bình của các đỉnh
Bậc trung bình của các đỉnh là gì? Đây là câu hỏi đầy ý nghĩa Tất nhiên, bậc trung bình chỉ có thể được xác định với một sai số nào đó, và nó sẽ thay đổi với công nghệ của người sử dụng, nhưng tại một thời điểm, một xấp xỉ tốt có thể được tìm kiếm
Q3 Tính liên thông
Đồ thị có liên thông không? Với câu hỏi này, câu trả lời gần như là không có Nhưng điều này không phải là cách thú vị để đặt câu hỏi Chúng ta xem xét Internet bị ngắt bởi một trận động đất Vì vậy chúng ta muốn bỏ qua các thành phần nhỏ (không đáng kể liên quan tới toàn bộ đồ thị) và xem xét các đồ thị bị
Trang 8thị) Mặt khác, chúng ta có thể cho phép hai phần đó được kết nối với nhau bởi một vài cạnh và vẫn xem đồ thị đó là không liên thông
Q4 Nhát cắt cực đại
Làm thế nào để tìm kiếm nhát cắt lớn nhất trong đồ thị? Nói một cách khác, chúng ta đi tìm sự phân hoạch các đỉnh thành hai lớp để tối đa số cạnh liên kết hai lớp Câu trả lời là không dễ dàng Một phần nhỏ của các cạnh chứa trong nhát cắt lớn nhất có thể được xác định tương đối dễ dàng (với sai số nhỏ cho xác suất lớn), nhưng làm thế nào để xác định nhát cắt lớn nhất trong bản thân chúng?
1.3 Làm thế nào để có được thông tin về chúng?
Nếu chúng ta đối mặt với một mạng lớn (như Internet) thách thức đầu tiên là thu được thông tin về chúng Thông thường chúng ta thậm chí không biết số lượng các nút
1.3.1 Mẫu địa phương
Tính chất của các đồ thị rất lớn có thể được nghiên cứu bởi các mẫu đồ thị con nhỏ
Trong trường hợp các đồ thị dày đặc G, quá trình lấy mẫu là đơn giản Chúng
ta lựa chọn độc lập một số k các đỉnh ngẫu nhiên và xác định các cạnh giữa chúng để có được một đồ thị con cảm sinh ngẫu nhiên (Đồ thị con H của một đồ thị G được gọi là đồ thị con cảm sinh nếu với mọi cặp đỉnh x, y của H, (x,y) là một cạnh của H nếu và chỉ nếu (x,y) là một cạnh của G.) Chúng ta gọi chúng là các mẫu đồ thị con Cho mỗi đồ thị F, chúng ta định nghĩa một xác suất quan sát
F khi |V(F)| các đỉnh được lấy mẫu và đưa ra một phân bố xác suấtG k, trên tất
cả các đồ thị với k đỉnh Mẫu này chứa đủ thông tin để xác định nhiều tính chất
và tham số của đồ thị (xem [37])
Trang 9Trong trường hợp các đồ thị thưa thớt với bậc bị chặn, phương pháp lấy mẫu các đồ thị con dẫn tới một kết quả tầm thường: trong đồ thị con được lấy mẫu, các cạnh sẽ ít hơn Xác suất là cách tự nhiên nhất để xem xét mẫu lân cận Cho
d
G là lớp các đồ thị hữu hạn với tất cả các bậc bị chặn bởi d Với GGd, chọn
một đỉnh ngẫu nhiên và khảo sát lân cận của chúng tới một khoảng cách m cho
trước Điều này cung cấp một phân bố xác suất G m, trên các đồ thị trong Gd với
một đỉnh gốc định rõ sao cho tất cả các đỉnh có khoảng cách tối đa m từ gốc Các
đồ thị gốc như các m-cầu và số lượng m-cầu là hữu hạn nếu d và m là cố định
(xem [37])
Đồng cấu giữa hai đồ thị: Một đồ thị G được gọi là đồng cấu tới một đồ thị H
nếu có một ánh xạ từ V G( )V H( ) thỏa mãn: với hai đỉnh kề trong G thì hai đỉnh tương ứng của chúng là kề trong H
Phân bố mẫu (trong cả hai trường hợp dày đặc và thưa thớt) là tương đương
để tính toán các đồ thị con cảm sinh của một kiểu cho trước Để thay thế điều này, chúng ta có thể tính toán số đồng cấu (hoặc các tự đồng cấu) của các đồ thị
―nhỏ‖ vào đồ thị gốc
1.3.2 Quan sát quá trình toàn cục
Những nguồn thông tin khác về một mạng là việc quan sát hoạt động của các quá trình toàn cục khác nhau (qua việc xem xét một vài tham số toàn cục) hoặc địa phương (tại một nút hoặc một vài các nút lân cận, nhưng trong thời gian lâu hơn) Tuy nhiên một lý thuyết tổng quát của các quan sát địa phương chưa xuất
hiện (xem [6])
Trang 101.3.3 Đồng cấu trái và phải
Thay vì kiểm tra, sẽ thuận tiện hơn để nói về đồng cấu giữa các đồ thị Điều
này dẫn đến các thiết lập sau Nếu chúng ta đưa ra một đồ thị G lớn, chúng ta có
thể nghiên cứu các cấu trúc địa phương của nó bằng cách tính toán các đồng cấu
từ nhiều đồ thị nhỏ khác nhau F vào G và chúng ta có thể nghiên cứu cấu trúc
toàn cục của nó bằng cách tính các đồng cấu của nó vào trong các đồ thị nhỏ
(xem [27]) Cho số nguyên dương n và số thực p, 0 ≤ p ≤ 1 Đồ thị ngẫu nhiên
G(n,p) là một đồ thị với tập đỉnh được gán nhãn [n] = {1,2,…,n} và mỗi cặp đỉnh
có một xác suất liên kết độc lập p
Có nhiều mô hình thay thế, bản chất là tương đương: chúng ta cố định số
cạnh là m và sau đó chọn một tập con m phần tử ngẫu nhiên từ tập các cặp trong [n], thống nhất từ tất cả các tập con Đồ thị ngẫu nhiên như vậy ký hiệu là G(n,m)
tương tự như G(n,p) với m = p
2
n
Một mô hình khác, gần gũi hơn, phát triển
gần đây là các đồ thị tiến hóa ngẫu nhiên, trong đó các cạnh được thêm vào lần lượt và luôn chọn thống nhất từ tập các cặp không liên thông Dừng quá trình này
sau m bước, chúng ta có đồ thị G(n,m)
Đồ thị ngẫu nhiên Erdo‖s-Re’nyi có nhiều tính chất ngạc nhiên, thú vị Các
đồ thị ngẫu nhiên với mật độ cạnh cho trước đều có các tính chất giống nhau Ví dụ: các tham số cơ bản, số màu, đồ thị con đều lớn nhất, mật độ tam giác,…
Trang 11Thực tế này là động lực quan trọng khi định nghĩa độ đo đúng toàn cục của các
đồ thị (xem [8])
1.4.2 Đồ thị phát triển một cách ngẫu nhiên
Mô hình đồ thị ngẫu nhiên trên một tập đỉnh cố định được thảo luận ở trên không có khả năng tái lập các tính chất quan trọng của các mạng thực tế Ví dụ, bậc của đồ thị ngẫu nhiên Erdo‖s – Re’nyi tuân theo một phân phối nhị thức và
vì vậy chúng tiệm cận chuẩn nếu xác suất cạnh p là một hằng số và tiệm cận phân bố Poisson nếu bậc mong muốn là hằng số (tức là p = p(n) ~ c/n) Trong
các trường hợp khác, các bậc cao tập trung quanh giá trị trung bình, trong khi các
bậc của các mạng thực tế có khuynh hướng tuân theo ―hiện tượng Zipf ‖, nghĩa là
đuôi của sự phân bố giảm theo luật số lớn (xem [37])
1.4.3 Các đồ thị tựa ngẫu nhiên
Lý thuyết đồ thị ngẫu nhiên được giới thiệu bởi Thomason (xem [44]) và Chung, Graham, Wilson (xem [18]) dựa trên các quan sát sau: không chỉ đồ thị ngẫu nhiên có nhiều tính chất khá ngặt (với xác suất lớn) mà đối với một số tính chất cơ bản, các đồ thị đặc biệt cũng vậy
Chúng ta xem xét dãy đồ thị G n với | (V G n)| Để đơn giản, chúng ta giả thiết rằng | (V G n) |n Cho 0 < p < 1 là một số thực, ta xem xét các tính chất sau
của các đồ thị
(P1) Tất cả các bậc tiệm cận pn và tất cả các bậc chung (số lân cận chung của
hai đỉnh) tiệm cận với p 2
Trang 12(P4) Số cạnh sinh ra từ một tập αn các đỉnh tiệm cận với p n 2 2/ 2
Tất cả các tính chất đó đúng với xác suất tiệm cận với 1 nếu G n = G(n,p)
Tuy nhiên nếu một dãy đồ thị thỏa mãn một trong các tính chất đó thì thỏa mãn
các tính chất còn lại (xem [18]) Dãy đồ thị như vậy được gọi là tựa ngẫu nhiên
Bốn tính chất ở trên chỉ ở một mẫu Có nhiều tính chất tựa ngẫu nhiên khác cũng
tương đương
1.5 Xấp xỉ chúng thế nào?
Chúng ta muốn mô tả một xấp xỉ của một mạng rất lớn, thường bởi các mạng
nhỏ hơn Để làm chính xác về mặt toán học, chúng ta cần định nghĩa hai đồ thị
là tương tự nhau và mô tả các cấu trúc sử dụng để xấp xỉ Ta cần đến khái niệm
khoảng cách của hai đồ thị
1.5.1 Khoảng cách sửa
Có nhiều cách để định nghĩa khoảng cách của hai đồ thị G và G Giả sử hai '
đồ thị có chung tập đỉnh [n] Một khái niệm tự nhiên của khoảng cách là khoảng
cách sửa định nghĩa như sau: số cạnh phải thay đổi để chuyển từ một đồ thị tới
một đồ thị khác Khoảng cách sửa giữa hai đồ thị G và G được định nghĩa bởi '
công thức
1
| ( ) ( ') |( , ')
Trang 13E(G)E’(G’) = {AB,BC,CD,DE,EF,FA,AC,CE,EA,BD,DF,FB}
E(G)E’(G’) = {AB,BC,CD,DE,EF,FA}
E(G)E’(G’) \ E(G)E’(G’) = {AC,CE,EA,BD,DF,FB}
| E(G)E’(G’) \ E(G)E’(G’)| = 6; n = 6
d1(G,G’) = | E(G)E’(G’) \ E(G)E’(G’)| / C2
n = 6/ 6!
2!4! = 2/5
Trong khi khoảng cách này đóng một vai trò quan trọng trong nghiên cứu các tính chất đồ thị, nó lại không phản ánh tốt sự tương đồng về cấu trúc Chúng
ta xem xét hai đồ thị ngẫu nhiên trên [n] với mật độ cạnh 1/2 Như đề cập trong
phần giới thiệu, những đồ thị này là tương tự nhau gần như ở mọi khía cạnh
nhưng khoảng cách sửa của chúng là lớn (khoảng 1/2 với xác suất lớn)
Một rắc rối khác với khái niệm khoảng cách sửa là nó chỉ định nghĩa được khi hai đồ thị có cùng một số đỉnh
Chúng ta có thể dựa trên độ đo của khoảng cách trên mẫu Khoảng cách mẫu
của hai đồ thị G và G được định nghĩa bởi công thức '
Trang 14trong đó d t v( , ) sup | ( ) X X ( ) |X là tổng các khoảng cách biến thiên của phân
bố α và β Ở đây hệ số 1/2k chỉ để làm cho tổng hội tụ Tuy nhiên khoảng cách này sẽ không phản ánh trực tiếp sự tương đồng về cấu trúc
Việc xây dựng khoảng cách mẫu có thể áp dụng cho các đồ thị với bậc bị chặn bằng cách thay thế trong (1.1) phân bố mẫu G k, bởi phân bố lân cận G k, Tuy nhiên, rất khó có thể định nghĩa khoảng cách giữa hai đồ thị với bậc bị chặn
để phản ánh sự giống nhau toàn cục của chúng (xem [37])
1.5.2 Khoảng cách cắt của hai đồ thị
Định nghĩa về khoảng cách của hai đồ thị tùy ý khá phức tạp và chúng ta sẽ xem xét vấn đề theo các bước: bắt đầu với hai đồ thị có cùng tập đỉnh, sau đó chuyển tới hai đồ thị với số đỉnh giống nhau (nhưng không liên quan), cuối cùng chuyển tới các trường hợp tổng quát
1.5.3 Hai đồ thị với cùng tập đỉnh
Cho G và G là hai đồ thị với tập đỉnh chung [n] Khái niệm khoảng cách 'được thảo luận ở đây được đề xướng bởi Frieze và Kannan (xem [26]) Cho một
đồ thị không trọng số G = V(E) và tập S T, V Ký hiệu e S T G( , ) là số cạnh
trong G với một đỉnh kết thúc trong S và đỉnh khác kết thúc trong T (đỉnh kết thúc cũng có thể thuộc ST, vì vậy e S S G( , ) là hai lần số cạnh của G trong tập
S) Cho hai đồ thị G và G trên tập nút giống nhau [n], chúng ta định nghĩa 'khoảng cách cắt:
'
2 , ( )
1( , ') max | G( , ) G( , ) |
Chú ý rằng chúng ta chia cho n2 mà không phải |S|x|T| Tuy nhiên, chia cho
|S|x|T| các tập nhỏ quá nhiều và giá trị lớn nhất sẽ đạt được khi |S| = |T| = 1 Với định nghĩa này, sự đóng góp của một cặp S,T nhiều nhất là |T|.|S|/n2
(cho các đồ thị đơn)
Trang 151.5.4 Hai đồ thị với cùng số đỉnh
Nếu G và G là hai đồ thị không trọng số, không được gán nhãn trên tập các '
đỉnh khác nhau nhưng lực lượng cùng bằng n thì chúng ta định nghĩa khoảng
G và số nguyên dương m, ký hiệu G(m) là các đồ thị thu được từ G bằng cách
thay thế mỗi đỉnh của G bởi m đỉnh, trong đó hai đỉnh mới được nối với nhau nếu
và chỉ nếu các đỉnh gốc tương ứng cũng vậy
Chúng ta có thể sử dụng khoảng cách ˆ để định nghĩa khoảng cách
ˆ( , ') lim ( [kn'],G'[kn])
―Phân hoạch Szemeredi‖ hoặc ―Bổ đề chính quy‖ (xem [37])
Xấp xỉ vô hạn: Hội tụ và giới hạn
Trang 16Xét một dãy phát triển các đồ thị (Gn) với số nút tiến tới hữu hạn và để xác định khi nào một dãy hội tụ Các thảo luận của chúng ta về mẫu dẫn tới một khái niệm: chúng ta xem xét các mẫu với kích thước k cho trước từ Gn và phân bố của chúng Chúng ta nói rằng một dãy là hội tụ địa phương (với phương pháp mẫu cho trước) nếu phân bố tiến tới một giới hạn khi n với moi k cố định
Với các đồ thị dày đặc, khái niệm hội tụ được giới thiệu bởi Erdos, Lovasz (xem [23]) Các đồ thị thưa thớt khái niệm hội tụ được giới thiệu bởi Aldous, Benjamini và Schramm (xem [5])
Định nghĩa ở trên thay cho giới hạn của một dãy các đồ thị giống như tập hợp các phân bố xác suất trên các đồ thị Điều này không phải luôn luôn giúp ích cho việc mô tả các đối tượng giới hạn, và một mô tả rõ ràng hơn là luôn được mong đợi
Trang 17Chương II Đồ thị ngẫu nhiên
Mô hình đồ thị ngẫu nhiên là một công cụ hữu hiệu để mô hình các mạng có kích thước rất lớn Mục đích chính của lý thuyết đồ thị ngẫu nhiên là xác định một tính chất cho trước có nhiều khả năng xuất hiện Nội dung phần này chủ yếu được dịch từ các tài liệu của B Bollobas [8]
Xét đồ thị với n đỉnh V = {1,2,…,n} Ký hiệu tập các đồ thị với tập đỉnh V
M luôn là một hàm của
n, M = M(n) Xác suất và kỳ vọng trongG (n,M(m)) ký hiệu là P M(X) và EM(X).
G (n,M) có thể viết đơn giản là GM hayG(M)
Trong mô hình G (n,P(cạnh) = p) ta có 0 < p < 1 và mô hình gồm tất cả các
đồ thị có tập đỉnh V trong đó các cạnh được chọn độc lập với xác suất p Nói cách khác nếu G 0 là một đồ thị với tập đỉnh V và có m cạnh thì
P({G0}) = P(G=G0) = p m q N - m Xác suất và kỳ vọng trong G(n,P(cạnh) = p) được ký hiệu là P p và E p G{n,
P(edge) = p(n)} có thể ký hiệu là G(n,p), G p, G(p)
Xa hơn, G p , G M thay thế cho các đồ thị ngẫu nhiên từ G(n,p) và G(n,M) Vì
vậy P(G p không liên thông) là xác suất một đồ thị trong G{n, P(edge) = p}
Trang 18không liên thông Chúng ta viết G n,p và G n,M để nhấn mạnh các đồ thị của chúng
Một tính chất Q được nói là đơn điệu tăng nếu với G ∈ Q và G H thì H ∈
Q Ta gọi Q là lồi nếu F G H và F ∈ Q, H ∈ Q thì G ∈ Q Nếu Q là một tính chất nào đó thì P M (Q) là xác suất để một đồ thị của G (n,M) có tính chất Q Tương tự chúng ta định nghĩa được P p (Q)
Cho n là một mô hình của các đồ thị ngẫu nhiên bậc n (Vì vậy chúng ta
thường có n= G {n,M(n)} hoặc n= G (n,p)) Ta nói ―hầu hết mọi‖ đồ thị
trong n có một tính chất Q nào đó nếu P Q( )1 khi n , tức là khẳng định
―hầu hết mọi G G (n,1/2) có tính chất Q‖ có nghĩa là bộ phận tất cả các đồ thị bậc n được gán nhãn có Q , tiến tới 1 khi n
Đặt p(p2 p1) / (1 p1) Chọn độc lập G 1 ∈ G (n,p1) và G ∈ G(n,p2) và
tập G 2 = G 1 ∪ G Khi đó các cạnh của G 2 đã chọn lựa độc lập với xác suất
Trang 19p1 + p – p1p = p2 , vì vậy G 2 là phần tử của G(n,p2) Vì Q là đơn điệu tăng, nếu G1 có tính chất Q và G 2 có tính chất Q thì P p1(Q) ≤ P2(Q) □
Endo‖s và Re’nyi (xem [22]) đã nhận thấy rằng hầu hết các tính chất đơn
điệu xuất hiện khá đột ngột: Với một M = M(n) nào đó phần lớn G M không có
tính chất Q trong khi đó chỉ với M lớn hơn một chút thì gần như mọi G M có tính
chất Q Cho trước một tính chất đơn điệu tăng, một hàm M * (n) được gọi là hàm
ngưỡng cho Q nếu:
M(n)/M * (n) 0 , thì hầu hết không G M nào có tính chất Q ,
và M(n)/M * (n) ∞, thì hầu hết tất cả G M có tính chất Q
Khi nghiên cứu một tính chất đồ thị đặc biệt Q, chúng ta thường thành công nhiều hơn trong việc đồng nhất một hàm ngưỡng: với nhiều tính chất Q, ta không xác định đúng hàm ngưỡng nhưng với mọi x, 0 < x < 1, chúng ta tìm được một hàm M x(n) sao cho P(GM, có tính chất Q) → x khi n → ∞
Hàm ngưỡng là không duy nhất Nếu M1* là hàm ngưỡng của Q thì M2* cũng
là hàm ngưỡng của Q nếu và chỉ nếu * *
1 ( 2)
M O M
Mô hình G p có thể sử dụng dễ dàng hơn G M vì trong G p các cạnh được chọn độc lập, trong khi trong mô hình G M việc chọn một cạnh ảnh hưởng việc chọn cạnh khác
Có nhiều mô hình khác nhau của đồ thị ngẫu nhiên Bằng việc đưa vào tất cả các đồ thị vào một tập hữu hạn với xác suất giống nhau, chúng ta thu được một
không gian xác suất Theo đó, ta có các đồ thị k-chính quy ngẫu nhiên, cây ngẫu
nhiên, rừng ngẫu nhiên,v.v Chúng ta sẽ xem xét chi tiết các đồ chính quy ngẫu nhiên Hai mô hình được thảo luận là G(n,p) và G(n,M)
Trang 20Cho 0 < p <1 là cố định Mô hình G (N,p) được nghiên cứu bởi Bolloba’s và
Erdo‖s (1976) gồm tất cả các đồ thị với tập đỉnh N, trong đó các cạnh được chọn
độc lập với xác suất p Nói cách khác, một đồ thị ngẫu nhiên G ∈ G(N,p) là một
tập (X ij) = {Xij: 1 ≤ i < j} của các biến ngẫu nhiên độc lập với P(Xij = 1) = p và P(Xij = 0) = q: một cặp (i, j) là một cạnh của G nếu và chỉ nếu Xij=1 Gn =
G[1,2,…,n], đồ thị con của G được mở rộng bởi 1,2,…,n , chính là một đồ thị
ngẫu nhiên G p trên V = {1,2,…,n}
Không gian G(N,p) có số lượng không đếm được các điểm và chỉ phụ thuộc
vào p Định nghĩa ―hầu hết mọi‖ được định nghĩa như sau: hầu hết mọi G ∈ G(N,p), được nói là có một tính chất Q nếu P(G có tính chất Q) = 1 Nếu hầu hết
mọi G thỏa mãn n(G) ∈ N, mọi G n, n ≥ n(G) có tính chất Q thì hầu hết mọi Gp có
tính chất Q Điều ngược lại rất khó xảy ra Vì vậy, các khẳng định liên quan đến
phần lớn đồ thị trong G(N,p) thường mạnh hơn các khẳng định trong phần lớn
Gp
Một quá trình đồ thị ngẫu nhiên trên V = {1,…,n} hay đơn giản là một quá
trình đồ thị là một xích Markov G(G t)0 có trạng thái trên V Quá trình bắt đầu
, đồ thị G t thu được từ G t-1 bằng cách thêm một
cạnh Tất cả các cạnh mới có xác suất bằng nhau Khi đó G t có đúng t cạnh, do
đồ thị là một dãy (G t t)N0 sao cho
Trang 21tính chất Q nếu xác suất G có tính chất Q tiến tới 1 khi n → ∞ Xa hơn nữa chúng
ta gọi G t là trạng thái của quá trình G(G t)0N tại thời điểm t
Ánh xạ GG ( ,n M) xác định bởi G(G t)0N → G M là bảo toàn độ đo Vì
vậy tập các đồ thị thu được tại thời điểm t = M có thể đồng nhất với G(n,M) Do
đó không có mâu thuẫn nảy sinh từ thực tế rằng G M thay thế cho hai đối tượng khác nhau: một đồ thị ngẫu nhiên từ G(n,M) và trạng thái của một quá trình đồ
thị G tại thời điểm M
Một mục đích chính của lý thuyết đồ thị ngẫu nhiên là xác định một tính chất cho trước có nhiều khả năng xuất hiện Erdo‖s và Re’nyi đã cho thấy rằng hầu hết các tính chất đơn điệu xuất hiện khá đột ngột
Giả sử Q là một tính chất đơn điệu của các đồ thị Thời gian 𝜏 tại đó Q xuất hiện là thời gian chạm của Q
𝜏= 𝜏Q= 𝜏Q(G ) = min{t ≥ 0: G t has Q}
Vì vậy M * (n) là hàm ngưỡng của Q nếu 𝜔(n) →∞, thì thời gian chạm là nằm giữa M * (n)/ 𝜔(n) và M * (n) 𝜔(n):
P{ M * (n)/ 𝜔(n) < 𝜏 Q(n)< M * (n) 𝜔(n)} ) → 1
Trang 22Thời gian chạm cho phép chúng ta liên hệ các tính chất của các đồ thị ngẫu
nhiên chính xác hơn trong mô hình G (n,M) Ví dụ cho Q 1 là tính chất không có
đỉnh cô lập và Q 2 là tính chất liên thông Khi đó
𝜏Q1(G) ≤ 𝜏Q2(G ), tức là Q 2 không thể xảy ra trước Q 1 vì một đồ thị liên
thông (bậc ít nhất là 2) không có đỉnh cô lập Hầu hết mọi G M có tính chất Q i
(i=1,2) nếu và chỉ nếu M = (n/2){log n + 𝜔(n)} khi 𝜔(n) → ∞ Vì vậy hầu hết mọi G M là liên thông nếu và chỉ nếu hầu hết mọi G M có bậc cực tiểu là 1 Tuy nhiên cản trở chính tới tính liên thông là sự tồn tại của một đỉnh cô lập: Hầu hết mọi quá trình G là 𝜏Q1= 𝜏Q2, có nghĩa là cạnh đầu tiên nối với đỉnh cô lập cuối cùng sẽ làm đồ thị liên thông
2.2 Các tính chất của hầu hết tất cả các đồ thị
Nếu M không phải là quá nhỏ, cũng không quá gần N thì với mọi đồ thị cố định H, hầu hết G M có tính chất khá thú vị, đó là đồ thị H có thể nhúng trong nó bởi đỉnh Để chính xác hơn, các đồ thị cho trước F H, trong miền lớn của M,
hầu hết G M thỏa mãn nếu G M có một đồ thị con đồng cấu với F thì G M cũng có
một đồ thị con H* sao cho H*F* , H* H và đồng cấu H* H là một mở
rộng của F* F Đây là một hệ quả trực tiếp của kết quả sau (xem [8])
Chúng ta nói đồ thị G có một tính chất P k nếu với W 1 và W 2 là các tập rời
nhau của k đỉnh thì có một đỉnh x 𝜖 V(G) – W 1 ∪ W 2 được nối với mọi đỉnh trong
W1 và không một đỉnh nào trong W 2 Rõ ràng P k+1 đưa đến P k
Định lý 2.2 Giả sử M = M(n) và p = p(n) thỏa mãn với mọi 𝜀 > 0 ta có
Trang 23Khi đó với mọi số tự nhiên k cố định ta có hầu hết G M có tính chất P k và hầu
hết G p có P k
Trong lý thuyết đồ thị, có duy nhất một quan hệ liền kề thỏa mãn điều kiện y
xRy Rx và xRx , trong đó xRy có nghĩa là đỉnh x kề với đỉnh y Kết quả tiếp
theo liên quan đến khẳng định tân từ (khẳng định liên quan đến , , , , , ,
và R) M và p khi áp dụng vào các đồ thị trong G(n,M) và G (n,p)
Định lý 2.3 Giả sử M và p thỏa mãn (2.1) và (2.2) và Q là một tính chất của
các đồ thị được cho bởi một khẳng định tân từ Khi đó hoặc là Q đúng với hầu
hết mọi đồ thị trong G (n,M) và G (n,p) hoặc không với hầu hết mọi đồ thị trong
G (n,M) và G (n,p)
Chứng minh: Chúng ta muốn có một đồ thị duy nhất (đối với phép đẳng cấu)
với một tập đếm được các đỉnh có tính chất P k với mọi k Một ví dụ là đồ thị G0 = (N,E) với E = {ij: i < j,pi|j}, trong đó p1,…,pn là một dãy đếm được các số
nguyên tố Giả sử G và H có tính chất P k với mọi k, V(G)={ g 1,g2 ,…} và V(H) = {h 1 ,…,h in} Định nghĩa ―đồng cấu một phần‖ σn: {g i1 ,…,g in} → {hi1 ,…,h in} bằng
quy nạp như sau Cho g i1 = g1 và h i1 = h1 Nếu n ≥ 2 là chẵn, chọn i n+1 là số i ≥ 1
bé nhất không ở trong {i 1 ,…,i n } Từ H có tính chất P n , sẽ có một đỉnh
Tính chất đơn điệu trong Định lý 2.3 có thể được trình bày lại dưới dạng thời
gian chạm như sau: nếu Q là một tính chất đơn điệu cho trước bởi một khẳng định tân từ thì không có quá trình đồ thị Q mà M ( )G thỏa mãn (2.1) Từ
Trang 24Định lý 2.3, nếu chúng ta muốn nghiên cứu một tính chất của các đồ thị ngẫu
nhiên bằng khẳng định tân từ, chúng ta phải nghiên cứu nó trong các mô hình
Lý do chính tại sao các đồ thị ngẫu nhiên thường cung cấp các ví dụ của các
đồ thị không có cấu trúc rõ ràng, đó là, một đồ thị ngẫu nhiên là một đồ thị hầu chính quy với các tính chất đồng cấu mạnh đáng ngạc nhiên Chính xác hơn,
trong phạm vi lớn của p và M, hầu hết trong các đồ thị ngẫu nhiên G p và G, các
đỉnh của nó có bậc giống nhau và tất cả các tập không quá nhỏ các đỉnh hoạt động một cách rất giống nhau
Sự giống nhau này trong hoạt động của tập các đỉnh sẽ được thảo luận ở đây
Xem xét đồ thị G G p Để ngắn gọn, chúng ta viết e(U) = e(G[U]) là số cạnh của G trong đồ thị con G[U] với U V , đó là số cạnh nối các đỉnh của U Tương tự, chúng ta viết e(U,W) cho số cạnh của U − W, trong đó U và W là các
tập đỉnh rời nhau Giá trị mong muốn của e(U) là p
2
u
và giá trị mong muốn của
e(U,W) là puw, trong đó u và w là số đỉnh trong U và W tương ứng Một khía
Trang 25cạnh quan trọng về sự giống nhau của các tập đỉnh không quá nhỏ là hầu hết mọi
Các định lý sau được chứng minh trong [8]
Định lý 2.5 Cho 0 < p = p(n) ≤ 1/2 Khi đó hầu hết mọi G G p thỏa mãn
nếu U là tập bất kỳ của u > (252/p)log n các đỉnh thì
Khi đó với mọi 𝜀 > 0, hầu hết G M thỏa mãn với mọi tập U của u > u 0 các đỉnh thỏa mãn
|e(U)-M(u/n) 2|< 𝜀M(u/n)2
Hệ quả 2.7 Nếu M/n → ∞ và 𝜀 > 0 thì hầu hết mọi G M thỏa mãn
|e(U)-Mu 2 /n 2|< 𝜀Mu2
/n 2,
với mọi tập U của ít nhất 𝜀n đỉnh
Định lý 2.8 Cho 0 < p = p(n) ≤ 1/2 Khi đó hầu hết mọi G p thỏa mãn
Khi đó với mọi 𝜀 > 0 hầu hết G thỏa mãn |e(U,W)-2Muw/n 2| < 𝜀Muw/n2
,
Trang 26với U và W là các tập đỉnh rời nhau thỏa mãn u 0 < u = |U| ≤ w = |W|
Hệ quả 2.10 Nếu M/n → ∞ và 𝜀 > 0 thì hầu hết mọi G M thỏa mãn
|e(U,W)-2Muw/n 2|< 𝜀Muw/n2,
với U và W là các tập đỉnh rời nhau thỏa mãn 𝜀 ≤ u = |U| ≤ w = |W|
Hai định lý sau thể hiện thực tế: trong hầu hết các đồ thị, tất cả các tập lớn các đỉnh có tính chất tương tự nhau
Định lý 2.11 Cho 0 < 𝜀 < 1/6 là một hằng số dương, p = p(n) ≤ 1/2 và giả sử
rằng w0w ( )0 n 6log / (n 2p) Khi đó hầu hết Gp thỏa mãn nếu W V và
và C n Khi đó hầu hết G p thỏa mãn với mọi
Trang 27UV, |U| = u =C p/ , tập Tu {x V-U: (x) U= } có nhiều nhất n phần
2.4 Các đồ thị chính quy ngẫu nhiên
Giả sử rằng có một số tự nhiên n và r = r(n) sao cho 3 r < n và rn = 2m là
chẵn Ký hiệu G r-reg là tập các đồ thị r-chính quy Giả thiết rằng trên r, tậpG r-reg
là không rỗng Chúng ta đưa G r-reg vào trong một không gian xác suất bằng cách đưa vào tất cả các phần tử có xác suất giống nhau, và gọi một phần tử của không gian xác suất này, G r-reg là một đồ thị r-chính quy ngẫu nhiên
Khi đó mọi bất biến đồ thị trở thành một biến ngẫu nhiên trên G r-reg và sự
biểu diễn ―hầu hết mọi đồ thị r-chính quy có tính chất Q‖ không cần giải thích Khi nghiên cứu các đồ thị r-chính quy, một câu hỏi cơ bản được đặt ra là: Có bao nhiêu đồ thị r-chính quy bậc n trong đó? Nói cách khác độ lớn tiệm cận của
Lr = Lr(n) = | G | là gì? Lý do tại sao mô hình G (n,M) và G(n,p) được
Trang 28nghiên cứu thành công từ lâu trong khi mô hình G r-reg chỉ mới xuất hiện và một công thức tiệm cận không dễ đạt được
Bolloba’s (1979) (xem [7]) đã đưa ra một mô hình đơn giản cho tập các đồ thị chính quy được gán nhãn, không những đơn giản chứng minh công thức tiệm cận mà còn làm cho sự nghiên cứu các đồ thị chính quy ngẫu nhiên khá dễ dàng Mục đích ở đây là chứng minh công thức tiệm cận qua mô hình này
Định lý được chứng minh trong [8] □
Hệ quả 2.14: Giả sử r 2 là cố định và rn là chẵn Ký hiệu L r(n) là số đồ thị r-chính quy được gán nhãn bậc n Khi đó
Quan trọng chính của Định lý 2.13 là khi chúng ta nghiên cứu các đồ thị
ngẫu nhiên chính quy (với các đồ thị mà bậc không phát triển quá nhanh với n),
Trang 29để thay thế cho sự xem xét tập các đồ thị chính quy, chúng ta xem xét tập các trạng thái
Hệ quả 2.15 nếu r2 là cố định và Q* đúng với phần lớn các trạng thái (tức là P Q( *1)) thì Q đúng với hầu hết mọi đồ thị r-chính quy
Hệ quả 2.16 Cho r2 và m3là các số tự nhiên cố định Ký hiệu ( )
đồ thị có một vài tính chất của các đồ thị ngẫu nhiên điển hình Các cấu trúc cụ thể giống với các đồ thị ngẫu nhiên điển hình sẽ được gọi là các đồ thị ngẫu nhiên cụ thể hay các đồ thị giả ngẫu nhiên
Ví dụ điển hình của một đồ thị ngẫu nhiên cụ thể là đồ thị Paley hay đồ thị
thặng dư P q, với tập các đỉnh là Fq là trường hữu hạn bậc q trong đó q là một số
mũ nguyên tố đồng dư với modun 4, xy là một cạnh nếu và chỉ nếu x – y là một
Trang 30Bổ đề 2.17 Giả sử rằng q số nguyên tố, x0F và (D p x l )( )0 0với
0 l L q Khi đó x0 là nghiệm của p với bội ít nhất L
Chứng minh: Chúng ta áp dụng quy nạp theo L, bắt đầu với khẳng định L =
0 Giả sử L > 0 và bổ đề đúng cho các giá trị nhỏ của L Khi đó
Định lý 2.18 Giả sử d3 là một số nguyên lẻ, q > 4d 2 là lũy thừa của số
nguyên tố, F= Fq, f X( )F X[ ] là đa thức bậc d Khi đó s là số nghiệm của phương trình y 2
= f(x) thỏa mãn |s q | 4dq1/2
Một đặc trưng nhân tính của F là một đồng cấu từ F *, nhóm nhân của các
phần tử khác không của F, tới nhóm nhân của các số phức với modun 1 Hàm đồng nhất 1 được gọi là đặc trưng cơ bản của F, và được ký hiệu bởi 0 Từ x q-1
= 1 với mọi xF*, chúng ta có q10với mọi đặc trưng Một đặc trưng
có bậc là d nếu d 0 và d là số nguyên dương nhỏ nhất thỏa mãn tính chất này Để mở rộng một đặc trưng tới toàn bộ F ta đặt (0) 0
Đặc trưng bậc hai được định nghĩa là: ( 1)/2
( )x x q
, tức là là 1 trên số chính phương, 0 tại 0, và −1 trong các trường hợp khác Cho đa thức ( ) [ ]
f X F X , ta có
Trang 31trong đó S và 'S là số nghiệm của phương trình g(x) = 1 và g(x) = −1 Do vậy
nếu f(X) có bậc lẻ m 3và q > 4m2 là lũy thừa của một số nguyên tố thì kết quả của Định lý 2.18 có nghĩa là
Định lý 2.19 Cho là một đặc trưng bậc d > 1 Giả sử rằng f X( )F X[ ]
có đúng m nghiệm phân biệt và không có dạng c{g(X)}d, trong đó c F và ( ) [ ]
Định lý được chứng minh trong [8]
Một hệ quả khác liên quan tới số nghiệm của đa thức với hai biến như sau:
Định lý 2.20: Giả sử f X Y( , )F X Y( , ) là bất khả quy tuyệt đối, và có tổng
bậc d > 0 Khi đó số s các nghiệm ( , )x y F qcủa phương trình
f(x,y) = 0,
thỏa mãn
5/2 1/2
|sq| 2d q ,
với điều kiện p > 250d2
Chúng ta cần một vài tính chất cơ bản của tổng liên quan tới nhân và một đặc
trưng cộng tính, đặc biệt là tổng Gauss Một đặc trưng cộng tính của trường F =
Fq là một đồng cấu của (F,+) vào nhóm tròn Hàm đồng nhất 1 là một nguyên lý
Trang 32đặc trưng cộng tính; ký hiệu bởi 0 (Vì vậy 0( )X 0( )x nếu x0 nhưng
: , ( ) ( ),
G G r r trong đó tổng lấy qua tất cả các phần tử r của của các hoán vị vòng R, ( )r là nhóm đồng cấu của nhóm cộng R vào nhóm tròn đơn vị, ( )r là nhóm đồng cấu của nhóm đơn vị R vào nhóm tròn đơn vị)
Trong vấn đề tiếp theo, luôn là một đặc trưng nhân tính và thay thế cho một đặc trưng cộng tính Chú ý rằng nếu 0 và 0 thì