ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINHTRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN NGUYỄN HỒNG PHÚC ỨNG DỤNG CỦA PHỨC WITNESS VÀO PHÂN TÍCH DỮ LIỆU ẢNH Chuyên ngành: ĐẠI SỐ VÀ LÝ THUYẾT SỐ Mã số: 60
Trang 1ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
NGUYỄN HỒNG PHÚC
ỨNG DỤNG CỦA PHỨC WITNESS VÀO PHÂN TÍCH DỮ LIỆU ẢNH
Chuyên ngành: ĐẠI SỐ VÀ LÝ THUYẾT SỐ
Mã số: 60 46 05
LUẬN VĂN THẠC SĨ TOÁN HỌC
NGƯỜI HƯỚNG DẪN KHOA HỌC
TS NGUYỄN PHÚC SƠN
Tp Hồ Chí Minh - 2012
Trang 2Tôi xin bày tỏ lòng biết ơn sâu sắc tới thầy Nguyễn Phúc Sơn Nhờ sự hướngdẫn và chỉ bảo tận tình của thầy mà luận văn đã hoàn thành một cách khoa họcvà đúng tiến độ Xin cảm ơn các thầy cô công tác tại trường Khoa Học Tự Nhiênđã trực tiếp giảng dạy và quan tâm, cảm ơn các bạn bè và gia đình đã động viêngiúp đỡ tôi trong suốt thời gian học tập và nghiên cứu.
Mặc dù có nhiều cố gắng, song luận văn có thể vẫn còn khiếm khuyết, tôi rấtmong sự phê bình góp ý từ phía các thầy cô và các bạn
Tp.HCM, ngày 25 tháng 8 năm 2012
Học viên
Nguyễn Hồng Phúc
Trang 3Mục lục
1.1 Các đơn hình 7
1.2 Phức simplicial 8
1.2.1 Phức simplicial trừu tượng S 9
1.2.2 Xấp xỉ simplicial 10
1.3 Phức ˘Cech, phức Rips 11
1.3.1 Phức ˘Cech 11
1.3.2 Phức Rips 12
2 Ứng dụng của phức witness vào phân tích dữ liệu ảnh 15 2.1 Phức witness 15
2.1.1 Cách chọn landmark trong phức witness 15
2.1.2 Phức witness mạnh và phức witness yếu 17
2.1.3 Cách xây dựng các phiên bản của phức witness yếu 17
2.2 Đồng điều persistent 21
2.2.1 Số Betti 21
4
Trang 42.2.2 Dãy lọc 21
2.2.3 Định nghĩa đồng điều persistent 23
2.3 Thống kê ảnh tự nhiên 26
2.3.1 Hình cầu S2 26
2.3.2 Thống kê ảnh tự nhiên 28
Trang 5Tổ hợp affine, x =Pp
j=0λjaj, là một tổ hợp lồi nếu λj ≥ 0, với 0 ≤ j ≤ p
Bao lồi của aj là tập hợp tất cả các tổ hợp lồi của nó
Một p − simplex (xem hình 1.1), là bao lồi của p + 1 điểm độc lập affine, ký
hiệu
σ =conv{a0, a1, a2, , ap}Khi đó ta nói aj span σ và dimσ = p.
Bất kỳ tập con nào của tập các điểm độc lập affine cũng độc lập affine, do đócũng định nghĩa một simplex
Mặt của σ là bao lồi của một tập hợp con khác rỗng của tập hợp gồm các điểm
aj, j = 0, 1, , p
Một mặt là mặt thực sự nếu mặt đó là bao lồi của một tập con thật sự.
7
Trang 6Hình 1.1: 0-simplex, 1-simplex, 2-simplex, 3-simplex lần lượt được gọi là vertex,
edge, triangle, tetrahedron.
Biên của σ, ký hiệu bdσ, là phần hợp của tất cả các mặt thực sự trong σ Phần trong của σ, ký hiệu intσ = σ − bdσ.
Với mỗi điểm x = Pp
j=0λjaj ∈ σ, ta có x ∈ intσ khi và chỉ khi mọi λj > 0,
j = 0, 1, , p
1.2 Phức simplicial
Khái niệm 1.2.1 Một phức simplicial K (xem hình 1.2), là tập hợp hữu hạn các
đơn hình trong K thỏa mãn:
-Với σ ∈ K và τ ⊆ σ thì τ ∈ K
-Với σ, σ0 ∈ K thì σ ∩ σ0 ⊆ σ, σ0 (với σ, σ0 là những đơn hình trong K.)Số chiều của K là số chiều cao nhất của các đơn hình trong K
Cho L ⊆ K là một phức simplicial, khi đó L được gọi là phức con của K.
j-skeleton là tập hợp gồm tất cả các đơn hình trong K có số chiều j hoặc nhỏ
hơn j,
Kj = {σ ∈ K|dimσ ≤ j}
Trang 7Trang 9
Hình 1.2: (A) là phức simplicial, (B) không phải là phức simplicial vì đoạn giaonhau của hai mặt không thuộc một trong hai mặt đó, (C) không là phức simplicial
vì một mặt của nó bị khuyết cạnh
0-skeleton là một tập đỉnh, ký hiệu vertK = K(0); 1-skeleton là tập hợp gồmtất cả các đơn hình 0-chiều và 1-chiều
1.2.1 Phức simplicial trừu tượng S
Phức simplicial trừu tượng được xem như là phần mô tả hình học của phứcsimplicial
Định nghĩa 1.2.2 Cho K là một phức simplicial, phức simplicial trừu tượng S
của K là tập hợp hữu hạn các đơn hình trong K thỏa mãn: nếu σ ∈ K và τ ⊆ σthì τ ∈ K
Chú ý 1.2.3 Ta có:
i) Tập φ thuộc mọi phức simplicial trừu tượng
ii) Tập đỉnh Z của phức simplicial trừu tượng S, vertZ = {a0, a1, , ap}, p ∈ R
iii) Nếu p-simplex σ = [a0a1 ap] ∈ S, thì tất cả các mặt của σ đều thuộc S Ởđây các đỉnh a0, a1, , ap trong Z là phân biệt
Nguyễn Hồng Phúc - Cao học Đại số K20
Trang 81.2.2 Xấp xỉ simplicial
Từ không gian tôpô X, lấy một tập điểm bất kỳ Từ tập điểm ấy, ta xây dựngphức simplicial K xấp xỉ cấu trúc tôpô của X
Ví dụ 1.2.1 Quét tia laser qua một vật rắn X có hình vòng tròn, ta sẽ thu được
một tập gồm vô số điểm trên mặt phẳng:
Hình 1.3: Tập điểm trên mặt phẳng
Chọn ra một mẫu bất kỳ từ tập điểm trên hình 1.3 ta được hình 1.4 Ta sẽ đixây dựng phức simplicial K xấp xỉ vòng tròn X đã cho
Hình 1.4: Landmark của hình 1.3
Nhận xét 1.2.4 Xét hai landmark được trích từ tập điểm của một đường tròn
(hình 1.5) Hai trường hợp (A) và (B) đều được xem là xấp xỉ của đường tròn Mặcdù ở trường hợp (B), sự xấp xỉ có vẻ rất thô nhưng nó vẫn đảm bảo các tính chấtcủa tôpô
Trang 9Chú ý 1.3.1 Cho F là một tập hợp hữu hạn trong không gian ơclid.
Nerve của F là tập hợp các tập con khác rỗng của F mà giao của họ tập con
này là một tập không tầm thường
NrvF = {X ⊆ F |\X 6= φ}
Định lý 1.3.2 (Nerve) Cho F là một tập lồi, đóng trong không gian ơclid Khi đó
NrvF và hợp của các tập con trong F có kiểu đồng điều giống nhau.
Từ định ngĩa Nerve, ta có phức ˘Cech là Nerve của tập {B(a, R/2), a ∈ Z}
Vì các quả cầu B(a, R/2) là lồi nên ta có ˘Cech tương đương đồng luân vớiphần hợp của các quả cầu này
Nguyễn Hồng Phúc - Cao học Đại số K20
Trang 101.3.2 Phức Rips
Tập đỉnh là tập dữ liệu Z ⊂ Rd
Đường kính: R > 0, R ∈ R
Định nghĩa: Rips(Z, R) là tập hợp tất cả các p-simplex σ = [a0a1 ap],
p = 0, 1, , sao cho các cạnh [ajak], 0 ≤ j < k ≤ p, có |aj − ak| ≤ R
Rips(Z, R) là phức simplicial lớn nhất có cùng số 1-skeleton với ˘Cech(Z, R).Những simplex có số chiều lớn hơn hoặc bằng 1 thuộc Rips(Z, R) khi và chỉkhi mọi cạnh của nó cũng thuộc Rips(Z, R)
Nếu khoảng cách |aj− ak| được đo trong không gian l∞ thì phức Rips là Nervecủa tập hợp các siêu lập phương có cạnh là 2R Khi đó Rips(Z, R) tương đươngđồng luân với phần hợp của những siêu lập phương này
Ví dụ 1.3.1.
Hình 1.6: ˘Cech, RipsCho một tập hợp gồm nhiều điểm như hình 1.6(A) Ta vẽ các đường tròn cócùng bán kính, với tâm là những điểm đã cho, thì được hình 1.6(B)
Trang 11Trang 13
Phức ˘Cech ở hình 1.6(C) được vẽ như sau:
Hai đường tròn có phần giao khác rỗng, như c1 ∩ c2 6= φ, khi đó ta nối tâmcủa hai đường tròn lại với nhau thì được một cạnh O1O2, làm tương tự các trườnghợp còn lại
Ba đường tròn có phần giao khác rỗng, như c3∩ c4∩ c5 6= φ, khi đó ta nối tâmcủa ba đường tròn lại với nhau và tô đặc tam giác O3O4O5, ta có một mặt tamgiác O3O4O5 Làm tương tự các trường hợp còn lại
Ba đường tròn c6, c7, c8 có c6 ∩ c7 6= φ, c7 ∩ c8 6= φ, c6 ∩ c8 6= φ nhưng
c6∩ c7∩ c8 = φ do đó ta chỉ có tam giác "rỗng ruột" O6O7O8 Làm tương tự cáctrường hợp còn lại
Phức Rips ở hình 1.6(D) được vẽ như sau:
Giống như khi xây dựng ˘Cech, hai đường tròn có phần giao khác rỗng, như
c1 ∩ c2 6= φ, khi đó ta nối tâm của hai đường tròn lại với nhau thì được một cạnh
O1O2, làm tương tự các trường hợp còn lại
Xây dựng phức Rips đơn giản hơn so với phức ˘Cech, chỉ cần ba đường tròn
c6, c7, c8 có c6∩ c7 6= φ, c7∩ c8 6= φ, c6 ∩ c8 6= φ thì nối O6O7, O7O8 và O6O8rồi tô đặc tam giác O6O7O8
Chú ý 1.3.3 Ta có:
i) Định nghĩa của phức ˘Cech và phức Rips được áp dụng đối với mọi không gianmetric
ii) Cả hai cấu trúc ˘Cech và Rips đều không thực sự hiệu quả Thật vậy, khi bánkính R tăng đến một giá trị nhất định, ta sẽ nhận được một khối dày đặc, lúcđó không thể phân biệt được ˘Cech và Rips (hình 1.7)
Nguyễn Hồng Phúc - Cao học Đại số K20
Trang 12Hình 1.7: Phức ˘Cech, Rips
Hai phức ˘Cech và Rips cho ta những hình dung về tính chất hình học củadữ liệu ảnh rất tốt, nhưng có nhược điểm là cần rất nhiều cell trong quá trìnhtính toán Một công cụ rất hiệu quả, khắc phục được những nhược điểm của phức
˘
Cech và Rips mà ta sẽ đề cập đến đó là phức witness.
Trang 132.1 Phức witness
2.1.1 Cách chọn landmark trong phức witness
Landmark là tập hợp điểm được chọn ra để làm witness.
Có hai cách phổ biến để chọn landmark, đó là cách chọn maxmin và cách chọn
ngẫu nhiên.
15
Trang 141) Phương pháp maxmin: được minh họa ở hình 2.1 Cho Z là tập hợp N điểm
trong không gian ơclid, gọi n là số điểm landmark D = (n × N ) là ma trậnkhoảng cách Chọn theo quy tắc quy nạp:
Bước 1: Chọn ngẫu nhiên điểm a1 ∈ Z
Bước 2: Giả sử đã chọn được các điểm a1, a2, , aj−1 ∈ Z, ta tiến hành chọn
aj ∈ Z \ {a1, a2, , aj−1} Với mỗi x ∈ Z, ta có các khoảng cáchD(x, a1), D(x, a2), , D(x, aj−1) aj được chọn theo tiêu chuẩn sau:
aj = maxx∈Zmin{D(x, a1), D(x, a2), , D(x, aj−1)}
Bước 3: Lập lại bước 2 cho đến khi có tập L = {a1, a2, , an} của n điểm
landmark được chọn
2) Phương pháp chọn ngẫu nhiên: được minh họa ở hình 2.1
Hình 2.1: Landmark
Nhận xét 2.1.1 Ta có:
i) Cách chọn maxmin có ưu điểm là chọn được landmark phân bố đều trên toànbộ tập dữ liệu
ii) Nhược điểm của cách chọn maxmin là thường bị ảnh hưởng nặng nếu dữ liệucó nhiễu
Trang 15Trang 17
2.1.2 Phức witness mạnh và phức witness yếu
Gọi L ⊂ Rd là tập hợp hữu hạn điểm a0, a1, , ap, σ = [a0a1 ap] là mộtp-simplex
Định nghĩa 2.1.2 Điểm x ∈ Rd được gọi là witness mạnh đối với σ trong L nếu
và chỉ nếu x có khoảng cách tới các điểm a0, a1, , ap đều bằng nhau và là khoảngcách nhỏ nhất trong L (Hình 2.2)
Hình 2.2: Witness mạnh và witness yếu
Định nghĩa 2.1.3 Điểm x ∈ Rd được gọi là witness yếu đối với σ trong L nếu và
chỉ nếu
|x − aj| ≤ |x − a|
∀j = 0, 1, , p và a ∈ L \ {a0, a1, , ap} (Hình 2.2)
Chú ý 2.1.4 Tập hợp có số lượng winess càng nhỏ thì khả năng tồn tại witness
mạnh càng thấp, có khi không tồn tại witness mạnh
Định lý 2.1.5 Cho L ∈ Rd là tập hợp hữu hạn các điểm a0, a1, , ap Khi đó
σ = [a0a1 ap] có witness mạnh trong L khi và chỉ khi σ và tất cả các đơn hình con của nó có witness yếu trong L.
2.1.3 Cách xây dựng các phiên bản của phức witness yếu
Cho D là ma trận khoảng cách n × N , trong đó n là số điểm landmark và
N là kích cỡ mẫu của dữ liệu đang xét Khi đó ta có khái niệm về phức witness
W∞(D) như sau:
Nguyễn Hồng Phúc - Cao học Đại số K20
Trang 16Khái niệm 2.1.6 Ta có:
Tập đỉnh: {a1, a2, , an} là tập n điểm landmark
Cạnh σ = [ab] ∈ W∞(D) khi và chỉ khi tồn tại i, 1 ≤ i ≤ N , sao cho D(a, i)và D(b, i) là các khoảng cách nhỏ nhất trong cột thứ i của ma trận D
Cho p-simplex σ = [a0a1 ap], p ≥ n − 1, giả sử tất cả các mặt của σ đềunằm trong W∞(D), khi đó σ ∈ W∞(D) khi và chỉ khi tồn tại i, 1 ≤ i ≤ N , saocho D(a0, i), D(a1, i), , D(ap, i) là (p + 1) khoảng cách nhỏ nhất trong cột thứ
i của ma trận D Ta gọi i là witness chứng tỏ sự tồn tại của σ.
Khái niệm 2.1.7 Phức W1(D):
Tập đỉnh: {a1, a2, , an} là tập n điểm landmark
Cạnh σ = [ab] nằm trong phức witness W1(D) khi và chỉ khi tồn tại i,
1 ≤ i ≤ N , sao cho D(a, i) và D(b, i) là các khoảng cách nhỏ nhất trong cột thứ
a2 thành mặt tam giác a0a1a2 Ta nói σ1 = [a0a1a2] ∈ W∞(D) với witness i
Trang 17Sau khi quan sát, điểm mà ta đặt là i có khoảng cách đến a0 và a2 là gần nhất,
do đó ta có cạnh a0a2 bằng cách nối hai điểm a0, a2 Khi đó i được gọi là witnesscủa σ1 = [a0a2] ∈ W1(D) Tương tự, ta có j là witness của σ2 = [a0a1] ∈ W1(D),
k là witness của σ3 = [a1a2] ∈ W1(D)
Khi đã nối được ba cạnh a0a1, a0a2 và a1a2, W1(D) cho phép ta tô đặc tamgiác a0a1a2 Khi đó, 3-simplex σ = [a0a1a2] ∈ W1(D) Tương tự với trường hợpcòn lại
Nhận xét 2.1.8 Ta có:
Khái niệm 2.1.9 Cho v là một số nguyên không âm, các họ phức lồng nhau của
phức simplicial, ký hiệu W (D, R, v), R ∈ [0, ∞), được xác định như sau:
Nguyễn Hồng Phúc - Cao học Đại số K20
Trang 18Tập đỉnh của W (D, R, v) là {a0, a1, , an}.
Cho đoạn σ = [ab], ta có σ = [ab] ∈ W (D, R, v) nếu tồn tại witness
i ∈ {1, 2, , N } sao cho:
max(D(a, i), D(b, i)) ≤ R + mi (∗)
Cho p-simplex σ = [a0a1 ap], ta có σ = [a0a1 ap] ∈ W (D, R, v) nếu và chỉnếu tất cả các cạnh của nó thuộc trong W (D, R, v), điều này tương đương với việctồn tại witness i, 1 ≤ i ≤ N sao cho:
max(D(a0, i), D(a1, i), , D(ap, i)) ≤ R + mi
mi được xác định như sau:
• Nếu v = 0 thì ∀i = 1, 2, , N , ta định nghĩa mi = 0 Lúc này:
(∗) ↔ max(D(a, i), D(b, i)) ≤ R
• Nếu v = 1 thì ∀i = 1, 2, , N , ta định nghĩa mi là phần tử nhỏ nhất ở cột thứ
i của D Ta có:
max(D(a, i), D(b, i)) ≤ R + mi
- Nếu R = 0 thì i có khoảng cách đến a và b là bằng nhau và là khoảng cáchnhỏ nhất Cụ thể i sẽ là trung điểm đoạn [ab]
- Khi cho R tăng thì i sẽ di chuyển trên đường trung trực của đoạn [ab]
• Nếu v = 2 thì ∀i = 1, 2, , N , ta định nghĩa mi là phần tử nhỏ nhì ở cột thứ icủa D Ta có:
max(D(a0, i), D(a1, i), , D(ap, i)) ≤ R + mi
- Nếu R = 0, ta có: W (D, 0, 2) = W (D)
- Khi cho R tăng ta xây dựng được dãy lọc
Một cách tiếp cận khác đó là sử dụng phân chùm, tham khảo trong [2] Nhưng
theo kinh nghiệm của những người từng sử dụng thì cách này không thực sự hiệuquả, vì phương pháp phân chùm tạo thêm các đặc tính vốn không có trong dữ liệugốc
Trang 19Trang 21
2.2 Đồng điều persistent
2.2.1 Số Betti
Trong phần này ta sẽ tìm hiểu về số betti của đồng điều cổ điển
Số betti được dùng để phân biệt các không gian tôpô Số betti là một số tựnhiên hoặc +∞
Định nghĩa 2.2.1 Số betii thứ p của không gian X, ký hiệu βp(X), là hạng củanhóm giao hoán Hp(X)
Ý nghĩa hình học của số betti :
β0 là số thành phần liên thông
β1 là số các lỗ 2-chiều
β2 là số các lỗ 3-chiều
Ví dụ 2.2.1 Torus ở hình 2.5 có: β0 = 1, β1 = 2, β2 = 1
σ 7−→ f (σ), σ là đơn hình trong K
Ở đây f (σ) được gọi là giá trị của σ
Nguyễn Hồng Phúc - Cao học Đại số K20
Trang 20Với r là một số thực bất kỳ, ta gọi level của r là tập ảnh ngược f−1(r)
f−1(r) = {σ ∈ K|f (σ) = r}
Tập level con được xác định như sau:
K(r) = f−1(−∞, r] = {σ ∈ K|f (σ) ≤ r}
Định nghĩa 2.2.2 Cho K là một phức simplicial, chọn dãy r1 < r2 < < rn,
r0 = ∞, với rj, j = 1, 2, , n, là các số thực Khi đó ta có các Kj := K(rj),, làcác phức con của K và
φ = K0 ⊆ K1 ⊆ ⊆ Kn = K (∗)
Ta gọi dãy các phức (∗) là dãy lọc.
Ví dụ 2.2.2 Cho φ = K0, K1, , K7 = K là các phức con của K Ta có dãy lọc
φ = K0 ⊆ K1 ⊆ ⊆ K7 = Knhư hình 2.6
Trang 21Trang 23
Hình 2.6: Dãy lọc của phức simplicial K
2.2.3 Định nghĩa đồng điều persistent
Cho K là một phức simplicial, Kj là các phức con của K, với mỗi j ≤ k ={0, 1, 2, }, từ đơn cấu Kj −→ Kk cảm sinh ra đồng cấu:
fpj,k : Hp(Kj) −→ Hp(Kk) ,p là số chiều của đồng điều
Ta có dãy các nhóm đồng điều, ứng với số chiều p, tương ứng với dãy lọc (∗):
0 = Hp(K0) f
0,1 p
−−−−→ Hp(K1) f
1,2 p
−−−−→ f
n−1,n p
−−−−→ Hp(Kn) = Hp(K)
Định nghĩa 2.2.3 Nhóm đồng điều persistent thứ p là ảnh của đồng cấu cảm sinh
fpj,k :
Hpj,k = imfpj,k với: 0 ≤ j ≤ k ≤ n
Định nghĩa 2.2.4 Số betti persistent thứ p của các phức K là hạng của các nhóm
đồng điều persistent thứ p của K:
βpj,k = rankHpj,k
Nguyễn Hồng Phúc - Cao học Đại số K20
Trang 22Lưu ý rằng: Hj,j
p = Hp(Kj)
Nhóm đồng điều persistent Hj,k
p bao gồm những lớp đồng điều trong Kj màvẫn còn tồn tại trong Kk, nghĩa là:
Hpj,k = Zp(Kj)/(Bp(Kk) ∩ Zp(Kj))Gọi γ là một lớp trong Hp(Kj):
-Lớp γ được sinh ra ở Kj nếu γ /∈ Hj−1,j
p -Lớp γ "chết" khi vào Kk nếu nó nối kết với một lớp khác cũ hơn khi đượcánh xạ từ Kk−1 vào Kk, cụ thể như sau:
fpj,k−1(γ) /∈ Hj−1,k−1
fpj,k(γ) ∈ Hpj−1,k Điều này được mô tả trong hình 2.7
Hình 2.7: Sự tồn tại của lớp γ trong Hp(Kj)
Trang 23Trang 25
Ví dụ 2.2.3 Cho K = K14 là một phức simplicial và K0, K1, , K14 là các phứccon của K (Hình 2.8)
Hình 2.8: Tính số betti
Ta có dãy lọc φ = K0 ⊂ K1 ⊂ ⊂ K14 = K
Ta tính được số betti ứng với mỗi phức con của K Ở đây, β0 là hạng của
H0(K), β1 là hạng của H1(K), β2 là hạng của H2(K)
Sau đây ta sẽ dùng mã vạch để hình dung về đồng điều persistent (Hình 2.9)Xét lớp simplex γ1 ∈ H1(K) trong ví dụ 2.2.3, ta thấy lớp γ1 xuất hiện ở K6,
vì ở K6: β1 6= 0, γ1 tiếp tục tồn tại ở K7 và K8 Nhưng đến K9, β1 = 0, khi đó
ta nói lớp γ1 chết Vậy thời gian tồn tại của lớp simplex γ1 được biểu diễn trongbảng mã vạch là một đoạn thẳng kéo dài liên tục từ K6 đến K8
Nguyễn Hồng Phúc - Cao học Đại số K20