1. Trang chủ
  2. » Công Nghệ Thông Tin

Ứng dụng thuật toán phân cụm FCM vào phân đoạn ảnh

39 3 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 39
Dung lượng 1,19 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

MỤC LỤC LỜI MỞ ĐẦU 1 CHƯƠNG 1 TỔNG QUAN VỀ LOGIC MỜ VÀ PHÂN ĐOẠN ẢNH 2 1 1 Tổng quan về logic mờ 2 1 1 1 Tập mờ loại một 2 1 1 2 Tập mờ loại hai 6 1 1 3 Mô hình hóa bài toán 9 1 2 Tổng quan về phân đo.

Trang 1

MỤC LỤC

LỜI MỞ ĐẦU 1

CHƯƠNG 1 TỔNG QUAN VỀ LOGIC MỜ VÀ PHÂN ĐOẠN ẢNH 2

1.1 Tổng quan về logic mờ 2

1.1.1 Tập mờ loại một 2

1.1.2 Tập mờ loại hai 6

1.1.3 Mô hình hóa bài toán 9

1.2 Tổng quan về phân đoạn ảnh 11

1.2.1 Giới thiệu 11

1.2.2 Các phương pháp tiếp cận 12

CHƯƠNG 2 KỸ THUẬT PHÂN CỤM DỮ LIỆU MỜ LOẠI MỘT 21

2.1 Tổng quan về phân cụm mờ 21

2.2 Thuật toán Fuzzy C-means (FCM) 22

2.2.1 Giới thiệu Fuzzy C-means 22

2.2.2 Thuật toán FCM 25

2.2.3 So sánh FCM với K-means 26

2.2.4 Đánh giá thuật toán FCM 28

2.3 Thuật toán FCM cải tiến 29

2.3.1 Cơ sở thuật toán 29

2.3.2 Thuật toán FCM cải tiến 29

2.4 Thuật toán ε-Insensitive Fuzzy C-means (εFCM) 30

2.4.1 Giới thiệu thuật toán 30

2.4.2 Chi tiết thuật toán εFCM 31

CHƯƠNG 3 CHƯƠNG TRÌNH VÀ ỨNG DỤNG 32

3.1 Mô hình hóa bài toán phân đoạn ảnh 32

3.2 Cài đặt chương trình 32

3.3 Kết quả ứng dụng phân đoạn trên ảnh không gian màu RGB 34

KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 36

TÀI LIỆU THAM KHẢO 37

Trang 2

DANH MỤC HÌNH

Hình 1.1: Các ví dụ của bốn loại hàm thuộc 3

Hình 1.2: (a) Tập mờ cơ sở A; (b) Mở rộng trụ C(A) của A 5

Hình 1.3: (a) Tập mờ hai chiều R; (b) RX (chiếu của R trên X); (c) RY (chiếu của R trên Y) 6

Hình 1.4: (a) Hàm thuộc loại một và (b) Hàm thuộc loại một được mờ hóa 7

Hình 1.5: Minh họa hàm thuộc loại hai 7

Hình 1.6: Ví dụ về phân vùng ảnh 11

Hình 1.7: Minh họa cách chọn ngưỡng 13

Hình 1.8: Khái niệm 4 liên thông và 8 liên thông 16

Hình 1.9: Phân tích kết cấu bằng dải tương quan 17

Hình 1.10: Biểu diễn ảnh dưới dạng một đồ thị 19

Hình 2.1: Mô tả tập dữ liệu một chiều 26

Hình 2.2: Hàm thuộc với trọng tâm của cụm A trong K-means 26

Hình 2.3: Hàm thuộc với trọng tâm cụm A trong FCM 27

Hình 2.4: Các cụm được khám phá bởi thuật toán FCM 27

Hình 3.1: Giao diện chính chương trình phân đoạn ảnh 33

Hình 3.2: Giao diện chương trình sau khi cho ảnh vào 34

Trang 3

1

LỜI MỞ ĐẦU

Logic mờ được công bố lần đầu tiên tại Mỹ vào năm 1965 bởi giáo sư L.Zadeh

Kể từ đó, Logic mờ đã có bước phát triển mạnh mẽ trong nhiều lĩnh vực và các ứng dụng thực tế khác nhau Đặc biệt, việc ứng dụng Logic mờ trong lĩnh vực xử lý ảnh đã đem lại những hiệu quả rõ rệt Bởi vì, với việc áp dụng Logic mờ vào trong xử lý ảnh,

ta đã phần nào xử lý được những yếu tố không chắc chắn thường xuyên xảy ra trong xử

lý ảnh, bởi vì đầu vào ảnh thường có nhiễu và các đối tượng trong ảnh thường không rõ ràng và nằm chồng lên nhau Chính vì vậy, việc ứng dụng Logic mờ vào xử lý ảnh đã trở thành hướng nghiên cứu và quan tâm của rất nhiều nhà khoa học cũng như người

sử dụng

Với đề tài “Ứng dụng thuật toán phân cụm FCM vào phân đoạn ảnh”,

đề tài sẽ trình bày một số vấn đề về ứng dụng Logic mờ và phân đoạn ảnh Trong đó, đề tài tập trung vào việc sử dụng các thuật toán phân cụm FCM

(Fuzzy C-means) để thực hiện phân đoạn ảnh

Có nhiều phương pháp khác nhau để phân đoạn ảnh song mỗi phương pháp đều có những ưu điểm và nhược điểm riêng tùy thuộc vào từng bài toán cụ thể Báo cáo được trình bày trong 3 chương:

Chương 1: Tổng quan về Logic mờ và phân đoạn ảnh

Chương 2: Kỹ thuật phân cụm dữ liệu mờ loại một

Chương 3: Chương trình và ứng dụng

Kết luận: Tóm tắt các vấn đề được tìm hiểu trong báo cáo và các vấn đề liên quan trong báo cáo, đưa ra phương hướng nghiên cứu tiếp theo

Trang 4

Hàm đặc tính (characteristic funtions) cho mỗi đối tượng xXcó quan hệ với tập

A như sau: Tập cổ điển A là một tập của các cặp phần tử có bậc (x,0) với x A  hoặc (

x, 1) với x A  Với cách định nghĩa trên, có thể miêu tả tập cổ điển A thông qua hàm đặc tính:

 

A  { x,A x | x X}Trong đó: A  x là hàm đặc tính được xác định:

  0,

1,

A

x A x

Ở đây: A  x được gọi là hàm thuộc (MF) cho tập mờ A MF ánh xạ mỗi phần tử

xX tới độ thuộc giữa 0 và 1 của MF

Với định nghĩa trên, không giống như tập cổ điển, tập mờ có hàm đặc tính (theo nghĩa của tập cổ điển) cho phép có giá trị nằm giữa 0 và 1 Như vậy định nghĩa của tập

mờ là một mở rộng đơn giản của định nghĩa tập cổ điển trong đó hàm thuộc có độ thuộc giữa 0 và 1 Nếu giá trị của hàm thuộc A  x được đưa về chỉ có 0 và 1, khi đó A chính

Hàm thuộc một chiều là hàm chỉ có một đầu vào Do vậy, các hàm đưa ra dưới đây

sẽ được hiểu ngầm định là luôn luôn có một đầu vào

+ Định nghĩa 1.1: Hàm thuộc Triangular

Trang 5

3

Một hàm thuộc triangular được đưa ra bởi 3 tham số {a, b, c}

(với a < b < c) như sau:

0,

, , , ,

Hình 1.1: Các ví dụ của bốn loại hàm thuộc

Trong đó (a) Triangle(x; 20, 60, 80); (b) Trapezoid(x; 10, 20, 60, 95); (c) Gaussian(x; 50, 20); (d) bell(x; 20, 4, 50)

+ Định nghĩa 1.2: Hàm thuộc Trapezoidal (Hình thang)

Một hàm thuộc trapezoidal được đưa ra bởi 4 tham số {a, b, c, d} (với a

< b < c < d ) như sau:

Trang 6

x d

c x b

b x a

b

a x

a x

d c b a x trapezoid

d ,0

c ,

,1

a ,

,0

),,,

;(

Bằng cách dùng min và max, người ta đã đưa ra biểu diễn biểu thức trên như sau:

; (

c d

x d a b

a x d

c b a x trapezoid

Ở đây: Các tham số {a, b, c, d} xác định tọa độ x của bốn góc của hàm thuộc Trapezoidal

Hình 1.1(b) minh họa hàm thuộc Trapezoidal được định nghĩa bởi trapezoidal(x;

10, 20, 60, 95)

+ Định nghĩa 1.3: Hàm thuộc Gaussian

Hàm thuộc Gaussian được đưa ra bởi 2 tham số   c ,  :

2

1 2

+ Định nghĩa 1.4: Hàm thuộc bell – hình chuông

Hàm thuộc bell – hình chuông được đưa ra bởi 3 tham số {a, b, c}:

+ Định nghĩa 1.5: Hàm thuộc sigmoidal

Hàm thuộc sigmoidal được định nghĩa bởi:

exp1

1)

,

;(

c x a c

a x sig

Trang 7

5

đưa ra hai cách kết hợp các hàm sigmoidal để tạo ra các hàm thuộc có tính đóng và tính không đối xứng

+ Định nghĩa 1.6: Hàm thuộc left - right

Hàm thuộc left – right được đưa ra bởi 3 tham số   , ,c :

* Một số hàm thuộc hai chiều

Hàm thuộc hai chiều là hàm có hai đầu vào Cách cơ bản để mở rộng hàm thuộc một chiều thành hàm hai chiều là thông qua mở rộng trụ (cylindrical extension), được định nghĩa như sau:

+ Định nghĩa 1.7: Mở rộng trụ của hàm thuộc một chiều

Nếu A là tập mờ trong X, khi đó mở rộng trụ của A trong XY là tập mờ C(A) được định nghĩa:

Hình 1.2: (a) Tập mờ cơ sở A; (b) Mở rộng trụ C(A) của A

+ Định nghĩa 1.8: Các phép chiếu của tập mờ

Cho R là tập mờ hai chiều trên XY Khi đó các phép chiếu trên X và Y được định nghĩa tương ứng:

Trang 8

6

Hình 1.3: (a) Tập mờ hai chiều R; (b) RX (chiếu của R trên X); (c) RY

(chiếu của R trên Y)

Nói chung, hàm thuộc hai chiều được chia thành hai nhóm: kết hợp và không kết hợp Nếu hàm thuộc hai chiều có thể được biểu diễn thông qua hai hàm thuộc một chiều thì khi đó nó thuộc nhóm kết hợp Ngược lại thì là nhóm không kết hợp

Ví dụ: Hàm thuộc hai chiều thuộc nhóm kết hợp và không kết hợp

Giả sử tập mờ A = “(x, y) is near (3, 4)” được định nghĩa bởi:

3exp

),

1

4exp

2

3exp

),

A

)1,4

;()

2,3

;(x gaussian y gaussian

Với cách tách như trên thì bây giờ ta có thể biểu diễn tập mờ A như là sự kết nối giữa hai câu lệnh “x is near 3 AND y is near 4” Ở đây câu lệnh đầu tiên được định nghĩa: near3  xg aussian(x;3,2)

Câu lệnh thứ hai được định nghĩa: near4  xg aussian(x;4,1).Và tích giữa hai hàm thuộc trên được định nghĩa như là toán tử AND giữa câu lệnh

Một loại hàm thuộc hai chiều khác là không kết hợp, ví dụ như tập mờ sau đây:

- Các định nghĩa cơ bản của tập mờ loại hai

Trong phần này, chúng ta định nghĩa tập mờ loại hai và một số khái niệm quan trọng Khoảng mờ của hàm thuộc loại một được vẽ trong hình 1.4(a) bằng cách di chuyển các điểm trên tam giác hoặc tới bên trái hoặc tới bên phải, và không cần thiết phải có số

Trang 9

7

lượng các điểm giống nhau, như hình 1.4(b) Sau đó, ở một giá trị rõ x ta gọi là x’, nó không còn là giá trị đơn cho hàm thuộc u’, thay thế vào đó hàm thuộc nhận các giá trị ở bất kỳ đâu trên đường thẳng giao với vùng mờ Các giá trị này không nhất thiết phải có các trọng số giống nhau Vì vậy chúng ta có thể chỉ định các biên phân bố đến tất các điểm đó Để làm như vậy với tất cả các điểm xX Chúng ta tạo ra một hàm thuộc 3 chiều (hay gọi là hàm thuộc loại hai) là đặc trưng cho tập mờ loại hai (hình 1.5)

Hình 1.4: (a) Hàm thuộc loại một và (b) Hàm thuộc loại một được

mờ hóa

Hình 1.5: Minh họa hàm thuộc loại hai + Định nghĩa 1.9: Một tập mờ loại hai, ký hiệu là A, được đặc trưng bởi hàm thuộc loại hai A( , ) x u , trong đó x X và u J x [0,1], …

Trang 10

 luôn nằm trong đoạn [0,1]

+ Định nghĩa 1.10: Với mỗi giá trị của x, tại x = x’, mặt phẳng 2D mà có hai trục là u

và A( ', ) x u được gọi là nhát cắt đứng (vertical slice) của A( , ) x u Một hàm thuộc phụ (secondary membership function) là một nhát cắt đứng của A( , ) x u Nó chính là

ta sẽ có A( )x là hàm phụ, đó chính là tập mờ loại một, tập mà chúng ta tham chiếu tới như là tập phụ (secondary set)

Chúng ta có thể viết lại A theo các nhát cắt đứng như sau:

+ Định nghĩa 1.11: Miền của hàm thuộc phụ được gọi là hàm thuộc chính (primary

membership) của x Trong (1.5) J là hàm thuộc chính của x, trong đó x J x [0,1] với

 

- Các phép toán cơ bản trên tập mờ loại hai

+ Hợp của hai tập mờ loại hai

Trang 11

Trong đó v = u w,  là ký hiệu của toán tử min hay toán tử nhân  là ký hiệu

của phép toán Meet

+ Phần bù của tập mờ loại hai

Phần bù của tập mờ loại hai được miêu tả như sau:

( ) ( ) / (1 ) ( )

u x

1.1.3 Mô hình hóa bài toán

Phân đoạn ảnh giữ một vai trò rất quan trọng trong nhiều ứng dụng như các bài toán nhận dạng hay các bài toán xử lý ảnh Phân đoạn ảnh là một bước cơ bản để có thể thực hiện việc phân tích các ảnh thu được Một cách tổng quát, phân đoạn ảnh được định nghĩa như việc chia hình ảnh thành các đối tượng độc lập với nhau dựa trên các đặc tính của ảnh như mức xám hay kết cấu của ảnh Có rất nhiều các thuật toán phân đoạn ảnh được đề xuất, chúng ta có thể chia ra làm 4 loại sau đây:

- Phương pháp cơ bản: Phân ngưỡng, phát triển vùng, tách biên…

- Phương pháp thống kê: Maximum Likelihood Classifier (MLC)…

- Phương pháp dựa trên mạng Neural

- Phương pháp dựa trên logic mờ (Fuzzy Clustering)

Chúng ta sẽ tập trung vào phương pháp trên logic mờ dựa trên mô hình phân cụm

mờ Fuzzy C-means (FCM)

Phân lớp Fuzzy C-Means (FCM) là một trong những phương pháp được ứng dụng rộng rãi nhất trong Logic mờ Được đưa ra bởi Bezdek bằng cách mở rộng thuật toán Dunn năm 1973, FCM là một trong những thuật toán hiệu quả trong bài toán phân lớp

và đặc biệt là trong các bài toán phân đoạn ảnh Như vậy, bài toán phân lớp sẽ dẫn đến việc giải bài toán xác định giá trị min của tổng khoảng cách của các điểm ảnh đến tâm của mỗi phân đoạn trên miền đặc trưng của ảnh

Giả sử rằng X:= {x1, x2, , xn} định nghĩa tập các điểm ảnh của một ảnh cần phải phân thành c (0<c<n) phân đoạn {C1, C2, , Cc} trong đó d

k

xR với k=1,2 n biểu diễn các đặc tính của điểm ảnh Trong các ảnh thông thường, chúng ta thường hay xét đến giá trị mức xám, giá trị màu RGB của các điểm ảnh

Xét ma trận phân lớp mờ (Fuzzy Partition Matrix) U   u ik cxntrong đó mỗi phần

tử u chỉ ra khả năng thuộc phân lớp i của một điểm ảnh ik x Khi đó, bài toán phân lớp k

chính là tối ưu hoá hàm mục tiêu:

Trang 12

10

Trong đó ||.|| chính là giá trị chuẩn Euclidean trên không gian tương ứng và ma trận

V biểu diễn tập hợp các điểm tâm của các phân lớp trong không gian này còn tham số

m được gọi là tham số mờ của các tập dữ liệu Khi đó, mô hình của bài toán phân đoạn ảnh được biểu diễn:

Trang 13

Vùng ảnh là tập hợp các điểm ảnh có thuộc tính tương tự Ta có thể xem một ảnh

X chính là một tập các điểm ảnh pi, ký hiệu X= { pi }, i∈ [1, N.M], với N.M là kích thước của hình ảnh Như vậy, phân vùng ảnh là quá trình tìm các tập con Ri ={ tập các điểm ảnh có thuộc tính tương tự} của các vùng ảnh sao cho:

UK

i=1 Ri = X và Ri ∩ Rj, ∀i≠ j, i, j = 1…K, với K là số vùng của ảnh X

Phân vùng ảnh là quá trình xử lý một ảnh số thành một tập các vùng, mỗi vùng

là một tập hợp các điểm ảnh Chính xác hơn, phân vùng ảnh là quá trình gán nhãn cho mỗi điểm ảnh trong ảnh sao cho các điểm ảnh có các thuộc tính tương tự nhau thì có cùng một nhãn Đường bao quanh một vùng ảnh được gọi là đường biên

Cơ sở toán học ở đây là chỉ tiêu phân vùng dựa trên độ đo sự tương tự giữa các thuộc tính Thuộc tính quan trọng là thuộc tính biên độ của hàm độ sáng

a) Ảnh gốc b) Kết quả sau khi phân vùng

Hình 1.6: Ví dụ về phân vùng ảnh

Trang 14

12

1.2.2 Các phương pháp tiếp cận

Dựa vào đặc tính vật lý của ảnh, người ta có nhiều kỹ thuật phân vùng: Phân vùng dựa theo miền liên thông gọi là phân vùng dựa theo miền đồng nhất hay miền kề; phân vùng dựa vào biên gọi là phân vùng biên Ngoài ra còn có các kỹ thuật phân vùng khác dựa vào biên độ, phân vùng dựa theo kết cấu Phương pháp phân vùng ảnh được chia thành hai hướng:

- Phương pháp phân vùng trực tiếp: (phân vùng dựa trên độ tương tự về thuộc tính):

Có nhiều phương pháp phân vùng ảnh như phân vùng ảnh dựa vào ngưỡng biên

bộ, phân vùng dựa theo miền liên thông hay còn gọi là phân vùng dựa theo miền đồng nhất hoặc là phân vùng miền liền kề, có thể liệt kê các phương pháp như sau:

+ Phân vùng ảnh theo ngưỡng biên độ

+ Phân lớp điểm ảnh

+ Phân vùng dựa trên cấu trúc đồ thị

+ Phân vùng dựa trên xử lý đa phân giải

+ Phân vùng dựa trên phân tích kết cấu

+ Phân vùng dựa vào phát hiện đối tượng trong ảnh

+ Phương pháp cấu trúc

- Phương pháp phân vùng gián tiếp: (Phân vùng dựa trên tách biên)

Phân vùng dựa trên tách biên Hay nói một cách khác, phân vùng ảnh và đường biên có tính chất đối ngẫu, nếu như ta phát hiện được đường biên thì dựa vào biên có thể xác định vùng ảnh hoặc nếu như ta phân vùng ảnh thì đường bao quanh vùng ảnh đó được gọi là đường biên Ngoài ra còn có các phương pháp phân vùng khác như phân vùng ảnh sử dụng bộ lọc tối ưu; phân vùng ảnh thông qua biểu diễn bề mặt

Việc phân vùng ảnh dựa vào đường biên thì có ưu điểm nhanh, đơn giản Ngoài

ra phân vùng ảnh dựa vào ngưỡng biên bộ thì rất nhạy cảm với nhiễu Đối với các loại ảnh tự nhiên thì đường biểu diễn biên của các vùng rất phức tạp (đường răng cưa) Chính

vì thế phương pháp dựa vào ngưỡng không hiệu quả trong phân vùng những loại ảnh này Thông thường, kỹ thuật phân ngưỡng theo biên độ rất có lợi đối với ảnh nhị phân như văn bản in, đồ họa, ảnh màu hay ảnh X-quang Việc chọn ngưỡng rất quan trọng và bao gồm nhiều bước Như vậy, có thể dùng ngưỡng biên độ để phân vùng khi biên độ

đủ lớn

* Phân vùng ảnh theo ngưỡng biên độ

Các đặc tính đơn giản, cần thiết nhất của ảnh là biên độ và các tính chất vật lý như: Độ tương phản, độ truyền sáng, màu sắc hoặc đáp ứng phổ Như vậy, có thể dùng ngưỡng biên độ để phân vùng khi biên độ đủ lớn đặc trưng cho ảnh Ví dụ, biên độ trong

bộ cảm biến ảnh hồng ngoại có thể phản ánh vùng có nhiệt độ thấp hay vùng có nhiệt

độ cao Kỹ thuật phân ngưỡng theo biên độ rất có lợi đối vớ ảnh nhị phân như văn bản

in, đồ họa, ảnh màu hay ảnh X-quang Việc chọn ngưỡng rất quan trọng Nó bao gồm các bước:

Trang 15

- Điều chỉnh ngưỡng dựa trên lược đồ xám của các điểm lân cận

- Chọn ngưỡng theo lược đồ xám của nhữg điểm thỏa mãn tiêu chuẩn chọn Ví dụ, với ảnh có độ tương phản thấp, lược đồ của những điểm có biên độ Laplace g(m,n) lớn hơn giá trị t định trước (sao cho từ 5% đến 10% số điểm ảnh với Gradient lớn nhất sẽ coi như biên) sẽ cho phép xác định các đặc tính ảnh lưỡng cực tốt hơn ảnh gốc

- Khi có mô hình phân lớp xác suất, việc xác định ngưỡng dựa vào tiêu chuẩn xác suất nhằm cực tiểu xác suất sai số hoặc dựa vào một số tính chất khác của luật Bayes

- Để hiểu rõ hơn nguyên tắc phân vùng dựa vào ngưỡng biên độ, xét thí dụ sau:

Hình 1.7: Minh họa cách chọn ngưỡng

Giả sử ảnh có lược đồ xám như Hình 1.7, chọn các ngưỡng như hình trên với: T0 =Lmin,…,T4=Lmax Ta có 5 ngưỡng và phân ảnh thành 4 vùng, ký hiệu Ck là vùng thứ k của ảnh, với k=1,2,3,4 Thì ta sẽ có được cách phân vùng theo nguyên tắc

như sau:

P(m,n) ∈ C k nếu T k-1 ≤ P(m,n) < T k , k=1,2,3,4

Khi phân vùng xong, nếu ảnh rõ nét thì việc phân vùng coi như kết thúc Nếu không, cần điều chỉnh ngưỡng

* Phân vùng theo miền đồng nhất

Kỹ thuật phân vùng ảnh thành các miền đồng nhất dựa vào các tính chất quan

trọng nào đó của miền ảnh Việc lựa chọn các tính chất của miền sẽ xác định tiêu chuẩn phân vùng Tính đồng nhất của một miền ảnh là điểm chủ yếu xác định tính hiệu quả của việc phân vùng Các tiêu chuẩn hay được dùng là sự thuần nhất về mức xám, màu sắc đối với ảnh màu, kết cấu sợi và chuyển động

Các phương pháp phân vùng ảnh theo miền đồng nhất thường áp dụng là:

- Phương pháp tách cây tứ phân

- Phương pháp cục bộ

Trang 16

14

- Phương pháp tổng hợp

a) Phương pháp tách cây tứ phân

Về nguyên tắc, phương pháp này kiểm tra tính đúng đắn của tiêu chuẩn đề ra một cách tổng thể trên miền lớn của ảnh Nếu tiêu chuẩn được thỏa mãn, việc phân đoạn coi như kết thúc Trong trường hợp ngược lại, chia miền đang xét thành 4 miền nhỏ hơn Với mỗi miền nhỏ, áp dụng một cách đệ quy phương pháp trên cho đến khi tất cả các miền đều thỏa mãn điều kiện

Phương pháp này có thể mô tả như sau:

Tiêu chuẩn xét miền đồng nhất ở đây có thể dựa vào mức xám Ngoài ra, có thể dựa vào độ lệch chuẩn hay độ chênh giữa giá trị mức xám lớn nhất và giá trị mức xám nhỏ nhất

Giả sử Max và Min là giá trị mức xám lớn nhất và nhỏ nhất trong miền đang xét Nếu:|Max – Min| < T (ngưỡng) ta coi miền đang xét là đồng nhất Trường hợp ngược lại, miền đang xét không là miền đồng nhất và sẽ được chia làm 4 phần

Trang 17

15

Thuật toán kiểm tra tiêu chuẩn dựa vào độ chênh lệch max, min được viết: Function Examin_Criteria(I, N1, M1, N2, M2, T)

/* Giả thiết ảnh có tối đa 255 mức xám (N1, M1), (N2, M2) là tọa độ điểm đầu

và điểm cuối của miền; T là ngưỡng */

Begin

1 Max=0 ; Min=255

2 For i = N1 to N2 do

If I[i,j] < Min Then Min=I[i,j] ;

If I[i,j] < Max Then Max=I[i,j] ;

3 If ABS(Max–Min)<T Then Examin_Criteria=0

Else Examin_Criteria=1 ;

End

Nếu hàm trả về giá trị 0, có nghĩa vùng đang xét là đồng nhất, nếu không thì không đồng nhất Trong giải thuật trên, khi miền là đồng nhất cần tính lại giá trị trung bình và cập nhật lại ảnh đầu ra Giá trị trung bình được tính bởi:

Tổng giá trị mức xám / tổng số điểm ảnh trong vùng

Thuật toán này tạo nên một cây mà mỗi nút cha có 4 nút con ở mọi mức trừ mức ngoài cùng Vì thế, cây này có tên là cây tứ phân Cây cho ta hình ảnh rõ nét về cấu trúc phân cấp của các vùng tương ứng với tiêu chuẩn

Một vùng thõa mãn điều kiện sẽ tạo nên một nút lá; nếu không nó sẽ tạo nên một nút trong và 4 nút con tương ứng Tiếp tục như vậy cho đến khi phân chia xong để đạt các vùng đồng nhất

b) Phân vùng ảnh dựa vào phát triển vùng cục bộ

Ý tưởng của phương pháp là xét ảnh từ các miền nhỏ nhất rồi nối chúng lại nếu thỏa mãn tiêu chuẩn để được một miền đồng nhất lớn hơn Tiếp tục với các miền thu được cho đến khi không thể nối thêm được nữa Số miền còn lại cho ta kết quả phân đoạn Như vậy, miền nhỏ nhất của bước xuất phát là điểm ảnh Phương pháp này hoàn toàn ngược với phương pháp tách Song điều quan trọng ở đây là nguyên lý nối 2 vùng Việc nối 2 vùng được thực hiện theo nguyên tắc sau:

- Hai vùng phải đáp ứng tiêu chuẩn, thí dụ như cùng màu hay cùng mức xám

- Hai vùng phải kế cận nhau

Trang 18

Hình 1.8: Khái niệm 4 liên thông và 8 liên thông Dựa theo nguyên lý của phương pháp nối, ta có 2 thuật toán:

- Thuật toán tô màu (Blob Coloring): Sử dụng khái niệm 4 liên thông, dùng một cửa sổ di chuyển trên ảnh để so sánh với tiêu chuẩn nối

- Thuật toán đệ quy cực bộ: Sử dụng phương pháp tìm kiếm trong một cây để làm tăng kích thước vùng

* Phân vùng ảnh dựa trên phân tích kết cấu

Kết cấu thường được nhận biết trên bề mặt của các đối tượng như gỗ, cát, vải…

Kết cấu là thuật ngữ phản ánh sự lặp lại của các phân tử mẩu kết cấu cơ bản Sự lặp lại

có thể ngẫu nhiên hay có tính chu kỳ hoặc gần chu kỳ Một mẫu kết cấu chứa rất nhiều điểm ảnh Trong phân tích ảnh, kết cấu được chia làm hai loại chính là: Loại thống kê

và lọa cấu trúc

- Phương pháp thống kê

Tính kết cấu ngẫu nhiên rất phù hợp với các đặc trưng thống kê Vậy, người ta

có thể dùng các đặc trưng ngẫu nhiên để đo nó như: Hàm tự tương quan (AutoCorrelation Function- ACF), các biến đổi mật độ giờ, ma trận tương tranh,… Theo cách tiếp cận bằng hàm tự tương quan, độ thô của kết cấu sợi tỉ lệ vớ độ rộng của ACF, được biểu diễn bởi khoảng cách x0, y0 sao cho r(x0,0) = r(0,y0) = 1 Người ta cũng dùng cách đo nhánh của ACF nhờ hàm khởi sinh moment:

M(k, l) = ∑ ∑𝑛 𝑚(n – 𝜇1)k (m – 𝜇2)r(n,m) Với 𝜇1 = ∑ ∑𝑛 𝑛.r(n,m) và 𝜇2 = ∑ ∑𝑛 𝑚.r(n,m)

Trang 19

17

Các đặc trưng của kết cấu sợi như độ thô, độ mịn hay hướng có thể ước lượng

nhờ các biến đổi ảnh bằng kỹ thuật lọc tuyến tính Một mô hình đơn giản trong trường hợp ngẫu nhiên cho việc phân tích tính kết cấu được mô tả trong hình dưới đây:

Hình 1.9: Phân tích kết cấu bằng dải tương quan Trong mô hình này, trường kết cấu sợi trước tiên được giải chập bởi bộ lọc lấy

từ đầu ra của ACF Như vậy, Như vậy, nếu r(m,n) là ACF thì u(n, m)  a(n, m) = ε(n, m) là trường ngẫu nhiên không tương quan

Các đặc trưng của lược đồ bậc một của ε(n, m) chẳng hạn như trung bình m1, độ phân tán √𝜇2 cũng hay được sử dụng Ngoài các đặc trưng trên, có thể đưa thêm một

số khái niệm và định nghĩa các đại lượng dựa trên đó như: Lược đồ mức xám (Histogram Grey Level Difference), ma trận xuất hiện mức xám

- Tiếp cận theo tính kết cấu

Khi đối tượng xuất hiện trên một nền có tính kết cấu cao, việc phân đoạn dựa vào

tính kết cấu trở nên quan trọng Nguyên nhân là kết cấu sợi thường chứa mật độ cao các

gờ (edge) làm cho phân đoạn theo biên kém hiệu quả, trừ khi ta loại tính kết cấu Việc phân đoạn dựa vào miền đồng nhất cũng có thể áp dụng cho các đặc trưng kết cấu và có thể dùng để phân đoạn các miền có tính kết cấu

Nhìn chung, việc phân loại và phân vùng dựa vào kết cấu là một vấn đề phức tạp

Ngày đăng: 02/08/2022, 14:14

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] Nguyễn Thiện Luận (2006), Bài giảng Logic mờ và suy luận xấp xỉ, Học viện Kỹ Thuật Quân sự Sách, tạp chí
Tiêu đề: Bài giảng Logic mờ và suy luận xấp xỉ
Tác giả: Nguyễn Thiện Luận
Năm: 2006
[4] Đỗ Năng Toàn, Phạm Việt Bình (2007), Giáo trình xử lý ảnh, Nhà xuất bản Đại học Thái Nguyên.Tiếng Anh Sách, tạp chí
Tiêu đề: Giáo trình xử lý ảnh
Tác giả: Đỗ Năng Toàn, Phạm Việt Bình
Nhà XB: Nhà xuất bản Đại học Thái Nguyên. Tiếng Anh
Năm: 2007
[1] F. Rhee and C.Hwang (2001), “A type-2 fuzzy C-means clustering algorithm,” in Proc. Joint Conf. IFSA/NAFIPS, Jul. 2001 Sách, tạp chí
Tiêu đề: A type-2 fuzzy C-means clustering algorithm
Tác giả: F. Rhee and C.Hwang
Năm: 2001
[2] Cheul Hwang and Frank Chung-Hoon Rhee (2007), Uncertain Fuzzy clustering: Intervel Type-2 Fuzzy Approach to C-Means, IEEE Transactions on Fuzzy Systems Sách, tạp chí
Tiêu đề: Uncertain Fuzzy clustering: Intervel Type-2 Fuzzy Approach to C-Means
Tác giả: Cheul Hwang and Frank Chung-Hoon Rhee
Năm: 2007
[3] J.M. Mendel, John R. I., Feilong Liu (2006), "Interval Type-2 Fuzzy Logic Systems Made Simple", IEEE Trans. on Fuzzy Systems Sách, tạp chí
Tiêu đề: Interval Type-2 Fuzzy Logic Systems Made Simple
Tác giả: J.M. Mendel, John R. I., Feilong Liu
Năm: 2006

TỪ KHÓA LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w