Luận văn thạc sĩ công nghệ thông tin Phân tích một số phương pháp phân đoạn ảnh có giám sát

Trong hầu hết các ứng dụng của lĩnh vực xử lý ảnh, thị giác máy tính, phân đoạn ảnh luôn đóng một vai trò cơ bản và thường là bước tiền xử lý đầu tiên trong toàn bộ quá trình trước

Trang 1

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC LẠC HỒNG

* * *

Nguyễn Văn Thành

PHÂN TÍCH MỘT SỐ PHƯƠNG PHÁP PHÂN ĐOẠN ẢNH CÓ GIÁM SÁT

Luận văn thạc sĩ Công nghệ thông tin

Đồng Nai – 2013

Trang 2

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC LẠC HỒNG

* * *

PHÂN TÍCH MỘT SỐ PHƯƠNG PHÁP PHÂN ĐOẠN ẢNH CÓ GIÁM SÁT

Chuyên ngành : Công Nghệ Thông Tin

Luận văn thạc sĩ Công nghệ thông tin

NGƯỜI HƯỚNG DẪN KHOA HỌC : PGS.TS NGÔ QUỐC TẠO

Đồng Nai – 2013

Trang 3

LỜI CẢM ƠN

Trong quá trình làm luận văn vừa qua, được sự giúp đỡ và chỉ bảo nhiệt tình của PGS TS Ngô Quốc Tạo – Viện Công nghệ Thông tin – Viện khoa học Việt Nam, luận văn của em đã được hoàn thành Măc dù đã cố gắng cùng với sự tận tâm của thầy h ướng dẫn song do th ời gian và khả năng vẫn cò n nhiều hạn chế nên luận văn không tránh khỏi những thiếu sót

Em xin bày tỏ lò ng biết ơn sâu sắc t ới thầy PGS TS Ngô Quốc Tạo đã tận tình hướng dẫn, chỉ bảo và dành rất nhiều thời gian quí báu của thầy cho em trong thời gian qua, đã giúp em hoàn thành bài luận văn đúng thời hạn

Em xin gửi lời cảm ơn đến Ban Giám hiệu, các Thầy cô giáo của Trường Đại học Lạc Hồng, các Thầy cô bộ môn, đã giảng dạy cung cấp, trang bị cho chúng em những kiến thức chuyên ngành, chuyên môn chuyên sâu trong suốt hai năm qua Xin cảm ơn gia đình và bạn bè đã động viên cổ vũ em trong suốt quá trình học tập cũng như thời gian làm luận văn, đã giúp em hoàn thành khóa học, luận văn theo qui định

Trang 4

LỜI CAM ĐOAN

Tôi xin cam đoan luận văn là kết quả nghiên cứu của tôi, không sao chép của

ai Nội dung luận văn có tham khảo và sử dụng các tài liệu liên quan, các thông tin trong tài liệu được đăng tải trên các tạp chí và các trang website theo danh mục tài

liệu của luận văn

Tác giả luận văn

Trang 5

MỤC LỤC

DANH MỤC CÁC THUẬT NGỮ, CÁC TỪ VIẾT TẮT i

CÁC THUẬT NGỮ i

CÁC TỪ VIẾT TẮT ii

DANH MỤC CÁC BẢNG iii

DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ iv

MỞ ĐẦU 1

CHƯƠNG 1: TỔNG QUAN VỀ XỬ LÝ ẢNH, PHÂN ĐOẠN ẢNH 3

1.1 Tổng quan về xử lý ảnh 3

1.1.1 Một số khái niệm cơ bản về xử lý ảnh 3

1.1.1.1 Xử lý ảnh là gì ? 3

1.1.1.2 Phần tử ảnh (Pixel - Picture Element) 3

1.1.1.3 Mức xám của ảnh 4

1.1.1.4 Độ phân giải của ảnh 5

1.1.2 Các giai đoạn cơ bản trong xử lý ảnh 6

1.1.2.1 Biểu diễn ảnh 6

1.1.2.2 Tăng cường, nâng cao chất lượng ảnh 7

1.1.2.3 Khôi phục ảnh 7

1.1.2.4 Biến đổi ảnh 8

1.1.2.5 Phân tích ảnh 8

1.1.2.6 Nhận dạng ảnh 9

1.1.2.7 Nén ảnh 11

1.1.3 Các ứng dụng của xử lý ảnh 12

1.1.4 Quan hệ cơ bản giữa các điểm ảnh 13

1.2 Tổng quan về phân đoạn ảnh 16

Trang 6

1.2.1 Giới thiệu 16

1.2.2 Các phương pháp tiếp cận 17

1.2.2.1 Phân vùng ảnh theo ngưỡng biên độ 19

1.2.2.2 Phân vùng theo miền đồng nhất 20

1.2.2.3 Phân vùng ảnh dựa trên phân tích kết cấu 24

1.2.2.4 Phân vùng ảnh dựa trên sự phân lớp điểm ảnh 28

1.2.2.5 Phân vùng dựa vào lý thuyết đồ thị 30

1.2.2.6 Phân vùng ảnh dựa trên biểu diễn và xử lý đa phân giải 35

CHƯƠNG 2: MỘT SỐ KỸ THUẬT PHÂN ĐOẠN ẢNH CÓ GIÁM SÁT 37

2.1 Giới thiệu về phân đoạn ảnh có giám sát 37

2.2 Phân đoạn ảnh sử dụng grabcut 38

2.2.1 Phân đoạn theo năng lượng cực tiểu hóa 39

2.2.2 Giải thuật phân đoạn GrabCut 41

2.2.2.1 Mô hình dữ liệu màu 41

2.2.2.2 Phân đoạn theo lặp lại cực tiểu năng lượng 42

2.2.2.3.Tương tác người sử dụng và trimap không đầy đủ 44

2.3 Phân đoạn ảnh sử dụng Random Walks 45

2.3.1 Trọng số cạnh 46

2.3.2.Vấn đề Dirichlet Tổ hợp 46

2.3.3.Mạch tương tự 48

2.3.4.Mối quan hệ để khuếch tán 49

2.4.Phân đoạn ảnh sử dụng Random Walks with Restart 50

2.4.1.Phương pháp phân đoạn ảnh dựa trên RWR 54

2.4.1.1.Xây dựng đồ thị trọng số cho hình ảnh 55

2.4.1.2.Tính xác suất 56

Trang 7

2.4.1.3.Gán nhãn để phân đoạn ảnh 58

2.4.2.Độ phức tạp thuật toán 59

CHƯƠNG 3: CÀI ĐẶT THỬ NGHIỆM 61

3.1.Môi trường cài đặt 61

3.2.Chương trình thực nghiệm phân đoạn ảnh sử dụng RWR 61

3.2.1.Thiết lập thông số 61

3.2.2.Kết quả phân đoạn RWR B_LIN với c=10-4 63

3.2.3.Một số so sánh 64

3.2.3.1.Vấn đề biên ảnh yếu 64

3.2.3.2.Vấn đề kết cấu 65

3.2.3.3.Định lượng so sánh 66

3.3.Kết luận và kiến nghị 68

TÀI LIỆU THAM KHẢO

Trang 8

DANH MỤC CÁC THUẬT NGỮ, CÁC TỪ VIẾT TẮT CÁC THUẬT NGỮ

Random Walk With Return Bước đi ngẫu nhiên với quay lại

Trang 9

CÁC TỪ VIẾT TẮT

Trang 10

DANH MỤC CÁC BẢNG

Trang 11

DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ

Hình 1.1 Quá trình xử lý ảnh 3

Hình 1.2 Lân cận các điểm ảnh của tọa độ (x,y) 14

Hình 1.3 Một ví dụ về phân vùng ảnh 17

Hình 1.4 Minh họa cách chọn ngưỡng 20

Hình 1.5 Khái niệm 4 liên thông và 8 liên thông 23

Hình 1.6 Phân tích kết cấu bằng dải tương quan 25

Hình 1.7 Biểu diễn ảnh dưới dạng một đồ thị 31

Hình 1.8 Minh họa cây bao trùm tối thiểu của một đồ thị 32

Hình 2.1 Một số ví dụ của Grabcut 41

Hình 2.2 Phân đoạn ảnh Lặp đi lặp lại ở GrabCut 44

Hình 2 3 Sự Quy tụ cực tiểu hóa lặp đi lặp lại 44

Hình 2.4 Người dùng hiệu chỉnh 45

Hình 2.5 Kết quả phân đoạn 58

Hình 2.6 So sánh độ phức tạp thuật toán 60

Hình 3.1 Sự thay đổi xác suất trạng thái ổn định r 62

Hình 3.2 Phân đoạn đối với sự biết đổi của các xác suất khởi động lại c trong ảnh tự nhiên 62

Hình 3.3 So sánh thuật toán GC, RW, RWR cho ảnh có đường biên yếu 65

Hình 3 4 So sánh phân đoạn cho ảnh có kết cấu yếu giữa các thuật toán GC, RW, RWR 66

Hình 3.5 So sánh thuật toán GC, RW, RWR trên ảnh tự nhiên 67

Trang 12

MỞ ĐẦU

Xử lý ảnh (Image Processing) là một trong những mảng quan trọng nhất trong kỹ thuật thị giác máy tính Xử lý ảnh được ứng dụng trong nhiều lĩnh khác nhau như y học, an ninh, quốc phòng

Phân đoạn ảnh là một thao tác ở mức thấp trong toàn bộ quá trình xử lý ảnh Phân đoạn ảnh có vai trò quan trọng trong việc chiết xuất thông tin từ những hình ảnh và việc khai thác các thông tin hữu ích và các thuộc tính từ hình ảnh Nếu bước phân đoạn ảnh không tốt thì dẫn đến việc nhận diện sai lầm về các đối tượng có trong ảnh

Trong hầu hết các ứng dụng của lĩnh vực xử lý ảnh, thị giác máy tính, phân đoạn ảnh luôn đóng một vai trò cơ bản và thường là bước tiền xử lý đầu tiên trong toàn bộ quá trình trước khi thực hiện các thao tác khác ở mức cao hơn như nhận dạng đối tượng, biểu diễn đối tượng, nén ảnh dựa trên đối tượng, hay truy vấn ảnh dựa vào nội dung

Hiện nay đã có nhiều thuật toán được đề xuất để giải quyết bài toán phân đoạn ảnh Các thuật toán trên hầu hết đều dựa vào hai thuộc tính quan trọng của mỗi điểm ảnh so với các điểm lân cận của nó, đó là: sự khác (dissimilarity) và giống nhau (similarity) Các phương pháp dựa trên sự khác nhau của các điểm ảnh được gọi là các phương pháp biên (boundary-based methods), còn các phương pháp dựa trên sự giống nhau của các điểm ảnh được gọi là phương pháp miền (region-based methods)

Tuy nhiên, các thuật toán theo cả hai hướng này đều vẫn chưa cho kết quả phân đoạn tốt, vì cả hai loại phương pháp này đều chỉ nắm bắt được các thuộc tính cục bộ (local) của ảnh Do đó, việc tìm ra các thuật toán nắm bắt được các thuộc tính toàn cục (global) của bức ảnh đã trở thành một xu hướng

Chương 1 của luận văn trình bày tổng quan về xử lý ảnh, các hướng tiếp cận chính trong phân đoạn ảnh

Trong chương 2, luận văn tập trung tìm hiểu và trình bày một số phương pháp phân đoạn ảnh có giám sát như Random Walker (RW), Graph cuts (GC),

Trang 13

Random Walker Restart (RWR) – chỉ ra phương pháp được đánh giá là hiệu quả hơn các phương pháp phân đoạn ảnh trước đây, khắc phục được hai khó khăn quan trọng trong ảnh tự nhiên là bài toán đường biên yếu và kết cấu yếu

Phương pháp RWR dựa vào việc coi một bức ảnh như một đồ thị có trọng số Sau khi tính xác suất trạng thái ổn định của mỗi điểm ảnh bằng cách sử dụng kỹ thuật phân đoạn ảnh chúng ta có thể ước lượng khả năng phân tách và cuối cùng gán nhãn vào mỗi điểm ảnh

Chương 3 phân tích kết quả thực nghiệm phân đoạn ảnh RWR với các ảnh tự

nhiên có đường biên yếu và kết cấu yếu

Trang 14

CHƯƠNG 1: TỔNG QUAN VỀ XỬ LÝ ẢNH, PHÂN ĐOẠN ẢNH

Quá trình xử lý ảnh được xem như là quá trình thao tác ảnh đầu vào nhằm cho ra kết quả mong muốn Kết quả đầu ra của một quá trình xử lý ảnh có thể là một ảnh “tốt hơn” hoặc một kết luận

Hình 1.1 Quá trình xử lý ảnh

Ảnh có thể xem là tập hợp các điểm ảnh và mỗi điểm ảnh được xem như là đặc trưng cường độ sáng hay một dấu hiệu nào đó tại một vị trí nào đó của đối tượng trong không gian và nó có thể xem như một hàm n biến P(c1, c2, , cn) Do

đó, ảnh trong xử lý ảnh có thể xem như ảnh n chiều

1.1.1.2 Phần tử ảnh (Pixel - Picture Element)

Ảnh trong thực tế là một ảnh liên tục về không gian và về giá trị độ sáng Để

có thể xử lý ảnh bằng máy tính thì cần thiết phải tiến hành số hóa ảnh Trong quá trình số hóa, người ta biến đổi tín hiệu liên tục sang tín hiệu rời rạc thông qua quá trình lấy mẫu (rời rạc hoá về không gian) và lượng hoá thành phần giá trị (rời rạc hoá biên độ giá trị) mà bằng mắt thường ta khó phân biệt được hai mức xám kề

Ảnh

“Tốt hơn”

Kết luận

Trang 15

nhau Trong trường hợp này, người ta sử dụng khái niệm phần tử ảnh hay là điểm ảnh (Picture Element - Pixel) Trong khuôn khổ ảnh hai chiều Mỗi điểm ảnh gồm

có một cặp toạ độ (x,y) và giá trị biểu diễn độ sáng (cấp xám) cụ thể Các cặp tọa độ (x, y) tạo nên độ phân giải (resolution) Chẳng hạn như màn hình máy tính có độ phân giải là 480×640 nghĩa là trên màn hình có 480×640 điểm ảnh (x, y), chiều rộng 80 điểm ảnh, chiều dài 640 điểm ảnh

Điểm ảnh (pixel) là một phần tử của ảnh số tại tọa độ (x,y) với độ xám hoặc màu nhất định

Điểm ảnh được xem như là dấu hiệu hay cường độ sáng tại 1 toạ độ trong không gian của đối tượng và ảnh được xem như là 1 tập hợp các điểm ảnh Kích thước và khoảng cách giữa các điểm ảnh đó được chọn thích hợp sao cho mắt người cảm nhận sự liên tục về không gian và mức xám (hoặc màu) của ảnh số gần như thật Mỗi phần tử trong ma trận được gọi là một phần tử ảnh

Ta cần phân biệt Pixel (phần tử ảnh) với khái niệm pixel hay đề cập đến trong hệ thống đồ hoạ máy tính

1.1.1.3 Mức xám của ảnh

Mức xám (gray-level) là kết quả của sự mã hoá tương ứng một cường độ sáng của mỗi điểm ảnh với một giá trị số của quá trình lượng hoá Là số các giá trị có thể có của các điểm ảnh của ảnh Một điểm ảnh (pixel) có hai đặc trưng cơ bản là vị trí (x, y) của điểm ảnh và độ xám của nó Dưới đây chúng ta xem xét một số khái

niệm và thuật ngữ thường dùng trong xử lý ảnh

Trang 16

Lý do: từ kỹ thuật máy tính dùng 1 byte (8 bit) để biểu diễn mức xám: Mức xám dùng 1 byte biểu diễn: 28=256 mức, tức là từ 0 đến 255)

mỗi pixel sẽ được mã hóa bởi 8 bit

1.1.1.4 Độ phân giải của ảnh

Định nghĩa: Độ phân giải (Resolution) của ảnh là mật độ điểm ảnh được ấn

định trên một ảnh số được hiển thị

Theo định nghĩa, khoảng cách giữa các điểm ảnh phải được chọn sao cho mắt người vẫn thấy được sự liên tục của ảnh Việc lựa chọn khoảng cách thích hợp tạo nên một mật độ phân bổ, đó chính là độ phân giải và được phân bố theo trục x

và y trong không gian hai chiều

Ví dụ: Độ phân giải của ảnh trên màn hình CGA (Color Graphic Adaptor) là

một lưới điểm theo chiều ngang màn hình: 320 điểm chiều dọc * 200 điểm ảnh (320*200) Rõ ràng, cùng màn hình CGA 12” ta nhận thấy mịn hơn màn hình CGA

Trang 17

17” độ phân giải 320*200 Lý do: cùng một mật độ (độ phân giải) nhưng diện tích màn hình rộng hơn thì độ mịn (liên tục của các điểm) kém hơn

1.1.2 Các giai đoạn cơ bản trong xử lý ảnh

1.1.2.1 Biểu diễn ảnh

Trong biểu diễn ảnh người ta thường dùng các phần tử đặc trưng của ảnh là pixel Nhìn chung có thể xem một hàm hai biến f(x,y) chứa các thông tin như là biểu diễn của một ảnh Các mô hình biểu diễn ảnh cho ta một mô tả logic hay định lượng các tính chất của hàm này Một số mô hình thường được dùng trong biểu diễn ảnh: mô hình toán, mô hình thống kê Trong mô hình toán, ảnh hai chiều được biểu diễn nhờ các hàm hai biến trực giao gọi là các hàm cơ sở Với mô hình thống kê, một ảnh được coi như là một phần tử của một tập hợp đặc trưng bởi các đại lượng

như: kỳ vọng, hiệp biến, phương sai, moment

Đây là một bước quan trọng, tạo tiền đề cho xử lý ảnh Mục đích chính nhằm làm nổi bật một số đặc tính của ảnh như thay đổi độ tương phản, lọc nhiễu, nổi biên, làm trơn biên, khuyếch đại ảnh nhằm phục vụ cho việc hiển thị hoặc các quá trình phân tích tiếp theo Tùy theo các ứng dụng khác nhau mà chúng ta có các kỹ thuật nâng cao chất lượng ảnh khác nhau

Nâng cao chất lượng ảnh có quan hệ gần gũi với khôi phục ảnh Khi một ảnh

bị nhiễu thì khôi phục ảnh gốc thường đưa đến nâng cao chất lượng ảnh Có một số khác biệt giữa khôi phục ảnh và nâng cao chất lượng ảnh Trong khôi phục ảnh, một ảnh gốc bị nhiễu thì mục tiêu là làm sao cho ảnh sau khi xử lý càng gần giống ảnh gốc càng tốt Còn trong nâng cao chất lượng ảnh thì mục tiêu là làm cho ảnh sau khi

xử lý có được chất lượng tốt hơn khi chưa xử lý Như vậy một ảnh không bị nhiễu thì không thể được xử lý bằng các kỹ thuật khôi phục ảnh nhưng ảnh đó có thể được

xử lý bằng các kỹ thuật nâng cao chất lượng ảnh Nhưng một ảnh bị nhiễu thì nó có thể được xử lý vừa bằng các kỹ thuật khôi phục ảnh vừa bằng các kỹ thuật nâng cao chất lượng ảnh

Trang 18

1.1.2.2 Tăng cường, nâng cao chất lượng ảnh

Đây là một bước quan trọng, tạo tiền đề cho xử lý ảnh

Mục đích chính nhằm làm nổi bật một số đặc tính của ảnh như thay đổi độ tương phản, lọc nhiễu, nổi biên, làm trơn biên, khuyếch đại ảnh nhằm phục vụ cho việc hiển thị hoặc các quá trình phân tích tiếp theo Tùy theo các ứng dụng khác nhau mà chúng ta có các kỹ thuật nâng cao chất lượng ảnh khác nhau

Nâng cao chất lượng ảnh có quan hệ gần gũi với khôi phục ảnh Khi một ảnh

bị nhiễu thì khôi phục ảnh gốc thường đưa đến nâng cao chất lượng ảnh Có một số khác biệt giữa khôi phục ảnh và nâng cao chất lượng ảnh Trong khôi phục ảnh, một ảnh gốc bị nhiễu thì mục tiêu là làm sao cho ảnh sau khi xử lý càng gần giống ảnh gốc càng tốt Còn trong nâng cao chất lượng ảnh thì mục tiêu là làm cho ảnh sau khi

xử lý có được chất lượng tốt hơn khi chưa xử lý Như vậy một ảnh không bị nhiễu thì không thể được xử lý bằng các kỹ thuật khôi phục ảnh nhưng ảnh đó có thể được

xử lý bằng các kỹ thuật nâng cao chất lượng ảnh Nhưng một ảnh bị nhiễu thì nó có thể được xử lý vừa bằng các kỹ thuật khôi phục ảnh vừa bằng các kỹ thuật nâng cao chất lượng ảnh

1.1.2.3 Khôi phục ảnh

Khôi phục ảnh là quá trình loại bỏ hay tối thiểu hoá các ảnh hưởng của môi trường bên ngoài hoặc do các hệ thống thu nhận ảnh gây ra Về nguyên tắc, khôi phục ảnh nhằm xác định mô hình toán học của quá trình đã gây ra biến dạng, tiếp theo là dùng ánh xạ ngược để xác định lại ảnh

Bất kỳ một ảnh nào được thu bằng các thiết bị điện, quang điện hay quang học thường bị nhiễu bởi môi trường cảm biến của các thiết bị đó Các loại nhiễu có thể là nhiễu hệ thống, bị mờ do lệch tiêu điểm camera, nhiễu ngẫu nhiên do chuyển động giữa camera và đối tượng được chụp, nhiễu do khí quyển…

Khôi phục ảnh là dùng các bộ lọc để lọc các ảnh bị nhiễu nhằm giảm tối thiểu sự ảnh hưởng của các loại nhiễu này để cho ra ảnh kết quả càng gần giống ảnh gốc càng tốt Hiệu quả của các bộ lọc khôi phục ảnh phụ thuộc vào sự nhận biết về

Trang 19

quá trình nhiễu cùng với quá trình thu nhận ảnh Khôi phục ảnh thường được xử lý trên miền tần số là chủ yếu Bao gồm các kỹ thuật lọc ngược, lọc bình phương tối thiểu (Wiener)

1.1.2.4 Biến đổi ảnh

Biến đổi ảnh là việc sử dụng một lớp các ma trận đơn vị và các kỹ thuật thường dùng để biến đổi ảnh như: Biến đổi Fourier, Sin, Cosin, tích Kronecker, biến đổi Karhumen Loeve…

1.1.2.5 Phân tích ảnh

Là khâu quan trọng trong quá trình xử lý ảnh để tiến tới hiểu ảnh Trong phân tích ảnh việc trích chọn đặc điểm là một bước quan trọng Các đặc điểm của đối tượng được trích chọn tuỳ theo mục đích nhận dạng trong quá trình xử lý ảnh

Có thể nêu ra một số đặc điểm của ảnh sau đây:

Đặc điểm không gian: Phân bố mức xám, phân bố xác suất, biên độ, điểm

uốn…

Đặc điểm biến đổi: Các đặc điểm loại này được trích chọn bằng việc thực

hiện lọc vùng (zonal filtering) Các bộ vùng được gọi là “mặt nạ đặc điểm” (feature mask) thường là các khe hẹp với hình dạng khác nhau (chữ nhật, tam giác, cung tròn )

Đặc điểm biên và đường biên: Đặc trưng cho đường biên của đối tượng và

do vậy rất hữu ích trong việc trích trọn các thuộc tính bất biến được dùng khi nhận dạng đối tượng Các đặc điểm này có thể được trích chọn nhờ toán tử gradient, toán

tử la bàn, toán tử Laplace, toán tử “chéo không” (zero crossing) v.v

Việc trích chọn hiệu quả các đặc điểm giúp cho việc nhận dạng các đối tượng ảnh chính xác, với tốc độ tính toán cao và dung lượng nhớ lưu trữ giảm xuống

Phân tích ảnh là quá trình suy luận, tính toán dựa vào các đặc tính thể hiện trên hình ảnh để từ đó rút ra được các thông tin định lượng về hình ảnh

Trang 20

Phân tích ảnh có thể tách biệt các vật thể trên ảnh, đo lường, phân loại, mô

tả, so sánh chúng

Mặt khác, từ việc phân tích ảnh cũng có thể suy ra các số liệu thống kê về hình ảnh Liên quan đến việc xác định các độ đo định lượng của một ảnh để đưa ra một mô tả đầy đủ về ảnh Có nhiều kỹ thuật khác nhau hỗ trợ phân tích ảnh như: các

kỹ thuật lọc,các kỹ thuật tách, hợp dựa trên các tiêu chuẩn đánh giá về màu sắc, cường độ, kết cấu… và các kỹ thuật phân lớp dựa theo cấu trúc Phân vùng ảnh là một hướng riêng của phân tích ảnh Phân vùng ảnh bao gồm các kỹ thuật phân tách các vùng của ảnh thành những vùng có những nét đặc trưng của nó hoặc tách biệt hoàn toàn giữa các vùng ảnh này với các vùng ảnh khác trên ảnh và nền Mục đích

là giúp cho dễ quan sát và dễ xử lý và hỗ trợ cho các giai đoạn tiếp theo của hệ thống xử lý ảnh

1.1.2.6 Nhận dạng ảnh

Là một khoa học nhằm trang bị phương pháp luận để trang bị cho máy tính

có khả năng nhận thức Nhận dạng tự động (automatic recognition), mô tả đối tượng, phân loại và phân nhóm các mẫu là những vấn đề quan trọng trong thị giác máy, được ứng dụng trong nhiều ngành khoa học khác nhau Các đối tượng nhận dạng là các mẫu đối tượng Tuy nhiên, một câu hỏi đặt ra là: mẫu (pattern) là gì? Watanabe, một trong những người đi đầu trong lĩnh vực này đã định nghĩa: “Ngược lại với hỗn loạn (chaos), mẫu là một thực thể (entity), được xác định một cách ang áng (vaguely defined) và có thể gán cho nó một tên gọi nào đó” Ví dụ mẫu có thể

là ảnh của vân tay, ảnh của một vật nào đó được chụp, một chữ viết, khuôn mặt người hoặc một ký đồ tín hiệu tiếng nói Khi biết một mẫu nào đó, để nhận dạng hoặc phân loại mẫu đó có thể:

Hoặc phân loại có mẫu (supervised classification), chẳng hạn phân tích phân biệt (discriminant analyis), trong đó mẫu đầu vào được định danh như một thành phần của một lớp đã xác định

Hoặc phân loại không có mẫu (unsupervised classification hay clustering) trong đó các mẫu được gán vào các lớp khác nhau dựa trên một tiêu chuẩn đồng

Trang 21

dạng nào đó Các lớp này cho đến thời điểm phân loại vẫn chưa biết hay chưa được định danh

Nhận dạng đối tượng ảnh quá trình từ không gian biểu diễn lớp đối tượng vào không gian tên gọi của đối tượng (mỗi đối tượng được gán một cái tên) Hay nói một cách khác nhận dạng đối tượng chính là quá trình tiến hành phân lớp đối tượng cần nhận dạng vào các lớp Có hai lớp phương pháp tiếp cận chính trong quá trình phân lớp các đối tượng, đó là các phương pháp phân lớp dựa vào đường ranh giới phân biệt giữa các lớp (Nơ ron network, phương pháp véc tơ tựa, boosting, trường ngẫu nhiên có điều kiện, nhận dạng dựa vào đa nhân…) và các phương pháp phân lớp dựa vào phân bố thống kế của các lớp (mô hình markov ẩn, phương pháp phân loại thống kê, Bayesian, trường marko ngẫu nhiên) Trên cơ sở các bài toán thì sẽ có các mô hình nhận dạng phù hợp và các thuật toán đi kèm các mô hình đó Ngoài ra còn một số cách tiếp cận khác trong lý thuyết nhận dạng đó là đối sánh mẫu dựa trên các đặc trưng được trích chọn, nhận dạng cấu trúc (xâu chuỗi, đồ thị, ) nhận dạng dựa trên biểu diễn ngữ pháp văn phạm

Hệ thống nhận dạng tự động bao gồm 4 khâu tương ứng với bốn giai đoạn chủ yếu sau:

1 Thu nhận dữ liệu , tiền xử lý, trích chọn đặc tính

2 Biểu diễn dữ liệu

3 Huấn luyện dữ liệu

4 Nhận dạng, ra quyết định

Trên thực tế, người ta đã áp dụng kỹ thuật nhận dạng khá thành công với nhiều bài khác nhau như: nhận dạng ảnh vân tay, nhận dạng chữ (chữ cái, chữ số, chữ có dấu) Nhận dạng chữ in hoặc đánh máy phục vụ cho việc tự động hóa quá trình đọc tài liệu, tăng nhanh tốc độ và chất lượng thu nhận thông tin từ máy tính Các bài toán và ứng dung nhận dạng rất phong phú như: Nhận dạng Khuôn mặt, nhận dạng các biểu cảm của con người, nhận dạng các cử chỉ và hoạt động của con

Trang 22

người, nhận dạng người đi bộ, xây dựng các hệ thống giám sát thông minh, rô bốt, các hệ thống dự báo dựa vào hình ảnh…

1.1.2.7 Nén ảnh

Ảnh dù ở dạng nào vẫn chiếm không gian nhớ rất lớn Khi mô tả ảnh người ta

đã đưa kỹ thuật nén ảnh vào Nén ảnh là làm giảm lượng số liệu cần để biểu diễn một ảnh Cơ sở của vấn đề nén ảnh là quá trình giảm những số liệu dư thừa Từ quan điểm toán học, đó là biến đổi một dãy pixel 2 chiều thành một tập số liệu không liên kết thống kê Sự biến đổi được áp dụng trước để lưu trữ hoặc truyền ảnh Quá trình sau nén ảnh là giải nén để tạo lại ảnh gốc hoặc một xấp xỉ của ảnh gốc Hiện nay, các chuẩn MPEG được dùng với ảnh đang phát huy hiệu quả

Nhằm giảm thiểu không gian lưu trữ Thường được tiến hành theo cả hai cách khuynh hướng là nén có bảo toàn và không bảo toàn thông tin Nén không bảo toàn thì thường có khả năng nén cao hơn nhưng khả năng phục hồi thì kém hơn Trên cơ

sở hai khuynh hướng, có 4 cách tiếp cận cơ bản trong nén ảnh:

• Nén ảnh thống kê: Kỹ thuật nén này dựa vào việc thống kê tần xuất xuất hiện của giá trị các điểm ảnh, trên cơ sở đó mà có chiến lược mã hóa thích hợp Một ví dụ điển hình cho kỹ thuật mã hóa này là *.TIF

• Nén ảnh không gian: Kỹ thuật này dựa vào vị trí không gian của các điểm ảnh

để tiến hành mã hóa Kỹ thuật lợi dụng sự giống nhau của các điểm ảnh trong các vùng gần nhau Ví dụ cho kỹ thuật này là mã nén *.PCX

• Nén ảnh sử dụng phép biến đổi: Đây là kỹ thuật tiếp cận theo hướng nén không bảo toàn và do vậy, kỹ thuật thướng nến hiệu quả hơn *.JPG chính là tiếp cận theo kỹ thuật nén này

• Nén ảnh Fractal: Sử dụng tính chất Fractal của các đối tượng ảnh, thể hiện sự lặp lại của các chi tiết Kỹ thuật nén sẽ tính toán để chỉ cần lưu trữ phần gốc ảnh và quy luật sinh ra ảnh theo nguyên lý Fractal

Trang 23

1.1.3 Các ứng dụng của xử lý ảnh

Xử lý ảnh có nhiều ứng dụng trong thực tế Một trong những ứng dụng sớm nhất là xử lý ảnh từ nhiêm vụ Ranger 7 tại phòng thí nghiệm JetPulsion vào những năm đầu của thập kỷ 60 Hệ thống chụp hình gắn trên tàu vũ trụ có một số hạn chế

về kích thước và trọng lượng, do đó ảnh nhận được bị giảm chất lượng như bị mờ, méo hình học và nhiễu nền Các ảnh đó được xử lý thành công nhờ máy tính số Hình ảnh của mặt trăng và sao hỏa mà chúng ta thấy trong tất cả các tạp chí đều được xử lý bằng những máy tính số Ngày nay, hầu hết các thông tin ảnh đều được chuyển sang dạng ảnh số Vì vậy, trong gần như tất cả các lĩnh vực của các ngành

kỹ thuật đều có ít nhiều liên quan đến ảnh số và sử dụng kỹ thuật xử lý ảnh số Ứng dụng của xử lý ảnh có khả năng tác động mạnh mẽ nhất đến cuộc sống của chúng ta

là lĩnh vực y tế Soi chụp ảnh bừng máy tính dựa rteen cơ sở định lý cắt lớp (project slice) được dùng thường xuyên trong xét nghiệm lâm sang, ví dụ phát hiện và nhận dạng u não Những ứng dụng y khoa khác của xử lý ảnh gồm cải thiện ảnh X quang

và nhận dạng đường biên mạch máu từ những ảnh chụp bằng tia X (angiograms)

Có những dụng khác gần gủi hơn với cuộc sông gia đình là cải tiến ảnh tivi Hình ảnh mà chúng ta thấy trên màn hình tivi có các khuyết tật do độ phân giải hạn chế, bi rung rinh, có ảnh ma, nhiều nền và trượt hình do đan dòng ở những mức độ khác nhau Xử lý ảnh sô có tác động quyết định đến việc cải thiện chất lượng hình ảnh của những hệ truyền hình hiện tại và làm phát triển những hệ truyền hình mới

có độ phân giải cao (HDTV) Một vấn đề nữa cúa chính truyền thông video như hội nghị video, điện thoại video là cần có dải tần rộng Việc mã hóa thẳng chương trình video chất lượng quảng bá yêu cầu đến 100 triệu bit/giây Nếu hy sinh một phần chất lượng và dùng các sơ đô mã hóa ảnh số thì có thể đưa ra thị trường những hệ truyền hình chất lượng đủ rõ với nhịp bit chỉ dưới 100 nghìn bit/giây

Người máy càng ngày đóng vai trò quan trọng trong công nghiệp và gia đinh Chúng sẽ thực hiện những công việc rất nhàm chán hoặc nguy hiểm và những công việc mà tốc độ và độ chính xác vượt quá khả năng của con người Khi người máy trở nên tinh vi hơn, thị giác máy tinh sẽ đóng vai trò ngày càng quan trọng Người ta

sẽ đòi hỏi người máy không những phát hiện và nhận dạng các bộ phận công

Trang 24

nghiệp, mà còn “hiểu” được những gì chúng “thấy” và đưa ra những hành động phù hợp Xử lý ảnh số có tác động rất lớn đến thị giác máy tính

Ngoài những lĩnh vực ứng dụng mọi người thường biết đến, xử lý ảnh số còn

có một số ứng dụng khác ít được nói đến hơn Người thi hành pháp luật thương chụp hình trong những môi trường không thuận lợi, và ảnh nhận được thường bị xuống cấp Ví dụ, bức ảnh chụp thường bị nhòe, việc làm giảm độ nhòe là cần thiết trong nhận dạng

Những ứng dụng của xử lý ảnh số là rất lớn Ngoài những ứng dụng đã thảo luận ở trên thì còn bao gồm các ứng dụng trong các lĩnh vực như điện tử gia đình, thiên văn học, sinh vật học, vật lý, nông nghiệp, địa lý, nhân chủng học, và nhiều lĩnh vực khác Khả năng nhìn và nghe thấy hà hai phương tiện quan trọng nhất để con người nhận thức thế giới bên ngoài, do vậy không có gì đáng ngạc nhiên khi mà

xử lý ảnh số có nhiều khả năng ứng dụng, không chỉ trong khoa học và kỹ thuật mà còn cả trong mọi hoạt động khác của con người

1.1.4 Quan hệ cơ bản giữa các điểm ảnh

Một ảnh số giả sử được biểu diễn bằng hàm f(x, y) Tập con các điểm ảnh là S; cặp điểm ảnh có quan hệ với nhau ký hiệu là p, q

Chúng ta nêu một số các khái niệm sau

1.1.4.1 Các lân cận của điểm ảnh (Image Neighbors)

* Giả sử có điểm ảnh p tại toạ độ (x, y) p có 4 điểm lân cận gần nhất theo chiều đứng và ngang (có thể coi như lân cận 4 hướng chính: Đông, Tây, Nam, Bắc)

{(x-1, y); (x, y-1); (x, y+1); (x+1, y)} = N 4 (p)

trong đó: số 1 là giá trị logic; N4(p) tập 4 điểm lân cận của p

Trang 25

Đông x Tây

Nam

y

Bắc

Hình 1.2 Lân cận các điểm ảnh của tọa độ (x,y)

* Các lân cận chéo: Các điểm lân cận chéo NP(p) (Có thể coi lân cận chéo la 4 hướng: Đông-Nam, Đông-Bắc, Tây-Nam, Tây-Bắc)

Np(p) = { (x+1, y+1); (x+1, y-1); (x-1, y+1); (x-1, y-1)}

* Tập kết hợp: N8(p) = N4(p) + NP(p) là tập hợp 8 lân cận của điểm ảnh p

* Chú ý: Nếu (x, y) nằm ở biên (mép) ảnh; một số điểm sẽ nằm ngoài ảnh

1.1.4.2 Các mối liên kết điểm ảnh

Các mối liên kết được sử dụng để xác định giới hạn (Boundaries) của đối tượng vật thể hoặc xác định vùng trong một ảnh Một liên kết được đặc trưng bởi tính liền kề giữa các điểm và mức xám của chúng

Giả sử V là tập các giá trị mức xám Một ảnh có các giá trị cường độ sáng từ thang mức xám từ 32 đến 64 được mô tả như sau :

V={32, 33, … , 63, 64}

Có 3 loại liên kết

* Liên kết 4: Hai điểm ảnh p và q được nói là liên kết 4 với các giá trị cường

độ sáng V nếu q nằm trong một các lân cận của p, tức q thuộc N4(p)

* Liên kết 8: Hai điểm ảnh p và q nằm trong một các lân cận 8 của p, tức q thuộc N8(p)

Trang 26

* Liên kết m (liên kết hỗn hợp): Hai điểm ảnh p và q với các giá trị cường độ sáng V được nói là liên kết m nếu

1 q thuộc N 4 (p) hoặc

2 q thuộc N P (p)

1.1.4.3 Đo khoảng cách giữa các điểm ảnh

Định nghĩa: Khoảng cách D(p, q) giữa hai điểm ảnh p toạ độ (x, y), q toạ độ

(s, t) là hàm khoảng cách (Distance) hoặc Metric nếu:

1 D(p,q) ≥ 0 (Với D(p,q)=0 nếu và chỉ nếu p=q)

Như vậy, khoảng cách điểm ảnh lân cận của CGA 12” là ≈ 1mm

Trang 27

Khoảng cách D8(p, q) còn gọi là khoảng cách bàn cờ (Chess-Board Distance) giữa điểm ảnh p, q được xác định như sau:

Phân vùng có thể được tiếp cận từ hai quan điểm: bằng cách nhận dạng các đường biên (hoặc đường) hoặc bằng cách nhận ra các vùng (region, area) bên trong ảnh Các phép toán phân vùng có thể xem như là đối ngẫu của các phép toán tìm biên (hay tách cạnh), bởi vì khi tìm biên được kết thúc, điều đó tương đương với việc tách một vùng làm hai Một cách lý tưởng, các phép toán tách cạnh và phân vùng sẽ cho cùng một kết quả phân đoạn, tuy nhiên trong thực tế ít khi đạt được như vậy

Vùng ảnh là tập hợp các điểm ảnh có thuộc tính tương tự (gần giống nhau)

Ta có thể xem một ảnh X chính là một tập các điểm ảnh pi, ký hiệu X= { p i }, i∈ [1, N.M], với N.M là kích thước của hình ảnh Như vậy, phân vùng ảnh là quá trình tìm các tập con Ri ={ tập các điểm ảnh có thuộc tính tương tự} của các vùng ảnh sao cho:

𝐾 𝑅𝑖 = 𝑋

𝑖=1 𝑣à 𝑅𝑖 𝑅𝑗 , ∀𝑖 ≠ 𝑗, 𝑖, 𝑗 = 1 … 𝐾 , với K là số vùng của ảnh X

Trang 28

Phân vùng ảnh là quá trình xử lý một ảnh số thành một tập các vùng, mỗi vùng là một tập hợp các điểm ảnh Chính xác hơn, phân vùng ảnh là quá trình gán nhãn cho mỗi điểm ảnh trong ảnh sao cho các điểm ảnh có các thuộc tính tương tự nhau thì có cùng một nhãn Đường bao quanh một vùng ảnh được gọi là đường biên

Cơ sở toán học ở đây là chỉ tiêu phân vùng dựa trên độ đo sự tương tự giữa các thuộc tính Thuộc tính quan trọng là thuộc tính biên độ của hàm độ sáng (hàm

độ sáng ít biến thiên – tương tự)

a) Ảnh gốc b) Kết quả sau khi phân vùng

Hình 1.3 Một ví dụ về phân vùng ảnh

1.2.2 Các phương pháp tiếp cận

Dựa vào đặc tính vật lý của ảnh, người ta có nhiều kỹ thuật phân vùng: phân vùng dựa theo miền liên thông gọi là phân vùng dựa theo miền đồng nhất hay miền kề; phân vùng dựa vào biên gọi là phân vùng biên Ngoài ra còn có các kỹ thuật phân vùng khác dựa vào biên độ, phân vùng dựa theo kết cấu

Phương pháp phân vùng ảnh được chia thành hai hướng:

Trang 29

 Phương pháp phân vùng trực tiếp (phân vùng dựa trên độ tương tự về thuộc

tính):

Có nhiều phương pháp phân vùng ảnh như phân vùng ảnh dựa vào ngưỡng biên bộ, phân vùng dựa theo miền liên thông hay còn gọi là phân vùng dựa theo miền đồng nhất hoặc là phân vùng miền liền kề, có thể liệt kê các phương pháp như sau:

- Phân vùng ảnh theo ngưỡng biên độ

- Phân lớp điểm ảnh

- Phân vùng dựa trên cấu trúc đồ thị

- Phân vùng dựa trên xử lý đa phân giải

- Phân vùng dựa trên phân tích kết cấu

- Phân vùng dựa vào phát hiện đối tượng trong ảnh

- Phương pháp cấu trúc

 Phương pháp phân vùng gián tiếp: Phân vùng dựa trên tách biên

Phân vùng dựa trên tách biên Hay nói một cách khác, phân vùng ảnh và đường biên có tính chất đối ngẫu, nếu như tôi phát hiện được đường biên thì dựa vào biên có thể xác định vùng ảnh hoặc nếu như tôi phân vùng ảnh thì đường bao quanh vùng ảnh đó được gọi là đường biên Ngoài ra còn có các phương pháp phân vùng khác như phân vùng ảnh sử dụng bộ lọc tối ưu; phân vùng ảnh thông qua biểu diễn bề mặt

Việc phân vùng ảnh dựa vào đường biên thì có ưu điểm nhanh, đơn giản và câu hỏi chính đặt ra ở đây là làm sao xác định được các ngưỡng biên độ để phân vùng ảnh? Ngoài ra phân vùng ảnh dựa vào ngưỡng biên bộ thì rất nhạy cảm với nhiễu Đối với các loại ảnh tự nhiên thì đường biểu diễn biên của các vùng rất phức tạp (đường răng cưa) Chính vì thế phương pháp dựa vào ngưỡng không hiệu quả trong phân vùng những loại ảnh này Thông thường, kỹ thuật phân ngưỡng theo

Trang 30

biên độ rất có lợi đối với ảnh nhị phân như văn bản in, đồ họa, ảnh màu hay ảnh X

- quang Việc chọn ngưỡng rất quan trọng và bao gồm nhiều bước Như vậy, có thể dùng ngưỡng biên độ để phân vùng khi biên độ đủ lớn

Phương pháp phân vùng ảnh thành các miền đồng nhất dựa vào các tính chất quan trọng nào đó của miền ảnh Việc lựa chọn các tính chất của miền sẽ xác định tiêu chuẩn phân vùng Tính đồng nhất của một miền ảnh là điểm chủ yếu xác định tính hiệu quả của việc phân vùng Các tiêu chuẩn hay được dùng là sự đồng nhất về mức xám, màu sắc

1.2.2.1 Phân vùng ảnh theo ngƣỡng biên độ

Các đặc tính đơn giản, cần thiết nhất của ảnh là biên độ và các tính chất vật

lý như: độ tương phản, độ truyền sáng, màu sắc hoặc đáp ứng phổ Như vậy, có thể dùng ngưỡng biên độ để phân vùng khi biên độ đủ lớn đặc trưng cho ảnh Thí dụ, biên độ trong bộ cảm biến ảnh hồng ngoại có thể phản ánh vùng có nhiệt độ thấp hay vùng có nhiệt độ cao Kỹ thuật phân ngưỡng theo biên độ rất có lợi đối với ảnh nhị phân như văn bản in, đồ họa, ảnh màu hay ảnh X-quang

Việc chọn ngưỡng rất quan trọng Nó bao gồm các bước :

 Xem xét lược đồ xám của ảnh để xác định các đỉnh và các khe Nếu ảnh có dạng rắn lượn (nhiều đỉnh và khe), các khe có thể dùng để chọn ngưỡng

 Chọn ngưỡng t sao cho một phần xác định trước η của toàn bộ số mẫu là thấp hơn t

 Điều chỉnh ngưỡng dựa trên lược đồ xám của các điểm lân cận

 Chọn ngưỡng theo lược đồ xám của những điểm thỏa mãn tiêu chuẩn chọn Thí dụ, với ảnh có độ tương phản thấp, lược đồ của những điểm có biên độ Laplace g(m,n) lớn hơn giá trị t định trước (sao cho từ 5% đến 10% số điểm ảnh với Gradient lớn nhất sẽ coi như biên) sẽ cho phép xác định các đặc tính ảnh lưỡng cực tốt hơn ảnh gốc

Trang 31

 Khi có mô hình phân lớp xác suất, việc xác định ngưỡng dựa vào tiêu chuẩn xác suất nhằm cực tiểu xác suất sai số hoặc dựa vào một số tính chất khác của luật Bayes

 Để hiểu rõ hơn nguyên tắc phân vùng dựa vào ngưỡng biên độ, xét thí dụ sau:

1.2.2.2 Phân vùng theo miền đồng nhất

Kỹ thuật phân vùng ảnh thành các miền đồng nhất dựa vào các tính chất quan trọng nào đó của miền ảnh Việc lựa chọn các tính chất của miền sẽ xác định tiêu chuẩn phân vùng Tính đồng nhất của một miền ảnh là điểm chủ yếu xác định tính hiệu quả của việc phân vùng Các tiêu chuẩn hay được dùng là sự thuần nhất về mức xám, màu sắc đối với ảnh màu, kết cấu sợi và chuyển động

Các phương pháp phân vùng ảnh theo miền đồng nhất thường áp dụng là :

 Phương pháp tách cây tứ phân

Trang 32

 Phương pháp cục bộ

 Phương pháp tổng hợp

a) Phương pháp tách cây tứ phân

Về nguyên tắc, phương pháp này kiểm tra tính đúng đắn của tiêu chuẩn đề ra một cách tổng thể trên miền lớn của ảnh Nếu tiêu chuẩn được thỏa mãn, việc phân đoạn coi như kết thúc Trong trường hợp ngược lại, chia miền đang xét thành 4 miền nhỏ hơn Với mỗi miền nhỏ, áp dụng một cách đệ quy phương pháp trên cho đến khi tất cả các miền đều thỏa mãn điều kiện

Phương pháp này có thể mô tả như sau :

Procedure PhanDoan(Mien)

Begin

If miền đang xét không thỏa Then

Begin

Chia miền đang xét thành 4 miền : Z 1 , Z 2 , Z 3 , Z 4

For i=1 to 4 do PhanDoan (Z i )

Trang 33

Thuật toán kiểm tra tiêu chuẩn dựa vào độ chênh lệch max, min được viết:

If I[i,j] < Min Then Min=I[i,j] ;

If I[i,j] < Max Then Max=I[i,j] ;

3 If ABS(Max–Min)<T Then Examin_Criteria=0

Else Examin_Criteria=1 ;

End

Nếu hàm trả về giá trị 0, có nghĩa vùng đang xét là đồng nhất, nếu không thì không đồng nhất Trong giải thuật trên, khi miền là đồng nhất cần tính lại giá trị trung bình và cập nhật lại ảnh đầu ra Giá trị trung bình được tính bởi :

Tổng giá trị mức xám / tổng số điểm ảnh trong vùng

Thuật toán này tạo nên một cây mà mỗi nút cha có 4 nút con ở mọi mức trừ mức ngoài cùng Vì thế, cây này có tên là cây tứ phân Cây cho ta hình ảnh rõ nét về cấu trúc phân cấp của các vùng tương ứng với tiêu chuẩn

Một vùng thỏa mãn điều kiện sẽ tạo nên một nút lá; nếu không nó sẽ tạo nên một nút trong và có 4 nút con tương ứng Tiếp tục như vậy cho đến khi phân chia xong để đạt các vùng đồng nhất

Trang 34

b) Phân vùng ảnh dựa vào phát triển vùng cục bộ

Ý tưởng của phương pháp là xét ảnh từ các miền nhỏ nhất rồi nối chúng lại nếu thỏa mãn tiêu chuẩn để được một miền đồng nhất lớn hơn Tiếp tục với các miền thu được cho đến khi không thể nối thêm được nữa Số miền còn lại cho ta kết quả phân đoạn Như vậy, miền nhỏ nhất của bước xuất phát là điểm ảnh Phương pháp này hoàn toàn ngược với phương pháp tách Song điều quan trọng ở đây là nguyên lý nối 2 vùng Việc nối 2 vùng được thực hiện theo nguyên tắc sau :

- Hai vùng phải đáp ứng tiêu chuẩn, thí dụ như cùng màu hay cùng mức xám

- Hai vùng phải kế cận nhau

Khái niệm kế cận: trong xử lý ảnh, người ta dùng khái niệm liên thông để xác định tính chất kế cận Có hai khái niệm về liên thông là 4 liên thông và 8 liên thông Với 4 liên thông một điểm ảnh I(x,y) sẽ có 4 kế cận theo 2 hướng x và y ; trong khi đó với 8 liên thông, điểm I(x,y) sẽ có 4 liên thông theo 2 hướng x, y và 4 liên thông khác theo hướng chéo 450

(a) 4 liên thông (b) 8 liên thông

Hình 1.5 Khái niệm 4 liên thông và 8 liên thông

Dựa theo nguyên lý của phương pháp nối, ta có 2 thuật toán :

- Thuật toán tô màu (Blob Coloring) : sử dụng khái niệm 4 liên thông, dùng một cửa sổ di chuyển trên ảnh để so sánh với tiêu chuẩn nối

- Thuật toán đệ quy cực bộ: sử dụng phương pháp tìm kiếm trong một cây để làm tăng kích thước vùng

Trang 35

c) Phương pháp phân vùng dựa trên hợp và tách vùng

Hai phương pháp nối (hợp) và tách đều có nhược điểm Phương pháp tách sẽ tạo nên một cấu trúc phân cấp và thiết lập mối quan hệ giữa các vùng Tuy nhiên,

nó thực hiện việc chia quá chi tiết Phương pháp hợp cho phép làm giảm số miền liên thông xuống tối thiểu, nhưng cấu trúc hàng ngang dàn trải, không cho ta thấy rõ mối liên hệ giữa các miền Vì nhược điểm này, người ta nghĩ đến phối hợp cả 2 phương pháp Trước tiên, dùng phương pháp tách để tạo nên cây tứ phân, phân đoạn theo hướng từ gốc đến lá Tiếp theo, tiến hành duyệt cây theo chiều ngược lại và hợp các vùng có cùng tiêu chuẩn Với phương pháp này ta thu được một cấu trúc ảnh với các miền liên thông có kích thước tối đa Giải thuật tách hợp gồm một số bước chính sau:

1 Kiểm tra tiêu chuẩn đồng nhất

 Nếu không thỏa mãn tiêu chuẩn đồng nhất và số điểm trong một vùng nhiều hơn 1, tách vùng ảnh làm 4 miền (trên, dưới, phải, trái) bằng cách

đệ quy Nếu kết quả tách xong và không tách được nữa chuyển sang bước

 Nếu tiêu chuẩn đồng nhất thỏa mãn thì tiến hành hợp vùng và cập nhật lại giá trị trung bình của vùng cho vùng này

2 Hợp vùng

Kiểm tra 4 lân cận như đã nêu trên Có thể có nhiều vùng thỏa mãn Khi

đó, chọn vùng tối ưu nhất rồi tiến hành hợp

1.2.2.3 Phân vùng ảnh dựa trên phân tích kết cấu

Kết cấu thường được nhận biết trên bề mặt của các đối tượng như gỗ, cát, vải vóc…Kết cấu là thuật ngữ phản ánh sự lặp lại của các phần tử mẫu kết cấu cơ bản

Sự lặp lại này có thể ngẫu nhiên hay có tính chu kì hoặc gần chu kì Một mẫu kết cấu chứa rất nhiều điểm ảnh Trong phân tích ảnh, kết cấu được chia làm hai loại chính là: loại thống kê và loại cấu trúc

Trang 36

a) Phương pháp thống kế

Tính kết cấu ngẫu nhiên rất phù hợp với các đặc trưng thống kê Vì vậy, người

ta có thể dùng các đặc trưng ngẫu nhiên để đo nó như: Hàm tự tương quan (AutoCorrelation Function- ACF), các biến đổi mật độ gờ, ma trận tương tranh,… Theo cách tiếp cận bằng hàm tự tương quan, độ thô của kết cấu sợi tỉ lệ với độ rộng của ACF, được biểu diễn bởi khoảng cách x0, y0 sao cho r(x0,0) = r(0,y0) = 1 Người

ta cũng dùng cách đo nhánh của ACF nhờ hàm khởi sinh moment:

𝑀 𝑘, 𝑙 = 𝑛 − 𝜇1 𝑘 𝑚 − 𝜇2 𝑟 𝑛, 𝑚

𝑚 𝑛

𝑣ớ𝑖 𝜇1 = 𝑛 𝑟 𝑛, 𝑚 𝑣à 𝜇𝑛 2 = 𝑚 𝑟 𝑛, 𝑚 𝑛

Các đặc trưng của kết cấu sợi như độ thô, độ mịn hay hướng có thể ước lượng nhờ các biến đổi ảnh bằng kỹ thuật lọc tuyến tính Một mô hình đơn giản trong trường hợp ngẫu nhiên cho việc phân tích tính kết cấu được mô tả trong hình dưới đây:

Hình 1.6 Phân tích kết cấu bằng dải tương quan

Trong mô hình này, trường kết cấu sợi trước tiên được giải chập bởi bộ lọc lấy từ đầu ra của ACF Như vậy, nếu r(m,n) là ACF thì u(n, m)  a(n, m) = ε(n, m)

là trường ngẫu nhiên không tương quan

Lưu ý rằng, bộ lọc là không duy nhất, có thể là nhân quả, bán nhân quả hay không nhân quả Các ACF hay dùng như M(0, 2), M(2, 0), M(1, 1), M(2, 2)

Các đặc trưng của lược đồ bậc một của ε(n, m) chẳng hạn như trung bình m1, độ

Trang 37

phân tán 𝜇2 cũng hay được sử dụng Ngoài các đặc trưng trên, có thể đưa thêm một số khái niệm và định nghĩa các đại lượng dựa trên đó như: lược đồ mức xám (Histogram Grey Level Difference), ma trận xuất hiện mức xám

Lược đồ hiệu mức xám

Lược đồ hiệu mức xám dùng để mô tả các thông tin mang tính không gian và

được định nghĩa như sau Cho d = (d 1 , d 2 ) là vecto dịch chuyển giữa 2 điểm ảnh và

g(d) là hiệu mức xám với khoảng cách d: g(d) = |f(k,l) – f(k+d 1 , l+d 2 )| với hàm f(k,

l) cho giá trị mức xám tại tọa độ (k, l) Gọi hg(g, d) là lược đồ của hiệu mức xám khoảng cách d Với mỗi khoảng cách d ta có một lược đồ mức xám riêng Với một miền ảnh có kết cấu thô, lược đồ hg(g, d) có khuynh hướng tập trung xung quanh g=0 với khoảng cách d nhỏ Trái lại, với một miền ảnh có kết cấu mịn, hg(g, d) sẽ phân nhánh dù với vecto dịch chuyển d khá nhỏ Dựa trên lược đồ này, người ta định nghĩa lại một số đại lượng :

là mômen của lược đồ hg(g, d) xung quanh g = 0 và đo độ tương phản của hiệu mức xám Người ta sử dụng entropy để đo độ đồng nhất cảu lược đồ hg:

𝐻𝑔 = − ℎ𝑔(𝑔𝑘, 𝑑)ln⁡(ℎ𝑔

𝑁

𝑘=1

(𝑔𝑘, 𝑑))

Ưu điểm cơ bản của lược đồ hiệu mức xám là tính toán đơn giản Ngoài ra còn

có khả năng cho ta tổ chức kết cấu không gian

Ma trận xuất hiện liên hiệp mức xám

Giả sử P(k, l, d) là xác suất liên hiệp của hai điểm ảnh f k và f 1 với các mức xám

Trang 38

k,l tương ứng cách nhau một khoảng d Xác suất này dễ dàng tính được nhờ việc

tính số lần xuất hiện n k,l của cặp điểm ảnh (f k , f 1 ) có mức xám k và l với khoảng cách

d Gọi n là tổng số cặp liên hiệp có thể với khoảng cách d trong ảnh Các phần tử c k,l của ma trận xuất hiện liên hiệp mức xám c d được tính như sau : c d = (c k,l ) và

c k,l =P(k,l,d)=n k,l /n Ma trận xuất hiện liên hiệp mức xám C d là ma trận vuông N x N phần tử (N là số mức xám của ảnh) Ma trận này chứa các thông tin hữu ích về tổ chức kết cấu không gian Nếu kết cấu tương đối thô thì các phần tử của ma trận tập trung xung quanh đường chéo chính Ngược lại, nếu kết cấu bề mặt mịn, giá trị các

phần tử của c d sẽ phân rải tương đối rõ Dựa trên khái niệm này người ta định nghĩa

I d cực tiểu khi các phân tử của ma trận C tập trung trên đường chéo chính vì

khoảng cách |k-l|m rất nhỏ, I d nhỏ có nghĩa là kết cấu khá thô Người ta cũng còn đưa vào một số độ đo khác như hàm tự tương quan, phổ năng lượng Để áp dụng cách tiếp cận này, cần cài đặt các giải thuật tính các đại lượng đo trên

b) Phương pháp cấu trúc

Kết cấu sợi có cấu trúc thuần nhất là những mấu kết cấu xác định, mà sự xuất hiện lặp đi lặp lại tuân theo một luật tất định hay ngẫu nhiên nào đấy Một mẫu kết cấu về thực tế là một nhóm các điểm ảnh có cùng một số tính chất bất biến lặp trên ảnh Một mẫu kết cấu cũng có định nghĩa theo mức xám, theo bề mặt hay tính đồng nhất đối với một số các tính chất như kích thước, hướng, lược đồ bậc hai (ma trận tương tranh) Với các mẫu kết cấu được phân bố ngẫu nhiên, tính kết cấu sợi tương ứng của nó được coi là yếu (Weak) ngược với qui luật phân bố tất định gọi là mạnh (Strong) Khi tính kết cấu sợi là yếu, luật phân bố có thể đo bởi:

- Mật độ gờ

Trang 39

- Các loạt dài của các mẫu kết cấu liên thông tối đa

- Mật độ cực trị tương đối; số pixel trên một đơn vị diện tích có mức xám cực trị địa phương so với các lân cận

Ngoài hai cách tiếp cận trên, người ta còn dùng cách tiếp cận khác bằng cách lấy tổ hợp 2 cách trên và gọi là kỹ thuật mosaic Mô hình này biểu diễn các quá trình học ngẫu nhiên, thí dụ như khảm ngẫu nhiên hay đều của một mặt phẳng vào các đường cong lồi sẽ làm nổi lên tính kết cấu tế bào

c) Tiếp cận theo tính kết cấu

Khi đối tượng xuất hiện trên một nền có tính kết cấu cao, việc phân đoạn dựa vào tính kết cấu trở nên quan trọng Nguyên nhân là kết cấu sợi thường chứa mật độ cao các gờ (edge) làm cho phân đoạn theo biên kém hiệu quả, trừ phi ta loại tính kết cấu Việc phân đoạn dựa vào miền đồng nhất cũng có thể áp dụng cho các đặc trưng kết cấu và có thể dùng để phân đoạn các miền có tính kết cấu

Nhìn chung, việc phân loại và phân vùng dựa vào kết cấu là một vấn đề phức tạp

Ở đây, tài liệu chỉ mang tính chất giới thiệu Có thể giải quyết vấn đề này trong thực tế nếu ta biết trước các loại kết cấu (dựa vào quy luật hay các phân bố của nó)

1.2.2.4 Phân vùng ảnh dựa trên sự phân lớp điểm ảnh

a) Mô hình bài toán:

Cho ảnh X ={p i } , i ∈ [1,N.M] , với N là chiều rộng của ảnh và M là chiều cao

của ảnh, p i là điểm ảnh thứ i và A(p i ) là thuộc tính của p i Đối tượng phân lớp ở

đây là các p i

Phân vùng ảnh X chính là phân lớp tập X thành các lớp Ci sao cho từ Ci phát triển thành các vùng Ri Chỉ tiêu phân lớp ở đây chính là độ đồng đều (tương tự) về thuộc tính của các điểm ảnh

Trang 40

Quá trình phân lớp có thể sử dụng các phương pháp học máy và quyết định phân lớp

b) Phân lớp điểm ảnh trong không gian thuộc tính một chiều

Trong phần này sẽ giới thiệu một thuật toán vùng dựa trên sự phân lớp các

điểm ảnh trên nguyên tắc phân tích tự tổ chức theo nguyên tắc lặp (ISODATA –

Interactive Seft Organization DATa Analysis)

Thuật toán ISODATA trong phân vùng ảnh:

Đầu vào: X={p i }, i[1,N.M], A(p i ) là gia trị mức xám của p i

 Chọn các giá trị ngưỡng ban đầu của các lớp theo nguyên tắc sau:

T 0 =l min , T K =l max và T i (t)= 𝑖.𝑙𝑚𝑎𝑥 −𝑙𝑚𝑖𝑛

𝐾 + 𝑇0 , với i=1…K-1

2 Bước lặp

 Thực hiện phân lớp điểm theo các ngưỡng Ti(t-1)

P iC k nếu T i (t-1) ≤ A(p i )≤T i+1 (t-l),k[l,K]

 Tính giá trị trung bình của mỗi lớp tại thời điểm t

Định dạng
Số trang	80
Dung lượng	1,51 MB