1. Trang chủ
  2. » Luận Văn - Báo Cáo

Luận văn thạc sĩ công nghệ thông tin Phân tích một số phương pháp phân đoạn ảnh có giám sát

80 695 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 80
Dung lượng 1,51 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Trong hầu hết các ứng dụng của lĩnh vực xử lý ảnh, thị giác máy tính, phân đoạn ảnh luôn đóng một vai trò cơ bản và thường là bước tiền xử lý đầu tiên trong toàn bộ quá trình trước

Trang 1

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC LẠC HỒNG

* * *

Nguyễn Văn Thành

PHÂN TÍCH MỘT SỐ PHƯƠNG PHÁP PHÂN ĐOẠN ẢNH CÓ GIÁM SÁT

Luận văn thạc sĩ Công nghệ thông tin

Đồng Nai – 2013

Trang 2

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC LẠC HỒNG

* * *

Nguyễn Văn Thành

PHÂN TÍCH MỘT SỐ PHƯƠNG PHÁP PHÂN ĐOẠN ẢNH CÓ GIÁM SÁT

Chuyên ngành : Công Nghệ Thông Tin

Luận văn thạc sĩ Công nghệ thông tin

NGƯỜI HƯỚNG DẪN KHOA HỌC : PGS.TS NGÔ QUỐC TẠO

Đồng Nai – 2013

Trang 3

LỜI CẢM ƠN

Trong quá trình làm luận văn vừa qua, được sự giúp đỡ và chỉ bảo nhiệt tình của PGS TS Ngô Quốc Tạo – Viện Công nghệ Thông tin – Viện khoa học Việt Nam, luận văn của em đã được hoàn thành Măc dù đã cố gắng cùng với sự tận tâm của thầy h ướng dẫn song do th ời gian và khả năng vẫn cò n nhiều hạn chế nên luận văn không tránh khỏi những thiếu sót

Em xin bày tỏ lò ng biết ơn sâu sắc t ới thầy PGS TS Ngô Quốc Tạo đã tận tình hướng dẫn, chỉ bảo và dành rất nhiều thời gian quí báu của thầy cho em trong thời gian qua, đã giúp em hoàn thành bài luận văn đúng thời hạn

Em xin gửi lời cảm ơn đến Ban Giám hiệu, các Thầy cô giáo của Trường Đại học Lạc Hồng, các Thầy cô bộ môn, đã giảng dạy cung cấp, trang bị cho chúng em những kiến thức chuyên ngành, chuyên môn chuyên sâu trong suốt hai năm qua Xin cảm ơn gia đình và bạn bè đã động viên cổ vũ em trong suốt quá trình học tập cũng như thời gian làm luận văn, đã giúp em hoàn thành khóa học, luận văn theo qui định

Trang 4

LỜI CAM ĐOAN

Tôi xin cam đoan luận văn là kết quả nghiên cứu của tôi, không sao chép của

ai Nội dung luận văn có tham khảo và sử dụng các tài liệu liên quan, các thông tin trong tài liệu được đăng tải trên các tạp chí và các trang website theo danh mục tài

liệu của luận văn

Tác giả luận văn

Nguyễn Văn Thành

Trang 5

MỤC LỤC

DANH MỤC CÁC THUẬT NGỮ, CÁC TỪ VIẾT TẮT i

CÁC THUẬT NGỮ i

CÁC TỪ VIẾT TẮT ii

DANH MỤC CÁC BẢNG iii

DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ iv

MỞ ĐẦU 1

CHƯƠNG 1: TỔNG QUAN VỀ XỬ LÝ ẢNH, PHÂN ĐOẠN ẢNH 3

1.1 Tổng quan về xử lý ảnh 3

1.1.1 Một số khái niệm cơ bản về xử lý ảnh 3

1.1.1.1 Xử lý ảnh là gì ? 3

1.1.1.2 Phần tử ảnh (Pixel - Picture Element) 3

1.1.1.3 Mức xám của ảnh 4

1.1.1.4 Độ phân giải của ảnh 5

1.1.2 Các giai đoạn cơ bản trong xử lý ảnh 6

1.1.2.1 Biểu diễn ảnh 6

1.1.2.2 Tăng cường, nâng cao chất lượng ảnh 7

1.1.2.3 Khôi phục ảnh 7

1.1.2.4 Biến đổi ảnh 8

1.1.2.5 Phân tích ảnh 8

1.1.2.6 Nhận dạng ảnh 9

1.1.2.7 Nén ảnh 11

1.1.3 Các ứng dụng của xử lý ảnh 12

1.1.4 Quan hệ cơ bản giữa các điểm ảnh 13

1.2 Tổng quan về phân đoạn ảnh 16

Trang 6

1.2.1 Giới thiệu 16

1.2.2 Các phương pháp tiếp cận 17

1.2.2.1 Phân vùng ảnh theo ngưỡng biên độ 19

1.2.2.2 Phân vùng theo miền đồng nhất 20

1.2.2.3 Phân vùng ảnh dựa trên phân tích kết cấu 24

1.2.2.4 Phân vùng ảnh dựa trên sự phân lớp điểm ảnh 28

1.2.2.5 Phân vùng dựa vào lý thuyết đồ thị 30

1.2.2.6 Phân vùng ảnh dựa trên biểu diễn và xử lý đa phân giải 35

CHƯƠNG 2: MỘT SỐ KỸ THUẬT PHÂN ĐOẠN ẢNH CÓ GIÁM SÁT 37

2.1 Giới thiệu về phân đoạn ảnh có giám sát 37

2.2 Phân đoạn ảnh sử dụng grabcut 38

2.2.1 Phân đoạn theo năng lượng cực tiểu hóa 39

2.2.2 Giải thuật phân đoạn GrabCut 41

2.2.2.1 Mô hình dữ liệu màu 41

2.2.2.2 Phân đoạn theo lặp lại cực tiểu năng lượng 42

2.2.2.3.Tương tác người sử dụng và trimap không đầy đủ 44

2.3 Phân đoạn ảnh sử dụng Random Walks 45

2.3.1 Trọng số cạnh 46

2.3.2.Vấn đề Dirichlet Tổ hợp 46

2.3.3.Mạch tương tự 48

2.3.4.Mối quan hệ để khuếch tán 49

2.4.Phân đoạn ảnh sử dụng Random Walks with Restart 50

2.4.1.Phương pháp phân đoạn ảnh dựa trên RWR 54

2.4.1.1.Xây dựng đồ thị trọng số cho hình ảnh 55

2.4.1.2.Tính xác suất 56

Trang 7

2.4.1.3.Gán nhãn để phân đoạn ảnh 58

2.4.2.Độ phức tạp thuật toán 59

CHƯƠNG 3: CÀI ĐẶT THỬ NGHIỆM 61

3.1.Môi trường cài đặt 61

3.2.Chương trình thực nghiệm phân đoạn ảnh sử dụng RWR 61

3.2.1.Thiết lập thông số 61

3.2.2.Kết quả phân đoạn RWR B_LIN với c=10-4 63

3.2.3.Một số so sánh 64

3.2.3.1.Vấn đề biên ảnh yếu 64

3.2.3.2.Vấn đề kết cấu 65

3.2.3.3.Định lượng so sánh 66

3.3.Kết luận và kiến nghị 68

TÀI LIỆU THAM KHẢO

Trang 8

DANH MỤC CÁC THUẬT NGỮ, CÁC TỪ VIẾT TẮT CÁC THUẬT NGỮ

Random Walk With Return Bước đi ngẫu nhiên với quay lại

Trang 9

CÁC TỪ VIẾT TẮT

Trang 10

DANH MỤC CÁC BẢNG

Trang 11

DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ

Hình 1.1 Quá trình xử lý ảnh 3

Hình 1.2 Lân cận các điểm ảnh của tọa độ (x,y) 14

Hình 1.3 Một ví dụ về phân vùng ảnh 17

Hình 1.4 Minh họa cách chọn ngưỡng 20

Hình 1.5 Khái niệm 4 liên thông và 8 liên thông 23

Hình 1.6 Phân tích kết cấu bằng dải tương quan 25

Hình 1.7 Biểu diễn ảnh dưới dạng một đồ thị 31

Hình 1.8 Minh họa cây bao trùm tối thiểu của một đồ thị 32

Hình 2.1 Một số ví dụ của Grabcut 41

Hình 2.2 Phân đoạn ảnh Lặp đi lặp lại ở GrabCut 44

Hình 2 3 Sự Quy tụ cực tiểu hóa lặp đi lặp lại 44

Hình 2.4 Người dùng hiệu chỉnh 45

Hình 2.5 Kết quả phân đoạn 58

Hình 2.6 So sánh độ phức tạp thuật toán 60

Hình 3.1 Sự thay đổi xác suất trạng thái ổn định r 62

Hình 3.2 Phân đoạn đối với sự biết đổi của các xác suất khởi động lại c trong ảnh tự nhiên 62

Hình 3.3 So sánh thuật toán GC, RW, RWR cho ảnh có đường biên yếu 65

Hình 3 4 So sánh phân đoạn cho ảnh có kết cấu yếu giữa các thuật toán GC, RW, RWR 66

Hình 3.5 So sánh thuật toán GC, RW, RWR trên ảnh tự nhiên 67

Trang 12

MỞ ĐẦU

Xử lý ảnh (Image Processing) là một trong những mảng quan trọng nhất trong kỹ thuật thị giác máy tính Xử lý ảnh được ứng dụng trong nhiều lĩnh khác nhau như y học, an ninh, quốc phòng

Phân đoạn ảnh là một thao tác ở mức thấp trong toàn bộ quá trình xử lý ảnh Phân đoạn ảnh có vai trò quan trọng trong việc chiết xuất thông tin từ những hình ảnh và việc khai thác các thông tin hữu ích và các thuộc tính từ hình ảnh Nếu bước phân đoạn ảnh không tốt thì dẫn đến việc nhận diện sai lầm về các đối tượng có trong ảnh

Trong hầu hết các ứng dụng của lĩnh vực xử lý ảnh, thị giác máy tính, phân đoạn ảnh luôn đóng một vai trò cơ bản và thường là bước tiền xử lý đầu tiên trong toàn bộ quá trình trước khi thực hiện các thao tác khác ở mức cao hơn như nhận dạng đối tượng, biểu diễn đối tượng, nén ảnh dựa trên đối tượng, hay truy vấn ảnh dựa vào nội dung

Hiện nay đã có nhiều thuật toán được đề xuất để giải quyết bài toán phân đoạn ảnh Các thuật toán trên hầu hết đều dựa vào hai thuộc tính quan trọng của mỗi điểm ảnh so với các điểm lân cận của nó, đó là: sự khác (dissimilarity) và giống nhau (similarity) Các phương pháp dựa trên sự khác nhau của các điểm ảnh được gọi là các phương pháp biên (boundary-based methods), còn các phương pháp dựa trên sự giống nhau của các điểm ảnh được gọi là phương pháp miền (region-based methods)

Tuy nhiên, các thuật toán theo cả hai hướng này đều vẫn chưa cho kết quả phân đoạn tốt, vì cả hai loại phương pháp này đều chỉ nắm bắt được các thuộc tính cục bộ (local) của ảnh Do đó, việc tìm ra các thuật toán nắm bắt được các thuộc tính toàn cục (global) của bức ảnh đã trở thành một xu hướng

Chương 1 của luận văn trình bày tổng quan về xử lý ảnh, các hướng tiếp cận chính trong phân đoạn ảnh

Trong chương 2, luận văn tập trung tìm hiểu và trình bày một số phương pháp phân đoạn ảnh có giám sát như Random Walker (RW), Graph cuts (GC),

Trang 13

Random Walker Restart (RWR) – chỉ ra phương pháp được đánh giá là hiệu quả hơn các phương pháp phân đoạn ảnh trước đây, khắc phục được hai khó khăn quan trọng trong ảnh tự nhiên là bài toán đường biên yếu và kết cấu yếu

Phương pháp RWR dựa vào việc coi một bức ảnh như một đồ thị có trọng số Sau khi tính xác suất trạng thái ổn định của mỗi điểm ảnh bằng cách sử dụng kỹ thuật phân đoạn ảnh chúng ta có thể ước lượng khả năng phân tách và cuối cùng gán nhãn vào mỗi điểm ảnh

Chương 3 phân tích kết quả thực nghiệm phân đoạn ảnh RWR với các ảnh tự

nhiên có đường biên yếu và kết cấu yếu

Trang 14

CHƯƠNG 1: TỔNG QUAN VỀ XỬ LÝ ẢNH, PHÂN ĐOẠN ẢNH

Quá trình xử lý ảnh được xem như là quá trình thao tác ảnh đầu vào nhằm cho ra kết quả mong muốn Kết quả đầu ra của một quá trình xử lý ảnh có thể là một ảnh “tốt hơn” hoặc một kết luận

Hình 1.1 Quá trình xử lý ảnh

Ảnh có thể xem là tập hợp các điểm ảnh và mỗi điểm ảnh được xem như là đặc trưng cường độ sáng hay một dấu hiệu nào đó tại một vị trí nào đó của đối tượng trong không gian và nó có thể xem như một hàm n biến P(c1, c2, , cn) Do

đó, ảnh trong xử lý ảnh có thể xem như ảnh n chiều

1.1.1.2 Phần tử ảnh (Pixel - Picture Element)

Ảnh trong thực tế là một ảnh liên tục về không gian và về giá trị độ sáng Để

có thể xử lý ảnh bằng máy tính thì cần thiết phải tiến hành số hóa ảnh Trong quá trình số hóa, người ta biến đổi tín hiệu liên tục sang tín hiệu rời rạc thông qua quá trình lấy mẫu (rời rạc hoá về không gian) và lượng hoá thành phần giá trị (rời rạc hoá biên độ giá trị) mà bằng mắt thường ta khó phân biệt được hai mức xám kề

Ảnh

“Tốt hơn”

Kết luận

Trang 15

nhau Trong trường hợp này, người ta sử dụng khái niệm phần tử ảnh hay là điểm ảnh (Picture Element - Pixel) Trong khuôn khổ ảnh hai chiều Mỗi điểm ảnh gồm

có một cặp toạ độ (x,y) và giá trị biểu diễn độ sáng (cấp xám) cụ thể Các cặp tọa độ (x, y) tạo nên độ phân giải (resolution) Chẳng hạn như màn hình máy tính có độ phân giải là 480×640 nghĩa là trên màn hình có 480×640 điểm ảnh (x, y), chiều rộng 80 điểm ảnh, chiều dài 640 điểm ảnh

Điểm ảnh (pixel) là một phần tử của ảnh số tại tọa độ (x,y) với độ xám hoặc màu nhất định

Điểm ảnh được xem như là dấu hiệu hay cường độ sáng tại 1 toạ độ trong không gian của đối tượng và ảnh được xem như là 1 tập hợp các điểm ảnh Kích thước và khoảng cách giữa các điểm ảnh đó được chọn thích hợp sao cho mắt người cảm nhận sự liên tục về không gian và mức xám (hoặc màu) của ảnh số gần như thật Mỗi phần tử trong ma trận được gọi là một phần tử ảnh

Ta cần phân biệt Pixel (phần tử ảnh) với khái niệm pixel hay đề cập đến trong hệ thống đồ hoạ máy tính

1.1.1.3 Mức xám của ảnh

Mức xám (gray-level) là kết quả của sự mã hoá tương ứng một cường độ sáng của mỗi điểm ảnh với một giá trị số của quá trình lượng hoá Là số các giá trị có thể có của các điểm ảnh của ảnh Một điểm ảnh (pixel) có hai đặc trưng cơ bản là vị trí (x, y) của điểm ảnh và độ xám của nó Dưới đây chúng ta xem xét một số khái

niệm và thuật ngữ thường dùng trong xử lý ảnh

Trang 16

Lý do: từ kỹ thuật máy tính dùng 1 byte (8 bit) để biểu diễn mức xám: Mức xám dùng 1 byte biểu diễn: 28=256 mức, tức là từ 0 đến 255)

mỗi pixel sẽ được mã hóa bởi 8 bit

1.1.1.4 Độ phân giải của ảnh

Định nghĩa: Độ phân giải (Resolution) của ảnh là mật độ điểm ảnh được ấn

định trên một ảnh số được hiển thị

Theo định nghĩa, khoảng cách giữa các điểm ảnh phải được chọn sao cho mắt người vẫn thấy được sự liên tục của ảnh Việc lựa chọn khoảng cách thích hợp tạo nên một mật độ phân bổ, đó chính là độ phân giải và được phân bố theo trục x

và y trong không gian hai chiều

Ví dụ: Độ phân giải của ảnh trên màn hình CGA (Color Graphic Adaptor) là

một lưới điểm theo chiều ngang màn hình: 320 điểm chiều dọc * 200 điểm ảnh (320*200) Rõ ràng, cùng màn hình CGA 12” ta nhận thấy mịn hơn màn hình CGA

Trang 17

17” độ phân giải 320*200 Lý do: cùng một mật độ (độ phân giải) nhưng diện tích màn hình rộng hơn thì độ mịn (liên tục của các điểm) kém hơn

1.1.2 Các giai đoạn cơ bản trong xử lý ảnh

1.1.2.1 Biểu diễn ảnh

Trong biểu diễn ảnh người ta thường dùng các phần tử đặc trưng của ảnh là pixel Nhìn chung có thể xem một hàm hai biến f(x,y) chứa các thông tin như là biểu diễn của một ảnh Các mô hình biểu diễn ảnh cho ta một mô tả logic hay định lượng các tính chất của hàm này Một số mô hình thường được dùng trong biểu diễn ảnh: mô hình toán, mô hình thống kê Trong mô hình toán, ảnh hai chiều được biểu diễn nhờ các hàm hai biến trực giao gọi là các hàm cơ sở Với mô hình thống kê, một ảnh được coi như là một phần tử của một tập hợp đặc trưng bởi các đại lượng

như: kỳ vọng, hiệp biến, phương sai, moment

Đây là một bước quan trọng, tạo tiền đề cho xử lý ảnh Mục đích chính nhằm làm nổi bật một số đặc tính của ảnh như thay đổi độ tương phản, lọc nhiễu, nổi biên, làm trơn biên, khuyếch đại ảnh nhằm phục vụ cho việc hiển thị hoặc các quá trình phân tích tiếp theo Tùy theo các ứng dụng khác nhau mà chúng ta có các kỹ thuật nâng cao chất lượng ảnh khác nhau

Nâng cao chất lượng ảnh có quan hệ gần gũi với khôi phục ảnh Khi một ảnh

bị nhiễu thì khôi phục ảnh gốc thường đưa đến nâng cao chất lượng ảnh Có một số khác biệt giữa khôi phục ảnh và nâng cao chất lượng ảnh Trong khôi phục ảnh, một ảnh gốc bị nhiễu thì mục tiêu là làm sao cho ảnh sau khi xử lý càng gần giống ảnh gốc càng tốt Còn trong nâng cao chất lượng ảnh thì mục tiêu là làm cho ảnh sau khi

xử lý có được chất lượng tốt hơn khi chưa xử lý Như vậy một ảnh không bị nhiễu thì không thể được xử lý bằng các kỹ thuật khôi phục ảnh nhưng ảnh đó có thể được

xử lý bằng các kỹ thuật nâng cao chất lượng ảnh Nhưng một ảnh bị nhiễu thì nó có thể được xử lý vừa bằng các kỹ thuật khôi phục ảnh vừa bằng các kỹ thuật nâng cao chất lượng ảnh

Trang 18

1.1.2.2 Tăng cường, nâng cao chất lượng ảnh

Đây là một bước quan trọng, tạo tiền đề cho xử lý ảnh

Mục đích chính nhằm làm nổi bật một số đặc tính của ảnh như thay đổi độ tương phản, lọc nhiễu, nổi biên, làm trơn biên, khuyếch đại ảnh nhằm phục vụ cho việc hiển thị hoặc các quá trình phân tích tiếp theo Tùy theo các ứng dụng khác nhau mà chúng ta có các kỹ thuật nâng cao chất lượng ảnh khác nhau

Nâng cao chất lượng ảnh có quan hệ gần gũi với khôi phục ảnh Khi một ảnh

bị nhiễu thì khôi phục ảnh gốc thường đưa đến nâng cao chất lượng ảnh Có một số khác biệt giữa khôi phục ảnh và nâng cao chất lượng ảnh Trong khôi phục ảnh, một ảnh gốc bị nhiễu thì mục tiêu là làm sao cho ảnh sau khi xử lý càng gần giống ảnh gốc càng tốt Còn trong nâng cao chất lượng ảnh thì mục tiêu là làm cho ảnh sau khi

xử lý có được chất lượng tốt hơn khi chưa xử lý Như vậy một ảnh không bị nhiễu thì không thể được xử lý bằng các kỹ thuật khôi phục ảnh nhưng ảnh đó có thể được

xử lý bằng các kỹ thuật nâng cao chất lượng ảnh Nhưng một ảnh bị nhiễu thì nó có thể được xử lý vừa bằng các kỹ thuật khôi phục ảnh vừa bằng các kỹ thuật nâng cao chất lượng ảnh

1.1.2.3 Khôi phục ảnh

Khôi phục ảnh là quá trình loại bỏ hay tối thiểu hoá các ảnh hưởng của môi trường bên ngoài hoặc do các hệ thống thu nhận ảnh gây ra Về nguyên tắc, khôi phục ảnh nhằm xác định mô hình toán học của quá trình đã gây ra biến dạng, tiếp theo là dùng ánh xạ ngược để xác định lại ảnh

Bất kỳ một ảnh nào được thu bằng các thiết bị điện, quang điện hay quang học thường bị nhiễu bởi môi trường cảm biến của các thiết bị đó Các loại nhiễu có thể là nhiễu hệ thống, bị mờ do lệch tiêu điểm camera, nhiễu ngẫu nhiên do chuyển động giữa camera và đối tượng được chụp, nhiễu do khí quyển…

Khôi phục ảnh là dùng các bộ lọc để lọc các ảnh bị nhiễu nhằm giảm tối thiểu sự ảnh hưởng của các loại nhiễu này để cho ra ảnh kết quả càng gần giống ảnh gốc càng tốt Hiệu quả của các bộ lọc khôi phục ảnh phụ thuộc vào sự nhận biết về

Trang 19

quá trình nhiễu cùng với quá trình thu nhận ảnh Khôi phục ảnh thường được xử lý trên miền tần số là chủ yếu Bao gồm các kỹ thuật lọc ngược, lọc bình phương tối thiểu (Wiener)

1.1.2.4 Biến đổi ảnh

Biến đổi ảnh là việc sử dụng một lớp các ma trận đơn vị và các kỹ thuật thường dùng để biến đổi ảnh như: Biến đổi Fourier, Sin, Cosin, tích Kronecker, biến đổi Karhumen Loeve…

1.1.2.5 Phân tích ảnh

Là khâu quan trọng trong quá trình xử lý ảnh để tiến tới hiểu ảnh Trong phân tích ảnh việc trích chọn đặc điểm là một bước quan trọng Các đặc điểm của đối tượng được trích chọn tuỳ theo mục đích nhận dạng trong quá trình xử lý ảnh

Có thể nêu ra một số đặc điểm của ảnh sau đây:

Đặc điểm không gian: Phân bố mức xám, phân bố xác suất, biên độ, điểm

uốn…

Đặc điểm biến đổi: Các đặc điểm loại này được trích chọn bằng việc thực

hiện lọc vùng (zonal filtering) Các bộ vùng được gọi là “mặt nạ đặc điểm” (feature mask) thường là các khe hẹp với hình dạng khác nhau (chữ nhật, tam giác, cung tròn )

Đặc điểm biên và đường biên: Đặc trưng cho đường biên của đối tượng và

do vậy rất hữu ích trong việc trích trọn các thuộc tính bất biến được dùng khi nhận dạng đối tượng Các đặc điểm này có thể được trích chọn nhờ toán tử gradient, toán

tử la bàn, toán tử Laplace, toán tử “chéo không” (zero crossing) v.v

Việc trích chọn hiệu quả các đặc điểm giúp cho việc nhận dạng các đối tượng ảnh chính xác, với tốc độ tính toán cao và dung lượng nhớ lưu trữ giảm xuống

Phân tích ảnh là quá trình suy luận, tính toán dựa vào các đặc tính thể hiện trên hình ảnh để từ đó rút ra được các thông tin định lượng về hình ảnh

Trang 20

Phân tích ảnh có thể tách biệt các vật thể trên ảnh, đo lường, phân loại, mô

tả, so sánh chúng

Mặt khác, từ việc phân tích ảnh cũng có thể suy ra các số liệu thống kê về hình ảnh Liên quan đến việc xác định các độ đo định lượng của một ảnh để đưa ra một mô tả đầy đủ về ảnh Có nhiều kỹ thuật khác nhau hỗ trợ phân tích ảnh như: các

kỹ thuật lọc,các kỹ thuật tách, hợp dựa trên các tiêu chuẩn đánh giá về màu sắc, cường độ, kết cấu… và các kỹ thuật phân lớp dựa theo cấu trúc Phân vùng ảnh là một hướng riêng của phân tích ảnh Phân vùng ảnh bao gồm các kỹ thuật phân tách các vùng của ảnh thành những vùng có những nét đặc trưng của nó hoặc tách biệt hoàn toàn giữa các vùng ảnh này với các vùng ảnh khác trên ảnh và nền Mục đích

là giúp cho dễ quan sát và dễ xử lý và hỗ trợ cho các giai đoạn tiếp theo của hệ thống xử lý ảnh

1.1.2.6 Nhận dạng ảnh

Là một khoa học nhằm trang bị phương pháp luận để trang bị cho máy tính

có khả năng nhận thức Nhận dạng tự động (automatic recognition), mô tả đối tượng, phân loại và phân nhóm các mẫu là những vấn đề quan trọng trong thị giác máy, được ứng dụng trong nhiều ngành khoa học khác nhau Các đối tượng nhận dạng là các mẫu đối tượng Tuy nhiên, một câu hỏi đặt ra là: mẫu (pattern) là gì? Watanabe, một trong những người đi đầu trong lĩnh vực này đã định nghĩa: “Ngược lại với hỗn loạn (chaos), mẫu là một thực thể (entity), được xác định một cách ang áng (vaguely defined) và có thể gán cho nó một tên gọi nào đó” Ví dụ mẫu có thể

là ảnh của vân tay, ảnh của một vật nào đó được chụp, một chữ viết, khuôn mặt người hoặc một ký đồ tín hiệu tiếng nói Khi biết một mẫu nào đó, để nhận dạng hoặc phân loại mẫu đó có thể:

Hoặc phân loại có mẫu (supervised classification), chẳng hạn phân tích phân biệt (discriminant analyis), trong đó mẫu đầu vào được định danh như một thành phần của một lớp đã xác định

Hoặc phân loại không có mẫu (unsupervised classification hay clustering) trong đó các mẫu được gán vào các lớp khác nhau dựa trên một tiêu chuẩn đồng

Trang 21

dạng nào đó Các lớp này cho đến thời điểm phân loại vẫn chưa biết hay chưa được định danh

Nhận dạng đối tượng ảnh quá trình từ không gian biểu diễn lớp đối tượng vào không gian tên gọi của đối tượng (mỗi đối tượng được gán một cái tên) Hay nói một cách khác nhận dạng đối tượng chính là quá trình tiến hành phân lớp đối tượng cần nhận dạng vào các lớp Có hai lớp phương pháp tiếp cận chính trong quá trình phân lớp các đối tượng, đó là các phương pháp phân lớp dựa vào đường ranh giới phân biệt giữa các lớp (Nơ ron network, phương pháp véc tơ tựa, boosting, trường ngẫu nhiên có điều kiện, nhận dạng dựa vào đa nhân…) và các phương pháp phân lớp dựa vào phân bố thống kế của các lớp (mô hình markov ẩn, phương pháp phân loại thống kê, Bayesian, trường marko ngẫu nhiên) Trên cơ sở các bài toán thì sẽ có các mô hình nhận dạng phù hợp và các thuật toán đi kèm các mô hình đó Ngoài ra còn một số cách tiếp cận khác trong lý thuyết nhận dạng đó là đối sánh mẫu dựa trên các đặc trưng được trích chọn, nhận dạng cấu trúc (xâu chuỗi, đồ thị, ) nhận dạng dựa trên biểu diễn ngữ pháp văn phạm

Hệ thống nhận dạng tự động bao gồm 4 khâu tương ứng với bốn giai đoạn chủ yếu sau:

1 Thu nhận dữ liệu , tiền xử lý, trích chọn đặc tính

2 Biểu diễn dữ liệu

3 Huấn luyện dữ liệu

4 Nhận dạng, ra quyết định

Trên thực tế, người ta đã áp dụng kỹ thuật nhận dạng khá thành công với nhiều bài khác nhau như: nhận dạng ảnh vân tay, nhận dạng chữ (chữ cái, chữ số, chữ có dấu) Nhận dạng chữ in hoặc đánh máy phục vụ cho việc tự động hóa quá trình đọc tài liệu, tăng nhanh tốc độ và chất lượng thu nhận thông tin từ máy tính Các bài toán và ứng dung nhận dạng rất phong phú như: Nhận dạng Khuôn mặt, nhận dạng các biểu cảm của con người, nhận dạng các cử chỉ và hoạt động của con

Trang 22

người, nhận dạng người đi bộ, xây dựng các hệ thống giám sát thông minh, rô bốt, các hệ thống dự báo dựa vào hình ảnh…

1.1.2.7 Nén ảnh

Ảnh dù ở dạng nào vẫn chiếm không gian nhớ rất lớn Khi mô tả ảnh người ta

đã đưa kỹ thuật nén ảnh vào Nén ảnh là làm giảm lượng số liệu cần để biểu diễn một ảnh Cơ sở của vấn đề nén ảnh là quá trình giảm những số liệu dư thừa Từ quan điểm toán học, đó là biến đổi một dãy pixel 2 chiều thành một tập số liệu không liên kết thống kê Sự biến đổi được áp dụng trước để lưu trữ hoặc truyền ảnh Quá trình sau nén ảnh là giải nén để tạo lại ảnh gốc hoặc một xấp xỉ của ảnh gốc Hiện nay, các chuẩn MPEG được dùng với ảnh đang phát huy hiệu quả

Nhằm giảm thiểu không gian lưu trữ Thường được tiến hành theo cả hai cách khuynh hướng là nén có bảo toàn và không bảo toàn thông tin Nén không bảo toàn thì thường có khả năng nén cao hơn nhưng khả năng phục hồi thì kém hơn Trên cơ

sở hai khuynh hướng, có 4 cách tiếp cận cơ bản trong nén ảnh:

• Nén ảnh thống kê: Kỹ thuật nén này dựa vào việc thống kê tần xuất xuất hiện của giá trị các điểm ảnh, trên cơ sở đó mà có chiến lược mã hóa thích hợp Một ví dụ điển hình cho kỹ thuật mã hóa này là *.TIF

• Nén ảnh không gian: Kỹ thuật này dựa vào vị trí không gian của các điểm ảnh

để tiến hành mã hóa Kỹ thuật lợi dụng sự giống nhau của các điểm ảnh trong các vùng gần nhau Ví dụ cho kỹ thuật này là mã nén *.PCX

• Nén ảnh sử dụng phép biến đổi: Đây là kỹ thuật tiếp cận theo hướng nén không bảo toàn và do vậy, kỹ thuật thướng nến hiệu quả hơn *.JPG chính là tiếp cận theo kỹ thuật nén này

• Nén ảnh Fractal: Sử dụng tính chất Fractal của các đối tượng ảnh, thể hiện sự lặp lại của các chi tiết Kỹ thuật nén sẽ tính toán để chỉ cần lưu trữ phần gốc ảnh và quy luật sinh ra ảnh theo nguyên lý Fractal

Trang 23

1.1.3 Các ứng dụng của xử lý ảnh

Xử lý ảnh có nhiều ứng dụng trong thực tế Một trong những ứng dụng sớm nhất là xử lý ảnh từ nhiêm vụ Ranger 7 tại phòng thí nghiệm JetPulsion vào những năm đầu của thập kỷ 60 Hệ thống chụp hình gắn trên tàu vũ trụ có một số hạn chế

về kích thước và trọng lượng, do đó ảnh nhận được bị giảm chất lượng như bị mờ, méo hình học và nhiễu nền Các ảnh đó được xử lý thành công nhờ máy tính số Hình ảnh của mặt trăng và sao hỏa mà chúng ta thấy trong tất cả các tạp chí đều được xử lý bằng những máy tính số Ngày nay, hầu hết các thông tin ảnh đều được chuyển sang dạng ảnh số Vì vậy, trong gần như tất cả các lĩnh vực của các ngành

kỹ thuật đều có ít nhiều liên quan đến ảnh số và sử dụng kỹ thuật xử lý ảnh số Ứng dụng của xử lý ảnh có khả năng tác động mạnh mẽ nhất đến cuộc sống của chúng ta

là lĩnh vực y tế Soi chụp ảnh bừng máy tính dựa rteen cơ sở định lý cắt lớp (project slice) được dùng thường xuyên trong xét nghiệm lâm sang, ví dụ phát hiện và nhận dạng u não Những ứng dụng y khoa khác của xử lý ảnh gồm cải thiện ảnh X quang

và nhận dạng đường biên mạch máu từ những ảnh chụp bằng tia X (angiograms)

Có những dụng khác gần gủi hơn với cuộc sông gia đình là cải tiến ảnh tivi Hình ảnh mà chúng ta thấy trên màn hình tivi có các khuyết tật do độ phân giải hạn chế, bi rung rinh, có ảnh ma, nhiều nền và trượt hình do đan dòng ở những mức độ khác nhau Xử lý ảnh sô có tác động quyết định đến việc cải thiện chất lượng hình ảnh của những hệ truyền hình hiện tại và làm phát triển những hệ truyền hình mới

có độ phân giải cao (HDTV) Một vấn đề nữa cúa chính truyền thông video như hội nghị video, điện thoại video là cần có dải tần rộng Việc mã hóa thẳng chương trình video chất lượng quảng bá yêu cầu đến 100 triệu bit/giây Nếu hy sinh một phần chất lượng và dùng các sơ đô mã hóa ảnh số thì có thể đưa ra thị trường những hệ truyền hình chất lượng đủ rõ với nhịp bit chỉ dưới 100 nghìn bit/giây

Người máy càng ngày đóng vai trò quan trọng trong công nghiệp và gia đinh Chúng sẽ thực hiện những công việc rất nhàm chán hoặc nguy hiểm và những công việc mà tốc độ và độ chính xác vượt quá khả năng của con người Khi người máy trở nên tinh vi hơn, thị giác máy tinh sẽ đóng vai trò ngày càng quan trọng Người ta

sẽ đòi hỏi người máy không những phát hiện và nhận dạng các bộ phận công

Trang 24

nghiệp, mà còn “hiểu” được những gì chúng “thấy” và đưa ra những hành động phù hợp Xử lý ảnh số có tác động rất lớn đến thị giác máy tính

Ngoài những lĩnh vực ứng dụng mọi người thường biết đến, xử lý ảnh số còn

có một số ứng dụng khác ít được nói đến hơn Người thi hành pháp luật thương chụp hình trong những môi trường không thuận lợi, và ảnh nhận được thường bị xuống cấp Ví dụ, bức ảnh chụp thường bị nhòe, việc làm giảm độ nhòe là cần thiết trong nhận dạng

Những ứng dụng của xử lý ảnh số là rất lớn Ngoài những ứng dụng đã thảo luận ở trên thì còn bao gồm các ứng dụng trong các lĩnh vực như điện tử gia đình, thiên văn học, sinh vật học, vật lý, nông nghiệp, địa lý, nhân chủng học, và nhiều lĩnh vực khác Khả năng nhìn và nghe thấy hà hai phương tiện quan trọng nhất để con người nhận thức thế giới bên ngoài, do vậy không có gì đáng ngạc nhiên khi mà

xử lý ảnh số có nhiều khả năng ứng dụng, không chỉ trong khoa học và kỹ thuật mà còn cả trong mọi hoạt động khác của con người

1.1.4 Quan hệ cơ bản giữa các điểm ảnh

Một ảnh số giả sử được biểu diễn bằng hàm f(x, y) Tập con các điểm ảnh là S; cặp điểm ảnh có quan hệ với nhau ký hiệu là p, q

Chúng ta nêu một số các khái niệm sau

1.1.4.1 Các lân cận của điểm ảnh (Image Neighbors)

* Giả sử có điểm ảnh p tại toạ độ (x, y) p có 4 điểm lân cận gần nhất theo chiều đứng và ngang (có thể coi như lân cận 4 hướng chính: Đông, Tây, Nam, Bắc)

{(x-1, y); (x, y-1); (x, y+1); (x+1, y)} = N 4 (p)

trong đó: số 1 là giá trị logic; N4(p) tập 4 điểm lân cận của p

Trang 25

Đông x Tây

Nam

y

Bắc

Hình 1.2 Lân cận các điểm ảnh của tọa độ (x,y)

* Các lân cận chéo: Các điểm lân cận chéo NP(p) (Có thể coi lân cận chéo la 4 hướng: Đông-Nam, Đông-Bắc, Tây-Nam, Tây-Bắc)

Np(p) = { (x+1, y+1); (x+1, y-1); (x-1, y+1); (x-1, y-1)}

* Tập kết hợp: N8(p) = N4(p) + NP(p) là tập hợp 8 lân cận của điểm ảnh p

* Chú ý: Nếu (x, y) nằm ở biên (mép) ảnh; một số điểm sẽ nằm ngoài ảnh

1.1.4.2 Các mối liên kết điểm ảnh

Các mối liên kết được sử dụng để xác định giới hạn (Boundaries) của đối tượng vật thể hoặc xác định vùng trong một ảnh Một liên kết được đặc trưng bởi tính liền kề giữa các điểm và mức xám của chúng

Giả sử V là tập các giá trị mức xám Một ảnh có các giá trị cường độ sáng từ thang mức xám từ 32 đến 64 được mô tả như sau :

V={32, 33, … , 63, 64}

Có 3 loại liên kết

* Liên kết 4: Hai điểm ảnh p và q được nói là liên kết 4 với các giá trị cường

độ sáng V nếu q nằm trong một các lân cận của p, tức q thuộc N4(p)

* Liên kết 8: Hai điểm ảnh p và q nằm trong một các lân cận 8 của p, tức q thuộc N8(p)

Trang 26

* Liên kết m (liên kết hỗn hợp): Hai điểm ảnh p và q với các giá trị cường độ sáng V được nói là liên kết m nếu

1 q thuộc N 4 (p) hoặc

2 q thuộc N P (p)

1.1.4.3 Đo khoảng cách giữa các điểm ảnh

Định nghĩa: Khoảng cách D(p, q) giữa hai điểm ảnh p toạ độ (x, y), q toạ độ

(s, t) là hàm khoảng cách (Distance) hoặc Metric nếu:

1 D(p,q) ≥ 0 (Với D(p,q)=0 nếu và chỉ nếu p=q)

Như vậy, khoảng cách điểm ảnh lân cận của CGA 12” là ≈ 1mm

Trang 27

Khoảng cách D8(p, q) còn gọi là khoảng cách bàn cờ (Chess-Board Distance) giữa điểm ảnh p, q được xác định như sau:

Phân vùng có thể được tiếp cận từ hai quan điểm: bằng cách nhận dạng các đường biên (hoặc đường) hoặc bằng cách nhận ra các vùng (region, area) bên trong ảnh Các phép toán phân vùng có thể xem như là đối ngẫu của các phép toán tìm biên (hay tách cạnh), bởi vì khi tìm biên được kết thúc, điều đó tương đương với việc tách một vùng làm hai Một cách lý tưởng, các phép toán tách cạnh và phân vùng sẽ cho cùng một kết quả phân đoạn, tuy nhiên trong thực tế ít khi đạt được như vậy

Vùng ảnh là tập hợp các điểm ảnh có thuộc tính tương tự (gần giống nhau)

Ta có thể xem một ảnh X chính là một tập các điểm ảnh pi, ký hiệu X= { p i }, i∈ [1, N.M], với N.M là kích thước của hình ảnh Như vậy, phân vùng ảnh là quá trình tìm các tập con Ri ={ tập các điểm ảnh có thuộc tính tương tự} của các vùng ảnh sao cho:

𝐾 𝑅𝑖 = 𝑋

𝑖=1 𝑣à 𝑅𝑖 𝑅𝑗 , ∀𝑖 ≠ 𝑗, 𝑖, 𝑗 = 1 … 𝐾 , với K là số vùng của ảnh X

Trang 28

Phân vùng ảnh là quá trình xử lý một ảnh số thành một tập các vùng, mỗi vùng là một tập hợp các điểm ảnh Chính xác hơn, phân vùng ảnh là quá trình gán nhãn cho mỗi điểm ảnh trong ảnh sao cho các điểm ảnh có các thuộc tính tương tự nhau thì có cùng một nhãn Đường bao quanh một vùng ảnh được gọi là đường biên

Cơ sở toán học ở đây là chỉ tiêu phân vùng dựa trên độ đo sự tương tự giữa các thuộc tính Thuộc tính quan trọng là thuộc tính biên độ của hàm độ sáng (hàm

độ sáng ít biến thiên – tương tự)

a) Ảnh gốc b) Kết quả sau khi phân vùng

Hình 1.3 Một ví dụ về phân vùng ảnh

1.2.2 Các phương pháp tiếp cận

Dựa vào đặc tính vật lý của ảnh, người ta có nhiều kỹ thuật phân vùng: phân vùng dựa theo miền liên thông gọi là phân vùng dựa theo miền đồng nhất hay miền kề; phân vùng dựa vào biên gọi là phân vùng biên Ngoài ra còn có các kỹ thuật phân vùng khác dựa vào biên độ, phân vùng dựa theo kết cấu

Phương pháp phân vùng ảnh được chia thành hai hướng:

Trang 29

 Phương pháp phân vùng trực tiếp (phân vùng dựa trên độ tương tự về thuộc

tính):

Có nhiều phương pháp phân vùng ảnh như phân vùng ảnh dựa vào ngưỡng biên bộ, phân vùng dựa theo miền liên thông hay còn gọi là phân vùng dựa theo miền đồng nhất hoặc là phân vùng miền liền kề, có thể liệt kê các phương pháp như sau:

- Phân vùng ảnh theo ngưỡng biên độ

- Phân lớp điểm ảnh

- Phân vùng dựa trên cấu trúc đồ thị

- Phân vùng dựa trên xử lý đa phân giải

- Phân vùng dựa trên phân tích kết cấu

- Phân vùng dựa vào phát hiện đối tượng trong ảnh

- Phương pháp cấu trúc

 Phương pháp phân vùng gián tiếp: Phân vùng dựa trên tách biên

Phân vùng dựa trên tách biên Hay nói một cách khác, phân vùng ảnh và đường biên có tính chất đối ngẫu, nếu như tôi phát hiện được đường biên thì dựa vào biên có thể xác định vùng ảnh hoặc nếu như tôi phân vùng ảnh thì đường bao quanh vùng ảnh đó được gọi là đường biên Ngoài ra còn có các phương pháp phân vùng khác như phân vùng ảnh sử dụng bộ lọc tối ưu; phân vùng ảnh thông qua biểu diễn bề mặt

Việc phân vùng ảnh dựa vào đường biên thì có ưu điểm nhanh, đơn giản và câu hỏi chính đặt ra ở đây là làm sao xác định được các ngưỡng biên độ để phân vùng ảnh? Ngoài ra phân vùng ảnh dựa vào ngưỡng biên bộ thì rất nhạy cảm với nhiễu Đối với các loại ảnh tự nhiên thì đường biểu diễn biên của các vùng rất phức tạp (đường răng cưa) Chính vì thế phương pháp dựa vào ngưỡng không hiệu quả trong phân vùng những loại ảnh này Thông thường, kỹ thuật phân ngưỡng theo

Trang 30

biên độ rất có lợi đối với ảnh nhị phân như văn bản in, đồ họa, ảnh màu hay ảnh X

- quang Việc chọn ngưỡng rất quan trọng và bao gồm nhiều bước Như vậy, có thể dùng ngưỡng biên độ để phân vùng khi biên độ đủ lớn

Phương pháp phân vùng ảnh thành các miền đồng nhất dựa vào các tính chất quan trọng nào đó của miền ảnh Việc lựa chọn các tính chất của miền sẽ xác định tiêu chuẩn phân vùng Tính đồng nhất của một miền ảnh là điểm chủ yếu xác định tính hiệu quả của việc phân vùng Các tiêu chuẩn hay được dùng là sự đồng nhất về mức xám, màu sắc

1.2.2.1 Phân vùng ảnh theo ngƣỡng biên độ

Các đặc tính đơn giản, cần thiết nhất của ảnh là biên độ và các tính chất vật

lý như: độ tương phản, độ truyền sáng, màu sắc hoặc đáp ứng phổ Như vậy, có thể dùng ngưỡng biên độ để phân vùng khi biên độ đủ lớn đặc trưng cho ảnh Thí dụ, biên độ trong bộ cảm biến ảnh hồng ngoại có thể phản ánh vùng có nhiệt độ thấp hay vùng có nhiệt độ cao Kỹ thuật phân ngưỡng theo biên độ rất có lợi đối với ảnh nhị phân như văn bản in, đồ họa, ảnh màu hay ảnh X-quang

Việc chọn ngưỡng rất quan trọng Nó bao gồm các bước :

 Xem xét lược đồ xám của ảnh để xác định các đỉnh và các khe Nếu ảnh có dạng rắn lượn (nhiều đỉnh và khe), các khe có thể dùng để chọn ngưỡng

 Chọn ngưỡng t sao cho một phần xác định trước η của toàn bộ số mẫu là thấp hơn t

 Điều chỉnh ngưỡng dựa trên lược đồ xám của các điểm lân cận

 Chọn ngưỡng theo lược đồ xám của những điểm thỏa mãn tiêu chuẩn chọn Thí dụ, với ảnh có độ tương phản thấp, lược đồ của những điểm có biên độ Laplace g(m,n) lớn hơn giá trị t định trước (sao cho từ 5% đến 10% số điểm ảnh với Gradient lớn nhất sẽ coi như biên) sẽ cho phép xác định các đặc tính ảnh lưỡng cực tốt hơn ảnh gốc

Trang 31

 Khi có mô hình phân lớp xác suất, việc xác định ngưỡng dựa vào tiêu chuẩn xác suất nhằm cực tiểu xác suất sai số hoặc dựa vào một số tính chất khác của luật Bayes

 Để hiểu rõ hơn nguyên tắc phân vùng dựa vào ngưỡng biên độ, xét thí dụ sau:

1.2.2.2 Phân vùng theo miền đồng nhất

Kỹ thuật phân vùng ảnh thành các miền đồng nhất dựa vào các tính chất quan trọng nào đó của miền ảnh Việc lựa chọn các tính chất của miền sẽ xác định tiêu chuẩn phân vùng Tính đồng nhất của một miền ảnh là điểm chủ yếu xác định tính hiệu quả của việc phân vùng Các tiêu chuẩn hay được dùng là sự thuần nhất về mức xám, màu sắc đối với ảnh màu, kết cấu sợi và chuyển động

Các phương pháp phân vùng ảnh theo miền đồng nhất thường áp dụng là :

 Phương pháp tách cây tứ phân

Trang 32

 Phương pháp cục bộ

 Phương pháp tổng hợp

a) Phương pháp tách cây tứ phân

Về nguyên tắc, phương pháp này kiểm tra tính đúng đắn của tiêu chuẩn đề ra một cách tổng thể trên miền lớn của ảnh Nếu tiêu chuẩn được thỏa mãn, việc phân đoạn coi như kết thúc Trong trường hợp ngược lại, chia miền đang xét thành 4 miền nhỏ hơn Với mỗi miền nhỏ, áp dụng một cách đệ quy phương pháp trên cho đến khi tất cả các miền đều thỏa mãn điều kiện

Phương pháp này có thể mô tả như sau :

Procedure PhanDoan(Mien)

Begin

If miền đang xét không thỏa Then

Begin

Chia miền đang xét thành 4 miền : Z 1 , Z 2 , Z 3 , Z 4

For i=1 to 4 do PhanDoan (Z i )

Trang 33

Thuật toán kiểm tra tiêu chuẩn dựa vào độ chênh lệch max, min được viết:

If I[i,j] < Min Then Min=I[i,j] ;

If I[i,j] < Max Then Max=I[i,j] ;

3 If ABS(Max–Min)<T Then Examin_Criteria=0

Else Examin_Criteria=1 ;

End

Nếu hàm trả về giá trị 0, có nghĩa vùng đang xét là đồng nhất, nếu không thì không đồng nhất Trong giải thuật trên, khi miền là đồng nhất cần tính lại giá trị trung bình và cập nhật lại ảnh đầu ra Giá trị trung bình được tính bởi :

Tổng giá trị mức xám / tổng số điểm ảnh trong vùng

Thuật toán này tạo nên một cây mà mỗi nút cha có 4 nút con ở mọi mức trừ mức ngoài cùng Vì thế, cây này có tên là cây tứ phân Cây cho ta hình ảnh rõ nét về cấu trúc phân cấp của các vùng tương ứng với tiêu chuẩn

Một vùng thỏa mãn điều kiện sẽ tạo nên một nút lá; nếu không nó sẽ tạo nên một nút trong và có 4 nút con tương ứng Tiếp tục như vậy cho đến khi phân chia xong để đạt các vùng đồng nhất

Trang 34

b) Phân vùng ảnh dựa vào phát triển vùng cục bộ

Ý tưởng của phương pháp là xét ảnh từ các miền nhỏ nhất rồi nối chúng lại nếu thỏa mãn tiêu chuẩn để được một miền đồng nhất lớn hơn Tiếp tục với các miền thu được cho đến khi không thể nối thêm được nữa Số miền còn lại cho ta kết quả phân đoạn Như vậy, miền nhỏ nhất của bước xuất phát là điểm ảnh Phương pháp này hoàn toàn ngược với phương pháp tách Song điều quan trọng ở đây là nguyên lý nối 2 vùng Việc nối 2 vùng được thực hiện theo nguyên tắc sau :

- Hai vùng phải đáp ứng tiêu chuẩn, thí dụ như cùng màu hay cùng mức xám

- Hai vùng phải kế cận nhau

Khái niệm kế cận: trong xử lý ảnh, người ta dùng khái niệm liên thông để xác định tính chất kế cận Có hai khái niệm về liên thông là 4 liên thông và 8 liên thông Với 4 liên thông một điểm ảnh I(x,y) sẽ có 4 kế cận theo 2 hướng x và y ; trong khi đó với 8 liên thông, điểm I(x,y) sẽ có 4 liên thông theo 2 hướng x, y và 4 liên thông khác theo hướng chéo 450

(a) 4 liên thông (b) 8 liên thông

Hình 1.5 Khái niệm 4 liên thông và 8 liên thông

Dựa theo nguyên lý của phương pháp nối, ta có 2 thuật toán :

- Thuật toán tô màu (Blob Coloring) : sử dụng khái niệm 4 liên thông, dùng một cửa sổ di chuyển trên ảnh để so sánh với tiêu chuẩn nối

- Thuật toán đệ quy cực bộ: sử dụng phương pháp tìm kiếm trong một cây để làm tăng kích thước vùng

Trang 35

c) Phương pháp phân vùng dựa trên hợp và tách vùng

Hai phương pháp nối (hợp) và tách đều có nhược điểm Phương pháp tách sẽ tạo nên một cấu trúc phân cấp và thiết lập mối quan hệ giữa các vùng Tuy nhiên,

nó thực hiện việc chia quá chi tiết Phương pháp hợp cho phép làm giảm số miền liên thông xuống tối thiểu, nhưng cấu trúc hàng ngang dàn trải, không cho ta thấy rõ mối liên hệ giữa các miền Vì nhược điểm này, người ta nghĩ đến phối hợp cả 2 phương pháp Trước tiên, dùng phương pháp tách để tạo nên cây tứ phân, phân đoạn theo hướng từ gốc đến lá Tiếp theo, tiến hành duyệt cây theo chiều ngược lại và hợp các vùng có cùng tiêu chuẩn Với phương pháp này ta thu được một cấu trúc ảnh với các miền liên thông có kích thước tối đa Giải thuật tách hợp gồm một số bước chính sau:

1 Kiểm tra tiêu chuẩn đồng nhất

 Nếu không thỏa mãn tiêu chuẩn đồng nhất và số điểm trong một vùng nhiều hơn 1, tách vùng ảnh làm 4 miền (trên, dưới, phải, trái) bằng cách

đệ quy Nếu kết quả tách xong và không tách được nữa chuyển sang bước

 Nếu tiêu chuẩn đồng nhất thỏa mãn thì tiến hành hợp vùng và cập nhật lại giá trị trung bình của vùng cho vùng này

2 Hợp vùng

Kiểm tra 4 lân cận như đã nêu trên Có thể có nhiều vùng thỏa mãn Khi

đó, chọn vùng tối ưu nhất rồi tiến hành hợp

1.2.2.3 Phân vùng ảnh dựa trên phân tích kết cấu

Kết cấu thường được nhận biết trên bề mặt của các đối tượng như gỗ, cát, vải vóc…Kết cấu là thuật ngữ phản ánh sự lặp lại của các phần tử mẫu kết cấu cơ bản

Sự lặp lại này có thể ngẫu nhiên hay có tính chu kì hoặc gần chu kì Một mẫu kết cấu chứa rất nhiều điểm ảnh Trong phân tích ảnh, kết cấu được chia làm hai loại chính là: loại thống kê và loại cấu trúc

Trang 36

a) Phương pháp thống kế

Tính kết cấu ngẫu nhiên rất phù hợp với các đặc trưng thống kê Vì vậy, người

ta có thể dùng các đặc trưng ngẫu nhiên để đo nó như: Hàm tự tương quan (AutoCorrelation Function- ACF), các biến đổi mật độ gờ, ma trận tương tranh,… Theo cách tiếp cận bằng hàm tự tương quan, độ thô của kết cấu sợi tỉ lệ với độ rộng của ACF, được biểu diễn bởi khoảng cách x0, y0 sao cho r(x0,0) = r(0,y0) = 1 Người

ta cũng dùng cách đo nhánh của ACF nhờ hàm khởi sinh moment:

𝑀 𝑘, 𝑙 = 𝑛 − 𝜇1 𝑘 𝑚 − 𝜇2 𝑟 𝑛, 𝑚

𝑚 𝑛

𝑣ớ𝑖 𝜇1 = 𝑛 𝑟 𝑛, 𝑚 𝑣à 𝜇𝑛 2 = 𝑚 𝑟 𝑛, 𝑚 𝑛

Các đặc trưng của kết cấu sợi như độ thô, độ mịn hay hướng có thể ước lượng nhờ các biến đổi ảnh bằng kỹ thuật lọc tuyến tính Một mô hình đơn giản trong trường hợp ngẫu nhiên cho việc phân tích tính kết cấu được mô tả trong hình dưới đây:

Hình 1.6 Phân tích kết cấu bằng dải tương quan

Trong mô hình này, trường kết cấu sợi trước tiên được giải chập bởi bộ lọc lấy từ đầu ra của ACF Như vậy, nếu r(m,n) là ACF thì u(n, m)  a(n, m) = ε(n, m)

là trường ngẫu nhiên không tương quan

Lưu ý rằng, bộ lọc là không duy nhất, có thể là nhân quả, bán nhân quả hay không nhân quả Các ACF hay dùng như M(0, 2), M(2, 0), M(1, 1), M(2, 2)

Các đặc trưng của lược đồ bậc một của ε(n, m) chẳng hạn như trung bình m1, độ

Trang 37

phân tán 𝜇2 cũng hay được sử dụng Ngoài các đặc trưng trên, có thể đưa thêm một số khái niệm và định nghĩa các đại lượng dựa trên đó như: lược đồ mức xám (Histogram Grey Level Difference), ma trận xuất hiện mức xám

Lược đồ hiệu mức xám

Lược đồ hiệu mức xám dùng để mô tả các thông tin mang tính không gian và

được định nghĩa như sau Cho d = (d 1 , d 2 ) là vecto dịch chuyển giữa 2 điểm ảnh và

g(d) là hiệu mức xám với khoảng cách d: g(d) = |f(k,l) – f(k+d 1 , l+d 2 )| với hàm f(k,

l) cho giá trị mức xám tại tọa độ (k, l) Gọi hg(g, d) là lược đồ của hiệu mức xám khoảng cách d Với mỗi khoảng cách d ta có một lược đồ mức xám riêng Với một miền ảnh có kết cấu thô, lược đồ hg(g, d) có khuynh hướng tập trung xung quanh g=0 với khoảng cách d nhỏ Trái lại, với một miền ảnh có kết cấu mịn, hg(g, d) sẽ phân nhánh dù với vecto dịch chuyển d khá nhỏ Dựa trên lược đồ này, người ta định nghĩa lại một số đại lượng :

là mômen của lược đồ hg(g, d) xung quanh g = 0 và đo độ tương phản của hiệu mức xám Người ta sử dụng entropy để đo độ đồng nhất cảu lược đồ hg:

𝐻𝑔 = − ℎ𝑔(𝑔𝑘, 𝑑)ln⁡(ℎ𝑔

𝑁

𝑘=1

(𝑔𝑘, 𝑑))

Ưu điểm cơ bản của lược đồ hiệu mức xám là tính toán đơn giản Ngoài ra còn

có khả năng cho ta tổ chức kết cấu không gian

Ma trận xuất hiện liên hiệp mức xám

Giả sử P(k, l, d) là xác suất liên hiệp của hai điểm ảnh f k và f 1 với các mức xám

Trang 38

k,l tương ứng cách nhau một khoảng d Xác suất này dễ dàng tính được nhờ việc

tính số lần xuất hiện n k,l của cặp điểm ảnh (f k , f 1 ) có mức xám k và l với khoảng cách

d Gọi n là tổng số cặp liên hiệp có thể với khoảng cách d trong ảnh Các phần tử c k,l của ma trận xuất hiện liên hiệp mức xám c d được tính như sau : c d = (c k,l ) và

c k,l =P(k,l,d)=n k,l /n Ma trận xuất hiện liên hiệp mức xám C d là ma trận vuông N x N phần tử (N là số mức xám của ảnh) Ma trận này chứa các thông tin hữu ích về tổ chức kết cấu không gian Nếu kết cấu tương đối thô thì các phần tử của ma trận tập trung xung quanh đường chéo chính Ngược lại, nếu kết cấu bề mặt mịn, giá trị các

phần tử của c d sẽ phân rải tương đối rõ Dựa trên khái niệm này người ta định nghĩa

I d cực tiểu khi các phân tử của ma trận C tập trung trên đường chéo chính vì

khoảng cách |k-l|m rất nhỏ, I d nhỏ có nghĩa là kết cấu khá thô Người ta cũng còn đưa vào một số độ đo khác như hàm tự tương quan, phổ năng lượng Để áp dụng cách tiếp cận này, cần cài đặt các giải thuật tính các đại lượng đo trên

b) Phương pháp cấu trúc

Kết cấu sợi có cấu trúc thuần nhất là những mấu kết cấu xác định, mà sự xuất hiện lặp đi lặp lại tuân theo một luật tất định hay ngẫu nhiên nào đấy Một mẫu kết cấu về thực tế là một nhóm các điểm ảnh có cùng một số tính chất bất biến lặp trên ảnh Một mẫu kết cấu cũng có định nghĩa theo mức xám, theo bề mặt hay tính đồng nhất đối với một số các tính chất như kích thước, hướng, lược đồ bậc hai (ma trận tương tranh) Với các mẫu kết cấu được phân bố ngẫu nhiên, tính kết cấu sợi tương ứng của nó được coi là yếu (Weak) ngược với qui luật phân bố tất định gọi là mạnh (Strong) Khi tính kết cấu sợi là yếu, luật phân bố có thể đo bởi:

- Mật độ gờ

Trang 39

- Các loạt dài của các mẫu kết cấu liên thông tối đa

- Mật độ cực trị tương đối; số pixel trên một đơn vị diện tích có mức xám cực trị địa phương so với các lân cận

Ngoài hai cách tiếp cận trên, người ta còn dùng cách tiếp cận khác bằng cách lấy tổ hợp 2 cách trên và gọi là kỹ thuật mosaic Mô hình này biểu diễn các quá trình học ngẫu nhiên, thí dụ như khảm ngẫu nhiên hay đều của một mặt phẳng vào các đường cong lồi sẽ làm nổi lên tính kết cấu tế bào

c) Tiếp cận theo tính kết cấu

Khi đối tượng xuất hiện trên một nền có tính kết cấu cao, việc phân đoạn dựa vào tính kết cấu trở nên quan trọng Nguyên nhân là kết cấu sợi thường chứa mật độ cao các gờ (edge) làm cho phân đoạn theo biên kém hiệu quả, trừ phi ta loại tính kết cấu Việc phân đoạn dựa vào miền đồng nhất cũng có thể áp dụng cho các đặc trưng kết cấu và có thể dùng để phân đoạn các miền có tính kết cấu

Nhìn chung, việc phân loại và phân vùng dựa vào kết cấu là một vấn đề phức tạp

Ở đây, tài liệu chỉ mang tính chất giới thiệu Có thể giải quyết vấn đề này trong thực tế nếu ta biết trước các loại kết cấu (dựa vào quy luật hay các phân bố của nó)

1.2.2.4 Phân vùng ảnh dựa trên sự phân lớp điểm ảnh

a) Mô hình bài toán:

Cho ảnh X ={p i } , i ∈ [1,N.M] , với N là chiều rộng của ảnh và M là chiều cao

của ảnh, p i là điểm ảnh thứ i và A(p i ) là thuộc tính của p i Đối tượng phân lớp ở

đây là các p i

Phân vùng ảnh X chính là phân lớp tập X thành các lớp Ci sao cho từ Ci phát triển thành các vùng Ri Chỉ tiêu phân lớp ở đây chính là độ đồng đều (tương tự) về thuộc tính của các điểm ảnh

Trang 40

Quá trình phân lớp có thể sử dụng các phương pháp học máy và quyết định phân lớp

b) Phân lớp điểm ảnh trong không gian thuộc tính một chiều

Trong phần này sẽ giới thiệu một thuật toán vùng dựa trên sự phân lớp các

điểm ảnh trên nguyên tắc phân tích tự tổ chức theo nguyên tắc lặp (ISODATA –

Interactive Seft Organization DATa Analysis)

Thuật toán ISODATA trong phân vùng ảnh:

Đầu vào: X={p i }, i[1,N.M], A(p i ) là gia trị mức xám của p i

 ƒ Chọn các giá trị ngưỡng ban đầu của các lớp theo nguyên tắc sau:

T 0 =l min , T K =l max và T i (t)= 𝑖.𝑙𝑚𝑎𝑥 −𝑙𝑚𝑖𝑛

𝐾 + 𝑇0 , với i=1…K-1

2 Bước lặp

 ƒ Thực hiện phân lớp điểm theo các ngưỡng Ti(t-1)

P iC k nếu T i (t-1) ≤ A(p i )≤T i+1 (t-l),k[l,K]

 ƒ Tính giá trị trung bình của mỗi lớp tại thời điểm t

Ngày đăng: 29/11/2014, 10:03

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
1. Lương Mạnh Bá, Nguyễn Thanh Thủy. Nhập môn xử lý ảnh số, Nhà xuất bản Khoa học kỹ thuật, Hà Nội Sách, tạp chí
Tiêu đề: Nhập môn xử lý ảnh số
Nhà XB: Nhà xuất bản Khoa học kỹ thuật
3. Đỗ Năng Toàn, Phạm Việt Bình (2007). Giáo trình xử lý ảnh, Nhà xuất bản Đại học Thái Nguyên Sách, tạp chí
Tiêu đề: Giáo trình xử lý ảnh
Tác giả: Đỗ Năng Toàn, Phạm Việt Bình
Nhà XB: Nhà xuất bản Đại học Thái Nguyên
Năm: 2007
5. C. Rother, V. Kolmogorov, and A. Blake, GrabCut: Interactive foreground extraction using iterated graph cuts, ACM Trans. Graph., vol. 23, pp. 309–314, 2004 Sách, tạp chí
Tiêu đề: GrabCut: Interactive foreground extraction using iterated graph cuts
2. Nguyễn Đăng Bình, Giáo Trình Xử Lý Ảnh, Đại Học Khoa Học Huế, Huế, 2011 Khác
4. Nguyễn Quang Hoan, Giáo Trình Xử Lý Ảnh, Học Viện Bưu Chính Viễn Thông, Hà Nội, 2006 Khác
6. L. Grady: Random Walks for Image Segmentation, IEEE Trans. on Pattern Analysis and Machine Intelligence, Vol. 28, No. 11, pp. 1768–1783, Nov., 2006 Khác
7. T. H. Kim, K. M. Lee, S. U. Lee: Generative Image Segmentation Using Random Walks with Restart, Proc. of ECCV 2008, pp. 264–275 Khác

HÌNH ẢNH LIÊN QUAN

Hình 1.2  Lân cận các điểm ảnh của tọa độ (x,y) - Luận văn thạc sĩ công nghệ thông tin Phân tích một số phương pháp phân đoạn ảnh có giám sát
Hình 1.2 Lân cận các điểm ảnh của tọa độ (x,y) (Trang 25)
Hình 1.3  Một ví dụ về phân vùng ảnh  1.2.2  Các phương pháp tiếp cận. - Luận văn thạc sĩ công nghệ thông tin Phân tích một số phương pháp phân đoạn ảnh có giám sát
Hình 1.3 Một ví dụ về phân vùng ảnh 1.2.2 Các phương pháp tiếp cận (Trang 28)
Hình 1.4  Minh họa cách chọn ngƣỡng. - Luận văn thạc sĩ công nghệ thông tin Phân tích một số phương pháp phân đoạn ảnh có giám sát
Hình 1.4 Minh họa cách chọn ngƣỡng (Trang 31)
Hình 1.6  Phân tích kết cấu bằng dải tương quan - Luận văn thạc sĩ công nghệ thông tin Phân tích một số phương pháp phân đoạn ảnh có giám sát
Hình 1.6 Phân tích kết cấu bằng dải tương quan (Trang 36)
Hình 1.7  Biểu diễn ảnh dưới dạng một đồ thị - Luận văn thạc sĩ công nghệ thông tin Phân tích một số phương pháp phân đoạn ảnh có giám sát
Hình 1.7 Biểu diễn ảnh dưới dạng một đồ thị (Trang 42)
Hình 1.8  Minh họa cây bao trùm tối thiểu của một đồ thị. - Luận văn thạc sĩ công nghệ thông tin Phân tích một số phương pháp phân đoạn ảnh có giám sát
Hình 1.8 Minh họa cây bao trùm tối thiểu của một đồ thị (Trang 43)
Hình 2.4 Người dùng hiệu chỉnh. - Luận văn thạc sĩ công nghệ thông tin Phân tích một số phương pháp phân đoạn ảnh có giám sát
Hình 2.4 Người dùng hiệu chỉnh (Trang 56)
Bảng 2-1: B_LIN - Luận văn thạc sĩ công nghệ thông tin Phân tích một số phương pháp phân đoạn ảnh có giám sát
Bảng 2 1: B_LIN (Trang 64)
Hình 2.5  Kết quả phân đoạn - Luận văn thạc sĩ công nghệ thông tin Phân tích một số phương pháp phân đoạn ảnh có giám sát
Hình 2.5 Kết quả phân đoạn (Trang 69)
Hình 2.6  So sánh độ phức tạp thuật toán - Luận văn thạc sĩ công nghệ thông tin Phân tích một số phương pháp phân đoạn ảnh có giám sát
Hình 2.6 So sánh độ phức tạp thuật toán (Trang 71)
Hình 3.1  Sự thay đổi xác suất trạng thái ổn định r - Luận văn thạc sĩ công nghệ thông tin Phân tích một số phương pháp phân đoạn ảnh có giám sát
Hình 3.1 Sự thay đổi xác suất trạng thái ổn định r (Trang 73)
Hình 3.2 cho thấy một ví dụ khác của phân đoạn ảnh đối với sự biến đổi của  xác suất c trong một ảnh thường - Luận văn thạc sĩ công nghệ thông tin Phân tích một số phương pháp phân đoạn ảnh có giám sát
Hình 3.2 cho thấy một ví dụ khác của phân đoạn ảnh đối với sự biến đổi của xác suất c trong một ảnh thường (Trang 73)
Hình 3.3  So sánh thuật toán GC, RW, RWR cho ảnh có đường biên yếu  3.2.3.2.  Vấn đề kết cấu - Luận văn thạc sĩ công nghệ thông tin Phân tích một số phương pháp phân đoạn ảnh có giám sát
Hình 3.3 So sánh thuật toán GC, RW, RWR cho ảnh có đường biên yếu 3.2.3.2. Vấn đề kết cấu (Trang 76)
Hình 3. 4  So sánh phân đoạn cho ảnh có kết cấu yếu - Luận văn thạc sĩ công nghệ thông tin Phân tích một số phương pháp phân đoạn ảnh có giám sát
Hình 3. 4 So sánh phân đoạn cho ảnh có kết cấu yếu (Trang 77)
Hình 3.5  So sánh thuật toán GC, RW, RWR trên ảnh tự nhiên - Luận văn thạc sĩ công nghệ thông tin Phân tích một số phương pháp phân đoạn ảnh có giám sát
Hình 3.5 So sánh thuật toán GC, RW, RWR trên ảnh tự nhiên (Trang 78)

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w