Trong hầu hết các ứng dụng của lĩnh vực xử lý ảnh, thị giác máy tính, phân đoạn ảnh luôn đóng một vai trò cơ bản và thường là bước tiền xử lý đầu tiên trong toàn bộ quá trình trước
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC LẠC HỒNG
* * *
Nguyễn Văn Thành
PHÂN TÍCH MỘT SỐ PHƯƠNG PHÁP PHÂN ĐOẠN ẢNH CÓ GIÁM SÁT
Luận văn thạc sĩ Công nghệ thông tin
Đồng Nai – 2013
Trang 2BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC LẠC HỒNG
* * *
Nguyễn Văn Thành
PHÂN TÍCH MỘT SỐ PHƯƠNG PHÁP PHÂN ĐOẠN ẢNH CÓ GIÁM SÁT
Chuyên ngành : Công Nghệ Thông Tin
Luận văn thạc sĩ Công nghệ thông tin
NGƯỜI HƯỚNG DẪN KHOA HỌC : PGS.TS NGÔ QUỐC TẠO
Đồng Nai – 2013
Trang 3LỜI CẢM ƠN
Trong quá trình làm luận văn vừa qua, được sự giúp đỡ và chỉ bảo nhiệt tình của PGS TS Ngô Quốc Tạo – Viện Công nghệ Thông tin – Viện khoa học Việt Nam, luận văn của em đã được hoàn thành Măc dù đã cố gắng cùng với sự tận tâm của thầy h ướng dẫn song do th ời gian và khả năng vẫn cò n nhiều hạn chế nên luận văn không tránh khỏi những thiếu sót
Em xin bày tỏ lò ng biết ơn sâu sắc t ới thầy PGS TS Ngô Quốc Tạo đã tận tình hướng dẫn, chỉ bảo và dành rất nhiều thời gian quí báu của thầy cho em trong thời gian qua, đã giúp em hoàn thành bài luận văn đúng thời hạn
Em xin gửi lời cảm ơn đến Ban Giám hiệu, các Thầy cô giáo của Trường Đại học Lạc Hồng, các Thầy cô bộ môn, đã giảng dạy cung cấp, trang bị cho chúng em những kiến thức chuyên ngành, chuyên môn chuyên sâu trong suốt hai năm qua Xin cảm ơn gia đình và bạn bè đã động viên cổ vũ em trong suốt quá trình học tập cũng như thời gian làm luận văn, đã giúp em hoàn thành khóa học, luận văn theo qui định
Trang 4LỜI CAM ĐOAN
Tôi xin cam đoan luận văn là kết quả nghiên cứu của tôi, không sao chép của
ai Nội dung luận văn có tham khảo và sử dụng các tài liệu liên quan, các thông tin trong tài liệu được đăng tải trên các tạp chí và các trang website theo danh mục tài
liệu của luận văn
Tác giả luận văn
Nguyễn Văn Thành
Trang 5MỤC LỤC
DANH MỤC CÁC THUẬT NGỮ, CÁC TỪ VIẾT TẮT i
CÁC THUẬT NGỮ i
CÁC TỪ VIẾT TẮT ii
DANH MỤC CÁC BẢNG iii
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ iv
MỞ ĐẦU 1
CHƯƠNG 1: TỔNG QUAN VỀ XỬ LÝ ẢNH, PHÂN ĐOẠN ẢNH 3
1.1 Tổng quan về xử lý ảnh 3
1.1.1 Một số khái niệm cơ bản về xử lý ảnh 3
1.1.1.1 Xử lý ảnh là gì ? 3
1.1.1.2 Phần tử ảnh (Pixel - Picture Element) 3
1.1.1.3 Mức xám của ảnh 4
1.1.1.4 Độ phân giải của ảnh 5
1.1.2 Các giai đoạn cơ bản trong xử lý ảnh 6
1.1.2.1 Biểu diễn ảnh 6
1.1.2.2 Tăng cường, nâng cao chất lượng ảnh 7
1.1.2.3 Khôi phục ảnh 7
1.1.2.4 Biến đổi ảnh 8
1.1.2.5 Phân tích ảnh 8
1.1.2.6 Nhận dạng ảnh 9
1.1.2.7 Nén ảnh 11
1.1.3 Các ứng dụng của xử lý ảnh 12
1.1.4 Quan hệ cơ bản giữa các điểm ảnh 13
1.2 Tổng quan về phân đoạn ảnh 16
Trang 61.2.1 Giới thiệu 16
1.2.2 Các phương pháp tiếp cận 17
1.2.2.1 Phân vùng ảnh theo ngưỡng biên độ 19
1.2.2.2 Phân vùng theo miền đồng nhất 20
1.2.2.3 Phân vùng ảnh dựa trên phân tích kết cấu 24
1.2.2.4 Phân vùng ảnh dựa trên sự phân lớp điểm ảnh 28
1.2.2.5 Phân vùng dựa vào lý thuyết đồ thị 30
1.2.2.6 Phân vùng ảnh dựa trên biểu diễn và xử lý đa phân giải 35
CHƯƠNG 2: MỘT SỐ KỸ THUẬT PHÂN ĐOẠN ẢNH CÓ GIÁM SÁT 37
2.1 Giới thiệu về phân đoạn ảnh có giám sát 37
2.2 Phân đoạn ảnh sử dụng grabcut 38
2.2.1 Phân đoạn theo năng lượng cực tiểu hóa 39
2.2.2 Giải thuật phân đoạn GrabCut 41
2.2.2.1 Mô hình dữ liệu màu 41
2.2.2.2 Phân đoạn theo lặp lại cực tiểu năng lượng 42
2.2.2.3.Tương tác người sử dụng và trimap không đầy đủ 44
2.3 Phân đoạn ảnh sử dụng Random Walks 45
2.3.1 Trọng số cạnh 46
2.3.2.Vấn đề Dirichlet Tổ hợp 46
2.3.3.Mạch tương tự 48
2.3.4.Mối quan hệ để khuếch tán 49
2.4.Phân đoạn ảnh sử dụng Random Walks with Restart 50
2.4.1.Phương pháp phân đoạn ảnh dựa trên RWR 54
2.4.1.1.Xây dựng đồ thị trọng số cho hình ảnh 55
2.4.1.2.Tính xác suất 56
Trang 72.4.1.3.Gán nhãn để phân đoạn ảnh 58
2.4.2.Độ phức tạp thuật toán 59
CHƯƠNG 3: CÀI ĐẶT THỬ NGHIỆM 61
3.1.Môi trường cài đặt 61
3.2.Chương trình thực nghiệm phân đoạn ảnh sử dụng RWR 61
3.2.1.Thiết lập thông số 61
3.2.2.Kết quả phân đoạn RWR B_LIN với c=10-4 63
3.2.3.Một số so sánh 64
3.2.3.1.Vấn đề biên ảnh yếu 64
3.2.3.2.Vấn đề kết cấu 65
3.2.3.3.Định lượng so sánh 66
3.3.Kết luận và kiến nghị 68
TÀI LIỆU THAM KHẢO
Trang 8DANH MỤC CÁC THUẬT NGỮ, CÁC TỪ VIẾT TẮT CÁC THUẬT NGỮ
Random Walk With Return Bước đi ngẫu nhiên với quay lại
Trang 9CÁC TỪ VIẾT TẮT
Trang 10DANH MỤC CÁC BẢNG
Trang 11DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ
Hình 1.1 Quá trình xử lý ảnh 3
Hình 1.2 Lân cận các điểm ảnh của tọa độ (x,y) 14
Hình 1.3 Một ví dụ về phân vùng ảnh 17
Hình 1.4 Minh họa cách chọn ngưỡng 20
Hình 1.5 Khái niệm 4 liên thông và 8 liên thông 23
Hình 1.6 Phân tích kết cấu bằng dải tương quan 25
Hình 1.7 Biểu diễn ảnh dưới dạng một đồ thị 31
Hình 1.8 Minh họa cây bao trùm tối thiểu của một đồ thị 32
Hình 2.1 Một số ví dụ của Grabcut 41
Hình 2.2 Phân đoạn ảnh Lặp đi lặp lại ở GrabCut 44
Hình 2 3 Sự Quy tụ cực tiểu hóa lặp đi lặp lại 44
Hình 2.4 Người dùng hiệu chỉnh 45
Hình 2.5 Kết quả phân đoạn 58
Hình 2.6 So sánh độ phức tạp thuật toán 60
Hình 3.1 Sự thay đổi xác suất trạng thái ổn định r 62
Hình 3.2 Phân đoạn đối với sự biết đổi của các xác suất khởi động lại c trong ảnh tự nhiên 62
Hình 3.3 So sánh thuật toán GC, RW, RWR cho ảnh có đường biên yếu 65
Hình 3 4 So sánh phân đoạn cho ảnh có kết cấu yếu giữa các thuật toán GC, RW, RWR 66
Hình 3.5 So sánh thuật toán GC, RW, RWR trên ảnh tự nhiên 67
Trang 12MỞ ĐẦU
Xử lý ảnh (Image Processing) là một trong những mảng quan trọng nhất trong kỹ thuật thị giác máy tính Xử lý ảnh được ứng dụng trong nhiều lĩnh khác nhau như y học, an ninh, quốc phòng
Phân đoạn ảnh là một thao tác ở mức thấp trong toàn bộ quá trình xử lý ảnh Phân đoạn ảnh có vai trò quan trọng trong việc chiết xuất thông tin từ những hình ảnh và việc khai thác các thông tin hữu ích và các thuộc tính từ hình ảnh Nếu bước phân đoạn ảnh không tốt thì dẫn đến việc nhận diện sai lầm về các đối tượng có trong ảnh
Trong hầu hết các ứng dụng của lĩnh vực xử lý ảnh, thị giác máy tính, phân đoạn ảnh luôn đóng một vai trò cơ bản và thường là bước tiền xử lý đầu tiên trong toàn bộ quá trình trước khi thực hiện các thao tác khác ở mức cao hơn như nhận dạng đối tượng, biểu diễn đối tượng, nén ảnh dựa trên đối tượng, hay truy vấn ảnh dựa vào nội dung
Hiện nay đã có nhiều thuật toán được đề xuất để giải quyết bài toán phân đoạn ảnh Các thuật toán trên hầu hết đều dựa vào hai thuộc tính quan trọng của mỗi điểm ảnh so với các điểm lân cận của nó, đó là: sự khác (dissimilarity) và giống nhau (similarity) Các phương pháp dựa trên sự khác nhau của các điểm ảnh được gọi là các phương pháp biên (boundary-based methods), còn các phương pháp dựa trên sự giống nhau của các điểm ảnh được gọi là phương pháp miền (region-based methods)
Tuy nhiên, các thuật toán theo cả hai hướng này đều vẫn chưa cho kết quả phân đoạn tốt, vì cả hai loại phương pháp này đều chỉ nắm bắt được các thuộc tính cục bộ (local) của ảnh Do đó, việc tìm ra các thuật toán nắm bắt được các thuộc tính toàn cục (global) của bức ảnh đã trở thành một xu hướng
Chương 1 của luận văn trình bày tổng quan về xử lý ảnh, các hướng tiếp cận chính trong phân đoạn ảnh
Trong chương 2, luận văn tập trung tìm hiểu và trình bày một số phương pháp phân đoạn ảnh có giám sát như Random Walker (RW), Graph cuts (GC),
Trang 13Random Walker Restart (RWR) – chỉ ra phương pháp được đánh giá là hiệu quả hơn các phương pháp phân đoạn ảnh trước đây, khắc phục được hai khó khăn quan trọng trong ảnh tự nhiên là bài toán đường biên yếu và kết cấu yếu
Phương pháp RWR dựa vào việc coi một bức ảnh như một đồ thị có trọng số Sau khi tính xác suất trạng thái ổn định của mỗi điểm ảnh bằng cách sử dụng kỹ thuật phân đoạn ảnh chúng ta có thể ước lượng khả năng phân tách và cuối cùng gán nhãn vào mỗi điểm ảnh
Chương 3 phân tích kết quả thực nghiệm phân đoạn ảnh RWR với các ảnh tự
nhiên có đường biên yếu và kết cấu yếu
Trang 14CHƯƠNG 1: TỔNG QUAN VỀ XỬ LÝ ẢNH, PHÂN ĐOẠN ẢNH
Quá trình xử lý ảnh được xem như là quá trình thao tác ảnh đầu vào nhằm cho ra kết quả mong muốn Kết quả đầu ra của một quá trình xử lý ảnh có thể là một ảnh “tốt hơn” hoặc một kết luận
Hình 1.1 Quá trình xử lý ảnh
Ảnh có thể xem là tập hợp các điểm ảnh và mỗi điểm ảnh được xem như là đặc trưng cường độ sáng hay một dấu hiệu nào đó tại một vị trí nào đó của đối tượng trong không gian và nó có thể xem như một hàm n biến P(c1, c2, , cn) Do
đó, ảnh trong xử lý ảnh có thể xem như ảnh n chiều
1.1.1.2 Phần tử ảnh (Pixel - Picture Element)
Ảnh trong thực tế là một ảnh liên tục về không gian và về giá trị độ sáng Để
có thể xử lý ảnh bằng máy tính thì cần thiết phải tiến hành số hóa ảnh Trong quá trình số hóa, người ta biến đổi tín hiệu liên tục sang tín hiệu rời rạc thông qua quá trình lấy mẫu (rời rạc hoá về không gian) và lượng hoá thành phần giá trị (rời rạc hoá biên độ giá trị) mà bằng mắt thường ta khó phân biệt được hai mức xám kề
Ảnh
“Tốt hơn”
Kết luận
Trang 15nhau Trong trường hợp này, người ta sử dụng khái niệm phần tử ảnh hay là điểm ảnh (Picture Element - Pixel) Trong khuôn khổ ảnh hai chiều Mỗi điểm ảnh gồm
có một cặp toạ độ (x,y) và giá trị biểu diễn độ sáng (cấp xám) cụ thể Các cặp tọa độ (x, y) tạo nên độ phân giải (resolution) Chẳng hạn như màn hình máy tính có độ phân giải là 480×640 nghĩa là trên màn hình có 480×640 điểm ảnh (x, y), chiều rộng 80 điểm ảnh, chiều dài 640 điểm ảnh
Điểm ảnh (pixel) là một phần tử của ảnh số tại tọa độ (x,y) với độ xám hoặc màu nhất định
Điểm ảnh được xem như là dấu hiệu hay cường độ sáng tại 1 toạ độ trong không gian của đối tượng và ảnh được xem như là 1 tập hợp các điểm ảnh Kích thước và khoảng cách giữa các điểm ảnh đó được chọn thích hợp sao cho mắt người cảm nhận sự liên tục về không gian và mức xám (hoặc màu) của ảnh số gần như thật Mỗi phần tử trong ma trận được gọi là một phần tử ảnh
Ta cần phân biệt Pixel (phần tử ảnh) với khái niệm pixel hay đề cập đến trong hệ thống đồ hoạ máy tính
1.1.1.3 Mức xám của ảnh
Mức xám (gray-level) là kết quả của sự mã hoá tương ứng một cường độ sáng của mỗi điểm ảnh với một giá trị số của quá trình lượng hoá Là số các giá trị có thể có của các điểm ảnh của ảnh Một điểm ảnh (pixel) có hai đặc trưng cơ bản là vị trí (x, y) của điểm ảnh và độ xám của nó Dưới đây chúng ta xem xét một số khái
niệm và thuật ngữ thường dùng trong xử lý ảnh
Trang 16Lý do: từ kỹ thuật máy tính dùng 1 byte (8 bit) để biểu diễn mức xám: Mức xám dùng 1 byte biểu diễn: 28=256 mức, tức là từ 0 đến 255)
mỗi pixel sẽ được mã hóa bởi 8 bit
1.1.1.4 Độ phân giải của ảnh
Định nghĩa: Độ phân giải (Resolution) của ảnh là mật độ điểm ảnh được ấn
định trên một ảnh số được hiển thị
Theo định nghĩa, khoảng cách giữa các điểm ảnh phải được chọn sao cho mắt người vẫn thấy được sự liên tục của ảnh Việc lựa chọn khoảng cách thích hợp tạo nên một mật độ phân bổ, đó chính là độ phân giải và được phân bố theo trục x
và y trong không gian hai chiều
Ví dụ: Độ phân giải của ảnh trên màn hình CGA (Color Graphic Adaptor) là
một lưới điểm theo chiều ngang màn hình: 320 điểm chiều dọc * 200 điểm ảnh (320*200) Rõ ràng, cùng màn hình CGA 12” ta nhận thấy mịn hơn màn hình CGA
Trang 1717” độ phân giải 320*200 Lý do: cùng một mật độ (độ phân giải) nhưng diện tích màn hình rộng hơn thì độ mịn (liên tục của các điểm) kém hơn
1.1.2 Các giai đoạn cơ bản trong xử lý ảnh
1.1.2.1 Biểu diễn ảnh
Trong biểu diễn ảnh người ta thường dùng các phần tử đặc trưng của ảnh là pixel Nhìn chung có thể xem một hàm hai biến f(x,y) chứa các thông tin như là biểu diễn của một ảnh Các mô hình biểu diễn ảnh cho ta một mô tả logic hay định lượng các tính chất của hàm này Một số mô hình thường được dùng trong biểu diễn ảnh: mô hình toán, mô hình thống kê Trong mô hình toán, ảnh hai chiều được biểu diễn nhờ các hàm hai biến trực giao gọi là các hàm cơ sở Với mô hình thống kê, một ảnh được coi như là một phần tử của một tập hợp đặc trưng bởi các đại lượng
như: kỳ vọng, hiệp biến, phương sai, moment
Đây là một bước quan trọng, tạo tiền đề cho xử lý ảnh Mục đích chính nhằm làm nổi bật một số đặc tính của ảnh như thay đổi độ tương phản, lọc nhiễu, nổi biên, làm trơn biên, khuyếch đại ảnh nhằm phục vụ cho việc hiển thị hoặc các quá trình phân tích tiếp theo Tùy theo các ứng dụng khác nhau mà chúng ta có các kỹ thuật nâng cao chất lượng ảnh khác nhau
Nâng cao chất lượng ảnh có quan hệ gần gũi với khôi phục ảnh Khi một ảnh
bị nhiễu thì khôi phục ảnh gốc thường đưa đến nâng cao chất lượng ảnh Có một số khác biệt giữa khôi phục ảnh và nâng cao chất lượng ảnh Trong khôi phục ảnh, một ảnh gốc bị nhiễu thì mục tiêu là làm sao cho ảnh sau khi xử lý càng gần giống ảnh gốc càng tốt Còn trong nâng cao chất lượng ảnh thì mục tiêu là làm cho ảnh sau khi
xử lý có được chất lượng tốt hơn khi chưa xử lý Như vậy một ảnh không bị nhiễu thì không thể được xử lý bằng các kỹ thuật khôi phục ảnh nhưng ảnh đó có thể được
xử lý bằng các kỹ thuật nâng cao chất lượng ảnh Nhưng một ảnh bị nhiễu thì nó có thể được xử lý vừa bằng các kỹ thuật khôi phục ảnh vừa bằng các kỹ thuật nâng cao chất lượng ảnh
Trang 181.1.2.2 Tăng cường, nâng cao chất lượng ảnh
Đây là một bước quan trọng, tạo tiền đề cho xử lý ảnh
Mục đích chính nhằm làm nổi bật một số đặc tính của ảnh như thay đổi độ tương phản, lọc nhiễu, nổi biên, làm trơn biên, khuyếch đại ảnh nhằm phục vụ cho việc hiển thị hoặc các quá trình phân tích tiếp theo Tùy theo các ứng dụng khác nhau mà chúng ta có các kỹ thuật nâng cao chất lượng ảnh khác nhau
Nâng cao chất lượng ảnh có quan hệ gần gũi với khôi phục ảnh Khi một ảnh
bị nhiễu thì khôi phục ảnh gốc thường đưa đến nâng cao chất lượng ảnh Có một số khác biệt giữa khôi phục ảnh và nâng cao chất lượng ảnh Trong khôi phục ảnh, một ảnh gốc bị nhiễu thì mục tiêu là làm sao cho ảnh sau khi xử lý càng gần giống ảnh gốc càng tốt Còn trong nâng cao chất lượng ảnh thì mục tiêu là làm cho ảnh sau khi
xử lý có được chất lượng tốt hơn khi chưa xử lý Như vậy một ảnh không bị nhiễu thì không thể được xử lý bằng các kỹ thuật khôi phục ảnh nhưng ảnh đó có thể được
xử lý bằng các kỹ thuật nâng cao chất lượng ảnh Nhưng một ảnh bị nhiễu thì nó có thể được xử lý vừa bằng các kỹ thuật khôi phục ảnh vừa bằng các kỹ thuật nâng cao chất lượng ảnh
1.1.2.3 Khôi phục ảnh
Khôi phục ảnh là quá trình loại bỏ hay tối thiểu hoá các ảnh hưởng của môi trường bên ngoài hoặc do các hệ thống thu nhận ảnh gây ra Về nguyên tắc, khôi phục ảnh nhằm xác định mô hình toán học của quá trình đã gây ra biến dạng, tiếp theo là dùng ánh xạ ngược để xác định lại ảnh
Bất kỳ một ảnh nào được thu bằng các thiết bị điện, quang điện hay quang học thường bị nhiễu bởi môi trường cảm biến của các thiết bị đó Các loại nhiễu có thể là nhiễu hệ thống, bị mờ do lệch tiêu điểm camera, nhiễu ngẫu nhiên do chuyển động giữa camera và đối tượng được chụp, nhiễu do khí quyển…
Khôi phục ảnh là dùng các bộ lọc để lọc các ảnh bị nhiễu nhằm giảm tối thiểu sự ảnh hưởng của các loại nhiễu này để cho ra ảnh kết quả càng gần giống ảnh gốc càng tốt Hiệu quả của các bộ lọc khôi phục ảnh phụ thuộc vào sự nhận biết về
Trang 19quá trình nhiễu cùng với quá trình thu nhận ảnh Khôi phục ảnh thường được xử lý trên miền tần số là chủ yếu Bao gồm các kỹ thuật lọc ngược, lọc bình phương tối thiểu (Wiener)
1.1.2.4 Biến đổi ảnh
Biến đổi ảnh là việc sử dụng một lớp các ma trận đơn vị và các kỹ thuật thường dùng để biến đổi ảnh như: Biến đổi Fourier, Sin, Cosin, tích Kronecker, biến đổi Karhumen Loeve…
1.1.2.5 Phân tích ảnh
Là khâu quan trọng trong quá trình xử lý ảnh để tiến tới hiểu ảnh Trong phân tích ảnh việc trích chọn đặc điểm là một bước quan trọng Các đặc điểm của đối tượng được trích chọn tuỳ theo mục đích nhận dạng trong quá trình xử lý ảnh
Có thể nêu ra một số đặc điểm của ảnh sau đây:
Đặc điểm không gian: Phân bố mức xám, phân bố xác suất, biên độ, điểm
uốn…
Đặc điểm biến đổi: Các đặc điểm loại này được trích chọn bằng việc thực
hiện lọc vùng (zonal filtering) Các bộ vùng được gọi là “mặt nạ đặc điểm” (feature mask) thường là các khe hẹp với hình dạng khác nhau (chữ nhật, tam giác, cung tròn )
Đặc điểm biên và đường biên: Đặc trưng cho đường biên của đối tượng và
do vậy rất hữu ích trong việc trích trọn các thuộc tính bất biến được dùng khi nhận dạng đối tượng Các đặc điểm này có thể được trích chọn nhờ toán tử gradient, toán
tử la bàn, toán tử Laplace, toán tử “chéo không” (zero crossing) v.v
Việc trích chọn hiệu quả các đặc điểm giúp cho việc nhận dạng các đối tượng ảnh chính xác, với tốc độ tính toán cao và dung lượng nhớ lưu trữ giảm xuống
Phân tích ảnh là quá trình suy luận, tính toán dựa vào các đặc tính thể hiện trên hình ảnh để từ đó rút ra được các thông tin định lượng về hình ảnh
Trang 20Phân tích ảnh có thể tách biệt các vật thể trên ảnh, đo lường, phân loại, mô
tả, so sánh chúng
Mặt khác, từ việc phân tích ảnh cũng có thể suy ra các số liệu thống kê về hình ảnh Liên quan đến việc xác định các độ đo định lượng của một ảnh để đưa ra một mô tả đầy đủ về ảnh Có nhiều kỹ thuật khác nhau hỗ trợ phân tích ảnh như: các
kỹ thuật lọc,các kỹ thuật tách, hợp dựa trên các tiêu chuẩn đánh giá về màu sắc, cường độ, kết cấu… và các kỹ thuật phân lớp dựa theo cấu trúc Phân vùng ảnh là một hướng riêng của phân tích ảnh Phân vùng ảnh bao gồm các kỹ thuật phân tách các vùng của ảnh thành những vùng có những nét đặc trưng của nó hoặc tách biệt hoàn toàn giữa các vùng ảnh này với các vùng ảnh khác trên ảnh và nền Mục đích
là giúp cho dễ quan sát và dễ xử lý và hỗ trợ cho các giai đoạn tiếp theo của hệ thống xử lý ảnh
1.1.2.6 Nhận dạng ảnh
Là một khoa học nhằm trang bị phương pháp luận để trang bị cho máy tính
có khả năng nhận thức Nhận dạng tự động (automatic recognition), mô tả đối tượng, phân loại và phân nhóm các mẫu là những vấn đề quan trọng trong thị giác máy, được ứng dụng trong nhiều ngành khoa học khác nhau Các đối tượng nhận dạng là các mẫu đối tượng Tuy nhiên, một câu hỏi đặt ra là: mẫu (pattern) là gì? Watanabe, một trong những người đi đầu trong lĩnh vực này đã định nghĩa: “Ngược lại với hỗn loạn (chaos), mẫu là một thực thể (entity), được xác định một cách ang áng (vaguely defined) và có thể gán cho nó một tên gọi nào đó” Ví dụ mẫu có thể
là ảnh của vân tay, ảnh của một vật nào đó được chụp, một chữ viết, khuôn mặt người hoặc một ký đồ tín hiệu tiếng nói Khi biết một mẫu nào đó, để nhận dạng hoặc phân loại mẫu đó có thể:
Hoặc phân loại có mẫu (supervised classification), chẳng hạn phân tích phân biệt (discriminant analyis), trong đó mẫu đầu vào được định danh như một thành phần của một lớp đã xác định
Hoặc phân loại không có mẫu (unsupervised classification hay clustering) trong đó các mẫu được gán vào các lớp khác nhau dựa trên một tiêu chuẩn đồng
Trang 21dạng nào đó Các lớp này cho đến thời điểm phân loại vẫn chưa biết hay chưa được định danh
Nhận dạng đối tượng ảnh quá trình từ không gian biểu diễn lớp đối tượng vào không gian tên gọi của đối tượng (mỗi đối tượng được gán một cái tên) Hay nói một cách khác nhận dạng đối tượng chính là quá trình tiến hành phân lớp đối tượng cần nhận dạng vào các lớp Có hai lớp phương pháp tiếp cận chính trong quá trình phân lớp các đối tượng, đó là các phương pháp phân lớp dựa vào đường ranh giới phân biệt giữa các lớp (Nơ ron network, phương pháp véc tơ tựa, boosting, trường ngẫu nhiên có điều kiện, nhận dạng dựa vào đa nhân…) và các phương pháp phân lớp dựa vào phân bố thống kế của các lớp (mô hình markov ẩn, phương pháp phân loại thống kê, Bayesian, trường marko ngẫu nhiên) Trên cơ sở các bài toán thì sẽ có các mô hình nhận dạng phù hợp và các thuật toán đi kèm các mô hình đó Ngoài ra còn một số cách tiếp cận khác trong lý thuyết nhận dạng đó là đối sánh mẫu dựa trên các đặc trưng được trích chọn, nhận dạng cấu trúc (xâu chuỗi, đồ thị, ) nhận dạng dựa trên biểu diễn ngữ pháp văn phạm
Hệ thống nhận dạng tự động bao gồm 4 khâu tương ứng với bốn giai đoạn chủ yếu sau:
1 Thu nhận dữ liệu , tiền xử lý, trích chọn đặc tính
2 Biểu diễn dữ liệu
3 Huấn luyện dữ liệu
4 Nhận dạng, ra quyết định
Trên thực tế, người ta đã áp dụng kỹ thuật nhận dạng khá thành công với nhiều bài khác nhau như: nhận dạng ảnh vân tay, nhận dạng chữ (chữ cái, chữ số, chữ có dấu) Nhận dạng chữ in hoặc đánh máy phục vụ cho việc tự động hóa quá trình đọc tài liệu, tăng nhanh tốc độ và chất lượng thu nhận thông tin từ máy tính Các bài toán và ứng dung nhận dạng rất phong phú như: Nhận dạng Khuôn mặt, nhận dạng các biểu cảm của con người, nhận dạng các cử chỉ và hoạt động của con
Trang 22người, nhận dạng người đi bộ, xây dựng các hệ thống giám sát thông minh, rô bốt, các hệ thống dự báo dựa vào hình ảnh…
1.1.2.7 Nén ảnh
Ảnh dù ở dạng nào vẫn chiếm không gian nhớ rất lớn Khi mô tả ảnh người ta
đã đưa kỹ thuật nén ảnh vào Nén ảnh là làm giảm lượng số liệu cần để biểu diễn một ảnh Cơ sở của vấn đề nén ảnh là quá trình giảm những số liệu dư thừa Từ quan điểm toán học, đó là biến đổi một dãy pixel 2 chiều thành một tập số liệu không liên kết thống kê Sự biến đổi được áp dụng trước để lưu trữ hoặc truyền ảnh Quá trình sau nén ảnh là giải nén để tạo lại ảnh gốc hoặc một xấp xỉ của ảnh gốc Hiện nay, các chuẩn MPEG được dùng với ảnh đang phát huy hiệu quả
Nhằm giảm thiểu không gian lưu trữ Thường được tiến hành theo cả hai cách khuynh hướng là nén có bảo toàn và không bảo toàn thông tin Nén không bảo toàn thì thường có khả năng nén cao hơn nhưng khả năng phục hồi thì kém hơn Trên cơ
sở hai khuynh hướng, có 4 cách tiếp cận cơ bản trong nén ảnh:
• Nén ảnh thống kê: Kỹ thuật nén này dựa vào việc thống kê tần xuất xuất hiện của giá trị các điểm ảnh, trên cơ sở đó mà có chiến lược mã hóa thích hợp Một ví dụ điển hình cho kỹ thuật mã hóa này là *.TIF
• Nén ảnh không gian: Kỹ thuật này dựa vào vị trí không gian của các điểm ảnh
để tiến hành mã hóa Kỹ thuật lợi dụng sự giống nhau của các điểm ảnh trong các vùng gần nhau Ví dụ cho kỹ thuật này là mã nén *.PCX
• Nén ảnh sử dụng phép biến đổi: Đây là kỹ thuật tiếp cận theo hướng nén không bảo toàn và do vậy, kỹ thuật thướng nến hiệu quả hơn *.JPG chính là tiếp cận theo kỹ thuật nén này
• Nén ảnh Fractal: Sử dụng tính chất Fractal của các đối tượng ảnh, thể hiện sự lặp lại của các chi tiết Kỹ thuật nén sẽ tính toán để chỉ cần lưu trữ phần gốc ảnh và quy luật sinh ra ảnh theo nguyên lý Fractal
Trang 231.1.3 Các ứng dụng của xử lý ảnh
Xử lý ảnh có nhiều ứng dụng trong thực tế Một trong những ứng dụng sớm nhất là xử lý ảnh từ nhiêm vụ Ranger 7 tại phòng thí nghiệm JetPulsion vào những năm đầu của thập kỷ 60 Hệ thống chụp hình gắn trên tàu vũ trụ có một số hạn chế
về kích thước và trọng lượng, do đó ảnh nhận được bị giảm chất lượng như bị mờ, méo hình học và nhiễu nền Các ảnh đó được xử lý thành công nhờ máy tính số Hình ảnh của mặt trăng và sao hỏa mà chúng ta thấy trong tất cả các tạp chí đều được xử lý bằng những máy tính số Ngày nay, hầu hết các thông tin ảnh đều được chuyển sang dạng ảnh số Vì vậy, trong gần như tất cả các lĩnh vực của các ngành
kỹ thuật đều có ít nhiều liên quan đến ảnh số và sử dụng kỹ thuật xử lý ảnh số Ứng dụng của xử lý ảnh có khả năng tác động mạnh mẽ nhất đến cuộc sống của chúng ta
là lĩnh vực y tế Soi chụp ảnh bừng máy tính dựa rteen cơ sở định lý cắt lớp (project slice) được dùng thường xuyên trong xét nghiệm lâm sang, ví dụ phát hiện và nhận dạng u não Những ứng dụng y khoa khác của xử lý ảnh gồm cải thiện ảnh X quang
và nhận dạng đường biên mạch máu từ những ảnh chụp bằng tia X (angiograms)
Có những dụng khác gần gủi hơn với cuộc sông gia đình là cải tiến ảnh tivi Hình ảnh mà chúng ta thấy trên màn hình tivi có các khuyết tật do độ phân giải hạn chế, bi rung rinh, có ảnh ma, nhiều nền và trượt hình do đan dòng ở những mức độ khác nhau Xử lý ảnh sô có tác động quyết định đến việc cải thiện chất lượng hình ảnh của những hệ truyền hình hiện tại và làm phát triển những hệ truyền hình mới
có độ phân giải cao (HDTV) Một vấn đề nữa cúa chính truyền thông video như hội nghị video, điện thoại video là cần có dải tần rộng Việc mã hóa thẳng chương trình video chất lượng quảng bá yêu cầu đến 100 triệu bit/giây Nếu hy sinh một phần chất lượng và dùng các sơ đô mã hóa ảnh số thì có thể đưa ra thị trường những hệ truyền hình chất lượng đủ rõ với nhịp bit chỉ dưới 100 nghìn bit/giây
Người máy càng ngày đóng vai trò quan trọng trong công nghiệp và gia đinh Chúng sẽ thực hiện những công việc rất nhàm chán hoặc nguy hiểm và những công việc mà tốc độ và độ chính xác vượt quá khả năng của con người Khi người máy trở nên tinh vi hơn, thị giác máy tinh sẽ đóng vai trò ngày càng quan trọng Người ta
sẽ đòi hỏi người máy không những phát hiện và nhận dạng các bộ phận công
Trang 24nghiệp, mà còn “hiểu” được những gì chúng “thấy” và đưa ra những hành động phù hợp Xử lý ảnh số có tác động rất lớn đến thị giác máy tính
Ngoài những lĩnh vực ứng dụng mọi người thường biết đến, xử lý ảnh số còn
có một số ứng dụng khác ít được nói đến hơn Người thi hành pháp luật thương chụp hình trong những môi trường không thuận lợi, và ảnh nhận được thường bị xuống cấp Ví dụ, bức ảnh chụp thường bị nhòe, việc làm giảm độ nhòe là cần thiết trong nhận dạng
Những ứng dụng của xử lý ảnh số là rất lớn Ngoài những ứng dụng đã thảo luận ở trên thì còn bao gồm các ứng dụng trong các lĩnh vực như điện tử gia đình, thiên văn học, sinh vật học, vật lý, nông nghiệp, địa lý, nhân chủng học, và nhiều lĩnh vực khác Khả năng nhìn và nghe thấy hà hai phương tiện quan trọng nhất để con người nhận thức thế giới bên ngoài, do vậy không có gì đáng ngạc nhiên khi mà
xử lý ảnh số có nhiều khả năng ứng dụng, không chỉ trong khoa học và kỹ thuật mà còn cả trong mọi hoạt động khác của con người
1.1.4 Quan hệ cơ bản giữa các điểm ảnh
Một ảnh số giả sử được biểu diễn bằng hàm f(x, y) Tập con các điểm ảnh là S; cặp điểm ảnh có quan hệ với nhau ký hiệu là p, q
Chúng ta nêu một số các khái niệm sau
1.1.4.1 Các lân cận của điểm ảnh (Image Neighbors)
* Giả sử có điểm ảnh p tại toạ độ (x, y) p có 4 điểm lân cận gần nhất theo chiều đứng và ngang (có thể coi như lân cận 4 hướng chính: Đông, Tây, Nam, Bắc)
{(x-1, y); (x, y-1); (x, y+1); (x+1, y)} = N 4 (p)
trong đó: số 1 là giá trị logic; N4(p) tập 4 điểm lân cận của p
Trang 25Đông x Tây
Nam
y
Bắc
Hình 1.2 Lân cận các điểm ảnh của tọa độ (x,y)
* Các lân cận chéo: Các điểm lân cận chéo NP(p) (Có thể coi lân cận chéo la 4 hướng: Đông-Nam, Đông-Bắc, Tây-Nam, Tây-Bắc)
Np(p) = { (x+1, y+1); (x+1, y-1); (x-1, y+1); (x-1, y-1)}
* Tập kết hợp: N8(p) = N4(p) + NP(p) là tập hợp 8 lân cận của điểm ảnh p
* Chú ý: Nếu (x, y) nằm ở biên (mép) ảnh; một số điểm sẽ nằm ngoài ảnh
1.1.4.2 Các mối liên kết điểm ảnh
Các mối liên kết được sử dụng để xác định giới hạn (Boundaries) của đối tượng vật thể hoặc xác định vùng trong một ảnh Một liên kết được đặc trưng bởi tính liền kề giữa các điểm và mức xám của chúng
Giả sử V là tập các giá trị mức xám Một ảnh có các giá trị cường độ sáng từ thang mức xám từ 32 đến 64 được mô tả như sau :
V={32, 33, … , 63, 64}
Có 3 loại liên kết
* Liên kết 4: Hai điểm ảnh p và q được nói là liên kết 4 với các giá trị cường
độ sáng V nếu q nằm trong một các lân cận của p, tức q thuộc N4(p)
* Liên kết 8: Hai điểm ảnh p và q nằm trong một các lân cận 8 của p, tức q thuộc N8(p)
Trang 26* Liên kết m (liên kết hỗn hợp): Hai điểm ảnh p và q với các giá trị cường độ sáng V được nói là liên kết m nếu
1 q thuộc N 4 (p) hoặc
2 q thuộc N P (p)
1.1.4.3 Đo khoảng cách giữa các điểm ảnh
Định nghĩa: Khoảng cách D(p, q) giữa hai điểm ảnh p toạ độ (x, y), q toạ độ
(s, t) là hàm khoảng cách (Distance) hoặc Metric nếu:
1 D(p,q) ≥ 0 (Với D(p,q)=0 nếu và chỉ nếu p=q)
Như vậy, khoảng cách điểm ảnh lân cận của CGA 12” là ≈ 1mm
Trang 27Khoảng cách D8(p, q) còn gọi là khoảng cách bàn cờ (Chess-Board Distance) giữa điểm ảnh p, q được xác định như sau:
Phân vùng có thể được tiếp cận từ hai quan điểm: bằng cách nhận dạng các đường biên (hoặc đường) hoặc bằng cách nhận ra các vùng (region, area) bên trong ảnh Các phép toán phân vùng có thể xem như là đối ngẫu của các phép toán tìm biên (hay tách cạnh), bởi vì khi tìm biên được kết thúc, điều đó tương đương với việc tách một vùng làm hai Một cách lý tưởng, các phép toán tách cạnh và phân vùng sẽ cho cùng một kết quả phân đoạn, tuy nhiên trong thực tế ít khi đạt được như vậy
Vùng ảnh là tập hợp các điểm ảnh có thuộc tính tương tự (gần giống nhau)
Ta có thể xem một ảnh X chính là một tập các điểm ảnh pi, ký hiệu X= { p i }, i∈ [1, N.M], với N.M là kích thước của hình ảnh Như vậy, phân vùng ảnh là quá trình tìm các tập con Ri ={ tập các điểm ảnh có thuộc tính tương tự} của các vùng ảnh sao cho:
𝐾 𝑅𝑖 = 𝑋
𝑖=1 𝑣à 𝑅𝑖 𝑅𝑗 , ∀𝑖 ≠ 𝑗, 𝑖, 𝑗 = 1 … 𝐾 , với K là số vùng của ảnh X
Trang 28Phân vùng ảnh là quá trình xử lý một ảnh số thành một tập các vùng, mỗi vùng là một tập hợp các điểm ảnh Chính xác hơn, phân vùng ảnh là quá trình gán nhãn cho mỗi điểm ảnh trong ảnh sao cho các điểm ảnh có các thuộc tính tương tự nhau thì có cùng một nhãn Đường bao quanh một vùng ảnh được gọi là đường biên
Cơ sở toán học ở đây là chỉ tiêu phân vùng dựa trên độ đo sự tương tự giữa các thuộc tính Thuộc tính quan trọng là thuộc tính biên độ của hàm độ sáng (hàm
độ sáng ít biến thiên – tương tự)
a) Ảnh gốc b) Kết quả sau khi phân vùng
Hình 1.3 Một ví dụ về phân vùng ảnh
1.2.2 Các phương pháp tiếp cận
Dựa vào đặc tính vật lý của ảnh, người ta có nhiều kỹ thuật phân vùng: phân vùng dựa theo miền liên thông gọi là phân vùng dựa theo miền đồng nhất hay miền kề; phân vùng dựa vào biên gọi là phân vùng biên Ngoài ra còn có các kỹ thuật phân vùng khác dựa vào biên độ, phân vùng dựa theo kết cấu
Phương pháp phân vùng ảnh được chia thành hai hướng:
Trang 29 Phương pháp phân vùng trực tiếp (phân vùng dựa trên độ tương tự về thuộc
tính):
Có nhiều phương pháp phân vùng ảnh như phân vùng ảnh dựa vào ngưỡng biên bộ, phân vùng dựa theo miền liên thông hay còn gọi là phân vùng dựa theo miền đồng nhất hoặc là phân vùng miền liền kề, có thể liệt kê các phương pháp như sau:
- Phân vùng ảnh theo ngưỡng biên độ
- Phân lớp điểm ảnh
- Phân vùng dựa trên cấu trúc đồ thị
- Phân vùng dựa trên xử lý đa phân giải
- Phân vùng dựa trên phân tích kết cấu
- Phân vùng dựa vào phát hiện đối tượng trong ảnh
- Phương pháp cấu trúc
Phương pháp phân vùng gián tiếp: Phân vùng dựa trên tách biên
Phân vùng dựa trên tách biên Hay nói một cách khác, phân vùng ảnh và đường biên có tính chất đối ngẫu, nếu như tôi phát hiện được đường biên thì dựa vào biên có thể xác định vùng ảnh hoặc nếu như tôi phân vùng ảnh thì đường bao quanh vùng ảnh đó được gọi là đường biên Ngoài ra còn có các phương pháp phân vùng khác như phân vùng ảnh sử dụng bộ lọc tối ưu; phân vùng ảnh thông qua biểu diễn bề mặt
Việc phân vùng ảnh dựa vào đường biên thì có ưu điểm nhanh, đơn giản và câu hỏi chính đặt ra ở đây là làm sao xác định được các ngưỡng biên độ để phân vùng ảnh? Ngoài ra phân vùng ảnh dựa vào ngưỡng biên bộ thì rất nhạy cảm với nhiễu Đối với các loại ảnh tự nhiên thì đường biểu diễn biên của các vùng rất phức tạp (đường răng cưa) Chính vì thế phương pháp dựa vào ngưỡng không hiệu quả trong phân vùng những loại ảnh này Thông thường, kỹ thuật phân ngưỡng theo
Trang 30biên độ rất có lợi đối với ảnh nhị phân như văn bản in, đồ họa, ảnh màu hay ảnh X
- quang Việc chọn ngưỡng rất quan trọng và bao gồm nhiều bước Như vậy, có thể dùng ngưỡng biên độ để phân vùng khi biên độ đủ lớn
Phương pháp phân vùng ảnh thành các miền đồng nhất dựa vào các tính chất quan trọng nào đó của miền ảnh Việc lựa chọn các tính chất của miền sẽ xác định tiêu chuẩn phân vùng Tính đồng nhất của một miền ảnh là điểm chủ yếu xác định tính hiệu quả của việc phân vùng Các tiêu chuẩn hay được dùng là sự đồng nhất về mức xám, màu sắc
1.2.2.1 Phân vùng ảnh theo ngƣỡng biên độ
Các đặc tính đơn giản, cần thiết nhất của ảnh là biên độ và các tính chất vật
lý như: độ tương phản, độ truyền sáng, màu sắc hoặc đáp ứng phổ Như vậy, có thể dùng ngưỡng biên độ để phân vùng khi biên độ đủ lớn đặc trưng cho ảnh Thí dụ, biên độ trong bộ cảm biến ảnh hồng ngoại có thể phản ánh vùng có nhiệt độ thấp hay vùng có nhiệt độ cao Kỹ thuật phân ngưỡng theo biên độ rất có lợi đối với ảnh nhị phân như văn bản in, đồ họa, ảnh màu hay ảnh X-quang
Việc chọn ngưỡng rất quan trọng Nó bao gồm các bước :
Xem xét lược đồ xám của ảnh để xác định các đỉnh và các khe Nếu ảnh có dạng rắn lượn (nhiều đỉnh và khe), các khe có thể dùng để chọn ngưỡng
Chọn ngưỡng t sao cho một phần xác định trước η của toàn bộ số mẫu là thấp hơn t
Điều chỉnh ngưỡng dựa trên lược đồ xám của các điểm lân cận
Chọn ngưỡng theo lược đồ xám của những điểm thỏa mãn tiêu chuẩn chọn Thí dụ, với ảnh có độ tương phản thấp, lược đồ của những điểm có biên độ Laplace g(m,n) lớn hơn giá trị t định trước (sao cho từ 5% đến 10% số điểm ảnh với Gradient lớn nhất sẽ coi như biên) sẽ cho phép xác định các đặc tính ảnh lưỡng cực tốt hơn ảnh gốc
Trang 31 Khi có mô hình phân lớp xác suất, việc xác định ngưỡng dựa vào tiêu chuẩn xác suất nhằm cực tiểu xác suất sai số hoặc dựa vào một số tính chất khác của luật Bayes
Để hiểu rõ hơn nguyên tắc phân vùng dựa vào ngưỡng biên độ, xét thí dụ sau:
1.2.2.2 Phân vùng theo miền đồng nhất
Kỹ thuật phân vùng ảnh thành các miền đồng nhất dựa vào các tính chất quan trọng nào đó của miền ảnh Việc lựa chọn các tính chất của miền sẽ xác định tiêu chuẩn phân vùng Tính đồng nhất của một miền ảnh là điểm chủ yếu xác định tính hiệu quả của việc phân vùng Các tiêu chuẩn hay được dùng là sự thuần nhất về mức xám, màu sắc đối với ảnh màu, kết cấu sợi và chuyển động
Các phương pháp phân vùng ảnh theo miền đồng nhất thường áp dụng là :
Phương pháp tách cây tứ phân
Trang 32 Phương pháp cục bộ
Phương pháp tổng hợp
a) Phương pháp tách cây tứ phân
Về nguyên tắc, phương pháp này kiểm tra tính đúng đắn của tiêu chuẩn đề ra một cách tổng thể trên miền lớn của ảnh Nếu tiêu chuẩn được thỏa mãn, việc phân đoạn coi như kết thúc Trong trường hợp ngược lại, chia miền đang xét thành 4 miền nhỏ hơn Với mỗi miền nhỏ, áp dụng một cách đệ quy phương pháp trên cho đến khi tất cả các miền đều thỏa mãn điều kiện
Phương pháp này có thể mô tả như sau :
Procedure PhanDoan(Mien)
Begin
If miền đang xét không thỏa Then
Begin
Chia miền đang xét thành 4 miền : Z 1 , Z 2 , Z 3 , Z 4
For i=1 to 4 do PhanDoan (Z i )
Trang 33Thuật toán kiểm tra tiêu chuẩn dựa vào độ chênh lệch max, min được viết:
If I[i,j] < Min Then Min=I[i,j] ;
If I[i,j] < Max Then Max=I[i,j] ;
3 If ABS(Max–Min)<T Then Examin_Criteria=0
Else Examin_Criteria=1 ;
End
Nếu hàm trả về giá trị 0, có nghĩa vùng đang xét là đồng nhất, nếu không thì không đồng nhất Trong giải thuật trên, khi miền là đồng nhất cần tính lại giá trị trung bình và cập nhật lại ảnh đầu ra Giá trị trung bình được tính bởi :
Tổng giá trị mức xám / tổng số điểm ảnh trong vùng
Thuật toán này tạo nên một cây mà mỗi nút cha có 4 nút con ở mọi mức trừ mức ngoài cùng Vì thế, cây này có tên là cây tứ phân Cây cho ta hình ảnh rõ nét về cấu trúc phân cấp của các vùng tương ứng với tiêu chuẩn
Một vùng thỏa mãn điều kiện sẽ tạo nên một nút lá; nếu không nó sẽ tạo nên một nút trong và có 4 nút con tương ứng Tiếp tục như vậy cho đến khi phân chia xong để đạt các vùng đồng nhất
Trang 34b) Phân vùng ảnh dựa vào phát triển vùng cục bộ
Ý tưởng của phương pháp là xét ảnh từ các miền nhỏ nhất rồi nối chúng lại nếu thỏa mãn tiêu chuẩn để được một miền đồng nhất lớn hơn Tiếp tục với các miền thu được cho đến khi không thể nối thêm được nữa Số miền còn lại cho ta kết quả phân đoạn Như vậy, miền nhỏ nhất của bước xuất phát là điểm ảnh Phương pháp này hoàn toàn ngược với phương pháp tách Song điều quan trọng ở đây là nguyên lý nối 2 vùng Việc nối 2 vùng được thực hiện theo nguyên tắc sau :
- Hai vùng phải đáp ứng tiêu chuẩn, thí dụ như cùng màu hay cùng mức xám
- Hai vùng phải kế cận nhau
Khái niệm kế cận: trong xử lý ảnh, người ta dùng khái niệm liên thông để xác định tính chất kế cận Có hai khái niệm về liên thông là 4 liên thông và 8 liên thông Với 4 liên thông một điểm ảnh I(x,y) sẽ có 4 kế cận theo 2 hướng x và y ; trong khi đó với 8 liên thông, điểm I(x,y) sẽ có 4 liên thông theo 2 hướng x, y và 4 liên thông khác theo hướng chéo 450
(a) 4 liên thông (b) 8 liên thông
Hình 1.5 Khái niệm 4 liên thông và 8 liên thông
Dựa theo nguyên lý của phương pháp nối, ta có 2 thuật toán :
- Thuật toán tô màu (Blob Coloring) : sử dụng khái niệm 4 liên thông, dùng một cửa sổ di chuyển trên ảnh để so sánh với tiêu chuẩn nối
- Thuật toán đệ quy cực bộ: sử dụng phương pháp tìm kiếm trong một cây để làm tăng kích thước vùng
Trang 35c) Phương pháp phân vùng dựa trên hợp và tách vùng
Hai phương pháp nối (hợp) và tách đều có nhược điểm Phương pháp tách sẽ tạo nên một cấu trúc phân cấp và thiết lập mối quan hệ giữa các vùng Tuy nhiên,
nó thực hiện việc chia quá chi tiết Phương pháp hợp cho phép làm giảm số miền liên thông xuống tối thiểu, nhưng cấu trúc hàng ngang dàn trải, không cho ta thấy rõ mối liên hệ giữa các miền Vì nhược điểm này, người ta nghĩ đến phối hợp cả 2 phương pháp Trước tiên, dùng phương pháp tách để tạo nên cây tứ phân, phân đoạn theo hướng từ gốc đến lá Tiếp theo, tiến hành duyệt cây theo chiều ngược lại và hợp các vùng có cùng tiêu chuẩn Với phương pháp này ta thu được một cấu trúc ảnh với các miền liên thông có kích thước tối đa Giải thuật tách hợp gồm một số bước chính sau:
1 Kiểm tra tiêu chuẩn đồng nhất
Nếu không thỏa mãn tiêu chuẩn đồng nhất và số điểm trong một vùng nhiều hơn 1, tách vùng ảnh làm 4 miền (trên, dưới, phải, trái) bằng cách
đệ quy Nếu kết quả tách xong và không tách được nữa chuyển sang bước
Nếu tiêu chuẩn đồng nhất thỏa mãn thì tiến hành hợp vùng và cập nhật lại giá trị trung bình của vùng cho vùng này
2 Hợp vùng
Kiểm tra 4 lân cận như đã nêu trên Có thể có nhiều vùng thỏa mãn Khi
đó, chọn vùng tối ưu nhất rồi tiến hành hợp
1.2.2.3 Phân vùng ảnh dựa trên phân tích kết cấu
Kết cấu thường được nhận biết trên bề mặt của các đối tượng như gỗ, cát, vải vóc…Kết cấu là thuật ngữ phản ánh sự lặp lại của các phần tử mẫu kết cấu cơ bản
Sự lặp lại này có thể ngẫu nhiên hay có tính chu kì hoặc gần chu kì Một mẫu kết cấu chứa rất nhiều điểm ảnh Trong phân tích ảnh, kết cấu được chia làm hai loại chính là: loại thống kê và loại cấu trúc
Trang 36a) Phương pháp thống kế
Tính kết cấu ngẫu nhiên rất phù hợp với các đặc trưng thống kê Vì vậy, người
ta có thể dùng các đặc trưng ngẫu nhiên để đo nó như: Hàm tự tương quan (AutoCorrelation Function- ACF), các biến đổi mật độ gờ, ma trận tương tranh,… Theo cách tiếp cận bằng hàm tự tương quan, độ thô của kết cấu sợi tỉ lệ với độ rộng của ACF, được biểu diễn bởi khoảng cách x0, y0 sao cho r(x0,0) = r(0,y0) = 1 Người
ta cũng dùng cách đo nhánh của ACF nhờ hàm khởi sinh moment:
𝑀 𝑘, 𝑙 = 𝑛 − 𝜇1 𝑘 𝑚 − 𝜇2 𝑟 𝑛, 𝑚
𝑚 𝑛
𝑣ớ𝑖 𝜇1 = 𝑛 𝑟 𝑛, 𝑚 𝑣à 𝜇𝑛 2 = 𝑚 𝑟 𝑛, 𝑚 𝑛
Các đặc trưng của kết cấu sợi như độ thô, độ mịn hay hướng có thể ước lượng nhờ các biến đổi ảnh bằng kỹ thuật lọc tuyến tính Một mô hình đơn giản trong trường hợp ngẫu nhiên cho việc phân tích tính kết cấu được mô tả trong hình dưới đây:
Hình 1.6 Phân tích kết cấu bằng dải tương quan
Trong mô hình này, trường kết cấu sợi trước tiên được giải chập bởi bộ lọc lấy từ đầu ra của ACF Như vậy, nếu r(m,n) là ACF thì u(n, m) a(n, m) = ε(n, m)
là trường ngẫu nhiên không tương quan
Lưu ý rằng, bộ lọc là không duy nhất, có thể là nhân quả, bán nhân quả hay không nhân quả Các ACF hay dùng như M(0, 2), M(2, 0), M(1, 1), M(2, 2)
Các đặc trưng của lược đồ bậc một của ε(n, m) chẳng hạn như trung bình m1, độ
Trang 37phân tán 𝜇2 cũng hay được sử dụng Ngoài các đặc trưng trên, có thể đưa thêm một số khái niệm và định nghĩa các đại lượng dựa trên đó như: lược đồ mức xám (Histogram Grey Level Difference), ma trận xuất hiện mức xám
Lược đồ hiệu mức xám
Lược đồ hiệu mức xám dùng để mô tả các thông tin mang tính không gian và
được định nghĩa như sau Cho d = (d 1 , d 2 ) là vecto dịch chuyển giữa 2 điểm ảnh và
g(d) là hiệu mức xám với khoảng cách d: g(d) = |f(k,l) – f(k+d 1 , l+d 2 )| với hàm f(k,
l) cho giá trị mức xám tại tọa độ (k, l) Gọi hg(g, d) là lược đồ của hiệu mức xám khoảng cách d Với mỗi khoảng cách d ta có một lược đồ mức xám riêng Với một miền ảnh có kết cấu thô, lược đồ hg(g, d) có khuynh hướng tập trung xung quanh g=0 với khoảng cách d nhỏ Trái lại, với một miền ảnh có kết cấu mịn, hg(g, d) sẽ phân nhánh dù với vecto dịch chuyển d khá nhỏ Dựa trên lược đồ này, người ta định nghĩa lại một số đại lượng :
là mômen của lược đồ hg(g, d) xung quanh g = 0 và đo độ tương phản của hiệu mức xám Người ta sử dụng entropy để đo độ đồng nhất cảu lược đồ hg:
𝐻𝑔 = − ℎ𝑔(𝑔𝑘, 𝑑)ln(ℎ𝑔
𝑁
𝑘=1
(𝑔𝑘, 𝑑))
Ưu điểm cơ bản của lược đồ hiệu mức xám là tính toán đơn giản Ngoài ra còn
có khả năng cho ta tổ chức kết cấu không gian
Ma trận xuất hiện liên hiệp mức xám
Giả sử P(k, l, d) là xác suất liên hiệp của hai điểm ảnh f k và f 1 với các mức xám
Trang 38k,l tương ứng cách nhau một khoảng d Xác suất này dễ dàng tính được nhờ việc
tính số lần xuất hiện n k,l của cặp điểm ảnh (f k , f 1 ) có mức xám k và l với khoảng cách
d Gọi n là tổng số cặp liên hiệp có thể với khoảng cách d trong ảnh Các phần tử c k,l của ma trận xuất hiện liên hiệp mức xám c d được tính như sau : c d = (c k,l ) và
c k,l =P(k,l,d)=n k,l /n Ma trận xuất hiện liên hiệp mức xám C d là ma trận vuông N x N phần tử (N là số mức xám của ảnh) Ma trận này chứa các thông tin hữu ích về tổ chức kết cấu không gian Nếu kết cấu tương đối thô thì các phần tử của ma trận tập trung xung quanh đường chéo chính Ngược lại, nếu kết cấu bề mặt mịn, giá trị các
phần tử của c d sẽ phân rải tương đối rõ Dựa trên khái niệm này người ta định nghĩa
I d cực tiểu khi các phân tử của ma trận C tập trung trên đường chéo chính vì
khoảng cách |k-l|m rất nhỏ, I d nhỏ có nghĩa là kết cấu khá thô Người ta cũng còn đưa vào một số độ đo khác như hàm tự tương quan, phổ năng lượng Để áp dụng cách tiếp cận này, cần cài đặt các giải thuật tính các đại lượng đo trên
b) Phương pháp cấu trúc
Kết cấu sợi có cấu trúc thuần nhất là những mấu kết cấu xác định, mà sự xuất hiện lặp đi lặp lại tuân theo một luật tất định hay ngẫu nhiên nào đấy Một mẫu kết cấu về thực tế là một nhóm các điểm ảnh có cùng một số tính chất bất biến lặp trên ảnh Một mẫu kết cấu cũng có định nghĩa theo mức xám, theo bề mặt hay tính đồng nhất đối với một số các tính chất như kích thước, hướng, lược đồ bậc hai (ma trận tương tranh) Với các mẫu kết cấu được phân bố ngẫu nhiên, tính kết cấu sợi tương ứng của nó được coi là yếu (Weak) ngược với qui luật phân bố tất định gọi là mạnh (Strong) Khi tính kết cấu sợi là yếu, luật phân bố có thể đo bởi:
- Mật độ gờ
Trang 39- Các loạt dài của các mẫu kết cấu liên thông tối đa
- Mật độ cực trị tương đối; số pixel trên một đơn vị diện tích có mức xám cực trị địa phương so với các lân cận
Ngoài hai cách tiếp cận trên, người ta còn dùng cách tiếp cận khác bằng cách lấy tổ hợp 2 cách trên và gọi là kỹ thuật mosaic Mô hình này biểu diễn các quá trình học ngẫu nhiên, thí dụ như khảm ngẫu nhiên hay đều của một mặt phẳng vào các đường cong lồi sẽ làm nổi lên tính kết cấu tế bào
c) Tiếp cận theo tính kết cấu
Khi đối tượng xuất hiện trên một nền có tính kết cấu cao, việc phân đoạn dựa vào tính kết cấu trở nên quan trọng Nguyên nhân là kết cấu sợi thường chứa mật độ cao các gờ (edge) làm cho phân đoạn theo biên kém hiệu quả, trừ phi ta loại tính kết cấu Việc phân đoạn dựa vào miền đồng nhất cũng có thể áp dụng cho các đặc trưng kết cấu và có thể dùng để phân đoạn các miền có tính kết cấu
Nhìn chung, việc phân loại và phân vùng dựa vào kết cấu là một vấn đề phức tạp
Ở đây, tài liệu chỉ mang tính chất giới thiệu Có thể giải quyết vấn đề này trong thực tế nếu ta biết trước các loại kết cấu (dựa vào quy luật hay các phân bố của nó)
1.2.2.4 Phân vùng ảnh dựa trên sự phân lớp điểm ảnh
a) Mô hình bài toán:
Cho ảnh X ={p i } , i ∈ [1,N.M] , với N là chiều rộng của ảnh và M là chiều cao
của ảnh, p i là điểm ảnh thứ i và A(p i ) là thuộc tính của p i Đối tượng phân lớp ở
đây là các p i
Phân vùng ảnh X chính là phân lớp tập X thành các lớp Ci sao cho từ Ci phát triển thành các vùng Ri Chỉ tiêu phân lớp ở đây chính là độ đồng đều (tương tự) về thuộc tính của các điểm ảnh
Trang 40Quá trình phân lớp có thể sử dụng các phương pháp học máy và quyết định phân lớp
b) Phân lớp điểm ảnh trong không gian thuộc tính một chiều
Trong phần này sẽ giới thiệu một thuật toán vùng dựa trên sự phân lớp các
điểm ảnh trên nguyên tắc phân tích tự tổ chức theo nguyên tắc lặp (ISODATA –
Interactive Seft Organization DATa Analysis)
Thuật toán ISODATA trong phân vùng ảnh:
Đầu vào: X={p i }, i[1,N.M], A(p i ) là gia trị mức xám của p i
Chọn các giá trị ngưỡng ban đầu của các lớp theo nguyên tắc sau:
T 0 =l min , T K =l max và T i (t)= 𝑖.𝑙𝑚𝑎𝑥 −𝑙𝑚𝑖𝑛
𝐾 + 𝑇0 , với i=1…K-1
2 Bước lặp
Thực hiện phân lớp điểm theo các ngưỡng Ti(t-1)
P iC k nếu T i (t-1) ≤ A(p i )≤T i+1 (t-l),k[l,K]
Tính giá trị trung bình của mỗi lớp tại thời điểm t