Ứng dụng trong các lĩnh vực khoa học, hình sự, kinh tế như các chương trình xử lý, nhận dạng vân tay, nhận dạng các loại tem sản phẩm… Quá trình xử lý ảnh bao gồm nhiều giai đoạn khác nh
Trang 1MỤC LỤC
MỞ ĐẦU 3
Chương 1 5
TỔNG QUAN VỀ PHÂN ĐOẠN ẢNH 5
1.1 Đối tượng ảnh 6
1.2 Biểu đồ cột của các giá trị xám (Histogram) 6
1.3 Làm trơn và tăng độ tương phản 7
1.4 Biểu đồ cột độ bó chặt 7
Chương 2 9
MỘT SỐ PHƯƠNG PHÁP PHÂN ĐOẠN ẢNH 9
2.1 Phân vùng ảnh dựa theo ngưỡng biên độ 9
2.1.1 Ngưỡng cố định 10
2.1.2 Ngưỡng tự động 11
2.1.2.1 Phương pháp sử dụng các điểm biên 11
2.1.2.2 Phương pháp lặp 12
2.1.2.3 Phương pháp sử dụng biểu đồ mức xám 13
2.2 Phương pháp nới lỏng 14
2.3 Phương pháp phân vùng theo miền đồng nhất 15
2.3.1 Cơ sở 16
2.3.2 Phương pháp tách cây tứ phân( quad tree) 16
2.3.3 Phương pháp phân vùng bởi hợp 21
2.3.3.1 Thuật toán tô mầu 22
2.3.3.2 Thuật toán đệ quy cục bộ 23
2.3.4 Phương pháp tách hợp 24
2.4 Phân vùng dựa theo đường biên 25
2.4.1 Phát hiện biên và làm nổi biên 25
2.4.1.1 Phương pháp Gradient 28
2.4.1.2 Kỹ thuật Laplace 32
2.4.2 Làm mảnh biên 33
2.4.3 Nhị phân hoá đường biên 35
Trang 22.4.4 Miêu tả đường biên 35
2.4.4.1 Mã hoá theo toạ độ đề các 37
2.4.4.2 Mã hoá Freeman 39
2.4.4.3 Xấp xỉ bởi đoạn thẳng 42
2.5 Khảm Voronoi suy rộng cho phân đoạn ảnh giá trị véctơ 43
2.5.1 Khái quát chung 43
2.5.2 Khảm Voronoi suy rộng 44
2.5.2.1 Các định nghĩa 44
2.5.2.2 Phân đoạn ảnh số 46
2.5.3 Sự biến đổi đường đi 46
2.5.3.1 Các định nghĩa: 46
2.5.3.2 Định nghĩa về sự thay đổi đường đi 47
2.5.3.3 Ứng dụng sự thay đổi đường đi vào phân đoạn ảnh mầu 48
2.5.4 Việc lựa chọn các điểm nguồn 49
Chương 3 51
CÀI ĐẶT THỬ NGHIỆM MỘT SỐ THUẬT TOÁN PHÂN ĐOẠN ẢNH 51
3.1 Thuật toán phân đoạn ảnh dựa vào ngưỡng cố định 52
3.1.1 Tư tưởng thuật toán 52
3.1.2 Kết quả thực nghiệm và nhận xét 54
3.2 Thuật toán tam giác 55
3.2.1 Tư tưởng thuật toán 55
3.2.2 Kết quả thực nghiệm và nhận xét 59
3.3 Thuật toán Laplace 60
3.3.1 Tư tưởng thuật toán 60
3.3.2 Kết quả thực nghiệm và nhận xét 63
3.4 Kết chương 63
KẾT LUẬN 65
TÀI LIỆU THAM KHẢO 66
Trang 3MỞ ĐẦU
Xử lý ảnh là một trong những lĩnh vực có nhiều ứng dụng trong thực tế Môn học xử lý ảnh cũng được dạy trong tất cả các trường đào tạo về công nghệ thông tin và điện tử viễn thông Là một sinh viên công nghệ thông tin việc tìm hiểu và nghiên cứu về xử lý ảnh là cần thiết Hơn nữa ảnh cũng là một dạng thông tin rất phổ biến Người ta sử dụng ảnh để minh hoạ, để biểu diễn thông tin… Nó
đã trở thành công cụ không thể thiếu đối với các hình thức lưu trữ, biểu diễn thông tin Và từ đó thì nhu cầu xử lý các bức ảnh để phục vụ cho nhiều mục đích khác nhau đã dẫn đến việc hình thành một môn khoa học, có tên là: “Xử lý ảnh”
Nó cũng là một lĩnh vực đang được chú trọng và quan tâm
Xử lý ảnh thường nhằm hai mục đích: thứ nhất từ các ảnh đã có biến đổi
để thu các ảnh có nhiều thông tin hơn, từ đó có thể dễ dàng quan sát và đánh giá bằng mắt gọi là sự biến đổi ảnh hay nâng cao chất lượng ảnh Mục đích thứ hai là nhận dạng và đoán ảnh một cách tự động gọi là nhận dạng ảnh
Xử lý ảnh có rất nhiều ứng dụng như làm nổi các ảnh trong y học, khôi phục lại các ảnh do tác dụng của khí quyển trong thiên văn học, tăng cường độ phân giải của ảnh truyền hình mà không cần thay đổi cấu trúc bên trong của hệ thống chuyển tải, nén ảnh trong khi truyền đi xa hoặc lưu trữ Ứng dụng trong các lĩnh vực khoa học, hình sự, kinh tế như các chương trình xử lý, nhận dạng vân tay, nhận dạng các loại tem sản phẩm…
Quá trình xử lý ảnh bao gồm nhiều giai đoạn khác nhau, trong mỗi giai đoạn phải giải quyết một bài toán riêng, sau đó các giai đoạn này được lắp ghép với nhau thành từng khối bao gồm: thu nhận ảnh, tiền xử lý ảnh, phân đoạn ảnh, tách ra các đặc tính phân loại
Xác định các đối tượng trong ảnh là cơ bản đối với hầu hết các ứng dụng liên quan đến xử lý ảnh bằng máy tính Công việc này gọi là phân đoạn ảnh, phân đoạn nhằm phân chia đối tượng cần khảo sát ra ra khỏi phần nội dung còn lại của ảnh; phân tách những đối tượng tiếp giáp với nhau và phân tách các đối tượng riêng biệt thành những đối tượng con để phục vụ cho những bước tiếp theo Vì
Trang 4vậy quá trình phân đoạn ảnh là một bước quan trọng nhất trong kỹ thuật xử lý ảnh tự động
Xuất phát từ vai trò quan trọng của việc phân đoạn ảnh trong quá trình xử
lý ảnh, trong những năm vừa qua nhiều phương pháp phân đoạn ảnh đã được tập chung nghiên cứu và đã có nhiều thành công Trong đồ án này, em sẽ tìm hiểu và cài đặt một số thuật toán phân đoạn ảnh cơ bản Đồ án được chia thành ba chương
Chương 1:Tổng quan về phân đoạn ảnh Chương này trình bày tổng quan
về phân đoạn ảnh bao gồm các khái niệm
Chương 2: Một số phương pháp phân đoạn ảnh Chương này trình bày chi
tiết về một số kỹ thuật phân đoạn ảnh Kỹ thuật phân vùng ảnh dựa theo ngưỡng biên độ gồm kỹ thuật phân ngưỡng tự động và kỹ thuật phân ngưỡng cố định Kỹ thuật phân vùng ảnh dựa theo miền đồng nhất gồm 3 phương pháp: phương pháp tách cây tứ phân, phương pháp phân vùng bởi hợp và phương pháp tổng hợp Và kỹ thuật phân vùng dựa theo đường biên thì gồm các bước phát hiện và làm nổi biên, làm mảnh biên, nhị phân
hoá đường biên, mô tả biên
Chương 3: Cài đặt thử nghiệm một số thuật toán phân đoạn ảnh Chương
này mô tả chi tiết về ba thuật toán phân đoạn ảnh là: phân đoạn ảnh dựa theo ngưỡng cố định, phân đoạn ảnh theo thuật toán tam giácvà phân đoạn
ảnh dựa theo đường biên
Trang 5Chương 1 TỔNG QUAN VỀ PHÂN ĐOẠN ẢNH
Vì lượng thông tin trong ảnh là lớn, trong khi đa số ứng dụng chỉ cần một
số thông tin đặc trưng nào đó, phân đoạn ảnh là quá trình giảm lượng thông tin khổng lồ mà vẫn giữ được các đặc trưng cần thiết Nhiệm vụ của quá trình phân đoạn ảnh là từ các ảnh đã có lấy ra những “đối tượng đáng quan tâm “ hoặc những ảnh con phục vụ cho những bước tiếp theo của quá trình xử lý ảnh Quá trình phân đoạn chia tách đối tượng ra khỏi nền, lựa chọn các ảnh riêng lẻ từ một
bộ sưu tập ảnh các đối tượng hoặc phân tách các đối tượng phủ lên nhau Đây là bước quan trọng trong quá trình xử lý ảnh, giai đoạn này nhằm phân ảnh ra thành các vùng ảnh khác nhau Mỗi vùng ảnh là một tập các điểm ảnh có cùng tính chất nào đó dựa theo đường biên hay vùng liên thông Tiêu chuẩn để xác định theo miền liên thông hay còn gọi là kỹ thuật phân vùng dựa theo miền đồng nhất, tiêu chuẩn để xác định có thể là cùng mức xám, cùng mầu hay cùng độ nhám Nếu phân vùng dựa theo biên gọi là kỹ thuật phân vùng biên Ngoài ra còn có các kỹ thuật khác là phân vùng theo biên độ hay phân vùng theo kết cấu
Quá trình phân đoạn ảnh như là một quá trình phân loại điểm ảnh khi ta phân biệt giữa điểm ảnh nền và điểm ảnh đối tượng Một đặc tính vô cùng quan trọng là giá trị xám Nhưng các tính chất cục bộ hoặc tính chất phổ của các điểm ảnh riêng lẻ cũng có thể là những đặc tính có thể sử dụng, chúng tỏ ra thích hợp đối với sự phân đoạn theo cách phân loại ảnh Kết quả của sự phân đoạn là một ảnh logic, trên đó các mặt phẳng đối tượng đã qua phân đoạn được gán cho tên gọi là những giá trị xám, hay ảnh nhị phân, trên đó các điểm đối tượng có giá trị bằng 1, còn điểm nền có giá trị là 0
Quá trình phân đoạn ảnh là một quá trình mang nặng tính chủ quan Ở đây, các quá trình đánh giá bằng mắt đóng vai trò quan trọng và mẫu mực, bởi vì
bề mặt này hệ thống phân giải có một năng suất đến mức ngạc nhiên Đáng tiếc
là quá trình xảy ra trong hệ thống thị giác còn chưa thể hiểu một cách thấu đáo
Do đó thật khó mà đặt ra những tiêu chuẩn để có thể dễ dàng đánh giá được kết
Trang 6quả hoặc chất lượng của một quá trình phân đoạn Một tiêu chuẩn khả dĩ để đánh giá quá trình phân đoạn là vi sai bề mặt giữa một mặt phẳng phân đoạn được quan sát bằng mắt và một mặt phẳng phân đoạn được tìm thấy một cách tự động Muốn thế, ta tính tổng của bình phương khoảng cách giữa các điểm ở biên của hai mặt phẳng phân đoạn Mặt phẳng phân đoạn được tìm thấy một cách tự động lệch khỏi mặt phẳng phân đoạn được quan sát bằng mắt càng nhiều thì bình phương khoảng cách càng trở lên lớn và kết quả của quá trình phân đoạn càng kém đi
Quá trình phân đoạn có thể được chia ra thành hai loại: phân đoạn trọn vẹn và phân đoạn không trọn vẹn Khi một phương pháp dẫn đến kết quả là một đường biên quen thuộc thì đây là một phương pháp phân đoạn trọn vẹn, chẳng hạn phương pháp giá trị ngưỡng, còn khi một phương pháp dẫn đến kết quả là một đường biên có lỗi hoặc những chỗ khuyết thì phương pháp phân đoạn này là không trọn vẹn, chẳng hạn như quá trình lọc gradient một ảnh
1.2 Biểu đồ cột của các giá trị xám (Histogram)
Histogram của cấp sáng i chính là tần suất xuất hiện các giá trị i trong ảnh, ký hiệu là h(i)
Từ biểu đồ các giá trị xám có thể suy diễn ra các tính chất quan trọng của ảnh, như giá trị xám trung bình hoặc độ lệch tiêu chuẩn Qua các tác động lên điểm ảnh, sự phân bố của biểu đồ cột được thay đổi theo mục đích Biểu đồ cột
Trang 7cũng trở lên cần thiết để xác định ngưỡng thích hợp dùng cho quá trình phân đoạn
Khi tiến hành phân tích thống kê một chiều của một ảnh, từ phân bố biểu đồ cột tuyệt đối hay phân bố xác suất p(i) ở đây 0 P(i) 1
i
iu i
i
P = 1
N là số các điểm ảnh của đoạn ảnh mà ta khảo sát Biểu đồ cột có giá trị xám nhỏ nhất iuvà một giá trị xám lớn nhất i0 Giá trị trung bình số học của giá trị i được tính từ histogram
x
x
x u
x p
x 2 ( _) 2 ( )
0
x p x x
1.3 Làm trơn và tăng độ tương phản
Để phân đoạn đạt kết quả tốt hơn, trước khi sử dụng phương pháp giá trị ngưỡng ta nên làm trơn ảnh nhờ một bộ lọc Sau khi làm trơn các mặt phẳng được tìm kiếm sẽ bó chặt hơn, các lỗ trống trên mặt phẳng sẽ được lấp đầy một phần Dựa trên tính chất độ dốc ở gờ cạnh và tác dụng làm trơn, bộ lọc điểm giữa
tỏ ra đặc biệt thích hợp để làm trơn trước khi phân đoạn
Việc làm tăng độ tương phản tỏ ra rất hữu ích khi tiến hành xử lý trước theo phương pháp ngưỡng Bằng việc làm tăng độ tương phản, và tăng sự khác nhau của giá trị nền và đối tượng, độ dốc của cạnh đối tượng được tăng lên Do đó sau khi làm tăng độ tương phản ta có thể tìm các giá trị T thích hợp với một vùng sáng lớn hơn
1.4 Biểu đồ cột độ bó chặt
Ở một số ứng dụng xác định, biểu đồ cột dùng cho độ bó chặt tỏ ra là thích hợp, bởi vì nhờ vậy mà nhận biết được một số tính chất toàn cục của điểm ảnh đó
là độ bó chặt
Độ bó chặt KTở một ngưỡng T cho trước được tính toán theo:
Trang 9Chương 2 MỘT SỐ PHƯƠNG PHÁP PHÂN ĐOẠN ẢNH
2.1 Phân vùng ảnh dựa theo ngưỡng biên độ
Đặc tính đơn giản nhất và có thể hữu ích nhất của ảnh đó là biên độ của các tính chất vật lý của ảnh như: độ phản xạ, độ truyền sáng, màu sắc hoặc đáp ứng đa phổ Thí dụ, trong ảnh X-quang, biên độ mức xám biểu diễn đặc tính bão hoà của các phần hấp thụ của cơ thể và làm cho ta có khả năng phân biệt xương với các phần mềm, tế bào lành với các tế bào bị nhiễm bệnh…
Như vậy, có thể dùng ngưỡng biên độ để phân vùng khi mà biên độ đủ lớn đặc trưng cho ảnh Thí dụ, biên độ trong bộ cảm biến ảnh hồng ngoại có thể phản ánh vùng nhiệt độ thấp hay vùng có nhiệt độ cao hơn Kỹ thuật phân ngưỡng theo biên độ rất có ích đối với ảnh nhị phân như văn bản in, đồ hoạ, ảnh màu hay ảnh X-quang
Phân ngưỡng là phương pháp định hướng điểm tập trung vào tính chất của điểm ảnh khi quyết định xem liệu một điểm ảnh có thuộc về đối tượng hay không Tính chất đó có thể là giá trị xám, mầu hoặc một tính chất cục bộ nào đó
Để quyết định ta tìm một hoặc vào ngưỡng tối ưu, do đó còn gọi là phương pháp phân ngưỡng Phân ngưỡng là một phương pháp phân đoạn thông dụng nhằm biến một ảnh đa cấp xám thành một ảnh nhị phân( chỉ có 2 mầu đen và trắng) Việc chọn ngưỡng tối ưu vẫn còn là một thách thức Bên cạnh vai trò là một công
cụ phân đoạn ảnh, nó còn là một bước trong nhiều kỹ thuật phân đoạn ảnh cấp cao trong không gian
Trước hết cần đưa về ảnh nhị phân một cách đơn giản bằng một giá trị ngưỡng Các điểm ảnh ở trên một ngưỡng T sẽ là đối tượng còn dưới ngưỡng T
sẽ là những điểm nền Ta có một hàm biến đổi tổng quát :
1, ( , ) ( , )
Trang 10Hàm này được hiện thực hoá bằng một bảng dò tìm (LUT - Look Up Table) trên đó một ảnh xám B x y( , )được biến đổi thành một ảnh nhị phân
),
,
(x y
A T hay còn gọi là quá trình nhị phân hoá
Phương pháp ngưỡng vừa trình bày trên đây phân loại điểm ảnh dựa trên tính chất “giá trị xám” của các điểm đối tượng và các điểm nền Đặc điểm của vùng lân cận điểm ảnh không được quan tâm đến Khi quyết định xem một điểm ảnh nào đấy có thuộc về đối tượng hay không phương pháp này chỉ hướng theo giá trị xám của một điểm ảnh Một kết quả như ý đòi hỏi có một ngưỡng tối ưu được xác định, ngưỡng này có thể dễ dàng tìm được ở nhiều ứng dụng
Một số phương pháp được sử dụng để tìm Đơn giản nhất là dùng ngưỡng
cố định khi ảnh có độ sáng tối rõ ràng Nhưng để tìm ngưỡng một cách tối ưu hơn với những ảnh không có độ sáng tối rõ ràng như vậy thì có thể dùng đến các phương pháp tìm ngưỡng tự động
2.1.1 Ngưỡng cố định
Các ảnh với đối tượng sáng trên nền tối hoặc đối tượng tối trên nền sáng
có thể được phân đoạn tương đối tốt bằng cách lựa chọn một ngưỡng cố định Ngưỡng này có thể do người sử dụng lựa chọn tùy theo ảnh, ở đây ta cũng có thể
mặc đinh là T = 128
Ngưỡng Tđược chọn sao cho các điểm có màu sáng là điểm nền (phân bố biểu đồ cột ở bên phải T) và các điểm tối thuộc về đối tượng (phân bố biểu đồ cột bên trái T) được phân tách ra như hình dưới đây
Hình 2.1.a:
Ảnh gốc
Hình 2.1.b: Histogram điểm đánh dấu tại ngưỡng T = 128
Hình2.1.c: Ảnh nhị phân với ngưỡng T=128
Trang 11Đây là một thuật toán tương đối đơn giản Ý tưởng chính của thuật toán chỉ là phân ngưỡng ảnh bằng giá trị xám cố định độc lập với dữ liệu ảnh và chi tiết về thuật toán được trình bày chi tiết ở mục 3.1 thuộc chương 3
2.1.2 Ngưỡng tự động
Việc chọn ngưỡng trong kỹ thuật này là bước rất quan trọng Với những ảnh mà độ tương phản màu sắc không cao, nếu áp dụng phân ngưỡng cố định thì kết quả phân đoạn của một số ảnh có độ sáng tối không rõ ràng sẽ không tốt Khi
đó, có thể áp dụng một số phương pháp phân ngưỡng tự động Người ta thường tiến hành theo các bước chung sau:
- Xem xét lược đồ xám của ảnh để xác định các đỉnh và các khe Nếu ảnh có dạng rắn lượn (nhiều đỉnh và khe) các khe có thể sử dụng để chọn ngưỡng
- Chọn ngưỡng t sao cho một phần xác định trước của toàn bộ số mẫu
- Khi có một mô hình phân lớp xác suất, việc xác định ngưỡng dựa vào tiêu chuẩn nhằm cực tiểu xác suất của sai số hoặc một số tính chất khác theo luật Bayes
Dưới đây là một số thuật toán tìm ngưỡng:
2.1.2.1 Phương pháp sử dụng các điểm biên
Điểm biên là điểm mà ở đó có sự thay đổi đột ngột về giá trị cấp xám Biên là điểm nằm ở biên giới của các đối tượng ảnh, hay giữa các đối tượng ảnh
và nền Do các mức xám của các điểm biên này sẽ thể hiện được các vùng tốt
Trang 12hơn nên biểu đồ mức xám của các điểm biên sẽ thể hiên được các vùng tốt hơn nên biểu đồ mức xám của các điểm biên sẽ cho kết quả chính xác hơn so với biểu thức vô hướng laplace mức xám tổng thể
Việc xác định ngưỡng dựa trên toán tử dò biên
Ngưỡng được xác định trước hết bằng cách tính laplace của ảnh đầu vào
Có nhiều cách để thực hiện điều này, trong đó một cách đơn giản là nhân chập ảnh đầu vào với mặt nạ sau:
1 4 1
0 1 0
Lúc này ta có một biểu đồ mức xám của ảnh ban đầu mà ta chỉ quan tâm đến các điểm ảnh có giá trị Laplace lớn, những điểm ảnh trong nhóm 85% hoặc hơn sẽ nằm trong biểu đồ này, còn các điểm khác thì không Ngưỡng vừa sử dụng sẽ được tìm trong biểu đồ mức xám vừa tìm được Chú ý việc sử dụng một xấp xỉ tốt hơn của phép tính Laplace như trên sẽ mang lại kết quả tốt hơn
Trong chương 3 phần 3.3 sẽ trình bày kỹ hơn về phương pháp này
2.1.2.2 Phương pháp lặp
Phương pháp lặp là phương pháp giá trị ngưỡng ban đầu sẽ được ước đoán sau đó sẽ được tinh chỉnh dần qua các bước lặp trên toàn bộ ảnh Giá trị ước đoán khởi đầu của ngưỡng là các giá trị mức xám trung bình Ngưỡng này sau đó sử dụng để thu thập các giá trị thống kê trên các vùng trắng và đen thu được Giá trị mức xám trung bình cho tất cả các điểm ảnh dưới ngưỡng được tính toán gọi là
Tb và trên ngưỡng gọi là T0 Khi đó xác định một ngưỡng mới theo công thức (T0 + Tb)/2 hay bằng giá trị trung bình của các mức xám trung bình trên mỗi lớp điểm ảnh Quá trình đó sẽ tiếp tục với giá trị ngưỡng mới vừa tìm được Khi không tìm thấy sự thay đổi giá trị ngưỡng sau các lần tính toán, quá trình dừng với giá trị ngưỡng thu được
Trang 13Phương pháp này được đưa ra để thực hiện bằng phần cứng , trong đó việc đánh giá ban đầu giá trị ngưỡng giả thiết rằng bốn góc của ảnh tương ứng với vùng nền và phần còn lại của ảnh được sử dụng như là một đánh giá các mức xám đối tượng Tuy nhiên giá trị ngưỡng này có thể được tạo ra từ phần mền sử dụng biểu đồ mức xám và đưa ra kết quả nhanh chóng với biểu đồ mức xám là một mảng một chiều có kích thước nhỏ và cố định
Bắt đầu với đánh giá ngưỡng ban đầu T0, đánh giá thứ k của ngưỡng sẽ là (theo Thrusel 1979)
0
0
) ( 2
) (
k k
i h i
N
T j
k
k
j h
j h j
1 1
1
1
) (
) (
Trong đó h là biểu đồ mức xám của ảnh Khi Tk=Tk 1 thì Tklà ngưỡng cần tìm
và ta dừng quá trình lặp với ngưỡng nhận được là Tk
2.1.2.3 Phương pháp sử dụng biểu đồ mức xám
Các phương pháp lấy ngưỡng dựa trên việc lựa chọn các điểm thấp giữa
2 đỉnh của biểu đồ mức xám sử dụng một khái niệm rằng các điểm ảnh của đối tượng và nền có các mức xám trung bình khác nhau, và là các giá trị số ngẫu nhiên được tính từ phân bố chuẩn hai chiều
Nếu tồn tại hai nhóm điểm ảnh trong ảnh thì có thể dễ dàng tính toán được phương sai tổng thể của các giá trị mức xám trong ảnh và ký hiệu 2
t
với một ngưỡng bất kỳ t được đưa ra có thể tính toán một cách riêng rẽ phương sai của các điểm ảnh đối tượng và nền Các giá trị này được biểu diễn bằng giá trị phương sai nội lớp ký hiệu là 2
là tỷ số cần thiết tối ưu và giá trị t sao cho tỷ số này là nhỏ nhất
sẽ là giá trị ngưỡng tối ưu
Trang 14
t ,
0 1
1) Tạo một ước lượng đầu tiên tại một phân đoạn trong ảnh, cung cấp ước lượng tại mỗi điểm ảnh
2) Đối với mỗi điểm ảnh, thay đổi phân đoạn và ước lượng trên các điểm ảnh trong vùng lân cận, thường bao quanh 8 điểm ảnh
3) Lặp lại bước 2 cho đến khi phân đoạn hoàn thành Việc phân đoạn được hoàn thành khi không có sự thay đổi lớn trong các bước kế tiếp Một cách để tạo phân lớp đầu tiên là sử dụng cấp xám trung bình Một điểm lớn hơn so với giá trị trung bình có xác suất là điểm trắng Xác suất cho phân lớp đầu tiên là ( Rosenfeld 1981):
2
1 g i
Miêu tả vị trí này cho điểm ảnh lớn hơn so với giá trị trung bình có xác suất là trắng Ở đó là giá trị trung bình, max là cấp xám lớn nhất, min là cấp xám nhỏ nhất và gi là cấp xám của điểm ảnh i
Trang 15Với mỗi điểm ảnh nhỏ hơn giá trị trung bình ta có:
min 2
g q
P0
i là xác suất đầu tiên mà điểm I là trắng , q0
t là xác suất đầu tiên mà điểm i là đen
Sự thích hợp của 1 điểm với các điểm lân cận sẽ được ước lượng bởi 1 hàm C(i , c1, j, c2) nhận kết quả giữa -1 và 1 Cách thích hợp điểm điểm i (với lớp c1) và với j ( lớp c2) là như thế nào Cho vấn đề ngưỡng chỉ có 2 lớp đen hoặc trắng, và cho 1 lân cận nhỏ và các điểm I và j sẽ nằm gần nhau Sẽ không biết chắc chắn hàm này làm gì, bởi vì nó phụ thuộc vào xác suất cuối cùng trong ngưỡng cuối cùng của ảnh Tuy nhiên bổ sung đơn giản sẽ có C=1 khi c1= c2 và C=-1 nếu c1c2 Bây giờ khi có 2 lớp xác suất cho các điểm ảnh , giá trị trung bình có thể được dùng để xác định tính tương hợp giữa 2 điểm ảnh:
Qij=C(I, c1, j, while)pj + C(I, c1, j, black) qj
Sự thích hợp vùng quanh điểm I có thể được định nghĩa là giá trị trung bình thích hợp cho 8 điểm lân cận:
q black j c i C p while j c i
) 1 (
1
black Q
q while Q
p
Q p
i k i k
i k i
k i k i k
2.3 Phương pháp phân vùng theo miền đồng nhất
Trang 16Các phương pháp phân lớp ta vừa xét là phân đoạn ảnh dựa trên các chỉ tiêu thuộc tính ảnh hay độ đồng đều, tương tự nhau về thuộc tính của từng phần
tử Điều này thực hiện đơn giản và phát hiện các vùng ảnh có thể không liên thông nhưng lại không cho phép khai thác tính liên thông của các điểm ảnh trong một vùng ở một số đối tượng Phương pháp phân vùng theo miền đồng nhất sau đây là phương pháp phân đoạn ảnh dựa trên cả hai tiêu chí: độ tương tự đồng đều
về thuộc tính của các phần tử ảnh và tính liên thông của các phần tử ảnh trong 1 vùng
2.3.1 Cơ sở
Cho R biểu diễn toàn bộ vùng ảnh Phân đoạn của ảnh là quá trình chia R thành n vùng con R1,R2, ,R n sao cho:
R R
P( i) với i=1,2,…,n cho biết các pixels trong một vùng phải thỏa các đặc trưng đặt ra, ví dụ cùng cường độ sáng
FALSE R
- Phương pháp tách - hợp ( split – merge)
2.3.2 Phương pháp tách cây tứ phân( quad tree)
Về nguyên tắc, phương pháp này kiểm tra tính hợp thức của tiêu chuẩn đồng nhất một cách tổng thể trên miền lớn Nếu tiêu chuẩn được thoả mãn, việc
Trang 17phân đoạn coi như kết thúc Trong trường hợp ngược lại ta chia miền đang xét thành 4 miền nhỏ hơn, ta lại áp dụng đệ quy bằng phương pháp trên cho mỗi miền nhỏ hơn cho đến khi tất cả các miền đều thoả mãn Phương pháp này có thể
mô tả bằng thuật toán sau (và cần lưu ý rằng tham số là miền đang xét):
Procedure PhanDoan(Mien)
Begin
If miền đang xét không thoả Then
Begin
Chia miền đang xét thành 4 miền: Z1, Z2, Z3, Z4
For i=1 to 4 Do PhanDoan(Zi)
End
Else Exit
End;
Có thể dựa vào mức xám để xét tiêu chuẩn miền đồng nhất Giả sử Max
và Min là giá trị mức xám lớn nhất và nhỏ nhất trong miền đang xét Khi đó,
tiêu chuẩn để miền đang xét là đồng nhất có thể là:
/* Giả sử là ảnh có tối đa 255 mức xám
(N1,M1), (N2, M2) là toạ độ điểm đầu và điểm cuối của miền, T là ngưỡng */
Begin
Trang 181 Max = 0; Min = 255;
2 For i = N1 to N2 do
For j = N1 to N2 do
If I(i,j) < Min Then Min = I(i,j);
If I(i,j) >Max Then Max = I(i,j);
3 If ABS(max - min) < T Then Examin_Criteria = 0
Else Examin_Criteria = 1;
End
Nếu hàm trả về giá trị 0, có nghĩa vùng đang xét là đồng nhất, trường hợp ngược lại nghĩa là mức không đồng nhất Trong giải thuật trên, khi miền là đồng nhất cần tính lại giá trị trung bình và cập nhật lại ảnh đầu ra Giá trị trung bình
được tính bởi:Tổng giá trị mức xám/ tổng số điểm
Thuật toán này tạo nên một cây mà mỗi nút cha có 4 nút con ở mọi mức, trừ mức ngoài cùng Vì thế, cây này có tên là cây tứ phân Cây này cho hình ảnh
rõ nét về cấu trúc phân cấp các vùng tương ứng với tiêu chuẩn
Hình dưới đây mô tả một ví dụ về phương pháp phân vùng bởi tách:
a Ảnh gốc
Trang 19b Phân mức 1
c Phân mức 2
Trang 20d Phân mức 3 Hình 2.2: Phân vùng bởi tách
Một vùng thoả mãn tiêu chuẩn tạo nên một nút lá, nếu không sẽ tạo nên một nút trong và 4 nút con tương ứng của việc chia làm 4 vùng Mỗi nút lá của cây biểu diễn một vùng đã phân chia theo tiêu chuẩn Cứ tiếp tục như vậy cho đến khi phân xong Các nút lá của cây biểu diễn số vùng đã phân theo tiêu chuẩn
Trang 212.3.3 Phương pháp phân vùng bởi hợp
Ý tưởng của phương pháp này là xem xét ảnh từ các miền nhỏ nhất rồi hợp chúng lại nếu thoả mãn tiêu chuẩn để được một miền đồng nhất lớn hơn Ta lại tiếp tục với miền thu được cho đến khi không thể hợp được nữa Số miền còn lại cho ta kết quả phân đoạn ảnh Miền nhỏ nhất của bước xuất phát là điểm ảnh Phương pháp này hoàn toàn ngược với phương pháp tách Song điều quan trọng ở đây là nguyên lý hợp 2 vùng Việc hợp hai vùng được thực hiện theo nguyên tắc sau:
- Hai vùng phải đáp ứng tiêu chuẩn, như cùng màu hay cùng mức xám
Trang 22- Chúng phải kế cận nhau
Chúng ta nên làm rõ khái niệm kế cận Trong xử lý ảnh người ta dùng khái niệm liên thông để xác định kế cận Có hai khái niệm liên thông là 4 liên thông và 8 liên thông Với 4 liên thông một điểm ảnh I (x,y) sẽ có 4 kế cận theo hướng x, y Trong khi đó, với 8 liên thông, điểm ảnh I(x, y) sẽ có 4 liên thông theo hai hướng x và y và 4 liên thông khác theo hướng chéo 450 Hình trên cho
ta khái niệm về 4 và 8 liên thông
Dựa theo nguyên lý của phương pháp hợp, ta có 2 thuật toán:
- Thuật toán tô màu (Blog coloring)
- Thuật toán đệ quy cục bộ
2.3.3.1 Thuật toán tô mầu
Thuật toán này sử dụng khái niệm 4 liên thông Người ta dùng một cửa sổ
di chuyển trên ảnh để sánh với tiêu chuẩn hợp Thuật toán có thể tóm tắt như sau:
For mỗi điểm I(x,y) do
/*Kiểm tra màu của các lân cận*/
Trang 23Else
M(x,y)=NewM;
End
/*Hợp lại nếu các lân cận cùng màu*/
If (Criteria(x,y)=Criteria(x-1,y)) and (Criteria(x,y)=Criteria(x,y-1)) Then
Merge 2 phân vùng bằng cách để màu giống nhau
Trong thuật toán trên, chỉ tiêu hợp là màu đồng nhất Thực tế chứng tỏ rằng thuật toán này tỏ ra khá hiệu quả khi dùng camera một hàng vì có thể phân đoạn theo từng hàng
2.3.3.2 Thuật toán đệ quy cục bộ
Thuật toán này sử dụng phương pháp tìm kiếm trong một cây để làm tăng kích thước vùng Trước tiên, người ta tìm kiếm các lân cận để tăng kích thước tối
đa của vùng rồi sau đó mới quan tâm đến các vùng khác và cũng áp dụng thuật
toán trên Thuật toán này sử dụng một thủ tục đệ quy GiaTang để thực hiện việc
tăng kích thước một vùng Thuật toán được mô tả như sau:
Save(I(x,y)) GiaTang(x,y) NSeg <= NSeg+1 End
End
b) Thủ tục GiaTang
I(x,y)<=0 /*Đặt I(x,y) là 0 để không phải xét lại*/
Trang 24For mọi điểm kế cận của I(x,y) do
Chính vì nhược điểm này mà ta nghĩ đến cách phối hợp cả 2 phương pháp Trước tiên, dùng phương pháp tách để tạo nên cây tứ phân, phân đoạn theo hướng từ gốc đến lá Tiếp theo, tiến hành duyệt cây theo chiều ngược lại và hợp các vùng có cùng tiêu chuẩn Với phương pháp này ta thu được miêu tả cấu trúc của ảnh với các miền liên thông có kích thước tối đa
Giải thuật tách hợp gồm một số bước chính sau:
1 Kiểm tra tiêu chuẩn đồng nhất
a) Nếu không thoả và số điểm trong vùng lớn hơn một điểm, tách làm 4 vùng (trên, dưới, trái, phải) bằng cách gọi đệ quy Nếu kết quả tách xong và không tách được nữa chuyển sang bước 2 b) Nếu tiêu chuẩn đồng nhất là thoả thì tiến hành hợp vùng và cập nhật giá trị trung bình cho vùng
2 Hợp vùng
Cần kiểm tra 4 lân cận đã nêu trên Có thể có nhiều vùng thoả mãn khi đó ta
chọn vùng tối ưu rồi tiến hành hợp
Phương pháp này thu được kết quả số vùng là nhỏ hơn phương pháp tách
Trang 25Hình 2.5: 4 lân cận của điểm hiện thời
Với ví dụ trong hình 2.2, áp dụng phương pháp tách hợp ta thu được một cây chỉ có 2 phân vùng hay nói cách khác là phân đoạn ảnh thành 2 miền đồng nhất Rõ ràng là phương pháp này đạt hiệu quả tốt hơn so với phương pháp tách
Hình 2.6: Cây thu được theo phương pháp tách hợp
2.4 Phân vùng dựa theo đường biên
Biên là một trong những đặc trưng quan trọng của ảnh Cũng vì thế mà trong nhiều ứng dụng, người ta sử dụng cách phân đoạn theo biên Việc phân đoạn ảnh dựa vào biên được tiến hành qua một số bước:
- Phát hiện biên và làm nổi biên
- Làm mảnh biên
- Nhị phân hoá đường biên
- Miêu tả đường biên
2.4.1 Phát hiện biên và làm nổi biên
Trang 26Biên là một vấn đề chủ yếu trong phân tích ảnh vì các kỹ thuật phân đoạn ảnh chủ yếu dựa vào biên Một điểm ảnh có thể coi là biên nếu ở đó có sự thay đổi đột ngột về mức xám Tập hợp các điểm biên tạo thành biên hay đường bao của ảnh (boundary) Thí dụ, trong một ảnh nhị phân, một điểm ảnh có thể coi là biên nếu nó là điểm đen và có ít nhất một điểm trắng lân cận
Ta xét ví dụ sau để thấy được tầm quan trọng của biên Khi người hoạ sĩ
vẽ một cái bàn gỗ, chỉ cần vài nét phác thảo về hình dáng như mặt bàn, chân bàn
mà không cần thêm các chi tiết khác, người xem đã có thể nhận ra đó là cái bàn Nếu ứng dụng của ta là phân lớp nhận diện đối tượng, thì coi như nhiệm vụ đã hoàn thành Tuy nhiên, nếu đòi hỏi thêm về các chi tiết như vân gỗ hay màu sắc… thì với chừng ấy thông tin là chưa đủ
Về toán học, người ta coi điểm biên của ảnh là điểm có sự biến đổi đột
ngột về độ xám, như trong hình 2.7 dưới đây:
Phát hiện biên một cách lý tưởng là xác định được tất cả các đường bao trong các đối tượng Định nghĩa toán học của biên ở trên là cơ sở cho các kỹ thuật phát hiện biên Điểm quan trọng là biến thiên giữa các điểm ảnh thường là nhỏ, trong khi đó biến thiên độ sáng của điểm biên (khi qua biên) lại khá lớn Xuất phát từ cơ sở này, người ta thường sử dụng hai phương pháp phát hiện biên như sau:
Phương pháp phát hiện biên trực tiếp: Phương pháp này nhằm làm nổi biên dựa vào sự biến thiên về giá trị độ sáng của điểm ảnh Kỹ thuật chủ yếu dùng phát hiện biên ở đây là kỹ thuật đạo hàm Nếu lấy đạo hàm bậc nhất của ảnh ta có phương pháp Gradient Nếu lấy đạo hàm bậc hai của ảnh ta có kỹ thuật Laplace
Phương pháp phát hiện biên gián tiếp: Nếu bằng cách nào đấy ta phân được ảnh thành các vùng thì đường phân ranh giữa các vùng đó chính
là biên Việc phân vùng ảnh thường dựa vào kết cấu texture của ảnh hoặc dựa vào một số yếu tố khác
Trang 27Cũng cần chú ý rằng kỹ thuật dò biên và phân vùng ảnh là hai bài toán đối ngẫu của nhau Thực vậy, dò biên để thực hiện phân lớp đối tượng và một khi đã phân lớp xong có nghĩa là đã phân vùng được ảnh Và ngược lại, Khi đã phân vùng, ảnh đã phân lập được thành các đối tượng, ta có thể phát hiện được biên Phương pháp dò biên trực tiếp tỏ ra khá hiệu quả vì ít khi chịu ảnh hưởng của nhiễu Song nếu sự biến thiên độ sáng không đột ngột Phương pháp này lại tỏ ra kém hiệu quả Phương pháp dò biên gián tiếp tuy khó cài đặt, song lại áp dụng khá tốt khi sự biến thiên độ sáng nhỏ
c) Đường bao thực
Mức xám
x
Hình 2.7: Đường biên của ảnh
b) Đường biên bậc thang
Mức xám
a) Đường biên lý tưởng
Mức xám
Trang 28Có một số phương pháp phát hiện biên hay được sử dụng như: phương pháp Gradient, kỹ thuật Laplace
2.4.1.1 Phương pháp Gradient
Phương pháp Gradient là phương pháp dò biên cục bộ dựa vào cực đại của đạo hàm Gradient là một véctơ có các thành phần biểu thị tốc độ thay đổi giá trị của điểm ảnh theo hai hướng x và y Các thành phần của gradient được tính bởi:
dy
y x f dy y x f f y
,
(
) , ( ) , ( )
với dx là khoảng cách giữa các điểm theo hướng x (khoảng cách tính bằng
số điểm), tương tự, dy là khoảng cách giữa các điểm theo hướng y Thực tế, người ta hay dùng với dx = dy = 1
Với một ảnh liên tục f(x,y), các đạo hàm riêng của nó cho phép xác định
vị trí cực đại cục bộ theo hướng của biên Thực vậy, một ảnh liên tục được biểu diễn bởi một hàm f(x,y) dọc theo r với góc được định nghĩa bởi:
dy y
f dr
dx x
f dr
đối với đạt cực đại khi(df / d )(df / dr)=0 hay f xcos f ysin 0
Do vậy, ta có thể xác định hướng cực đại của nó: r tan1fy fx và
2 2
dr
df
Ta gọi r là hướng của biên
Đạo hàm của ảnh là không tồn tại vì f(x,y) không liên tục Ở đây, ta chỉ sử dụng mô phỏng theo ý nghĩa của đạo hàm, việc tính toán là xấp xỉ đạo hàm bằng
kỹ thuật nhân chập Trong phương pháp gradient, người ta chia nhỏ thành hai kỹ thuật (do sử dụng hai toán tử khác nhau):
- Kỹ thuật gradient dùng toán tử gradient, lấy đạo hàm theo một hướng
Trang 29- Kỹ thuật la bàn dùng toán tử la bàn, lấy đạo hàm theo tám hướng: Bắc, Nam, Đông, Tây, và Đông Bắc, Tây Bắc, Đông Nam, Tây Nam
a) Kỹ thuật Gradient:
Kỹ thuật gradient sử dụng một cặp mặt nạ H1, H2 trực giao (theo hai hướng vuông góc Ta có thể định nghĩa:
g1 là gradient theo hướng x
g2 là gradient theo hướng y
Biên độ của gradient tại điểm (m,n) ký hiệu là g(m,n) được tính theo công thức:
) , ( ) , ( )
, (m n A0 g12 m n g22 m n
Và góc là:
)),(
),((tan),(
1
2 1
n m g
n m g n
m r
) , ( ) , 1 (
y x I y
x I
g
y x I y x I
1 0
0 1
2
H
Trang 30Trong trường hợp tổng quát, người ta dùng các công thức (2.11) và (2.12)
để tính Gradient biên độ g và Gradient hướng r Nhưng để giảm bớt thời gian tính toán, người ta có thể dùng các chuẩn sau:
) , ( ) ,
1 0 1
1 0 1
0 0 0
1 1 1
2 0 2
1 0 1
0 0 0
1 2 1
2 0 2
1 0 1
0 0 0
1 2 1
2
H
Trang 31Gradient được xấp xỉ bởi công thức: G x H x I và G y H y I (2.16) Thực tế cho thấy rằng Sobel và prewitt tốt hơn so với Robert bởi chúng ít nhạy cảm với nhiễu Ta cũng thấy rằng, việc lấy đạo hàm một tín hiệu có xu hướng làm tăng nhiễu trong tin hiệu đó Độ nhạy cảm này có thể làm giảm xuống nhờ thao tác lấy trung bình cục bộ trong miền phủ bởi mặt lạ
Lưu ý rằng, các chuẩn trong công thức (2.14) và (2.15) tạo nên sự vặn xoắn trong tính toán biên độ Thực vậy, nếu g x hoặc g y bằng 0 thì A1 A2 A0 Còn nếu: g x g y ta sẽ có A1 g x,A2 g y và A0 2g x Phương pháp Robert và Sobel dùng chuẩn A1 Nguyên nhân của sự vặn xoắn là khá đơn giản: các mặt lạ của các toán tử tạo nên một xấp xỉ rời rạc của đạo hàm thực và các chuẩn áp dụng để tính biên độ lại phụ thuộc vào giá trị của các Gradient thành phần
Với mục đích nghiên cứu các mặt lạ cho kết quả tốt hơn, người ta nghĩ đến việc xét lân cận theo 8 hướng Đó chính là phương pháp Kirsh, còn gọi là toán tử Kirsh hay toán tử la bàn Toán tử này được trình bày dưới đây
b) Toán tử la bàn (Kirsh):
Toán tử la bàn đo gradient theo tám hướng lần lượt ngược chiều kim đồng
hồ Đó là các hướng: k = /2 + k2, với k = 0, 1, 2, , 7 cách nhau 0
45 ; với gradient tương ứng là g k
Có nhiều toán tử la bàn khác nhau Ở đây, ta chỉ nêu chi tiết một toán tử,
đó là toán tử Kirsh, sử dụng mặt nạ 3x3 Mặt nạ H k ứng với hướng k với k = 0,
1, 2, , 7 H1 cho hướng gốc 0, trên cơ sở đó H2 đến H8 cho 7 hướng còn lại:
0 0 0 0 0
0
0
315 , 270 , 225 , 180
3 0 3
5 5 5
5 0 3
5 5 3
5 0 3
5 3 3
3
H
Trang 325 0 3
3 3 3
3 0 3
3 3 3
3 0 5
3 3 3
3 0 5
3 3 5
3 0 5
3 5 5
8
H
Nếu ký hiệu A i, i 1 , 2 , 3 8 là Gradient thu được theo 8 hướng bởi 8 mặt
nạ, thì biên độ Gradient tại (x,y) sẽ được tính theo công thức sau:
x, y Maxg (x, y) , i 1,2, 8
Ngoài ra, người ta còn sử dụng một số toán tử khác mà mặt nạ theo hướng
0 như sau (các mặt nạ khác có thể tự suy diễn):
1 2 1
1 1 1
1
H
Để đơn giản tính toán thì chỉ tính với 4 hướng 0 0 0 0
135 , 90 , 45 ,
Nói chung, thuật toán này cũng tương đối đơn giản vì chỉ cần cài đặt một thủ tục với tham số là hướng chính
2.4.1.2 Kỹ thuật Laplace
Các phương pháp đánh giá gradient làm việc khá tốt khi độ sáng thay đổi
rõ nét khi qua biên Khi sự thay đổi của mức xám thay đổi chậm, miền chuyển tiếp trải rộng thì phương pháp đánh giá gradient tỏ ra bớt hiệu quả Có một phương pháp hiệu quả hơn trong trường hợp này, đó là phương pháp Laplace Phương pháp này sử dụng đạo hàm bậc hai, toán tử Laplace được định nghĩa như sau:
2 2
2
2 2
dy
f dx
Trang 331 4 1
0 1 0
1 8 1
1 1 1
2 5 2
1 2 1
3
H
Với mặt nạ H1, đôi khi người ta dùng phần tử tâm là 8 thay vì 4
Trong kỹ thuật Laplace, điểm biên được xác định bởi điểm cắt điểm không Điểm không là duy nhất, do đó đường biên thu được là đường biên mảnh (có độ rộng 1 pixel) Một điểm nữa là: do đạo hàm bậc hai thường không ổn định nên kỹ thuật Laplace rất nhạy cảm với nhiễu
Khi thực hiện đạo hàm một ảnh, ta thu được những điểm cực trị cục bộ Theo kỹ thuật Gradient, những điểm cực trị cục bộ có thể coi như biên Do vậy cần tách biệt những điểm cực trị đó để xác định chính xác biên ảnh và để giảm độ
rộng biên ảnh Một trong những phương pháp hay dùng đó là phương pháp “Loại
bỏ các điểm không cực đại”
Giả sử ảnh I(x,y) gồm Gradient hướng và Gradient biên độ (còn gọi là bản
đồ biên độ và bản đồ hướng) Với mỗi điểm ảnh I(x,y), ta xác định các điểm lân
cận của nó theo hướng Gradient Gọi các điểm đó là I(x1,y1) và I(x2,y2)
Nếu I(x,y) lớn hơn cả I(x1,y1) và I(x2,y2), giá trị của I(x,y) sẽ được bảo
toàn Nếu không nó sẽ được đạt là 0 và coi như bị loại bỏ Thuật toán này được
sử dụng trong phương pháp Canny
Ngoài thuật toán kể trên còn nhiều kỹ thuật làm mảnh biên để xác định khung của đối tượng (ảnh hay ký tự) như kỹ thuật mảnh biên chữ do Sherman đề