1. Trang chủ
  2. » Giáo Dục - Đào Tạo

BÀI BÁO CÁO PHÂN ĐOẠN ẢNH

73 19 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Phân Đoạn Ảnh
Tác giả Khanh, Ánh, Thảo, Dương
Thể loại Đề Tài Môn Học
Định dạng
Số trang 73
Dung lượng 21,17 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

TÁCH KHÔNG LIÊN TỤC: Phần này chúng ta sẽ nói về 3 kỹ thuật cơ bản để tách mức xám không liên tục trong một ảnh số: điểm, đường và biên.. Ví dụ đối với mặt nạ 3x3 ở hình 1,quá trình này

Trang 1

Đề tài môn học Nhóm 2: Khanh, Ánh, Thảo, Dương.

3.2 Vai trò của sự chiếu sáng

3.3 Ngưỡng toàn cục cơ bản

3.4 Ngưỡng động cơ sở

3.5 Ngưỡng động và ngưỡng toàn cục tối ưu

3.6 Sử dụng những đặc điểm biên để cải tiến histogram và

phân ngưỡng địa phương

3.7 Ngưỡng dựa trên 1 vài biến số

4 Phân đoạn trên cơ sở vùng

4.1 Công thức cơ bản

4.2 Tăng vùng

4.3 Chia và trộn vùng

5 Phân đoạn theo mức hình thái

5.1 Khái niệm cơ bản

5.2 Xây dựng đập

5.3 Thuật toán phân mức

5.4 Áp dụng cho những ảnh nhiễu hay những vùng phân đoạn nhỏ

Trang 2

Đề tài môn học Nhóm 2: Khanh, Ánh, Thảo, Dương.

Lời giới thiệu

Phân đoạn ảnh là các thao tác chia nhỏ bức ảnh đầu vào thành các miền hoặc các vật thể con với mức độ tùy theo nhu cầu xử lý Có rất nhiều kiểu phân đoạn như xác định biên của vật thể, xử lý các vùng ảnh, tách bạch rõ ràng vật thể và nền bằng 1 ngưỡng,… nhưng tựu chung lại mục tiêu của phân đoạn ảnh là làm nổi bật hoặc tách hẳn vật thể cần quan tâm ra từ ảnh ban đầu

Trong các thao tác về xử lý ảnh thì phân đoạn ảnh được xem là thao tác khó nhất và là thao tác rất quan trọng vì độ chính xác của quá trình phân đoạn ảnh có ý nghĩa quyết định tới các xử lý tính toán sau đó Phân đoạn có thể đóng vai trò trungtâm trong 1 số xử lý kĩ thuật như phân tích chất lượng sản phẩm, kiểm tra quá trìnhlắp ráp các chi tiết điện,… hoặc là 1 khâu trung gian cần thiết cho các quá trình xử

lý tiếp theo như các xử lý trong y học

Vì thời gian có hạn nên đề tài chỉ giới hạn trong việc xét ảnh xám chứ hầu như không xét tới sự phân đoạn ảnh màu Và cấu trúc của đề tài gồm các phần sau: Chương 1: là các vấn đề về tách 1 phần nhỏ của bức ảnh, cụ thể là tách điểm, tách dòng, tách biên Kĩ thuật chính của phần này là dựa vào sự rời rạc mức xám tại các phần này

Chương 2: dựa trên một số thuộc tính của mức xám là gradient và toán tử Laplace để tiến hành liên kết các đường biên bị gián đoạn và dùng lý thuyết đồ thị

để tìm ra các đường biên phân chia vật thể và nền

Chương 3: là các phương pháp chọn và xử lý trên ngưỡng; đây là kĩ thuật trung tâm của phân đoạn ảnh Trong đó chúng ta sẽ đi từ việc chọn ngưỡng toàn cục đơn (dễ thực hiện nhất) tới chọn 1 ngưỡng động bằng cách chia nhỏ ảnh và chọn ngưỡng tối ưu dựa trên các tính toán về xác suất

Chương 4: chúng ta tiến hành chia bức ảnh thành các vùng nhỏ theo 1 số đặc trưng nhất định rồi sau đó, tùy theo yêu cầu bài toán, ta sẽ tiến hành 1 số xử lý như chia vùng, trộn vùng

Chương 5: chương này nói về cách xác định các đường phân mức dựa trên 1 hình ảnh rất tự nhiên là các con đập Chúng ta sẽ tiến hành xây dựng các đập trên bức ảnh rồi cho ngập nước từ từ toàn bộ ảnh Tới 1 lúc nhất định khi chỉ còn các chỗ cao trên con đập chưa bị ngập thì ta có thể xác định được các

đường biên của đập và các đường biên này là các đường định mức cần tìm Chương 6: nhiệm vụ của chúng ta trong phần này là làm sao tách các vật thể chuyển động từ 1 bức ảnh đưa vào gồm các đối tượng động và tĩnh Có 2 kĩ thuật chính: kĩ thuật miền không gian dựa vào việc tạo ra 1 ảnh mẫu chỉ gồm các vật thể tĩnh và tính toán sai biệt tích lũy để xác định vật thể động, còn kĩ thuật miền tần số dựa vào các biến đổi Fourier

Phân đoạn ảnh Trang 51

Trang 3

Tách không liên tục Nhóm 2: Khanh, Ánh, Thảo, Dương.

1 TÁCH KHÔNG LIÊN TỤC:

Phần này chúng ta sẽ nói về 3 kỹ thuật cơ bản để tách mức xám không liên tục

trong một ảnh số: điểm, đường và biên Cách phổ biến nhất để tìm ra sự không liêntục này là sử dụng mặt nạ quét qua hết bức ảnh Ví dụ đối với mặt nạ 3x3 ở hình 1,quá trình này bao gồm việc tính tổng các tích của trọng số với mức xám trong vùngmặt nạ đi qua để thu được đáp ứng của mặt nạ:

Hình 1

1.1Tách Điểm:

Về nguyên tắc, việc tách các điểm cô lập trong 1 bức ảnh khá đơn giản Ví dụ

khi sử dụng mặt nạ như hình 2a, ta tách điểm có vị trí mà mặt nạ tập trung nếu :

đủ lớn (xác định bởi T) Tổng hệ số của mặt nạ bằng 0, điều đó chứng tỏ rằng đápứng của mặt nạ sẽ bằng 0 tại những vùng có mức xám không đổi

Hình 2b là 1 minh họa cho việc tách các điểm cô lập trong 1 ảnh Hình 2b biểudiễn ảnh chụp bằng tia X của bề mặt tua bin của 1 động cơ phản lực ở trạng thái bị

rỗ Có 1 pixel màu đen đơn lẻ ở trong mỗi vùng bị rỗ Hình 2c là kết quả sau khi áp

Phân đoạn ảnh Trang 3

Trang 4

Tách không liên tục Nhóm 2: Khanh, Ánh, Thảo, Dương.

dụng tách điểm bằng cách sử dụng mặt nạ 2a cho ảnh 2b Hình 2d là kết quả ápdụng công thức 1.2 với ngưỡng T bằng 90% giá trị của các pixel cao nhất tronghình 2c (Việc chọn ngưỡng – threshold sẽ được nói chi tiết trong phần sau).Những pixel đơn hiện ra rõ ràng trong bức ảnh này

Hình 2

Kiểu xử lý tách này thì khá đặc biệt bởi vì nó dựa trên cơ sở là những pixel đơnkhông liên tục trên nền đồng nhất của mặt nạ tách Khi điều kiện này không thỏamãn thì ta dùng phương pháp khác phù hợp hơn (sẽ được bàn đến trong chươngnày) để tách mức xám không liên tục

1.2Tách Dòng:

Phương pháp tiếp theo là tách dòng Cho những mặt nạ như trong hình 3

Nếu ma trận đầu tiên di chuyển qua bức ảnh, nó sẽ đáp ứng mạnh tại nhữngđường có hướng nằm ngang (độ dày một pixel) Với nền không đổi, kết quả trả vềlớn nhất khi đường đi qua hàng giữa của mặt nạ Thực nghiệm cho thấy mặt nạ thứ

2 trong hình 3 sẽ đáp ứng tốt nhất những đường có hướng là +45o, mặt nạ thứ 3 thìđáp ứng tốt với đường thẳng đứng, mặt nạ thứ tư thì đáp ứng tốt với những đường

có hướng là -45o Những hướng này cũng được thiết lập bằng cách làm chú ý rằngcác hướng thích hợp của mỗi mặt nạ có trọng số lớn hơn những hướng khác Chú ýrằng các hệ số trong 1 mặt nạ có tổng bằng 0, hệ số đáp ứng của mặt nạ sẽ bằng 0tại những vùng có mức xám không đổi

Phân đoạn ảnh Trang 4

Trang 5

Tách không liên tục Nhóm 2: Khanh, Ánh, Thảo, Dương.

Hình 3

Đặt R1,R2,R3 và R4 là đáp ứng của những mặt nạ trong hình 3 từ trái qua phải,trong đó Ri được xác định bởi (1.1) Cho 4 mặt nạ này lần lượt quét qua toàn bộảnh Nếu tại một điểm xác định trong hình, |R i |>|R j| với mọi j≠i, ta nói rằng điểm

đó có hướng phù hợp với hướng của mặt nạ i hơn Ví dụ nếu tại một điểm trongbức ảnh mà |R1|>|R j|, với j=2,3,4, thì điểm đó có hướng phù hợp hơn với hướngcủa đường nằm ngang Lần lượt chúng ta quan tâm đến việc tách những đường cóhướng xác định Trong trường hợp này, chúng ta sẽ sử dụng mặt nạ phù hợp vớihướng và ngưỡng đó của đầu ra, theo biểu thức (1.2) Nói cách khác, nếu nhưchúng ta quan tâm đến việc tách tất cả các đường trong ảnh với hướng xác định bởimột mặt nạ cho trước, chúng ta chạy mặt nạ này qua ảnh và tạo ngưỡng cho giá trịtuyệt đối của kết quả Những điểm còn lại là những điểm có đáp ứng mạnh nhất,đối với những đường có độ dày 1 pixel, phù hợp nhất với hướng được xác định bởimặt nạ Ví dụ sau sẽ minh họa cho điều này

Ví dụ:

Giả sử rằng chúng ta quan tâm đến việc tìm tất cả các đường có độ dày 1 pixel

và có hướng -45o Với giả thuyết này, chúng ta sử dụng mặt nạ cuối cùng tronghình 3 Kết quả được thể hiện trong hình 4b Chú ý rằng tất cả những phần ngang

và phần đứng trong bức ảnh thì bị loại bỏ và những phần của bức ảnh ban đầu mà

có hướng -45o thì được nổi rõ nhất trong hình 4b Để xác định những đường nàophù hợp nhất với mặt nạ chúng ta chọn ngưỡng cho hình này Kết quả của việc sửdụng ngưỡng bằng với giá trị lớn nhất của bức ảnh thể hiện trong hình 4c Giá trịlớn nhất này là một lựa chọn tốt cho 1 ngưỡng trong trường hợp này, bởi vì ảnhđầu vào là ảnh nhị phân Thực hiện xong việc này, chúng ta tìm những đáp ứngmạnh nhất Hình 4c biểu diễn tất cả những điểm vượt qua ngưỡng bằng màu trắng

Phân đoạn ảnh Trang 5

Trang 6

Tách không liên tục Nhóm 2: Khanh, Ánh, Thảo, Dương.

Hình 4

Trong trường hợp này, phương pháp trên chỉ tìm ra những đoạn có độ dày 1pixel và hướng -45o Những điểm cô lập nhìn thấy trong hình 4c là những điểmđáp ứng mạnh đối với mặt nạ Trong ảnh ban đầu, những điểm này và láng giềngcủa chúng được định hướng theo hướng mặt nạ đáp ứng mạnh nhất Những điểm

cô lập này có thể được tách bằng cách sử dụng mặt nạ trong hình 2a và sau đóđược xóa đi

1.3Tách Biên:

Mặc dù phương pháp tách điểm và tách dòng là các kỹ thuật phân đoạn quan

trọng, nhưng việc tách biên lại hoàn toàn khác xa với các kỹ thuật trên, nó được sửdụng phổ biến nhất cho việc tách độ trung bình không liên tục của mức xám Trongphần này chúng ta sẽ nói về công cụ đạo hàm bậc 1 và bậc 2 và nhấn mạnh về cácthuộc tính của chúng để tách biên cho bức ảnh

Cơ sở của việc tách biên:

Phân đoạn ảnh Trang 6

Trang 7

Tách không liên tục Nhóm 2: Khanh, Ánh, Thảo, Dương.

Một cách trực quan, một biên là tập hợp những pixel ( nằm trên đường biêngiới giữa 2 vùng) liên kết với nhau Tuy nhiên, biên và cạnh có sự khác nhau.Về cơbản ta sẽ xem xét một cách ngắn gọn, một cạnh là 1 khái niệm “cục bộ”, trong khiđường biên của một miền mang tính toàn cục hơn nhiều Một định nghĩa hợp lýcủa “biên” đòi hỏi khả năng đo được sự chuyển tiếp mức xám

Chúng ta bắt đầu bằng việc làm mô hình cho biên và việc đo đạc sự chuyểntiếp trung bình của mức xám chỉ mang tính hình thức Một cách trực quan, mộtbiên lý tưởng có các thuộc tính của mô hình ở hình 5a Theo mô hình này thì mộtbiên lý tưởng là một tập hợp các pixel (ở đây là theo hướng thẳng đứng) liên kếtvới nhau, mỗi thành phần của biên có vị trí tại 1 bước chuyển tiếp trực giao mứcxám

có một đường biên mảnh (có độ dày một pixel) Thay vào đó, một điểm biên bâygiờ là một điểm bất kì chứa trong đoạn dốc và biên là tập hợp những điểm liênthông Độ dày của đường biên được xác định bởi chiều dài của đoạn dốc, khi biênbiến đổi từ đầu đến cuối mức xám Độ dài này được xác định bởi độ nhòe Dễ dàngnhận ra rằng: biên nhòe thì dày và biên sắc nét thì mảnh

Phân đoạn ảnh Trang 7

Trang 8

Tách không liên tục Nhóm 2: Khanh, Ánh, Thảo, Dương.

Hình 6

Hình 6a hiển thị 1 phần trích ra từ hình 5b Ảnh 6b thể hiện mặt nghiêng củamột mức xám theo hướng nằm ngang của biên nằm giữa hai vùng Hình này cũngcho thấy đạo hàm bậc một, bậc hai của mức xám Đạo hàm bậc 1 dương tại nhữngđiểm chuyển tiếp từ trong ra ngoài đoạn dốc theo hướng di chuyển từ trái sangphải, và không đổi đối với những điểm nằm trên dốc, bằng 0 tại những vùng cómức xám không đổi Đạo hàm bậc hai dương tại những biến đổi tương ứng vớiphía tối của biên, âm tại những biến đổi tương ứng với phía sáng của biên, và bằng

0 dọc theo dốc hoặc trong những vùng mức xám không đổi Dấu của đạo hàmtrong 6b sẽ bị đảo ngược đối với những biên biến đổi từ sáng sang tối

Từ những quan sát trên ta kết luận rằng độ lớn của đạo hàm bậc 1 có thể được

sử dụng để phát hiện ra dấu hiệu của một biên tại một điểm trong hình (nghĩa làxác định điểm đó có nằm trên dốc không) Tương tự như vậy dấu của đạo hàm bậc

2 có thể được sử dụng để xác định một pixel cạnh nằm trên phía sáng hay phía tốicủa biên Chúng ta chú ý thêm hai thuộc tính của đạo hàm bậc hai xung quanh mộtbiên:

(1) Nó tạo ra hai giá trị cho mỗi cạnh (điều không mong muốn)

(2) Một đường thẳng tưởng tượng nối từ điểm dương lớn nhất và điểm âm nhỏ

nhất của đạo hàm bậc hai sẽ đi qua 0 gần với điểm giữa của biên Thuộc tính

zero-Phân đoạn ảnh Trang 8

Trang 9

Tách không liên tục Nhóm 2: Khanh, Ánh, Thảo, Dương.

Hình 7

Phân đoạn ảnh Trang 9

Trang 10

Tách không liên tục Nhóm 2: Khanh, Ánh, Thảo, Dương.

Các ảnh trong cột 2 của hình 7 là đạo hàm bậc 1 của những ảnh ở cột 1 Xétảnh ở giữa trên cùng, đạo hàm bằng 0 tại những vùng đen và trắng không đổi Đạohàm của một đoạn biên không đổi là hằng số biểu thị độ nghiêng của dốc Đạo hàmkhông đổi này được biểu diễn bằng màu xám Hình tiếp theo của cột 2 thì các đạohàm càng tăng so với trường hợp không có nhiễu Và trong hình cuối cùng của cột

2, rất khó để chỉ ra biên Yếu tố gây ra sự sai lệch này chính là nhiễu Ảnh cuốicùng có nhiều hạt nhỏ nhưng sự sai lệch này hầu như không thể nhận thấy

Ví dụ trên cho thấy độ nhạy của đạo hàm đối với nhiễu, đạo hàm bậc hai nhạyhơn đối với nhiễu Đạo hàm bậc hai của ảnh không nhiễu ở ảnh trên cùng bên phảicủa hình Đường mảnh màu trắng và đen là thành phần dương và âm được nhắcđến trong hình 6 Màu xám trong những ảnh này biểu diễn cho số 0 tương ứngtrong thang chia tỷ lệ Nhiễu đạo hàm bậc hai (tương tự với trường hợp không cónhiễu) tương ứng với nhiễu có độ lệch chuẩn ở mức xám 0.1 Hai ảnh đạo hàm bậchai và biên cho thấy rất khó để các tách thành phần âm và dương

Thực tế, nhiễu khá nhỏ vẫn có thể có sự tác động đáng kể trên 2 đạo hàm thenchốt được dùng cho việc tách ảnh Vì vậy đối với những ứng dụng rất có khả năngxuất hiện nhiễu với các mức độ chúng ta vừa đề cập, ta nên làm trơn ảnh trước khi

xử lý

Dựa vào ví dụ này và 3 nội dung đã trình bày, chúng ta đưa ra kết luận rằngtiêu chuẩn để phân loại 1 điểm biên là sự chuyển tiếp mức xám tương ứng vớiđiểm đó phải mạnh hơn đáng kể so với nền của điểm đó Vì chúng ta đang đề cậpđến tính toán cục bộ, do đó chúng ta kết luận 1 điểm trong ảnh là điểm biên nếuđạo hàm bậc nhất của nó lớn hơn một ngưỡng lý thuyết Biên là tập hợp nhữngđiểm thỏa điều kiện đó liên kết với nhau theo một tiêu chuẩn xác định cho trước

Sự phân đoạn giới hạn biên được sử dụng nếu biên ngắn so với các kích cỡ củaảnh Vấn đề then chốt trong việc phân đoạn là lắp ráp các phần biên thành nhữngbiên dài hơn Nếu chúng ta quyết định sử dụng đạo hàm bậc hai để dễ dàng xácđịnh các điểm biên trong 1 ảnh khi đạo hàm bậc hai của nó là 0 thì có 1 định nghĩathay thế Trong trường hợp này, định nghĩa của biên cũng giống như trên Điềuquan trọng cần chú ý là những định nghĩa này không đảm bảo thành công trongviệc tìm điểm biên của ảnh Chúng chỉ đơn giản là cho chúng ta một hình thức tìmkiếm các điểm biên đó

Toán tử Gradient :

Đạo hàm bậc nhất của 1 ảnh số dựa trên những xấp xỉ khác nhau của độ chênhlệch của cả hai thành phần x và y Gradient của 1 ảnh f(x,y) tại vị trí (x,y) được xácđịnh là vectơ :

Trang 11

Tách không liên tục Nhóm 2: Khanh, Ánh, Thảo, Dương.

Từ sự phân tích vector, ta thấy rằng các vector Gradient cho biết hướng và tốc

độ thay đổi cực đại của f tại (x, y)

Một đại lượng quan trọng trong tách biên là độ lớn của vector này, được kýhiệu là ∇f :

∂ ∂ và ∂ ∂f / y tại mỗi vị trí pixel Cho vùng (3x3) trong hình 8(a) biểu diễn các

mức xám trong vùng lân cận của ảnh Một trong những cách dễ nhất để tính đạohàm riêng bậc nhất tại điểm z5 là sử dụng toán tử Robert:

Trang 12

Tách không liên tục Nhóm 2: Khanh, Ánh, Thảo, Dương.

Hình 8

Trong công thức này, sự khác nhau giữa hàng 1 và hàng thứ 3 của vùng ảnh 3 x

3 xấp xỉ với đạo hàm theo x, và sự khác nhau giữa cột thứ 3 và cột thứ 1 xấp xỉ vớiđạo hàm theo y Những mặt nạ trong hình 8(d) và (e) gọi là các toán tử Prewitt, cóthể được sử dụng để thực hiện hai phương trình này

Một sự biến đổi nhỏ giữa hai phương trình này là việc nhân hệ số trung tâm với2:

Trang 13

Tách không liên tục Nhóm 2: Khanh, Ánh, Thảo, Dương.

Hình 8(f) và (g) là toán tử Sobel được dùng để thực hiện hai phương trình này.Toán tử Prewitt và toán tử Sobel được sử dụng nhiều nhất trong thực hành tínhtoán các gradient số Việc thực hiện mặt nạ Prewitt đơn giản hơn so với mặt nạSobel, nhưng lại gây ra nhiễu suppression nhỏ, một vấn đề quan trọng khi sử dụngđạo hàm Chú ý rằng các hệ số trong tất cả các mặt nạ ở hình 8 đều có tổng bằng 0,nên các đáp ứng phải bằng 0 trong vùng mức xám cố định

Những mặt nạ vừa đề cập được sử dụng để tính các thành phần Gradient G x

y

G Việc tính Gradient theo phương trình (1.4) không phải bao giờ cũng được sửdụng bởi vì những tính toán bắt buộc là bình phương và khai căn bậc hai Mộtphương pháp hay được sử dụng là xấp xỉ gradient bằng giá trị sau:

Chúng ta có thể điều chỉnh mặt nạ 3x3 trong hình 8 để có những kết quả trả vềtốt nhất theo hướng chéo Các mặt nạ Prewitt và Sobel bổ sung để tách những điểmkhông liên tục theo hướng chéo được thể hiện trong hình 9

Hình 9

Hình 10 minh họa đáp ứng của hai thành phần của gradient, |G x|và |G y| như làảnh gradient được tạo thành từ tổng của hai thành phần này Hướng của hai thànhphần rất rõ trong hình 10(b) và (c) Chú ý đặc biệt là sự nổi rõ của ngói lợp máinhà, những chỗ nối viên gạch nằm ngang và những phần ngang của cửa sổ tronghình 10(b) Ngược lại, hình 10(c) lại nổi rõ những thành phần dọc, như là góc của

Phân đoạn ảnh Trang 13

Trang 14

Tách không liên tục Nhóm 2: Khanh, Ánh, Thảo, Dương.

Ở hình 10 và 11 rõ ràng những mặt nạ Sobel theo chiều ngang và chiều dọc đápứng tốt gần như nhau với những biên định hướng -450 và +450 Nếu chú ý đến việclàm nổi biên theo hướng đường chéo, thì ta nên dùng một trong những cặp mặt nạ

ở hình 9

Đáp ứng tốt của mặt nạ Sobel chéo được biểu diễn ở hình 12 Rõ ràng tronghình này những đường chéo đáp ứng mạnh hơn với những mặt nạ này Cả 2 mặt nạđường chéo đều này đều có đáp ứng giống nhau cho biên ngang và biên dọc,nhưng như dự đoán, đáp ứng của chúng theo những hướng này yếu hơn đáp ứngcủa mặt nạ Sobel ngang và dọc biểu diễn trong hình 10(b) và 10(c)

Phân đoạn ảnh Trang 14

Trang 15

Tách không liên tục Nhóm 2: Khanh, Ánh, Thảo, Dương.

Trang 16

Tách không liên tục Nhóm 2: Khanh, Ánh, Thảo, Dương.

• Vì là đạo hàm bậc 2 nên toán tử Laplace rất nhạy với nhiễu (hình 7)

• Toán tử Laplace thường tạo ra biên kép (xem ở hình 6 và 7), đây là một hiệuứng không mong muốn bởi vì nó làm cho việc phân đoạn trở nên rắc rối

• Lý do cuối cùng là toán tử Laplace không thể nhận dạng hoặc tách hướngbiên ảnh một cách trực tiếp

Vì những lý do này nên vai trò của toán tử Laplace trong phân đoạn bao gồm :(1) Sử dụng thuộc tính Zero-crossing cho vị trí biên

(2) Sử dụng nó với mục đích bổ sung là xác định một pixel ở mặt tối hay mặtsáng của biên

Ở vai trò đầu tiên, toán tử Laplace được kết hợp với hàm làm trơn là tiền thâncủa việc tìm biên thông qua thuộc tính Zero-crossing Xem xét hàm sau:

2 2 2( )

Trang 17

Tách không liên tục Nhóm 2: Khanh, Ánh, Thảo, Dương.

Hình 14

Hình 14 biểu diễn đồ thị 3-D, mặt cắt ngang của hàm LoG, và một mặt nạ 5 x 5xấp xỉ ∇2h Xấp xỉ này không phải là duy nhất Mục đích của nó là thu được hìnhdạng cơ bản của ∇2h, đó là hình gồm một vùng ở giữa dương, kề liền là vùng biênmang giá trị âm bao bọc xung quanh có giá trị tăng theo khoảng cách với gốc tọa

độ và một vùng bên ngoài mang giá trị 0 Các hệ số cũng phải có tổng bằng 0 đểđáp ứng mặt nạ bằng 0 ở những vùng mức xám không đổi Mặt nạ nhỏ chỉ hữudụng đối với những ảnh không có nhiễu Dựa vào hình dạng của nó, đôi khi toán tửcủa Gauss cũng được gọi là hàm mũ Mexico (Mexican hat)

Vì đạo hàm bậc 2 là toán tử tuyến tính nên tích chập của ảnh với ∇2h cũngtương tự như tích chập của ảnh với hàm làm trơn Gauss ở phương trình (1.16), sau

đó tính Laplace của kết quả vừa tìm được Vì vậy, ta thấy rằng mục đích của hàmGauss trong việc tính toán theo công thức LoG là để làm trơn ảnh, và mục đích củatoán tử Laplace là để cung cấp hình ảnh với Zero crossing được dùng để xác định

vị trí của biên Việc làm trơn ảnh sẽ làm giảm đi tác động của nhiễu và chủ yếu là

nó ngăn chặn sự tăng tác động của nhiễu gây ra bởi đạo hàm bậc 2 của toán tửLaplace

Phân đoạn ảnh Trang 17

Trang 18

Tách không liên tục Nhóm 2: Khanh, Ánh, Thảo, Dương.

Hình 15

Hình 15(a) là hình chụp X-Quang của mạch máu Hình 15(b) biểu diễnGradient Sobel của hình này Hình 15(c) là 1 hàm Gauss trong không gian ( vớimột độ lệch chuẩn 5 pixel) được dùng để thu được mặt nạ trơn trong không gian 27

x 27 Hình 15(d) là mặt nạ trong không gian được sử dụng để thực hiện phươngtrình (1.5) Hình 15(e) là hình LoG thu được bằng cách làm trơn ảnh ban đầu vớimặt nạ làm trơn Gauss, sau đó áp dụng mặt nạ Laplace (hình này đã được dùng đểkhử hiệu ứng đường biên tạo ra bởi mặt nạ làm trơn)

Kết quả LoG biểu diễn trong hình 15(e) là ảnh thu được từ việc tính toán Zerocrossing để tìm biên Một phương pháp dễ hiểu cho xấp xỉ zero crossing là tạongưỡng ảnh LoG bằng cách thiết lập tất cả giá trị dương cho điểm màu trắng, và tất

cả giá trị âm cho điểm màu đen Kết quả được biểu diễn trong hình 15(f) Tính

Phân đoạn ảnh Trang 18

Trang 19

Tách không liên tục Nhóm 2: Khanh, Ánh, Thảo, Dương.

logic của phương pháp này là zero crossing xảy ra giữa những giá trị âm và dươngcủa toán tử Laplace Cuối cùng, hình 15(g) biểu diễn ước lượng zero crossing thuđược bằng cách quét ngưỡng ảnh và làm nổi phần chuyển tiếp giữa vùng màu đen

và vùng màu trắng

So sánh hình 15(b) và (g) ta phát hiện ra vài sự khác biệt quan trọng và thú vị.Trước tiên, chúng ta chú ý thấy biên trong ảnh zero-crossing mảnh hơn biên trongảnh gradient Đây là đặc trưng của zero-crossing làm cho phương pháp được thuhút Mặt khác, chúng ta xem trong hình 15(g), biên được xác định bởi zero-crossing hình thành các mạch kín nhiều hơn Cái này thường được gọi là hiệu ứngspaghetti, là một trong những mặt hạn chế lớn nhất của phương pháp này Mặt hạnchế lớn khác là độ phức tạp của việc tính toán zero crossing, mà việc tính toán nàylại là nền tảng của phương pháp Mặc dù nó hợp lý trong ví dụ này, nhưng thực tếviệc tính toán zero crossing thường có rất nhiều trở ngại, và để thu được kết quả cóthể chấp nhận được đòi hỏi phải có những kỹ thuật tinh vi hơn ( Huertas vàMedione [1986] )

Phương pháp zero-crossing được quan tâm sử dụng vì khả năng làm giảmnhiễu và ẩn đi những biểu diễn gồ ghề Tuy nhiên, sự hạn chế chỉ nổi rõ khi biểudiễn một chướng ngại vật khá lớn trong các ứng dụng thực tế Vì lý do này, các kỹthuật tìm biên dựa trên những cách tính gradient khác nhau vẫn thường được sửdụng hơn phương pháp zero crossing trong việc thực hiện thuật toán phân đoạn

2 LIÊN KẾT BIÊN VÀ TÁCH ĐƯỜNG GIỚI HẠN :

Những phương pháp đã thảo luận trước đây giúp định ra những pixel nằm trên

biên và sắp xếp các pixel đó vào các tập hợp riêng Tuy nhiên trong thực tế thìhiếm khi tập hợp các pixel này xác định 1 cạnh hoàn chỉnh vì có sự xuất hiện củanhiễu, sự vỡ cạnh do chiếu sáng không đồng đều và các tác động khác tạo ra mật

độ gián đoạn sai lệch Chính vì vậy mà các giải thuật xác định biên luôn đi kèmvới việc liên kết các thủ tục nhằm tập hợp các pixel thành các cạnh có ý nghĩa Sauđây là một vài phương pháp cơ bản:

2.1 Xử lý cục bộ:

Một trong những phương pháp đơn giản nhất để liên kết cạnh là phân tích tínhchất của các pixel trong 1 láng giếng nhỏ (3×3 hay 5×5) của những pixel mà đã được định là 1 điểm của 1 cạnh nào đó bằng 1 trong các phương pháp đã bàn trongphần trước Tất cả các điểm mà thỏa một số tính chất định trước nào đó thì đượcliên kết lại Sau cùng ta sẽ có 1 cạnh thỏa các tính chất đã định trước

Hai tính chất chính được dùng trong phương pháp phân tích này là : (1) Độ dàicủa kết quả của toán tử gradient được sử dụng để tạo ra các pixel cạnh; và (2)Hướng của véctơ gradient Tính chất đầu tiên sử dụng giá trị của ∇ f :

Phân đoạn ảnh Trang 19

Trang 20

Liên kết biên và tách đường giới hạn Nhóm 2: Khanh, Ánh, Thảo, Dương.

| ∇ f x y ( , ) − ∇ f x y ( , ) |0 0 ≤ E ,trong đó E là 1 ngưỡng không âm

Hướng (góc) của véctơ gradient được đưa ra trong phương trình (1-5), mộtpixel cạnh tại ( , ) x y0 0 trong một lân cận cho trước của (x,y) có góc tương tự vớipixel (x,y) nếu:

| ( , ) α x y − α ( , ) | x y0 0 < A , với A là ngưỡng góc không âm.Như đã chú ý trong phương trình (1-5), hướng của một biên tại (x,y) vuông góc vớihướng của véctơ gradient tại điểm đó

Một điểm trong lân cận cho trước của (x,y) được liên kết với pixel tại (x,y) nếu

cả tiêu chuẩn về độ lớn và hướng được đáp ứng Quá trình này được lặp lại tại mọi

vị trí trong bức ảnh Sẽ có một mẫu tin lưu lại những điểm liên kết với điểm trungtâm của vùng lân cận lần lượt di chuyển từ pixel này sang pixel khác Một thủ tụcđánh dấu đơn giản là đưa ra cho mỗi tập hợp các pixel biên liên kết một mức xámkhác nhau

Để minh họa cho những thủ tục đã nói, hãy nhìn vào hình 16(a) - ảnh chụp phíasau chiếc xe Mục đích là để tìm ra hình chữ nhật có kích thước phù hợp với kíchthước của bảng số xe Thông tin của những hình chữ nhật này có thể được lấy đượcbằng cách xác định các cạnh dọc và ngang của chúng Hình 16(b) và (c) thể hiệnnhững cạnh dọc và ngang nhận được bằng cách sử dụng toán tử Sobel dọc vàngang Hình 16(d) là kết quả nhận được sau khi liên kết tất cả những điểm có giátrị gradient lớn hơn 25 và hướng của véctơ gradient không khác biệt quá 150

Các đường ngang được tạo ra bằng cách sử dụng liên tiếp các tiêu chuẩn trêncho từng dòng của hình 16(c) Lần lượt quét từng cột của hình 16(b) thì ta có cáccạnh dọc Hơn nữa quá trình xử lý trên còn bao hàm cả thao tác liên kết các đoạncạnh nhỏ bị phân chia do các vết nứt nhỏ và hủy bỏ các đoạn cạnh ngắn cô lập

Trang 21

Liên kết biên và tách đường giới hạn Nhóm 2: Khanh, Ánh, Thảo, Dương.

Hình 16

Cuối cùng, như ta thấy ở hình 16(d), hình chữ nhật tương ứng với bảng số xe là 1trong số các hình chữ nhật được xác định trong ảnh Và bây giờ thì thật dễ dàng đểđịnh vị bảng số xe dựa vào các hình chữ nhật này (tỉ lệ chiều dài chia chiều cao củabảng số xe hình chữ nhật luôn là 2:1 với các bảng số của U.S.)

2.2 Liên kết cạnh và tách biên:

Trong phần này, các điểm được liên kết với nhau đầu tiên nếu chúng nằm trênmột đường cong có hình dạng được định trước Không giống như phương phápphân tích cục bộ đã được thảo luận trong phần trước, bây giờ chúng ta lại quan tâmtới mối quan hệ toàn cục giữa các pixel

Cho n điểm trên 1 bức ảnh Giả sử rằng ta muốn tìm ra những tập con của cácđiểm thuộc cùng một đường thẳng Một lời giải khả dĩ là trước tiên tìm ra tất cả cácđường thẳng được xác định bởi mỗi cặp điểm, rồi sau đó tìm các tập con của nhữngđiểm gần với các đường đặc biệt Vấn đề nảy sinh trong cách làm này là nó baogồm việc xác định ra

Trang 22

Liên kết biên và tách đường giới hạn Nhóm 2: Khanh, Ánh, Thảo, Dương.

Hough [1962] đã đề xuất 1 cách tiếp cận khác, đó là biến đổi Hough (Houghtransform) Xét điểm ( , )x y và phương trình tổng quát của đường thẳng có dạng: i i

y = ax + b Có vô số đường thẳng cùng đi qua ( , ) x yi i , nhưng tất cả chúng đều

có dạng yi = axi + b với các giá trị khác nhau của a và b Tuy nhiên, khi viết lạiphương trình này dưới dạng b=-axi + yi và xét mặt phẳng ab (còn gọi là khônggian tham số) ta đưa ra được phương trình của một đường đơn cho một cặp

( , ) x yi i tương ứng Hơn nữa, một điểm thứ hai ( , ) x yj j cũng có một đường trongkhông gian tham số tương ứng với nó, và đường này giao với đường thẳng ứng với

( , ) x yi i tại (a', b'), với (a',b') là giao điểm của đường thẳng chứa cả hai điểm

( , ) x yi i và ( , ) x yj j trong mặt phẳng xy Thực tế, tất cả mọi điểm trên đường nàyđều có các đường trong không gian tham số giao nhau tại (a’,b’) Hình 17 minhhọa cho những khái niệm này

Hình 17

Sự hấp dẫn trong tính toán của biến đổi Hough bắt nguồn từ việc chia nhỏkhông gian tham số thành những cái gọi là ô tích lũy (accumulator cells) như minhhọa trong hình 18, trong đó ( amax, amin)và ( bmax, bmin)là những khoảng mong đợicủa các giá trị độ dốc (slope) và intercept Ô ở tọa độ (i,j) (có giá trị tích lũy A(i,j))tương ứng với hình vuông trong không gian tham số có tọa độ ( , ) a bi j .

Trang 23

Liên kết biên và tách đường giới hạn Nhóm 2: Khanh, Ánh, Thảo, Dương.

Hình 18

Quá trình xác định các giá trị tích lũy được làm như sau :

B1: Cho mọi giá trị tích lũy A(i,j) = 0

B2: Với mỗi điểm ( , )x y k k trong mặt phẳng ảnh.Ta đặt tham số a = giá trị chianhỏ trên trục x Sau đó giải b = − x a yk + k rồi làm tròn b tới giá trị gần nhất trêntrục b Nếu một lựa chọn của ap tìm được bq, chúng ta gán A(p,q) = A(p,q)+1 B3: Cuối cùng ta thay giá trị Q trong A(i,j) tương ứng với Q điểm trong mặtphẳng xy nằm trên đường thẳng y a x b = i + j Số lượng các điểm chia trong mặtphẳng ab quyết định sự chính xác của sự cộng tuyến của các điểm này

Chú ý rằng nếu số khoảng chia nhỏ của trục a là K thì ứng với mỗi điểm ảnh

( , ) x yk k , giá trị K của b tương ứng với các giá trị K có thể có của a Do đó với nđiểm ảnh thì ta chỉ tốn nK phép tính Vì vậy mà quá trình xử lý này là tuyến tínhtheo n, và tích nK không đạt đến số phép tính đã được thảo luận ở đầu phần này trừkhi K xấp xỉ hoặc lớn hơn n

Tuy vậy có vấn đề nảy sinh khi sử dụng phương trình y = ax + b để biểu diễn 1đường thẳng là hệ số góc sẽ tiến tới vô cùng khi đường thẳng “xấp xỉ” trục đứng.Một cách để khắc phục khó khăn này là sử dụng biểu diễn thông thường của đườngthẳng :

x θ + y θ ρ = (2-3) Hình 19a minh họa sự giải thích bằng hình học của những tham số được sửdụng trong phương trình (2-3) Việc sử dụng biểu diễn này trong việc xây dựngmột bảng của những bộ đếm thì giống với phương pháp đã thảo luận cho cách biểudiễn Slope-intercept Tuy nhiên, thay vì là những đường thẳng, quỹ tích các điểm

đó lại là các đường hình sin trong mặt phẳng ρθ Như trên, Q điểm cùng nằm trên

Trang 24

Liên kết biên và tách đường giới hạn Nhóm 2: Khanh, Ánh, Thảo, Dương.

đường thẳng cosx θ +j ysinθ = ρj tạo ra Q đường hình sin giao nhau tại ( , ) ρ θi j

trong không gian tham số Hình 19b biểu diễn việc chia không gian tham số Tăng

θ và giải ρ tương ứng sẽ thu được Q dữ liệu trong giá trị tích lũy A(i,j) tương ứngvới ô được xác định bởi ( , ) ρ θi j Hình 19b minh họa việc chia nhỏ cho không gian

tham số

Khoảng giá trị của θlà ± 900, tương ứng với trục x Do đó với biểu diễn tronghình 19a, một đường thẳng nằm ngang sẽ có θ= 00và ρbằng x-intercept dương.

Tương tự với trường hợp đường thẳng dọc ta có θ = 900còn ρ bằng y-intercept

dương , hoặc θ = − 900, với ρ bằng giá trị y-intercept âm.

Hình 19

Hình 20 minh họa biến đổi Hough dựa vào phương trình (2-3) Hình 20a biểudiễn ảnh với 5 điểm được đánh số Mỗi điểm được ánh xạ qua mặt phẳng ρθ nhưbiểu diễn ở hình 20b Khoảng giá trị của giá trị θ là ± 900, và khoảng của trục ρ

là ± 2D, với D là khoảng cách giữa hai góc trong ảnh Không giống như biến đổidựa trên việc sử dụng slope-intercept, mỗi đường cong có dạng hình sin khác nhau.Đường nằm ngang là kết quả của việc ánh xạ điểm 1, đó là trường hợp đặc biệt củamột hàm sin với biên độ 0

Thuộc tính nhận dạng sự cộng tuyến của biến đổi Hough được minh họa tronghình 20c Điểm A là giao điểm của những đường cong tương ứng với các điểm 1,3

và 5 trong mặt phẳng ảnh xy Vị trí của điểm A cho thấy 3 điểm này nằm trên mộtđường thẳng đi qua gốc tọa độ ( ρ = 0) và có hướng là − 45 0 Tương tự, giao điểmcủa những đường cong tại điểm B trong không gian tham số cho thấy các điểm 2,

3, 4 nằm trên một đường thẳng có hướng 45 0 và khoảng cách của các điểm đó đếngốc tọa độ bằng nửa khoảng cách đường chéo từ gốc đến góc đối diện của ảnh

Trang 25

Liên kết biên và tách đường giới hạn Nhóm 2: Khanh, Ánh, Thảo, Dương.

Hình 20

Cuối cùng, hình 20d cho thấy rằng biến đổi Hough biểu diễn mối quan hệ đốixứng tại những biên bên trái và bên phải của không cách tham số Thuộc tính nàyđược biểu diễn bởi những điểm A, B, C trong hình 20d, là kết quả của phươngpháp với ρ và θ thay đổi dấu tại các đường bao ± 90 0

Mặc dù biến đổi Hough chủ yếu dành cho đường thẳng nhưng ta vẫn có thể ápdụng nó cho bất cứ hàm nào có dạng g(v,c) = 0, trong đó v là vector tọa độ và c làvector hệ số Ví dụ các điểm nằm trên đường tròn

( x c − ) + − ( y c ) = c (2-4)

có thể được xác định bằng cách sử dụng phương pháp trên Sự khác nhau cơ bản là

sự hiện diện của 3 tham số (c1, c2 và c3), mà kết quả nằm trong không gian tham số3-D với những khối lập phương và tích lũy có dạng A(i, j, k) Thủ tục này là đểtăng c1, c2, tìm c3 theo phương trình (2-4) và cập nhật giá trị tích lũy cho các ôtương ứng với bộ ba (c1, c2 và c3) Rõ ràng, độ phức tạp của biến đổi Hough tỉ lệvới số lượng tọa độ và những hệ số được cho trong phương trình biểu diễn Hơnnữa, ta có thể suy rộng biến đổi Hough nhằm nhận diện các đường cong có biểudiễn không đơn giản, như là ứng dụng của biến đổi ảnh xám

Bây giờ, chúng ta trở lại vấn đề liên kết cạnh Một phương pháp dựa trên biếnđổi Hough được trình bày như sau:

Trang 26

Liên kết biên và tách đường giới hạn Nhóm 2: Khanh, Ánh, Thảo, Dương.

nó vượt quá một ngưỡng xác định

Hình 21

Hình 21a biểu diễn một ảnh hồng ngoại tưởng tượng bao gồm hai chỗ chứamáy bay và một đường băng, hình 21b là ảnh radient đã được phân ngưỡng thuđược bằng cách sử dụng toán tử Sobel như đã thảo luận ở phần 1.3 (chú ý khoảngcách nhỏ giữa hai tầng cánh của máy bay trong đường biên của đường bay) Hình20c (màu trắng) biểu diễn biến đổi Hough của ảnh gradient, hình 20d biểu diễn tậphợp những pixel được liên kết với nhau dựa trên tiêu chuẩn:

- Thuộc vào một trong 3 ô tích lũy (accumulation cell) với bộ đếm cao nhất

Trang 27

Liên kết biên và tách đường giới hạn Nhóm 2: Khanh, Ánh, Thảo, Dương.

- Không lệch quá 5 pixel

Chú ý rằng sự biến mất của các kẽ hở chính là kết quả của sự liên kết.

2.3Xử lý toàn cục bằng phương pháp lý thuyết đồ thị:

Chúng ta bắt đầu với một số định nghĩa cơ bản Một đồ thì G= (N, U) là mộttập hợp các nốt N khác rỗng hữu hạn, với một tập hợp U không có thứ tự các cặpthành phần nhất định của tập N Mỗi cặp (ni, nj) của U được gọi là một cung

Hình 22

Một đồ thị mà các cạnh có hướng được gọi là đồ thị có hướng Nếu một cung

có hướng từ ni đến nj, thì nj là con của nốt ni Quá trình nhận biết một successorcủa 1 nốt được gọi là khai triển của một nốt Trong mỗi đồ thị chúng ta xác địnhcác mức của nó, chẳng hạn mức 0 gồm một nốt đơn, gọi là nốt bắt đầu hay nốt gốc,

và những nốt ở mức cuối cùng được gọi là nốt lá c(ni, nj) có thể kết nối được vớimọi cung (ni, nj) Một dãy các nốt n1, n2,…, nk ( trong đó mỗi nốt ni là một nốt concủa ni-1) được gọi là một đường đi từ n1 đến nk Trọng số của toàn bộ đường đi là:

=

= ∑ (2.5) Một thành phần cạnh như là đường bao giữa 2 pixel p và q, với p và q là lánggiềng-4 như minh họa ở hình 22 Những thành phần cạnh được định nghĩa bởinhững tọa độ (x,y) của điểm p và q Nói cách khác, thành phần cạnh trong hình 22được định nghĩa bởi cặp (xp, yp)(xq, yq) Giống với định nghĩa trong 1.3, một cạnh

là một dãy các thành phần cạnh liên kết với nhau

Chúng ta có thể minh họa cách áp dụng tư tưởng trên để tách biên sử dụng ảnh3x3 trong hình 23a Các số bên ngoài là các tọa độ pixel và số bên trong ngoặcvuông biểu diễn giá trị mức xám

Mỗi thành phần biên xác định bởi pixel p và q có trọng số tương ứng được địnhnghĩa bởi:

( , ) ( ) ( )

Trang 28

Liên kết biên và tách đường giới hạn Nhóm 2: Khanh, Ánh, Thảo, Dương.

Với H là giá trị mức xám cao nhất trong bức ảnh (trong trường hợp này là 7),

f p( ) và f q( ) là giá trị mức xám của p và q Qui ước điểm p nằm bên tay phảicủa hướng di chuyển dọc theo thành phần biên

Hình 23

Ví dụ: đoạn biên (1, 2) (2, 2) nằm giữa điểm (1, 2) và (2, 2) trong hình 23b Nếuhướng di chuyển sang bên phải thì p là điểm có tọa độ (2, 2) và q là điểm có tọa độ(1, 2); khi đó c(p, q) = 7 - [ 7 - 6] = 6 Trọng số này được biểu diễn trong hìnhvuông bên dưới thành phần biên Nếu chúng ta di chuyển sang trái giữa hai điểmnhư trên thì p là điểm (1, 2) và q là điểm (2, 2) Trong trường hợp này c(p, q) = 8,được thể hiện bên trên của thành phần biên trong hình 23b Để đơn giản chúng tagiả sử rằng các cạnh bắt đầu ở hàng trên cùng và kết thúc ở hàng cuối, vì vậy thànhphần đầu tiên của biên chỉ có thể nằm giữa những điểm (1, 1), (1, 2) hoặc (1, 2), (1,3) Tương tự thành phần biên cuối cùng chỉ nằm giữa những điểm (3, 1), (3, 2)hoặc (3, 2), (3, 3) Dựa theo ý tưởng này thì p và q là liên láng giềng 4 như chú ýtrên

Hình 24 biểu diễn đồ thị cho vấn đề này Mỗi nốt trong đồ thị tương ứng vớithành phần biên từ hình 23 Giữa 2 nốt có một cung nếu 2 thành phần biên tươngứng là một thành phần của một cạnh Như hình 23(b), trọng số của mỗi thành phầnbiên được tính toán bằng công thức 2.6, được biểu diễn trong hình vuông nằm bêncạnh cung nối với nốt tương ứng Các nốt lá được tô đậm Đường đi có trọng sốnhỏ nhất được biểu diễn bằng đường đứt nét và cạnh tương ứng với đường đi nàyđược biểu diễn trong hình 23(c)

Trang 29

Liên kết biên và tách đường giới hạn Nhóm 2: Khanh, Ánh, Thảo, Dương.

Hình 24

Thông thường vấn đề tìm đường đi có trọng số nhỏ nhất không đơn giản trongtính toán Phương pháp này sẽ làm mất đi sự tối ưu tốc độ Thuật toán sau đây biểudiễn lớp các thủ tục sử dụng heuristic để giảm đi việc tìm kiếm Đặt r(n) là ướclượng của trọng số của đường đi có trọng số nhỏ nhất từ điểm bắt đầu s cho đến nốt

lá, trong đó đường đi phải đi qua n Trọng số này có thể biểu diễn như là một trọng

số ước lượng của đường đi có trọng số nhỏ nhất từ s đến n cộng với trọng số củađường đi đó từ n đến nốt lá, tức là,

r(n) = g(n) + h(n) (2.7)

trong đó g(n) có thể chọn như là đường đi có trọng số nhỏ nhất từ s tới n đã đượctìm thấy, và h(n) có được bằng cách sử dụng bất kỳ thông tin heruristic nào có giátrị Một thuật toán sử dụng r(n) như là nền tảng cho biểu diễn tìm kiếm trong đồ thịgồm các bước sau:

Bước 1 : Đánh dấu nốt bắt đầu là OPEN và đặt g(s) =0

Bước 2 : Nếu không có nốt nào OPEN thì thoát và báo lỗi, ngược lại đến

bước 3

Trang 30

Liên kết biên và tách đường giới hạn Nhóm 2: Khanh, Ánh, Thảo, Dương.

Bước 3 : Đánh dấu CLOSED cho nốt OPEN n mà ước lượng r(n) được tính

từ phương trình (2.7) là nhỏ nhất

Bước 4 : Nếu n là nốt lá thì kết thúc, ta nhận được đường đi kết quả bằng

việc dò ngược con trỏ Ngược lại, qua bước 5

Bước 5 : Mở rộng nốt n, khởi tạo tất cả các phần tử tiếp theo của nó (nếu

không có phần tử tiếp theo thì đến bước 2)

Bước 6 : Nếu một phần tử tiếp theo ni không được đánh dấu Đặt

r(ni)= g(n) + c(n, ni) , đánh dấu OPEN, và hướng con trỏ quay ngược lại n

Bước 7 : Nếu phần tử kế tiếp ni được đánh dấu CLOSED hoặc OPEN, cậpnhật giá trị của nó bằng cách đặt

g’(ni) = min[ g(ni), g(n) + c(n,ni)]

Đánh dấu OPEN cho những nốt CLOSED kế tiếp có giá trị g’ nhỏ và định

hướng lại các con trỏ đến n từ tất cả những nốt mà giá trị g’ nhỏ, trở về bước

2

Thuật toán này không chắc chắn đưa ra đường đi ngắn nhất, ưu điểm của nó làtốc độ nhờ sử dụng heuristic Tuy nhiên, nếu h(n) là giới hạn nhỏ hơn của trọng sốcủa đường đi ngắn nhất từ n đến một nốt lá thì thuật toán này sẽ tìm được mộtđường đi tối ưu Nếu không có thông tin Heuristic nào có giá trị (nghĩa là h ≡ 0) thìphải dùng thuật toán Dijkstra [1959]

Ví dụ :

Hình 25

Trang 31

Liên kết biên và tách đường giới hạn Nhóm 2: Khanh, Ánh, Thảo, Dương.

Hình 25 biểu diễn bức ảnh của một ảnh của bóng nhiễm sắc thể bị nhiễu và mộtbiên được tìm thấy bằng cách sử dụng tìm kiếm đồ thị heuristic dựa trên thuật toánđược phát triển trong mục này Biên biểu diễn bằng màu trắng chồng lên trên ảnhgốc Chú ý rằng, trong trường hợp này biên và giới hạn của đối tượng là xấp xỉ nhưnhau Trọng số tính theo phương trình 2.6 và heuristic sử dụng ở một điểm bất kỳtrên đồ thị là để xác định và sử dụng đường đi tối ưu cho 5 mức từ điểm đó Xemxét số lượng nhiễu biểu diễn trong hình này, ta thấy phương pháp tìm kiếm đồ thị

đã đưa ra một kết quả chính xác hợp lý

3 NGƯỠNG:

Bởi vì những tính chất trực giác và sự thực hiện đơn giản nên phân ngưỡngđóng vai trò trung tâm trong phân đoạn ảnh Trong các chương trước chúng ta đãnhắc sơ về ngưỡng cùng 1 số ứng dụng đơn giản của nó, còn chương này sẽ trìnhbày về ngưỡng 1 cách chính thức hơn và đưa nó vào trong những kỹ thuật mà tổngquát hơn rất nhiều

3.1 Sự thành lập:

Hình 26

Giả sử rằng histogram mức xám trong hình 26a là histogram của 1 tấm ảnh (gọi

là f(x,y)) gồm có các vật thể sáng trên 1 nền tối Các pixel của các vật thể lẫn cáinền có mức xám được chia vào 2 dạng chính ( dominant modes) Một cách tựnhiên để trích các vật thể ra là chọn 1 ngưỡng T mà có thể phân chia các dạng này.Khi đó với điểm (x,y) thì (x,y) sẽ được gọi là điểm vật thể nếu f(x,y) > T, ngoài ragọi (x,y) là điểm nền Đây là loại ngưỡng được giới thiệu trong phần 3.1

Hình 26b thể hiện 1 trường hợp tổng quát hơn 1 chút về cách tiếp cận này.Trong đó 3 dạng chính biểu thị tính chất của histogram ảnh ( trong ví dụ ta thấy có

Trang 32

Liên kết biên và tách đường giới hạn Nhóm 2: Khanh, Ánh, Thảo, Dương.

2 vật thể sáng trên 1 nền tối) Ở đây, ngưỡng nhiều mức (mutilevel thresholding)chia 1 điểm (x,y) hoặc thuộc về 1 lớp vật thể nếu T1 < f x y ( , ) ≤ T2hoặc thuộc 1lớp vật thể khác nếu f(x,y) > T2, và hoặc thuộc về nền nếu f x y ( , ) ≤ T1 Trongtrường hợp tổng quát, bài toán phân đoạn yêu cầu nhiều ngưỡng được giải quyếttốt nhất bằng cách dùng phương pháp tăng vùng (sẽ giới thiệu trong phần 4)

Dựa trên những gì đã nói trên , việc chọn ngưỡng có thể xem như 1 thao táckiểm tra hàm T :

T = T[x, y, p(x,y), f(x,y)] (3.1)

với f(x,y) là mức xám của điểm (x,y) còn p(x,y) là 1 số tính chất địa phươngcủa điểm này (ví dụ như mức xám trung bình của 1 láng giềng tâm (x,y)) Một bứcảnh đã được phân ngưỡng g(x,y) được định nghĩa như sau:

Khi T chỉ phụ thuộc vào f(x,y) (tức là chỉ phụ thuộc vào giá trị mức xám) thìngưỡng được gọi là ngưỡng toàn cục Nếu T phụ thuộc vào f(x,y) và p(x,y) thìngưỡng được gọi là ngưỡng cục bộ Ngoài ra nếu T phụ thuộc vào các tọa đôkhông gian x và y thì ngưỡng được gọi là động (adaptive)

3.2 Vai trò của sự chiếu sáng :

Chúng ta đã biết f(x,y) có thể được định dạng như tích của thành phần năng

suất phản xạ (reflectance component) r(x,y)và thành phần chiếu sáng (illuminationcomponent) i(x,y) Do đó trong mục này sẽ sử dụng dạng này nhằm giới thiệu ngắngọn về ảnh hưởng của sự chiếu sáng lên trên việc chọn ngưỡng, đặc biệt vớingưỡng toàn cục

Chú ý tới hàm phản xạ được xác định bởi máy tính biểu diễn trong hình 27a.

Histogram của hàm này ( được thể hiện trong hình 27b) phân làm đôi một cách rõràng và có thể dễ dàng chia ra bằng cách dùng một ngưỡng toàn cục đơn (singleglobal threshold) T tại rãnh của histogram Nhân hàm phản xạ trong hình 27a vớihàm chiếu sáng (biểu diễn bằng hình 27c) thì tạo ra bức ảnh như trong hình 27d

Và hình 27e là histogram của bức ảnh này Chú ý là rãnh gốc ban đầu hầu như đã

bị loại bỏ, do đó việc phân đoạn ảnh bằng 1 ngưỡng đơn trở nên không thể Mặc dùchúng ta hiếm khi làm việc với hàm phản xạ nhưng minh họa này cho thấy chúng

ta có thể dễ dàng phân chia tính chất phản xạ tự nhiên của các vật thể và nền.Ngược lại, bức ảnh kết quả trong ví dụ lại rất khó để phân đoạn

Trang 33

Liên kết biên và tách đường giới hạn Nhóm 2: Khanh, Ánh, Thảo, Dương.

Lý do tại sao histogram trong hình 27e bị biến dạng rất nhiều so với histogram

của hàm phản xạ có thể được giải thích như sau: Trước hết, từ phương trình (4.5 –1) :

Trang 34

Liên kết biên và tách đường giới hạn Nhóm 2: Khanh, Ánh, Thảo, Dương.

Theo định lý xác suất (Papoulis – 1991), nếu i’(x,y) và r’(x,y) là 2 biến ngẫunhiên độc lập thì histogram của z(x,y) là tích chập (convolution) của histogram củai’(x,y) và histogram của r’(x,y) Nếu i(x,y) là hằng số thì i’(x,y) cũng là hằng số vàhistogram của i’(x,y) có dạng xung đơn (nghĩa là 1 đoạn thẳng) giống như mộtxung lực Tích chập của hàm số dạng xung lực này với histogram của r’(x,y) khônglàm thay đổi hình dạng cơ bản của histogram của r’(x,y) (tích chập của một hàm sốvới một xung lực sẽ sao chép lại hàm số ở vị trí xung lực) Tuy nhiên nếu i’(x,y) cómột histogram rộng hơn (nguyên nhân là do sự chiếu sáng không đồng đều) thì tíchchấp sẽ làm thay đổi nhiều hình dạng của histogram của r’(x,y) Do đó histogramcủa z(x,y) có thể có hình dạng hoàn toàn khác histogram của r’(x,y) Độ sai lệchphụ thuộc vào độ rộng của histogram của i’(x,y), mà độ rộng này thì lại phụ thuộcvào mức độ không đồng đều của sự chiếu sáng

Chúng ta đã xử lý ln ( , ) f x y thay vì xử lý f x y ( , ), chính nhờ cách dùng ln đểphân tách thành phần chiếu sáng và thành phần phản xạ mà chúng ta đã giải thích

rõ ràng bản chất của vấn đề Phương pháp tiếp cận này cho phép chúng ta coihistogram của f x y ( , )như một tích chập, như thế giải thích tại sao một rãnh rõràng trong histogram của thành phần phản xạ lại bị mờ đi do sự chiếu sáng khôngphù hợp

Trong trường hợp chúng ta được phép xử lý nguồn sáng thì một giải phápthường được sử dụng đẻ bù đắp sự chiếu sáng không đồng đều là lấy mô hìnhchiếu sáng chiếu lên một mặt phản xạ không đổi, trắng (tức là lúc này thành phầnphản xạ là 1 hằng số k phụ thuộc vào mặt phản xạ này) Khi đó sẽ nhận được bứcảnh g(x,y) = ki(x,y) với i(x,y) là mô hình chiếu sáng Lúc này với bất kỳ ảnh

( , )

f x y = i(x,y)r(x,y) nào được chụp trong mô hình sáng trên thì chỉ cần chia

( , )

f x y cho g(x,y) ta sẽ được 1 hàm số đã tầm thường hóa : h(x,y) = f x y ( , )

/g(x,y) = r(x,y) / k Và nếu r(x,y) có thể được phân đoạn bằng 1 ngưỡng đơn T thìh(x,y) cũng có thễ được phân đoạn bằng ngưỡng đơn T/k

3.3 Ngưỡng toàn cục cơ bản (basic global thresholding):

Từ những gì được đề cập trong phần 10.3.1, chúng ta có thể thấy kĩ thuật đơngiản nhất trong mọi kĩ thuật phân đoạn ngưỡng là phân chia histogram ảnh bằngcách sử dụng một ngưỡng toàn cục đơn T như minh họa trong hình 26a Sự phânđoạn ảnh được thực hiện bằng cách quét qua bức ảnh từng pixel một và gán chomỗi pixel hoặc là vật thể, hoặc là nền bằng cách xem xét mức xám của pixel đó lớnhơn hay nhỏ hơn ngưỡng T Và như đã trình bày, sự thành công của phương phápnày phụ thuộc hoàn toàn vào việc histogram của bức ảnh có thể được phân tách tốtnhư thế nào

Hình 28a là một bức ảnh đơn giản, và hình 28b là histogram của nó Hình 28c

là kết quả phân đoạn hình 28a bằng 1 ngưỡng T là trung bình của mức xám lớnnhất và mức xám nhỏ nhất Ngưỡng này đã đạt đến 1 sự phân đoạn “sạch” vì đã

Trang 35

Liên kết biên và tách đường giới hạn Nhóm 2: Khanh, Ánh, Thảo, Dương.

Loại ngưỡng toàn cục trên có thể xem như là 1 thành công trong các môitrường kiểm tra kĩ thuật cao như trong các ứng dụng về kiểm tra công nghiệp vìthường trong điều kiện này chúng ta có thể điều chỉnh sự chiếu sáng được

Ngưỡng trong ví dụ trên được xác định bằng một phương pháp mang tính kinhnghiệm dựa vào việc xem xét histogram của ảnh Vì vậy ta có thể dùng giải thuậtsau để có được ngưỡng T một cách tự động :

• Chọn một giá trị xấp xỉ ban đầu cho T

• Phân đoạn bức ảnh với ngưỡng T Khi đó ta nhận được 2 nhóm pixels: G1

bao gồm các pixel với mức xám > T và G2bao gồm các pixel có mức xám ≤

T

Hình 28

Trang 36

Liên kết biên và tách đường giới hạn Nhóm 2: Khanh, Ánh, Thảo, Dương.

• Lặp lại từ bước 2 tới bước 4 cho tới khi sự sai khác giữa 2 giá trị T liền nhau

bé hơn 1 tham số chọn trước T0

Khi có thể chắc chắn rằng nền và vật thể có độ lớn tương đối giống nhau thìmột ngưỡng ban đầu thích hợp chính là mức xám trung bình của bức ảnh Còn khivật thể có kích thước nhỏ hơn nền (hoặc ngược lại) thì một nhóm pixel (biểu thị conền hoặc vật thể) sẽ chiếm giữ phần lớn histogram, do đó lúc này việc chọn mứcxám trung bình làm ngưỡng ban đầu là không thích hợp Lúc này một xấp xỉ tốthơn cho giá trị ban đầu T là trung bình của mức xám cao nhất và mức xám thấpnhất Tham số T0được dùng để dừng giải thuật lại : khi sự chêng lệch của 2ngưỡng trong 2 lần lặp liên tiếp bé hơn T0 thì dừng giải thuật Việc chọn tham số

T0 đóng 1 vai trò quan trọng vì nó ảnh hưởng tới tốc độ của quá trình xử lý

Tuy nhiên chú ý là giải thuật trên mang tính trực giác và không chính xác vềmặt toán học Thật vậy, ta có thể dễ dàng xây dựng histogram làm phản ví dụ :

Xét histogram như hình trên Trong đó phần có mức xám bé hơn 50 là phầnhistogram của vật thể, còn phần có mức xám lớn hơn 99 là biểu thị cho nền (thực

ra histogram phải được biểu thị dưới dạng các đoạn thẳng rời nhau – biểu đồđường, nhưng ở đây ta xét trường hợp mọi số lượng pixel của mỗi mức xám hoặc

là 0, hoặc là 200, nên vẽ như trên cho đơn giản) Theo hình trên ta thấy ngay có rấtnhiều giá trị có thể dùng làm ngưỡng toàn cục, cụ thể các giá trị từ 50 tới 99 đềuthỏa Tuy nhiên bây giờ ta sẽ dùng giải thuật trên để xây dựng ra 1 ngưỡng khôngthích hợp như sau : trước hết chọn 1 giá trị không thích hợp là 115 làm ngưỡng (T

= 115) và ta chọn mức xám lớn nhất a sao cho có phương trình :

Ngày đăng: 29/06/2021, 07:39

HÌNH ẢNH LIÊN QUAN

Hình 3 - BÀI BÁO CÁO PHÂN ĐOẠN ẢNH
Hình 3 (Trang 5)
Hình 8 - BÀI BÁO CÁO PHÂN ĐOẠN ẢNH
Hình 8 (Trang 12)
Hình 10 - BÀI BÁO CÁO PHÂN ĐOẠN ẢNH
Hình 10 (Trang 14)
Hình 11 - BÀI BÁO CÁO PHÂN ĐOẠN ẢNH
Hình 11 (Trang 15)
Hình 13 - BÀI BÁO CÁO PHÂN ĐOẠN ẢNH
Hình 13 (Trang 16)
Hình 14 - BÀI BÁO CÁO PHÂN ĐOẠN ẢNH
Hình 14 (Trang 17)
Hình 18 - BÀI BÁO CÁO PHÂN ĐOẠN ẢNH
Hình 18 (Trang 23)
đường thẳng cos jy sin ρj tạo ra Q đường hình sin giao nhau tại ,) ρθ ij - BÀI BÁO CÁO PHÂN ĐOẠN ẢNH
ng thẳng cos jy sin ρj tạo ra Q đường hình sin giao nhau tại ,) ρθ ij (Trang 24)
Hình 20 - BÀI BÁO CÁO PHÂN ĐOẠN ẢNH
Hình 20 (Trang 25)
Hình 21 - BÀI BÁO CÁO PHÂN ĐOẠN ẢNH
Hình 21 (Trang 26)
Hình 23 - BÀI BÁO CÁO PHÂN ĐOẠN ẢNH
Hình 23 (Trang 28)
Hình 28 - BÀI BÁO CÁO PHÂN ĐOẠN ẢNH
Hình 28 (Trang 35)
Hình 29 - BÀI BÁO CÁO PHÂN ĐOẠN ẢNH
Hình 29 (Trang 37)
Hình 30 - BÀI BÁO CÁO PHÂN ĐOẠN ẢNH
Hình 30 (Trang 39)
Hình 31 - BÀI BÁO CÁO PHÂN ĐOẠN ẢNH
Hình 31 (Trang 40)
Hình 36 - BÀI BÁO CÁO PHÂN ĐOẠN ẢNH
Hình 36 (Trang 49)
Hình 37 - BÀI BÁO CÁO PHÂN ĐOẠN ẢNH
Hình 37 (Trang 50)
Hình 4 0. a) hình 1 mối hàn có lỗi. b)điểm hạt. - BÀI BÁO CÁO PHÂN ĐOẠN ẢNH
Hình 4 0. a) hình 1 mối hàn có lỗi. b)điểm hạt (Trang 53)
Hình 4 1: histogram của 40 - BÀI BÁO CÁO PHÂN ĐOẠN ẢNH
Hình 4 1: histogram của 40 (Trang 55)
Phân đoạn theo mức hình thái Nhóm 2: Khanh, Ánh, Thảo, Dương.               - BÀI BÁO CÁO PHÂN ĐOẠN ẢNH
h ân đoạn theo mức hình thái Nhóm 2: Khanh, Ánh, Thảo, Dương. (Trang 59)
Phân đoạn theo mức hình thái Nhóm 2: Khanh, Ánh, Thảo, Dương.               - BÀI BÁO CÁO PHÂN ĐOẠN ẢNH
h ân đoạn theo mức hình thái Nhóm 2: Khanh, Ánh, Thảo, Dương. (Trang 60)
Phân đoạn theo mức hình thái Nhóm 2: Khanh, Ánh, Thảo, Dương.               - BÀI BÁO CÁO PHÂN ĐOẠN ẢNH
h ân đoạn theo mức hình thái Nhóm 2: Khanh, Ánh, Thảo, Dương. (Trang 62)
Phân đoạn theo mức hình thái Nhóm 2: Khanh, Ánh, Thảo, Dương.               - BÀI BÁO CÁO PHÂN ĐOẠN ẢNH
h ân đoạn theo mức hình thái Nhóm 2: Khanh, Ánh, Thảo, Dương. (Trang 64)
Phân đoạn theo mức hình thái Nhóm 2: Khanh, Ánh, Thảo, Dương.               - BÀI BÁO CÁO PHÂN ĐOẠN ẢNH
h ân đoạn theo mức hình thái Nhóm 2: Khanh, Ánh, Thảo, Dương. (Trang 65)
Phân đoạn theo mức hình thái Nhóm 2: Khanh, Ánh, Thảo, Dương.               - BÀI BÁO CÁO PHÂN ĐOẠN ẢNH
h ân đoạn theo mức hình thái Nhóm 2: Khanh, Ánh, Thảo, Dương. (Trang 66)
Phân đoạn theo mức hình thái Nhóm 2: Khanh, Ánh, Thảo, Dương.               - BÀI BÁO CÁO PHÂN ĐOẠN ẢNH
h ân đoạn theo mức hình thái Nhóm 2: Khanh, Ánh, Thảo, Dương. (Trang 68)
Phân đoạn theo mức hình thái Nhóm 2: Khanh, Ánh, Thảo, Dương.               - BÀI BÁO CÁO PHÂN ĐOẠN ẢNH
h ân đoạn theo mức hình thái Nhóm 2: Khanh, Ánh, Thảo, Dương. (Trang 69)
Phân đoạn theo mức hình thái Nhóm 2: Khanh, Ánh, Thảo, Dương.               - BÀI BÁO CÁO PHÂN ĐOẠN ẢNH
h ân đoạn theo mức hình thái Nhóm 2: Khanh, Ánh, Thảo, Dương. (Trang 72)
Phân đoạn theo mức hình thái Nhóm 2: Khanh, Ánh, Thảo, Dương.               - BÀI BÁO CÁO PHÂN ĐOẠN ẢNH
h ân đoạn theo mức hình thái Nhóm 2: Khanh, Ánh, Thảo, Dương. (Trang 73)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w