10.1 Phát hiện gián đoạn Trong phần này chúng ta trình bày một số kỹ thuật để phát hiện ba loại cơ bản của sự gián đoạn mức xám gray-level trong một ảnh số: điểm, đường và các cạnh.Cách
Trang 1Tiểu luận xử lý ảnh nâng cao PHÂN ĐOẠN ẢNH
Phân đoạn chia nhỏ một ảnh thành các vùng thành phần hoặc các đối tượng của
nó Mức độ phân chia được thực hiện phụ thuộc vào các vấn đề được giải quyết
Đó là, phân đoạn nên dừng lại khi các đối tượng quan tâm trong một ứng dụng đãđược cô lập Ví dụ, trong việc kiểm tra tự động lắp ráp điện tử, sự quan tâm nằmtrong việc phân tích ảnh của sản phẩm với mục tiêu xác định sự hiện diện hay vắngmặt của các bất thường cụ thể, chẳng hạn như thiếu các thành phần hoặc các đườngkết nối bị hỏng Không có điểm trong việc thực hiện phân đoạn qua mức độ chi tiếtcần thiết để xác định những yếu tố này
Phân đoạn của ảnh không tầm thường là một trong những nhiệm vụ khó khănnhất trong xử lý ảnh Độ chính xác phân đoạn xác định sự thành công hay thất bạicuối cùng của các thủ tục phân tích trên máy vi tính Vì lý do này, sự quan tâm đáng
kể nên được thực hiện để cải thiện khả năng của phân đoạn không đều Trong một
số trường hợp, chẳng hạn như các ứng dụng kiểm tra công nghiệp, ít nhất một sốbiện pháp kiểm soát môi trường có thể vào lúc này Người thiết kế hệ thống xử lýảnh giàu kinh nghiệm luôn luôn quan tâm đáng kể đến cơ hội như vậy Trong cácứng dụng khác, chẳng hạn như phát hiện mục tiêu độc lập, các nhà thiết kế hệ thốngkhông kiểm soát môi trường Sau đó, cách tiếp cận thông thường là tập trung vàoviệc lựa chọn các loại cảm biến có nhiều khả năng tăng cường các đối tượng quantâm trong khi làm giảm bớt sự đóng góp của các chi tiết ảnh không thích hợp Một
ví dụ là việc sử dụng các ảnh hồng ngoại của quân đội để phát hiện đối tượng cóchữ ký nhiệt mạnh mẽ, chẳng hạn như thiết bị và quân đội trong chuyển động
Trang 2Các thuật toán phân đoạn ảnh thường được dựa trên một trong hai đặc tính cơbản của các giá trị cường độ: gián đoạn và tương tự Trong nhóm thứ nhất, phươngpháp tiếp cận để phân vùng ảnh dựa trên những thay đổi đột ngột về cường độ,chẳng hạn như các cạnh trong một ảnh Các phương pháp tiếp cận chính trong thểloại thứ hai được dựa trên phân vùng một ảnh thành các vùng tương tự theo một bộtiêu chí được xác định trước Ngưỡng, khu vực đang phát triển, và khu vực chiatách và sáp nhập là những ví dụ của phương pháp trong thể loại này.
Trong chương này, chúng ta thảo luận về một số phương pháp tiếp cận của hailoại vừa được đề cập đến Chúng ta bắt đầu phát triển với các phương pháp thíchhợp cho việc phát hiện các gián đoạn mức xám như điểm, dòng, và các cạnh Pháthiện cạnh đặc biệt đã được một yếu của thuật toán phân đoạn trong nhiều năm.Ngoài việc phát hiện cạnh theo thường lệ, chúng ta cũng thảo luận về phương pháp
để kết nối các phân đoạn cạnh và " lắp ráp " cạnh vào ranh giới vùng Thảo luận vềphát hiện cạnh tiếp theo là sự ra đời của kỹ thuật ngưỡng khác nhau Ngưỡng tuyệtnhiên cũng là một cách tiếp cận cơ bản để phân đoạn đó được hưởng một mức độđáng kể của sự phổ biến, đặc biệt trong các ứng dụng tốc độ là một yếu tố quantrọng Các cuộc thảo luận trên ngưỡng tiếp theo là sự phát triển của một số phươngpháp tiếp cận gián đoạn theo định hướng khu vực Chúng ta sau đó thảo luận mộtcách tiếp cận hình thái để phân đoạn được gọi là phân đoạn Watersheds Cách tiếpcận này đặc biệt hấp dẫn bởi vì nó kết hợp một số các thuộc tính tích cực của phânđoạn dựa trên các kỹ thuật trình bày trong phần đầu của chương này Chúng ta kếtluận chương này với một cuộc thảo luận về việc sử dụng các dấu hiệu chuyển độngcho việc phân đoạn ảnh
10.1 Phát hiện gián đoạn
Trong phần này chúng ta trình bày một số kỹ thuật để phát hiện ba loại cơ bản của
sự gián đoạn mức xám (gray-level) trong một ảnh số: điểm, đường và các cạnh.Cách phổ biến nhất để tìm kiếm các gián đoạn là chạy một mặt nạ thông qua ảnhtheo cách mô tả trong phần 3.5 Đối với mặt nạ 3x3 thể hiện trong hình 10.1, thủ tục
Trang 3này liên quan đến việc tính tổng của các sản phẩm các hệ số với các mức xám chứatrong khu vực bao phủ bởi mặt nạ
Trong đó T là ngưỡng âm và R được cho bởi phương trình (10.1-1) Về cơ bản, côngthức này đo lường sự khác biệt trọng số giữa điểm trung tâm và các láng giềng của
Trang 4nó Ý tưởng là một điểm bị cô lập (một điểm có mức xám khác nhau đáng kể từ nềncủa nó và được đặt tại một khu vực đồng nhất hoặc gần đồng nhất) sẽ hơi khác môitrường xung quanh của nó, và do đó có thể dễ dàng phát hiện bằng cách loại mặt nạ.Lưu ý rằng mặt nạ trong hình 10.2(a) giống với mặt nạ thể hiện trong hình 3.39(d)trong việc kết nối với toán tử Laplacian Tuy nhiên, sự nhấn mạnh ở đây là đúng về
sự phát hiện của các điểm Đó là, sự khác biệt duy nhất được xem xét quan tâm lànhững điểm đủ lớn (được xác định bởi T) được coi là điểm bị cô lập Lưu ý rằngtổng các hệ số mặt nạ bằng 0, chỉ ra rằng đáp ứng mặt nạ sẽ là 0 trong khu vực mứcxám không thay đổi
Ví dụ 10.1 Phát hiện các điểm bị cô lập trong ảnh
Chúng ta minh họa việc phân đoạn các điểm bị cô lập từ một ảnh với sự trợ giúp củahình 10.2(b), trong đó cho thấy một ảnh tia X của một lưỡi tuabin động cơ phản lựcvới một độ xốp ở trên, góc phải của ảnh Có một điểm ảnh màu đen duy nhất đượcnhúng trong độ xốp Hình 10.2(c) là kết quả của việc áp dụng mặt nạ phát hiện điểmđối với ảnh tia X, và hình 10.2(d) biểu diễn kết quả của việc sử dụng phương trình(10.1-2) với T bằng 90% giá trị điểm ảnh tuyệt đối cao nhất của ảnh trong hình10.2(c) (Lựa chọn ngưỡng được thảo luận chi tiết trong mục 10.3) Các điểm ảnh
Trang 5đơn giản có thể nhìn thấy trong ảnh này (các điểm ảnh được mở rộng bằng tay để nó
sẽ được hiển thị sau khi in) Đây là loại quá trình phát hiện khá đặt biệt vì nó đượcdựa trên sự gián đoạn điểm ảnh đơn có nền đồng nhất trong khu vực của mặt nạ pháthiện Khi đó điều kiện này là không thõa mãn, các phương pháp khác được thảo luậntrong chương này phù hợp hơn để phát hiện các gián đoạn mức xám
10.1.2 Phát hiện dòng
Mức độ tiếp theo của sự phức tạp là phát hiện dòng Xem xét mặt nạ biểu diễntrong hình 10.3 Nếu mặt nạ đầu tiên được di chuyển xung quanh một ảnh, nó sẽ đápứng mạnh hơn đối với các dòng (một điểm ảnh dày) định hướng theo chiều ngang.Đối với một nền ổn định, đáp ứng cực đại sẽ cho kết quả khi đường đi qua hàng giữacủa mặt nạ Điều này có thể dễ dàng xác nhận qua sự phác thảo một mảng đơn giảnnếu 1 với một dòng của mức xám khác nhau (nói, 5) chạy ngang qua mảng Kinhnghiệm tương tự sẽ tiết lộ rằng mặt nạ thứ hai trong hình 10.3 đáp ứng tốt nhất chocác dòng theo định hướng tại +45o; mặt nạ thứ ba với đường thẳng đứng và mặt nạthứ tư dòng trong hướng -45o Những hướng dẫn này có thể được thiết lập bằng việckhẳng định hướng ưu tiên của mỗi mặt nạ được nặng với một hệ số lớn hơn (ví dụ,2) so với hướng khác Lưu ý rằng tổng các hệ số trong mỗi mặt nạ bằng 0, chỉ thịđáp ứng zero từ các mặt nạ trong vùng mức xám không đổi
Cho R1, R2, R3 và R4 chỉ thị các đáp ứng của mặt nạ trong hình 10.3, từ trái sangphải, trong đó R được cho bởi phương trình (10.1-1) Giả sử rằng bốn mặt nạ đượcchạy riêng qua một ảnh Nếu tại một điểm nhất định trong ảnh, R i R j , với mọi j
≠ i, điểm đó được cho là có nhiều khả năng liên quan với một đường theo hướng mặt
nạ i Cho ví dụ, nếu tại một điểm trong ảnh, R i R j với k = 2,3,4,
Trang 6Hình 10.3 Mặt nạ dòng
điểm đặc biệt này được cho là có nhiều khả năng liên quan đến một đường ngang.Ngoài ra, chúng ta có thể quan tâm trong việc phát hiện dòng theo một hướng cụ thể.Trong trường hợp này, chúng ta sẽ sử dụng mặt nạ kết hợp với hướng đó và ngưỡngđầu ra của nó, như trong phương trình (10.1-2) Nói cách khác, nếu chúng ta quantâm trong việc phát hiện tất cả các dòng trong một ảnh theo hướng xác định cho bởimặt nạ, chúng ta chỉ chạy mặt nạ qua ảnh và ngưỡng giá trị tuyệt đối của kết quả.Các điểm bên trái đáp ứng mạnh nhất, trong đó, đối với dòng một trong những điểmảnh dày, tương ứng với hướng gần nhất được xác định bởi mặt nạ Ví dụ sau đâyminh họa quá trình này
Trang 7Ví dụ 10.2 Phát hiện các dòng theo một hướng quy định
Hình 10.4(a) cho thấy một phần số hóa (nhị phân) phần của một mặt nạ đường mạch
in (wire-bond) cho bởi mạch điện tử Giả sử rằng chúng ta quan tâm đến việc tìmkiếm tất cả các dòng đó là một điểm ảnh dày và được định hướng tại -45o Với mụcđích này, chúng ta sử dụng mặt nạ cuối cùng thể hiện trong hình 10.3 Giá trị tuyệtđối của kết quả được hiển thị trong hình 10.4(b) Lưu ý rằng tất cả các thành phầndọc và ngang của ảnh đã bị loại bỏ, và các thành phần của ảnh gốc có xu hướnghướng tới một hướng -45o tạo nên các đáp ứng mạnh nhất trong hình 10.4(b) Để xácđịnh các dòng tốt nhất phù hợp với mặt nạ, chúng ta đơn giản ngưỡng ảnh này Kếtquả của việc sử dụng một ngưỡng tương đương với giá trị lớn nhất trong ảnh biểudiễn trong hình 10.4(c) Giá trị cực đại là một lựa chọn tốt cho một ngưỡng trongcác ứng dụng như thế này bởi vì ảnh đầu vào là nhị phân và chúng ta đang tìm cácđáp ứng mạnh nhất Hình 10.4(c) cho thấy trong tất cả các điểm trắng được thông
Trang 8qua việc kiểm tra ngưỡng Trong trường hợp này, các thủ tục trích xuất các đoạnthẳng duy nhất là một điểm ảnh dày và định hướng tại -45o (các thành phần khác củaảnh được định hướng theo hướng này ở phía trên, góc phần tư bên trái không phải làmột điểm ảnh dày) Các điểm bị cô lập thể hiện trong hình 10.4(c) là những điểm màcũng đã có đáp ứng mạnh tương tự như mặt nạ Trong ảnh gốc, các điểm này và cácđiểm láng giềng của nó được định hướng như cách mà mặt nạ tạo đáp ứng tối đa tạicác vị trí bị cô lập Các điểm bị cô lập này có thể được phát hiện bằng cách sử dụngmặt nạ trong hình 10.2(a) và sau đó đã bị xóa, hoặc họ có thể xóa việc sử dụng xóimòn hình thái, như đã thảo luận trong chương cuối.
10.1.3 Phát hiện cạnh
Mặc dù việc phát hiện điểm và đường chắc chắn rất quan trọng trong bất kỳ cuộcthảo luận về sự phân đoạn, phát hiện cạnh đến nay là phương pháp phổ biến nhất đểphát hiện các gián đoạn có ý nghĩa ở mức xám Trong phần này, chúng tôi thảo luậncách tiếp cận để thực hiện các dẫn xuất số bậc một và bậc hai phát sinh cho việcphát hiện các cạnh trong ảnh Chúng ta giới thiệu các phát sinh trong phần phần 3.7trong nội dung nâng cao hình ảnh Trọng tâm ở phần này là các đặc điểm của chúngcho việc phát hiện cạnh Một số khái niệm giới thiệu trước đây được trình bày lạimột thời gian ngắn vào đây để liên tục vì lợi ích trong cuộc thảo luận
Công thức cơ bản
Các cạnh đã được giới thiệu chính thức tại mục 3.7.1 Trong phần này, chúng ta xemxét các khái niệm về cạnh số gần hơn một chút Trực giác, một cạnh là một tập hợpcác điểm ảnh kết nối nằm trên ranh giới giữa hai khu vực Tuy nhiên, chúng ta đã điqua một số chiều dài tại phần 2.5.2 để giải thích sự khác biệt giữa một cạnh và mộtđường biên Về cơ bản, như chúng ta sẽ thấy ngay, một cạnh là một khái niệm "cụcbộ" trong khi một vùng đường biên, do theo cách nó được định nghĩa, là một ýtưởng toàn cục Một định nghĩa hợp lý "cạnh" đòi hỏi khả năng đo quá trình chuyểnđổi mức xám theo một cách có ý nghĩa
Trang 9Chúng ta bắt đầu bằng cách mô hình một cạnh trực giác Điều này sẽ dẫn chúng
ta đến một hình thức trong đó "có ý nghĩa" quá trình chuyển đổi ở mức xám có thểđược đo Trực giác, một cạnh lý tưởng có đặc tính của mô hình thể hiện trong hình10.5(a) Một cạnh lý tưởng theo mô hình này là một tập hợp các điểm ảnh được kếtnối (ở đây theo hướng thẳng đứng), mỗi trong số đó nằm ở một bước chuyển đổitrực giao ở mức xám (thể hiện bởi mặt ngang trong hình vẽ)
Trong thực tế, quang học, lấy mẫu, và hình ảnh thu thập được không hoàn hảo tạo racạnh bị mờ, với mức độ làm mờ được xác định bởi các yếu tố như chất lượng củacác hệ thống thu thập ảnh, tỷ lệ lấy mẫu, và dưới các điều kiện chiếu sáng mà ảnhđược thu thập Kết quả là, các cạnh được mô hình chặt chẽ hơn như có một mặt
"đoạn đường nối", chẳng hạn như thể hiện trong hình 10.5(b) Độ dốc của đoạnđường nối tỉ lệ nghịch với mức độ mờ ở cạnh Trong mô hình này, chúng ta khôngcòn có một (một điểm ảnh dày) phần mỏng Thay vào đó, một điểm cạnh bây giờ làđiểm bất kỳ có trong đoạn đường nối, và một cạnh sau đó sẽ là một tập hợp các điểmnhư vậy đã được kết nối "Độ dày" của cạnh được xác định bởi chiều dài của đoạnđường nối, như nó chuyển từ mức ban đầu đến một mức xám cuối cùng Chiều dàinày được xác định bởi độ dốc, mà đến lượt nó, được xác định bởi mức độ làm mờ.Điều này có ý nghĩa: các cạnh mờ có xu hướng dày và các cạnh sắc nét có xu hướngmỏng
Trang 10Hình 10.6(a) biểu diễn ảnh từ cận cảnh trong hình 10.5(b) được lấy ra, Hình10.6(b) cho thấy một trắc đồ mức xám ngang của cạnh giữa hai vùng Con số nàycũng cho thấy các dẫn xuất thứ nhất và thứ hai của trắc đồ mức xám Dẫn xuất thứnhất là dương tại các điểm chuyển tiếp vào và ra khỏi đoạn đường nối như chúng ta
di chuyển từ trái sang phải dọc theo trắc đồ, nó là hằng số cho các điểm trong đoạnđường nối, và là số không trong vùng mức xám không đổi Dẫn xuất thứ hai làdương tại quá trình chuyển đổi kết hợp với mặt tối của các cạnh, âm tại các quá trìnhchuyển đổi kết hợp với phía ánh sáng của cạnh, và zero dọc theo đoạn đường nối vàtrong khu vực mức xám không đổi Dấu hiệu của các dẫn xuất trong hình 10.6(b) sẽđược đảo ngược cho một cạnh đó là quá trình chuyển đổi từ sáng đến tối
Chúng ta kết luận từ các quan sát rằng biên độ của dẫn xuất đầu tiên có thể được
sử dụng để phát hiện sự hiện diện của một cạnh tại một điểm trong một ảnh (ví dụ ,
để xác định một điểm trên một đoạn đường nối) Tương tự, các dấu hiệu của dẫnxuất thứ hai có thể được sử dụng để xác định xem một điểm ảnh cạnh nằm trên mặt
Trang 11tối hoặc sáng của một cạnh Chúng ta lưu ý hai thuộc tính bổ sung của dẫn xuất thứhai quanh một cạnh: (1) Nó tạo ra hai giá trị cho mỗi cạnh trong một hình ảnh (mộttính năng không mong muốn), và (2) một đường thẳng tưởng tượng kết hợp các giátrị cực dương và âm của dẫn xuất thứ hai sẽ đi qua zero gần trung điểm của cạnh.Tính chất zero-crossing của dẫn xuất thứ hai này khá hữu dụng để định vị các trungđiểm của các cạnh dày, như chúng ta thấy ở phần sau Cuối cùng, chúng ta lưu ýrằng một số mô hình cạnh sử dụng một chuyển đổi làm mịn vào và ra khỏi đoạnđường nối (Vấn đề 10.5) Tuy nhiên, những kết luận mà chúng ta đến thảo luận sauđây đều giống nhau Ngoài ra, đó là điều hiển nhiên từ cuộc thảo luận này mà chúng
ta đang đối phó ở đây với việc đo đạt cục bộ (như vậy, những nhận xét được thựchiện tại mục 2.5.2 về bản chất cục bộ của các cạnh)
Mặt dầu sự chú ý như vậy cho đến nay đã được gới hạn đối với trắc đồ ngang
1-D, lý luận tương tự áp dụng cho một cạnh định hướng bất kỳ tại bất kỳ điểm mongmuốn và giải thích kết quả như trong các cuộc thảo luận trước đó
Ví dụ 10.3 Hành vi của các dẫn xuất thứ nhất và thứ hai xung quanh một cạnh nhiễu
Các cạnh hình 10.5 và 10.6 là nhiễu tự do Các phân đoạn ảnh trong cột đầu tiêntrong hình 10.7 cho thấy cận cảnh của bốn cạnh đoạn đường nối tách một vùng đenbên trái và một vùng màu trắng ở bên phải Điều quan trọng là hãy nhớ rằng toàn bộquá trình chuyển đổi từ màu đen sang màu trắng là một cạnh duy nhất Phân đoạnảnh ở phía trên, bên trái là nhiễu tự do Ba ảnh khác trong cột đầu tiên của Hình 10.7
bị hỏng bởi cộng nhiễu Gaussian với zero mean và độ lệch tiêu chuẩn 0.1, 1.0, và10.0 mức xám tương ứng Đồ thị dưới đây mỗi ảnh là một trắc đồ mức xám của mộtđường quét ngang qua ảnh
Trang 12Các ảnh trong cột thứ hai của hình 10.7 là các dẫn xuất bậc một của ảnh bên trái
(chúng ta thảo luận tính toán các dẫn xuất ảnh thứ nhất và thứ hai ở phần sau) Xemxét, cho ví dụ, ảnh trung tâm ở phía trên Như đã thảo luận kết nối với hình 10.6(b),các dẫn xuất là zero trong các vùng màu đen và trắng không đổi Đây là hai vùngmàu đen hiển thị trong ảnh dẫn xuất Dẫn xuất của một đoạn đường nối không đổi làmột hằng số, bằng với độ dốc của đoạn đường nối Khu vực không đổi này trongảnh dẫn xuất được thể hiện bằng màu xám Chúng ta di chuyển xuống cột trung tâm,các dẫn xuất ngày càng trở nên khác biệt so với trường hợp không nhiễu Trong thực
tế, sẽ rất khó để kết hợp trắc đồ cuối cùng ở cột đó với một đường đoạn đường nối.Điều gì làm cho các kết quả thú vị là nhiễu thực sự là gần như vô hình trong các
Trang 13hình ảnh ở cột bên trái Hình ảnh cuối cùng là một chút hạt, nhưng sự hư hỏng này
là gần như không thể nhận thấy Những ví dụ minh họa tốt cho sự nhạy cảm của cácdẫn xuất đến nhiễu
Theo dự kiến, dẫn xuất thứ hai thậm chí còn nhạy cảm hơn với nhiễu Dẫn xuấtbậc hai của ảnh không nhiễu được thể hiện ở phía trên ảnh bên phải Các đường màuđen và trắng mỏng là các phần dương và âm được giải thích trong hình 10.6 Màuxám trong các ảnh đại diện cho zero do mở rộng quy mô Chúng ta lưu ý rằng chỉdẫn xuất nhiễu bậc hai giống với trường hợp không nhiễu tương ứng tới nhiễu với
độ lệch chuẩn của các mức xám 0.1 Hai ảnh dẫn xuất thứ hai và cấu hình khác rõràng minh họa rằng nó sẽ là khó khăn thực sự để phát hiện các thành phần dương và
âm của nó, đó là những tính năng thực sự hữu ích của dẫn xuất thứ hai về phát hiệncạnh
Thực tế là khá ít nhiễu có thể có một tác động đáng kể như trên hai chất dẫn xuấtchính được sử dụng để phát hiện cạnh trong ảnh là một vấn đề quan trọng cần lưu ý.Đặc biệt, làm mịn hình ảnh nên được xem xét nghiêm túc trước khi sử dụng các dẫnxuất trong các ứng dụng nơi nhiễu với mức độ tương tự như chúng ta vừa thảo luận
là giống với hiện tại
Dựa vào ví dụ này và trên ba đoạn đứng trước nó, chúng ta được dẫn đến kết luậnrằng, để được phân loại như là một điểm cạnh có ý nghĩa, quá trình chuyển đổi trongmức độ màu xám kết hợp với điểm mà đã mạnh hơn đáng kể nền tại điểm đó Vìchúng ta đang đối phó với tính toán cục bộ, phương pháp lựa chọn để xác định xemmột giá trị là "quan trọng" hay không là sử dụng một ngưỡng Do đó, chúng ta xácđịnh một điểm trong một hình ảnh như là một điểm cạnh nếu dẫn xuất đầu tiên đểchiều của nó lớn hơn một ngưỡng quy định Một tập hợp các điểm như vậy đượckết nối theo một tiêu chuẩn được xác định trước mối (xem Phần 2.5.2) được địnhnghĩa một cạnh Phân khúc cạnh hạn thường được sử dụng nếu cạnh là ngắn hơn sovới kích thước của hình ảnh Một vấn đề quan trọng trong phân khúc là để lắp rápcác phân đoạn tiến vào cạnh còn như được giải thích trong mục 10.2 Một định
Trang 14nghĩa được thay thế nếu chúng ta chọn việc sử dụng dẫn xuất thứ hai chỉ đơn giản là
để xác định các điểm cạnh trong một ảnh như ngang qua zero của dẫn xuất thứ haicủa nó Định nghĩa của một cạnh trong trường hợp này là tương tự như trên Điềuquan trọng cần lưu ý là những định nghĩa này không đảm bảo thành công trong việctìm kiếm các cạnh trong một ảnh Họ chỉ đơn giản là cung cấp cho chúng ta mộthình thức để tìm chúng
Như trong chương 3, dẫn xuất bậc 3 trong một ảnh được tính toán sử dụnggradient Dẫn xuất bậc hai thu được dùng Laplacian
Trang 15Hướng của vector gradient cũng là một số lượng quan trọng Cho α(x,y) đặc trưngcho hướng góc của vector tại (x,y) Khi đó, từ phân tích vector,
Trong đó các góc được đo liên quan với trục x Hướng của một cạnh tại (x, y) làvuông góc với hướng của vector gradient tại điểm đó
Tính toán gradient của một ảnh là trên việc thu được một phần các chất dẫn xuất
∂f/∂x và ∂f/∂y tại mỗi vị trí điểm ảnh Cho khu vực 3x3 hình 10.8(a) đại diện chocác mức xám trong một lân cận của ảnh Như đã thảo luận tại mục 3.7.3, một trongnhững cách đơn giản nhất để thực hiện một phần dẫn xuất bậc một tại điểm z5 là sửdung toán tử Roberts cross-gradient sau đây:
Trang 16và
Trong công thức này, sự khác nha giữa hàng thứ nhất và thứ ba của vùng ảnh 3x3xấp xỉ dẫn xuất theo hướng x, và khác nhau giữa cột thứ nhất và thứ ba là xấp xỉ dẫnxuất theo hướng y Các mặt nạ biểu diaanx trong hình 10.8(a) và (e) được gọi là toán
tử Prewitt, có thể dùng để thực hiện hai phương trình này
Một sự thay đổi nhỏ của hai phương trình này sử dụng một trọng số của 2 ở hệ sốtrung tâm:
Trang 17Và
Giá trị trọng số của 2 được sử dụng để đạt được một số làm mịn bằng cách đưa ratầm quan trọng nhiều hơn đến điểm trung tâm (Vấn đề 10.8) Hình 10.8(f) và (g)được gọi là toán tử Sobel được sử dụng để thực hiện hai phương trình này Toán tửPriwitt và Sobel là một trong những toán tử được sử dụng nhiều nhất trong thực tế
để tính toán độ các gradient số
Các mặt nạ Prewitt thực hiện đơn giản hơn các mặt nạ Sobel, nhưng sau này cónhững đặc điểm đàn áp nhiễu hơi cao, một vấn đề quan trọng khi xử lý với các dẫnxuất Lưu ý rằng các hệ số trong tất cả các mặt nạ hình 10.8 có tổng bằng 0, chỉ thịrằng chúng cho đáp ứng zero ở khu vực mức xám không đổi, như mong muốn cảutoán tử dẫn xuất
Các mặt nạ vừa thảo luận được sử dụng để thu được các thành phần gradient Gx
và Gy Việc tính toán gradient yêu cầu hai thành phần này kết hợp trong cách thứcthể hiện trong phương trình (10.1-4) Tuy nhiên việc thực hiện này không luônmong muốn bởi vì gánh nặng tính toán theo yêu cầu bởi bình phương và căn bậc hai.Một cách tiếp cận được sử dụng thường xuyên là gradient gần đúng bởi các giá trịtuyệt đối:
Phương trình này tính toán hấp dẫn hơn nhiều, và nó vẫn còn lưu giữ những thayđổi tương đối ở mức xám Như đã thảo luận tại mục 3.7.3, giá phải trả cho ưu điểmnày là các bộ lọc kết quả sẽ không đẳng hướng (không đổi khi xoay vòng) nóichung Tuy nhiên, đây không phải là một vấn đề khi mặt nạ như Prewitt và mặt nạSobel được sử dụng để tính toán Gx và Gy Các mặt nạ này cho kết quả đẳng hướngchỉ với các cạnh thẳng đứng và nằm ngang, vì vậy ngay cả nếu chúng ta sử dụngphương trình (10.1-4) để tính toán gradient, kết quả sẽ là đẳng hướng chỉ với các
Trang 18cạnh trong những hướng này Trong trường hợp này, các phương trình (10.1-4) và(10.1-12) cho kết quả giống (vấn đề 10.6).
Nó có thể thay đổi mặt nạ 3x3 trong Hình 10.8 do đó chúng có đáp ứng mạnhnhất của chúng dọc theo hướng đường chéo.Thêm hai mặt nạ Prewitt và Soble đểphát hiện các gián đoạn theo các hướng đường chéo được trình bày trong Hình 10.9 Hình 10.10 minh họa đáp ứng của hai thành phần gradient, |Gx| và |Gy|, cũng nhưcác ảnh gradient hình thành từ tổng của hai thành phần này
Trang 19Các hướng của hai thành phần thể hiện rõ trong hình 10.10(b) và (c) Chú ý kỹ
vào phần mái ngói, khớp gạch ngang, và các đoạn ngang của các cửa sổ trong hình10.10(b) Ngược lại, hình 10.10(c) có dấu hiệu các thành phần dọc, chẳng hạn nhưcác góc của bức tường gần đó, các cột đèn ở phía bên phải của bức hình
Ảnh gốc có độ phân giải tương đối cao (1200 x 1600 pixel) và, tại khoảng cáchhình ảnh được chụp, góp phần tạo nên ảnh chi tiết bởi những viên gạch tường vẫncòn đáng kể Mức độ chi tiết thường là không mong muốn, và một trong những cách
để giảm bớt nó là làm mịn ảnh Hình 10.11 cho thấy trình tự của các hình ảnh nhưtrong hình 10.10, nhưng với hình ảnh ban đầu được làm mịn đầu tiên sử dụng một
bộ lọc trung bình 5x5 Đáp ứng của mỗi mặt nạ bây giờ hầu như không có đóng góp
do những viên gạch với kết quả được làm mịn chủ yếu là do các cạnh chính Lưu ýrằng trung bình gây ra các đáp ứng của tất cả các cạnh là yếu
Trong hình 10.10 và 10.11, rõ ràng là các mặt nạ Sobel ngang và dọc đáp ứng tốtnhư nhau cho việc định hướng cạnh theo hướng cộng và trừ 45o Nếu điều quantrọng là để nhấn mạnh các cạnh theo hướng chéo sau đó một trong những cặp mặt nạtrong Hình 10.9 nên được sử dụng Đáp ứng tuyệt đối của mặt nạ Sobel chéo được
Trang 20thể hiện trong hình 10.12 Đáp ứng chéo mạnh hơn của các mặt nạ là điều hiển nhiêntrong hình này Cả hai mặt nạ đường chéo có đáp ứng tương tự với cạnh ngang vàdọc nhưng, như mong đợi, đáp ứng của nó theo hướng này là yếu hơn so với đápứng của mặt nạ Sobel ngang và dọc thể hiện trong hình 10.10(b) và 10.10(c).
Toán tử Laplacian
Laplacian của một hàm 2-D f(x,y) là một dẫn xuất bậc hai được định nghĩa là