1. Trang chủ
  2. » Luận Văn - Báo Cáo

tiểu luận môn xử lý ảnh nâng cao ngưỡng

39 504 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 39
Dung lượng 4,76 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

10.3.3 Ngưỡng toàn cầu cơ bản Với tham chiếu đến các cuộc thảo luận trong mục 10.3.1, đơn giản nhất trong tất cả các kỹ thuật ngưỡng là phân vùng biểu đồ hình ảnh bằng cách sử dụng một

Trang 1

TIỂU LUẬN MÔN XỬ LÝ ẢNH NÂNG CAO : NGƯỠNG

Vì tính trực quan và đơn giản thực hiện, ngưỡng hình ảnh một vị trí trung tâm trong các ứng dụng của phân vùng ảnh Đơn giản ngưỡng lần đầu tiên được giới thiệu trong phần 3.1, và chúng ta đã sử dụng nó trong các cuộc thảo luận khác nhau trong các chương trước Trong phần này, chúng tôi giới thiệu ngưỡng một cách chính thức hơn

và mở rộng nó để kỹ thuật mà là đáng kể tổng quát hơn những gì đã được trình bày cho đến nay

10.3.1 Nền tảng

Giả sử rằng biểu đồ màu xám cấp hình 10.26 (a) tương ứng với một hình ảnh, f (x, y), bao gồm các đối tượng ánh sáng trên một nền tối, trong một cách mà đối tượng và nền pixel có mức xám nhóm lại thành hai chế độ chi phối Một cách rõ ràng để trích xuất các đối tượng từ nền là để chọn một ngưỡng T phân cách các chế độ này Sau đó bất kỳ điểm (x, y) mà f (x, y) > T được gọi là một điểm đối tượng: nếu không, các điểm được gọi là một điểm nền Đây là loại ngưỡng giới thiệu trong phần 3.1

Hình 10.26 (a) biểu đồ màu xám cấp có thể được phân chia bởi (a) một ngưỡng duy nhất, và (b) nhiều ngưỡng

Hình 10.26 (b) cho thấy một trường hợp hơi tổng quát hơn của phương pháp này, nơi

ba chế độ thống trị đặc trưng cho biểu đồ hình ảnh (ví dụ, hai loại đối tượng ánh sáng trên nền tối) Đây, ngưỡng đa phân loại một điểm (x, y) là thuộc về một lớp đối tượng nếu T1 <(x, y) <T2, cho lớp đối tượng khác nếu f (x, y)> T2, và nền nếu f (x, y) <T3 Nói chung, vấn đề phân chia nhỏ đòi hỏi nhiều ngưỡng được giải quyết tốt nhất sử dụng phương pháp phát triển khu vực, chẳng hạn như những thảo luận trong phần 10.4

Dựa trên các cuộc thảo luận trước đó, ngưỡng có thể được xem như là một hoạt động

có liên quan đến việc kiểm tra đối với một chức năng T của mẫu

T = T [x, y, p (x, y), f (x, y)] ( 10.3-1)

Trang 2

trong đó f (x, y) là mức xám của điểm (x, y) và p (x, y) biểu thị một số bất động sản địa phương của điểm-cho ví dụ này, mức độ màu xám trung bình của một khu phố tập trung vào (x, y) Một hình ảnh ngưỡng g (x, y) được định nghĩa là

( 10.3-2)

Do đó, các điểm ảnh được dán nhãn 1 (hoặc bất kỳ cấp độ màu xám tiện lợi khác) tương ứng với các đối tượng trong khi pixel nhãn 0 (hoặc bất kỳ cấp độ xám khác không giao cho đối tượng tương ứng với nền

Khi T chỉ phụ thuộc vào f (x, y) (có nghĩa là, chỉ có trên các giá trị màu xám cấp) ngưỡng được gọi là toàn cầu Nếu T phụ thuộc vào cả hai f (x, y) và p (x, y), ngưỡng được gọi là cục bộ Ngoài ra, T phụ thuộc vào các tọa độ không gian x và y ngưỡng được gọi là động hay thích nghi

10.3.2 Vai trò của độ sáng

Tại mục 2.3.4 chúng tôi giới thiệu một mô hình đơn giản trong đó hình ảnh của f (x, y)được hình thành như là sản phẩm của một phản xạ thành phần r (x, y) và lan độ sáng thành phần i (x, y) Mục đích của việc này phần là sử dụng mô hình này để thảo luận

về một thời gian ngắn ảnh hưởng của ánh sáng trên ngưỡng, đặc biệt là trên ngưỡng toàn cầu

Xem xét các máy tính chức năng phản xạ tạo ra hình 10.27 (a) Các biểu đồ của chức năng này, thể hiện trong hình 10,27 (b), rõ ràng là hai mốt và có thể được phân chia

dễ dàng bằng cách đặt một ngưỡng toàn cầu duy nhất, T, trong thung lũng biểu đồ Nhân chức năng phản xạ trong hình 10.27 (a) bởi chức năng chiếu sáng trong hình, 10,27 (c) sản lượng hình ảnh hiển thị trong hình 10,27 (d) Hình 10.27 (e) cho thấy biểu đồ của hình ảnh này Lưu ý rằng các thung lũng ban đầu đã được hầu như bị loại, làm cho phân chia bởi một ngưỡng duy nhất một nhiệm vụ không thể Mặc dù chúng

ta hiếm khi có chức năng phản xạ của chính nó để làm việc với, minh hoạ đơn giản này cho thấy tính chất phản chiếu của các đối tượng và hình nền có thể được như vậy

mà họ có thể dễ dàng tách rời Tuy nhiên, các kết quả hình ảnh từ nghèo (trong trườnghợp này không đồng dạng) chiếu sáng có thể được khá khó khăn để phân đoạn

Trang 3

nó sẽ là đơn giản ( như một xung ) Phép chập của hàm này với biểu đồ mức xám của

r ' ( x, y) sẽ để lại hình dạng cơ bản của biểu đồ này không thay đổi ( thu hồi từ các cuộc thảo luận tại mục 4.2.4 mà chập của một chức năng với một xung tương tự các chức năng tại địa điểm của xung ) Nhưng nếu i '( x, y) đã có một biểu đồ rộng hơn (do sự không đồng dạng chiếu sáng ) , quá trình chập sẽ làm bẩn các biểu đồ mức xám của r' ( x, y) , cho ra một biểu đồ cho z { x, y } có hình dạng khá khác so với biểu

Trang 4

đồ mức xám của r'( x, y) Mức độ biến dạng phụ thuộc vào bề ngang của biểu đồ của

i '( x, y) , do đó phụ thuộc vào sự không giống nhau của các hàm về độ sáng

Chúng ta đã xử lý với logarit của f (x, y), thay vì đối phó với các chức năng chụp ảnh trực tiếp, nhưng bản chất của vấn đề được giải thích rõ ràng bằng cách sử dụng logarit để tách các thành phần chiếu sáng và phản xạ Cách tiếp cận này cho phép hìnhthành biểu đồ được xem như là một quá trình tích chập, điều này giải thích lý do tại sao một khe khác biệt trong biểu đồ của các hàm phản xạ có thể bị mờ bởi ánh sáng không phù hợp

Khi truy cập vào các nguồn chiếu sáng có sẵn, một giải pháp thường được sử dụngtrong thực tế để bù cho những phần không giống là dự án mô hình chiếu sáng trên một

bề mặt phản chiếu màu trắng liên tục Điều này mang lại một hình ảnh g (x, y) = ki (x,y), với k là một hằng số mà phụ thuộc vào bề mặt và i (x, y) là pattern.Then chiếu sáng, cho bất kỳ hình ảnh của f (x, y ) = i (x, y) r (x, y) thu được với chức năng chiếu sáng như nhau, chỉ đơn giản là chia f (x, y) bởi g (x, y) mang lại một chức năng bình thường hóa h (x, y) = f (x , y) / g (x, y) = r (x, y) / k Vì vậy, nếu r (x, y) có thể được phân đoạn bằng cách sử dụng một T ngưỡng duy nhất, sau đó h (x> y) có thể được phân đoạn bằng cách sử dụng một ngưỡng giá trị duy nhất của T / k

10.3.3 Ngưỡng toàn cầu cơ bản

Với tham chiếu đến các cuộc thảo luận trong mục 10.3.1, đơn giản nhất trong tất cả các kỹ thuật ngưỡng là phân vùng biểu đồ hình ảnh bằng cách sử dụng một ngưỡng toàn cầu duy nhất, T, như minh họa trong hình 10.26 (a) Phân khúc sau đó được thựchiện bằng cách quét các điểm ảnh hình ảnh của điểm ảnh và ghi nhãn mỗi điểm ảnh như đối tượng hoặc nền, tùy thuộc vào mức độ màu xám của điểm ảnh đó là lớn hơn hoặc thấp hơn giá trị của T Như nêu ở trên, sự thành công của phương pháp này phụ thuộc toàn bộ trên như thế nào biểu đồ có thể được phân chia

Hình 10.28 (a) cho thấy một hình ảnh đơn giản, và hình 10,28 (b) cho thấy biểu đồ hình của nó 10,28 (c) cho thấy kết quả của việc phân chia hình 10,28 (a) bằng cách sửdụng một ngưỡng T nằm giữa các cấp độ màu xám tối đa và tối thiểu Ngưỡng này đạtđược một "clean" phân khúc bằng cách loại bỏ bóng tối và chỉ để lại các đối tượng tự Các đối tượng quan tâm trong trường hợp này là tối hơn nền, do đó bất kỳ điểm ảnh với một mức độ màu xám ≤ T đã được dán nhãn màu đen (0)., Và bất kỳ điểm ảnh vớimột mức độ màu xám> T đã được dán nhãn trong khi (255) mục tiêu chính là chỉ ly

để tạo ra một hình ảnh nhị phân, vì vậy mối quan hệ đen-trắng có thể bị đảo ngược

Trang 5

Loại ngưỡng toàn cầu vừa mô tả có thể được dự kiến sẽ được thành công trong môi trường kiểm soát cao Một trong những lĩnh vực mà điều này thường có thể là trong các ứng dụng kiểm tra công nghiệp, nơi kiểm soát của ánh sáng thường có tính khả thi.

Ngưỡng trong ví dụ trên đã được xác định bằng cách sử dụng một phương pháp tiếp cận heuristic, dựa trên quan sát bằng mắt của thuật toán sau đây histogram.Có thể được sử dụng để có được T tự động:

1 Chọn một ước tính ban đầu cho T

2 Phân khúc hình ảnh sử dụng T.This sẽ sản xuất hai nhóm điểm ảnh: G1con ¬ sistingcủa tất cả các điểm ảnh với giá trị mức xám> T và G2 bao gồm các điểm ảnh với giá trị ≤ T

3 Tính toán các giá trị mức xám trung bình μ1 và μ2 cho các điểm ảnh trong vùng G1

Trang 6

Khi có lý do để tin rằng nền và đối tượng chiếm khu vực so sánh trong các hình ảnh, giá trị ban đầu tốt cho T là mức xám trung bình của hình ảnh Khi đối tượng là nhỏ so với các khu vực bị chiếm đóng bởi nền (hoặc ngược lại), sau đó một nhóm các điểm ảnh sẽ chiếm ưu thế trong biểu đồ và mức độ màu xám trung bình không phải là một

sự lựa chọn tốt ban đầu Một giá trị ban đầu thích hợp hơn cho T trong trường hợp như thế này là một giá trị giữa chừng giữa các cấp độ màu xám tối đa và tối thiểu T0

các tham số được sử dụng để ngăn chặn các thuật toán sau khi thay đổi trở nên nhỏ về thông số này Này được sử dụng khi tốc độ lặp đi lặp lại là một vấn đề quan trọng

EXAMPLE 10.11: Image segmentation using an estimated global threshold.

Hình 10.29 cho thấy một ví dụ về phân đoạn dựa trên một ngưỡng ước tính bằng cách

sử dụng thuật toán trước đó Hình 10.29 (a) là hình ảnh ban đầu, và hình 10.29 (b) là biểu đồ hình ảnh Lưu ý các khe rõ ràng của biểu đồ Áp dụng các thuật toán lặp đi lặplại dẫn đến một giá trị 125,4 sau khi ba lần lặp lại bắt đầu với mức độ trung bình và màu xám

T0 = 0 Kết quả thu được sử dụng T = 125 phân đoạn hình ảnh ban đầu được thể hiện trong hình 10.29 (c) Như đã phân định rõ ràng các chế độ trong biểu đồ, các phân hóa giữa các đối tượng và hình nền là rất hiệu quả

10.3.4 Thresholding thích ứng cơ bản

Như minh họa trong Fig.10.27 yếu tố hình ảnh như chiếu sáng không đồng đều có thể chuyển đổi một biểu đồ hoàn hảo segmentable vào một biểu đồ mà không thể được phân chia một cách hiệu quả bởi một ngưỡng toàn cầu duy nhất Một cách tiếp cận để

xử lý một tình huống như vậy là để phân chia hình ảnh ban đầu vào subimages và sau

đó sử dụng một ngưỡng khác nhau để phân đoạn mỗi subimage Các vấn đề quan trọng trong cách tiếp cận này là làm thế nào để chia nhỏ các hình ảnh và làm thế nào

để ước tính ngưỡng cho mỗi subimage kết quả Kể từ khi ngưỡng sử dụng cho mỗi điểm ảnh phụ thuộc vào vị trí của các điểm ảnh trong các điều khoản của subimages, loại hình này là ngưỡng thích nghi Chúng tôi minh họa ngưỡng thích nghi với một ví

dụ đơn giản Một ví dụ toàn diện hơn được đưa ra trong phần tiếp theo

Hình 10.30 (a) cho thấy hình ảnh từ hình 10,27 (d), mà chúng tôi kết luận không thể ngưỡng hiệu quả với một ngưỡng toàn cầu duy nhất Trong hình 10.30 (b) cho thấy kết quả của ngưỡng hình ảnh với một ngưỡng toàn cầu tự đặt trong khe của biểu đồ của nó [xem hình 10,27 (e)] Một cách tiếp cận để giảm hiệu ứng của sự không đồng dạng chiếu sáng là để chia nhỏ các hình ảnh vào subimages nhỏ hơn, như vậy mà sự chiếu sáng của mỗi subimage khoảng thống nhất Hình 10.30 (c) cho thấy một phân vùng như vậy, thu được bằng cách phân chia hình ảnh thành bốn phần bằng nhau, và sau đó phân chia từng phần bằng bốn lần nữa

Trang 7

Tất cả các subimages không chứa một ranh giới giữa đối tượng và nền đã có chênh lệch dưới 75 Tất cả subimages chứa ranh giới có chênh lệch vượt quá 100 Mỗi subimage với phương sai lớn hơn 100 là phân đoạn với một ngưỡng tính toán cho rằngsubimage sử dụng thuật toán thảo luận trong các giá trị của phần trước.The trước cho Tín từng trường hợp được chọn làm điểm giữa chừng giữa các cấp độ màu xám tối thiểu và tối đa trong subimage Tất cả subimages với phương sai nhỏ hơn 100 được coi là một hình ảnh tổng hợp, đó là phân đoạn sử dụng một ngưỡng đơn ước tính bằngcách sử dụng cùng một thuật toán.

Kết quả của phân khúc sử dụng thủ tục này được thể hiện trong hình 10.30 (d) Ngoại trừ hai subimages, sự cải thiện trên hình 10.30 (b) là điều hiển nhiên Ranh giớigiữa đối tượng và nền trong mỗi subimages không đúng phân đoạn nhỏ và tối, và biểu

đồ kết quả là gần như unimodal Hình 10.31 (a) cho thấy đầu không đúng cách phân đoạn subimage từ hình 10.30 (c) và subimage trực tiếp trên nó đó là phân đoạn đúng.Các biểu đồ của subimage đó là đúng phân đoạn rõ ràng là hai đỉnh, đỉnh điểm rõ ràng

và thung lũng Các biểu đồ khác là gần như unimodal, không có phân biệt rõ ràng giữacác đối tượng và nền

Hình 10.31 (d) cho thấy subimage không được chia nhỏ thành subimages nhỏ hơn nhiều, và hình 10.31 (e) cho thấy biểu đồ của hàng đầu, trái nhỏ subimage.This

Trang 8

subimage có sự chuyển tiếp giữa đối tượng và nền Subimage này nhỏ hơn có một biểu đồ rõ ràng hai mốt và phải được dễ dàng segmentable Điều này, trên thực tế, là trường hợp, như thể hiện trong hình 10.31 (f) Con số này cũng cho thấy các phân đoạn của tất cả các subimages nhỏ khác Tất cả những subimages có một biểu đồ gần unimodal, và mức độ màu xám trung bình của họ là gần hơn với đối tượng hơn nền, vìvậy tất cả chúng được xếp vào nhóm đối tượng Nó là trái như một dự án để cho ngườiđọc thấy rằng phân khúc đáng kể chính xác hơn có thể đạt được bằng cách phân chia toàn bộ hình ảnh trong hình 10.30 (a) vào subimages của kích thước hình 10.31 (d)

Ngưỡng tối ưu và thích ứng toàn cầu

Trong phần này, chúng tôi thảo luận về phương pháp ước lượng ngưỡng đầu ra tối thiểu lỗi phân vùng trung bình Như một minh hoạ, phương pháp này được áp dụng cho một vấn đề đòi hỏi phải có giải pháp của một số vấn đề quan trọng tìm thấy thường xuyên trong các ứng dụng thực tế của ngưỡng

Hình 10.31 (a) subimages phân đoạn đúng và không đúng từ hình, 10.30 (b) - (c) biểu đồ tương ứng, (d) chia nhỏ hơn nữa của subimage phân đoạn không đúng , (e) Histogram của subimage nhỏ ở đầu , trái, (f) Kết quả phân chia thích nghi (d)

Giả sử rằng một hình ảnh chỉ chứa hai vùng màu xám cấp chính Cho z biểu thị giá trị màu xám cấp Chúng ta có thể xem các giá trị như số lượng ngẫu nhiên, và biểu đồ của họ có thể được coi là một ước tính hàm mật độ xác suất (PDF), p (z) Hàm mật độ tổng thể này là tổng hợp hoặc hỗn hợp của hai mật độ một cho ánh sáng và một cho các vùng tối trong hình ảnh Hơn nữa, các thông số hỗn hợp là tỷ lệ thuận với khu vực tương đối của các vùng tối và sáng Nếu hình thức của mật độ được biết đến hoặc đã thừa nhận, nó có thể xác định một ngưỡng tối ưu (về lỗi tối thiểu) để phân chia hình ảnh thành hai khu vực riêng biệt

Trang 9

Hình 10.32 cho thấy hai hàm mật độ xác suất Cho rằng lớn hơn mô tả các mức độ màu xám của các đối tượng trong hình ảnh Hàm mật độ xác suất hỗn hợp mô tả các biến thể màu xám cấp tổng thể trong hình ảnh là

p(z) = P 1 p 1 (z) + P 2 p 2 (z) (10.3-5)

Đây, P1 và P2 là xác suất của sự xuất hiện của hai lớp của điểm ảnh, đó là, P1 là xác suất (một số) mà một điểm ảnh ngẫu nhiên với giá trị z là một điểm ảnh đối tượng.Tương tự như vậy, P2 là xác suất mà các điểm ảnh là một điểm ảnh nền Chúng tôi giảđịnh rằng bất kỳ điểm ảnh được thuộc về một trong hai đến một đối tượng hoặc nền,

do đó

P1 + P2 = 1

Một hình ảnh là phân đoạn bằng cách phân loại như nền tất cả các pixel có mức xám lớn hơn một ngưỡng T (xem hình 10,32) Tất cả các điểm ảnh khác được gọi là điểm ảnh đối tượng Mục tiêu chính của chúng tôi là chọn giá trị của T là giảm thiểu các lỗi trung bình trong việc đưa ra các quyết định mà một điểm ảnh được thuộc về một đối tượng hoặc nền

Nhớ lại rằng xác suất của một biến ngẫu nhiên có giá trị trong khoảng [a, b] là bộ của hàm mật độ xác suất của nó từ a đến b, đó là khu vực của đường cong PDF giữa hai giới hạn này Như vậy, xác suất lỗi phân loại một điểm nền là một điểm đối tượng là

Trang 10

nhau Đây đơn giản để giải thích Xem xét, ví dụ, trường hợp cực đoan, trong đó điểmnền được biết đến không bao giờ xảy ra Trong trường hợp này P2 = 0 Đóng góp cho

sự lỗi tổng thể (E) phân loại một điểm nền là một điểm đối tượng (E1) nên bị lỗi ngoài

vì điểm nền được biết đến không bao giờ xảy ra Này được thực hiện bằng cách nhân

E1 bởi P2 = 0 Nếu nền và đối tượng điểm đều có khả năng xảy ra, thì trọng lượng là P1

Có được một biểu hiện phân tích cho T đòi hỏi chúng ta biết các phương trình cho hai file PDF Ước tính các mật độ trong thực tế không phải lúc nào cũng khả thi, và một cách tiếp cận được sử dụng thường là sử dụng mật độ có các tham số hợp lý đơn giản để có được Một trong những mật độ chính được sử dụng theo cách này là mật độGauss, được đặc trưng hoàn toàn bởi hai thông số: giá trị trung bình và phương sai Trong trường hợp này:

h (zi) là

Trang 11

Nói chung, phân tích xác định các thông số để giảm thiểu lỗi này hình vuông có nghĩa không phải là một vấn đề đơn giản Ngay cả đối với các trường hợp Gaussian, tính toán đơn giản của tương đương các đạo hàm riêng đến 0 dẫn đến một tập hợp các phương trình siêu việt đồng thời thường chỉ có thể được giải quyết bằng thủ tục số, chẳng hạn như một gradient liên hợp hoặc phương pháp của Newton cho phương trìnhphi tuyến đồng thời.

Sau đây là một trong những ví dụ đầu tiên về phân chia bởi ngưỡng tối ưu trong

xử lý hình ảnh Ví dụ này là đặc biệt thú vị tại điểm này bởi vì nó cho thấy kết quả phân đoạn có thể được cải thiện bằng cách sử dụng các kỹ thuật tiền xử lý dựa trên cácphương pháp phát triển trong cuộc thảo luận của chúng ta về nâng cao hình ảnh Ngoài ra, ví dụ này cũng minh họa việc sử dụng các biểu đồ dự toán địa phương và ngưỡng thích nghi Các vấn đề chung là để phác thảo tự động ranh giới của tâm thất trái tim trong cardioangiograms (hình ảnh X-quang của một trái tim đã được tiêm một chất cản quang) Phương pháp thảo luận ở đây được phát triển bởi Chow và Kaneko [1972] cho phác thảo ranh giới của tâm thất trái của tim

Trước khi phân khúc, tất cả các hình ảnh được tiền xử lý như sau: (1) Mỗi điểm ảnh được ánh xạ với một chức năng đăng nhập (xem Phần 3.2.2) để chống lại hiệu ứng theo cấp số nhân gây ra bởi sự hấp thụ phóng xạ (2) Một hình ảnh thu được trướckhi áp dụng các chất cản quang đã trừ đi từ mỗi hình ảnh được chụp sau khi vừa được tiêm để loại bỏ hiện tại cột sống trong cả hai hình ảnh (xem Phần 3.4.1) (3) Một số tia

X quang được tổng kết để lại giúp giảm nhiễu ngẫu nhiên (xem Phần 3.4.2) Hình 10,33 cho thấy một cardioangiogram trước và sau khi tiền xử lý (một lời giải thích củacác khu vực được đánh dấu A và B được đưa ra trong đoạn sau)

Trang 12

Để tính toán ngưỡng tối ưu, mỗi hình ảnh xử lý trước được chia thành 49 khu vực bằng cách đặt một

7 x 7 lưới với 50% chồng lên nhau trên mỗi hình ảnh (tất cả các hình ảnh ban đầu thể hiện trong ví dụ này có kích thước 256 x 256 pixel) Mỗi phòng trong số kết quả các khu vực chồng chéo 49 chứa 64 x 64 pixel Hình ¬ ures 10.34 (a) và 10.34 (b) là những biểu đồ của các khu vực được đánh dấu A và B trong hình 10,33 (b) Lưu ý rằng các biểu đồ cho khu vực một cách rõ ràng là hai mốt, cá Cating sự hiện diện của một ranh giới Biểu đồ cho khu vực B, tuy nhiên, là đơn phương thức, cho thấy sự vắng mặt của hai khu vực riêng biệt rõ rệt

Sau khi tất cả 49 biểu đồ được tính toán, một bài kiểm tra bimodality được thực hiện để loại bỏ các biểu đồ còn lại histograms.The unimodal sau đó được trang bị bởi hai đỉnh đường cong mật độ Gaussian [xem phương trình (10,3-11)] sử dụng một gradient liên hợp đồi leo phương pháp để giảm thiểu hàm lỗi được đưa ra trong

phương trình (10,3-15) X và O trong hình 10.34 (a) là hai phù hợp với biểu đồ thể hiện trong các chấm đen Các ngưỡng tối ưu đã được sau đó thu được bằng cách sử dụng EQS (10,3-12) và (10,3-13)

Ở giai đoạn này của quá trình chỉ các khu vực với biểu đồ hai mốt được phân ngưỡng Các ngưỡng cho các khu vực còn lại đã thu được bằng cách nội suy các ngưỡng này Sau đó, một suy thứ hai được thực hiện từng điểm bằng cách sử dụng cácgiá trị ngưỡng lân cận do đó, vào cuối các thủ tục, tất cả các điểm trong hình ảnh đã được chỉ định một ngưỡng Cuối cùng, một quyết định nhị phân được thực hiện cho mỗi điểm ảnh bằng cách sử dụng quy tắc

Sử dụng các đặc tính biên cho cải thiện biểu đồ và Thresholding cục bộ

Trang 13

Dựa trên các cuộc thảo luận trong các năm phần trước, nó là trực giác rõ ràng rằng cơ hội để lựa chọn một ngưỡng "tốt" được tăng cường đáng kể nếu các đỉnh biểu

đồ là cao, hẹp, đối xứng, và cách nhau bởi các thung lũng sâu Một cách tiếp cận để cải thiện hình dạng của biểu đồ là để xem xét chỉ những điểm ảnh nằm trên hoặc gần các cạnh giữa các đối tượng và hình nền một cải tiến ngay lập tức và rõ ràng là biểu

đồ sẽ ít phụ thuộc vào kích thước tương đối của các đối tượng và nền Ví dụ, biểu đồ của một hình ảnh bao gồm một đối tượng nhỏ trên một diện tích nền lớn (hoặc ngược lại) sẽ được thống trị bởi một đỉnh lớn do nồng độ cao của một loại các điểm ảnh hình10.30 và 10.31 là một minh họa tốt về cách thức thực hiện phân chia nhỏ bị ảnh hưởngbởi điều này điều kiện

Nếu chỉ có các điểm ảnh trên hoặc gần mép giữa các đối tượng và hình nền được sử dụng, biểu đồ kết quả sẽ có đỉnh xấp xỉ cùng một chiều cao Ngoài ra, khả năng mà bất kỳ của những điểm ảnh được nằm trên một đối tượng sẽ được xấp xỉ bằng xác suất

mà nó nằm trên nền, do đó cải thiện tính đối xứng của các đỉnh biểu đồ Cuối cùng như đã nêu trong các đoạn sau đây, sử dụng điểm ảnh đáp ứng một số biện pháp đơn giản dựa trên gradient và Laplacian các nhà khai thác có xu hướng làm sâu sắc thêm các thung lũng giữa đỉnh biểu đồ

Vấn đề chính với cách tiếp cận chỉ thảo luận là các giả định ngầm rằng các cạnh giữa các đối tượng và nền được biết đến Thông tin này rõ ràng là không có sẵn trong phân khúc, như việc tìm kiếm một phân chia giữa các đối tượng và nền là chính xác những gì phân khúc là tất cả về Tuy nhiên, từ các cuộc thảo luận trong mục 10.1.3, chỉ số cho biết một điểm ảnh trên một cạnh có thể thu được bằng cách tính toán độ dốc của nó Ngoài ra, sử dụng là Laplacian có thể mang lại thông tin về việc liệu có một điểm ảnh được nằm trên mặt tối hoặc ánh sáng của một cạnh Giá trị trung bình của Laplacian là 0 ở sự chuyển đổi của một cạnh (xem hình 10.6) trong thực tế các thung lũng của biểu đồ hình thành từ các điểm ảnh được chọn bởi một gradient / Laplacian tiêu chí có thể được dự kiến sẽ được dân cư thưa thớt Thuộc tính này là kết quả của các rảnh sâu đã thảo luân trước đó

Trang 14

Gradient ∇f tại điểm bất kỳ (x, y) trong một hình ảnh được cho bởi phương trình (10,1-4) hoặc (10,1-12) Tương tự như vậy, các Laplacian 2f được cho bởi phương trình (10,1-14) hoặc (10,1-15) Hai với số lượng có thể được sử dụng để tạo thành một hình ảnh ba cấp, như sau:

nơi mà các ký hiệu 0, + và - đại diện cho bất kỳ ba cấp độ màu xám khác nhau, T là một ngưỡng, và gradient và Laplacian được tính ở mọi điểm (x, y) Cho một đối tượngtối trên một nền ánh sáng, và có sự tham khảo hình 10.6, việc sử dụng các phương trình (10,3-36) tạo ra hình ảnh của (x, y), trong đó (1) tất cả các điểm mà không phải

là trên một cạnh (được xác định bởi ∇ f là ít hơn so với T) được dán nhãn 0, (2) tất cả các điểm ảnh trên bóng tối bên cạnh được dán nhãn +, và (3) tất cả các điểm ảnh trên bên ánh sáng của một cạnh được dán nhãn -, các ký hiệu + và - trong phương trình (10.3-16) được đảo ngược cho một đối tượng ánh sáng trên nền tối Con số 10.36 cho thấy ghi nhãn sản xuất bởi phương trình (10.3-16) cho một hình ảnh của nền tối, nhấnmạnh việc mất khi viết trên nền sáng

Các thông tin thu được với điều này có thể được sử dụng để tạo ra một phân đoạn, hình ảnh nhị phân trong đó 1 's tương ứng với đối tượng quan tâm và 0 của tương ứng với nền Quá trình chuyển đổi (dọc theo một đường quét ngang hay dọc) từ một nền ánh sáng cho một đối tượng tối phải được đặc trưng bởi sự xuất hiện của một - theo sau là một + trong s (x, y) Bên trong các đối tượng bao gồm các điểm ảnh được dán nhãn hoặc là 0 hoặc + Cuối cùng, quá trình chuyển đổi từ đối tượng quay trở lại nền được đặc trưng bởi sự xuất hiện của một + theo sau là một - Như vậy, một dòng quét ngang hoặc thẳng đứng chứa một phần của một đối tượng có cấu trúc sau

Trang 15

( ) (-, +) (0 hoặc +) (+, -) ( )

( ) đại diện cho bất kỳ sự kết hợp của +, -, và 0 Các dấu ngoặc chứa đối tượng, điểm

và được dán nhãn 1 Tất cả các điểm khác dọc theo đường quét tương tự được dán nhãn 0, ngoại trừ bất kỳ chuỗi khác (0 hoặc +) giới hạn bởi (-, +) và (+, -)

Hình 10.37 (a) cho thấy một hình của một ảnh kiểm tra ngân hàng bình thường Hình 10.38 cho thấy biểu đồ như một chức năng của các giá trị độ dốc cho các điểm ảnh với độ dốc lớn hơn 5 Lưu ý rằng biểu đồ này có hai chế độ chi phối là đối xứng gần của cùng một chiều cao, và được ngăn cách bởi một thung lũng riêng biệt Cuối cùng Vả 10,37 (b) cho thấy hình ảnh phân đoạn thu được bằng cách sử dụng phương trình (10,3-16) với tôi tại hoặc gần trung điểm của thung lũng Kết quả đã được thực hiện nhị phân bằng cách sử dụng các phân tích trình tự chỉ thảo luận Lưu ý rằng ví dụnày là một minh chứng của ngưỡng cục bộ , như được định nghĩa trong phương trình (10,3-1), bởi vì giá trị của T được xác định từ một biểu đồ của gradient và Laplacian,

là thuộc tính cục bộ

Ngưỡng cơ bản dựa trên một số biến

Trang 16

Vì vậy, đến nay chúng tôi đã quan tâm đến ngưỡng mức màu xám Trong một số trường hợp, một bộ cảm biến có thể làm cho có sẵn nhiều hơn một biến để mô tả mỗi điểm ảnh trong một hình ảnh, và do đó cho phép theresholding đa phổ Như thảo luận chi tiết trong phần 6.7, màu sắc hình ảnh là một ví dụ điển hình, trong đó mỗi điểm ảnh được đặc trưng bởi ba giá trị RGB, trong trường hợp này, việc xây dựng một 3-D

"biểu đồ" trở thành có thể Các thủ tục cơ bản là tương tự như phương pháp sử dụng cho một biến Ví dụ, đối với một hình ảnh với ba biến (các thành phần RGB), từng có

16 cấp độ có thể, một x 16 lưới 16 x16 (khối lập phương) được hình thành chèn trongmỗi tế bào của khối lập phương là số lượng điểm ảnh có các thành phần RGB có giá trị tương ứng với các tọa độ xác định vị trí của mà tế bào đặc biệt Mỗi mục được chia cho tổng số lượng điểm ảnh trong hình ảnh để tạo thành một biểu đồ bình thường Các khái niệm về ngưỡng bây giờ trở thành một trong việc tìm kiếm các cụm điểm trong không gian 3 chiều Giả sử, ví dụ, cụm đáng kể K điểm được tìm thấy trong biểu

đồ Hình ảnh có thể được phân đoạn bằng cách chỉ định một giá trị tùy ý (ví dụ: trong khi) các điểm ảnh RGB có thành phần gần gũi hơn với một cụm và giá trị khác (ví dụ :đen) để các điểm ảnh trong hình ảnh Khái niệm này có thể dễ dàng mở rộng để các thành phần khác và chắc chắn các cụm hơn Khó khăn chủ yếu là tư lợi cụm trở thành một nhiệm vụ ngày càng phức tạp như số lượng các biến tăng Cụm tìm kiếm các phương pháp có thể được tìm thấy, ví dụ, trong các cuốn sách của Duda, Hart, và Stork [2001], và Tou và Gonzalez [1974]

Những hình ảnh thể hiện trong hình 10.39 (a) là một hình ảnh đơn sắc của một bức ảnh màu Những hình ảnh màu sắc ban đầu bao gồm ba hình ảnh RGB 16 độ Chiếc khăn là một màu đỏ rực rỡ, và mái tóc và màu sắc trên khuôn mặt được ánh sáng và khác nhau về đặc điểm quang phổ từ cửa sổ và các tính năng cơ bản khác

Ví dụ 10.15

Hình 10.39 (b) thu được bằng cách ngưỡng về một trong những cụm biểu đồ tương ứng với tông màu trên khuôn mặt Lưu ý rằng cửa sổ, trong hình ảnh đơn sắc

Trang 17

gần về giá trị màu xám cấp cho tóc, không xuất hiện trong hình ảnh phân đoạn do việc

sử dụng các đặc điểm đa phổ để phân cách giữa hai khu vực này Hình 10.39 (c) thu được bằng cách ngưỡng về một nhóm gần với trục màu đỏ Trong trường hợp này chỉ

có chiếc khăn và một phần của một bông hoa (có màu đỏ cũng) xuất hiện trong kết quả phân đoạn Ngưỡng được sử dụng để có được cả hai kết quả là một khoảng cách của một tế bào Do đó bất kỳ điểm ảnh có thành phần là bên ngoài tế bào bao quanh trung tâm của cụm trong câu hỏi đã được phân loại là nền (màu đen) Pixel mà thành phần đặt chúng bên trong tế bào được mã hóa màu trắng

Như đã thảo luận trong phần 6.7, phân khúc màu sắc có thể được dựa trên bất kỳ của các mô hình màu giới thiệu trong chương 6 Ví dụ, màu sắc và độ bão hòa là tài sản quan trọng trong nhiều ứng dụng xử lý việc sử dụng hình ảnh để kiểm tra tự động Các tính chất này đặc biệt quan trọng trong nỗ lực cạnh tranh với các chức năng tươngđương được thực hiện bởi con người, chẳng hạn như trong việc kiểm tra các loại trái cây cho chín hoặc trong việc kiểm tra hàng hóa sản xuất Như đã đề cập trong Chương6,the Hue, Saturation, Cường độ (HSI) mô hình lý tưởng cho các loại ứng dụng bởi vì

nó liên quan chặt chẽ đến cách thức mà con người mô tả nhận thức về màu sắc Một cách tiếp cận phân khúc bằng cách sử dụng màu sắc và độ bão hòa các thành phần củamột tín hiệu màu sắc cũng đặc biệt hấp dẫn, vì nó liên quan đến 2-D cụm dữ liệu được

dễ dàng hơn để phân tích hơn, nói rằng, các cụm 3-D cần thiết cho RGB phân khúc

10.4 Phân đoạn vùng cơ bản

Mục tiêu của phân khúc là phân chia một hình ảnh thành các vùng Trong Mục 10.1 và 10.2, chúng tôi tiếp cận vấn đề này bằng cách tìm ranh giới giữa các khu vực dựa trên không liên tục trong mức độ màu xám, trong khi đó tại mục 10.3 phân chia được thực hiện thông qua các ngưỡng dựa trên việc phân phối các tính điểm ảnh, chẳng hạn như giá trị màu xám cấp hoặc màu sắc Trong phần này, chúng tôi thảo luận về kỹ thuật phân chia nhỏ dựa trên việc tìm kiếm các khu vực trực tiếp

(c) Ri R j = Ø for all i and j , i ≠ j

(d) P (Ri) = TRUE for i = 1,2, …,n

(e) P (Ri R j) =FALSE for i ≠ j

Dưới đây, P (Ri) là một vị từ logic xác định qua các điểm trong thiết Ri và Ø tập vô giá trị

Điều kiện (a) chỉ ra rằng các phân khúc phải đầy đủ, có nghĩa là mỗi điểm ảnh phải ở trong một khu vực Điều kiện (b) yêu cầu điểm trong một khu vực phải được kết nối

Trang 18

trong một số ý nghĩa được xác định trước (xem mục 2.5.2 về kết nối)

Điều kiện (c) chỉ ra rằng các khu vực phải được tách rời Điều kiện (d) được giả quyết với các thuộc tính đó phải được đáp ứng bởi các điểm ảnh trong một khu vực được phân đoạn cho ví dụ P (Ri) = TRUE nếu tất cả các điểm trong R, có các cùng các cấp

độ màu xám Cuối cùng, điều kiện (e) chỉ ra rằng khu vực Ri và Rj khác nhau về ý nghĩa của vị P

Khu vực đang phát triển

Như tên gọi của nó, phát triển khu vực là một thủ tục mà các nhóm pixel hoặc tiểu vùng trong khu vực lớn hơn dựa trên các tiêu chí được xác định trước Phương pháp tiếp cận cơ bản là bắt đầu với một tập hợp các "hạt " điểm và từ các khu vực trồng câybằng cách phụ thêm cho mỗi hạt những điểm ảnh lân cận có đặc tính tương tự như hạt (chẳng hạn như phạm vi cụ thể của các cấp độ màu xám hoặc màu)

Lựa chọn một tập hợp của một hoặc nhiều điểm bắt đầu thường xuyên có thể dựa vào bản chất của vấn đề, được hiển thị trong Ví dụ 10,16 Khi một thông tin tiên là không có sẵn, thủ tục để tính toán tại mỗi điểm ảnh cùng một thuộc tính mà cuối cùng

sẽ được sử dụng để phân điểm ảnh để khu vực trong quá trình phát triển Nếu kết quả của những tính toán cho cụm các giá trị, các điểm ảnh có tính chất đặt chúng gần trọngtâm của các cụm có thể được sử dụng như hạt giống

Việc lựa chọn các tiêu chí tương tự không chỉ phụ thuộc vào vấn đề đang được xemxét, nhưng cũng vào loại dữ liệu hình ảnh có sẵn Ví dụ, việc phân tích các hình ảnh

vệ tinh sử dụng đất phụ thuộc nhiều vào việc sử dụng màu sắc Vấn đề này sẽ là khó khăn hơn, hoặc thậm chí không thể, để xử lý mà không có thông tin vốn có sẵn trong hình ảnh màu sắc Khi những hình ảnh đơn sắc, phân tích khu vực phải được thực hiệnvới một bộ mô tả dựa trên mức độ màu xám và thuộc tính không gian (chẳng hạn như những khoảnh khắc hoặc kết cấu) Chúng tôi thảo luận về mô tả đặc tính hữu ích cho khu vực trong chương 11

Mô tả chỉ có thể mang lại kết quả sai lệch nếu kết nối hoặc kề thông tin không được

sử dụng trong quá trình phát triển vùng Ví dụ, hình dung một sự sắp xếp ngẫu nhiên của các điểm ảnh chỉ có ba giá trị màu xám cấp riêng biệt Nhóm pixel với mức cùng một màu xám để tạo thành một "khu vực" mà không chú ý đến kết nối sẽ mang lại mộtkết quả phân đoạn đó là vô nghĩa trong cuộc thảo luận này

Một vấn đề khác phát triển trong khu vực là xây dựng một quy luật dừng lại Về cơ bản, phát triển một khu vực nên dừng lại khi không có nhiều điểm ảnh đủ tiêu chuẩn

để đưa vào khu vực đó Các tiêu chí như mức độ màu xám, kết cấu và màu sắc, là địa phương trong tự nhiên và không có tính "lịch sử" của tăng trưởng khu vực Tiêu chí

bổ sung làm tăng sức mạnh của một thuật toán region-growing sử dụng các khái niệm

về kích thước, giống như giữa một điểm ảnh ứng cử viên và các điểm ảnh phát triển cho đến nay (như so sánh về mức độ màu xám của một ứng cử viên và các cấp độ màu

Trang 19

xám trung bình của khu vực phát triển), và hình dạng của khu vực đang được trồng Việc sử dụng các loại mô tả là dựa trên giả định rằng một mô hình của kết quả mong đợi ít nhất là một phần có sẵn.

Hình 10.40 (a) cho thấy một hình ảnh X-quang của một mối hàn (khu vực tối ngang) có chứa một số vết nứt và porosities (sáng, vệt trắng chạy ngang qua giữa của hình ảnh) Chúng tôi muốn sử dụng khu vực đang phát triển để phân đoạn các khu vựccủa thất bại hàn Các tính năng phân đoạn có thể được sử dụng để kiểm tra, để đưa vào một cơ sở dữ liệu của nghiên cứu lịch sử, để điều khiển một hệ thống hàn tự động,

và cho nhiều ứng dụng khác

10.4 Vùng tách và sát nhập

Thủ tục chỉ thảo luận phát triển khu vực từ một tập hợp các điểm hạt giống Một cách khác là chia nhỏ một hình ảnh ban đầu vào một tập hợp các tùy ý, khu vực rời rạc và sau đó hợp nhất và phân chia các khu vực trong một nỗ lực để đáp ứng các điềukiện quy định tại mục 10.4.1 Một sự chia rẽ và hợp nhất các thuật toán mà lặp đi lặp lại quá trình tiến tới đáp ứng những khó khăn này được phát triển tiếp theo

Cho R đại diện cho toàn bộ khu vực hình ảnh và chọn một vị P Một cách tiếp cận đối với phân khúc R là chia nhỏ tiếp thành các vùng hạ sườn nhỏ hơn và nhỏ hơn do

đó, đối với bất kỳ Ri khu vực, P (Ri) = TRUE Chúng tôi bắt đầu với toàn bộ khu vực.Nếu P (R) = FALSE, chúng tôi chia hình ảnh vào góc phần tư Nếu P là FALSE cho bất kỳ góc phần tư, chúng tôi chia nhỏ góc phần tư đó vào subquadrants, và như vậy

Kỹ thuật tách biệt này có một đại diện thuận tiện trong các hình thức của một cây phàn tư cái gọi là (có nghĩa là, một cây mà các nút có chính xác bốn cháu), như minh họa trong hình 10.42 Lưu ý rằng thư mục gốc của cây tương ứng với toàn bộ hình ảnh và mỗi nút tương ứng với một phân khu Trong trường hợp này, chỉ R4 được chia thêm

Ngày đăng: 30/01/2015, 11:34

HÌNH ẢNH LIÊN QUAN

Hình 10.26 (a) biểu đồ màu xám cấp có thể được phân chia bởi (a) một ngưỡng duy  nhất, và (b) nhiều ngưỡng. - tiểu luận môn xử lý ảnh nâng cao  ngưỡng
Hình 10.26 (a) biểu đồ màu xám cấp có thể được phân chia bởi (a) một ngưỡng duy nhất, và (b) nhiều ngưỡng (Trang 1)
Hình 10.31 (a)  subimages phân đoạn  đúng và  không đúng từ hình, 10.30. (b) - (c)  biểu đồ tương ứng, (d) chia nhỏ hơn nữa của subimage phân đoạn không đúng , (e)  Histogram của subimage nhỏ ở đầu , trái, (f) Kết quả phân chia thích nghi (d) - tiểu luận môn xử lý ảnh nâng cao  ngưỡng
Hình 10.31 (a) subimages phân đoạn đúng và không đúng từ hình, 10.30. (b) - (c) biểu đồ tương ứng, (d) chia nhỏ hơn nữa của subimage phân đoạn không đúng , (e) Histogram của subimage nhỏ ở đầu , trái, (f) Kết quả phân chia thích nghi (d) (Trang 8)

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w