1. Trang chủ
  2. » Luận Văn - Báo Cáo

TÌM HIỂU một số PHƯƠNG PHÁP PHÂN ĐỌAN ẢNH và KHẢ NĂNG ỨNG DỤNG

74 630 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 74
Dung lượng 2,26 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Xử lý ảnh bao gồm nhiều kỹ thuật như: thu nhận ảnh, nén dữ liệu ảnh, xử lý nâng cao chất lượng và khôi phục ảnh, phát hiện biên, phân vùng ảnh, nhận dạng ảnh… Trong các kỹ thuật trên thì

Trang 1

MỤC LỤC

MỞ ĐẦU 3

Chương 1 5

SƠ LƯỢC VỀ XỬ LÝ ẢNH 5

1.1 Biểu diễn ảnh 6

1.2 Tăng cường ảnh - Khôi phục ảnh 6

1.3 Biến đổi ảnh 7

1.4 Phân tích ảnh 7

1.5 Nhận dạng ảnh 7

1.6 Nén ảnh 8

Chương 2 9

MỘT SỐ KỸ THUẬT PHÂN ĐOẠN ẢNH 9

2.1 Sơ lược về phân đoạn ảnh 9

2.2 Phân vùng ảnh dựa theo ngưỡng biên độ 10

2.2.1 Ngưỡng cố định 11

2.2.2 Ngưỡng tự động 11

2.3 Phân vùng theo miền đồng nhất 12

2.3.1 Phương pháp tách cây tứ phân 14

2.3.2 Phương pháp cục bộ hay phân vùng bởi hợp 18

2.3.2.1 Thuật toán tô màu 19

2.3.2.2 Thuật toán đệ quy cục bộ 20

2.3.3 Phương pháp tổng hợp 21

2.4 Phân vùng dựa theo đường biên 22

2.4.1 Phát hiện biên và làm nổi biên 23

2.4.1.1 Phương pháp Gradient 25

2.4.1.2 Kỹ thuật Laplace 29

2.4.2 Làm mảnh biên 30

2.4.3 Nhị phân hoá đường biên 31

2.4.4 Miêu tả đường biên 32

Trang 2

2.4.4.1 Mã hoá theo toạ độ đề các 34

2.4.4.2 Mã hoá Freeman 35

2.4.4.3 Xấp xỉ bởi đoạn thẳng 38

Chương 3 40

CÀI ĐẶT THỬ NGHIỆM MỘT SỐ THUẬT TOÁN PHÂN ĐOẠN ẢNH 40

3.1 Thuật toán phân đoạn ảnh dựa vào ngưỡng cố định 41

3.1.1 Tư tưởng thuật toán 41

3.1.2 Kết quả thực nghiệm và nhận xét 42

3.2 Thuật toán tam giác 43

3.2.1 Tư tưởng thuật toán 43

3.2.2 Kết quả thực nghiệm và nhận xét 47

3.3 Thuật toán JSEG 48

3.3.1 Giới thiệu 48

3.3.2 Tiêu chuẩn phân đoạn 50

3.3.2.1 Thuật toán lượng tử hoá ảnh màu 51

3.3.2.2 Tiêu chuẩn J 54

3.3.3 J-Image 58

3.3.4 Thuật toán phân hoạch không gian 62

3.3.4.1 Phát hiện các Valley 63

3.3.4.2 Phát triển các Valley 67

3.3.5 Kết quả thực nghiệm và nhận xét 69

3.4 Kết chương 72

KẾT LUẬN 73

TÀI LIỆU THAM KHẢO 74

Trang 3

MỞ ĐẦU

Ngày nay, công nghệ thông tin đã và đang đóng vai trò quan trọng trong đời sống kinh tế, xã hội của nhiều quốc gia trên thế giới, là một phần không thể thiếu trong một xã hội ngày càng hiện đại Các nhu cầu về thông tin ngày càng phức tạp

Nó không chỉ đơn thuần là các văn bản text như trước kia Ảnh cũng là một dạng thông tin rất phổ biến Người ta sử dụng ảnh để minh hoạ, để biểu diễn thông tin…

Nó đã trở thành công cụ không thể thiếu đối với các hình thức lưu trữ, biểu diễn thông tin Và từ đó thì nhu cầu xử lý các bức ảnh để phục vụ cho nhiều mục đích khác nhau đã dẫn đến việc hình thành một môn khoa học, có tên là: “Xử lý ảnh”

Nó cũng là một lĩnh vực đang được chú trọng, quan tâm

Xử lý ảnh bao gồm nhiều kỹ thuật như: thu nhận ảnh, nén dữ liệu ảnh, xử lý nâng cao chất lượng và khôi phục ảnh, phát hiện biên, phân vùng ảnh, nhận dạng ảnh… Trong các kỹ thuật trên thì phân vùng ảnh là bước khó nhất trong hệ thống

xử lý ảnh Nó là tiền đề quan trọng cho bước nhận dạng, là một kỹ thuật có rất nhiều ứng dụng Phân đoạn ảnh sẽ trợ giúp đắc lực cho quá trình nhận dạng tìm kiếm các ảnh để minh hoạ cho các bài báo, tìm kiếm các ảnh chụp về một đối tượng cho các mục đích khác nhau, giúp phát hiện ra các đối tượng chuyển động trong một cuốn film, hay đưa ra được tỷ lệ diện tích đất liền và biển trong một khu vực qua ảnh vệ tinh…

Người ta đã đưa ra một số phương pháp phân đoạn ảnh dựa vào ngưỡng biên

độ, dựa vào miền đồng nhất, dựa theo đường biên Trong đề tài này, em sẽ tìm hiểu

và cài đặt một số thuật toán phân đoạn ảnh dựa vào ngưỡng biên độ và miền đồng nhất:

1 Phân đoạn ảnh dựa vào ngưỡng cố định

2 Phân đoạn ảnh bằng thuật toán tam giác

3 Phân đoạn ảnh dựa trên giá trị J – thuật toán JSEG

Cấu trúc của báo cáo tốt nghiệp này như sau:

Trang 4

 Chương 1: Sơ lược về các kỹ thuật xử lý ảnh Chương này trình bày sơ lược

về các kỹ thuật xử lý ảnh Bao gồm các kỹ thuật sau: thu nhận ảnh, biểu diễn

ảnh, biến đổi và phân tích ảnh, nhận dạng ảnh, nén ảnh

 Chương 2: Một số kỹ thuật phân đoạn ảnh Chương này trình bày chi tiết về

một số kỹ thuật phân đoạn ảnh Kỹ thuật phân vùng ảnh dựa theo ngưỡng biên độ gồm kỹ thuật phân ngưỡng tự động và kỹ thuật phân ngưỡng cố định

Kỹ thuật phân vùng ảnh dựa theo miền đồng nhất gồm 3 phương pháp: phương pháp tách cây tứ phân, phương pháp phân vùng bởi hợp và phương pháp tổng hợp Và kỹ thuật phân vùng dựa theo đường biên thì gồm các bước phát hiện và làm nổi biên, làm mảnh biên, nhị phân hoá đường biên,

mô tả biên

 Chương 3: Cài đặt thử nghiệm một số thuật toán phân đoạn ảnh Chương

này mô tả chi tiết về ba thuật toán phân đoạn ảnh là: phân đoạn ảnh dựa theo ngưỡng cố định, phân đoạn ảnh theo thuật toán tam giác và phân đoạn ảnh

bằng thuật toán JSEG

Trang 5

Chương 1

SƠ LƯỢC VỀ XỬ LÝ ẢNH

Xử lý ảnh là một môn khoa học còn tương đối mới mẻ so với nhiều ngành khoa học khác Song cũng đã bắt đầu xuất hiện những máy tính chuyên dụng cho lĩnh vực này Người ta đã đưa ra cấu hình một hệ thống xử lý ảnh chuyên dụng gồm các giai đoạn sau:

Trước hết là quá trình thu nhận ảnh, ảnh có thể được thu nhận qua camera, qua bộ cảm ứng (sensor), hay trên máy quét (scanner) Tiếp theo là quá trình số hoá (digitalizer) để biến đổi tín hiệu tương tự sang tín hiệu rời rạc (lấy mẫu) và số hoá bằng lượng hoá, trước khi chuyển sang giai đoạn xử lý cần phân tích và lưu trữ lại Quá trình phân tích ảnh thực chất bao gồm nhiều công đoạn nhỏ Trước hết

là công việc tăng cường ảnh để nâng cao chất lượng Có thể do chất lượng thiết bị thu nhận ảnh, do nguồn sáng hay do nhiễu làm cho ảnh bị suy biến Do vậy, cần phải tăng cường và khôi phục lại ảnh để làm nổi bật một số đặc tính chính của ảnh, hay làm cho ảnh gần giống nhất với trạng thái gốc - trạng thái trước khi ảnh bị biến dạng Giai đoạn tiếp theo là phát hiện các đặc tính như biên, phân vùng ảnh, trích chọn các đặc trưng…

CAMERA

SENSOR

Thu nhận ảnh

Số hoá

Lưu trữ

Phân tích ảnh

Hệ Q Định

Lưu trữ

Nhận dạng

Hình 1.1 Các giai đoạn chính trong xử lý ảnh

Trang 6

Cuối cùng, tuy theo mục đích của ứng dụng, sẽ là giai đoạn nhận dạng, phân lớp hay các quyết định khác

1.1 Biểu diễn ảnh

Trong biểu diễn ảnh, người ta thường dùng các phần tử đặc trưng của ảnh là pixel Nhìn chung có thể xem một hàm 2 biến chứa các thông tin như biểu diễn của một ảnh Các mô hình biểu diễn ảnh cho ta một mô tả logic hay định lượng các tính chất của hàm này Trong biểu diễn ảnh cần chú ý đến tính trung thực của ảnh hoặc các tiêu chuẩn thông minh để đo chất lượng ảnh hoặc tính hiệu quả của các kỹ thuật

xử lý

Việc xử lý ảnh số yêu cầu phải được mẫu hoá và lượng tử hoá Thí dụ, một ảnh ma trận 512 dòng gồm khoảng 512x512 pixel Việc lượng tử hoá ảnh là chuyển đổi tín hiệu tương tự sang tín hiệu số (Analog Digital Convert) của một ảnh đã lấy mẫu sang một số hữu hạn mức xám

1.2 Tăng cường ảnh - Khôi phục ảnh

Tăng cường ảnh là bước quan trọng, tạo tiền đề cho xử lý ảnh Nó gồm một loạt các kỹ thuật như: bộ lọc tương phản, khử nhiễu, nổi màu…

Khôi phục ảnh là nhằm loại bỏ các suy giảm (degradation) trong ảnh Với một hệ thống tuyến tính, ảnh của một đối tượng có thể biểu diễn bởi:

,

Trong đó:

- (x,y) là hàm biểu diễn nhiễu cộng

- f(,) là hàm biểu diễn đối tượng

Hệ thống thu nhận ảnh

),( 

f

),(x y g

Nhiễu

) ,

; , (x y   h

ảnh đầu vào ) , ( 

ảnh đầu

ra ) , (x y

Hình 1.2 Ảnh bị biến dạng do nhiễu

Trang 7

- g(x,y) là ảnh thu nhận

- h(x,y;,) là hàm tán xạ điểm (Point spread Function - PSF)

Một vấn đề tiêu biểu là tìm một xấp xỉ của f(,) khi PSF của nó có thể đo lường hay quan sát được, ảnh mờ và các tính chất xác suất của quá trình nhiễu

1.3 Biến đổi ảnh

Thuật ngữ biến đổi ảnh thường dùng để nói tới một lớp các ma trận đơn vị và các kỹ thuật dùng để biến đổi ảnh Cũng như các tín hiệu một chiều được biểu diễn bởi một chuỗi các hàm cơ sở, ảnh cũng có thể được biểu diễn một chuỗi các ma trận

cơ sở gọi là ảnh cơ sở Phương trình ảnh cơ sở có dạng: T

l

k a

* kJ

A  với a k là cột thứ k của ma trận A, A là ma trận đơn vị Có nghĩa là AA*T I

Các *

kJ

A định nghĩa

ở trên với k,l = 0, 1, …, N-1 là ảnh cơ sở Có nhiều loại biến đổi được dùng như:

- Biến đổi Fourier, Sin, Cosin, Hadamard,…

- Tích Kronecker

- Biến đổi KL (Karhumen Loeve): biến đổi này có nguồn gốc từ khai triển của các quá trình ngẫu nhiên gọi là phương pháp trích chọn các thành phần chình

Do phải xử lý nhiều thông tin, các phép nhân và cộng trong khai triển là khá lớn Do vậy, các biến đổi trên nhằm làm việc xử lý ảnh được hiệu quả hơn

1.4 Phân tích ảnh

Phân tích ảnh liên quan đến việc xác định các độ đo định lượng của một ảnh

để đưa ra một mô tả đầy đủ về ảnh Các kỹ thuật được sử dụng ở đây nhằm mục đích xác định biên của ảnh Có nhiều kỹ thuật khác nhau như lọc vi phân hay dò theo quy hoạch động

Người ta cũng dùng các kỹ thuật để phân vùng ảnh Từ ảnh thu được, người

ta tiến hành kỹ thuật tách (split) hay hợp (fusion) dựa theo các tiêu chuẩn đánh giá như: màu sắc, cường độ,… Các phương pháp được biết đến như Quad-Tree, mảnh hoá biên, nhị phân hoá đường biên Cuối cùng, phải kể đến các kỹ thuật phân lớp dựa theo cấu trúc Đây là công việc vô cùng quan trọng và phức tạp Nó là tiền đề cho rất nhiều ứng dụng về ảnh Để hiểu rõ hơn về phân đoạn ảnh, một số kỹ thuật sẽ được trình kỹ ở chương 2 và cài đặt thử nghiệm ở chương 3

1.5 Nhận dạng ảnh

Trang 8

Nhận dạng ảnh là quá trình liên quan đến các mô tả đối tượng mà người ta muốn đặc tả nó Quá trình nhận dạng thường đi sau quá trình trích chọn các đặc tính chủ yếu của đối tượng Có hai kiểu mô tả đối tượng:

- Mô tả tham số (Nhận dạng theo tham số)

- Mô tả theo cấu trúc (Nhận dạng theo cấu trúc)

Trên thực tế, người ta đã áp dụng kỹ thuật nhận dạng khá thành công với nhiều đối tượng khác nhau như: nhận dạng ảnh vân tay, nhận dạng chữ (chữ cái, chữ số, chữ có dấu)

Nhận dạng chữ viết tay (với mức độ ràng buộc khác nhau về cách viết, kiểu chữ,…) phục vụ cho nhiều lĩnh vực

Ngoài hai kỹ thuật nhận dạng trên, hiện nay một kỹ thuật nhận dạng mới dựa vào kỹ thuật nhận dạng nơron đang được áp dụng và cho kết quả khả quan Một số khái niệm về mạng nơron cũng như một ứng dụng mạng nơron trong nhận dạng ký

tự đã được nghiên cứu đến

1.6 Nén ảnh

Dữ liệu ảnh cũng như các dữ liệu khác cần phải lưu trữ hay truyền đi trên mạng Như đã nói ở trên lượng thông tin phải truyền đi là rất lớn Ví dụ, một ảnh đen trắng cỡ 512x512 với 256 mức xám chiếm 256 K bytes Do đó, làm giảm lượng thông tin hay nén dữ liệu là một nhu cầu cần thiết Nhiều phương pháp nén dữ liệu khác được nghiên cứu và áp dụng cho loại dữ liệu đặc biệt này

Trang 9

Chương 2 MỘT SỐ KỸ THUẬT PHÂN ĐOẠN ẢNH

2.1 Sơ lược về phân đoạn ảnh

Phân tích ảnh là bước then chốt trong xử lý ảnh Nhiệm vụ của quá trình này

là từ các ảnh đã có, phân tích ảnh thành các thành phần có cùng tích chất nào đó hay

lấy ra “những đối tượng đáng quan tâm” hoặc những ảnh con để phục vụ cho

những bước tiếp theo của quá trình xử lý ảnh Quá trình phân đoạn chia tách đối tượng ra khỏi nền, lựa chọn các ảnh riêng lẻ từ một bộ sưu tập ảnh các đối tượng hoặc phân tách các đối tượng phủ lên nhau Quá trình phân đoạn là cơ sở cho các quá trình tiếp theo như đánh giá các tế bào và nhân trong mẫu cắt mô, nhận dạng chữ viết hoặc đánh giá các ảnh chụp từ không trung

Ta có thể xem xét quá trình phân đoạn ảnh như là quá trình phân loại điểm

ảnh khi ta phân biệt giữa điểm ảnh nền và điểm ảnh đối tượng, nhằm phân tích ảnh

thành các thành phần có cùng tính chất nào đó dựa theo biên hay các vùng liên thông Tiêu chuẩn để xác định các vùng liên thông có thể là cùng mức xám, cùng màu hay cùng độ nhám

Nếu phân vùng dựa trên các miền liên thông, ta gọi là kỹ thuật phân vùng dựa theo miền đồng nhất Nếu ta phân vùng dựa vào đường biên gọi là kỹ thuật phân vùng biên Ngoài ra, còn có kỹ thuật khác như phân vùng dựa vào ngưỡng biên độ, phân vùng theo kết cấu (texture segmentation)

Mục đích của phân tích ảnh là để có một miêu tả tổng hợp về nhiều phân tử khác nhau cấu tạo nên ảnh thô (brut image) Vì lượng thông tin chứa trong ảnh là rất lớn, trong khi đó đa số ứng dụng chỉ cần một số thông tin đặc trưng nào đó Do vậy, chúng ta cần có một quá trình để giảm lượng thông tin khổng lồ ấy Quá trình

Trang 10

này bao gồm phân vùng ảnh và trích chọn các đặc trưng chủ yếu Các kỹ thuật này

sẽ được đề cập dưới đây

2.2 Phân vùng ảnh dựa theo ngưỡng biên độ

Đặc tính đơn giản nhất và có thể hữu ích nhất của ảnh đó là biên độ của các tính chất vật lý của ảnh như: độ phản xạ, độ truyền sang, màu sắc hoặc đáp ứng đa phổ Thí dụ, trong ảnh X-quang, biên độ mức xám biểu diễn đặc tính bão hoà của các phần hấp thụ của cơ thể và làm cho ta có khả năng phân biệt xương với các phần mềm, tế bào lành với các tế bào bị nhiễm bệnh…

Như vậy, có thể dùng ngưỡng biên độ để phân vùng khi mà biên độ đủ lớn đặc trưng cho ảnh Thí dụ, biên độ trong bộ cảm biến ảnh hồng ngoại có thể phản ánh vùng nhiệt độ thấp hay vùng có nhiệt độ cao hơn Kỹ thuật phân ngưỡng theo biên độ rất có ích đối với ảnh nhị phân như văn bản in, đồ hoạ, ảnh màu hay ảnh X-quang

Trước hết cần đưa về ảnh nhị phân một cách đơn giản bằng một giá trị ngưỡng Các điểm ảnh ở trên một ngưỡng T sẽ là đối tượng còn dưới ngưỡng T sẽ

là những điểm nền Ta có một hàm biến đổi tổng quát :

1, ( , ) ( , )

Phương pháp ngưỡng vừa trình bày trên đây phân loại điểm ảnh dựa trên tính chất “giá trị xám” của các điểm đối tượng và các điểm nền Đặc điểm của vùng lân cận điểm ảnh không được quan tâm đến Khi quyết định xem một điểm ảnh nào đấy

có thuộc về đối tượng hay không phương pháp này chỉ hướng theo giá trị xám của một điểm ảnh Một kết quả như ý đòi hỏi có một ngưỡng tối ưu được xác định, ngưỡng này có thể dễ dàng tìm được ở nhiều ứng dụng

Một số phương pháp được sử dụng để tìm Đơn giản nhất là dùng ngưỡng cố định khi ảnh có độ sáng tối rõ ràng Nhưng để tìm ngưỡng một cách tối ưu hơn với

Trang 11

những ảnh không có độ sáng tối rõ ràng như vậy thì có thể dùng đến các phương pháp tìm ngưỡng tự động

Đây là một thuật toán tương đối đơn giản Ý tưởng chính của thuật toán chỉ

là phân ngưỡng ảnh bằng giá trị xám cố định độc lập với dữ liệu ảnh và chi tiết về thuật toán được trình bày chi tiết ở mục 3.1 thuộc chương 3

2.2.2 Ngưỡng tự động

Việc chọn ngưỡng trong kỹ thuật này là bước rất quan trọng Với những ảnh

mà độ tương phản màu sắc không cao, nếu áp dụng phân ngưỡng cố định thì kết quả phân đoạn ảnh sẽ không tốt Khi đó, có thể áp dụng một số phương pháp phân ngưỡng tự động Người ta thường tiến hành theo các bước chung sau:

- Xem xét lược đồ xám của ảnh để xác định các đỉnh và các khe Nếu ảnh

có dạng rắn lượn (nhiều đỉnh và khe) các khe có thể sử dụng để chọn ngưỡng

- Chọn ngưỡng t sao cho một phần xác định trước của toàn bộ số mẫu là thấp hơn t

Hình 2.1.a:

Ảnh gốc

Hình 2.1.b: Histogram điểm đánh dấu tại ngưỡng T = 128

Hình2.1.c: Ảnh nhị phân với ngưỡng T=128

Trang 12

- Điều chỉnh ngưỡng dựa trên xem xét lược đồ xám của các điểm lân cận

- Chọn ngưỡng như xem xét lược đồ xám của những điểm thoả mãn tiêu chuẩn chọn Thí dụ, với ảnh có độ tương phản thấp, lược đồ của những điểm có biên độ Laplace g(m,n) lớn hơn giá trị t định trước (sao cho từ 5% đến 10% số điểm ảnh với gradient lớn nhất sẽ coi như biên) sẽ cho phép xác định các đặc tính ảnh lưỡng cực tốt hơn ảnh gốc

- Khi có một mô hình phân lớp xác suất, việc xác định ngưỡng dựa vào tiêu chuẩn nhằm cực tiểu xác suất của sai số hoặc một số tính chất khác theo luật Bayes

Trong hầu hết các trường hợp, ngưỡng được chọn từ lược đồ độ sáng của vùng hay ảnh cần phân đoạn Có rất nhiều kỹ thuật chọn ngưỡng tự động xuất phát

từ lược đồ xám đã được đưa ra Trong đó có thuật toán tam giác được trình bày chi tiết trong mục 3.2 ở chương 3

2.3 Phân vùng theo miền đồng nhất

Kỹ thuật phân đoạn ảnh thành các miền đồng nhất dựa vào các tính chất quan trọng nào đó của miền Việc lựa chọn các tính chất của miền sẽ xác định các tiêu chuẩn phân vùng Ở đây cũng cần phải xác định rõ tính đồng nhất của một miền của ảnh Vì đó là điểm chủ yếu xác định tính hiệu quả của việc phân vùng Các tiêu chuẩn hay được dùng là sự thuần nhất về mức xám, kết cấu sợi và chuyển động Thí dụ, với ảnh hàng không, việc phân vùng theo màu cho phép phân biệt thảm thực vật: cánh đồng màu xanh hay mày vàng, rừng xanh thẫm, đường màu xám, mái nhà màu đỏ…

Đối với ảnh chuyển động, người ta tiến hành trừ 2 ảnh quan sát được tại 2 thời điểm khác nhau Trong trường hợp này, phần ảnh không thay đổi sẽ nhận giá trị không, những phần thay đổi sẽ nhận giá trị dương hay âm tương ứng với thay đổi hay dịch chuyển Như vậy, việc trừ ảnh thực ra là một xấp xỉ của đạo hàm theo thời

gian của ảnh Thực vậy, giả sử I(t) và I(t) là 2 ảnh quan sát ở thời điểm t và

Trang 13

Với cách tính này ta có thể biết được vận tốc dịch chuyển của ảnh

Cũng nhờ kỹ thuật trừ ảnh ta có thể xác định đựơc sự xuất hiện của các đối tượng mới (tín hiệu dương) hay sự biến mất của các đối tượng trong ảnh trước (tín hiệu âm)

Tính kết cấu là đặc tính rất quan trọng trong phân vùng ảnh Nhờ nó, ta có thể phân biệt thảm cỏ với một mặt nhuộm màu xanh lá cây Tính kết cấu đặc trưng cho kiểu dạng xuất hiện lặp trên bề mặt nào đó của đối tượng Có 2 kiểu lặp: lặp có tính chu kỳ và lặp ngẫu nhiên Lặp ngẫu nhiên thường gặp trong tự nhiên như cát, thảm cỏ; còn lặp có tính chu kỳ là lặp nhân tạo

Người ta có thể dùng logic vị từ để làm tiêu chuẩn đánh giá phân đoạn Giả

sử ảnh X phải phân thành n vùng khác nhau: Z1, Z2, , Zn và lôgic vị từ có dạng P(Z) Việc phân vùng phải thoả mãn các tính chất sau:

Z

P

n i

True Z

P

j i Z

Z

n i

Z X

j i

i

j i

n

i

i

; )

(

, , 2 , 1

; )

(

;

, , 2 , 1

; 1

Với ảnh màu, véc tơ đặc tính X có thể là thành phần ba màu R, G, B và

IR(k,l), IG(k,l), IB(k, l) là các thành phần tương ứng Lúc đó luật phân ngưỡng có dạng:

Trang 14

- Phương pháp hợp (merge)

- Phương pháp tách - hợp ( split – merge)

Mức độ hiệu quả của các phương pháp là phụ thuộc vào việc lựa chọn tiêu chuẩn đánh giá độ thuần nhất Trên thực tế người ta hay sử dụng trung bình số học,

và độ lệch chuẩn i cho vùng Zi có n điểm:

Z l k

n

m

) , (

) , (

i

n( , )

2 ) ) ( ( 1

Hai vùng Zi và Zj có thể hợp nhất nếu | mi-mj | < ki

2.3.1 Phương pháp tách cây tứ phân

Về nguyên tắc, phương pháp này kiểm tra tính hợp thức của tiêu chuẩn đồng nhất một cách tổng thể trên miền lớn Nếu tiêu chuẩn được thoả mãn, việc phân đoạn coi như kết thúc Trong trường hợp ngược lại ta chia miền đang xét thành 4 miền nhỏ hơn, ta lại áp dụng đệ quy bằng phương pháp trên cho mỗi miền nhỏ hơn cho đến khi tất cả các miền đều thoả mãn Phương pháp này có thể mô tả bằng thuật toán sau (và cần lưu ý rằng tham số là miền đang xét):

Procedure PhanDoan(Mien)

Begin

If miền đang xét không thoả Then

Begin

Chia miền đang xét thành 4 miền: Z1, Z2, Z3, Z4

For i=1 to 4 Do PhanDoan(Zi)

Trang 15

 tiêu chuẩn để miền đang xét là đồng nhất có thể là:

/* Giả sử là ảnh có tối đa 255 mức xám

(N1,M1), (N2, M2) là toạ độ điểm đầu và điểm cuối của miền, T là ngưỡng */

Begin

1 Max = 0; Min = 255;

2 For i = N1 to N2 do

For j = N1 to N2 do

If I(i,j) < Min Then Min = I(i,j);

If I(i,j) >Max Then Max = I(i,j);

3 If ABS(max - min) < T Then Examin_Criteria = 0

Else Examin_Criteria = 1;

End

Nếu hàm trả về giá trị 0, có nghĩa vùng đang xét là đồng nhất, trường hợp ngược lại nghĩa là mức không đồng nhất Trong giải thuật trên, khi miền là đồng nhất cần tính lại giá trị trung bình và cập nhật lại ảnh đầu ra Giá trị trung bình được tính bởi:

Trang 16

Hình dưới đây mô tả một ví dụ về phương pháp phân vùng bởi tách:

a Ảnh gốc

b Phân mức 1

Trang 17

c Phân mức 2

d Phân mức 3 Hình 2.2: Phân vùng bởi tách

Một vùng thoả mãn tiêu chuẩn tạo nên một nút lá, nếu không sẽ tạo nên một nút trong và 4 nút con tương ứng của việc chia làm 4 vùng Mỗi nút lá của cây biểu diễn một vùng đã phân chia theo tiêu chuẩn Cứ tiếp tục như vậy cho đến khi phân

Trang 18

xong Các nút lá của cây biểu diễn số vùng đã phân theo tiêu chuẩn (như trên hình

2.3)

Tiêu chuẩn phân vùng ở đây là màu sắc Nếu mọi điểm của vùng là màu trắng sẽ tạo nên một nút lá trắng và tương tự như vậy với nút lá đen Nút màu ghi có nghĩa là vùng không thuần nhất và phải tiếp tục chia

2.3.2 Phương pháp cục bộ hay phân vùng bởi hợp

Ý tưởng của phương pháp này là xem xét ảnh từ các miền nhỏ nhất rồi hợp chúng lại nếu thoả mãn tiêu chuẩn để được một miền đồng nhất lớn hơn Ta lại tiếp tục với miền thu được cho đến khi không thể hợp được nữa Số miền còn lại cho ta kết quả phân đoạn ảnh Miền nhỏ nhất của bước xuất phát là điểm ảnh

Trang 19

Phương pháp này hoàn toàn ngược với phương pháp tách Song điều quan trọng ở đây là nguyên lý hợp 2 vùng Việc hợp hai vùng được thực hiện theo nguyên tắc sau:

- Hai vùng phải đáp ứng tiêu chuẩn, như cùng màu hay cùng mức xám

- Chúng phải kế cận nhau

Chúng ta nên làm rõ khái niệm kế cận Trong xử lý ảnh người ta dùng khái niệm liên thông để xác định kế cận Có hai khái niệm liên thông là 4 liên thông và 8 liên thông Với 4 liên thông một điểm ảnh I (x,y) sẽ có 4 kế cận theo hướng x, y Trong khi đó, với 8 liên thông, điểm ảnh I(x, y) sẽ có 4 liên thông theo hai hướng x

và y và 4 liên thông khác theo hướng chéo 0

45 Hình trên cho ta khái niệm về 4 và

8 liên thông

Dựa theo nguyên lý của phương pháp hợp, ta có 2 thuật toán:

- Thuật toán tô màu (Blog coloring)

- Thuật toán đệ quy cục bộ

2.3.2.1 Thuật toán tô màu

Thuật toán này sử dụng khái niệm 4 liên thông Người ta dùng một cửa sổ di chuyển trên ảnh để sánh với tiêu chuẩn hợp Thuật toán có thể tóm tắt như sau:

For mỗi điểm I(x,y) do

/*Kiểm tra màu của các lân cận*/

Begin

b/ 8 liên thông Hình 2.4 Khái niệm 4 và 8 liên thông a/ 4 liên thông

Trang 20

If Criteria(x,y)=Criteria(x-1,y) Then M(x,y)=M(x-1,y) Else

If Criteria(x,y)=Criteria(x,y-1) Then M(x,y)=M(x,y-1) Else

M(x,y)=NewM;

End

/*Hợp lại nếu các lân cận cùng màu*/

If (Criteria(x,y)=Criteria(x-1,y)) and (Criteria(x,y)=Criteria(x,y-1))

Then

Merge 2 phân vùng bằng cách để màu giống nhau

Trong thuật toán trên, chỉ tiêu hợp là màu đồng nhất Thực tế chứng tỏ rằng thuật toán này tỏ ra khá hiệu quả khi dùng camera một hàng vì có thể phân đoạn theo từng hàng

2.3.2.2 Thuật toán đệ quy cục bộ

Thuật toán này sử dụng phương pháp tìm kiếm trong một cây để làm tăng kích thước vùng Trước tiên, người ta tìm kiếm các lân cận để tăng kích thước tối đa của vùng rồi sau đó mới quan tâm đến các vùng khác và cũng áp dụng thuật toán

trên Thuật toán này sử dụng một thủ tục đệ quy GiaTang để thực hiện việc tăng

kích thước một vùng Thuật toán được mô tả như sau:

Save(I(x,y)) GiaTang(x,y) NSeg <= NSeg+1 End

End

b) Thủ tục GiaTang

Trang 21

I(x,y)<=0 /*Đặt I(x,y) là 0 để không phải xét lại*/

For mọi điểm kế cận của I(x,y) do

Chính vì nhược điểm này mà ta nghĩ đến cách phối hợp cả 2 phương pháp Trước tiên, dùng phương pháp tách để tạo nên cây tứ phân, phân đoạn theo hướng

từ gốc đến lá Tiếp theo, tiến hành duyệt cây theo chiều ngược lại và hợp các vùng

có cùng tiêu chuẩn Với phương pháp này ta thu được miêu tả cấu trúc của ảnh với các miền liên thông có kích thước tối đa

Giải thuật tách hợp gồm một số bước chính sau:

1 Kiểm tra tiêu chuẩn đồng nhất

a) Nếu không thoả và số điểm trong vùng lớn hơn một điểm, tách làm

4 vùng (trên, dưới, trái, phải) bằng cách gọi đệ quy Nếu kết quả tách xong và không tách được nữa chuyển sang bước 2

b) Nếu tiêu chuẩn đồng nhất là thoả thì tiến hành hợp vùng và cập nhật giá trị trung bình cho vùng

2 Hợp vùng

Cần kiểm tra 4 lân cận đã nêu trên Có thể có nhiều vùng thoả mãn khi đó ta chọn vùng tối ưu rồi tiến hành hợp

Trang 22

Phương pháp này thu được kết quả số vùng là nhỏ hơn phương pháp tách

Hình 2.5: 4 lân cận của điểm hiện thời

Với ví dụ trong hình 2.2, áp dụng phương pháp tách hợp ta thu được một cây chỉ có 2 phân vùng hay nói cách khác là phân đoạn ảnh thành 2 miền đồng nhất Rõ ràng là phương pháp này đạt hiệu quả tốt hơn so với phương pháp tách

Hình 2.6: Cây thu được theo phương pháp tách hợp

2.4 Phân vùng dựa theo đường biên

Biên là một trong những đặc trưng quan trọng của ảnh Cũng vì thế mà trong nhiều ứng dụng, người ta sử dụng cách phân đoạn theo biên Việc phân đoạn ảnh dựa vào biên được tiến hành qua một số bước:

- Phát hiện biên và làm nổi biên

- Làm mảnh biên

- Nhị phân hoá đường biên

- Miêu tả đường biên

Trang 23

2.4.1 Phát hiện biên và làm nổi biên

Biên là một vấn đề chủ yếu trong phân tích ảnh vì các kỹ thuật phân đoạn ảnh chủ yếu dựa vào biên Một điểm ảnh có thể coi là biên nếu ở đó có sự thay đổi đột ngột về mức xám Tập hợp các điểm biên tạo thành biên hay đường bao của ảnh (boundary) Thí dụ, trong một ảnh nhị phân, một điểm ảnh có thể coi là biên nếu nó

là điểm đen và có ít nhất một điểm trắng lân cận

Ta xét ví dụ sau để thấy được tầm quan trọng của biên Khi người hoạ sĩ vẽ một cái bàn gỗ, chỉ cần vài nét phác thảo về hình dáng như mặt bàn, chân bàn mà không cần thêm các chi tiết khác, người xem đã có thể nhận ra đó là cái bàn Nếu ứng dụng của ta là phân lớp nhận diện đối tượng, thì coi như nhiệm vụ đã hoàn thành Tuy nhiên, nếu đòi hỏi thêm về các chi tiết như vân gỗ hay màu sắc… thì với chừng ấy thông tin là chưa đủ

Về toán học, người ta coi điểm biên của ảnh là điểm có sự biến đổi đột ngột

về độ xám, như trong hình 2.7 dưới đây:

Phát hiện biên một cách lý tưởng là xác định được tất cả các đường bao trong các đối tượng Định nghĩa toán học của biên ở trên là cơ sở cho các kỹ thuật phát hiện biên Điểm quan trọng là biến thiên giữa các điểm ảnh thường là nhỏ, trong khi

đó biến thiên độ sáng của điểm biên (khi qua biên) lại khá lớn

Xuất phát từ cơ sở này, người ta thường sử dụng hai phương pháp phát hiện biên như sau:

 Phương pháp phát hiện biên trực tiếp: Phương pháp này nhằm làm nổi biên dựa vào sự biến thiên về giá trị độ sáng của điểm ảnh Kỹ thuật chủ yếu dùng phát hiện biên ở đây là kỹ thuật đạo hàm Nếu lấy đạo hàm bậc nhất của ảnh ta có phương pháp Gradient Nếu lấy đạo hàm bậc hai của ảnh ta có kỹ thuật Laplace

 Phương pháp phát hiện biên gián tiếp: Nếu bằng cách nào đấy ta phân được ảnh thành các vùng thì đường phân ranh giữa các vùng đó chính là biên Việc phân vùng ảnh thường dựa vào kết cấu texture của ảnh hoặc dựa vào một số yếu tố khác

Trang 24

Cũng cần chú ý rằng kỹ thuật dò biên và phân vùng ảnh là hai bài toán đối ngẫu của nhau Thực vậy, dò biên để thực hiện phân lớp đối tượng và một khi đã phân lớp xong có nghĩa là đã phân vùng được ảnh Và ngược lại, Khi đã phân vùng, ảnh đã phân lập được thành các đối tượng, ta có thể phát hiện được biên Phương pháp dò biên trực tiếp tỏ ra khá hiệu quả vì ít khi chịu ảnh hưởng của nhiễu Song nếu sự biến thiên độ sáng không đột ngột Phương pháp này lại tỏ ra kém hiệu quả Phương pháp dò biên gián tiếp tuy khó cài đặt, song lại áp dụng khá tốt khi sự biến thiên độ sáng nhỏ

c) Đường bao thực

Mức xám

x

Hình 2.7: Đường biên của ảnh

b) Đường biên bậc thang

Mức xám

a) Đường biên lý tưởng

Mức xám

Trang 25

Có một số phương pháp phát hiện biên hay được sử dụng như: phương pháp Gradient, kỹ thuật Laplace

2.4.1.1 Phương pháp Gradient

Phương pháp Gradient là phương pháp dò biên cục bộ dựa vào cực đại của đạo hàm Gradient là một véctơ có các thành phần biểu thị tốc độ thay đổi giá trị của điểm ảnh theo hai hướng x và y Các thành phần của gradient được tính bởi:

dy

y x f dy y x f f y

,

(

) , ( ) , ( )

Với một ảnh liên tục f(x,y), các đạo hàm riêng của nó cho phép xác định vị trí cực đại cục bộ theo hướng của biên Thực vậy, một ảnh liên tục được biểu diễn bởi một hàm f(x,y) dọc theo r với góc  được định nghĩa bởi:

dy y

f dr

dx x

f dr

đối với  đạt cực đại khi(df / d )(df / dr)=0 hay f xcosf ysin 0

Do vậy, ta có thể xác định hướng cực đại của nó:  r tan 1fy fx và

2 2

dr

df

 Ta gọi  r là hướng của biên

Đạo hàm của ảnh là không tồn tại vì f(x,y) không liên tục Ở đây, ta chỉ sử dụng mô phỏng theo ý nghĩa của đạo hàm, việc tính toán là xấp xỉ đạo hàm bằng kỹ thuật nhân chập Trong phương pháp gradient, người ta chia nhỏ thành hai kỹ thuật (do sử dụng hai toán tử khác nhau):

- Kỹ thuật gradient dùng toán tử gradient, lấy đạo hàm theo một hướng

- Kỹ thuật la bàn dùng toán tử la bàn, lấy đạo hàm theo tám hướng: Bắc, Nam, Đông, Tây, và Đông Bắc, Tây Bắc, Đông Nam, Tây Nam

Trang 26

a) Kỹ thuật Gradient:

Kỹ thuật gradient sử dụng một cặp mặt nạ H1, H2 trực giao (theo hai hướng vuông góc Ta có thể định nghĩa:

g1 là gradient theo hướng x

g2 là gradient theo hướng y

 Biên độ của gradient tại điểm (m,n) ký hiệu là g(m,n) được tính theo công thức:

) , ( ) , ( )

, (m n A0 g12 m n g22 m n

 Và góc là:

) ) , (

) , ( ( tan ) , (

1

2 1

n m g

n m g n

) , ( ) , 1 (

y x I y x I

g

y x I y x I

1 0 1

0 1 2

H

Trong trường hợp tổng quát, người ta dùng các công thức (2.11) và (2.12) để tính Gradient biên độ g và Gradient hướng  r Nhưng để giảm bớt thời gian tính toán, người ta có thể dùng các chuẩn sau:

) , ( ) ,

1

Trang 27

1 0 1

1 0 1 1

0 0 0

1 1 1 2

2 0 2

1 0 1 1

0 0 0

1 2 1 2

2 0 2

1 0 1 1

0 0 0

1 2 1 2

H

Gradient được xấp xỉ bởi công thức: G xH xIG yH yI (2.16)

Thực tế cho thấy rằng Sobel và prewitt tốt hơn so với Robert bởi chúng ít nhạy cảm với nhiễu Ta cũng thấy rằng, việc lấy đạo hàm một tín hiệu có xu hướng làm tăng nhiễu trong tin hiệu đó Độ nhạy cảm này có thể làm giảm xuống nhờ thao tác lấy trung bình cục bộ trong miền phủ bởi mặt lạ

Trang 28

Lưu ý rằng, các chuẩn trong công thức (2.14) và (2.15) tạo nên sự vặn xoắn trong tính toán biên độ Thực vậy, nếu g x hoặc g y bằng 0 thì A1  A2  A0 Còn nếu: g  x g y ta sẽ có A1 g x,A2 g yA0  2g x Phương pháp Robert và Sobel dùng chuẩn A1 Nguyên nhân của sự vặn xoắn là khá đơn giản: các mặt lạ của các toán tử tạo nên một xấp xỉ rời rạc của đạo hàm thực và các chuẩn áp dụng để tính biên độ lại phụ thuộc vào giá trị của các Gradient thành phần

Với mục đích nghiên cứu các mặt lạ cho kết quả tốt hơn, người ta nghĩ đến việc xét lân cận theo 8 hướng Đó chính là phương pháp Kirsh, còn gọi là toán tử Kirsh hay toán tử la bàn Toán tử này được trình bày dưới đây

b) Toán tử la bàn (Kirsh):

Toán tử la bàn đo gradient theo tám hướng lần lượt ngược chiều kim đồng

hồ Đó là các hướng: k = /2 + k2, với k = 0, 1, 2, ., 7 cách nhau 0

45 ; với gradient tương ứng là g k

Có nhiều toán tử la bàn khác nhau Ở đây, ta chỉ nêu chi tiết một toán tử, đó

là toán tử Kirsh, sử dụng mặt nạ 3x3 Mặt nạ H k ứng với hướng  k với k = 0, 1, 2, , 7 H1 cho hướng gốc 0, trên cơ sở đó H2 đến H8 cho 7 hướng còn lại:

0 0 0 0 0

0

0

315,270,225,180

3 0 3

5 5 5 1

5 0 3

5 5 3 2

5 0 3

5 3 3 3

5 0 3

3 3 3 4

3 0 3

3 3 3 5

3 0 5

3 3 3 6

3 0 5

3 3 5 7

3 0 5

3 5 5 8

H

Nếu ký hiệu A i, i 1,2,3 8 là Gradient thu được theo 8 hướng bởi 8 mặt nạ, thì biên độ Gradient tại (x,y) sẽ được tính theo công thức sau:

Trang 29

1 2 1

1 1 1 1

H

Để đơn giản tính toán thì chỉ tính với 4 hướng 0 0 0 0

135 , 90 , 45 ,

sử dụng đạo hàm bậc hai, toán tử Laplace được định nghĩa như sau:

2 2 2

2 2

dy

f dx

f

f  

Người ta cũng dùng nhiều kiểu mặt nạ khác nhau cho toán tử Laplace để xấp

xỉ rời rạc đạo hàm cấp 2 Dưới đây là ba kiểu mặt nạ hay dùng:

1 4 1

0 1 0 1

1 8 1

1 1 1 2

2 5 2

1 2 1 3

H

Với mặt nạ H1, đôi khi người ta dùng phần tử tâm là 8 thay vì 4

Trong kỹ thuật Laplace, điểm biên được xác định bởi điểm cắt điểm không Điểm không là duy nhất, do đó đường biên thu được là đường biên mảnh (có độ rộng 1 pixel) Một điểm nữa là: do đạo hàm bậc hai thường không ổn định nên kỹ thuật Laplace rất nhạy cảm với nhiễu

Trang 30

2.4.2 Làm mảnh biên

Làm mảnh biên thực chất là việc làm nổi biên với độ rộng chỉ 1 pixel Kỹ thuật Laplace dùng trong việc phát hiện biên cho kết quả trực tiếp biên ảnh với độ rộng 1 pixel Song với nhiều kỹ thuật thì khác, sau quá trình phát hiện, biên thu được với độ rộng lớn hơn 1 pixel Khi đó, ta cần có một quá trình làm mảnh biên ảnh

Khi thực hiện đạo hàm một ảnh, ta thu được những điểm cực trị cục bộ Theo

kỹ thuật Gradient, những điểm cực trị cục bộ có thể coi như biên Do vậy cần tách biệt những điểm cực trị đó để xác định chính xác biên ảnh và để giảm độ rộng biên

ảnh Một trong những phương pháp hay dùng đó là phương pháp “Loại bỏ các điểm

không cực đại”

Giả sử ảnh I(x,y) gồm Gradient hướng và Gradient biên độ (còn gọi là bản đồ biên độ và bản đồ hướng) Với mỗi điểm ảnh I(x,y), ta xác định các điểm lân cận

của nó theo hướng Gradient Gọi các điểm đó là I(x1,y1) và I(x2,y2)

Nếu I(x,y) lớn hơn cả I(x1,y1) và I(x2,y2), giá trị của I(x,y) sẽ được bảo

toàn Nếu không nó sẽ được đạt là 0 và coi như bị loại bỏ Thuật toán này được sử dụng trong phương pháp Canny

Ngoài thuật toán kể trên còn nhiều kỹ thuật làm mảnh biên để xác định khung của đối tượng (ảnh hay ký tự) như kỹ thuật mảnh biên chữ do Sherman đề xuất Sau đó được Fraser cải tiến cho ảnh nhị phân Kỹ thuật này được tóm tắt như sau:

Trang 31

- Nó là điểm đen duy nhất kết nối với hai điểm đen không kề nhau

- Nó là điểm đen có duy nhất một lân cận cũng là điểm đen ngoại trừ không tồn tại một chuyển đổi nào tại phần tử trước nó

Cụ thể là điểm đó phải đồng thời thoả mãn các điều kiện sau:

*

*

1 ) (

0

6 ) ( 2

2 8

4 2

1

1

P hayZ P

(2.19)

Với :

Z0(P1) là số phần tử 0 chuyển sang phần tử khác 0 trong tập có thứ tự

1 8 4

2,P ,P,P

P

NZ(P1) số hàng xóm (lân cận) khác 0 của P1

Hình 2.9: Làm mảnh biên

2.4.3 Nhị phân hoá đường biên

Nhị phân hóa đường biên là giai đoạn then chốt trong quá trình trích chọn vì

nó xác định đường bao nào thực sự cần và đường bao nào có thể loại bỏ Nói chung, người ta thường nhị phân hóa đường biên theo cách thức làm giảm nhiễu hoặc tránh hiện tượng kéo sợi trên ảnh Điều này cũng giải thích tại sao phân đoạn dựa theo biên có hiệu quả khi ảnh có độ tương phản tốt Trong trường hợp ngược lại, có thể

sẽ bị mất một phần đường bao hay đường bao có chân, không khép kín, …, do đó sẽ bất lợi cho biểu diễn sau này Một phương pháp hay được dùng là chọn ngưỡng thích nghi Với cách chọn này, ngưỡng sẽ phụ thuộc vào hướng của gradient nhằm

Trang 32

làm giảm sự xoắn của biên Lúc đầu, người ta định ra một ngưỡng nào đó và sau đó

sử dụng một hệ số sinh thích nghi thông qua lời giải toán tử đạo hàm theo hướng tìm được để tinh chỉnh

2.4.4 Miêu tả đường biên

Khi đã có bản đồ biên ảnh, ta cần phải biểu diễn nó dưới dạng thích hợp phục vụ cho việc phân tích và làm giảm lượng thông tin dùng để miêu tả đối tượng Nguyên tắc chủ yếu là tách biệt mỗi biên và gán cho mỗi biên một mã Bắt đầu từ thời điểm này, chúng ta không quan tâm tới cách biểu diễn quen thuộc của ảnh bởi

ma trận số mà ta quan tâm đến cách miêu tả bởi một cấu trúc thích hợp và cô đọng

Có nhiều phương án mô tả đường biên khác nhau, mỗi phương án có liên quan mật thiết tới đặc thù của từng ứng dụng Việc tách biệt đường bao có thể được tăng cường thêm các điều kiện nhằm loại bỏ các đường bao không khép kín hoặc khép kín nhờ phương pháp ngoại suy, hay bỏ đi các chân rết bám theo các đường bao kín

Việc mã hóa đường bao có thể thực hiện theo nhiều cách khác nhau Có thể biểu diễn chính xác đường bao hay xấp xỉ nhờ nội suy Một số cấu trúc cơ sở mã hóa đường bao thường dùng là: điểm, đoạn thẳng, cung và đường cong

Nên lưu ý là luôn có xung đột giữa độ phức tạp tính toán và khả năng biểu diễn ảnh của cách mã hoá thông tin Biểu diễn đường bao bởi các điểm nói chung không phức tạp song lại rất nghèo nàn về cấu trúc và không cô đọng (vì có bao nhiêu điểm tạo nên biên thì phải mô tả bấy nhiêu) Trong khi đó, biểu diễn bằng đường cong đa thức bậc cao lại làm tăng độ phức tạp tính toán, song bù lại cấu trúc

dữ liệu lại rất cô đọng

Hình dưới đây mô tả các đường biên sau khi loại bỏ các đường bao hở, các chân rết và khép kín các đường bao nhờ ngoại suy:

Trang 33

a Loại bỏ các đường bao hở

b Khép kín nhờ ngoại suy

c Loại bỏ các chân rết Hình 2.10: Làm rõ biên

Một số phương pháp mã hóa đường bao hay dùng như: mã hóa theo tọa độ

đề các, mã hóa Freeman, xấp xỉ bởi đoạn thẳng sẽ được trình bày chi tiết dưới đây

Trang 34

2.4.4.1 Mã hoá theo toạ độ đề các

Kiểu mã hoá này khá đơn giản Đường bao của ảnh được biểu diễn bởi một danh sách các điểm ảnh tạo nên đường bao Gọi C là đường bao của ảnh và C(i,j) là các điểm Rõ ràng, cách mã hoá này bộc lộ nhược điểm là không giảm được lượng thông tin Tuy nhiên, việc tính toán lại khá nhanh và có thể cung cấp những phương tiện phục vụ cho việc trích chọn các đặc trưng hình học của ảnh Dưới đây sẽ trình bày chi tiết

Việc mã hoá được thực hiện theo phương pháp “Đi theo đường bao”

(Contour Following), sử dụng kỹ thuật tìm kiếm thông tin theo chiều sâu trên cây Nếu áp dụng một cách đơn giản kỹ thuật này, có thể ta sẽ thu được đường bao thô theo nghĩa có điểm có thể xuất hiện hai lần Người ta thường phối hợp với việc kiểm tra 8 liên thông để làm mịn biên

Hình dưới đây cho ta danh sách các điểm ảnh trên đường bao được duyệt theo thứ tự từ 1 đến 35:

Trang 35

Thuật toán Contour Following có xem xét 8 liên thông có thể mô tả như sau:

For mỗi điểm I(x,y) do

Thuật toán ContFoll được mô tả như dưới đây:

Function ContFoll(Pic, Depth)

e) Repeat

For mỗi pixel trong Stack do

KQ <= CountFoll(I,depth+1) Until KQ=OK or Stack empty End

End

2.4.4.2 Mã hoá Freeman

Phương pháp mã hoá này cũng là một cách biểu diễn chính xác các điểm đường bao bằng việc sử dụng vị trí tương đối của điểm trên đường bao với điểm trước Nguyên tắc của việc mã hoá này thể hiện trên hình 2.12a Người ta dùng một mặt lạ để xác định mã của mỗi điểm trong 8 liên thông so với điểm ở tâm Từ một điểm đã cho trên đường bao, người ta mã hoá đường bao bằng cách đi theo nó (hình

Trang 36

2.12b.) Tuy nhiên, người ta thích mã hoá theo góc giữa các cung (hình 2.12c.) Hình 2.12d mô tả việc mã hoá theo góc

Ngày đăng: 02/08/2016, 22:02

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1]. Phạm Hữu Khang, “Kỹ thuật lập trình ứng dụng C#.Net toàn tập”, NXB Lao động – Xã hội Sách, tạp chí
Tiêu đề: Kỹ thuật lập trình ứng dụng C#.Net toàn tập”
Nhà XB: NXB Lao động – Xã hội
[2]. Charles Petzold, “Programming Microsoft Windows with C#” Sách, tạp chí
Tiêu đề: “Programming Microsoft Windows with C#
[3]. Lương Mạnh Bá - Nguyễn Thanh Thuỷ, 1999, “Nhập môn xử lý ảnh số”, NXB Khoa học kỹ thuật, Hà Nội Sách, tạp chí
Tiêu đề: Nhập môn xử lý ảnh số
Nhà XB: NXB Khoa học kỹ thuật
[4]. Dương Anh Đức - Vũ Hải Quân - Lê Đình Duy, 2005, “Giáo trình đồ hoạ máy tính”, NXB Đại học Quốc Gia TP Hồ Chí Minh Sách, tạp chí
Tiêu đề: Giáo trình đồ hoạ máy tính
Nhà XB: NXB Đại học Quốc Gia TP Hồ Chí Minh
[5]. Yining Deng, B. S. Manjunath and Hyundoo Shin, “Color Image Segmentation”, Department of Electrical and Computer Engineering University of California, Santa Barbara Sách, tạp chí
Tiêu đề: Color Image Segmentation
[6]. Dan S. Bloomberg, “Color quantization using octrees”, Leptonica Sách, tạp chí
Tiêu đề: Color quantization using octrees
[7]. Y. Deng, C. Kenney, M.S. Moore, and B.S. Manjunath, 1999, “Peer group filtering and perceptual color image quantization”, to appear in Proc. of ISCAS Sách, tạp chí
Tiêu đề: Peer group filtering and perceptual color image quantization"”, to appear in

HÌNH ẢNH LIÊN QUAN

Hình dưới đây mô tả một ví dụ về phương pháp phân vùng bởi tách: - TÌM HIỂU một số PHƯƠNG PHÁP PHÂN ĐỌAN ẢNH và KHẢ NĂNG ỨNG DỤNG
Hình d ưới đây mô tả một ví dụ về phương pháp phân vùng bởi tách: (Trang 16)
Hình 2.3: Cây tứ phân tương ứng - TÌM HIỂU một số PHƯƠNG PHÁP PHÂN ĐỌAN ẢNH và KHẢ NĂNG ỨNG DỤNG
Hình 2.3 Cây tứ phân tương ứng (Trang 18)
Hình 2.7: Đường biên của ảnh - TÌM HIỂU một số PHƯƠNG PHÁP PHÂN ĐỌAN ẢNH và KHẢ NĂNG ỨNG DỤNG
Hình 2.7 Đường biên của ảnh (Trang 24)
Hình 2.9: Làm mảnh biên - TÌM HIỂU một số PHƯƠNG PHÁP PHÂN ĐỌAN ẢNH và KHẢ NĂNG ỨNG DỤNG
Hình 2.9 Làm mảnh biên (Trang 31)
Hình 2.12: Mã hoá Freeman - TÌM HIỂU một số PHƯƠNG PHÁP PHÂN ĐỌAN ẢNH và KHẢ NĂNG ỨNG DỤNG
Hình 2.12 Mã hoá Freeman (Trang 37)
Hình 2.13: Xấp xỉ đường bao bởi đường gấp khúc - TÌM HIỂU một số PHƯƠNG PHÁP PHÂN ĐỌAN ẢNH và KHẢ NĂNG ỨNG DỤNG
Hình 2.13 Xấp xỉ đường bao bởi đường gấp khúc (Trang 38)
Hình 3.1: Giao diện cài đặt thử nghiệm một số thuật toán phân đoạn ảnh - TÌM HIỂU một số PHƯƠNG PHÁP PHÂN ĐỌAN ẢNH và KHẢ NĂNG ỨNG DỤNG
Hình 3.1 Giao diện cài đặt thử nghiệm một số thuật toán phân đoạn ảnh (Trang 40)
Hình 3.3: Một số ảnh được phân vùng với - TÌM HIỂU một số PHƯƠNG PHÁP PHÂN ĐỌAN ẢNH và KHẢ NĂNG ỨNG DỤNG
Hình 3.3 Một số ảnh được phân vùng với (Trang 43)
Hình 3.5: Hình vẽ minh hoạ cách tính các  giá trị d trên một nửa của biểu đồ xám - TÌM HIỂU một số PHƯƠNG PHÁP PHÂN ĐỌAN ẢNH và KHẢ NĂNG ỨNG DỤNG
Hình 3.5 Hình vẽ minh hoạ cách tính các giá trị d trên một nửa của biểu đồ xám (Trang 45)
Hình 3.6: Một số ảnh đa năng đã được phân đoạn - TÌM HIỂU một số PHƯƠNG PHÁP PHÂN ĐỌAN ẢNH và KHẢ NĂNG ỨNG DỤNG
Hình 3.6 Một số ảnh đa năng đã được phân đoạn (Trang 47)
Hình 3.7: Sơ đồ của thuật toán JSEG - TÌM HIỂU một số PHƯƠNG PHÁP PHÂN ĐỌAN ẢNH và KHẢ NĂNG ỨNG DỤNG
Hình 3.7 Sơ đồ của thuật toán JSEG (Trang 50)
Hình 3.14: Lưu đồ mô tả các bước phân hoạch không - TÌM HIỂU một số PHƯƠNG PHÁP PHÂN ĐỌAN ẢNH và KHẢ NĂNG ỨNG DỤNG
Hình 3.14 Lưu đồ mô tả các bước phân hoạch không (Trang 62)
Hình 3.15: Kết quả sau khi phát hiện, tô màu - TÌM HIỂU một số PHƯƠNG PHÁP PHÂN ĐỌAN ẢNH và KHẢ NĂNG ỨNG DỤNG
Hình 3.15 Kết quả sau khi phát hiện, tô màu (Trang 64)
Hình 3.16: Kết quả sau khi “phát triển các Valley” là - TÌM HIỂU một số PHƯƠNG PHÁP PHÂN ĐỌAN ẢNH và KHẢ NĂNG ỨNG DỤNG
Hình 3.16 Kết quả sau khi “phát triển các Valley” là (Trang 69)
Hình 3.19: Kết quả phân đoạn trên các ảnh đa nămg được xử lý tự dộng mà không - TÌM HIỂU một số PHƯƠNG PHÁP PHÂN ĐỌAN ẢNH và KHẢ NĂNG ỨNG DỤNG
Hình 3.19 Kết quả phân đoạn trên các ảnh đa nămg được xử lý tự dộng mà không (Trang 71)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w