1. Trang chủ
  2. » Luận Văn - Báo Cáo

Phương pháp phân đoạn ảnh dựa trên mô hình tách, ghép vùng

67 373 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 67
Dung lượng 3,7 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

MỞ ĐẦUNgày nay, xử lý ảnh đã trở thành một ngành khoa học lớn và có nhiềuứng dụng trong các lĩnh vực: Y tế xử lý ảnh siêu âm, ảnh chụp cắt lớp, tìmkiếm tội phạm nhận dạng ảnh tội phạm, d

Trang 1

MỞ ĐẦU

Ngày nay, xử lý ảnh đã trở thành một ngành khoa học lớn và có nhiềuứng dụng trong các lĩnh vực: Y tế (xử lý ảnh siêu âm, ảnh chụp cắt lớp), tìmkiếm tội phạm (nhận dạng ảnh tội phạm, dấu vân tay), thị giác máy tính (dùng

xử lý ảnh phát hiện đối tượng chuyển động), tra cứu ảnh… Xử lý ảnh nghiêncứu các quá trình xử lý thông tin dạng hình ảnh, mà hình ảnh lại là một trongnhững dạng thông tin phong phú nhất đối với con người Quá trình xử lý ảnhbao gồm các bước: thu nhận ảnh, tiền xử lý, phân đoạn ảnh, biểu diễn và mô

tả, nhận dạng và nội suy dựa trên cơ sở tri thức Phân đoạn ảnh là một trongnhững công việc quan trọng và khó khăn nhất của xử lý ảnh, quyết định sựthành công hay thất bại của toàn bộ công việc phân tích ảnh Nếu bước phânđoạn ảnh không tốt thì sẽ dẫn đến việc nhận diện sai về các đối tượng trongảnh Chính vì vậy phải có những phương pháp phân đoạn ảnh tốt cùng vớinhững kỹ thuật phân tích ảnh phù hợp để quá trình xử lý ảnh đạt hiệu quả tốtnhất

Phân đoạn ảnh là quá trình phân hoạch một ảnh số thành nhiều đoạn(tập các pixel) Mục tiêu của phân đoạn là đơn giản hóa hoặc thay đổi biểudiễn của một ảnh thành biểu diễn có ý nghĩa và dễ phân tích Phân đoạn ảnhđược sử dụng để xác định các đối tượng và các đường biên (đường thẳng,đường cong, ) trong ảnh Nói cách khác, phân đoạn ảnh là quá trình gánnhãn cho mỗi pixel trong ảnh sao cho các pixel có cùng nhãn có chung cácthuộc tính trực quan nào đó

Cho đến nay có nhiều hướng tiếp cận để phân đoạn ảnh, có thể chiathành ba nhóm chính như sau: Dựa trên không gian đặc trưng, dựa trên khônggian ảnh, dựa trên các mô hình vật lý Mỗi hướng tiếp cận có ưu và nhượcđiểm riêng và phụ thuộc nhiều vào lĩnh vực ứng dụng cụ thể Do đó, việc

Trang 2

nghiên cứu các phương pháp phân đoạn ảnh và tiến hành cài đặt các phươngpháp phân đoạn ảnh là rất cần thiết

Vấn đề này chính là động lực để luận văn tìm hiểu các phương phápphân đoạn ảnh số và ứng dụng trong tra cứu ảnh Khi người sử dụng cung cấpmột ảnh đầu vào (gọi là ảnh truy vấn), hệ thống phân đoạn ảnh truy vấn nàythành các vùng và tính toán độ tương tự của ảnh truy vấn và các ảnh trong cơ

sở dữ liệu ảnh dựa trên các vùng đã được phân đoạn này Sau khi tính toán độtương tự, hệ thống dựa trên độ tương tự của ảnh truy vấn với mỗi ảnh trong cơ

sở dữ liệu ảnh để phân hạng các ảnh theo thứ tự giảm dần của độ tương tự Do

đó chất lượng của kỹ thuật phân đoạn sẽ ảnh hưởng rất nhiều đến độ chínhxác của hệ thống tra cứu

Luận văn trình bày tổng quan về xử lý ảnh số và các phương pháp phânđoạn ảnh số đi sâu vào phương pháp tách cây tứ phân, tách theo vùng đồngnhất, phương pháp K-means và HAC Trên cơ sở các phương pháp phân đoạnảnh này tiến hành xây dựng chương trình phân đoạn ảnh sử dụng ngôn ngữlập trình C# trên môi trường Visual Studio 2010 và SQL Server 2008

Nội dung luận văn gồm có ba chương:

Chương 1: Giới thiệu tổng quan về xử lý ảnh và phân đoạn ảnh.

Chương 2: Trình bày phân đoạn ảnh theo mô hình tách, ghép vùng Chương 3: Chương trình phân đoạn ảnh và ứng dụng phân đoạn

ảnh trong tra cứu ảnh.

Xử lý ảnh cũng là vấn đề trừu tượng liên quan đến nhiều thuật toán, kỹ thuật

xử lý cũng như viết chương trình Em đã cố gắng hết sức để hoàn thiện luậnvăn, tuy nhiên do thời gian có hạn nên không thể tránh khỏi những thiếu sót

Em rất mong nhận được sự đóng góp ý kiến của các thầy cô giáo trong Hộiđồng chấm luận văn để luận văn được hoàn thiện hơn

Trang 3

CHƯƠNG 1: TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ PHÂN ĐOẠN ẢNH

1.1 Tổng quan về xử lý ảnh

1.1.1 Giới thiệu về xử lý ảnh

Ngày nay, xử lý ảnh [2] đã trở thành một ngành khoa học lớn và có mặttrong nhiều lĩnh vực của cuộc sống như trong y tế, tìm kiếm tội phạm, khítượng thủy văn, thị giác máy tính, v.v Xử lý ảnh là ngành khoa học nghiêncứu các quá trình xử lý thông tin dạng hình ảnh, mà hình ảnh lại là một trongnhững dạng thông tin phong phú nhất đối với con người Trong quá trình xử

lý ảnh, phân đoạn ảnh là bước quan trọng nhất và cũng là khó khăn nhất.Phân đoạn nhằm mục đích phân tích ảnh thành những thành phần có cùng tínhchất nào đó để có thể sử dụng cho các ứng dụng về sau

Các phương pháp xử lý ảnh bắt đầu từ các ứng dụng chính: nâng caochất lượng ảnh, phân đoạn ảnh và phân tích ảnh Ứng dụng đầu tiên được biếtđến là nâng cao chất lượng ảnh báo được truyền qua cáp từ London đến NewYork từ những năm 1920 Vấn đề nâng cao chất lượng ảnh có liên quan tớiphân bố mức sáng và độ phân giải của ảnh Việc nâng cao chất lượng ảnhđược phát triển vào khoảng những năm 1955 Điều này có thể giải thích được

vì sau thế chiến thứ hai, máy tính phát triển nhanh tạo điều kiện cho quá trình

xử lý ảnh số thuận lợi Năm 1964, máy tính đã có khả năng xử lý và nâng caochất lượng ảnh từ mặt trăng và vệ tinh Ranger 7 của Mỹ bao gồm: làm nổiđường biên, lưu ảnh Từ năm 1964 đến nay, các phương tiện xử lý, nâng caochất lượng, phân đoạn ảnh và nhận dạng ảnh phát triển không ngừng

Trang 4

Ảnh trong xử lý ảnh có thể xem như ảnh n chiều Bởi vì, ảnh có thể

xem là tập hợp các điểm ảnh Trong đó, mỗi điểm ảnh được xem như là đặctrưng cường độ sáng hay một dấu hiệu nào đó tại một vị trí nào đó của đối

tượng trong không gian và do đó nó có thể xem như một hàm n biến

P(c1,c2, ,cn)

Quá trình xử lý ảnh [2] có thể được mô tả bằng sơ đồ sau:

Hình 1.2 Quá trình xử lý ảnh

Thu nhận ảnh: Đây là bước đầu tiên của quá trình xử lý ảnh song kết

quả của nó có ảnh hưởng rất nhiều đến các bước kế tiếp Đầu tiên, ảnh

tự nhiên từ thế giới ngoài được thu nhận qua các thiết bị thu như

Phân đoạn

Nhận dạng vànội suyTiền xử lý ảnh

Biểu diễn và

mô tả ảnh

CƠ SỞ TRI THỨC

Thu nhận

Xử lý ảnh

Kết luận

Trang 5

camera, máy chụp ảnh, v.v Trước đây, ảnh thu nhận qua camera là tínhiệu tương tự (loại camera ống kiểu CCIR) Gần đây, với sự phát triểncủa công nghệ, ảnh màu hoặc đen trắng được lấy ra từ camera, sau đó

nó được chuyển trực tiếp thành ảnh số tạo thuận lợi cho xử lý tiếp theo.Mặt khác, ảnh cũng có thể tiếp nhận từ vệ tinh qua các bộ cảm ứng hayảnh, tranh được quét trên máy quét ảnh (scanner)

Tiền xử lý: Ở bước này, ảnh sẽ được cải thiện về độ tương phản, khử

nhiễu, khôi phục ảnh, nắn chỉnh hình học, v.v Với mục đích làm chochất lượng ảnh trở nên tốt hơn nữa, chuẩn bị cho các bước xử lý phứctạp kế tiếp sau đó

* Khử nhiễu: Nhiễu được chia thành hai loại: nhiễu hệ thống vànhiễu ngẫu nhiên Đặc trưng của nhiễu hệ thống là tính tuần hoàn Dovậy, có thể khử nhiễu này bằng việc sử dụng phép biến đổi Fourier vàloại bỏ các đỉnh điểm Đối với nhiễu ngẫu nhiên, trường hợp đơn giản

là các vết bẩn tương ứng với các điểm sáng hay tối, có thể khử bằngphương pháp nội suy, lọc trung vị và trung bình

* Chỉnh mức xám: Đây là kỹ thuật nhằm chỉnh sửa tính khôngđồng đều của thiết bị thu nhận hoặc độ tương phản giữa các vùng ảnh

* Chỉnh tán xạ: Ảnh thu nhận được từ các thiết bị quang học hayđiện tử có thể bị mờ, nhoè Phương pháp biến đổi Fourier dựa trên tíchchập của ảnh với hàm tán xạ cho phép giải quyết việc hiệu chỉnh này

* Nắn chỉnh hình học: những biến dạng hình học thường do cácthiết bị điện tử và quang học gây ra Do đó, phương pháp hiệu chỉnhảnh dựa trên mô hình được mô tả dưới dạng phương trình biến đổi ảnhbiến dạng f(x,y) thành ảnh lý tưởng f(x',y') như sau:

) , ( '

y x h y

y x h x

y x

Trong đó h , h là các phương trình tuyến tính (biến dạng do phối cảnh)

Trang 6

hay bậc hai (biến dạng do ống kính camera).

Phân đoạn ảnh: Phân đoạn ảnh là bước then chốt trong xử lý ảnh, giai

đoạn này nhằm phân tích ảnh thành những thành phần có cùng tínhchất nào đó, dựa theo biên hay các vùng liên thông Tiêu chuẩn để xácđịnh các vùng liên thông có thể là cùng màu, cùng mức xám hay cùng

độ nhám, v.v Mục đích của phân đoạn ảnh là để có một miêu tả tổnghợp từ nhiều phần tử khác nhau cấu tạo nên ảnh thô Vì lượng thôngtin chứa trong ảnh rất lớn, trong khi đó trong đa số các ứng dụng chúng

ta chỉ cần trích chọn một vài đặc trưng nào đó, do vậy cần có một quátrình để giảm lượng thông tin khổng lồ ấy Quá trình này bao gồmphân vùng ảnh và trích chọn đặc tính chủ yếu

Biểu diễn và mô tả ảnh: Ảnh đầu ra sau phân đoạn chứa các điểm ảnh

của vùng ảnh (ảnh đã phân đoạn) cộng với mã liên kết với các vùng lâncận Việc biến đổi các số liệu này thành dạng thích hợp là cần thiết cho

xử lý tiếp theo bằng máy tính Việc chọn các tính chất để thể hiện ảnhgọi là trích chọn đặc trưng gắn với việc tách các đặc tính của ảnh dướidạng các thông tin định lượng hoặc làm cơ sở để phân lớp đối tượngnày với đối tượng khác trong phạm vi ảnh nhận được Ví dụ: trongnhận dạng các ký tự, ta miêu tả các đặc trưng của từng ký tự, giúpphân biệt ký tự này với ký tự khác Một số phương pháp biểu diễnthường dùng:

o Biểu diễn bằng mã chạy (Run-Length Code)

o Biểu diễn bằng mã xích (Chaine Code)

o Biểu diễn bằng mã tứ phân (Quad-Tree Code)

Nhận dạng và nội suy: Đây là bước cuối cùng trong quá trình xử lý

ảnh Nhận dạng ảnh là quá trình xác định ảnh Quá trình này thường thu

Trang 7

được bằng cách so sánh với mẫu chuẩn đã được học (hoặc lưu) từtrước Có 2 kiểu nhận dạng ảnh cơ bản:

− Nhận dạng theo tham số

− Nhận dạng theo cấu trúc

Một số đối tượng nhận dạng khá phổ biến hiện nay đang được áp dụngtrong khoa học và công nghệ là: Nhận dạng ký tự (chữ in, chữ viết tay,chữ ký điện tử), nhận dạng văn bản , nhận dạng vân tay, nhận dạng mãvạch, nhận dạng mặt người, v.v

Nội suy là phán đoán theo ý nghĩa trên cơ sở nhận dạng

Cơ sở tri thức: Ảnh là một đối tượng khá phức tạp về đường nét, độ sáng tối,

dung lượng điểm ảnh, v.v Trong nhiều khâu xử lý và phân tích ảnh, ngoàiviệc đơn giản hóa các phương pháp toán học đảm bảo tiện lợi cho xử lý,người ta mong muốn bắt chước quy trình tiếp nhận và xử lý ảnh theo cách củacon người Trong các bước xử lý đó, nhiều khâu hiện nay đã xử lý theo cácphương pháp trí tuệ con người Vì vậy, ở đây các cơ sở tri thức được phát huy

Không phải bất kỳ một ứng dụng xử lý ảnh nào cũng bắt buộc phảituân theo các bước xử lý đã nêu ở trên, ví dụ như các ứng dụng chỉnh sửa ảnhnghệ thuật chỉ dừng lại ở bước tiền xử lý Một cách tổng quát thì những chứcnăng xử lý bao gồm cả nhận dạng và nội suy thường chỉ có mặt trong hệthống phân tích ảnh tự động hoặc bán tự động, được dùng để rút trích ranhững thông tin quan trọng từ ảnh, ví dụ như các ứng dụng nhận dạng kí tựquang học, nhận dạng chữ viết tay, v.v

1.1.3 Một số khái niệm cơ bản

1.1.3.1 Điểm ảnh - Pixel

Ảnh trong thực tế [1] là một ảnh liên tục về không gian và vềgiá trị độ sáng Để có thể xử lý ảnh bằng máy tính, ảnhcần phải được sốhoá Số hoá ảnh là sự biến đổi tín hiệu liên tục sang tín hiệu rời rạc thông

Trang 8

qua quá trình lấy mẫu (rời rạc hoá về không gian) và lượng hoá thành phầngiá trị mà về nguyên tắc bằng mắt thường không phân biệt được hai điểm

kề nhau Trong quá trình này người ta sử dụng khái niệm Picture element

mà ta quen gọi là Pixel - phần tử ảnh Ảnh được xem như là tập hợp hữu hạncác điểm ảnh, thường được biểu diễn bằng một mảng hai chiều I(n,m) với n là

số hàng, m là số cột Ta ký hiệu P(x,y) – 1 phần tử trong ma trận là một điểmảnh tại vị trí (x,y)

- Ảnh nhị phân: Là ảnh có 2 mức trắng đen phân biệt, tức là dùng 1bit

mô tả 21 mức khác nhau Nói cách khác: Mỗi bit điểm ảnh nhị phân chỉ có thể

là 0,1

-Ảnh màu: Trong khuôn khổ lý thuyết 3 màu (Red, Green, Blue) để tạonên thế giới màu, người ta thường dùng 3 byte để mô tả mức màu, khi đó cácgiá trị màu: 28*3=224≈16,7 triệu màu

1.1.3.3 Biên

Biên là một đặc tính rất quan trọng của đối tượng trong ảnh, nhờ vàobiên mà chúng ta phân biệt được đối tượng này với đối tượng kia Một điểmảnh có thể gọi là điểm biên nếu ở đó có sự thay đổi đột ngột về mức xám.Tập hợp các điểm biên gọi là biên hay còn gọi là đường bao ảnh

Trang 9

N4((x,y)) = {(x+1,y), (x-1,y), (x,y+1), (x,y-1)}

Trong hình 1.3 các điểm P0, P2, P4, P6 là các 4-láng gi ng c a P ềng của P ủa P.

P2(x,y-1)

P4(x-1,y) P(x,y) P0(x+1,y)

P6(x,y+1)Hình 1.3 Khái niệm 4-láng giềng

- 8 láng giềng của (x,y) là một tập cha của 4 láng giềng và bao gồm

láng giềng ngang, dọc và chéo:

N8((x,y)) = N4((x,y)) {(x+1,y+1), (x-1,y-1), (x+1,y-1), (x-1,y+1)}

Trong hình 1.4 các điểm P0, P1, P2, P3, P4, P5, P6, P7 là các 8-láng giềng của P.

P3(x-1,y-1) P2(x,y-1) P1(x+1,y-1)

P4(x-1,y) P(x,y) P0(x+1,y)

P5(x-1,y+1) P6(x,y+1) P7(x+1,y+1)Hình 1.4 Khái niệm 8-láng giềng

1.1.3.5 Vùng liên thông

Một vùng R được gọi là liên thông nếu bất kỳ hai điểm (xA,yA) và(xB,yB) thuộc vào R có thể được nối bởi một đường (xA,yB) (xi-1,yi-1), (xi,yi),(xi+1,yi+1) (xB,yB), mà các điểm (xi,yi) thuộc vào R và bất kỳ điểm (xi,yi) nàođều kề sát với điểm trước (xi-1,yi-1) và điểm tiếp theo (xi+1,yi+1) trên đường đó.Một điểm (xk,yk) được gọi là kề với điểm (xl,yl) nếu (xl,yl) thuộc vào lánggiềng trực tiếp của (xk,yk)

Trang 10

1.1.3.6 Vùng ảnh (Segment)

Vùng ảnh là một chi tiết, một thực thể trong toàn cảnh Nó là một tậphợp các điểm có cùng hoặc gần cùng một tính chất nào đó : mức xám, mứcmàu, độ nhám, v.v Vùng ảnh là một trong hai thuộc tính quan trọng của ảnh.1.1.3.7 Đối tượng ảnh

Quan hệ k-liên thông [3] trong E (k=4,8) là một quan hệ phản xạ, đối

xứng và bắc cầu Bởi vậy đó là một quan hệ tương đương Mỗi lớp tươngđương được gọi là một thành phần k-liên thông của ảnh Ta sẽ gọi mỗi thànhphần k-liên thông của ảnh là một đối tượng ảnh

1.1.3.8 Chu tuyến ảnh

Chu tuyến của một đối tượng ảnh là dãy các điểm của đối tượng ảnhP1,…,Pn sao cho Pi và Pi+1 là các 8-láng giềng của nhau (i=1, ,n-1) và P1 là8-láng giềng của Pn, ∀i ∃Q không thuộc đối tượng ảnh và Q là 4-láng giềngcủa Pi (hay nói cách khác ∀i thì Pi là biên 4) Kí hiệu <P1P2 Pn>

Tổng các khoảng cách giữa hai điểm kế tiếp của chu tuyến là độ dài của chutuyến và kí hiệu Len(C) và hướng PiPi+1 là hướng chẵn nếu Pi và Pi+1 là các

4 – láng giềng (trường hợp còn lại thì PiPi+1 là hướng lẻ) Hình 1.3 dưới đâybiểu diễn chu tuyến của ảnh, trong đó, P là điểm khởi đầu chu tuyến

Hình 1.5 Ví dụ về chu tuyến của đối tượng ảnh

1.1.4 Các định dạng cơ bản trong xử lý ảnh

Trang 11

Trong quá trình xử lý ảnh [1], một ảnh thu nhận vào máy tính phảiđược mã hóa Hình ảnh khi lưu trữ dưới dạng tệp tin sẽ được số hóa Một sốdạng ảnh đã được chuẩn hóa như: Ảnh IMG, PCX, JPEG, TIFF, GIF, …

• Ảnh IMG: Là ảnh đen trắng, phần đầu của ảnh có 16 bytes chứa cácthông tin cần thiết Ảnh IMG được nén theo từng dòng Mỗi dòng bao gồmcác gói Các dòng giống nhau cũng nén thành một gói

• Ảnh PCX: Định dạng ảnh PCX là một trong những định dạng ảnh cổđiển nhất, phần đầu của ảnh có 128 bytes chứa các thông tin cần thiết nóthường được dùng để lưu trữ ảnh vì thao tác đơn giản, cho phép nén và giảinén nhanh Quá trình nén và giải nén được thực hiện trên từng dòng ảnh

• Ảnh JPEG: Là định dạng tập tin hầu hết các loại máy ảnh số và phầnmềm xử lý ảnh đều hỗ trợ tương thích JPEG chứa thông tin trung thực củamàu sắc: 24 bit cho một điểm (pixel) JPEG là một tiêu chuẩn của kỹ thuậtnén ảnh Tỷ lệ nén có thể đạt tới 10:1 [17] nhưng phải trả giá bằng chất lượng

• Ảnh TIFF: Phần đầu của ảnh có 8 bytes chứa các thông tin cần thiết

Nó là ảnh mà dữ liệu chứa trong tệp thường được tổ chức thành các nhómdòng ( cột) quét của dữ liệu ảnh TIFT là lựa chọn cho mục đích lưu trữ ảnhlâu dài tuy nhiên dung lượng cồng kềnh

• Ảnh GIF: Với định dạng ảnh GIF những vướng mắc mà các địnhdạng khác gặp phải khi số màu trong ảnh tăng lên không còn nữa Dạng ảnhGIF cho chất lượng cao độ phân giải đồ họa cũng đạt cao, cho phép hiển thịtrên hầu hết các phần cứng Do dung lượng nhỏ gọn nên GIFT là lựa chọn lýtưởng cho các ứng dụng web nhưng không phù hợp để lưu trữ ảnh

Trang 12

1.2.1.1 Không gian màu

Không gian màu là sự biểu diễn tập các màu, một số không gian màu được

sử dụng rộng rãi trong đồ họa máy tính Màu sắc thường được xác định trongkhông gian màu 3 chiều

Không gian màu RGB

Không gian màu RGB là không gian màu được sử dụng nhiều nhất cho

đồ hoạ máy tính Đây là không gian màu cộng: đỏ, xanh lục và xanh lơ đượckết hợp lại để tạo ra các màu khác Không gian này không đồng nhất về nhậnthức Không gian màu RGB có thể được trực quan hoá như một hình khối,như được minh hoạ trong Hình 1.6

Trang 13

Hình 1.6 Không gian màu RGB được trực quan hoá như một hình khối

Mỗi trục màu (R, G, B) có độ quan trọng như nhau Do đó, mỗi trục nênđược lượng hoá với cùng một độ chính xác Khi không gian màu RGB đượclượng hoá, số các bin sẽ luôn luôn là một hình khối Thông thường, 8 (23), 64(43), 216 (63), 512 (83) bin được sử dụng trong lượng hoá không gian màuRGB Chuyển đổi từ một ảnh RGB sang một ảnh cấp xám nhận được tổngcủa R, G và B rồi chia kết quả cho ba

Không gian màu HSx

Không gian màu HSI, HSV, HSB và HSL [15] thường được gọi là HSx

có mối liên quan gần gũi với sự nhận thức về màu sắc của con người hơn làkhông gian màu RGB Những trục từ không gian màu HSx mô tả những đặctính của màu như sắc độ, độ bão hoà và độ sáng Sự khác nhau giữa nhữngkhông gian màu HSx là sự biến đổi của chúng từ không gian màu RGB,chúng thường được mô tả bằng những hình dạng khác nhau (như hình nón,hình trụ) Trong hình 1.7 không gian màu HSV được mô tả như hình nón

Trang 14

Hình 1.7 Mô tả không gian màu HSV

Sắc độ là thành phần của không gian màu HSx Sắc độ là góc giữanhững đường tham chiếu và điểm gốc màu trong không gian màu RGB Vùnggiá trị này từ 00 đến 3600 Theo uỷ ban quốc tế về màu sắc CIE thì sắc độ làthuộc tính của cảm giác có liên quan đến thị giác, qua đó một vùng xuất hiệntương tự với một màu được cảm nhận như red, green, blue hoặc là sự kết hợpcủa hai trong số những màu được cảm nhận Cũng theo CIE độ bão hoà làmàu được đánh giá theo tỷ lệ độ sáng của nó Trong hình nón độ bão hoà làkhoảng cách từ tâm đến cạnh hình nón Chiều cao của đường cắt chính là giátrị đây chính là độ sáng hoặc độ chói của màu Khi độ bão hoà S bằng 0 thì Hkhông xác định, giá trị nằm trên trục V biểu diễn ảnh xám Không gian màuHSV dễ dàng lượng tử hoá Mức lượng tử hoá thông dụng trong không gianmàu này là 162 mức với H nhận 18 mức, S và V nhận 3 mức

Trang 15

Không gian màu YUV và YIQ

Các không gian màu YUV và YIQ được phát triển cho truyền hình vôtuyến Không gian màu YIQ là giống như không gian màu YUV, ở đây mặtphẳng I-Q là một mặt phẳng quay 33 0của mặt phẳng U-V Tín hiệu Y biểudiễn độ chói của một pixel và là kênh duy nhất được sử dụng trong ti vi đentrắng U và V cho YUV và I và Q cho YIQ là các thành phần màu

Kênh Y được định nghĩa bởi các giá trị năng lượng có trọng số củaR(0.299), G(0.587) và B(0.144) Các không gian màu YUV và YIQ không làđồng nhất nhận thức Khi các không gian màu YUV và YIQ được lượng hoá,mỗi trục được lượng hoá với cùng độ chính xác

Không gian màu CIE XYZ và LUV

Không gian màu [13] được phát triển đầu tiên bởi CIE là không gianmàu XYZ Thành phần Y là thành phần độ chói được định nghĩa bởi tổngtrọng số của R(0.212671), G(0.715160), B(0.072169), X và Z là các thànhphần màu Không gian màu CIE LUV là sự biến đổi của không gian màuXYZ Kênh L là độ chói của màu, kênh U và V là những thành phần màu Vìvậy khi U và V được đặt bằng 0 thì kênh L biểu diễn ảnh xám Trong lượng tửhoá không gian màu LUV mỗi trục được lượng tử hoá với mức xác định Sơ

đồ lượng tử hoá thường được sử dụng cho hai không gian màu này là 64, 125,

216 mức

1.2.1.2 Lược đồ màu

Lược đồ màu được xác định bằng một tập các bin, trong đó mỗi bin biểuthị xác suất của các pixel trong ảnh Một lược đồ màu H của một ảnh đã chođược xác định bởi véc tơ:

H={H[0], H[1], H[2], , H[i], H[N]}

Trang 16

Ở đây i biểu diễn một màu trong lược đồ màu và tương ứng với một khối con trong không gian màu RGB, H[i] là số các pixel có màu i trong ảnh và N

là số các bin trong lược đồ màu

Mỗi pixel trong ảnh sẽ thuộc về một bin của lược đồ màu của ảnh, vì thếvới lược đồ màu của một ảnh, giá trị của mỗi bin là số các pixel cùng màu Để

so sánh các ảnh có các kích cỡ khác nhau, các lược đồ màu được chuẩn hóa.Lược đồ màu chuẩn hóa H’ được xác định bằng:

H’={H’[0], H’[1], H’[2], , H’[i], H’[N]},

Ở đây H' [i] H p[i], P là tổng số các pixel trong ảnh

Trong lược đồ lượng hóa không gian màu lý tưởng, các màu riêng biệtkhông được định vị trong cùng hình khối con và các màu tương tự được gánvào cùng hình khối con Sử dụng một số màu sẽ giảm khả năng các màutương tự được gán vào các bin khác nhau, nhưng cũng tăng khả năng các màuriêng biệt được gán vào cùng các bin, nội dung thông tin của các ảnh sẽ giảm.Mặt khác, các lược đồ màu với một số lượng lớn các bin sẽ chứa nhiều thôngtin về nội dung của ảnh, theo đó giảm khả năng các màu riêng biệt sẽ đượcgán vào cùng các bin Tuy nhiên, chúng tăng khả năng các màu tương tự sẽđược gán vào các bin khác nhau và tăng không gian lưu trữ biểu diễn ảnh vàthời gian tính toán khoảng cách giữa các lược đồ màu Do đó, cần có sự thỏahiệp trong việc xác định số lượng các bin sẽ được sử dụng trong các lược đồ màu

1.2.2 Kết cấu

Kết cấu là một mô tả vùng trợ giúp tốt trong quá trình tra cứu Kết cấukhông có khả năng tìm ra các ảnh tương tự, nhưng nó có thể được sử dụng đểphân lớp các ảnh kết cấu từ các ảnh không kết cấu và sau đó được kết hợp vớicác thuộc tính đặc trưng khác như màu để làm cho tra cứu hiệu quả hơn Mộttrong những biểu diễn phổ biến nhất của đặc trưng kết cấu là ma trận đồngkhả năng được đề xuất bởi Haralick và cộng sự Ma trận dựa trên hướng và

Trang 17

khoảng cách pixel Các thống kê từ ma trận đồng khả năng được trích rút vàđược biểu diễn như thông tin kết cấu Tamura và cộng sự [6] đã đề xuấtphương pháp trích rút sáu thuộc tính kết cấu đặc trưng: Độ nhám(coarseness), tương phản (contrast), hướng (directionality), khả năng(likeliness), đều (regularity) và thô (roughness).

Bước tiếp theo là sử dụng các mô tả thích hợp cho các vùng này sao chochúng có thể được sử dụng trong khi đối sánh các vùng của các ảnh khácnhau Các mô tả hình được chia thành ba loại: Các mô tả dựa vào đường biênxác định các thuộc tính của đường biên Các kỹ thuật dựa vào đường biên sửdụng các phác thảo vùng để tính toán hình Mô tả Fourier là một trong nhữngphương pháp phổ biến thuộc về loại này Trong kỹ thuật này, đường biên củamột vùng đã cho được thu và được biến đổi Fourier Các hệ số Fourier trộiđược sử dụng như các mô tả hình Các mô tả khác trong loại này là các mômen hình

Nếu một vùng có một hình phức hợp, nó có thể được phân tách tiếp thànhcác hình đơn giản hơn như các hình chữ nhật hoặc các hình tròn và một sốthuộc tính của các hình đơn giản này và các quan hệ của chúng có thể được sử

Trang 18

dụng cho các mô tả hình Các mô tả vùng khác gồm màu và kết cấu Một sốđặc tính của vùng như trọng tâm, không cụ thể đối với đường biên hoặc nộidung của vùng.

1.3 Tổng quan về phân đoạn ảnh

1.3.1 Phân đoạn ảnh

Phân đoạn ảnh [1] là một thao tác ở mức thấp trong toàn bộ quá trình

xử lý ảnh Quá trình này thực hiện việc phân vùng ảnh thành các vùng rời rạc

và đồng nhất với nhau hay nói cách khác là xác định các biên của các vùngảnh đó Các vùng ảnh đồng nhất này thông thường sẽ tương ứng với toàn bộhay từng phần của các đối tượng thật sự bên trong ảnh Vì thế, trong hầu hếtcác ứng dụng của lĩnh vực xử lý ảnh, thị giác máy tính, phân đoạn ảnh luônđóng một vai trò cơ bản và thường là bước tiền xử lý đầu tiên trong toàn bộquá trình trước khi thực hiện các thao tác khác ở mức cao hơn như nhận dạngđối tượng, biểu diễn đối tượng, nén ảnh dựa trên đối tượng, hay truy vấn ảnhdựa vào nội dung, v.v Ở thời gian đầu, các phương pháp phân vùng ảnh đượcđưa ra chủ yếu làm việc trên các ảnh mức xám do các hạn chế về phương tiệnthu thập và lưu trữ Ngày nay, cùng với sự phát triển về các phương tiện thunhận và biểu diễn ảnh, các ảnh màu hầu như thay thế hoàn toàn các ảnh mứcxám trong việc biểu diễn và lưu trữ thông tin do các ưu thế vượt trội hơn hẳn

so với ảnh mức xám Do đó, các kỹ thuật, thuật giải mới thực hiện việc phânvùng ảnh trên các loại ảnh màu liên tục được phát triển để đáp ứng các nhucầu mới Các thuật giải, kỹ thuật này thường được phát triển dựa trên nền tảng

các thuật giải phân vùng ảnh mức xám đã có sẵn

Phân đoạn ảnh là chia ảnh thành các vùng không trùng lặp Mỗi vùnggồm một nhóm pixel liên thông và đồng nhất theo một tiêu chí nào đó Tiêuchí này phụ thuộc vào mục tiêu của quá trình phân đoạn Ví dụ như đồng nhất

về màu sắc, mức xám, kết cấu, độ sâu của các layer

Trang 19

1.3.2 Một số phương pháp phân đoạn ảnh

Để đánh giá chất lượng của quá trình phân đoạn là rất khó Vì vậy trướckhi phân đoạn ảnh cần xác định rõ mục tiêu của quá trình phân đoạn là gì Xétmột cách tổng quát, ta có thể chia các hướng tiếp cận phân đoạn ảnh thành banhóm chính như sau:

• Các phương pháp phân đoạn ảnh dựa trên không gian đặc trưng

• Các phương pháp dựa trên không gian ảnh

• Các phương pháp dựa trên các mô hình vật lý

Các phương pháp dựa trên không gian đặc trưng

Nếu chúng ta giả định màu sắc bề mặt của các đối tượng trong ảnh làmột thuộc tính bất biến và các màu sắc đó được ánh xạ vào một không gianmàu nào đó, vậy thì chúng ta sẽ có một cái nhìn đối với mỗi đối tượng trongảnh như là một cụm các điểm trong không gian màu đó Mức độ phân tán củacác điểm trong trong một cụm được xác định chủ yếu bởi sự khác biệt về màusắc Một cách khác, thay vì ánh xạ các pixel trong ảnh vào một không gianmàu cụ thể, ta xây dựng một histogram dựa trên các đặc trưng màu cho ảnh

đó (ví dụ như Hue), và thông thường, các đối tượng trong ảnh sẽ xuất hiệnnhư các giá trị đỉnh trong histogram đó Do đó, việc phân vùng các đối tượngtrong ảnh tương ứng với việc xác định các cụm hoặc xác định các vùng cực trịcủa histogram

Các phương pháp tiếp cận này chỉ làm việc trên một không gian màuxác định Dựa trên không gian đặc trưng, ta có các phương pháp phân đoạn:

- Phương pháp phân nhóm đối tượng không giám sát

- Phương pháp phân lớp thích nghi k -trung bình

- Phương pháp lấy ngưỡng lược đồ

Các phương pháp dựa trên không gian ảnh

Trang 20

Hầu hết những phương pháp được đề cập trong phần trên đều hoạtđộng dựa trên các không gian đặc trưng của ảnh (thông thường là màu sắc).

Do đó, các vùng ảnh kết quả là đồng nhất tương ứng với các đặc trưng đãchọn cho từng không gian Tuy nhiên, không có gì đảm bảo rằng tất cả cácvùng này thể hiện một sự cô đọng về nội dung xét theo nghĩa không gian ảnh(ý nghĩa các vùng theo sự cảm nhận của hệ thần kinh con người) Mà đặc tínhnày là quan trọng thứ hai sau đặc tính về sự thuần nhất của các vùng ảnh Docác phương pháp gom cụm cũng như xác định ngưỡng lược đồ đã nêu đều bỏqua thông tin về vị trí của các pixel trong ảnh

Trong các báo cáo khoa học về phân vùng ảnh mức xám, có khá nhiều

kỹ thuật cố thực hiện việc thoả mãn cùng lúc cả hai tiêu chí về tính đồng nhấttrong không gian đặc trưng của ảnh và tính cô đọng về nội dung ảnh Tuỳtheo các kỹ thuật mà các thuật giải này áp dụng, chúng được phân thành cácnhóm sau:

- Các thuật giải áp dụng kỹ thuật chia và trộn vùng

- Các thuật giải áp dụng kỹ thuật tăng trưởng vùng

- Các thuật giải áp dụng lý thuyết đồ thị

- Các giải thuật áp dụng mạng neural

- Các giải thuật dựa trên cạnh

Các phương pháp dựa trên mô hình vật lý

Tất cả các giải thuật được xem xét qua, không ít thì nhiều ở mặt nào đóđều có khả năng phát sinh việc phân vùng lỗi trong các trường hợp cụ thể nếunhư các đối tượng trong ảnh màu bị ảnh hưởng quá nhiều bởi các vùng sánghoặc bóng mờ, các hiện tượng này làm cho các màu đồng nhất trong ảnh thayđổi nhiều hoặc ít một cách đột ngột Kết quả là các thuật giải này tạo ra cáckết quả phân vùng quá mức mong muốn so với sự cảm nhận các đối tượngtrong ảnh bằng mắt thường Để giải quyết vấn đề này, các giải thuật phân

Trang 21

vùng ảnh áp dụng các mô hình tương tác vật lý giữa bề mặt các đối tượng vớiánh sáng đã được đề xuất Các công cụ toán học mà các phương pháp này sửdụng thì không khác mấy so với các phương pháp đã trình bày ở trên, điểmkhác biệt chính là việc áp dụng các mô hình vật lý để minh hoạ các thuộc tínhphản chiếu ánh sáng trên bề mặt màu sắc của các đối tượng

Phân đoạn là bước then chốt trong xử lý ảnh, nếu phân đoạn không tốt

sẽ dẫn đến sai lệch kết quả ở các bước tiếp theo Có nhiều phương pháp đểphân đoạn ảnh, tuy nhiên không có một phương pháp phân đoạn nào là vạnnăng – theo nghĩa là có thể áp dụng cho mọi loại ảnh và cũng không có mộtphương pháp phân đoạn ảnh nào là hoàn hảo

Chương 2 PHÂN ĐOẠN ẢNH THEO MÔ HÌNH TÁCH, GHÉP VÙNG

Trang 22

2.1 Phân đoạn ảnh theo mô hình tách vùng

2.1.1 Tách vùng theo phương pháp tách cây tứ phân

Phương pháp tách cây tứ phân [1] dựa trên nguyên tắc kiểm tra tínhhợp thức của tiêu chuẩn đồng nhất một cách tổng thể trên miền lớn của ảnh.Nếu tiêu chuẩn được thoả việc phân đoạn coi như kết thúc Trong trường hợpngược lại, chia miền đang xét thành 4 miền nhỏ hơn, áp dụng đệ quy bằngphương pháp trên cho mỗi miền nhỏ hơn cho đến khi tất cả các miền đềuthoả mãn tiêu chuẩn đồng nhất Thuật toán được mô tả như sau:

Thuật toán tách cây tứ phân

Input : Ảnh I coi là một miền

Chia miền đang xét thành 4 miền: Z1, Z2, Z3, Z4

For i=1 to 4 Do PhanDoan(Zi)

End

Else Exit

End;

Hình 2.1 Thuật toán tách cây tứ phân

Tiêu chuẩn xét miền đồng nhất ở đây có thể dựa vào mức xám Có thểdựa vào độ lệch chuẩn (6-8) hay độ chênh giữa giá trị mức xám lớn nhất và

Trang 23

giá trị mức xám nhỏ nhất Giả sử Max và Min là giá trị mức xám lớn nhất vànhỏ nhất trong miền đang xét Nếu:

Max - Min  T(ngưỡng)

Ta coi miền đang xét là miền đồng nhất, trong trường hợp ngược lại, miềnđang xét là không đồng nhất và sẽ được chia làm 4 phần

Thuật toán kiểm tra tiêu chuẩn dựa vào độ chênh max, min được viếtnhư sau:

Giả thiết ảnh có tối đa 255 mức xám

(N1,M1)( N2,M2) là tọa độ điểm đầu và điểm cuối của miền

If I[i,j]  Min then Min = I[i,j];

If I[i,j]  Max then Max = I[i,j];

If ABS(Max-Min)  T then KT_vung = 0 Else KT_vung = 1;

End

Nếu hàm trả về giá trị 0 có nghĩa vùng đang xét là đồng nhất, trườnghợp ngược lại nghĩa là vùng đang xét là không đồng nhất Trong giải thuậttrên, khi miền là đồng nhất cần tính lại giá trị trung bình và cập nhật lại ảnhđầu ra Giá trị trung bình được tính bởi:

Tổng giá trị mức xám/ tổng số điểm trong vùngThuật toán này tạo nên một cây mà mỗi nút cha có 4 nút con ở mọimức, trừ mức ngoài cùng Vì thế cây này có tên là cây tứ phân Cây này

Trang 24

cho ta hình ảnh rõ nét về cấu trúc phân cấp của các vùng tương ứngvới tiêu chuẩn.

Hình 2.2 Minh họa thuật toán tách cây tứ phân

Hình 2 2 m inh họa thuật toán tách cây tứ phân: ảnh gốc (a) được chiathành 4 phần được kết quả phân mức 1 (b), tiếp tục thực hiện đối với cácphần nhỏ ta được phân mức 2 (c), phân mức 3 (d)

a Ảnh

gốc

b Phân mức 1

Trang 25

Hình 2.3 Cây tứ phân tương ứng

Gốc của cây là ảnh ban đầu, một vùng thoả tiêu chuẩn tạo nên một nút

lá, nếu không sẽ tạo nên một nút nhánh và có 4 nút con tương ứng với việcchia làm 4 vùng Ta cứ tiếp tục như vậy cho đến khi cây phân xong Các nút

lá của cây biểu diễn số vùng đã phân theo tiêu chuẩn

Giả sử chọn tiêu chuẩn phân vùng là màu sắc và quy ước mọi điểmcủa vùng là màu trắng sẽ tạo nên một nút lá trắng và tương tự như vậy vớinút lá đen Nút màu ghi có nghĩa là vùng không thuần nhất và phải tiếp tục chia

2.1.2 Tách theo vùng đồng nhất

Trong phần này, tôi trình bày thuật toán CSI tách ảnh thành các vùngđồng nhất [7] Tôi áp dụng thuật toán cân bằng lược đồ để phân cụm các màuđược chọn Với mỗi màu được chọn, thuật toán được áp dụng với một không

gian ảnh theo cả trục x và y Kết quả của thuật toán là một tập các vùng với mỗi màu Vùng BR i được biểu diễn bởi hình chữ nhật (x , y , x , y i )

br i br i tl i

Trang 26

Thuật toán CSI được mô tả như sau:

Đầu tiên, toàn bộ ảnh đã cho Img được coi như một vùng Trong bước

đầu tiên, ảnh có thể được tách thành hai vùng phụ thuộc vào hàm giá trị

Cost(BR i) và màu phân cụm sử dụng kỹ thuật cân bằng lược đồ Với mỗivùng, một điều kiện tách được sử dụng để xác định một vùng có được phânhoạch hay không Nếu các mẫu quan sát rơi vào vùng lệch đáng kể so với kỳvọng, vùng cần phân hoạch tiếp, với mỗi vùng cần xác định hàm giá trị

Cost(BR i ), để xác định vùng BR i hoặc được phân hoạch theo chiều ngang hoặcphân hoạch theo chiều dọc

Kỳ vọng có thể được tính toán theo kinh nghiệm về phân bố mẫu Nếucác mẫu quan sát quá xa kỳ vọng, phân hoạch vùng cần được tiếp tục và với

mỗi vùng cần xác định giá trị hàm giá, để xác định BR i sẽ được phân hoạchtheo chiều ngang hay dọc Phương pháp dựa trên tri thức về phân bố phụthuộc vào kinh nghiệm chuyên gia sẽ đánh giá kỳ vọng được mô tả như dưới

Độ lệch giữa một quan sát i và kỳ vọng được tính theo công thức:

) i ( E

) i ( E ) i ( obs

(2.1)

Nếu DX vượt quá một ngưỡng T, vùng bị bỏ qua đối với phân hoạch tiếp

theo Trong trường hợp ngược lại, vùng hiện tại sẽ được thêm vào Stack chophân hoạch tiếp theo Quá trình phân hoạch được lặp cho đến khi một trongcác điều kiện sau được thoả mãn: tất cả các vùng là thuần nhất hoặc số cácmẫu trong một vùng nhỏ hơn một ngưỡng đã cho

Giá trị Cost(BR i) được tính như sau:

) DX

, Max(DX

)

Ký hiệu DX selectedrow là kỳ vọng trong dòng selectedrow, DX selectedcol là kỳ

vọng trong cột selectedcol

) DX

, Max(DX

DX selectedro wtoprow bottomrow (2.3)

Trang 27

Ký hiệu DX toprow và DX bottomrow là kỳ vọng trong dòng toprow và bottomrow theo các hướng trên xuống/dưới lên và các giá trị này được tính

toán theo công thức ở dưới:

(i) E

(i) E

(i) obs

DX

toprow

toprow toprow

toprow

(i) E

(i) E

(i) obs

DX

bottomrow

bottomrow bottomrow

) DX

, Max(DX

DX selectedco lleftcol rightcol (2.6)

Tương tự, ký hiệu DX leftcol , DX rightcol là kỳ vọng trong dòng

leftcol/rightcol theo các hướng trái sang phải/phải sang trái và các giá trị này

được tính theo công thức sau:

(i) E

(i) E

(i) obs

DX

leftcol

leftcol leftcol

leftcol

(i) E

(i) E

(i) obs

DX

rightcol

rightcol rightcol

rightcol

Nếu Cost(BR i ) bằng DX selectedrow, thì BR i được phân hoạch theo chiều

dọc Trong trường hợp ngược lại, nếu Cost(BR i ) bằng DX selectedcol , BR i đượcphân hoạch theo chiều ngang

Thuật toán trích rút màu và thông tin không gian CSI được mô tả như sau:

(2.8)

Trang 28

Thuật toán CSI

Input: Img - ảnh

minarea – ngưỡng diện tích của vùng

T – ngưỡng nhiễu

C - Tập màu

Output: BR - thông tin không gian của vùng màu

For (i=1; i<=|C|; i++) {

Hình 2.4 Thuật toán CSI

Trong thuật toán CSI có ba tham số minarea, Cost(BR i ) và T, trong đó:

- Tham số minarea là diện tích tối thiểu của một vùng Nếu diện tích của một vùng nhỏ hơn minarea, vùng không được sử dụng cho

phân hoạch tiếp theo

- Nếu Cost(BR i ) bằng DX selectedrow, vùng này được phân hoạch theo

chiều dọc Trong trường hợp ngược lại, nếu Cost(BR i) bằng

DX selectedcol vùng được phân hoạch theo chiều ngang

- Tham số T là ngưỡng nhiễu được chấp nhận của mỗi vùng

Trang 29

Kết quả của thuật toán này là thông tin không gian của mỗi màu của ảnh

được biểu diễn bởi một danh sách <(c 1 ; br 1 ),(c 2 ; br 2 ), ,(c n ; br n )>, trong đó:

độ góc trên bên trái và góc dưới bên phải của hình chữ nhật tương ứng

Ví dụ: Cho ảnh nhị phân I có cỡ 1010 điểm ảnh.

a/ Vùng BR1 b/Vùng BR2

Hình 2.6 Ảnh I sau khi được tách ra thành hai vùng BR1 và BR2

Trang 30

Bảng 2.1 Tính độ lệch DX selectedrow cho phân hoạch theo dòng của ảnh I .

Ảnh I được tách ra thành hai vùng BR 1BR 2 như được chỉ ra trong

Hình 2.6 ở trên là do giá trị độ lệch theo cột DX selectedcol lớn hơn giá trị độ lệch

theo dòng DX selectedrow Hơn nữa, DX selectedcol đạt giá trị lớn nhất tại cột thứ 3 tính

từ bên trái Do đó, vùng được tạo ra từ cột thứ 1 đến cột thứ 3 của ảnh I tính

từ bên trái có độ thuần nhất lớn nhất (xem Bảng 2.1 và Bảng 2.2)

Trang 31

Bảng 2.2 Tính độ lệch DX selectedcol cho phân hoạch theo cột của ảnh I .

Ở đây vùng BR 2 được tách ra thành hai vùng con theo chiều ngang vàhướng từ phải qua trái như được chỉ ra ở Hình 2.7

Trang 32

a/ Vùng BR 2,1 b/ Vùng BR 2,2

Hình 2.7 Vùng BR 2 sau khi được tách ra thành hai vùng BR2,1 và BR2,2

Bảng 2.3 Tính độ lệch DX selectedrow cho phân hoạch theo dòng của vùng BR 2.

Trang 33

Vùng BR 2 được tách ra thành hai vùng BR 2 , 1BR 2 , 2 như được chỉ ra

trong Hình 2.7 ở trên là do giá trị độ lệch theo cột DX selectedcol lớn hơn giá trị độ

lệch theo dòng DX selectedrow Hơn nữa, DX selectedcol đạt giá trị lớn nhất tại cột thứ 6tính từ bên trái Do đó, vùng được tạo ra từ cột thứ 6 đến cột thứ 7 của vùng

2

BR tính từ bên trái có độ thuần nhất lớn nhất (xem Bảng 2.3; Bảng 2.4)

Bảng 2.4 Tính độ lệch DX selectedcol cho phân hoạch theo cột của vùng BR 2.

2.2 Phân đoạn ảnh theo mô hình ghép vùng

2.2.1 Ghép vùng theo phương pháp HAC

Phương pháp phân cụm phân cấp xây dựng một cấu trúc cây phân cấpcho các đối tượng và có hai phương pháp chính là xây dựng cây theo hướng

từ trên xuống (top-down) và xây dựng theo hướng từ dưới lên (bottom-up).

Với phương pháp bottom-up, đầu tiên mỗi đối tượng được coi như một

Ngày đăng: 09/12/2016, 15:22

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] Lương Mạnh Bá, Nguyễn Thanh Thủy (2006), Nhập môn Xử lý ảnh, Nxb Khoa học và Kỹ thuật, tr. 24-28, 132-143 Sách, tạp chí
Tiêu đề: Nhập môn Xử lý ảnh
Tác giả: Lương Mạnh Bá, Nguyễn Thanh Thủy
Nhà XB: Nxb Khoa học và Kỹ thuật
Năm: 2006
[2] Nguyễn Quang Hoan, (2006), Xử lý ảnh, Học viện Bưu chính viễn thông, Hà Nội, tr. 4-9 Sách, tạp chí
Tiêu đề: Xử lý ảnh
Tác giả: Nguyễn Quang Hoan
Năm: 2006
[3] Đỗ Năng Toàn, Phạm Việt Bình (2007), Giáo trình môn học Xử lý ảnh, Trường Đại học Thái Nguyên, tr. 37-38.Tiếng Anh Sách, tạp chí
Tiêu đề: Giáo trình môn học Xử lý ảnh
Tác giả: Đỗ Năng Toàn, Phạm Việt Bình
Năm: 2007
[4] David M. Blei, Hierarchical clustering, COS424 Princeton University, February 28, 2008, pp. 52-53 Sách, tạp chí
Tiêu đề: Hierarchical clustering
[5] Flickner.M, Sawhney.H, Niblack.W, Ashley.J, Huang.Q, Dom.B, Gorkani.D, Hafner.J, Lee. D, Petkovic. D, Steele.D, Yanker.D, Query by Image and Video Content: The QBIC System. IEEE Computer 1995, september, pp. 23-32 Sách, tạp chí
Tiêu đề: Query by Image and Video Content
[6] H. Tamura, S. Mori, and T. Yamawaki. “Texture features corresponding to visual perception”. IEEE Transactionson Systems, Man, and Cybernetics, SMC-8(6):460–473, 1978 Sách, tạp chí
Tiêu đề: Texture features corresponding to visual perception
[7] Quynh, N. H. and Tao, N. Q (2008), “Combining color and spatial information for retrieving landscape images”, In Proc. of IEEE on Image and Signal Processing, vol.2, pp. 480-484 Sách, tạp chí
Tiêu đề: Combining color and spatial information for retrieving landscape images
Tác giả: Quynh, N. H. and Tao, N. Q
Năm: 2008
[8] R. Haralick, K. Shanmugam, and I. Dinstein. “Texture feature for image classification”. IEEE Transactions on Systems, Man, and Cybernetics, SMC-3(6):610–621, 1973 Sách, tạp chí
Tiêu đề: Texture feature for image classification
[9] R.C. Gonzalez and R.E. Woods, Digital Image Processing. Addison- Wesley, third edition, 1992 Sách, tạp chí
Tiêu đề: Digital Image Processing
[10] R.O. Stehling, M.A. Nascimento, and A.X Falc˜ao. “An adaptive and efficient clustering-based approach for content based image retrieval in image databases”. In Proc. of the Intl. Data Engineering and Application Symposium, 2001, pp. 5–15 Sách, tạp chí
Tiêu đề: An adaptive and efficient clustering-based approach for content based image retrieval in image databases
[11] R.O. Duda and P.E. Hart. Pattern Classification and Scene Analysis. Wiley-Interscience, 1973 Sách, tạp chí
Tiêu đề: Pattern Classification and Scene Analysis
[12] Ramesh Jain, Rangachar Kastun, Brian G. Schunck (1995), Machine Vision (Chapter 3), McGRAW-HILL, pp. 89-91 Sách, tạp chí
Tiêu đề: Machine Vision
Tác giả: Ramesh Jain, Rangachar Kastun, Brian G. Schunck
Năm: 1995
[13] Sameer Singh, Maneesha Singh, Chid Apte, Petra Perner, Pattern Recognition and Image Analysis- partII, Springer, 2005, pp.533-537Các trang web Sách, tạp chí
Tiêu đề: Pattern Recognition and Image Analysis- partII
[15] Không gian Euclide, http://vi.wikipedia.org/wiki/Không_gian_Euclide, ngày 21 tháng 04 năm 2012 Sách, tạp chí
Tiêu đề: http://vi.wikipedia.org/wiki/Không_gian_Euclide
[16] HSL &amp; HSV, http://en.wikipedia.org/wiki/HSL_and_HSV, ngày 01 tháng 04 năm 2012 Sách, tạp chí
Tiêu đề: http://en.wikipedia.org/wiki/HSL_and_HSV
[17] JPG, http://en.wikipedia.org/wiki/JPEG, ngày 14 tháng 04 năm 2012 Sách, tạp chí
Tiêu đề: http://en.wikipedia.org/wiki/JPEG
[14] Hierarchical clustering, http://www.ics.uci.edu/~eppstein/280/tree.html, ngày 06 tháng 05 năm 1999 Link

HÌNH ẢNH LIÊN QUAN

Hình 1.6 Không gian màu RGB được trực quan hoá như một hình khối - Phương pháp phân đoạn ảnh dựa trên mô hình tách, ghép vùng
Hình 1.6 Không gian màu RGB được trực quan hoá như một hình khối (Trang 13)
Hình 2.2 Minh họa thuật toán tách cây tứ phân - Phương pháp phân đoạn ảnh dựa trên mô hình tách, ghép vùng
Hình 2.2 Minh họa thuật toán tách cây tứ phân (Trang 24)
Hình 2.3 Cây tứ phân tương ứng - Phương pháp phân đoạn ảnh dựa trên mô hình tách, ghép vùng
Hình 2.3 Cây tứ phân tương ứng (Trang 25)
Hình 2.12 Ví dụ minh họa thuật toán K-means - Phương pháp phân đoạn ảnh dựa trên mô hình tách, ghép vùng
Hình 2.12 Ví dụ minh họa thuật toán K-means (Trang 42)
Hình 3.2 Chọn ảnh từ cơ sở dữ liệu - Phương pháp phân đoạn ảnh dựa trên mô hình tách, ghép vùng
Hình 3.2 Chọn ảnh từ cơ sở dữ liệu (Trang 45)
Hình 3.4 Chọn ảnh từ cơ sở dữ liệu - Phương pháp phân đoạn ảnh dựa trên mô hình tách, ghép vùng
Hình 3.4 Chọn ảnh từ cơ sở dữ liệu (Trang 46)
Hình 3.8 Kết quả phân đoạn với số cụm = 2 - Phương pháp phân đoạn ảnh dựa trên mô hình tách, ghép vùng
Hình 3.8 Kết quả phân đoạn với số cụm = 2 (Trang 49)
Hình 3.9 Kết quả phân đoạn với số cụm = 4 - Phương pháp phân đoạn ảnh dựa trên mô hình tách, ghép vùng
Hình 3.9 Kết quả phân đoạn với số cụm = 4 (Trang 50)
Hình 3.10  Kiến trúc tổng quát của hệ thống tra cứu ảnh - Phương pháp phân đoạn ảnh dựa trên mô hình tách, ghép vùng
Hình 3.10 Kiến trúc tổng quát của hệ thống tra cứu ảnh (Trang 52)
Hình 3.11 Mô hình chi tiết của hệ thống tra cứu ảnh - Phương pháp phân đoạn ảnh dựa trên mô hình tách, ghép vùng
Hình 3.11 Mô hình chi tiết của hệ thống tra cứu ảnh (Trang 53)
Hình 3.13 Biểu đồ trình tự tra cứu ảnh - Phương pháp phân đoạn ảnh dựa trên mô hình tách, ghép vùng
Hình 3.13 Biểu đồ trình tự tra cứu ảnh (Trang 55)
Hình 3.14  Biểu đồ trình tự lưu vào cơ sở dữ liệu - Phương pháp phân đoạn ảnh dựa trên mô hình tách, ghép vùng
Hình 3.14 Biểu đồ trình tự lưu vào cơ sở dữ liệu (Trang 55)
Hình 3.16 Kết quả truy vấn - Phương pháp phân đoạn ảnh dựa trên mô hình tách, ghép vùng
Hình 3.16 Kết quả truy vấn (Trang 57)
Hình 3.17 Chọn ảnh truy vấn - Phương pháp phân đoạn ảnh dựa trên mô hình tách, ghép vùng
Hình 3.17 Chọn ảnh truy vấn (Trang 58)
Hình 3.18 Kết quả truy vấn - Phương pháp phân đoạn ảnh dựa trên mô hình tách, ghép vùng
Hình 3.18 Kết quả truy vấn (Trang 58)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w