NGHIÊN CỨU CÁC PHƯƠNG PHÁP PHÂN ĐOẠN ẢNH ĐA CẤP XÁM VÀ ẢNH MÀU Chương 1: Tổng quan về xử lý ảnh chương này giới thiệu chung bộ môn xử lý ảnh và giới thiệu về phương pháp phân đoạn ảnh Chương 2: Phương pháp phân đoạn ảnh dựa vào ngưỡng biên độ Chương này trình bày phương pháp phân đoạn ảnh dựa vào ngưỡng, một số kỹ thuật chọn ngưỡng dựa trên lược đồ xám – Histogram, phương pháp sử dụng tập mờ, độ ổn định thông tin (sử dụng entropy). Chương 3 : Phương pháp phân đoạn ảnh dựa theo miền đồng nhất
Trang 1HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
Trang 2Luận văn được hoàn thành tại:
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
Người hướng dẫn khoa học: PGS.TS Ngô Quốc Tạo
Phản biện 1 : ………
Phản biện 2 : ………
Luận văn sẽ được bảo vệ trước Hội đồng chấm luận văn thạc sĩ tại Học viện Công nghệ Bưu chính Viễn thông
Vào lúc: giờ ngày tháng năm .
Có thể tìm hiểu luận văn tại:
- Thư viện của Học viện Công nghệ Bưu chính Viễn thông
Trang 3PHẦN MỞ ĐẦU
Xử lý ảnh là một môn khoa học ứng dụng , nó là một chuyên ngành đượcnghiên cứu và ứng dụng rộng rãi với nhiều lĩnh vực khác nhau như vật lý, hóahọc , y học xử lý ảnh thường hướng tới các mục đích sau :
Xử lý ảnh ban đầu để có được một bức ảnh mới theo một yêu cầu
Phân tích ảnh để thu được các thông tin nhằm hỗ trợ cho việc phân loại vànhận biết ảnh
trong ảnh nhằm hiểu được kết cấu của bức ảnh ở mức độ cao hơn
Phân đoạn ảnh là bước quan trọng nhất trong quá trình xử lý ảnh nó quyếtđịnh độ chính xác nhận diện đối tượng trong ảnh chính vì vậy trong nhữngnăm gần đây phân đoạn ảnh rất được chú tâm nghiên cứu với nhiều các thuật
toán được đề xuất
Sau khi được tiếp cận môn học Xử Lý ảnh cộng thêm sự động viên của thầy
hướng dẫn tôi quyết định lựa chọn phân đoạn ảnh làm đề tài luận văn của mình.Tôi tập trung nghiên cứu và hệ thống lại các phương pháp phân đoạn ảnh như:phân đoạn theo ngưỡng, phân đoạn theo miền đồng nhất và cuối cùng phânđoạn theo đường biên
Luận văn được bố trí theo các phần như sau:
Chương 1: Tổng quan về xử lý ảnh chương này giới thiệu chung bộ môn xử lýảnh và giới thiệu về phương pháp phân đoạn ảnh
Chương 2: Phương pháp phân đoạn ảnh dựa vào ngưỡng biên độ
Chương này trình bày phương pháp phân đoạn ảnh dựa vào ngưỡng, một số kỹthuật chọn ngưỡng dựa trên lược đồ xám – Histogram, phương pháp sử dụng
tập mờ, độ ổn định thông tin (sử dụng entropy)
Chương 3 : Phương pháp phân đoạn ảnh dựa theo miền đồng nhất
Trang 4Chương này trình bày một số phương pháp phân đoạn ảnh dựa vào miền đồngnhất Phương pháp tách cây tứ phân, phương pháp phân vùng bởi hợp
Chương 4 : Phương pháp phân đoạn ảnh dựa theo đường biên
Chương này trình bày các kỹ thuật tác biên cơ bản , phương pháp gradient vớicác toán tử sobel, prewit, roberts Toán tử Laplace
Chương 5 : Kết quả và đánh giá thực nghiệm
Chương này trình bày chương trình cài đặt thử nghiệm đã hoàn thành
Trang 5CHƯƠNG 1: TỔNG QUAN VỀ XỬ LÝ ẢNH
1.1 Giới thiệu về xử lý ảnh
Xử lý ảnh là một lĩnh vực đang được quan tâm nghiên cứu và có nhiềuứng dụng quan trọng trong thực tế cùng với sự phát triển của công nghệ thôngtin, thúc đẩy các ngành kinh tế, xã hội khác phát triển Mục đích chính của xử
lý ảnh có thể nêu ra như sau:
Xử lý ảnh ban đầu để có được ảnh mới theo một yêu cầu xác định (Ví dụnhư ảnh mờ, cần xử lý để được ảnh rõ hơn)
Phân tích ảnh để thu được các thông tin đặc trưng giúp cho việc phân loại,nhận biết ảnh
Hiểu ảnh đầu vào để có những mô tả về ảnh ở mức cao hơn, sâu hơn
Một ảnh trong thế giới thực được xem như là một hàm hai biến thựca(x,y), với a là độ sáng của ảnh tại vị trí toạ độ thực (x,y) Một ảnh còn có thểchứa những ảnh con gọi là các “vùng quan tâm” Khái niệm vùng phản ánh mộtthực tế là trong ảnh thường chứa nhiều đối tượng, mỗi đối tượng tạo nên phần
cơ sở của một vùng Đối với một hệ xử lý ảnh cao cấp, chúng ta có thể áp dụngnhiều phép toán cho từng vùng ảnh một, ví dụ như một vùng ảnh này sẽ được
áp dụng các phép toán loại bỏ hiệu ứng mờ do chuyển động, trong khi một vùngảnh khác sẽ được xử lý để nâng cao chất lượng màu sắc của nó
Các giá trị độ sáng của ảnh thường được thể hiện dưới dạng số thực hoặc
số nguyên Thông thường, những giá trị sáng kiểu số nguyên là kết quả của mộtquá trình lượng hoá chuyển một thang đo liên tục thành một số mức rời rạc.Tuy nhiên trong nhiều quá trình hình thành ảnh, độ lớn của tín hiệu là kết quảđếm số hạt photon ở từng thời điểm, do vậy độ lớn ấy dĩ nhiên đã được lượnghoá sẵn Còn trong một số quá trình tạo ảnh khác, ví dụ như tạo ảnh siêu âm
Trang 6trong y khoa, phương pháp đo đạc vật lý trực tiếp sẽ cho ra các giá trị phức, mỗigiá trị phức này gồm một giá trị độ lớn kết hợp với một giá trị pha, và cả haiđều ở dạng số thực.
1.2 Các bước cơ bản trong xử lý ảnh.
Quá trình xử lý một ảnh số đầu vào nhằm thu được một ảnh đầu ra mongmuốn thường phải trải qua nhiều bước khác nhau Hình 1.1 giới thiệu nhữngbước cơ bản của quá trình đó
Phân đoạn ảnh Biểu diễn và
mô tả ảnh
Tiền xử lý ảnh
Thu nhận ảnh
CƠ SỞ TRI THỨC
Nhận dạng và giải thích
Hình 1.1: Các bước cơ bản trong xử lý ảnh
Trong hình 1.1, để hoàn thành được mục tiêu xử lý cụ thể ứng với mỗibước, chúng ta sẽ đến phải sử dụng rất nhiều khái niệm, định nghĩa, công cụ,thuật toán, kỹ thuật vốn đã được phát triển và cải tiến trong quá trình hình thànhnên ngành xử lý ảnh như ngày nay
Trong xử lý ảnh, công việc đầu tiên là thu nhận ảnh, trong sơ đồ củahình 1.1, nó chính là bước đầu tiên Để thực hiện, chúng ta cần có một bộ cảm
biến lấy ảnh và khả năng số hoá các tín hiệu liên tục được sinh ra bởi bộ cảm
Trang 7biến đó Bộ cảm biến ở đây có thể là một máy chụp ảnh đơn sắc/màu, hoặc mộtmáy chụp ảnh kiểu quét dòng cho ra một dòng ảnh ở một thời điểm cụ thể.
Sau khi đã có ảnh dưới dạng số hoá, công việc kế tiếp là tiền xử lý ảnh
đó Ở bước này, ảnh sẽ được cải thiện về độ tương phản, khử nhiễu, khử bóng,khử độ lệch, v.v với mục đích làm cho chất lượng ảnh trở nên tốt hơn nữa,chuẩn bị cho các bước xử lý phức tạp hơn về sau trong quá trình xử lý ảnh
Bước thứ ba trong quá trình xử lý ảnh thường là bước phân đoạn ảnh Cóthể nói, phân đoạn ảnh là việc chia một ảnh đầu vào thành nhiều phần con khácnhau hay còn gọi là các đối tượng Việc phân đoạn tự động thành những tập đốitượng khác nhau là nhiệm vụ phức tạp nhất trong xử lý ảnh số hoá Nếu kết quảphân đoạn ảnh chỉ dừng lại được ở mức độ thô thiển, thì toàn bộ những bước xử
lý tiếp theo sẽ không cho kết quả tốt, và như vậy không thể đạt được thành côngnào về mặt ứng dụng Mặt khác, các thuật toán phân đoạn không đủ mạnh, hoạtđộng không ổn định cũng sẽ là nguồn gốc dẫn đến thất bại của một giải pháp xử
trích chọn đặc trưng đề cập đến sự rút trích từ ảnh những đặc trưng cần thiết
Trang 8dẫn đến sự hình thành các thông tin định lượng liên quan đến những đặc trưngđó.
Bước cuối cùng trong sơ đồ đã nêu ra ở hình 1.1 là nhận dạng và giải
thích. Nhận dạng là công đoạn gán nhãn cho một đối tượng dựa trên thông tin
do bộ mô tả của đối tượng đó cung cấp Giải thích là công việc gán nghĩa chomột tập các đối tượng đã dược nhận biết
Trong hình 1.1 có đề cập đến “cơ sở tri thức” và mối tương tác giữa “cơ
sở tri thức” và các bước xử lý Tri thức về một không gian bài toán sẽ được mãhoá vào trong một hệ xử lý ảnh dưới dạng cơ sở dữ liệu tri thức Tri thức được
đề cập đến có thể chỉ đơn giản là sự chi tiết hoá các vùng trong ảnh, nơi đượcbiết trước là sẽ có những thông tin đáng quan tâm để tìm ra lời giải cho bàitoán, do vậy giúp hệ thống thu hẹp phạm vi tìm kiếm và giúp cho hệ thống tìm
ra lời giải nhanh hơn Ngoài mục đích hướng dẫn cách thức làm việc phù hợpcho mỗi bước xử lý ảnh, cơ sở tri thức còn có thể giúp điều khiển mối tương tácgiữa các bước xử lý với nhau Trong hình 1.1, sự tương tác này được thể hiệnthông qua các mũi tên hai chiều thay vì các mũi tên một chiều dùng để liên kếtbước xử lý này với một bước xử lý tiếp sau Sự mô tả như trong sơ đồ chỉ ra
rằng các bước xử lý thường liên lạc với nhau trên cơ sở tri thức biết trước vềdạng của kết quả mà chúng cần phải tạo ra
Ngoài những bước đã nêu trên, trong các hệ thống xử lý ảnh còn có mộtcông việc nữa đó là hiển thị ảnh, cũng là một bài toán phức tạp Yêu cầu hiểnthị ảnh có thể được đưa ra ở bất kỳ một bước xử lý nào trong sơ đồ ở hình 1.1.Một vấn đề nữa là không phải ứng dụng xử lý ảnh nào cũng cần phải thực hiệnđầy đủ tất cả các bước đã nêu, ví dụ như các ứng dụng chỉnh sửa ảnh nghệ thuậtchỉ dừng lại ở bước tiền xử lý Một cách tổng quát thì những chức năng xử lýbao gồm cả nhận dạng và giải thích thường chỉ có mặt trong những hệ thống
Trang 9phân tích ảnh tự động hoặc bán tự động, được dùng để rút trích ra những thôngtin quan trọng từ ảnh, ví dụ như các ứng dụng nhận dạng ký tự.
1.3 Giới thiệu sơ lược về phân đoạn ảnh (image segmentation)
Hình dáng của một đối tượng có thể được miêu tả hoặc bởi các tham sốcủa đường biên hoặc các tham số của vùng mà nó chiếm giữ Sự miêu tả hìnhdáng dựa trên thông tin đường biên yêu cầu việc phát hiện biên Sự mô tả hìnhdáng dựa vào vùng đòi hỏi việc phân đoạn ảnh thành một số vùng đồng nhất.Như vậy, phát hiện biên và phân vùng là hai cách tiếp cận đối ngẫu trong việcphân tích ảnh Các vùng ảnh yêu cầu phải có các đặc tính đồng nhất giúp phânbiệt được từng vùng Các đặc tính này tạo nên các vectơ đặc trưng để phân biệtmột vùng với các vùng khác
Trang 10CHƯƠNG 2 : PHƯƠNG PHÁP PHÂN ĐOẠN ẢNH DỰA
VÀO NGƯỠNG BIÊN ĐỘ
2.2 Phân đoạn ảnh dựa vào ngưỡng cố định
Phương pháp đầu tiên là chọn một ngưỡng độc lập với dữ liệu ảnh Nếuchúng ta biết trước là chương trình ứng dụng sẽ làm việc với những ảnh có độtương phản rất cao, trong khi đó, các đối tượng quan tâm rất tối còn nền gầnnhư đồng nhất và rất sáng, thì giá trị ngưỡng không đổi bằng 128 trên thang độsáng từ 0 đến 255 sẽ là một giá trị ngưỡng rất tốt, tức là số điểm ảnh bị phân lớpsai là cực tiểu
2.3 Chọn ngưỡng dựa trêm lược đồ (histogram)
Trong hầu hết các trường hợp, ngưỡng được chọn từ lược đồ độ sáng củavùng hay ảnh cần phân đoạn Có rất nhiều kỹ thuật chọn ngưỡng tự động xuấtphát từ lược đồ xám {h[b] | b = 0, 1, , 2B-1} đã được đưa ra Tuy nhiên cácthuật toán làm trơn cần phải cẩn thận, không Kết quả của bước phân đoạn ảnhthường được cho dưới dạng dữ liệu điểm được làm dịch chuyển các vị trí đỉnhcủa lược đồ Nhận xét này dẫn đến thuật toán làm trơn dưới đây:
h smooth [b] 1
W
(W 1) / 2
h raw w(W 1) / 2
Trang 11Trong đó, W thường được chọn là 3 hoặc 5.
2.3.1 Thuật toán đẳng liệu
Đây là kỹ thuật chọn ngưỡng theo kiểu lặp do Ridler và Calvard đưa ra.Trước hết, lược đồ sẽ được phân đoạn thành hai phần bằng một giá trị ngưỡngkhởi động như 0=2B-1, tức là bằng phân nửa thang độ xám động của ảnh Sau
đó, các trung bình mẫu (mf,0) của những điểm ảnh thuộc đối tượng và (mb,0) củanhững điểm ảnh nền sẽ được tính toán Một giá trị ngưỡng mới 1 sẽ được tính
kế đó bằng cách lấy giá trị trung bình của hai trung bình mẫu nói trên Quá trìnhnày cứ thế sẽ được tiếp tục với ngưỡng mới cho đến khi nào giá trị ngưỡngkhông thay đổi nữa thì dừng lại
2.3.2 Thuật toán đối xứng nền
Đỉnh cực đại maxp tìm được nhờ tiến hành tìm giá trị cực đại trong lược
đồ Sau đó thuật toán sẽ được áp dụng ở phía không phải là điểm ảnh thuộc đốitượng ứng với giá trị cực đại đó nhằm tìm ra giá trị độ sáng a ứng với giá trị
phần trăm p% mà: P(a) = p%, trong đó P(a) là hàm phân phối xác suất về độ
sáng được định nghĩa như sau:
Định nghĩa: [Hàm phân phối xác suất về độ sáng]
Hàm phân phối xác suất P(a) thể hiện xác suất chọn được một giá trị độ sáng từ một vùng ảnh cho trước, sao cho giá trị này không vượt quá một giá trị sáng cho trước a Khi a biến thiên từ - đến +, P(a) sẽ nhận các giá trị từ 0 đến 1 P(a) là hàm đơn điệu không giảm theo a, do vậy dP/da 0
2.3.3 Thuật toán tam giác
Thuật toán này làm như sau: Nối đường thẳng từ điểm Hmax của lược đồ(điểm có histogram lớn nhất, có mức xám bmax) đến điểm Hmin của lược đồ
Trang 12(điểm ứng với độ sáng nhỏ nhất bmin) Với mỗi độ sáng b trong khoảng [bmax,
bmin], chúng ta đi tính khoảng cách d từ điểm Hb của lược đồ (ứng với giá trị độsáng b) đến Giá trị b0 ứng với khoảng cách d lớn nhất sẽ được chọn làm giátrị ngưỡng T
2.3.4 Chọn ngưỡng đối với Bimodal Histogram
Ngưỡng T được chọn ở tại vị trí cực tiểu địa phương của histogram nằmgiữa hai đỉnh của histogram Điểm cực đại địa phương của histogram có thể dễdàng được phát hiện bằng cách sử dụng biến đổi chóp mũ (top hat) do Meyerđưa ra: Phụ thuộc vào tình huống chúng ta đang phải làm việc là với nhưng đốitượng sáng trên nền tối hay đối tượng tối trên nền sáng mà phép biến đổi top hat
sẽ có một trong hai dạng sau:
a/ Các đối tượng sáng:
TopHat( A, B) A ( A B) A max(min ( A))
B B
b/ Các đối tượng tối:
TopHat( A, B) A ( A B) A min (max( A))
B B
(2.5)
(2.6)Việc tính toán giá trị cực tiểu địa phương của histogram thì khó nếuhistogram nhiễu
Trong một số ứng dụng nhất định, cường độ của đối tượng hay nền thayđổi khá chậm Trong trường hợp này, histogram ảnh có thể không chứa hai thuỳphân biệt rõ ràng, vì vậy có thể phải dùng ngưỡng thay đổi theo không gian
Hình ảnh được chia thành những khối hình vuông, histogram và ngưỡng đượctính cho mỗi khối tương ứng Nếu histogram cục bộ không phải là bimodalhistogram thì ngưỡng được tính bằng cách nội suy ngưỡng của các khối lánggiềng Khi ngưỡng cục bộ đã có thì áp dụng thuật toán phân ngưỡng ở hình 2.1cho khối này
Trang 132.4 Phương pháp sử dụng entropy
Entropy là một phép đo nội dung của ảnh
2.5 Phương pháp sử dụng tập mờ (fuzzy set)
Bước đầu tiên là xác định hàm thành viên hay xác suất thuộc đối tượnghoặc xác suất thuộc nền của từng điểm ảnh ứng với một sự phân ngưỡng banđầu cho trước
Sau khi có được các giá trị trên, để tối thiểu hoá tính mờ, ta thử tất cả cácgiá trị ngưỡng t có thể và chọn giá trị sinh ra độ mờ nhỏ nhất làm ngưỡng cầntìm
trích ra những thông tin quan trọng từ ảnh, ví dụ như các ứng dụng nhậndạng ký tự
Trang 14CHƯƠNG 3: PHƯƠNG PHÁP PHÂN ĐOẠN ẢNH THEO
MIỀN ĐỒNG NHẤT
3.1 Giới thiệu
Kỹ thuật phân đoạn ảnh thành các miền đồng nhất dựa vào các thuộc tínhquan trọng nào đó của miền Mỗi một thuộc tính khi sử dụng thì có một tiêuchuẩn phân đoạn tương ứng Một số thuộc tính tiêu biểu là: mức xám, màu sắc(đối với ảnh màu), kết cấu sợi
Có ba cách tiếp cận chủ yếu trong phân vùng ảnh theo miền đồng nhất vàđộc lập với tiêu chuẩn lựa chọn tính đồng nhất:
- Phương pháp phân tách – cây tứ phân (split – quad trees)
- Phương pháp hợp (merge)
- Phương pháp tách - hợp ( split – merge)
3.2 Phương pháp tách cây tứ phân (quad tree)
Phương pháp này kiểm tra tính hợp thức của tiêu chuẩn đồng nhất mộtcách tổng thể trên miền lớn Nếu tiêu chuẩn được thoả việc phân đoạn coi nhưkết thúc Trong trường hợp ngược lại ta chia miền đang xét thành 4 miền nhỏhơn, ta lại áp dụng đệ quy bằng phương pháp trên cho mỗi miền nhỏ hơn chođến khi tất cả các miền đều thoả mãn
3.3 Các phương pháp tách bởi hợp
Ý tưởng của phương pháp này là xem xét ảnh từ các miền nhỏ nhất rồihợp chúng lại nếu thoả tiêu chuẩn để được một miền đồng nhất lớn hơn Ta lạitiếp tục với miền thu được cho đến khi không thể hợp được nữa Số miền cònlại cho ta kết quả phân đoạn ảnh Miền nhỏ nhất của bước xuất phát là điểmảnh Việc hợp 2 vùng được thực hiện theo nguyên tắc sau:
Trang 15- Hai vùng phải đáp ứng tiêu chuẩn, như cùng màu hay cùng mức xám.
- Chúng phải kế cận nhau
3.4 Phương pháp tách hợp (split-merge)
Trước tiên dùng phương pháp tách để tạo nên cây tứ phân, phân đoạntheo hướng từ gốc đến lá Tiếp theo tiến hành duyệt cây theo chiều ngược lại vàhợp các vùng có cùng tiêu chuẩn Với phương pháp này ta thu được miêu tả cấutrúc của ảnh với các miền liên thông có kích thước tối đa
3.4.1 Thuật toán tô màu.
Thuật toán này sử dụng khái niệm 4 liên thông Người ta dùng một cửa sổ
di chuyển trên ảnh để so sánh với tiêu chuẩn hợp
3.4.2 Thuật toán đệ quy cục bộ.
Thuật toán đệ quy cục bộ sử dụng phương pháp tìm kiếm trong một cây
để làm tăng kích thước vùng Trước tiên, người ta tìm kiếm các lân cận để tăngkích thước tối đa của vùng rồi sau đó mới quan tâm đến các vùng khác và cũng
áp dụng thuật toán trên Thuật toán này sử dụng một thủ tục đệ quy GiaTang đểthực hiện việc tăng kích thước một vùng một cách đệ quy
3.5 Thuật toán tham lam dựa trên lý thuyết đồ thị.
3.5.1 Giới thiệu.
Phân đoạn ảnh dựa vào đồ thị là một phương pháp phân đoạn dựa trênthuộc tính toàn cục (non-local) của ảnh đầu vào Phương pháp này phát hiện rabiên giữa hai vùng của ảnh bằng cách so sánh sự khác nhau giữa nội vùng(inter-component) với sự khác nhau với các vùng khác Thuật toán phân đoạndựa vào đồ thị tuân theo chiến lược tham lam, có thời gian chạy gần như tuyếntính, nhưng vẫn đảm bảo được việc phân đoạn chính xác và hiệu quả