Nhằm giúp cho sinh viên những kiến thức cơ bản về các kỹ thuật xử lý ảnh, trong đó Nghiên cứu các vấn đề về phát triển và tách biên ảnh là một trong nhưng mục tiêu quan trọng trong lĩnh
Trang 1TRONG XỬ LÝ ẢNH SỐ . LG SE ESEEEE11511151E1151515 5151111111111 1111 11 1.E 5
I Các phương pháp phát hiện biên trong xử lý ảnh sỐ - 66s cscseesd 5
1 Một số khái niệm ¿- - + <2 St E13 1 1 11113131111 11131311 1111 ty 5
2 Các phương pháp phát hiện biên . -<<<<<<<<<<<<<<ssssssss 7 II.Các phương pháp tách biên ảnh trong xử lý ảnh sỐ - 56s s£+css4 19
1 Cơ sở lý thuyết tách biÊn - <9 E1 ngu: 19
2 Các bộ tách ĐIÊn - - - c9 HH SH HH Ki ve 21
3 Tách biên ảnh màu dùng phương pháp Gradlent 25 Chuong 3 DANH GIA KET QUA NGHIEN CUU VA KET LUẬN 31
1 Phát hiện biên trực tiẾp: - - - xxx 3v 11c 1g 31
2 Phương pháp phát hiện biên gián tiẾp - «E113 3kg: 33
©7777 cscscscscscsesscssscssscssscesesesscsssesescsesssssssssssesssesesesseenseseneneas 33 TÀI LIỆU THAM KHẢO ¿- ¿26 E 9E EEEEESEEEEEEEE xxx rrgreg 34
Trang 2LOI MO ĐẦU
Hiện nay, trong các trường đại học và cao dang, xử lý ảnh đã trở thành một môn học chuyên ngành của sinh viên các ngành công nghệ thông tin, Viễn thông Nhằm giúp cho sinh viên những kiến thức cơ bản về các kỹ thuật xử lý ảnh, trong đó Nghiên cứu các vấn đề về phát triển và tách biên ảnh là một trong nhưng mục tiêu quan trọng trong lĩnh vực xử lý ảnh số Sau giai đoạn tiền xử lí ảnh, ảnh đã được tăng cường hay khôi phục để làm nỗi các đặc trưng chủ yếu, tiếp theo là quá trình phân tích ảnh Quá trình phân tích ảnh gồm các giai đoạn trích trọn các đặc tính, sau đó là phân đoạn ảnh thành các phần tử, thí dụ như phân đoạn theo biên Phát hiện biên là một phần trong
quá trình phân tích ảnh sau khi đã lọc ảnh hay tiền xử lí ảnh Đề tìm hiểu việc phát hiện
và đò biên ảnh trước hết chúng ta tìm hiểu các khái niệm ban đầu
Biên ảnh: biên ảnh là những điểm mà tại đó hàm độ sang cua anh liên tục có bước nhảy hoặc biến thiên nhanh Cơ sở toán học của việc phát hiện và tách biên là phép toán đạo hàm, phương pháp này còn được gọi là phương pháp phát hiện biên trực tiếp Tập hợp các điểm biên tạo thành đường biên(edge) hay đường bao (boundary) của
ảnh Ví dụ trong một ảnh nhị phân một điểm có thê được gọi là biên nếu đó là điểm
đen và có ít nhất một điểm trắng lân cận
Vùng ảnh (region): là tập tất cá những điểm ảnh thuộc về một đối tượng trong ảnh Ranh rới giữa các vùng ảnh gọi là biên ảnh và các đường biên khép kín cho phép xác định vùng ảnh
Y nghĩa của đường biên trong xử lí: đường biên là một loại đặc trưng cục bộ tiêu biểu trong việc phân tích và nhận dạng ảnh Ngoài ra người ta còn sử dụng đường biên để phân vùng ảnh và ngược lại dùng các vùng ảnh để xác định biên Đây chính là phương pháp xác định biên gián tiếp
a, Đường hiện lý tưởng b, Duong bién bac thang c, Đường hiện thực
Đường biên của ảnh Như vậy, phát hiện biên một cách lí tưởng là phát hiện được tất cả các đường biên trong đối tượng Định nghĩa toán học trên là cơ sở cho các kỹ thuật phát hiện biên
mà chúng ta sẽ tìm hiểu trong tiểu luận
Page 2
Trang 3Chương I GIỚI THIỆU PHÁT BIÊU ĐÈ TÀI
1 Phát biểu về đề tài
Xử lý ảnh là một trong những máng quan trọng nhất trong kỹ thuật thị giác máy tính,
là tiêu đề cho nhiều nghiên cứu trong lĩnh vực này Hai nhiệm vụ cơ bản của quá trình
xử lý ảnh là nâng cao chất lượng thông tin hình ảnh và xử lý số liệu cung cấp cho các quá trình khác trong đó có việc ứng dụng thị giác vào điều khiến
Đã có rất nhiều các công trình nghiên cứu tại nhiều quốc gia từ năm 1920 đến nay về
xử lý ảnh đã góp phần thúc đây tiễ bộ trong lĩnh vực này lớn mạnh không ngừng Qúa trình bắt đầu từ việc thu nhận ảnh nguồn (từ các thiết bị thu nhận ảnh dạng số hoặc tương tự) gửi đến máy tính Dữ liệu ảnh được lưu trữ ở dạng phù hợp với quá trình xử
lý Người lập trình sẽ tác động các thuật toán tương ứng lên đữ liệu ảnh nhằm thay đổi cầu trúc ảnh phù hợp với các ứng đụng khác nhau
Một trong những vấn đề trọng tâm nghiên cứu của lĩnh vực thị giác máy là biên và các thao tác trên nó vì các kĩ thuật phân đoạn ảnh chủ yếu đựa vào biên Nhìn chung về mặt toán học, người ta coi điểm biên của ảnh là điểm có sự thay đổi nhanh hoặc đột ngột về độ xám (hoặc màu) Ví dụ, trong một ảnh nhị phân, một điểm có thể gọi là biên nếu đó là điểm đen và có ít nhất một điểm trắng ở bên cạnh Tập hợp các điểm biên liên tiếp tạo thành biên hay đường bao quanh của ảnh Ý nghĩa của đường biên trong
Việc nhận dạng đối tượng phụ thuộc nhiều vào các đặc trưng trích chọn và các đặc trưng này chủ yếu được trích chọn từ biên Đây là một đề tài vẫn đang được quan tâm và phát triển Nhất là, ở Việt Nam hiện nay, chưa có nhiều nghiên cứu về van đề nhận dạng các đối tượng ảnh Mặc dù, những ứng dụng thực tế đòi hỏi có những cách giải quyết cụ thể, chắng hạn như phần mềm nhận dạng các đối tượng địa lý, các biểu tượng trên bản đồ, phần mềm phát hiện và đếm các đối tượng chuyên động
Trang 4(phần mềm nhập phiếu điều tra dạng đánh đấu) dùng biên để tách các đối tượng
chứa dẫu, WinGIS, VectMap véc tơ hoá bản đồ dựa trên việc trích chọn xương ảnh Biên và xương đã và đang tạo ra các kết quả thực tế phong phú và đa dạng
Mục tiêu của tiêu luận :
> Tìm hiểu các kỹ thuật xử lý biên trong xử lý ảnh và đồ hoạ nhằm kế thừa
và cái tiễn các kỹ thuật trước đó
> Nghiên cứu kỹ thuật phát hiện biên trực tiếp và gián tiếp và một số
phương pháp phát hiện biên mới cho một số lớp bài toán
> Dò biên và kết nối đường biên (nguyên tắc dò biên — phương pháp đò biên
theo quy hoạch động)
> Đưa ra một số bài toán ứng dụng thực tế có sử dụng cá phương pháp trên
và cài đặt
3 Nội dung chính của tiểu luận
a Các lý thuyết liên quan đến đề tài, có ví đụ minh hoạ
b Cài đặt thử nghiệm chương trình (gồm cấu trúc đữ liệu và giải thuật nếu
có)
c Đánh giá kết quả nghiên cứu và kết luận
Trang 5Chương II CÁC PHƯƠNG PHÁP PHÁT HIỆN VÀ TÁCH
BIEN ANH TRONG XU LY ANH SO
I Các phương pháp phát hiện biên trong xử lý ảnh số
1 Một số khái niệm
1.1 Định nghĩa và khái niệm
Điểm Biên: Một điểm ảnh được coi là điểm biên nếu có sự thay đổi nhanh hoặc đột
ngột vê mức xám (hoặc màu) Ví dụ trong ảnh nhị phân, điêm đen gọi là điêm biên nêu lân cận nó có ít nhât một điêm trăng
Đường biên (đường bao: boundary): tập hợp các điểm biên liên tiếp tạo thành một
đường biên hay đường bao
Ý nghĩa của đường biên trong xử lý: ý nghĩa đầu tiên: đường biên là một loại đặc trưng
cục bộ tiêu biểu trong phân tích, nhận dạng ảnh Thứ hai, người ta sử dụng biên làm phân cách các vùng xám (màu) cách biệt Ngược lại, người ta cũng sử dụng các vùng ảnh đề tìm đường phân cách
Tâm quan trọng của biên: đề thấy rõ tầm quan trọng của biên, xét ví dụ sau: khi người họa sỹ muốn vẽ một danh nhân, họa sỹ chỉ cần vẽ vài đường nứt tốc họa mà không cần
a, Duong bien ly tuong b, Đường biến bậc thang c, Đường biển thực
Hình 4.1 Đường bao của ảnh Các khái niệm và định nghĩa tóm tắt trên là cơ sở giúp ta hiểu và dùng để hiểu cách xây
dựng, thiết kế các kỹ thuật phát hiện biên ảnh
Trang 6Các bước của phân tích ánh có thê mô tá theo sơ đồ đưới đây Việc đò và tìm biên ảnh
là một trong các đặc trưng thuộc khối trích chọn đặc trưng
1.2 Phán loại các kỹ thuật phát hiện biên
Từ định nghĩa toán học của biên người ta sử dụng hai phương pháp phát hiện biên như sau (phương pháp chính)
a, Phương pháp phát hiện biên trực tiếp: phương pháp này chủ yêu dựa vào sự biến
thiên độ sáng của điểm ánh đề làm nỗi biên bằng kỹ thuật đạo hàm
¢ Néu lay dao ham bậc nhất của ảnh: ta có phương pháp Gradient
‹ Nếu lẫy đạo hàm bậc hai của ảnh: ta có phương pháp Laplace
Hai phương pháp này được gọi chung là phương pháp dò biên cục bộ
Ngoài ra, người ta còn sử dụng phương pháp “đi theo đường bao” dựa vào công cụ toán học là nguyên lý quy hoạch động va đượng gọi là phương pháp dò biên tổng thể Phương pháp dò biên trực tiếp có hiệu quả và ít bị tác động của nhiễu
b, Phương pháp phát hiện biên gián tiếp: Nêu bằng cách nào đây, chúng ta thu đượng các vùng ảnh khác nhau thì đường phân cách giữa các vùng đó chính là biên Nói cách khác, việc xác định đường bao của ảnh được thực hiện từ ảnh đã được phân vùng Phương pháp dò biên gián tiếp khó cài đặt nhưng áp dụng tốt khi sự biến thiên độ sáng nhỏ
Cú ý: Kỹ thuật đò biên và phân vùng ảnh là hai bài toán đối ngẫu của nhau
1.3 Quy trình phút hiện biên
BI: Do ảnh ghi được thường có nhiễu, bước một là phải lọc nhiễu theo các phương
Trang 7Bỏ: Dinh vị bien Chi y rang ky thuật nổi biên gây tác dụng phụ là gây nhiễu làm một
sô biên giả xuât hiện do vậy cân loại bỏ biên gia
B4: Liên kết và trích chọn biên
2 Các phương pháp phát hiện biên
2 1 Phương pháp phát hiện biên cục bộ( phát hiện biên trực tiếp)
a Phương pháp phát hiện biên dựa trên Gradient của ảnh
Định nghĩa: Gradient là một vec tơ /fz, y) có các thành phần biểu thị tốc độ thay đổi
mức xám của điểm ảnh (theo hai hướng x, y trong bối cảnh xử lý ảnh hai chiều) tức:
Trang 8
Kỹ thuật Gradient: Theo dinh nghia vé Gradient, néu 4p dung né vào xử lý ảnh, việc tính toán sẽ rất phức tạp Để đơn giản mà không mất tính chất của phương pháp Gradient, người ta sử dụng kỹ thuật Gradient dùng cặp mặt nạ H7, H2 trực giao (theo 2 hướng vuông góc) Nếu định nghĩa g1, ø2 là Gradient theo hai hướng x, y tướng ứng thi bién 46 g(m,n) tai diém (m,n) dugc tinh:
Đề giảm độ phức tạp tính toán, 40 được tính gần đúng như sau:
y yl
Xét mot so toan tu Gradient tiéu biéu nhu toan tu | |
Robert, Sobel, Prewitt, dang hướng (Isometric), 4- |
¢ Toan tir Robert (1965) ele LO
Robert áp dụng công thức tính Gradient tại điêm |
Voi moi diém anh J(x,y) dao ham theo x, y dugc | |
ky hiéu tuong tng: gx, gy:
Trang 9¢ Toan tir (mat na) Sobel
Toan tt Sobel duoc Duda va Hart [5] dat ra nam 1973 với các mặt nạ tương tự như của Robert nhưng câu hình khác như sau:
Hương ngang (x) Hưởng dọc (y)
¢ Toan tir 4-lan can (4-Neighbour Operator)
Toán tử 4-lân cận được Chaudhuri và Chandor (1984) nêu ra, trong đó mặt na có kích thước 3x3 được thay cho mạt nạ 2x2 của toán tử Robert Các mặt nạy này được cho:
Trang 10NHnii 4.6: Mũf nạ 4-iữn cửu,
Kirsh đã đề xuất các mặt nạ theo 8 hướng như 8 hướng của la bàn (Compass) Hình 4.8
là mô hình 8 hướng và được đặt tên theo hướng địa lý và theo chiều kim đồng hồ:
Đông, Đông-Nam, Nam, Nam-Tây, Tây, Tây-Nam, Tây-Bắc, Bắc, Đông-Bắc; mỗi
hướng lệch nhau 457
¢ Toan tir la ban Kirsh:
Có nhiều toán tử la bàn khác nhau Trong phạm vi tài liệu này, ta xem xét toán tử la bàn Kirsh đặc trưng bởi tám mặt nạ với kích thước 3x3 như sau:
Trang 115 5 5 =3 4 5 =3 -3 5 Hyw=|-3 0 -3 THÍ bang — nan mi 5 Boxe |? ÚU ä
Ky hiéu Ai; i= J, 2, ., 8 la Gradient theo 8 hướng như 8§ mặt nạ kê trên, khi đó biên độ
Gradient tai diém anh (x,y) duoc tinh theo
A(x, y) = Max (|gi(x,y)|) i=1, 2, ., 8 (4-11)
¢ Toan ti la ban khac:
Ngoài toán tử la bàn Kirsh, một số toán tử la bàn khác sử dụng bộ mặt nạ § hướng khác như:
Trang 12A(x, y) Max(WTI(x,y)) i=vớii=l 2, ,n (4-12)
c Phát hiện biên dựa trên laplace của ảnh
Để khắc phục hạn chế và nhược điểm của phuong phap Gradient, trong đó sử dụng đạo hàm riêng bậc nhất người ta nghĩ đến việc sử dụng đạo hàm riêng bậc hai hay toán
tử Laplace Phương pháp dò biên theo toán tử Laplace hiệu quả hơn phương pháp toán
tử Gradient trong trường hợp mức xám biến đổi chậm, miền chuyên đổi mức xám có
Trang 13Ghi chú: Mặt nạ H1 còn cải biên bằng việc lấy giá trị ở tâm bằng 8 thay vì giá trị 4
Đề thấy rõ việc xấp xi đạo hàm riêng bậc hai trong không gian hai chiều với mặt nạ J7 làm ví dụ, ta có thể tính gần đúng như sau:
Kỹ thuật theo toán tử Laplace tạo đường biên mảnh (có độ rộng 1 pixel) Nhược
điểm của kỹ thuật này rất nhạy với nhiễu, do vậy đường biên thu được thường kém ôn
định
d Tách biên ảnh theo phương pháp canny
Bộ tác sườn ảnh theo Canny (1986) dựa trên cặp đạo hàm riêng bậc nhất với việc làm sạch nhiễu Mục này được để riêng vì đây là phương pháp tách đường biên khá phố biến được dùng theo toán tử đạo hàm Như đã nói, phương pháp đạo hàm chịu ảnh hưởng lớn của nhiễu Phương pháp đạt hiệu quả cao khi xấp xỉ đạo hàm bậc nhất cua Gauss
Trang 14
Hinh 4.9 Mo hinh tinh cua phireng phap Canny
Do bộ lọc Gauss là tỏch được, ta cú thể thực hiện riờng biệt cỏc tớch chập theo x và y:
G (x.y) =G,(x)@ G(y) và Œ (x.y)=G (y)đG(+x) (4-19)
Từ đú ta cú:
ƒ.(x.y)=G (x)đG(y) đù và f W(X, Ơ) = G, (VI@GO)eT) (4-20)
Với biờn độ và hướng tớnh theo cụng thức trờn, thuật toỏn được minh họa trờn Hỡnh 4.9
2.2 Dũ biờn theo quy hoạch động
Dũ biờn theo phương phỏp GradIent là xỏc định cực trị cục bộ của Gradient theo cỏc hướng: cũn phương phỏp Laplace dựa vào cắt điểm khụng của đạo hàm bậc hai Phương phỏp dũ biờn theo quy hoạch động là phương phỏp tỡm cực trị tổng thể theo nhiều bước Nú dựa vào nguyờn lý tối ưu của Beliman Nguyờn lý này phỏt biểu như
Trang 15đoạn CB cũng là còn đường tối ưu từ C đến 8 không kê đến ta đến C bằng cách nào (Hình 4.10)
—B
Anh 4.10 Minh hoa nguyén iy Beliman
Trong kỹ thuật này, giả sử bản đồ biên đã được xác định và được biểu diễn dưới dạng
đồ thị liên thông X chặng Giả sử hàm đánh giá được tính theo công thức:
S(x, y.W)= S|e(x,)|— ##'|8(x,)— 90x, ,)|— 85 4(xy.xya) (4-21)
k=l
© xk, k=l, ., N: biểu diễn các đỉnh của đồ thị trong chặng thứ &;
¢ d(x ,y): khoảng cách giữa 2 đỉnh x và y tính theo các định nghĩa tương ứng về khoảng cách;
° lơ(xk)| và O(xk) la Gradient bién d6 va Gradient hướng ở đỉnh x
«a va Ø là các hằng số không âm
Đường bao tói ưu sẽ nhận được bằng cách nỗi các đỉnh kx, k =1, ., N nào đó sao cho S(x1, , xN, N) đạt cực đại
Định nghĩa hàm o như sau:
xl aN-1 Viết lại công thức (4-21) một cách đệ quy ta có:
(Xj yeep Nays WV) = S (X00 X 4, —1)+
g(xy)|— e|Ø(%x,)—6Ø(,_¡)|— 8d(xy.xy 3) (4-23)
Đặt /#«N-1, xN)=|g(xN)| - a| O(ck) - O(xk-1) | - Bd(xN,xN-1) va thay vào ( 4-23) ta có:
S (x, ees Xyy N= S(Xp oe Nyy, M1) + f(xy Ky) (4-24)
Trang 16Với cách này, thay vì tìm tối ưu toàn cục phức tạp của S(x/, ,.xN, N), ta tim toi ư của
N chang theo t6i wu 2 bién Trong mỗi chặng, với mỗi xk tìm tối ưu (x,k)ko Đề dễ hình dung, xét ví dụ sau:
Giả sử có bản đồ biểu diễn bởi đồ thị liên thông (Hình 4.11a) Theo phương pháp trên
có ọ(4,1)= 5, với k=2 có ọ (D,2) = max(11,12) = 12 Điều đó có nghĩa là đường từ
A đến D đi qua C và 4C?D) là biên được chọn với &k=2 Tương tự, voi k=4, có hai đường được chọn là 4CDEF và 41GHJ Tuy nhiên, với &=5 thì đoạn J bị loại và chỉ ton tai đường duy nhất với cực đại là 28 Như vậy, biên được xác định là 4DEƑB
a(x .k)
ẻ ø\ mm
AG
a) Dé thi liên thông biểu diễn biên b) Quá trình dò biên theo quy hoạch động
Hình 4.11 Dò biển theo phiương phúp gay hoạch động
Trang 172.3 Một số phương pháp khác
Ngoài các phương pháp trên, người ta cũng áp dụng một số phương pháp khác cải tiễn như tiếp cận bởi mô hình mặt, cách tiếp cận tối ưu hóa Cách tiếp cận theo mô hình mặt dựa vào việc thực hiện xấp xỉ đa thức trên ảnh gốc hay ảnh đã thực hiện phép lọc Laplace Cách tiếp cận tôi ưu nhằm xác định một hàm (một bộ lọc), làm giảm phương sai o2 hoặc giảm một số điểm cực trị cục bộ Dưới đây sẽ trình bày một cách tóm tắt các phương pháp đó
a Tiếp cận theo mô hình mặt
Tư tưởng của phương pháp này là tại lân cận điểm cắt không (điểm biên), ảnh sau khi lọc Laplace có thê được xấp xỉ bởi một đa thức bậc 3 theo hàng và cột Đa thức thường được dùng là đa thức Trebưchép với kích thước 3x3 Các đa thức này được định nghĩa như (x.1) -= x? —
PO(,y)=1; Pl (x,y)=x; P2(x,y)=y;
P6(x,y)=xP35(x,y); P7 (x,y)=yP3(x.y); PS(x,y)= P5(x,y)P3(%.y)
Với mỗi điểm cắt không phát hiện tại P(+, y) trong ảnh đã được lọc bởi toán tử Laplace
— Gauss, Huertas va Medioni đã cho được tính theo công thức tính xấp xi:
N~I
n=U
Vấn đề là xác định các hệ số ai, ¡=1, 2, ., N-1 Nếu W là cửa số lọc tại điểm cắt không
va x, y, i, j trong cua số; các hệ số a có thê được tính toán như một tô hợp tuyến tính: