Xử lý ảnh bao gồm nhiều kỹ thuật như: thu nhận ảnh, nén dữ liệu ảnh, xử lý nâng cao chất lượng và khôi phục ảnh, phát hiện biên, phân vùng ảnh, nhận dạng ảnh… Trong các kỹ thuật trên thì
Trang 1MỤC LỤC
MỞ ĐẦU 3
Chương 1 5
SƠ LƯỢC VỀ XỬ LÝ ẢNH 5
1.1 Biểu diễn ảnh 6
1.2 Tăng cường ảnh - Khôi phục ảnh 6
1.3 Biến đổi ảnh 7
1.4 Phân tích ảnh 7
1.5 Nhận dạng ảnh 7
1.6 Nén ảnh 8
Chương 2 9
MỘT SỐ KỸ THUẬT PHÂN ĐOẠN ẢNH 9
2.1 Sơ lược về phân đoạn ảnh 9
2.2 Phân vùng ảnh dựa theo ngưỡng biên độ 10
2.2.1 Ngưỡng cố định 11
2.2.2 Ngưỡng tự động 11
2.3 Phân vùng theo miền đồng nhất 12
2.3.1 Phương pháp tách cây tứ phân 14
2.3.2 Phương pháp cục bộ hay phân vùng bởi hợp 18
2.3.2.1 Thuật toán tô màu 19
2.3.2.2 Thuật toán đệ quy cục bộ 20
2.3.3 Phương pháp tổng hợp 21
2.4 Phân vùng dựa theo đường biên 22
2.4.1 Phát hiện biên và làm nổi biên 23
2.4.1.1 Phương pháp Gradient 25
2.4.1.2 Kỹ thuật Laplace 29
2.4.2 Làm mảnh biên 30
2.4.3 Nhị phân hoá đường biên 31
2.4.4 Miêu tả đường biên 32
Trang 22.4.4.1 Mã hoá theo toạ độ đề các 34
2.4.4.2 Mã hoá Freeman 35
2.4.4.3 Xấp xỉ bởi đoạn thẳng 38
Chương 3 40
CÀI ĐẶT THỬ NGHIỆM MỘT SỐ THUẬT TOÁN PHÂN ĐOẠN ẢNH 40
3.1 Thuật toán phân đoạn ảnh dựa vào ngưỡng cố định 41
3.1.1 Tư tưởng thuật toán 41
3.1.2 Kết quả thực nghiệm và nhận xét 42
3.2 Thuật toán tam giác 43
3.2.1 Tư tưởng thuật toán 43
3.2.2 Kết quả thực nghiệm và nhận xét 47
3.3 Thuật toán JSEG 48
3.3.1 Giới thiệu 48
3.3.2 Tiêu chuẩn phân đoạn 50
3.3.2.1 Thuật toán lượng tử hoá ảnh màu 51
3.3.2.2 Tiêu chuẩn J 54
3.3.3 J-Image 58
3.3.4 Thuật toán phân hoạch không gian 62
3.3.4.1 Phát hiện các Valley 63
3.3.4.2 Phát triển các Valley 67
3.3.5 Kết quả thực nghiệm và nhận xét 69
3.4 Kết chương 72
KẾT LUẬN 73
TÀI LIỆU THAM KHẢO 74
Trang 3MỞ ĐẦU
Ngày nay, công nghệ thông tin đã và đang đóng vai trò quan trọng trong đời sống kinh tế, xã hội của nhiều quốc gia trên thế giới, là một phần không thể thiếu trong một xã hội ngày càng hiện đại Các nhu cầu về thông tin ngày càng phức tạp
Nó không chỉ đơn thuần là các văn bản text như trước kia Ảnh cũng là một dạng thông tin rất phổ biến Người ta sử dụng ảnh để minh hoạ, để biểu diễn thông tin…
Nó đã trở thành công cụ không thể thiếu đối với các hình thức lưu trữ, biểu diễn thông tin Và từ đó thì nhu cầu xử lý các bức ảnh để phục vụ cho nhiều mục đích khác nhau đã dẫn đến việc hình thành một môn khoa học, có tên là: “Xử lý ảnh”
Nó cũng là một lĩnh vực đang được chú trọng, quan tâm
Xử lý ảnh bao gồm nhiều kỹ thuật như: thu nhận ảnh, nén dữ liệu ảnh, xử lý nâng cao chất lượng và khôi phục ảnh, phát hiện biên, phân vùng ảnh, nhận dạng ảnh… Trong các kỹ thuật trên thì phân vùng ảnh là bước khó nhất trong hệ thống
xử lý ảnh Nó là tiền đề quan trọng cho bước nhận dạng, là một kỹ thuật có rất nhiều ứng dụng Phân đoạn ảnh sẽ trợ giúp đắc lực cho quá trình nhận dạng tìm kiếm các ảnh để minh hoạ cho các bài báo, tìm kiếm các ảnh chụp về một đối tượng cho các mục đích khác nhau, giúp phát hiện ra các đối tượng chuyển động trong một cuốn film, hay đưa ra được tỷ lệ diện tích đất liền và biển trong một khu vực qua ảnh vệ tinh…
Người ta đã đưa ra một số phương pháp phân đoạn ảnh dựa vào ngưỡng biên
độ, dựa vào miền đồng nhất, dựa theo đường biên Trong đề tài này, em sẽ tìm hiểu
và cài đặt một số thuật toán phân đoạn ảnh dựa vào ngưỡng biên độ và miền đồng nhất:
1 Phân đoạn ảnh dựa vào ngưỡng cố định
2 Phân đoạn ảnh bằng thuật toán tam giác
3 Phân đoạn ảnh dựa trên giá trị J – thuật toán JSEG
Cấu trúc của báo cáo tốt nghiệp này như sau:
Trang 4 Chương 1: Sơ lược về các kỹ thuật xử lý ảnh Chương này trình bày sơ lược
về các kỹ thuật xử lý ảnh Bao gồm các kỹ thuật sau: thu nhận ảnh, biểu diễn
ảnh, biến đổi và phân tích ảnh, nhận dạng ảnh, nén ảnh
Chương 2: Một số kỹ thuật phân đoạn ảnh Chương này trình bày chi tiết về
một số kỹ thuật phân đoạn ảnh Kỹ thuật phân vùng ảnh dựa theo ngưỡng biên độ gồm kỹ thuật phân ngưỡng tự động và kỹ thuật phân ngưỡng cố định
Kỹ thuật phân vùng ảnh dựa theo miền đồng nhất gồm 3 phương pháp: phương pháp tách cây tứ phân, phương pháp phân vùng bởi hợp và phương pháp tổng hợp Và kỹ thuật phân vùng dựa theo đường biên thì gồm các bước phát hiện và làm nổi biên, làm mảnh biên, nhị phân hoá đường biên,
mô tả biên
Chương 3: Cài đặt thử nghiệm một số thuật toán phân đoạn ảnh Chương
này mô tả chi tiết về ba thuật toán phân đoạn ảnh là: phân đoạn ảnh dựa theo ngưỡng cố định, phân đoạn ảnh theo thuật toán tam giác và phân đoạn ảnh
bằng thuật toán JSEG
Trang 5Chương 1
SƠ LƯỢC VỀ XỬ LÝ ẢNH
Xử lý ảnh là một môn khoa học còn tương đối mới mẻ so với nhiều ngành khoa học khác Song cũng đã bắt đầu xuất hiện những máy tính chuyên dụng cho lĩnh vực này Người ta đã đưa ra cấu hình một hệ thống xử lý ảnh chuyên dụng gồm các giai đoạn sau:
Trước hết là quá trình thu nhận ảnh, ảnh có thể được thu nhận qua camera, qua bộ cảm ứng (sensor), hay trên máy quét (scanner) Tiếp theo là quá trình số hoá (digitalizer) để biến đổi tín hiệu tương tự sang tín hiệu rời rạc (lấy mẫu) và số hoá bằng lượng hoá, trước khi chuyển sang giai đoạn xử lý cần phân tích và lưu trữ lại Quá trình phân tích ảnh thực chất bao gồm nhiều công đoạn nhỏ Trước hết
là công việc tăng cường ảnh để nâng cao chất lượng Có thể do chất lượng thiết bị thu nhận ảnh, do nguồn sáng hay do nhiễu làm cho ảnh bị suy biến Do vậy, cần phải tăng cường và khôi phục lại ảnh để làm nổi bật một số đặc tính chính của ảnh, hay làm cho ảnh gần giống nhất với trạng thái gốc - trạng thái trước khi ảnh bị biến dạng Giai đoạn tiếp theo là phát hiện các đặc tính như biên, phân vùng ảnh, trích chọn các đặc trưng…
CAMERA
SENSOR
Thu nhận ảnh
Số hoá
Lưu trữ
Phân tích ảnh
Hệ Q Định
Lưu trữ
Nhận dạng
Hình 1.1 Các giai đoạn chính trong xử lý ảnh
Trang 6Cuối cùng, tuy theo mục đích của ứng dụng, sẽ là giai đoạn nhận dạng, phân lớp hay các quyết định khác
1.1 Biểu diễn ảnh
Trong biểu diễn ảnh, người ta thường dùng các phần tử đặc trưng của ảnh là pixel Nhìn chung có thể xem một hàm 2 biến chứa các thông tin như biểu diễn của một ảnh Các mô hình biểu diễn ảnh cho ta một mô tả logic hay định lượng các tính chất của hàm này Trong biểu diễn ảnh cần chú ý đến tính trung thực của ảnh hoặc các tiêu chuẩn thông minh để đo chất lượng ảnh hoặc tính hiệu quả của các kỹ thuật
xử lý
Việc xử lý ảnh số yêu cầu phải được mẫu hoá và lượng tử hoá Thí dụ, một ảnh ma trận 512 dòng gồm khoảng 512x512 pixel Việc lượng tử hoá ảnh là chuyển đổi tín hiệu tương tự sang tín hiệu số (Analog Digital Convert) của một ảnh đã lấy mẫu sang một số hữu hạn mức xám
1.2 Tăng cường ảnh - Khôi phục ảnh
Tăng cường ảnh là bước quan trọng, tạo tiền đề cho xử lý ảnh Nó gồm một loạt các kỹ thuật như: bộ lọc tương phản, khử nhiễu, nổi màu…
Khôi phục ảnh là nhằm loại bỏ các suy giảm (degradation) trong ảnh Với một hệ thống tuyến tính, ảnh của một đối tượng có thể biểu diễn bởi:
,
Trong đó:
- (x,y) là hàm biểu diễn nhiễu cộng
- f(,) là hàm biểu diễn đối tượng
Hệ thống thu nhận ảnh
),(
f
),(x y g
Nhiễu
) ,
; , (x y h
ảnh đầu vào ) , (
ảnh đầu
ra ) , (x y
Hình 1.2 Ảnh bị biến dạng do nhiễu
Trang 7- g(x,y) là ảnh thu nhận
- h(x,y;,) là hàm tán xạ điểm (Point spread Function - PSF)
Một vấn đề tiêu biểu là tìm một xấp xỉ của f(,) khi PSF của nó có thể đo lường hay quan sát được, ảnh mờ và các tính chất xác suất của quá trình nhiễu
1.3 Biến đổi ảnh
Thuật ngữ biến đổi ảnh thường dùng để nói tới một lớp các ma trận đơn vị và các kỹ thuật dùng để biến đổi ảnh Cũng như các tín hiệu một chiều được biểu diễn bởi một chuỗi các hàm cơ sở, ảnh cũng có thể được biểu diễn một chuỗi các ma trận
cơ sở gọi là ảnh cơ sở Phương trình ảnh cơ sở có dạng: T
l
k a
* kJ
A với a k là cột thứ k của ma trận A, A là ma trận đơn vị Có nghĩa là AA*T I
Các *
kJ
A định nghĩa
ở trên với k,l = 0, 1, …, N-1 là ảnh cơ sở Có nhiều loại biến đổi được dùng như:
- Biến đổi Fourier, Sin, Cosin, Hadamard,…
- Tích Kronecker
- Biến đổi KL (Karhumen Loeve): biến đổi này có nguồn gốc từ khai triển của các quá trình ngẫu nhiên gọi là phương pháp trích chọn các thành phần chình
Do phải xử lý nhiều thông tin, các phép nhân và cộng trong khai triển là khá lớn Do vậy, các biến đổi trên nhằm làm việc xử lý ảnh được hiệu quả hơn
1.4 Phân tích ảnh
Phân tích ảnh liên quan đến việc xác định các độ đo định lượng của một ảnh
để đưa ra một mô tả đầy đủ về ảnh Các kỹ thuật được sử dụng ở đây nhằm mục đích xác định biên của ảnh Có nhiều kỹ thuật khác nhau như lọc vi phân hay dò theo quy hoạch động
Người ta cũng dùng các kỹ thuật để phân vùng ảnh Từ ảnh thu được, người
ta tiến hành kỹ thuật tách (split) hay hợp (fusion) dựa theo các tiêu chuẩn đánh giá như: màu sắc, cường độ,… Các phương pháp được biết đến như Quad-Tree, mảnh hoá biên, nhị phân hoá đường biên Cuối cùng, phải kể đến các kỹ thuật phân lớp dựa theo cấu trúc Đây là công việc vô cùng quan trọng và phức tạp Nó là tiền đề cho rất nhiều ứng dụng về ảnh Để hiểu rõ hơn về phân đoạn ảnh, một số kỹ thuật sẽ được trình kỹ ở chương 2 và cài đặt thử nghiệm ở chương 3
1.5 Nhận dạng ảnh
Trang 8Nhận dạng ảnh là quá trình liên quan đến các mô tả đối tượng mà người ta muốn đặc tả nó Quá trình nhận dạng thường đi sau quá trình trích chọn các đặc tính chủ yếu của đối tượng Có hai kiểu mô tả đối tượng:
- Mô tả tham số (Nhận dạng theo tham số)
- Mô tả theo cấu trúc (Nhận dạng theo cấu trúc)
Trên thực tế, người ta đã áp dụng kỹ thuật nhận dạng khá thành công với nhiều đối tượng khác nhau như: nhận dạng ảnh vân tay, nhận dạng chữ (chữ cái, chữ số, chữ có dấu)
Nhận dạng chữ viết tay (với mức độ ràng buộc khác nhau về cách viết, kiểu chữ,…) phục vụ cho nhiều lĩnh vực
Ngoài hai kỹ thuật nhận dạng trên, hiện nay một kỹ thuật nhận dạng mới dựa vào kỹ thuật nhận dạng nơron đang được áp dụng và cho kết quả khả quan Một số khái niệm về mạng nơron cũng như một ứng dụng mạng nơron trong nhận dạng ký
tự đã được nghiên cứu đến
1.6 Nén ảnh
Dữ liệu ảnh cũng như các dữ liệu khác cần phải lưu trữ hay truyền đi trên mạng Như đã nói ở trên lượng thông tin phải truyền đi là rất lớn Ví dụ, một ảnh đen trắng cỡ 512x512 với 256 mức xám chiếm 256 K bytes Do đó, làm giảm lượng thông tin hay nén dữ liệu là một nhu cầu cần thiết Nhiều phương pháp nén dữ liệu khác được nghiên cứu và áp dụng cho loại dữ liệu đặc biệt này
Trang 9Chương 2 MỘT SỐ KỸ THUẬT PHÂN ĐOẠN ẢNH
2.1 Sơ lược về phân đoạn ảnh
Phân tích ảnh là bước then chốt trong xử lý ảnh Nhiệm vụ của quá trình này
là từ các ảnh đã có, phân tích ảnh thành các thành phần có cùng tích chất nào đó hay
lấy ra “những đối tượng đáng quan tâm” hoặc những ảnh con để phục vụ cho
những bước tiếp theo của quá trình xử lý ảnh Quá trình phân đoạn chia tách đối tượng ra khỏi nền, lựa chọn các ảnh riêng lẻ từ một bộ sưu tập ảnh các đối tượng hoặc phân tách các đối tượng phủ lên nhau Quá trình phân đoạn là cơ sở cho các quá trình tiếp theo như đánh giá các tế bào và nhân trong mẫu cắt mô, nhận dạng chữ viết hoặc đánh giá các ảnh chụp từ không trung
Ta có thể xem xét quá trình phân đoạn ảnh như là quá trình phân loại điểm
ảnh khi ta phân biệt giữa điểm ảnh nền và điểm ảnh đối tượng, nhằm phân tích ảnh
thành các thành phần có cùng tính chất nào đó dựa theo biên hay các vùng liên thông Tiêu chuẩn để xác định các vùng liên thông có thể là cùng mức xám, cùng màu hay cùng độ nhám
Nếu phân vùng dựa trên các miền liên thông, ta gọi là kỹ thuật phân vùng dựa theo miền đồng nhất Nếu ta phân vùng dựa vào đường biên gọi là kỹ thuật phân vùng biên Ngoài ra, còn có kỹ thuật khác như phân vùng dựa vào ngưỡng biên độ, phân vùng theo kết cấu (texture segmentation)
Mục đích của phân tích ảnh là để có một miêu tả tổng hợp về nhiều phân tử khác nhau cấu tạo nên ảnh thô (brut image) Vì lượng thông tin chứa trong ảnh là rất lớn, trong khi đó đa số ứng dụng chỉ cần một số thông tin đặc trưng nào đó Do vậy, chúng ta cần có một quá trình để giảm lượng thông tin khổng lồ ấy Quá trình
Trang 10này bao gồm phân vùng ảnh và trích chọn các đặc trưng chủ yếu Các kỹ thuật này
sẽ được đề cập dưới đây
2.2 Phân vùng ảnh dựa theo ngưỡng biên độ
Đặc tính đơn giản nhất và có thể hữu ích nhất của ảnh đó là biên độ của các tính chất vật lý của ảnh như: độ phản xạ, độ truyền sang, màu sắc hoặc đáp ứng đa phổ Thí dụ, trong ảnh X-quang, biên độ mức xám biểu diễn đặc tính bão hoà của các phần hấp thụ của cơ thể và làm cho ta có khả năng phân biệt xương với các phần mềm, tế bào lành với các tế bào bị nhiễm bệnh…
Như vậy, có thể dùng ngưỡng biên độ để phân vùng khi mà biên độ đủ lớn đặc trưng cho ảnh Thí dụ, biên độ trong bộ cảm biến ảnh hồng ngoại có thể phản ánh vùng nhiệt độ thấp hay vùng có nhiệt độ cao hơn Kỹ thuật phân ngưỡng theo biên độ rất có ích đối với ảnh nhị phân như văn bản in, đồ hoạ, ảnh màu hay ảnh X-quang
Trước hết cần đưa về ảnh nhị phân một cách đơn giản bằng một giá trị ngưỡng Các điểm ảnh ở trên một ngưỡng T sẽ là đối tượng còn dưới ngưỡng T sẽ
là những điểm nền Ta có một hàm biến đổi tổng quát :
1, ( , ) ( , )
Phương pháp ngưỡng vừa trình bày trên đây phân loại điểm ảnh dựa trên tính chất “giá trị xám” của các điểm đối tượng và các điểm nền Đặc điểm của vùng lân cận điểm ảnh không được quan tâm đến Khi quyết định xem một điểm ảnh nào đấy
có thuộc về đối tượng hay không phương pháp này chỉ hướng theo giá trị xám của một điểm ảnh Một kết quả như ý đòi hỏi có một ngưỡng tối ưu được xác định, ngưỡng này có thể dễ dàng tìm được ở nhiều ứng dụng
Một số phương pháp được sử dụng để tìm Đơn giản nhất là dùng ngưỡng cố định khi ảnh có độ sáng tối rõ ràng Nhưng để tìm ngưỡng một cách tối ưu hơn với
Trang 11những ảnh không có độ sáng tối rõ ràng như vậy thì có thể dùng đến các phương pháp tìm ngưỡng tự động
Đây là một thuật toán tương đối đơn giản Ý tưởng chính của thuật toán chỉ
là phân ngưỡng ảnh bằng giá trị xám cố định độc lập với dữ liệu ảnh và chi tiết về thuật toán được trình bày chi tiết ở mục 3.1 thuộc chương 3
2.2.2 Ngưỡng tự động
Việc chọn ngưỡng trong kỹ thuật này là bước rất quan trọng Với những ảnh
mà độ tương phản màu sắc không cao, nếu áp dụng phân ngưỡng cố định thì kết quả phân đoạn ảnh sẽ không tốt Khi đó, có thể áp dụng một số phương pháp phân ngưỡng tự động Người ta thường tiến hành theo các bước chung sau:
- Xem xét lược đồ xám của ảnh để xác định các đỉnh và các khe Nếu ảnh
có dạng rắn lượn (nhiều đỉnh và khe) các khe có thể sử dụng để chọn ngưỡng
- Chọn ngưỡng t sao cho một phần xác định trước của toàn bộ số mẫu là thấp hơn t
Hình 2.1.a:
Ảnh gốc
Hình 2.1.b: Histogram điểm đánh dấu tại ngưỡng T = 128
Hình2.1.c: Ảnh nhị phân với ngưỡng T=128
Trang 12- Điều chỉnh ngưỡng dựa trên xem xét lược đồ xám của các điểm lân cận
- Chọn ngưỡng như xem xét lược đồ xám của những điểm thoả mãn tiêu chuẩn chọn Thí dụ, với ảnh có độ tương phản thấp, lược đồ của những điểm có biên độ Laplace g(m,n) lớn hơn giá trị t định trước (sao cho từ 5% đến 10% số điểm ảnh với gradient lớn nhất sẽ coi như biên) sẽ cho phép xác định các đặc tính ảnh lưỡng cực tốt hơn ảnh gốc
- Khi có một mô hình phân lớp xác suất, việc xác định ngưỡng dựa vào tiêu chuẩn nhằm cực tiểu xác suất của sai số hoặc một số tính chất khác theo luật Bayes
Trong hầu hết các trường hợp, ngưỡng được chọn từ lược đồ độ sáng của vùng hay ảnh cần phân đoạn Có rất nhiều kỹ thuật chọn ngưỡng tự động xuất phát
từ lược đồ xám đã được đưa ra Trong đó có thuật toán tam giác được trình bày chi tiết trong mục 3.2 ở chương 3
2.3 Phân vùng theo miền đồng nhất
Kỹ thuật phân đoạn ảnh thành các miền đồng nhất dựa vào các tính chất quan trọng nào đó của miền Việc lựa chọn các tính chất của miền sẽ xác định các tiêu chuẩn phân vùng Ở đây cũng cần phải xác định rõ tính đồng nhất của một miền của ảnh Vì đó là điểm chủ yếu xác định tính hiệu quả của việc phân vùng Các tiêu chuẩn hay được dùng là sự thuần nhất về mức xám, kết cấu sợi và chuyển động Thí dụ, với ảnh hàng không, việc phân vùng theo màu cho phép phân biệt thảm thực vật: cánh đồng màu xanh hay mày vàng, rừng xanh thẫm, đường màu xám, mái nhà màu đỏ…
Đối với ảnh chuyển động, người ta tiến hành trừ 2 ảnh quan sát được tại 2 thời điểm khác nhau Trong trường hợp này, phần ảnh không thay đổi sẽ nhận giá trị không, những phần thay đổi sẽ nhận giá trị dương hay âm tương ứng với thay đổi hay dịch chuyển Như vậy, việc trừ ảnh thực ra là một xấp xỉ của đạo hàm theo thời
gian của ảnh Thực vậy, giả sử I(t) và I(t) là 2 ảnh quan sát ở thời điểm t và
Trang 13Với cách tính này ta có thể biết được vận tốc dịch chuyển của ảnh
Cũng nhờ kỹ thuật trừ ảnh ta có thể xác định đựơc sự xuất hiện của các đối tượng mới (tín hiệu dương) hay sự biến mất của các đối tượng trong ảnh trước (tín hiệu âm)
Tính kết cấu là đặc tính rất quan trọng trong phân vùng ảnh Nhờ nó, ta có thể phân biệt thảm cỏ với một mặt nhuộm màu xanh lá cây Tính kết cấu đặc trưng cho kiểu dạng xuất hiện lặp trên bề mặt nào đó của đối tượng Có 2 kiểu lặp: lặp có tính chu kỳ và lặp ngẫu nhiên Lặp ngẫu nhiên thường gặp trong tự nhiên như cát, thảm cỏ; còn lặp có tính chu kỳ là lặp nhân tạo
Người ta có thể dùng logic vị từ để làm tiêu chuẩn đánh giá phân đoạn Giả
sử ảnh X phải phân thành n vùng khác nhau: Z1, Z2, , Zn và lôgic vị từ có dạng P(Z) Việc phân vùng phải thoả mãn các tính chất sau:
Z
P
n i
True Z
P
j i Z
Z
n i
Z X
j i
i
j i
n
i
i
; )
(
, , 2 , 1
; )
(
;
, , 2 , 1
; 1
Với ảnh màu, véc tơ đặc tính X có thể là thành phần ba màu R, G, B và
IR(k,l), IG(k,l), IB(k, l) là các thành phần tương ứng Lúc đó luật phân ngưỡng có dạng:
Trang 14- Phương pháp hợp (merge)
- Phương pháp tách - hợp ( split – merge)
Mức độ hiệu quả của các phương pháp là phụ thuộc vào việc lựa chọn tiêu chuẩn đánh giá độ thuần nhất Trên thực tế người ta hay sử dụng trung bình số học,
và độ lệch chuẩn i cho vùng Zi có n điểm:
Z l k
n
m
) , (
) , (
i
n( , )
2 ) ) ( ( 1
Hai vùng Zi và Zj có thể hợp nhất nếu | mi-mj | < ki
2.3.1 Phương pháp tách cây tứ phân
Về nguyên tắc, phương pháp này kiểm tra tính hợp thức của tiêu chuẩn đồng nhất một cách tổng thể trên miền lớn Nếu tiêu chuẩn được thoả mãn, việc phân đoạn coi như kết thúc Trong trường hợp ngược lại ta chia miền đang xét thành 4 miền nhỏ hơn, ta lại áp dụng đệ quy bằng phương pháp trên cho mỗi miền nhỏ hơn cho đến khi tất cả các miền đều thoả mãn Phương pháp này có thể mô tả bằng thuật toán sau (và cần lưu ý rằng tham số là miền đang xét):
Procedure PhanDoan(Mien)
Begin
If miền đang xét không thoả Then
Begin
Chia miền đang xét thành 4 miền: Z1, Z2, Z3, Z4
For i=1 to 4 Do PhanDoan(Zi)
Trang 15 tiêu chuẩn để miền đang xét là đồng nhất có thể là:
/* Giả sử là ảnh có tối đa 255 mức xám
(N1,M1), (N2, M2) là toạ độ điểm đầu và điểm cuối của miền, T là ngưỡng */
Begin
1 Max = 0; Min = 255;
2 For i = N1 to N2 do
For j = N1 to N2 do
If I(i,j) < Min Then Min = I(i,j);
If I(i,j) >Max Then Max = I(i,j);
3 If ABS(max - min) < T Then Examin_Criteria = 0
Else Examin_Criteria = 1;
End
Nếu hàm trả về giá trị 0, có nghĩa vùng đang xét là đồng nhất, trường hợp ngược lại nghĩa là mức không đồng nhất Trong giải thuật trên, khi miền là đồng nhất cần tính lại giá trị trung bình và cập nhật lại ảnh đầu ra Giá trị trung bình được tính bởi:
Trang 16Hình dưới đây mô tả một ví dụ về phương pháp phân vùng bởi tách:
a Ảnh gốc
b Phân mức 1
Trang 17c Phân mức 2
d Phân mức 3 Hình 2.2: Phân vùng bởi tách
Một vùng thoả mãn tiêu chuẩn tạo nên một nút lá, nếu không sẽ tạo nên một nút trong và 4 nút con tương ứng của việc chia làm 4 vùng Mỗi nút lá của cây biểu diễn một vùng đã phân chia theo tiêu chuẩn Cứ tiếp tục như vậy cho đến khi phân
Trang 18xong Các nút lá của cây biểu diễn số vùng đã phân theo tiêu chuẩn (như trên hình
2.3)
Tiêu chuẩn phân vùng ở đây là màu sắc Nếu mọi điểm của vùng là màu trắng sẽ tạo nên một nút lá trắng và tương tự như vậy với nút lá đen Nút màu ghi có nghĩa là vùng không thuần nhất và phải tiếp tục chia
2.3.2 Phương pháp cục bộ hay phân vùng bởi hợp
Ý tưởng của phương pháp này là xem xét ảnh từ các miền nhỏ nhất rồi hợp chúng lại nếu thoả mãn tiêu chuẩn để được một miền đồng nhất lớn hơn Ta lại tiếp tục với miền thu được cho đến khi không thể hợp được nữa Số miền còn lại cho ta kết quả phân đoạn ảnh Miền nhỏ nhất của bước xuất phát là điểm ảnh
Trang 19Phương pháp này hoàn toàn ngược với phương pháp tách Song điều quan trọng ở đây là nguyên lý hợp 2 vùng Việc hợp hai vùng được thực hiện theo nguyên tắc sau:
- Hai vùng phải đáp ứng tiêu chuẩn, như cùng màu hay cùng mức xám
- Chúng phải kế cận nhau
Chúng ta nên làm rõ khái niệm kế cận Trong xử lý ảnh người ta dùng khái niệm liên thông để xác định kế cận Có hai khái niệm liên thông là 4 liên thông và 8 liên thông Với 4 liên thông một điểm ảnh I (x,y) sẽ có 4 kế cận theo hướng x, y Trong khi đó, với 8 liên thông, điểm ảnh I(x, y) sẽ có 4 liên thông theo hai hướng x
và y và 4 liên thông khác theo hướng chéo 0
45 Hình trên cho ta khái niệm về 4 và
8 liên thông
Dựa theo nguyên lý của phương pháp hợp, ta có 2 thuật toán:
- Thuật toán tô màu (Blog coloring)
- Thuật toán đệ quy cục bộ
2.3.2.1 Thuật toán tô màu
Thuật toán này sử dụng khái niệm 4 liên thông Người ta dùng một cửa sổ di chuyển trên ảnh để sánh với tiêu chuẩn hợp Thuật toán có thể tóm tắt như sau:
For mỗi điểm I(x,y) do
/*Kiểm tra màu của các lân cận*/
Begin
b/ 8 liên thông Hình 2.4 Khái niệm 4 và 8 liên thông a/ 4 liên thông
Trang 20If Criteria(x,y)=Criteria(x-1,y) Then M(x,y)=M(x-1,y) Else
If Criteria(x,y)=Criteria(x,y-1) Then M(x,y)=M(x,y-1) Else
M(x,y)=NewM;
End
/*Hợp lại nếu các lân cận cùng màu*/
If (Criteria(x,y)=Criteria(x-1,y)) and (Criteria(x,y)=Criteria(x,y-1))
Then
Merge 2 phân vùng bằng cách để màu giống nhau
Trong thuật toán trên, chỉ tiêu hợp là màu đồng nhất Thực tế chứng tỏ rằng thuật toán này tỏ ra khá hiệu quả khi dùng camera một hàng vì có thể phân đoạn theo từng hàng
2.3.2.2 Thuật toán đệ quy cục bộ
Thuật toán này sử dụng phương pháp tìm kiếm trong một cây để làm tăng kích thước vùng Trước tiên, người ta tìm kiếm các lân cận để tăng kích thước tối đa của vùng rồi sau đó mới quan tâm đến các vùng khác và cũng áp dụng thuật toán
trên Thuật toán này sử dụng một thủ tục đệ quy GiaTang để thực hiện việc tăng
kích thước một vùng Thuật toán được mô tả như sau:
Save(I(x,y)) GiaTang(x,y) NSeg <= NSeg+1 End
End
b) Thủ tục GiaTang
Trang 21I(x,y)<=0 /*Đặt I(x,y) là 0 để không phải xét lại*/
For mọi điểm kế cận của I(x,y) do
Chính vì nhược điểm này mà ta nghĩ đến cách phối hợp cả 2 phương pháp Trước tiên, dùng phương pháp tách để tạo nên cây tứ phân, phân đoạn theo hướng
từ gốc đến lá Tiếp theo, tiến hành duyệt cây theo chiều ngược lại và hợp các vùng
có cùng tiêu chuẩn Với phương pháp này ta thu được miêu tả cấu trúc của ảnh với các miền liên thông có kích thước tối đa
Giải thuật tách hợp gồm một số bước chính sau:
1 Kiểm tra tiêu chuẩn đồng nhất
a) Nếu không thoả và số điểm trong vùng lớn hơn một điểm, tách làm
4 vùng (trên, dưới, trái, phải) bằng cách gọi đệ quy Nếu kết quả tách xong và không tách được nữa chuyển sang bước 2
b) Nếu tiêu chuẩn đồng nhất là thoả thì tiến hành hợp vùng và cập nhật giá trị trung bình cho vùng
2 Hợp vùng
Cần kiểm tra 4 lân cận đã nêu trên Có thể có nhiều vùng thoả mãn khi đó ta chọn vùng tối ưu rồi tiến hành hợp
Trang 22Phương pháp này thu được kết quả số vùng là nhỏ hơn phương pháp tách
Hình 2.5: 4 lân cận của điểm hiện thời
Với ví dụ trong hình 2.2, áp dụng phương pháp tách hợp ta thu được một cây chỉ có 2 phân vùng hay nói cách khác là phân đoạn ảnh thành 2 miền đồng nhất Rõ ràng là phương pháp này đạt hiệu quả tốt hơn so với phương pháp tách
Hình 2.6: Cây thu được theo phương pháp tách hợp
2.4 Phân vùng dựa theo đường biên
Biên là một trong những đặc trưng quan trọng của ảnh Cũng vì thế mà trong nhiều ứng dụng, người ta sử dụng cách phân đoạn theo biên Việc phân đoạn ảnh dựa vào biên được tiến hành qua một số bước:
- Phát hiện biên và làm nổi biên
- Làm mảnh biên
- Nhị phân hoá đường biên
- Miêu tả đường biên
Trang 232.4.1 Phát hiện biên và làm nổi biên
Biên là một vấn đề chủ yếu trong phân tích ảnh vì các kỹ thuật phân đoạn ảnh chủ yếu dựa vào biên Một điểm ảnh có thể coi là biên nếu ở đó có sự thay đổi đột ngột về mức xám Tập hợp các điểm biên tạo thành biên hay đường bao của ảnh (boundary) Thí dụ, trong một ảnh nhị phân, một điểm ảnh có thể coi là biên nếu nó
là điểm đen và có ít nhất một điểm trắng lân cận
Ta xét ví dụ sau để thấy được tầm quan trọng của biên Khi người hoạ sĩ vẽ một cái bàn gỗ, chỉ cần vài nét phác thảo về hình dáng như mặt bàn, chân bàn mà không cần thêm các chi tiết khác, người xem đã có thể nhận ra đó là cái bàn Nếu ứng dụng của ta là phân lớp nhận diện đối tượng, thì coi như nhiệm vụ đã hoàn thành Tuy nhiên, nếu đòi hỏi thêm về các chi tiết như vân gỗ hay màu sắc… thì với chừng ấy thông tin là chưa đủ
Về toán học, người ta coi điểm biên của ảnh là điểm có sự biến đổi đột ngột
về độ xám, như trong hình 2.7 dưới đây:
Phát hiện biên một cách lý tưởng là xác định được tất cả các đường bao trong các đối tượng Định nghĩa toán học của biên ở trên là cơ sở cho các kỹ thuật phát hiện biên Điểm quan trọng là biến thiên giữa các điểm ảnh thường là nhỏ, trong khi
đó biến thiên độ sáng của điểm biên (khi qua biên) lại khá lớn
Xuất phát từ cơ sở này, người ta thường sử dụng hai phương pháp phát hiện biên như sau:
Phương pháp phát hiện biên trực tiếp: Phương pháp này nhằm làm nổi biên dựa vào sự biến thiên về giá trị độ sáng của điểm ảnh Kỹ thuật chủ yếu dùng phát hiện biên ở đây là kỹ thuật đạo hàm Nếu lấy đạo hàm bậc nhất của ảnh ta có phương pháp Gradient Nếu lấy đạo hàm bậc hai của ảnh ta có kỹ thuật Laplace
Phương pháp phát hiện biên gián tiếp: Nếu bằng cách nào đấy ta phân được ảnh thành các vùng thì đường phân ranh giữa các vùng đó chính là biên Việc phân vùng ảnh thường dựa vào kết cấu texture của ảnh hoặc dựa vào một số yếu tố khác
Trang 24Cũng cần chú ý rằng kỹ thuật dò biên và phân vùng ảnh là hai bài toán đối ngẫu của nhau Thực vậy, dò biên để thực hiện phân lớp đối tượng và một khi đã phân lớp xong có nghĩa là đã phân vùng được ảnh Và ngược lại, Khi đã phân vùng, ảnh đã phân lập được thành các đối tượng, ta có thể phát hiện được biên Phương pháp dò biên trực tiếp tỏ ra khá hiệu quả vì ít khi chịu ảnh hưởng của nhiễu Song nếu sự biến thiên độ sáng không đột ngột Phương pháp này lại tỏ ra kém hiệu quả Phương pháp dò biên gián tiếp tuy khó cài đặt, song lại áp dụng khá tốt khi sự biến thiên độ sáng nhỏ
c) Đường bao thực
Mức xám
x
Hình 2.7: Đường biên của ảnh
b) Đường biên bậc thang
Mức xám
a) Đường biên lý tưởng
Mức xám
Trang 25Có một số phương pháp phát hiện biên hay được sử dụng như: phương pháp Gradient, kỹ thuật Laplace
2.4.1.1 Phương pháp Gradient
Phương pháp Gradient là phương pháp dò biên cục bộ dựa vào cực đại của đạo hàm Gradient là một véctơ có các thành phần biểu thị tốc độ thay đổi giá trị của điểm ảnh theo hai hướng x và y Các thành phần của gradient được tính bởi:
dy
y x f dy y x f f y
,
(
) , ( ) , ( )
Với một ảnh liên tục f(x,y), các đạo hàm riêng của nó cho phép xác định vị trí cực đại cục bộ theo hướng của biên Thực vậy, một ảnh liên tục được biểu diễn bởi một hàm f(x,y) dọc theo r với góc được định nghĩa bởi:
dy y
f dr
dx x
f dr
đối với đạt cực đại khi(df / d )(df / dr)=0 hay f xcos f ysin 0
Do vậy, ta có thể xác định hướng cực đại của nó: r tan 1fy fx và
2 2
dr
df
Ta gọi r là hướng của biên
Đạo hàm của ảnh là không tồn tại vì f(x,y) không liên tục Ở đây, ta chỉ sử dụng mô phỏng theo ý nghĩa của đạo hàm, việc tính toán là xấp xỉ đạo hàm bằng kỹ thuật nhân chập Trong phương pháp gradient, người ta chia nhỏ thành hai kỹ thuật (do sử dụng hai toán tử khác nhau):
- Kỹ thuật gradient dùng toán tử gradient, lấy đạo hàm theo một hướng
- Kỹ thuật la bàn dùng toán tử la bàn, lấy đạo hàm theo tám hướng: Bắc, Nam, Đông, Tây, và Đông Bắc, Tây Bắc, Đông Nam, Tây Nam
Trang 26a) Kỹ thuật Gradient:
Kỹ thuật gradient sử dụng một cặp mặt nạ H1, H2 trực giao (theo hai hướng vuông góc Ta có thể định nghĩa:
g1 là gradient theo hướng x
g2 là gradient theo hướng y
Biên độ của gradient tại điểm (m,n) ký hiệu là g(m,n) được tính theo công thức:
) , ( ) , ( )
, (m n A0 g12 m n g22 m n
Và góc là:
) ) , (
) , ( ( tan ) , (
1
2 1
n m g
n m g n
) , ( ) , 1 (
y x I y x I
g
y x I y x I
1 0 1
0 1 2
H
Trong trường hợp tổng quát, người ta dùng các công thức (2.11) và (2.12) để tính Gradient biên độ g và Gradient hướng r Nhưng để giảm bớt thời gian tính toán, người ta có thể dùng các chuẩn sau:
) , ( ) ,
1
Trang 271 0 1
1 0 1 1
0 0 0
1 1 1 2
2 0 2
1 0 1 1
0 0 0
1 2 1 2
2 0 2
1 0 1 1
0 0 0
1 2 1 2
H
Gradient được xấp xỉ bởi công thức: G x H x I và G y H y I (2.16)
Thực tế cho thấy rằng Sobel và prewitt tốt hơn so với Robert bởi chúng ít nhạy cảm với nhiễu Ta cũng thấy rằng, việc lấy đạo hàm một tín hiệu có xu hướng làm tăng nhiễu trong tin hiệu đó Độ nhạy cảm này có thể làm giảm xuống nhờ thao tác lấy trung bình cục bộ trong miền phủ bởi mặt lạ
Trang 28Lưu ý rằng, các chuẩn trong công thức (2.14) và (2.15) tạo nên sự vặn xoắn trong tính toán biên độ Thực vậy, nếu g x hoặc g y bằng 0 thì A1 A2 A0 Còn nếu: g x g y ta sẽ có A1 g x,A2 g y và A0 2g x Phương pháp Robert và Sobel dùng chuẩn A1 Nguyên nhân của sự vặn xoắn là khá đơn giản: các mặt lạ của các toán tử tạo nên một xấp xỉ rời rạc của đạo hàm thực và các chuẩn áp dụng để tính biên độ lại phụ thuộc vào giá trị của các Gradient thành phần
Với mục đích nghiên cứu các mặt lạ cho kết quả tốt hơn, người ta nghĩ đến việc xét lân cận theo 8 hướng Đó chính là phương pháp Kirsh, còn gọi là toán tử Kirsh hay toán tử la bàn Toán tử này được trình bày dưới đây
b) Toán tử la bàn (Kirsh):
Toán tử la bàn đo gradient theo tám hướng lần lượt ngược chiều kim đồng
hồ Đó là các hướng: k = /2 + k2, với k = 0, 1, 2, ., 7 cách nhau 0
45 ; với gradient tương ứng là g k
Có nhiều toán tử la bàn khác nhau Ở đây, ta chỉ nêu chi tiết một toán tử, đó
là toán tử Kirsh, sử dụng mặt nạ 3x3 Mặt nạ H k ứng với hướng k với k = 0, 1, 2, , 7 H1 cho hướng gốc 0, trên cơ sở đó H2 đến H8 cho 7 hướng còn lại:
0 0 0 0 0
0
0
315,270,225,180
3 0 3
5 5 5 1
5 0 3
5 5 3 2
5 0 3
5 3 3 3
5 0 3
3 3 3 4
3 0 3
3 3 3 5
3 0 5
3 3 3 6
3 0 5
3 3 5 7
3 0 5
3 5 5 8
H
Nếu ký hiệu A i, i 1,2,3 8 là Gradient thu được theo 8 hướng bởi 8 mặt nạ, thì biên độ Gradient tại (x,y) sẽ được tính theo công thức sau:
Trang 291 2 1
1 1 1 1
H
Để đơn giản tính toán thì chỉ tính với 4 hướng 0 0 0 0
135 , 90 , 45 ,
sử dụng đạo hàm bậc hai, toán tử Laplace được định nghĩa như sau:
2 2 2
2 2
dy
f dx
f
f
Người ta cũng dùng nhiều kiểu mặt nạ khác nhau cho toán tử Laplace để xấp
xỉ rời rạc đạo hàm cấp 2 Dưới đây là ba kiểu mặt nạ hay dùng:
1 4 1
0 1 0 1
1 8 1
1 1 1 2
2 5 2
1 2 1 3
H
Với mặt nạ H1, đôi khi người ta dùng phần tử tâm là 8 thay vì 4
Trong kỹ thuật Laplace, điểm biên được xác định bởi điểm cắt điểm không Điểm không là duy nhất, do đó đường biên thu được là đường biên mảnh (có độ rộng 1 pixel) Một điểm nữa là: do đạo hàm bậc hai thường không ổn định nên kỹ thuật Laplace rất nhạy cảm với nhiễu
Trang 302.4.2 Làm mảnh biên
Làm mảnh biên thực chất là việc làm nổi biên với độ rộng chỉ 1 pixel Kỹ thuật Laplace dùng trong việc phát hiện biên cho kết quả trực tiếp biên ảnh với độ rộng 1 pixel Song với nhiều kỹ thuật thì khác, sau quá trình phát hiện, biên thu được với độ rộng lớn hơn 1 pixel Khi đó, ta cần có một quá trình làm mảnh biên ảnh
Khi thực hiện đạo hàm một ảnh, ta thu được những điểm cực trị cục bộ Theo
kỹ thuật Gradient, những điểm cực trị cục bộ có thể coi như biên Do vậy cần tách biệt những điểm cực trị đó để xác định chính xác biên ảnh và để giảm độ rộng biên
ảnh Một trong những phương pháp hay dùng đó là phương pháp “Loại bỏ các điểm
không cực đại”
Giả sử ảnh I(x,y) gồm Gradient hướng và Gradient biên độ (còn gọi là bản đồ biên độ và bản đồ hướng) Với mỗi điểm ảnh I(x,y), ta xác định các điểm lân cận
của nó theo hướng Gradient Gọi các điểm đó là I(x1,y1) và I(x2,y2)
Nếu I(x,y) lớn hơn cả I(x1,y1) và I(x2,y2), giá trị của I(x,y) sẽ được bảo
toàn Nếu không nó sẽ được đạt là 0 và coi như bị loại bỏ Thuật toán này được sử dụng trong phương pháp Canny
Ngoài thuật toán kể trên còn nhiều kỹ thuật làm mảnh biên để xác định khung của đối tượng (ảnh hay ký tự) như kỹ thuật mảnh biên chữ do Sherman đề xuất Sau đó được Fraser cải tiến cho ảnh nhị phân Kỹ thuật này được tóm tắt như sau:
Trang 31- Nó là điểm đen duy nhất kết nối với hai điểm đen không kề nhau
- Nó là điểm đen có duy nhất một lân cận cũng là điểm đen ngoại trừ không tồn tại một chuyển đổi nào tại phần tử trước nó
Cụ thể là điểm đó phải đồng thời thoả mãn các điều kiện sau:
*
*
1 ) (
0
6 ) ( 2
2 8
4 2
1
1
P hayZ P
(2.19)
Với :
Z0(P1) là số phần tử 0 chuyển sang phần tử khác 0 trong tập có thứ tự
1 8 4
2,P ,P,P
P
NZ(P1) số hàng xóm (lân cận) khác 0 của P1
Hình 2.9: Làm mảnh biên
2.4.3 Nhị phân hoá đường biên
Nhị phân hóa đường biên là giai đoạn then chốt trong quá trình trích chọn vì
nó xác định đường bao nào thực sự cần và đường bao nào có thể loại bỏ Nói chung, người ta thường nhị phân hóa đường biên theo cách thức làm giảm nhiễu hoặc tránh hiện tượng kéo sợi trên ảnh Điều này cũng giải thích tại sao phân đoạn dựa theo biên có hiệu quả khi ảnh có độ tương phản tốt Trong trường hợp ngược lại, có thể
sẽ bị mất một phần đường bao hay đường bao có chân, không khép kín, …, do đó sẽ bất lợi cho biểu diễn sau này Một phương pháp hay được dùng là chọn ngưỡng thích nghi Với cách chọn này, ngưỡng sẽ phụ thuộc vào hướng của gradient nhằm
Trang 32làm giảm sự xoắn của biên Lúc đầu, người ta định ra một ngưỡng nào đó và sau đó
sử dụng một hệ số sinh thích nghi thông qua lời giải toán tử đạo hàm theo hướng tìm được để tinh chỉnh
2.4.4 Miêu tả đường biên
Khi đã có bản đồ biên ảnh, ta cần phải biểu diễn nó dưới dạng thích hợp phục vụ cho việc phân tích và làm giảm lượng thông tin dùng để miêu tả đối tượng Nguyên tắc chủ yếu là tách biệt mỗi biên và gán cho mỗi biên một mã Bắt đầu từ thời điểm này, chúng ta không quan tâm tới cách biểu diễn quen thuộc của ảnh bởi
ma trận số mà ta quan tâm đến cách miêu tả bởi một cấu trúc thích hợp và cô đọng
Có nhiều phương án mô tả đường biên khác nhau, mỗi phương án có liên quan mật thiết tới đặc thù của từng ứng dụng Việc tách biệt đường bao có thể được tăng cường thêm các điều kiện nhằm loại bỏ các đường bao không khép kín hoặc khép kín nhờ phương pháp ngoại suy, hay bỏ đi các chân rết bám theo các đường bao kín
Việc mã hóa đường bao có thể thực hiện theo nhiều cách khác nhau Có thể biểu diễn chính xác đường bao hay xấp xỉ nhờ nội suy Một số cấu trúc cơ sở mã hóa đường bao thường dùng là: điểm, đoạn thẳng, cung và đường cong
Nên lưu ý là luôn có xung đột giữa độ phức tạp tính toán và khả năng biểu diễn ảnh của cách mã hoá thông tin Biểu diễn đường bao bởi các điểm nói chung không phức tạp song lại rất nghèo nàn về cấu trúc và không cô đọng (vì có bao nhiêu điểm tạo nên biên thì phải mô tả bấy nhiêu) Trong khi đó, biểu diễn bằng đường cong đa thức bậc cao lại làm tăng độ phức tạp tính toán, song bù lại cấu trúc
dữ liệu lại rất cô đọng
Hình dưới đây mô tả các đường biên sau khi loại bỏ các đường bao hở, các chân rết và khép kín các đường bao nhờ ngoại suy:
Trang 33a Loại bỏ các đường bao hở
b Khép kín nhờ ngoại suy
c Loại bỏ các chân rết Hình 2.10: Làm rõ biên
Một số phương pháp mã hóa đường bao hay dùng như: mã hóa theo tọa độ
đề các, mã hóa Freeman, xấp xỉ bởi đoạn thẳng sẽ được trình bày chi tiết dưới đây
Trang 342.4.4.1 Mã hoá theo toạ độ đề các
Kiểu mã hoá này khá đơn giản Đường bao của ảnh được biểu diễn bởi một danh sách các điểm ảnh tạo nên đường bao Gọi C là đường bao của ảnh và C(i,j) là các điểm Rõ ràng, cách mã hoá này bộc lộ nhược điểm là không giảm được lượng thông tin Tuy nhiên, việc tính toán lại khá nhanh và có thể cung cấp những phương tiện phục vụ cho việc trích chọn các đặc trưng hình học của ảnh Dưới đây sẽ trình bày chi tiết
Việc mã hoá được thực hiện theo phương pháp “Đi theo đường bao”
(Contour Following), sử dụng kỹ thuật tìm kiếm thông tin theo chiều sâu trên cây Nếu áp dụng một cách đơn giản kỹ thuật này, có thể ta sẽ thu được đường bao thô theo nghĩa có điểm có thể xuất hiện hai lần Người ta thường phối hợp với việc kiểm tra 8 liên thông để làm mịn biên
Hình dưới đây cho ta danh sách các điểm ảnh trên đường bao được duyệt theo thứ tự từ 1 đến 35:
Trang 35Thuật toán Contour Following có xem xét 8 liên thông có thể mô tả như sau:
For mỗi điểm I(x,y) do
Thuật toán ContFoll được mô tả như dưới đây:
Function ContFoll(Pic, Depth)
e) Repeat
For mỗi pixel trong Stack do
KQ <= CountFoll(I,depth+1) Until KQ=OK or Stack empty End
End
2.4.4.2 Mã hoá Freeman
Phương pháp mã hoá này cũng là một cách biểu diễn chính xác các điểm đường bao bằng việc sử dụng vị trí tương đối của điểm trên đường bao với điểm trước Nguyên tắc của việc mã hoá này thể hiện trên hình 2.12a Người ta dùng một mặt lạ để xác định mã của mỗi điểm trong 8 liên thông so với điểm ở tâm Từ một điểm đã cho trên đường bao, người ta mã hoá đường bao bằng cách đi theo nó (hình
Trang 362.12b.) Tuy nhiên, người ta thích mã hoá theo góc giữa các cung (hình 2.12c.) Hình 2.12d mô tả việc mã hoá theo góc