Hầu hết các phương pháp tìm xương hiện tại đều có một hạn chế chung đó là nhạy cảm cao đối với nhiễu đường biên: những biến đổi nhỏ trên đường biên của đối tượng có thể làm thay đổi đáng
Trang 2LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
NGƯỜI HƯỚNG DẪN KHOA HỌC
TS Đào Nam Anh
THÁI NGUYÊN - 2012
Trang 3Trước tiên, con xin bày tỏ lòng biết ơn đến cha mẹ đã sinh thành, nuôi dạy con khôn lớn để con có được thành quả như ngày hôm này
Em xin chân thành cảm ơn TS Đào Nam Anh - người luôn chỉ bảo, trực tiếp hướng dẫn, cung cấp những tài liệu quý báu, nhận xét giúp đỡ em trong lựa chọn hướng nghiên cứu cũng như quá trình hoàn thành luận văn
Em cảm ơn các thầy cô giáo Viện Công nghệ Thông tin - Viện Khoa học và Công nghệ Việt Nam, Trường Đại học Công nghệ thông tin và Truyền thông - Đại học Thái Nguyên Các bạn học viên lớp Cao học CK09
đã luôn động viên tôi trong quá trình học tập và hoàn thành luận văn
Xin cảm ơn các đồng nghiệp tại Trường Đại Học Dân Lập Hải Phòng
đã giúp đỡ, hỗ trợ trong suốt quá trình học tập, công tác
Trang 4Tôi xin cam đoan luận văn này do tôi tự nghiên cứu, tìm hiểu và tổng hợp từ nhiều nguồn tài liệu khác nhau Luận văn tốt nghiệp là kết quả của quá trình học tập, nghiên cứu và thực hiện hoàn toàn nghiêm túc, trung thực của bản thân Tất cả các tài liệu tham khảo đều có xuất xứ rõ ràng và được trích dẫn hợp pháp
Tôi xin hoàn toàn chịu trách nhiệm về nội dung và sự trung thực trong luận văn tốt nghiệp Thạc sĩ của mình
Trang 5MỤC LỤC
DANH MỤC CÁC THUẬT NGỮ, CÁC TỪ VIẾT TẮT iii
DANH MỤC CÁC BẢNG iv
DANH MỤC CÁC HÌNH v
MỞ ĐẦU 1
CHƯƠNG 1: TỔNG QUAN VỀ RÚT GỌN VÀ BIỂU DIỄN ĐỐI TƯỢNG 3
1.1 Một số khái niệm Xử lý ảnh 3
1.1.1 Ảnh và điểm ảnh 3
1.1.2 Lân cận của điểm ảnh 4
1.1.3 Mối liên kết điểm ảnh 4
1.1.4 Đo khoảng cách giữa các điểm ảnh 5
1.1.5 Mức xám 5
1.2 Biên và các phương pháp tìm biên 6
1.2.1 Phát hiện biên trực tiếp 6
1.2.2 Phát hiện biên gián tiếp 7
1.3 Các phép toán hình thái học cơ bản 7
1.3.1 Định nghĩa phép giãn (Dilation) 7
1.3.2 Định nghĩa phép co (Erosion) 8
1.3.3 Định nghĩa phép mở (Open) 8
1.3.4 Định nghĩa phép đóng (Close) 9
1.4 Biểu diễn hình dạng đối tượng 9
1.4.1 Kỹ thuật biểu diễn hình dạng dựa trên biên 11
1.4.2 Kỹ thuật biểu diễn hình dạng dựa trên vùng 11
1.5 Xương và các phương pháp tìm xương 12
Trang 61.5.1 Phương pháp tìm xương dựa trên làm mảnh 13
1.5.2 Phương pháp tìm xương không dựa trên làm mảnh 15
CHƯƠNG 2: MỘT SỐ KỸ THUẬT CẮT TỈA XƯƠNG 16
2.1 Kỹ thuật cắt tỉa xương Discrete Curve Evolution (DCE) 17
2.1.1 Giải pháp 18
2.1.2 Độ phức tạp của DCE 27
2.2 Kỹ thuật cắt tỉa xương Discrete Skeleton Evolution (DSE) 28
2.2.1 Giải pháp 29
2.2.1 Độ phức tạp của DSE 32
2.3 Kỹ thuật cắt tỉa xương Bending Potential Ratio (BPR) 33
2.3.1 Giải pháp 34
2.3.2 Cắt tỉa xương với BPR 40
CHƯƠNG 3: THỬ NGHIỆM CẮT TỈA XƯƠNG 44
3.1 Môi trường cài đặt thử nghiệm 44
3.2 Thử nghiệm cắt tỉa xương 45
3.2.1 Kỹ thuật DCE 45
3.2.2 Kỹ thuật DSE 47
3.2.3 Kỹ thuật BPR 49
3.3 Một vài so sánh giữa DCE, DSE và BPR 51
3.4 Nhận xét chung 54
KẾT LUẬN 55
TÀI LIỆU THAM KHẢO 56
Trang 7DANH MỤC CÁC THUẬT NGỮ, CÁC TỪ VIẾT TẮT
Trang 8CÁC TỪ VIẾT TẮT
DANH MỤC CÁC BẢNG
Bảng 3.1: Một số ảnh được sử dụng trong thực nghiệm 44
Bảng 3.2: So sánh xương hình móng ngựa 51
Bảng 3.3: So sánh xương Thằn lằn 52
Bảng 3.4: So sánh xương Lạc đà 53
Trang 9DANH MỤC CÁC HÌNH
Hình 1.1: Phân loại các kỹ thuật mô tả hình dạng 10
Hình 1.2: Ví dụ về ảnh và xương 12
Hình 1.3: Minh họa về trục trung vị 15
Hình 2.1: Nhánh xương thừa phát sinh bởi nhiễu đường biên 16
Hình 2.2: Xương ban đầu và xương sau khi cắt tỉa với DCE 17
Hình 2.3: Đường đậm liên tục là cung ban đầu [x,y] Cung [a,b] chính là arc(s,[x, y])=[a,b] Xương là các đường đậm cách quãng 19
Hình 2.4: Tính toán các đỉnh lồi trên đường bao 20
Hình 2.5: Đa giác đơn giản với 8 đỉnh 21
Hình 2.6: Bộ xương của lá với các ngưỡng khác nhau 22
Hình 2.7: Minh họa cắt tỉa xương 23
Hình 2.8: Minh họa quá trình tìm xương 24
Hình 2.9: Minh họa cắt tỉa xương với DCE 25
Hình 2.10: Loại bỏ đỉnh lồi không quan trọng tạo ra xương tối ưu 26
Hình 2.11: Các điểm xương cuối (a) và mong muốn (b) 28
Hình 2.12: Nhánh xương ít ý nghĩa màu đỏ (a) được loại bỏ (b) 28
Hình 2.13: Các điểm xương cuối (đỏ), các điểm giao (xanh) 30
Hình 2.14: Khôi phục lại hình dạng gốc từ xương 30
Hình 2.15: Định nghĩa của điểm ghost và BPR 35
Hình 2.16: Vùng của điểm ghost 36
Hình 2.17: Hình chữ nhật với cùng một đỉnh thêm vào đường biên 39
Hình 2.18: Xương chân của một con Lạc đà 41
Hình 3.1: DCE với các ngưỡng khác nhau 45
Hình 3.2: Xương Bạch tuộc sau cắt tỉa 46
Hình 3.3: Cắt tỉa xương với DSE 47
Hình 3.4: Cắt tỉa BPR với các ngưỡng khác nhau 49
Hình 3.5: Nhánh xương cuối bị ngắn do ngưỡng không phù hợp 50
Hình 3.6: Minh họa mức độ đóng góp khác nhau 50
Trang 10MỞ ĐẦU
Mục đích quan trọng trong phân tích ảnh là đối sánh và nhận dạng đối tượng Việc này có thể được thực hiện thông qua một vài cách, sử dụng màu sắc, kết cấu, hình dạng, momen và vị trí Hình dạng là yếu tố quan trọng của đối tượng và cũng là hướng nghiên cứu quan trọng trong phân lớp và nhận dạng Hình dạng của đối tượng phẳng có thể được mô tả dựa trên đường bao hoặc dựa trên xương của chúng
Khi sử dụng đường bao trong phân lớp và nhận dạng, những lớp hình dạng có thay đổi lớn về hình dạng toàn cục do có biến đổi cấu trúc hoặc yếu
tố nào đó thường gây ra khó khăn cho quá trình nhận dạng [4] Những phương pháp đối sánh hình dạng đích với các hình dạng mẫu được lưu trữ trong cơ sở dữ liệu thì đòi hỏi một số lượng lớn các mẫu được lưu trữ [5] Hơn nữa những phương pháp dựa trên mô hình và ví dụ rất khó quản lý được lớp đối tượng có phần khác nhau mà không phân tách thành các lớp con riêng biệt
Xương (còn được gọi là trục trung vị) lần đầu tiên được xác định bởi tác giả Blum năm 1976 [7,1], là cách mô tả hình dạng rất hữu ích và quan trọng cho nhận dạng đối tượng vì nó chứa các đặc trưng hình dạng của đối tượng gốc Hình dạng tương tự dựa trên đối sánh xương thường thực hiện nhanh hơn đường biên [3] Do vậy, xương được sử dụng để biểu diễn và phân tích hình dạng trong nhiều lĩnh vực ứng dụng như hệ thống tra cứu ảnh dựa trên nội dung, hệ thống nhận dạng ký tự Những thập kỷ qua, có rất nhiều phương pháp trích chọn xương đã được đề xuất [6,7]
Hầu hết các phương pháp tìm xương hiện tại đều có một hạn chế chung
đó là nhạy cảm cao đối với nhiễu đường biên: những biến đổi nhỏ trên đường biên của đối tượng có thể làm thay đổi đáng kể xương nhận được Do các
Trang 11phương pháp này thường tạo ra các nhánh xương “giả”, ảnh hưởng tới việc nhận dạng đối tượng dựa trên cấu trúc xương Do đó, có thể nói việc nghiên cứu các phương pháp cắt tỉa xương nhằm nâng cao hiệu quả biểu diễn đối tượng phục vụ cho đối sánh và nhận dạng đối tượng dựa trên Shape là hết sức
cần thiết Đó cũng là cơ sở cho việc thực hiện đề tài “Một số phương pháp cắt tỉa xương trong xử lý ảnh”
Luận văn có ba chương:
Chương 1: Tổng quan về rút gọn và biểu diễn đối tượng
Chương 2: Một số kỹ thuật cắt tỉa xương
Chương 3: Thử nghiệm cắt tỉa xương
Trang 12CHƯƠNG 1: TỔNG QUAN VỀ RÚT GỌN VÀ BIỂU DIỄN ĐỐI TƯỢNG 1.1 Một số khái niệm Xử lý ảnh
Xử lý ảnh số là một lĩnh vực tin học ứng dụng Xử lý dữ liệu bằng đồ họa đề cập đến những ảnh nhân tạo, các ảnh này được xem xét như là một cấu trúc dữ liệu và được tạo ra bởi các chương trình Xử lý ảnh số bao gồm các phương pháp và kỹ thuật biến đổi, để truyền tải hoặc mã hóa các ảnh tự nhiên
Quá trình biến đổi từ một ảnh ban đầu sang một ảnh mới thường có hai mục đích chính:
Cải thiện chất lượng phục vụ cho quan sát
Chuẩn bị các điều kiện cho việc trích chọn các đặc trưng phục vụ cho việc nhận dạng và ra quyết định
1.1.1 Ảnh và điểm ảnh
Ảnh trong thực tế là một ảnh liên tục về không gian và về giá trị độ
sáng chúng được biểu diễn bằng một hàm 2 biến thực hoặc phức kí hiệu là f(x, y) Trong đó x, y là các giá trị tọa độ không gian và giá trị của f sẽ tỷ lệ với độ
sáng của ảnh tại điểm này
Để có thể xử lý ảnh bằng máy tính cần thiết phải tiến hành số hóa ảnh Trong quá trình số hóa, người ta biến đổi tín hiệu liên tục sang tín hiệu rời rạc thông qua quá trình lấy mẫu (rời rạc hóa về không gian) và lượng tử hóa thành phần giá trị mà về nguyên tắc bằng mắt thường không phân biệt được hai điểm kề nhau Trong quá trình này, người ta sử dụng khái niệm Picture element mà ta quen gọi hay viết tắt là pixel – phần tử ảnh Như vậy, mỗi ảnh
là một tập hợp các pixel
Trang 13Ảnh số là ảnh xử lý bằng máy tính thu được từ ảnh liên tục bởi quá
trình số hóa, thường được biểu diễn bởi mảng hai chiều I(n, p): n dòng và p cột Người ta thường kí hiệu I(x, y) để chỉ một pixel Một pixel có thể được lưu trữ bằng 1, 4, 8, 16 hay 24 bit Thường được kí hiệu là I[m, n]
Độ phân giải (Resolution) là mật độ của ảnh được ấn định trên ảnh số khi hiển thị Như vậy khoảng cách giữa các điểm ảnh được chọn sao cho mắt người vẫn thấy được sự liên tục của ảnh Việc chọn này tạo nên mật độ phân
bổ đó chính là độ phân giải được phân bổ liên tục theo x, y
1.1.2 Lân cận của điểm ảnh
Giả sử một ảnh số được biểu diễn bằng hàm f(x, y), p và q là cặp điểm ảnh có quan hệ với nhau, điểm ảnh p có tọa độ (x, y) Định nghĩa các lân cận
của điểm ảnh
Lân cận 4 của p kí hiệu N 4 (p):
- N 4 (p) = {(x-1, y); (x, y-1); (x, y+1); (x+1, y)}
Lân cận chéo của p kí hiệu N p (p):
- N p (p) ={(x+1, y+1); (x+1, y-1); (x-1, y+1); (x-1, y-1)}
Lân cận 8 của p kí hiệu N 8 (p):
- N 8 (p) = N 4 (p) + N p (p)
1.1.3 Mối liên kết điểm ảnh
Các mối liên kết được sử dụng để xác định giới hạn của đối tượng hoặc xác định vùng trong một ảnh Một liên kết được đặc trưng bởi tính liền kề giữa các điểm và mức xám của chúng
Trang 141.1.4 Đo khoảng cách giữa các điểm ảnh
Khoảng cách D(p, q) giữa hai điểm ảnh p có tọa độ (x, y), q có tọa độ (s, t) là hàm khoảng cách (Distance) nếu:
- D(p, q) ≥ 0 (Với D(p, q)=0 khi và chỉ khi p=q)
- D(p, q) = D(q, p)
- D(p, z) ≤ D(p, q) + D(q, z); z là một điểm ảnh khác
Khoảng cách Euclide giữa hai điểm ảnh p(x, y) và q(s, t) được định
nghĩa như sau:
D e (p, q) = [(x - s) 2 + (y - t) 2 ] 1/2 (1.1)
1.1.5 Mức xám
Mức xám (Gray level): Giá trị I[x, y] biểu diễn cường độ sáng được mã hóa của mỗi điểm ảnh (x, y) Giá trị đó còn được gọi là mức xám I[x, y] có giá trị rời rạc và để tiện xử lý, ta coi giá trị của I[x, y] là nguyên: I[x, y] ∈ {0, 1,
…, L-1} với L là mức xám tối đa dùng để biểu diễn Ảnh có nhiều mức xám
gọi là ảnh đa cấp xám Ảnh chỉ có 2 mức xám 0 và 1 gọi là ảnh nhị phân
Trang 15Cách mã hóa kinh điển thường dùng là 16, 32 hay 64 mức Mã hóa 256 mức là phổ dụng nhất do lý do kỹ thuật Vì 28 = 256 (0, 1, , 255), nên với
256 mức mỗi pixel sẽ được mã hóa bởi 8 bit
Ảnh nhị phân, mỗi pixel mã hóa trên 1 bit; còn ảnh 256 màu, mỗi pixel
mã hóa trên 8 bit
Ảnh màu là ảnh tổ hợp từ 3 màu cơ bản: đỏ (Red), lục (Green), lam (Blue) và thường thu nhận trên các dải băng tần khác nhau Để biểu diễn cho mỗi điểm ảnh màu cần 3 byte để mô tả 24 bit màu
Ảnh xám là trường hợp đặc biệt của ảnh màu Mỗi điểm ảnh màu có 3 giá trị (Red, Green, Blue), nếu 3 giá trị này bằng nhau thì ta có ảnh xám
1.2 Biên và các phương pháp tìm biên
Biên là vấn đề quan trọng trong trích chọn đặc điểm nhằm tiến tới hiểu ảnh Cho đến nay chưa có định nghĩa chính xác về biên, trong mỗi ứng dụng người ta đưa ra các độ đo khác nhau về biên, một trong các độ đo đó là độ đo
về sự thay đổi đột ngột về cấp xám Ví dụ: Đối với ảnh đen trắng, một điểm được gọi là điểm biên nếu nó là điểm đen có ít nhất một điểm trắng bên cạnh Tập hợp các điểm biên tạo nên biên hay đường bao của đối tượng Xuất phát
từ cơ sở này người ta thường sử dụng hai phương pháp phát hiện biên cơ bản
1.2.1 Phát hiện biên trực tiếp
Phương pháp này làm nổi biên dựa vào sự biến thiên mức xám của ảnh Kỹ thuật chủ yếu dùng để phát hiện biên ở đây là kỹ thuật lấy đạo hàm Nếu lấy đạo hàm bậc nhất của ảnh ta có các kỹ thuật Gradient, nếu lấy đạo hàm bậc hai của ảnh ta có kỹ thuật Laplace, ngoài ra còn có một số các tiếp cận khác
Trang 161.2.2 Phát hiện biên gián tiếp
Nếu bằng cách nào đó ta phân được ảnh thành các vùng thì ranh giới giữa các vùng đó gọi là biên Kỹ thuật dò biên và phân vùng ảnh là hai bài toán đối ngẫu nhau vì dò biên để thực hiện phân lớp đối tượng mà khi đã phân lớp xong nghĩa là đã phân vùng được ảnh và ngược lại, khi đã phân vùng ảnh
đã được phân lớp thành các đối tượng, do đó có thể phát hiện được biên
Phương pháp phát hiện biên trực tiếp tỏ ra khá hiệu quả và ít chịu ảnh hưởng của nhiễu, song nếu sự biến thiên độ sáng không đột ngột, phương pháp tỏ ra kém hiệu quả, phương pháp phát hiện biên gián tiếp tuy khó cài đặt, song lại áp dụng khá tốt trong trường hợp này Sự khác biệt cơ bản giữa hai phương pháp này là:
Phương pháp phát hiện biên trực tiếp cho ta kết quả là ảnh biên
Phương pháp phát hiện biên trực tiếp cho ta kết quả là đường biên
1.3 Các phép toán hình thái học cơ bản
Hình thái có nghĩa là cấu trúc hay topology của đối tượng, là một cách
để mô tả đối tượng ảnh số Hai phép toán hình thái cơ bản là; phép giãn (Dilation) và phép co (Erosion)
Các phép toán này được định nghĩa như sau: Giả thiết ta có đối tượng X
và phần tử cấu trúc (mẫu) B trong không gian Euclide hai chiều Kí hiệu Bx là dịch chuyển của B tới vị trí x
1.3.1 Định nghĩa phép giãn (Dilation)
Phép giãn của X theo mẫu B là hợp của tất cả các B x với x thuộc X Ta có:
X B =
X x x
B
Trang 1700xx0
0xx00
xx000
0 0
0
0 0 0
0 0
0 0
x x x
x x
x x
x x x
x x x
x x x x
x x x
x x x x x
x x x x
00
00
0 0 0 0 0
0 0 0 0
0 0 0
0
0 0
0 0
x x
x x x
B = x
Trang 181.3.4 Định nghĩa phép đóng (Close)
Phép đóng của X theo cấu trúc B là tập hợp các điểm của ảnh X sau khi
đã giãn nở và co liên tiếp theo B Ta có:
0xxx0
00xx0
xxxxx
xxxx0
1.4 Biểu diễn hình dạng đối tƣợng
Các phương pháp biểu diễn hình dạng phổ biến nhất là dựa trên việc sử dụng các điểm biên hình dạng và điểm vùng Biểu diễn hình dạng cũng có thể được phân biệt giữa miền không gian và miền đặc trưng Phương pháp trong miền không gian so sánh các hình dạng dựa trên điểm (hoặc điểm đặc trưng)
cơ sở, còn phương pháp miền đặc trưng so sánh các hình dạng dựa trên đặc trưng vector cơ sở
Một cách phân loại các kỹ thuật biểu diễn hình dạng khác là dựa trên cơ
sở bảo quản thông tin Phương pháp cho phép xây dựng lại chính xác một hình dạng từ mô tả của nó được gọi là lưu trữ thông tin (Information preserving - IP), còn phương pháp chỉ có khả năng xây dựng lại một phần hoặc mô tả không rõ ràng được gọi là sự không lưu trữ thông tin (Non Information preserving - NIP)
Trang 19Các phương pháp biểu diễn hình dạng được phân loại theo các cấp bậc, đầu tiên phương pháp phân loại dựa trên đường biên và phương pháp phân loại dựa trên vùng căn cứ vào đặc trưng hình dạng được trích chọn từ đường biên hay toàn bộ các phân vùng hình dạng Trong mỗi lớp, các phương pháp khác nhau được tiếp tục phân biệt thành cấu trúc và toàn cục dựa vào việc hình dạng được biểu diễn theo toàn bộ hay theo các thành phần con Sau đó, tiếp tục phân ra các phương pháp cụ thể như mô tả trong sơ đồ hình 1.1
Hình 1.1: Phân loại các kỹ thuật mô tả hình dạng
Dựa trên biên
Dựa trên biên
Dựa trên biên
Dựa trên biên
Dựa trên biên
Dựa trên biên
Dựa trên biên
Dựa trên biên
Momen biên
Bất biến momen hình học
Bất biến momen đại số
Phương pháp lưới
Bề mặt lồi Trục trung vị
Trang 201.4.1 Kỹ thuật biểu diễn hình dạng dựa trên biên
Kỹ thuật biểu diễn hình dạng dựa trên biên chỉ khai thác thông tin trên biên Có hai loại phương pháp tiếp cận rất khác nhau cho kỹ thuật dựa trên biên: phương pháp tiếp cận liên tục hay toàn cục và phương pháp tiếp cận rời rạc theo cấu trúc
Phương pháp tiếp cận liên tục không phân chia hình dạng thành các phần mà sử dụng một vector đặc trưng có gốc từ đường biên để mô tả hình dạng Thước đo sự giống nhau về hình dạng là dựa trên sự đối sánh các điểm đặc biệt hoặc dựa trên đặc trưng
Phương pháp tiếp cận rời rạc chia đường biên thành các phân đoạn bằng cách sử dụng một tiêu chuẩn cụ thể Biểu diễn cuối cùng thường là một chuỗi hoặc một đồ thị (hoặc cây), các biện pháp tương tự được thực hiện bằng cách kết hợp chuỗi hoặc đồ thị một cách phù hợp
1.4.2 Kỹ thuật biểu diễn hình dạng dựa trên vùng
Trong phương pháp biểu diễn dựa trên vùng phải kể đến tất cả những pixel trong vùng hình dạng thu được trong biểu diễn hình dạng Phương pháp biểu diễn vùng thường sử dụng các momen để mô tả hình dạng Một số phương pháp khác thường sử dụng gồm: phương pháp lưới, bề mặt lồi và trục trung vị
Biểu diễn hình dạng dựa trên vùng xem xét đến toàn bộ vùng hình dạng
và sử dụng hiệu quả thông tin của toàn bộ pixel chứa trong vùng Những phương pháp này đo sự phân phối pixel của vùng hình dạng, chúng ít có khả năng giả tạo bởi nhiễu và biến dạng Phương pháp vùng phổ biến là những phương pháp moment Ở mức thấp thứ tự moment hay bất biến moment mang
Trang 21theo những ý nghĩa vật lý kết hợp với sự phân phối pixel Tuy nhiên nó rất khó khăn để kết hợp thứ tự moment cao hơn với sự giải thích vật lý
Phương pháp lưới là dựa trên khả năng trực quan quan sát hình dạng,
nó không phản ánh sự thống kê phân bổ của vùng hình dạng và bị ảnh hưởng bởi nhiễu và không cô đọng như bất biến moment
1.5 Xương và các phương pháp tìm xương
Xương được coi như hình dạng cơ bản của một đối tượng, với số ít các điểm ảnh cơ bản Ta có thể khôi phục các thông tin về hình dạng nguyên bản của một đối tượng thông qua xương Một định nghĩa xúc tích về xương dựa trên tính continuum (tương tự như hiện tượng cháy đồng cỏ) được đưa ra bởi
Blum (1976) như sau:
Giả thiết rằng đối tượng là đồng nhất được phủ bởi cỏ khô và sau đó dựng lên một vòng biên lửa Xương được định nghĩa như nơi gặp của các vệt lửa và tại đó chúng được dập tắt [1]
Hình 1.2: Ví dụ về ảnh và xương
Có một số định nghĩa toán học khác nhau về xương trong các tài liệu
kỹ thuật và có nhiều thuật toán khác nhau cho tính toán chúng Trong các tài
Trang 22liệu kỹ thuật, khái niệm về xương và trục trung vị thường được sử dụng thay thế cho nhau ở một số tác giả, trong khi một số tác giả khác lại xem chúng chỉ liên quan với nhau mà không giống nhau
Tương tự, các khái niệm về tìm xương và làm mảnh cũng được coi là như nhau với một số tác giả và khác nhau đối với một số tác giả khác
Xương được sử dụng nhiều trong ứng dụng lĩnh vực máy tính, phân tích hình ảnh, và xử lý hình ảnh số, bao gồm nhận dạng ký tự quang học, nhận dạng vân tay, kiểm tra thị giác, nhận dạng mẫu, nén ảnh nhị phân
Phương pháp tìm xương luôn là chủ đề nghiên cứu trong xử lý ảnh những năm gần đây Mặc dù có những nỗ lực cho việc phát triển các thuật toán tìm xương, nhưng các phương pháp được đưa ra đều bị mất mát thông tin Có thể chia thành hai loại thuật toán tìm xương cơ bản:
Các thuật toán tìm xương dựa trên làm mảnh
Các thuật toán tìm xương không dựa trên làm mảnh
1.5.1 Phương pháp tìm xương dựa trên làm mảnh
Làm mảnh thông thường là bước chuẩn bị cho các bước tiếp theo xử lý một đối tượng của ảnh Các bước tiếp theo làm việc trên các thuộc tính cần thiết của xương
Thuật toán làm mảnh ảnh số nhị phân là một trong các thuật toán quan trọng trong xử lý ảnh và nhận dạng Xương chứa những thông tin bất biến về cấu trúc của ảnh, giúp cho quá trình nhận dạng hoặc vector hóa sau này
Thuật toán làm mảnh là quá trình lặp duyệt và kiểm tra tất cả các điểm thuộc đối tượng Trong mỗi lần lặp tất cả các điểm đối tượng sẽ được kiểm tra: nếu như chúng thỏa mãn điều kiện xóa nào đó tùy thuộc vào mỗi thuật toán thì nó sẽ bị xóa đi Quá trình cứ lặp lại cho đến khi không còn điểm biên nào được xóa Đối tượng được bóc dần lớp biên cho đến khi nào bị thu mảnh lại chỉ còn các điểm biên
Trang 23Về làm mảnh ta cần lưu ý: Không phải tất cả các đối tượng đều có thể làm mảnh Làm mảnh chỉ hữu dụng với các đối tượng là đường, nghĩa là chúng chỉ thẳng hoặc cong và nó không có tác dụng với các đối tượng có hình dạng đóng trong một vùng
Một số thuật toán làm mảnh:
Thuật toán làm mảnh song song: các điểm được xử lý cùng một lúc
Giá trị của mỗi điểm sau một lần lặp chỉ phụ thuộc vào giá trị của các láng giềng bên cạnh (thường là 8 – láng giềng) mà giá trị của các điểm này đã được xác định trong một lần lặp trước đó Trong những máy tính có nhiều bộ
vi xử lý thì mỗi vi xử lý sẽ xử lý một vùng của đối tượng, nó có quyền đọc các điểm ở vùng khác nhau nhưng chỉ được ghi trên vùng của nó xử lý
Thuật toán làm mảnh tuần tự: các điểm thuộc đối tượng sẽ được
kiểm tra theo một thứ tự nào đó (chẳng hạn các điểm được xét từ trái qua phải, từ trên xuống dưới) Giá trị của điểm sau mỗi lần lặp không những phụ thuộc vào giá trị của các láng giềng bên cạnh mà c̣n ph ụ thuộc vào các điểm
đã được xét trước đó trong chính lần lặp đang xét
Chất lượng của thuật toán làm mảnh được đánh giá theo các tiêu chuẩn được liệt kê dưới đây nhưng không nhất thiết phải thỏa mãn đồng thời tất cả các tiêu chuẩn:
Bảo toàn tính liên thông của đối tượng và phần bù của đối tượng
Sự tương hợp giữa xương và cấu trúc của ảnh đối tượng
Bảo toàn các thành phần liên thông
Bảo toàn các điểm cụt
Xương chỉ gồm các điểm biên, càng mảnh càng tốt
Bền vững đối với nhiễu
Xương cho phép khôi phục ảnh ban đầu của đối tượng
Xương thu được ở chính giữa đường nét của đối tượng được làm mảnh
Xương nhận được bất biến với phép quay
Trang 241.5.2 Phương pháp tìm xương không dựa trên làm mảnh
Bước thứ nhất, tính khoảng cách từ mỗi điểm ảnh của đối tượng đến điểm biên gần nhất Như vậy cần phải tính toán khoảng cách tới tất
cả các điểm biên của ảnh
Bước thứ hai, khoảng cách của ảnh đã được tính toán và các điểm ảnh có giá trị lớn nhất được xem là nằm trên xương của đối tượng Ngoài ra còn có một vài thuật toán duyệt các điểm biên 2 bên mẫu, tính điểm trung tâm các đường nối giữa các điểm biên đó và xương thu được là tâp hợp các điểm trung tâm đó (Line Following) hoặc các phương thức sử dụng chuỗi Fourier (Fourier transform)
Trang 25CHƯƠNG 2: MỘT SỐ KỸ THUẬT CẮT TỈA XƯƠNG
Một trong hai nhược điểm của xương là nhạy cảm đối với nhiễu đường biên của đối tượng, một ít nhiễu hoặc vài sự thay đổi của nhỏ trên đường biên cũng dẫn đến tạo ra những nhánh xương thừa hoặc làm cho vị trí điểm xương thiếu chính xác có thể làm ảnh hưởng nghiêm trọng tới hình dạng cơ bản của
đồ thị xương
Ví dụ như xương trong hình 2.1 có nhiều nhánh xương thừa được phát sinh ra bởi nhiễu đường biên
Hình 2.1: Nhánh xương thừa phát sinh bởi nhiễu đường biên
Để giải quyết vấn đề trên, nhiều kỹ thuật của các tác giả, nhóm tác giả
đã được đề xuất Có hai hướng chính đang được tập trung nghiên cứu là kỹ thuật dựa trên làm trơn đường bao và kỹ thuật dựa trên độ đo ý nghĩa của điểm xương
Các kỹ thuật làm trơn đường bao trước khi tính toán các điểm xương, nhằm mục đích loại bỏ nhiễu không mong muốn trên đường bao Tuy nhiên, làm trơn đường bao có thể làm thay đổi vị trí đường bao và do đó vị trí của xương có thể bị dịch chuyển, đó là khó khăn trong việc phân biệt nhiễu từ các thông tin hình dạng tần số thấp trên đường bao Một số khác gán độ đo có ý
Trang 26nghĩa cho các điểm xương hoặc nhánh xương, sau đó những điểm xương hoặc nhánh xương sẽ được cắt tỉa khi giá trị ý nghĩa nhỏ hơn giá trị ngưỡng
2.1 Kỹ thuật cắt tỉa xương Discrete Curve Evolution (DCE)
Đường bao của đối tượng thường rất phức tạp, có nhiều biến dạng nên việc tìm xương đối tượng cũng phức tạp dẫn đến ảnh hưởng tới độ chính xác của nhận dạng Bài toán đặt ra làm thế nào để tìm được xương của đối tượng
mà không có những nhánh xương giả do ảnh hưởng của nhiễu đường bao của đối tượng sinh ra
Nhóm tác giả Xiang Bai, Longin Jan Latecki, Wen-Yu Liu, đã đề xuất
kỹ thuật loại bỏ các điểm lồi ra trên đường bao mà không làm dịch chuyển các điểm biên Do đó các điểm xương tìm được sẽ không bị dịch chuyển vị trí Các nhánh xương “không mong muốn” sẽ bị loại bỏ trong khi những nhánh xương chính không bị cắt ngắn [7] Hình 2.2 minh họa xương trước và sau khi cắt tỉa với DCE
Hình 2.2: Xương ban đầu và xương sau khi cắt tỉa với DCE
Kỹ thuật cắt tỉa xương này dựa trên việc tiền xử lý đường bao hay làm mịn biên và có thể áp dụng với bất kỳ xương đầu vào nào Nhóm tác giả phân chia đường bao thành những đoạn cong và gán nhãn cho mỗi đoạn Loại bỏ
Trang 27các điểm xương của điểm đang xét nếu nằm trên cùng đoạn đường bao qua nhãn Chi tiết về thuật toán sẽ được trình bày ở phần dưới đây
2.1.1 Giải pháp
DCE thực hiện rời rạc đường cong biên để đơn giản hóa đường bao hình dạng ảnh đối tượng và thu được ít nhất các điểm lồi, cũng là các điểm nút của bộ xương Nhóm tác giả sử dụng mối quan hệ giữa điểm nút của bộ xương và các đỉnh của đường bao Xây dựng đa giác DCE từ các đỉnh lồi thu được
Xương được xây dựng tiếp theo từ các cặp điểm nút thu được từ bước xây dựng đa giác DCE bằng thuật toán tham lam
Coi đường cong biên của ảnh là một đa giác gồm n đỉnh, số đỉnh n đủ
lớn để nghiên cứu sự phát triển của hình dạng
Các điểm x 0 , ., x n-1 trên đường cong đóng C i tạo thành những phân
đoạn nhỏ hơn của C i nếu hai phân đoạn [x i , x i +1 ], [x i +1 , x i +2 ] giao nhau tại {x i +1 }, những đoạn không liên tục thì có những điểm giao cắt là rỗng và C i là hợp
của những đoạn này Phân vùng Γ của đường bao ∂D là một chuỗi có trình tự phân vùng của những đường cong đóng đơn giản C 1 , , C k
Trang 28Định nghĩa 2.2: Một phân đoạn [x, y] của một đường cong C trên
đường bao ∂D Điểm s là điểm xương của đoạn [x, y], tất cả các điểm sinh tạo
ra điểm xương s trên đường bao ∂D là Tan(s) nằm trong đoạn [x, y] Ký hiệu arc(s, [x, y]) là đường cong nhỏ nhất của [x, y] có chứa Tan(s)
Hình 2.3: Đường đậm liên tục là cung ban đầu [x,y] Cung [a,b] chính là
arc(s,[x, y])=[a,b] Xương là các đường đậm cách quãng
Định nghĩa 2.3: Cho một phân vùng Γ của đường bao ∂D của một tập
được kết nối đơn giản D (∂D gồm có một đường cong đóng đơn giản), cắt tỉa
xương được định nghĩa như là việc loại bỏ tất cả các điểm xương sS (D) có
những điểm sinh của s nằm trên cùng đoạn của phân vùng Chính xác hơn, xương được cắt tỉa được tạo thành từ tất cả các s điểm sS (D), sao cho
Tan(s) không chứa trong cùng một đoạn của phân vùng Γ
Định nghĩa 2.4: Tiến trình đơn giản hóa đường cong DCE phân chia
trình tự với đa giác đầu vào P {v 1 , …, v n } là đỉnh của P, {u 1 , …, u m }⊂{v 1 , …,
v n } là đỉnh lồi của P n-k sao cho m ≤ n-k Trên cấp n-k của phân chia H n-k (P), P
bị phân thành các cung nhỏ m của P: H n-k (P) ={[u 1 , u 2 ], [u 2 , u 3 ], …, [u m , u 1 ]}
Trang 29Nếu đỉnh u i được xoá trong bước tiếp theo, (ví dụ, u i ∈ P n-k - P n- k+1), hoặc trở thành lõm (do xoá đi một trong những đỉnh ở bên cạnh) thì sau đó
cung [u i-1 , u i+1 ] được thay thế bởi cung [u i-1 , u i ], [u i , u i+1 ] trong H n- (k+1) (P)
2.1.1.2 Xây dựng đa giác DCE
Tất cả đường cong số đều có thể biểu diễn bởi một đa giác một cách hoàn chỉnh nên ta chỉ cần khảo sát các đa giác là đủ [2]
Trong hình 2.4: tính toán độ liên quan của các đỉnh với hình dạng đối
tượng đã được đề xuất …: Tìm x sao cho quay AE xung quanh A và EF xung quanh E để EF và AE cùng hướng và độ dài cung FF’= BB’, nghĩa là:
Trang 30Tại mỗi bước DCE, mỗi cặp cạnh s 1 , s 2 kề nhau của đa giác sẽ được
thay thế bởi cạnh s 1 Us 2 nối điểm đầu s 1 và điểm cuối s 2 Sự thay thế được quy
định theo giá trị K tính bởi công thức (2.3):
2 1
2 1 2 1 2
1
, ,
s l s l
s l s l s s s
s K
l(s1 ), l(s2): là độ dài các cạnh s 1 (AE), s 2 (EF) đã được chuẩn hóa bằng
cách chia cho tổng độ dài các cạnh của đa giác
Giá trị K(s 1 , s 2 ) càng lớn thì giá trị của cung nối s 1 , s 2 càng lớn Từ đó
tại mỗi bước loại bỏ các cạnh có giá trị K(s 1 , s 2 ) nhỏ hơn ngưỡng theta thì đỉnh đang xét i bị loại và độ đo của đỉnh sau i+1 và đỉnh trước i-1 sẽ được tính toán lại Cuối cùng thu được đa giác với m đỉnh nhỏ hơn n đỉnh đối tượng
đang xét Các đỉnh lồi trên đường bao đối tượng sẽ tạo thành các cung và được gán nhăn tương ứng
Hình 2.5: Đa giác đơn giản với 8 đỉnh
Trang 31Như minh họa trong hình 2.6 dưới đây thể hiện các đa giác (màu đỏ) được đơn giản bởi kỹ thuật DCE với các ngưỡng khác nhau
Hình 2.6: Bộ xương của lá với các ngưỡng khác nhau
Trình tự bộ xương của lá thu được bằng cách cắt tỉa bộ xương đầu vào (phía trên bên trái) với sự chú ý đoạn đường biên thu được bởi DCE Đường nét bên ngoài (màu đỏ) thể hiện đơn giản hóa đường biên với DCE
Kỹ thuật DCE phân chia đường bao đường bao đối tượng một cách trình tự thành một tập hữu hạn các đường cong Trong mỗi bước một véctơ
nhỏ nhất không thỏa mãn điều kiện ngưỡng theta được loại bỏ Kỹ thuật cắt tỉa đề xuất có thể được áp dụng cho mặt phẳng D, với đường bao ∂D là các
đường cong kín
DCE có thể loại bỏ hiệu quả nhiễu và từng phần không quan trọng của
ảnh, nhưng cần xác định một tham số dừng Nói cách khác, tìm kiếm k để đa
Trang 32giác được đơn giản hóa P n-k miêu tả chi tiết những đường biên đầu vào Để
định lượng mức độ chi tiết, nhóm tác giả xác định khoảng cách trung bình P n-k
giữa điểm gốc của P và đường phân đoạn tương ứng của nó trong P n-k
Đưa ra giới hạn T, có thể dừng DCE nếu D av (P n-k ) > T cho một vài k Cho một chuỗi các giá trị T, chúng ta có thể có được một trình tự của đơn giản
hóa đường biên đa giác DCE, dẫn đến trình tự của những xương tương ứng Nói chung, điều kiện dừng thích hợp phụ thuộc vào ứng dụng cụ thể
2.1.1.3 Cắt tỉa xương dựa trên DCE
Trước khi tìm hiểu tổng quát việc cắt tỉa xương dựa trên kỹ thuật DCE
ta xét ví dụ đơn giản minh họa cho việc cắt tỉa xương dựa trên đa giác có 11 đỉnh trong đó có 6 đỉnh lồi và 5 đỉnh lõm được thể hiện trong hình 2.7 dưới đây
Hình 2.7: Minh họa cắt tỉa xương
Để đơn giản ta tiến hành cắt tỉa với hai đỉnh lồi a và b Như đã thấy,
sau bước đơn giản hóa đường bao nhóm tác giả thu được một bộ đỉnh lồi,