1. Trang chủ
  2. » Luận Văn - Báo Cáo

Một số kỹ thuật cắt tỉa xương trong xử lý ảnh

65 23 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 65
Dung lượng 1,4 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Hầu hết các phương pháp tìm xương hiện tại đều có một hạn chế chung đó là nhạy cảm cao đối với nhiễu đường biên: những biến đổi nhỏ trên đường biên của đối tượng có thể làm thay đổi đáng

Trang 2

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

NGƯỜI HƯỚNG DẪN KHOA HỌC

TS Đào Nam Anh

THÁI NGUYÊN - 2012

Trang 3

Trước tiên, con xin bày tỏ lòng biết ơn đến cha mẹ đã sinh thành, nuôi dạy con khôn lớn để con có được thành quả như ngày hôm này

Em xin chân thành cảm ơn TS Đào Nam Anh - người luôn chỉ bảo, trực tiếp hướng dẫn, cung cấp những tài liệu quý báu, nhận xét giúp đỡ em trong lựa chọn hướng nghiên cứu cũng như quá trình hoàn thành luận văn

Em cảm ơn các thầy cô giáo Viện Công nghệ Thông tin - Viện Khoa học và Công nghệ Việt Nam, Trường Đại học Công nghệ thông tin và Truyền thông - Đại học Thái Nguyên Các bạn học viên lớp Cao học CK09

đã luôn động viên tôi trong quá trình học tập và hoàn thành luận văn

Xin cảm ơn các đồng nghiệp tại Trường Đại Học Dân Lập Hải Phòng

đã giúp đỡ, hỗ trợ trong suốt quá trình học tập, công tác

Trang 4

Tôi xin cam đoan luận văn này do tôi tự nghiên cứu, tìm hiểu và tổng hợp từ nhiều nguồn tài liệu khác nhau Luận văn tốt nghiệp là kết quả của quá trình học tập, nghiên cứu và thực hiện hoàn toàn nghiêm túc, trung thực của bản thân Tất cả các tài liệu tham khảo đều có xuất xứ rõ ràng và được trích dẫn hợp pháp

Tôi xin hoàn toàn chịu trách nhiệm về nội dung và sự trung thực trong luận văn tốt nghiệp Thạc sĩ của mình

Trang 5

MỤC LỤC

DANH MỤC CÁC THUẬT NGỮ, CÁC TỪ VIẾT TẮT iii

DANH MỤC CÁC BẢNG iv

DANH MỤC CÁC HÌNH v

MỞ ĐẦU 1

CHƯƠNG 1: TỔNG QUAN VỀ RÚT GỌN VÀ BIỂU DIỄN ĐỐI TƯỢNG 3

1.1 Một số khái niệm Xử lý ảnh 3

1.1.1 Ảnh và điểm ảnh 3

1.1.2 Lân cận của điểm ảnh 4

1.1.3 Mối liên kết điểm ảnh 4

1.1.4 Đo khoảng cách giữa các điểm ảnh 5

1.1.5 Mức xám 5

1.2 Biên và các phương pháp tìm biên 6

1.2.1 Phát hiện biên trực tiếp 6

1.2.2 Phát hiện biên gián tiếp 7

1.3 Các phép toán hình thái học cơ bản 7

1.3.1 Định nghĩa phép giãn (Dilation) 7

1.3.2 Định nghĩa phép co (Erosion) 8

1.3.3 Định nghĩa phép mở (Open) 8

1.3.4 Định nghĩa phép đóng (Close) 9

1.4 Biểu diễn hình dạng đối tượng 9

1.4.1 Kỹ thuật biểu diễn hình dạng dựa trên biên 11

1.4.2 Kỹ thuật biểu diễn hình dạng dựa trên vùng 11

1.5 Xương và các phương pháp tìm xương 12

Trang 6

1.5.1 Phương pháp tìm xương dựa trên làm mảnh 13

1.5.2 Phương pháp tìm xương không dựa trên làm mảnh 15

CHƯƠNG 2: MỘT SỐ KỸ THUẬT CẮT TỈA XƯƠNG 16

2.1 Kỹ thuật cắt tỉa xương Discrete Curve Evolution (DCE) 17

2.1.1 Giải pháp 18

2.1.2 Độ phức tạp của DCE 27

2.2 Kỹ thuật cắt tỉa xương Discrete Skeleton Evolution (DSE) 28

2.2.1 Giải pháp 29

2.2.1 Độ phức tạp của DSE 32

2.3 Kỹ thuật cắt tỉa xương Bending Potential Ratio (BPR) 33

2.3.1 Giải pháp 34

2.3.2 Cắt tỉa xương với BPR 40

CHƯƠNG 3: THỬ NGHIỆM CẮT TỈA XƯƠNG 44

3.1 Môi trường cài đặt thử nghiệm 44

3.2 Thử nghiệm cắt tỉa xương 45

3.2.1 Kỹ thuật DCE 45

3.2.2 Kỹ thuật DSE 47

3.2.3 Kỹ thuật BPR 49

3.3 Một vài so sánh giữa DCE, DSE và BPR 51

3.4 Nhận xét chung 54

KẾT LUẬN 55

TÀI LIỆU THAM KHẢO 56

Trang 7

DANH MỤC CÁC THUẬT NGỮ, CÁC TỪ VIẾT TẮT

Trang 8

CÁC TỪ VIẾT TẮT

DANH MỤC CÁC BẢNG

Bảng 3.1: Một số ảnh được sử dụng trong thực nghiệm 44

Bảng 3.2: So sánh xương hình móng ngựa 51

Bảng 3.3: So sánh xương Thằn lằn 52

Bảng 3.4: So sánh xương Lạc đà 53

Trang 9

DANH MỤC CÁC HÌNH

Hình 1.1: Phân loại các kỹ thuật mô tả hình dạng 10

Hình 1.2: Ví dụ về ảnh và xương 12

Hình 1.3: Minh họa về trục trung vị 15

Hình 2.1: Nhánh xương thừa phát sinh bởi nhiễu đường biên 16

Hình 2.2: Xương ban đầu và xương sau khi cắt tỉa với DCE 17

Hình 2.3: Đường đậm liên tục là cung ban đầu [x,y] Cung [a,b] chính là arc(s,[x, y])=[a,b] Xương là các đường đậm cách quãng 19

Hình 2.4: Tính toán các đỉnh lồi trên đường bao 20

Hình 2.5: Đa giác đơn giản với 8 đỉnh 21

Hình 2.6: Bộ xương của lá với các ngưỡng khác nhau 22

Hình 2.7: Minh họa cắt tỉa xương 23

Hình 2.8: Minh họa quá trình tìm xương 24

Hình 2.9: Minh họa cắt tỉa xương với DCE 25

Hình 2.10: Loại bỏ đỉnh lồi không quan trọng tạo ra xương tối ưu 26

Hình 2.11: Các điểm xương cuối (a) và mong muốn (b) 28

Hình 2.12: Nhánh xương ít ý nghĩa màu đỏ (a) được loại bỏ (b) 28

Hình 2.13: Các điểm xương cuối (đỏ), các điểm giao (xanh) 30

Hình 2.14: Khôi phục lại hình dạng gốc từ xương 30

Hình 2.15: Định nghĩa của điểm ghost và BPR 35

Hình 2.16: Vùng của điểm ghost 36

Hình 2.17: Hình chữ nhật với cùng một đỉnh thêm vào đường biên 39

Hình 2.18: Xương chân của một con Lạc đà 41

Hình 3.1: DCE với các ngưỡng khác nhau 45

Hình 3.2: Xương Bạch tuộc sau cắt tỉa 46

Hình 3.3: Cắt tỉa xương với DSE 47

Hình 3.4: Cắt tỉa BPR với các ngưỡng khác nhau 49

Hình 3.5: Nhánh xương cuối bị ngắn do ngưỡng không phù hợp 50

Hình 3.6: Minh họa mức độ đóng góp khác nhau 50

Trang 10

MỞ ĐẦU

Mục đích quan trọng trong phân tích ảnh là đối sánh và nhận dạng đối tượng Việc này có thể được thực hiện thông qua một vài cách, sử dụng màu sắc, kết cấu, hình dạng, momen và vị trí Hình dạng là yếu tố quan trọng của đối tượng và cũng là hướng nghiên cứu quan trọng trong phân lớp và nhận dạng Hình dạng của đối tượng phẳng có thể được mô tả dựa trên đường bao hoặc dựa trên xương của chúng

Khi sử dụng đường bao trong phân lớp và nhận dạng, những lớp hình dạng có thay đổi lớn về hình dạng toàn cục do có biến đổi cấu trúc hoặc yếu

tố nào đó thường gây ra khó khăn cho quá trình nhận dạng [4] Những phương pháp đối sánh hình dạng đích với các hình dạng mẫu được lưu trữ trong cơ sở dữ liệu thì đòi hỏi một số lượng lớn các mẫu được lưu trữ [5] Hơn nữa những phương pháp dựa trên mô hình và ví dụ rất khó quản lý được lớp đối tượng có phần khác nhau mà không phân tách thành các lớp con riêng biệt

Xương (còn được gọi là trục trung vị) lần đầu tiên được xác định bởi tác giả Blum năm 1976 [7,1], là cách mô tả hình dạng rất hữu ích và quan trọng cho nhận dạng đối tượng vì nó chứa các đặc trưng hình dạng của đối tượng gốc Hình dạng tương tự dựa trên đối sánh xương thường thực hiện nhanh hơn đường biên [3] Do vậy, xương được sử dụng để biểu diễn và phân tích hình dạng trong nhiều lĩnh vực ứng dụng như hệ thống tra cứu ảnh dựa trên nội dung, hệ thống nhận dạng ký tự Những thập kỷ qua, có rất nhiều phương pháp trích chọn xương đã được đề xuất [6,7]

Hầu hết các phương pháp tìm xương hiện tại đều có một hạn chế chung

đó là nhạy cảm cao đối với nhiễu đường biên: những biến đổi nhỏ trên đường biên của đối tượng có thể làm thay đổi đáng kể xương nhận được Do các

Trang 11

phương pháp này thường tạo ra các nhánh xương “giả”, ảnh hưởng tới việc nhận dạng đối tượng dựa trên cấu trúc xương Do đó, có thể nói việc nghiên cứu các phương pháp cắt tỉa xương nhằm nâng cao hiệu quả biểu diễn đối tượng phục vụ cho đối sánh và nhận dạng đối tượng dựa trên Shape là hết sức

cần thiết Đó cũng là cơ sở cho việc thực hiện đề tài “Một số phương pháp cắt tỉa xương trong xử lý ảnh”

Luận văn có ba chương:

Chương 1: Tổng quan về rút gọn và biểu diễn đối tượng

Chương 2: Một số kỹ thuật cắt tỉa xương

Chương 3: Thử nghiệm cắt tỉa xương

Trang 12

CHƯƠNG 1: TỔNG QUAN VỀ RÚT GỌN VÀ BIỂU DIỄN ĐỐI TƯỢNG 1.1 Một số khái niệm Xử lý ảnh

Xử lý ảnh số là một lĩnh vực tin học ứng dụng Xử lý dữ liệu bằng đồ họa đề cập đến những ảnh nhân tạo, các ảnh này được xem xét như là một cấu trúc dữ liệu và được tạo ra bởi các chương trình Xử lý ảnh số bao gồm các phương pháp và kỹ thuật biến đổi, để truyền tải hoặc mã hóa các ảnh tự nhiên

Quá trình biến đổi từ một ảnh ban đầu sang một ảnh mới thường có hai mục đích chính:

 Cải thiện chất lượng phục vụ cho quan sát

 Chuẩn bị các điều kiện cho việc trích chọn các đặc trưng phục vụ cho việc nhận dạng và ra quyết định

1.1.1 Ảnh và điểm ảnh

Ảnh trong thực tế là một ảnh liên tục về không gian và về giá trị độ

sáng chúng được biểu diễn bằng một hàm 2 biến thực hoặc phức kí hiệu là f(x,

y) Trong đó x, y là các giá trị tọa độ không gian và giá trị của f sẽ tỷ lệ với độ

sáng của ảnh tại điểm này

Để có thể xử lý ảnh bằng máy tính cần thiết phải tiến hành số hóa ảnh Trong quá trình số hóa, người ta biến đổi tín hiệu liên tục sang tín hiệu rời rạc thông qua quá trình lấy mẫu (rời rạc hóa về không gian) và lượng tử hóa thành phần giá trị mà về nguyên tắc bằng mắt thường không phân biệt được hai điểm kề nhau Trong quá trình này, người ta sử dụng khái niệm Picture element mà ta quen gọi hay viết tắt là pixel – phần tử ảnh Như vậy, mỗi ảnh

là một tập hợp các pixel

Trang 13

Ảnh số là ảnh xử lý bằng máy tính thu được từ ảnh liên tục bởi quá

trình số hóa, thường được biểu diễn bởi mảng hai chiều I(n, p): n dòng và p cột Người ta thường kí hiệu I(x, y) để chỉ một pixel Một pixel có thể được lưu trữ bằng 1, 4, 8, 16 hay 24 bit Thường được kí hiệu là I[m, n]

Độ phân giải (Resolution) là mật độ của ảnh được ấn định trên ảnh số khi hiển thị Như vậy khoảng cách giữa các điểm ảnh được chọn sao cho mắt người vẫn thấy được sự liên tục của ảnh Việc chọn này tạo nên mật độ phân

bổ đó chính là độ phân giải được phân bổ liên tục theo x, y

1.1.2 Lân cận của điểm ảnh

Giả sử một ảnh số được biểu diễn bằng hàm f(x, y), p và q là cặp điểm ảnh có quan hệ với nhau, điểm ảnh p có tọa độ (x, y) Định nghĩa các lân cận

của điểm ảnh

Lân cận 4 của p kí hiệu N 4 (p):

- N 4 (p) = {(x-1, y); (x, y-1); (x, y+1); (x+1, y)}

Lân cận chéo của p kí hiệu N p (p):

- N p (p) ={(x+1, y+1); (x+1, y-1); (x-1, y+1); (x-1, y-1)}

Lân cận 8 của p kí hiệu N 8 (p):

- N 8 (p) = N 4 (p) + N p (p)

1.1.3 Mối liên kết điểm ảnh

Các mối liên kết được sử dụng để xác định giới hạn của đối tượng hoặc xác định vùng trong một ảnh Một liên kết được đặc trưng bởi tính liền kề giữa các điểm và mức xám của chúng

Trang 14

1.1.4 Đo khoảng cách giữa các điểm ảnh

Khoảng cách D(p, q) giữa hai điểm ảnh p có tọa độ (x, y), q có tọa độ

(s, t) là hàm khoảng cách (Distance) nếu:

- D(p, q) ≥ 0 (Với D(p, q)=0 khi và chỉ khi p=q)

- D(p, q) = D(q, p)

- D(p, z) ≤ D(p, q) + D(q, z); z là một điểm ảnh khác

Khoảng cách Euclide giữa hai điểm ảnh p(x, y) và q(s, t) được định

nghĩa như sau:

D e (p, q) = [(x - s) 2 + (y - t) 2 ] 1/2 (1.1)

1.1.5 Mức xám

Mức xám (Gray level): Giá trị I[x, y] biểu diễn cường độ sáng được mã hóa của mỗi điểm ảnh (x, y) Giá trị đó còn được gọi là mức xám I[x, y] có giá trị rời rạc và để tiện xử lý, ta coi giá trị của I[x, y] là nguyên: I[x, y] ∈ {0, 1,

…, L-1} với L là mức xám tối đa dùng để biểu diễn Ảnh có nhiều mức xám

gọi là ảnh đa cấp xám Ảnh chỉ có 2 mức xám 0 và 1 gọi là ảnh nhị phân

Trang 15

Cách mã hóa kinh điển thường dùng là 16, 32 hay 64 mức Mã hóa 256 mức là phổ dụng nhất do lý do kỹ thuật Vì 28 = 256 (0, 1, , 255), nên với

256 mức mỗi pixel sẽ được mã hóa bởi 8 bit

Ảnh nhị phân, mỗi pixel mã hóa trên 1 bit; còn ảnh 256 màu, mỗi pixel

mã hóa trên 8 bit

Ảnh màu là ảnh tổ hợp từ 3 màu cơ bản: đỏ (Red), lục (Green), lam (Blue) và thường thu nhận trên các dải băng tần khác nhau Để biểu diễn cho mỗi điểm ảnh màu cần 3 byte để mô tả 24 bit màu

Ảnh xám là trường hợp đặc biệt của ảnh màu Mỗi điểm ảnh màu có 3 giá trị (Red, Green, Blue), nếu 3 giá trị này bằng nhau thì ta có ảnh xám

1.2 Biên và các phương pháp tìm biên

Biên là vấn đề quan trọng trong trích chọn đặc điểm nhằm tiến tới hiểu ảnh Cho đến nay chưa có định nghĩa chính xác về biên, trong mỗi ứng dụng người ta đưa ra các độ đo khác nhau về biên, một trong các độ đo đó là độ đo

về sự thay đổi đột ngột về cấp xám Ví dụ: Đối với ảnh đen trắng, một điểm được gọi là điểm biên nếu nó là điểm đen có ít nhất một điểm trắng bên cạnh Tập hợp các điểm biên tạo nên biên hay đường bao của đối tượng Xuất phát

từ cơ sở này người ta thường sử dụng hai phương pháp phát hiện biên cơ bản

1.2.1 Phát hiện biên trực tiếp

Phương pháp này làm nổi biên dựa vào sự biến thiên mức xám của ảnh Kỹ thuật chủ yếu dùng để phát hiện biên ở đây là kỹ thuật lấy đạo hàm Nếu lấy đạo hàm bậc nhất của ảnh ta có các kỹ thuật Gradient, nếu lấy đạo hàm bậc hai của ảnh ta có kỹ thuật Laplace, ngoài ra còn có một số các tiếp cận khác

Trang 16

1.2.2 Phát hiện biên gián tiếp

Nếu bằng cách nào đó ta phân được ảnh thành các vùng thì ranh giới giữa các vùng đó gọi là biên Kỹ thuật dò biên và phân vùng ảnh là hai bài toán đối ngẫu nhau vì dò biên để thực hiện phân lớp đối tượng mà khi đã phân lớp xong nghĩa là đã phân vùng được ảnh và ngược lại, khi đã phân vùng ảnh

đã được phân lớp thành các đối tượng, do đó có thể phát hiện được biên

Phương pháp phát hiện biên trực tiếp tỏ ra khá hiệu quả và ít chịu ảnh hưởng của nhiễu, song nếu sự biến thiên độ sáng không đột ngột, phương pháp tỏ ra kém hiệu quả, phương pháp phát hiện biên gián tiếp tuy khó cài đặt, song lại áp dụng khá tốt trong trường hợp này Sự khác biệt cơ bản giữa hai phương pháp này là:

 Phương pháp phát hiện biên trực tiếp cho ta kết quả là ảnh biên

 Phương pháp phát hiện biên trực tiếp cho ta kết quả là đường biên

1.3 Các phép toán hình thái học cơ bản

Hình thái có nghĩa là cấu trúc hay topology của đối tượng, là một cách

để mô tả đối tượng ảnh số Hai phép toán hình thái cơ bản là; phép giãn (Dilation) và phép co (Erosion)

Các phép toán này được định nghĩa như sau: Giả thiết ta có đối tượng X

và phần tử cấu trúc (mẫu) B trong không gian Euclide hai chiều Kí hiệu Bx là dịch chuyển của B tới vị trí x

1.3.1 Định nghĩa phép giãn (Dilation)

Phép giãn của X theo mẫu B là hợp của tất cả các B x với x thuộc X Ta có:

X B =

X x x

B

Trang 17

00xx0

0xx00

xx000

0 0

0

0 0 0

0 0

0 0

x x x

x x

x x

x x x

x x x

x x x x

x x x

x x x x x

x x x x

00

00

0 0 0 0 0

0 0 0 0

0 0 0

0

0 0

0 0

x x

x x x

B =  x

Trang 18

1.3.4 Định nghĩa phép đóng (Close)

Phép đóng của X theo cấu trúc B là tập hợp các điểm của ảnh X sau khi

đã giãn nở và co liên tiếp theo B Ta có:

0xxx0

00xx0

xxxxx

xxxx0

1.4 Biểu diễn hình dạng đối tƣợng

Các phương pháp biểu diễn hình dạng phổ biến nhất là dựa trên việc sử dụng các điểm biên hình dạng và điểm vùng Biểu diễn hình dạng cũng có thể được phân biệt giữa miền không gian và miền đặc trưng Phương pháp trong miền không gian so sánh các hình dạng dựa trên điểm (hoặc điểm đặc trưng)

cơ sở, còn phương pháp miền đặc trưng so sánh các hình dạng dựa trên đặc trưng vector cơ sở

Một cách phân loại các kỹ thuật biểu diễn hình dạng khác là dựa trên cơ

sở bảo quản thông tin Phương pháp cho phép xây dựng lại chính xác một hình dạng từ mô tả của nó được gọi là lưu trữ thông tin (Information preserving - IP), còn phương pháp chỉ có khả năng xây dựng lại một phần hoặc mô tả không rõ ràng được gọi là sự không lưu trữ thông tin (Non Information preserving - NIP)

Trang 19

Các phương pháp biểu diễn hình dạng được phân loại theo các cấp bậc, đầu tiên phương pháp phân loại dựa trên đường biên và phương pháp phân loại dựa trên vùng căn cứ vào đặc trưng hình dạng được trích chọn từ đường biên hay toàn bộ các phân vùng hình dạng Trong mỗi lớp, các phương pháp khác nhau được tiếp tục phân biệt thành cấu trúc và toàn cục dựa vào việc hình dạng được biểu diễn theo toàn bộ hay theo các thành phần con Sau đó, tiếp tục phân ra các phương pháp cụ thể như mô tả trong sơ đồ hình 1.1

Hình 1.1: Phân loại các kỹ thuật mô tả hình dạng

Dựa trên biên

Dựa trên biên

Dựa trên biên

Dựa trên biên

Dựa trên biên

Dựa trên biên

Dựa trên biên

Dựa trên biên

Momen biên

Bất biến momen hình học

Bất biến momen đại số

Phương pháp lưới

Bề mặt lồi

Trục trung vị

Trang 20

1.4.1 Kỹ thuật biểu diễn hình dạng dựa trên biên

Kỹ thuật biểu diễn hình dạng dựa trên biên chỉ khai thác thông tin trên biên Có hai loại phương pháp tiếp cận rất khác nhau cho kỹ thuật dựa trên biên: phương pháp tiếp cận liên tục hay toàn cục và phương pháp tiếp cận rời rạc theo cấu trúc

Phương pháp tiếp cận liên tục không phân chia hình dạng thành các phần mà sử dụng một vector đặc trưng có gốc từ đường biên để mô tả hình dạng Thước đo sự giống nhau về hình dạng là dựa trên sự đối sánh các điểm đặc biệt hoặc dựa trên đặc trưng

Phương pháp tiếp cận rời rạc chia đường biên thành các phân đoạn bằng cách sử dụng một tiêu chuẩn cụ thể Biểu diễn cuối cùng thường là một chuỗi hoặc một đồ thị (hoặc cây), các biện pháp tương tự được thực hiện bằng cách kết hợp chuỗi hoặc đồ thị một cách phù hợp

1.4.2 Kỹ thuật biểu diễn hình dạng dựa trên vùng

Trong phương pháp biểu diễn dựa trên vùng phải kể đến tất cả những pixel trong vùng hình dạng thu được trong biểu diễn hình dạng Phương pháp biểu diễn vùng thường sử dụng các momen để mô tả hình dạng Một số phương pháp khác thường sử dụng gồm: phương pháp lưới, bề mặt lồi và trục trung vị

Biểu diễn hình dạng dựa trên vùng xem xét đến toàn bộ vùng hình dạng

và sử dụng hiệu quả thông tin của toàn bộ pixel chứa trong vùng Những phương pháp này đo sự phân phối pixel của vùng hình dạng, chúng ít có khả năng giả tạo bởi nhiễu và biến dạng Phương pháp vùng phổ biến là những phương pháp moment Ở mức thấp thứ tự moment hay bất biến moment mang

Trang 21

theo những ý nghĩa vật lý kết hợp với sự phân phối pixel Tuy nhiên nó rất khó khăn để kết hợp thứ tự moment cao hơn với sự giải thích vật lý

Phương pháp lưới là dựa trên khả năng trực quan quan sát hình dạng,

nó không phản ánh sự thống kê phân bổ của vùng hình dạng và bị ảnh hưởng bởi nhiễu và không cô đọng như bất biến moment

1.5 Xương và các phương pháp tìm xương

Xương được coi như hình dạng cơ bản của một đối tượng, với số ít các điểm ảnh cơ bản Ta có thể khôi phục các thông tin về hình dạng nguyên bản của một đối tượng thông qua xương Một định nghĩa xúc tích về xương dựa trên tính continuum (tương tự như hiện tượng cháy đồng cỏ) được đưa ra bởi

Blum (1976) như sau:

Giả thiết rằng đối tượng là đồng nhất được phủ bởi cỏ khô và sau đó dựng lên một vòng biên lửa Xương được định nghĩa như nơi gặp của các vệt lửa và tại đó chúng được dập tắt [1]

(a) Ảnh gốc (b) Xương

Hình 1.2: Ví dụ về ảnh và xương

Có một số định nghĩa toán học khác nhau về xương trong các tài liệu

kỹ thuật và có nhiều thuật toán khác nhau cho tính toán chúng Trong các tài

Trang 22

liệu kỹ thuật, khái niệm về xương và trục trung vị thường được sử dụng thay thế cho nhau ở một số tác giả, trong khi một số tác giả khác lại xem chúng chỉ liên quan với nhau mà không giống nhau

Tương tự, các khái niệm về tìm xương và làm mảnh cũng được coi là như nhau với một số tác giả và khác nhau đối với một số tác giả khác

Xương được sử dụng nhiều trong ứng dụng lĩnh vực máy tính, phân tích hình ảnh, và xử lý hình ảnh số, bao gồm nhận dạng ký tự quang học, nhận dạng vân tay, kiểm tra thị giác, nhận dạng mẫu, nén ảnh nhị phân

Phương pháp tìm xương luôn là chủ đề nghiên cứu trong xử lý ảnh những năm gần đây Mặc dù có những nỗ lực cho việc phát triển các thuật toán tìm xương, nhưng các phương pháp được đưa ra đều bị mất mát thông tin Có thể chia thành hai loại thuật toán tìm xương cơ bản:

 Các thuật toán tìm xương dựa trên làm mảnh

 Các thuật toán tìm xương không dựa trên làm mảnh

1.5.1 Phương pháp tìm xương dựa trên làm mảnh

Làm mảnh thông thường là bước chuẩn bị cho các bước tiếp theo xử lý một đối tượng của ảnh Các bước tiếp theo làm việc trên các thuộc tính cần thiết của xương

Thuật toán làm mảnh ảnh số nhị phân là một trong các thuật toán quan trọng trong xử lý ảnh và nhận dạng Xương chứa những thông tin bất biến về cấu trúc của ảnh, giúp cho quá trình nhận dạng hoặc vector hóa sau này

Thuật toán làm mảnh là quá trình lặp duyệt và kiểm tra tất cả các điểm thuộc đối tượng Trong mỗi lần lặp tất cả các điểm đối tượng sẽ được kiểm tra: nếu như chúng thỏa mãn điều kiện xóa nào đó tùy thuộc vào mỗi thuật toán thì nó sẽ bị xóa đi Quá trình cứ lặp lại cho đến khi không còn điểm biên nào được xóa Đối tượng được bóc dần lớp biên cho đến khi nào bị thu mảnh lại chỉ còn các điểm biên

Trang 23

Về làm mảnh ta cần lưu ý: Không phải tất cả các đối tượng đều có thể làm mảnh Làm mảnh chỉ hữu dụng với các đối tượng là đường, nghĩa là chúng chỉ thẳng hoặc cong và nó không có tác dụng với các đối tượng có hình dạng đóng trong một vùng

Một số thuật toán làm mảnh:

Thuật toán làm mảnh song song: các điểm được xử lý cùng một lúc

Giá trị của mỗi điểm sau một lần lặp chỉ phụ thuộc vào giá trị của các láng giềng bên cạnh (thường là 8 – láng giềng) mà giá trị của các điểm này đã được xác định trong một lần lặp trước đó Trong những máy tính có nhiều bộ

vi xử lý thì mỗi vi xử lý sẽ xử lý một vùng của đối tượng, nó có quyền đọc các điểm ở vùng khác nhau nhưng chỉ được ghi trên vùng của nó xử lý

Thuật toán làm mảnh tuần tự: các điểm thuộc đối tượng sẽ được

kiểm tra theo một thứ tự nào đó (chẳng hạn các điểm được xét từ trái qua phải, từ trên xuống dưới) Giá trị của điểm sau mỗi lần lặp không những phụ thuộc vào giá trị của các láng giềng bên cạnh mà c̣n ph ụ thuộc vào các điểm

đã được xét trước đó trong chính lần lặp đang xét

Chất lượng của thuật toán làm mảnh được đánh giá theo các tiêu chuẩn được liệt kê dưới đây nhưng không nhất thiết phải thỏa mãn đồng thời tất cả các tiêu chuẩn:

 Bảo toàn tính liên thông của đối tượng và phần bù của đối tượng

 Sự tương hợp giữa xương và cấu trúc của ảnh đối tượng

 Bảo toàn các thành phần liên thông

 Bảo toàn các điểm cụt

 Xương chỉ gồm các điểm biên, càng mảnh càng tốt

 Bền vững đối với nhiễu

 Xương cho phép khôi phục ảnh ban đầu của đối tượng

 Xương thu được ở chính giữa đường nét của đối tượng được làm mảnh

 Xương nhận được bất biến với phép quay

Trang 24

1.5.2 Phương pháp tìm xương không dựa trên làm mảnh

Trong đó: d( ): là khoảng cách Euclide, B: là đường bao đối tượng

1.5.2.2 Thuật toán tìm trục trung vị

 Bước thứ nhất, tính khoảng cách từ mỗi điểm ảnh của đối tượng đến điểm biên gần nhất Như vậy cần phải tính toán khoảng cách tới tất

cả các điểm biên của ảnh

 Bước thứ hai, khoảng cách của ảnh đã được tính toán và các điểm ảnh có giá trị lớn nhất được xem là nằm trên xương của đối tượng Ngoài ra còn có một vài thuật toán duyệt các điểm biên 2 bên mẫu, tính điểm trung tâm các đường nối giữa các điểm biên đó và xương thu được là tâp hợp các điểm trung tâm đó (Line Following) hoặc các phương thức sử dụng chuỗi Fourier (Fourier transform)

Trang 25

CHƯƠNG 2: MỘT SỐ KỸ THUẬT CẮT TỈA XƯƠNG

Một trong hai nhược điểm của xương là nhạy cảm đối với nhiễu đường biên của đối tượng, một ít nhiễu hoặc vài sự thay đổi của nhỏ trên đường biên cũng dẫn đến tạo ra những nhánh xương thừa hoặc làm cho vị trí điểm xương thiếu chính xác có thể làm ảnh hưởng nghiêm trọng tới hình dạng cơ bản của

đồ thị xương

Ví dụ như xương trong hình 2.1 có nhiều nhánh xương thừa được phát sinh ra bởi nhiễu đường biên

Hình 2.1: Nhánh xương thừa phát sinh bởi nhiễu đường biên

Để giải quyết vấn đề trên, nhiều kỹ thuật của các tác giả, nhóm tác giả

đã được đề xuất Có hai hướng chính đang được tập trung nghiên cứu là kỹ thuật dựa trên làm trơn đường bao và kỹ thuật dựa trên độ đo ý nghĩa của điểm xương

Các kỹ thuật làm trơn đường bao trước khi tính toán các điểm xương, nhằm mục đích loại bỏ nhiễu không mong muốn trên đường bao Tuy nhiên, làm trơn đường bao có thể làm thay đổi vị trí đường bao và do đó vị trí của xương có thể bị dịch chuyển, đó là khó khăn trong việc phân biệt nhiễu từ các thông tin hình dạng tần số thấp trên đường bao Một số khác gán độ đo có ý

Trang 26

nghĩa cho các điểm xương hoặc nhánh xương, sau đó những điểm xương hoặc nhánh xương sẽ được cắt tỉa khi giá trị ý nghĩa nhỏ hơn giá trị ngưỡng

2.1 Kỹ thuật cắt tỉa xương Discrete Curve Evolution (DCE)

Đường bao của đối tượng thường rất phức tạp, có nhiều biến dạng nên việc tìm xương đối tượng cũng phức tạp dẫn đến ảnh hưởng tới độ chính xác của nhận dạng Bài toán đặt ra làm thế nào để tìm được xương của đối tượng

mà không có những nhánh xương giả do ảnh hưởng của nhiễu đường bao của đối tượng sinh ra

Nhóm tác giả Xiang Bai, Longin Jan Latecki, Wen-Yu Liu, đã đề xuất

kỹ thuật loại bỏ các điểm lồi ra trên đường bao mà không làm dịch chuyển các điểm biên Do đó các điểm xương tìm được sẽ không bị dịch chuyển vị trí Các nhánh xương “không mong muốn” sẽ bị loại bỏ trong khi những nhánh xương chính không bị cắt ngắn [7] Hình 2.2 minh họa xương trước và sau khi cắt tỉa với DCE

Hình 2.2: Xương ban đầu và xương sau khi cắt tỉa với DCE

Kỹ thuật cắt tỉa xương này dựa trên việc tiền xử lý đường bao hay làm mịn biên và có thể áp dụng với bất kỳ xương đầu vào nào Nhóm tác giả phân chia đường bao thành những đoạn cong và gán nhãn cho mỗi đoạn Loại bỏ

Trang 27

các điểm xương của điểm đang xét nếu nằm trên cùng đoạn đường bao qua nhãn Chi tiết về thuật toán sẽ được trình bày ở phần dưới đây

2.1.1 Giải pháp

DCE thực hiện rời rạc đường cong biên để đơn giản hóa đường bao hình dạng ảnh đối tượng và thu được ít nhất các điểm lồi, cũng là các điểm nút của bộ xương Nhóm tác giả sử dụng mối quan hệ giữa điểm nút của bộ xương và các đỉnh của đường bao Xây dựng đa giác DCE từ các đỉnh lồi thu được

Xương được xây dựng tiếp theo từ các cặp điểm nút thu được từ bước xây dựng đa giác DCE bằng thuật toán tham lam

Coi đường cong biên của ảnh là một đa giác gồm n đỉnh, số đỉnh n đủ

lớn để nghiên cứu sự phát triển của hình dạng

Các điểm x 0 , ., x n-1 trên đường cong đóng C i tạo thành những phân

đoạn nhỏ hơn của C i nếu hai phân đoạn [x i , x i +1 ], [x i +1 , x i +2 ] giao nhau tại {x i +1 }, những đoạn không liên tục thì có những điểm giao cắt là rỗng và C i là hợp

của những đoạn này Phân vùng Γ của đường bao ∂D là một chuỗi có trình tự phân vùng của những đường cong đóng đơn giản C 1 , , C k

Trang 28

Định nghĩa 2.2: Một phân đoạn [x, y] của một đường cong C trên

đường bao ∂D Điểm s là điểm xương của đoạn [x, y], tất cả các điểm sinh tạo

ra điểm xương s trên đường bao ∂D là Tan(s) nằm trong đoạn [x, y] Ký hiệu

arc(s, [x, y]) là đường cong nhỏ nhất của [x, y] có chứa Tan(s)

Hình 2.3: Đường đậm liên tục là cung ban đầu [x,y] Cung [a,b] chính là

arc(s,[x, y])=[a,b] Xương là các đường đậm cách quãng

Định nghĩa 2.3: Cho một phân vùng Γ của đường bao ∂D của một tập

được kết nối đơn giản D (∂D gồm có một đường cong đóng đơn giản), cắt tỉa

xương được định nghĩa như là việc loại bỏ tất cả các điểm xương sS (D) có

những điểm sinh của s nằm trên cùng đoạn của phân vùng Chính xác hơn, xương được cắt tỉa được tạo thành từ tất cả các s điểm sS (D), sao cho

Tan(s) không chứa trong cùng một đoạn của phân vùng Γ

Định nghĩa 2.4: Tiến trình đơn giản hóa đường cong DCE phân chia

trình tự với đa giác đầu vào P {v 1 , …, v n } là đỉnh của P, {u 1 , …, u m }{v 1 , …,

v n } là đỉnh lồi của P n-k sao cho m ≤ n-k Trên cấp n-k của phân chia H n-k (P), P

bị phân thành các cung nhỏ m của P: H n-k (P) ={[u 1 , u 2 ], [u 2 , u 3 ], …, [u m , u 1 ]}

Trang 29

Nếu đỉnh u i được xoá trong bước tiếp theo, (ví dụ, u i P n-k - P n- k+1), hoặc trở thành lõm (do xoá đi một trong những đỉnh ở bên cạnh) thì sau đó

cung [u i-1 , u i+1 ] được thay thế bởi cung [u i-1 , u i ], [u i , u i+1 ] trong H n- (k+1) (P)

2.1.1.2 Xây dựng đa giác DCE

Tất cả đường cong số đều có thể biểu diễn bởi một đa giác một cách hoàn chỉnh nên ta chỉ cần khảo sát các đa giác là đủ [2]

Trong hình 2.4: tính toán độ liên quan của các đỉnh với hình dạng đối

tượng đã được đề xuất …: Tìm x sao cho quay AE xung quanh A và EF xung quanh E để EF và AE cùng hướng và độ dài cung FF’= BB’, nghĩa là:

Trang 30

Tại mỗi bước DCE, mỗi cặp cạnh s 1 , s 2 kề nhau của đa giác sẽ được

thay thế bởi cạnh s 1 Us 2 nối điểm đầu s 1 và điểm cuối s 2 Sự thay thế được quy

định theo giá trị K tính bởi công thức (2.3):

           

2 1

2 1 2 1 2

1

, ,

s l s l

s l s l s s s

s K

l(s1), l(s2): là độ dài các cạnh s 1 (AE), s 2 (EF) đã được chuẩn hóa bằng

cách chia cho tổng độ dài các cạnh của đa giác

Giá trị K(s 1 , s 2 ) càng lớn thì giá trị của cung nối s 1 , s 2 càng lớn Từ đó

tại mỗi bước loại bỏ các cạnh có giá trị K(s 1 , s 2 ) nhỏ hơn ngưỡng theta thì

đỉnh đang xét i bị loại và độ đo của đỉnh sau i+1 và đỉnh trước i-1 sẽ được tính toán lại Cuối cùng thu được đa giác với m đỉnh nhỏ hơn n đỉnh đối tượng

đang xét Các đỉnh lồi trên đường bao đối tượng sẽ tạo thành các cung và được gán nhăn tương ứng

Hình 2.5: Đa giác đơn giản với 8 đỉnh

Trang 31

Như minh họa trong hình 2.6 dưới đây thể hiện các đa giác (màu đỏ) được đơn giản bởi kỹ thuật DCE với các ngưỡng khác nhau

Hình 2.6: Bộ xương của lá với các ngưỡng khác nhau

Trình tự bộ xương của lá thu được bằng cách cắt tỉa bộ xương đầu vào (phía trên bên trái) với sự chú ý đoạn đường biên thu được bởi DCE Đường nét bên ngoài (màu đỏ) thể hiện đơn giản hóa đường biên với DCE

Kỹ thuật DCE phân chia đường bao đường bao đối tượng một cách trình tự thành một tập hữu hạn các đường cong Trong mỗi bước một véctơ

nhỏ nhất không thỏa mãn điều kiện ngưỡng theta được loại bỏ Kỹ thuật cắt tỉa đề xuất có thể được áp dụng cho mặt phẳng D, với đường bao ∂D là các

đường cong kín

DCE có thể loại bỏ hiệu quả nhiễu và từng phần không quan trọng của

ảnh, nhưng cần xác định một tham số dừng Nói cách khác, tìm kiếm k để đa

Trang 32

giác được đơn giản hóa P n-k miêu tả chi tiết những đường biên đầu vào Để

định lượng mức độ chi tiết, nhóm tác giả xác định khoảng cách trung bình P n-k giữa điểm gốc của P và đường phân đoạn tương ứng của nó trong P n-k

Đưa ra giới hạn T, có thể dừng DCE nếu D av (P n-k ) > T cho một vài k

Cho một chuỗi các giá trị T, chúng ta có thể có được một trình tự của đơn giản

hóa đường biên đa giác DCE, dẫn đến trình tự của những xương tương ứng Nói chung, điều kiện dừng thích hợp phụ thuộc vào ứng dụng cụ thể

2.1.1.3 Cắt tỉa xương dựa trên DCE

Trước khi tìm hiểu tổng quát việc cắt tỉa xương dựa trên kỹ thuật DCE

ta xét ví dụ đơn giản minh họa cho việc cắt tỉa xương dựa trên đa giác có 11 đỉnh trong đó có 6 đỉnh lồi và 5 đỉnh lõm được thể hiện trong hình 2.7 dưới đây

Hình 2.7: Minh họa cắt tỉa xương

Để đơn giản ta tiến hành cắt tỉa với hai đỉnh lồi a và b Như đã thấy,

sau bước đơn giản hóa đường bao nhóm tác giả thu được một bộ đỉnh lồi,

Ngày đăng: 26/03/2021, 07:03

TỪ KHÓA LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm