1. Trang chủ
  2. » Luận Văn - Báo Cáo

luận văn thạc sĩ Nghiên cứu một số phương pháp phát hiện biên

39 513 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 39
Dung lượng 6,38 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Ngoài phần mở đầu và kết luận luận văn được chia làm 4 chương, nội dung cụ thể của các chương như sau: Chương I: Tổng quan về xử lý ảnh và biên Trong chương này trình bày sơ lược về xử

Trang 1

ĐẠI HỌC THÁI NGUYÊN

KHOA CÔNG NGHỆ THÔNG TIN

NGUYỄN QUANG SƠN

NGHIÊN CỨU MỘT SỐ PHƯƠNG PHÁP

PHÁT HIỆN BIÊN

Mã số: 60.48.01

LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN

NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS NGÔ QUỐC TẠO

Thái Nguyên - 2008

MỤC LỤC

Trang

MỤC LỤC 2

LỜI CẢM ƠN 4

DANH SÁCH CÁC HÌNH ẢNH 5

MỞ ĐẦU 7

CHƯƠNG I: TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ BIÊN 9

1.1 Tổng quan về xử lý ảnh 9

1.1.1 Xử lý ảnh 9

1.1.2 Các bước cơ bản trong xử lý ảnh 10

1.1.3 Một số vấn đề cơ bản trong xử lý ảnh 14

1.2 Toán tử không gian với xử lý ảnh 18

1.2.1 Làm trơn nhiễu bằng lọc tuyến tính 18

1.2.2 Làm trơn nhiễu bằng lọc phi tuyến 21

1.2.3 Lọc thông thấp, thông cao và lọc dải thông 22

1.3 Tổng quan về biên 23

1.3.1 Biên và các kiểu biên cơ bản 23

1.3.2 Vai trò của biên trong nhận dạng 26

CHƯƠNG II: CÁC PHƯƠNG PHÁP PHÁT HIỆN BIÊN CỔ ĐIỂN 28

2.1 Phân loại các kỹ thuật phát hiện biên 28

2.1.1 Phương pháp phát hiện biên trực tiếp 28

2.1.2 Phương pháp phát hiện biên gián tiếp 28

2.1.3 Quy trình phát hiện biên 29

2.2 Kỹ thuật phát hiện biên Gradient 29

2.2.1 Pixel difference 30

2.2.2 Separated Pixel Difference 31

2.2.3 Toán tử Robert (1965) 32

2.2.4 Toán tử Prewitt 33

Trang 2

2.2.5 Toán tử (mặt nạ) Sobel 33

2.2.6 Toán tử Frie-Chen 34

2.2.7 Toán tử Boxcar 34

2.2.8 Toán tử Truncated Pyramid 35

2.3 Các toán tử la bàn 36

2.3.1 Toán tử la bàn Kirsh 37

2.3.2 Toán tử la bàn Prewitt 38

2.3.3 Robinson 3 - Level 39

2.3.4 Robinson 5 - Level 40

2.4 Kỹ thuật phát hiện biên Laplace 41

CHƯƠNG III: CÁC PHƯƠNG PHÁP PHÁT HIỆN BIÊN NÂNG CAO 45

3.1 Phương pháp Canny 45

3.1.1 Cơ sở lý thuyết thuật toán 45

3.1.2 Hoạt động của thuật toán 47

3.2 Phương pháp Shen - Castan 52

3.2.1 Xây dựng bộ lọc tối ưu 52

3.2.2 Hoạt động của thuật toán 54

3.3 Phát hiện biên dựa vào Wavelet 56

CHƯƠNG IV: MỘT SỐ NHẬN XÉT VÀ ĐÁNH GIÁ CÁC PHƯƠNG PHÁP PHÁT HIỆN BIÊN 62

4.1 Phương pháp phát hiện biên dựa vào kỹ thuật Gradient 62

4.2 Phương pháp đạo hàm bậc nhất và phương pháp đạo hàm bậc hai 66

4.3 Đánh giá nhận xét về phương pháp Canny 69

4.4 Các phương pháp phát hiện biên (phương pháp Gadient, phương pháp Laplace, phương pháp Canny) 71

4.5 Đánh giá nhận xét về phương pháp Wavelet 73

KẾT LUẬN 75

TÀI LIỆU THAM KHẢO 76

LỜI CẢM ƠN

Trước hết tôi muốn gửi lời cảm ơn đến các thầy cô giáo ở Viện công nghệ thông tin và Khoa công nghệ thông tin - Đại học Thái Nguyên đã quan tâm tổ chức chỉ đạo và trực tiếp giảng dạy khóa cao học của chúng tôi Đặc biệt tôi xin gửi lời cảm ơn sâu sắc đến thầy giáo hướng dẫn PGS.TS Ngô Quốc Tạo về những chỉ dẫn khoa học và tận tình hướng dẫn cho tôi trong suốt quá trình làm luận văn Nếu không có sự giúp đỡ của thầy thì tôi khó có thể hoàn thành bản luận văn này Cũng qua đây, tôi xin chân thành cảm ơn lãnh đạo Trung tâm ứng dụng tiến

bộ Khoa học và Công nghệ - Sở Khoa học và Công nghệ Thái Nguyên, nơi tôi công tác, đã tạo mọi điệu kiện thuận lợi cho tôi trong thời gian hoàn thành các môn học cũng như trong suốt thời gian làm luận văn tốt nghiệp

Cuối cùng, tôi xin cảm gia đình, những người đã luôn ủng hộ và động viên để tôi yên tâm nghiên cứu và hoàn thành luận văn

Trang 3

DANH SÁCH CÁC HÌNH ẢNH

Hình 1.1: Quá trình xử lý ảnh 9

Hình 1.2: Các bước trong quá trình xử lý ảnh 10

Hình 1.3: Lân cận các điểm ảnh của tọa độ (x,y) 16

Hình 1.4: Đường biên lý tưởng 24

Hình 1.5: Đường biên dốc 25

Hình 1.6: Đường biên không trơn 26

Hình 2.1: Biên ảnh với Pixel Difference 31

Hình 2.2: Biên ảnh với Separated Pixel Difference 32

Hình 2.3: Biên ảnh với toán tử Robert 33

Hình 2.4: Biên ảnh với toán tử Prewitt 33

Hình 2.5: Biên ảnh với toán tử Sobel 34

Hình 2.6: Biên ảnh với toán tử Frie-Chen 34

Hình 2.7: Biên ảnh với toán tử Boxcar 35

Hình 2.8: Biên ảnh với toán tử Truncated Pyramid 36

Hình 2.9: Biên ảnh với toán tử Kirsh 38

Hình 2.10: Biên ảnh với toán tử la bàn Prewitt 39

Hình 2.11: Biên ảnh với toán tử Robinson 3 level 40

Hình 2.12: Biên ảnh với toán tử Robinson 5 level 41

Hình 2.13: Biên ảnh với kỹ thuật Laplace 42

Hình 2.14: Bộ lọc Laplace of Gauss 42

Hình 2.15: Biên ảnh với kỹ thuật Laplace of Gauss 44

Hình 3.1: Đạo hàm hàm Gauss theo hai hướng (x,y) 48

Hình 3.2: Hình mô tả các điểm biên lân cận 50

Hình 3.3: Biên ảnh theo phương pháp Canny 52

Hình 3.4: Biên ảnh theo phương pháp Shen-Castan 55

Hình 3.5: Dùng DWT cho biến đổi Neurite 56

Hình 3.6 Biên ảnh của một cái hộp đơn 57

Hình 3.7: Biên ảnh con chó nằm ở bậc thang 57

Hình 3.8: Sử dụng 3 tiêu chuẩn cho ảnh con cho nằm bậc thang 58

Hình 3.9: Sử dụng 3 tiêu chuẩn cho ảnh của Filopodia 59

Hình 3.10: Sử dụng liên kết tự động trong ảnh hộp đơn 59

Hình 3.11: Sử dụng liên kết tự động trong ảnh con cho nằm bậc thang 60

Hình 3.12: Sử dụng liên kết tự động trong ảnh của Filopodia 60

Hình 4.1: Hình mô phỏng kết quả tìm biên theo kỹ thuật Gradient 65

Hình 4.2: Biên ảnh theo đạo hàm bậc nhất và bậc hai 68

Hình 4.3: Phát hiện biên với Canny ngưỡng cố định 69

Hình 4.4: Phát hiện biên với Canny ngưỡng thay đổi σ =1 70

Hình 4.5: Biên ảnh theo Gradient, Laplace, Canny 71

Hình 4.6: Phát hiện biên theo phương pháp Wavelet 72

Trang 4

MỞ ĐẦU

Thời đại công nghệ thông tin phát triển như vũ bão đã đi vào từng ngõ ngách

của cuộc sống Hiện nay, bất cứ sự phát triển của ngành công nghiệp nào đều có sự

hiện diện và đóng góp rất to lớn của công nghệ thông tin Xử lý ảnh là một trong

những chuyên ngành quan trọng và lâu đời của Công nghệ thông tin Xử lý ảnh

được áp dụng trong nhiều lĩnh khác nhau như y học, vật lý, hoá học, tìm kiếm tội

phạm, trong quân sự và trong một số lĩnh vực khác

Phần lớn con người thu nhận thông tin bằng thị giác, cụ thể đó là các hình ảnh

Vì vậy xử lý ảnh là vấn đề không thể thiếu và hết sức quan trọng để thu được hình

ảnh tốt hơn, đẹp hơn, nhằm đáp ứng yêu cầu thông tin khác nhau của người nhận

Trong xử lý ảnh, việc nhận dạng và phân lớp đối tượng cần trải qua các quá

trình và các thao tác khác nhau Phát hiện biên là một giai đoạn rất quan trọng vì các

kỹ thuật phân đoạn ảnh chủ yếu dựa vào giai đoạn này Mục đích của việc dò biên

sẽ đánh dấu những điểm trong một ảnh số mà có sự thay đổi đột ngột về độ xám,

tập hợp nhiều điểm biên tạo nên một đường bao quanh ảnh (đường biên) Nhờ có

đường biên mà chúng ta có thể phân biệt giữa đối tượng và nền, phân biệt giữa các

vùng khác nhau và định vị được đối tượng từ đó mà nhận dạng đối tượng Đây là cơ

sở quan trọng trong việc ứng dụng phương pháp này vào thực tiễn của cuộc sống,

đặc biệt là trong điều kiện đất nước ta đang từng bước phát triển và đi lên nên việc

nghiên cứu các ứng dụng vấn đề này cần được quan tâm và phát triển

Xuất phát từ thực tế đó, luận văn lựa chọn đề tài " Nghiên cứu một số phương

pháp phát hiện biên" Mục đích chính của đề tài là hệ thống hóa kiến thức về các

phương pháp phát hiện biên, từ các kỹ thuật dò biên cài đặt chương trình để đưa ra

các nhận xét, so sánh, đánh giá về các phương pháp phát hiện biên Qua đó có cái

nhìn tổng quát về các phương pháp phát hiện biên

Ngoài phần mở đầu và kết luận luận văn được chia làm 4 chương, nội dung cụ thể của các chương như sau:

Chương I: Tổng quan về xử lý ảnh và biên

Trong chương này trình bày sơ lược về xử lý ảnh, giới thiệu các bước xử lý trong một hệ thống xử lý ảnh Một số thành phần cốt tử trong xử lý ảnh, như điểm ảnh, mức xám, biên,…được trình bày như là các khái niệm

Chương II: Các phương pháp phát hiện biên cổ điển

Nội dung của chương này sẽ đề cập đến một số phương pháp phát hiện biên trong phương pháp đạo hàm bậc nhất và phương pháp đạo hàm bậc hai

Chương III: Các phương pháp phát hiện biên nâng cao

Trong chương này đề cập đến phương pháp phát hiện biên Canny, phương pháp Shen-Castan và phương pháp Wavelet

Chương IV: Một số nhận xét đánh giá các phương pháp phát hiện biên

Qua việc cài đặt thử nghiệm các phương pháp phát hiện biên đã trình bày trong các chương trước, từ các kết quả mô phỏng thực nghiệm khi chạy chương trình, trong chương này đưa ra các nhận xét đánh giá, so sánh các phương pháp phát hiện biên Chỉ ra phương pháp phát hiện biên phù hợp với loại ảnh cần xử lý

Tuy nhiên, việc nghiên cứu một vấn đề khoa học đi đến kết quả là một khó khăn

và nhiều thách thức do vậy luận văn chắc còn nhiều thiếu sót Rất mong nhận được

ý kiến đóng gópquý báu của các thầy cô và đồng nghiệp

Học viên

Nguyễn Quang Sơn

Trang 5

CHƯƠNG I TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ BIÊN

1.1 Tổng quan về xử lý ảnh

1.1.1 Xử lý ảnh

Con người thu nhận thông tin qua các giác quan trong đó thị giác đóng vai trò

quan trọng nhất Sự phát triển nhanh của phần cứng máy tính, xử lý ảnh và đồ hoạ

đã phát triển mạnh mẽ và ngày càng có nhiều ứng dụng trong cuộc sống Xử lý ảnh

đóng một vai trò quan trọng trong tương tác người máy

Quá trình xử lý nhận dạng ảnh là một quá trình thao tác nhằm biến đổi một

ảnh đầu vào để cho ra một kết quả mong muốn Kết quả đầu ra của một quá trình xử

lý ảnh có thể là một ảnh "tốt hơn" hoặc một kết luận

Hình 1.1: Quá trình xử lý ảnh

Như vậy mục tiêu của xử lý ảnh có thể chia làm ba hướng như sau:

- Xử lý ảnh ban đầu để cho ra một ảnh mới tốt hơn theo một mong muốn của

người dùng (ví dụ: ảnh mờ cần xử lý để được rõ hơn)

- Phân tích ảnh để thu được thông tin nào đó giúp cho việc phân loại và nhận

biết ảnh (ví dụ: phân tích ảnh vân tay để trích chọn các đặc trưng vân tay)

- Từ ảnh đầu vào mà có những nhận xét, kết luận ở mức cao hơn, sâu hơn (ví

dụ: ảnh một tai nạn giao thông phác hoạ hiện trường tai nạn)

Ảnh đầu vào Xử lý ảnh

Ảnh tốt hơn

Kết luận

1.1.2 Các bước cơ bản trong xử lý ảnh

Quá trình xử lý một ảnh đầu vào nhằm thu được một ảnh đầu ra mong muốn thường phải trải qua rất nhiều bước khác nhau Các bước cơ bản của một quá trình

xử lý ảnh được thể hiện thông qua hình sau:

Hình 1.2: Các bước cơ bản trong quá trình xử lý ảnh

1.1.2.1 Thu nhận ảnh

Đây là bước đầu tiên trong quá trình xử lý ảnh Để thực hiện điều này, ta cần

có bộ thu ảnh và khả năng số hoá những tín hiệu liên tục được sinh ra bởi bộ thu ảnh đó Bộ thu ảnh ở đây có thể là máy chụp ảnh đơn sắc hay màu, máy quét ảnh, máy quay Trong trường hợp bộ thu ảnh cung cấp chưa phải là dạng số hoá ta còn phải chuyển đổi hay số hoá ảnh Quá trình chuyển đổi ADC (Analog to Digital Converter) để thu nhận dạng số hoá của ảnh Mặc dù đây chỉ là công đoạn đầu tiên song kết quả của nó có ảnh hưởng rất nhiều đến công đoạn kế tiếp

Phân đoạn ảnh

Nhận dạng và nội suy

CƠ SỞ TRI THỨC

Trang 6

1.1.2.2 Tiền xử lý

Ở bước này, ảnh sẽ được cải thiện về độ tương phản, khử nhiễu, khôi phục

ảnh, nắn chỉnh hỉnh học Với mục đích làm cho chất lượng ảnh trở lên tốt hơn nữa,

chuẩn bị cho các bước xử lý phức tạp kế tiếp sau đó

* Khử nhiễu: Nhiễu được chia thành hai loại: nhiễu hệ thống và nhiễu ngẫu

nhiên Đặc trưng của nhiễu hệ thống là tính tuần hoàn Do vậy, có thể khử nhiễu này

bằng việc sử dụng phép biến đổi Fourier và loại bỏ các đỉnh điểm Đối với nhiễu

ngẫu nhiên, trường hợp đơn giản là các vết bẩn tương ứng với các điểm sáng hay

tối, có thể khử bằng phương pháp nội suy, lọc trung vị và trung bình

* Chỉnh mức xám: Đây là kỹ thuật nhằm chỉnh sửa tính không đồng đều của

thiết bị thu nhận hoặc độ tương phản giữa các vùng ảnh

* Chỉnh tán xạ: Ảnh thu nhận được từ các thiết bị quang học hay điện tử có

thể bị mờ, nhoè Phương pháp biến đổi Fourier dựa trên tích chập của ảnh với hàm

tán xạ cho phép giải quyết việc hiệu chỉnh này

* Nắn chỉnh hình học: Những biến dạng hình học thường do các thiết bị điện

tử và quang học gây ra Do đó, phương pháp hiệu chỉnh ảnh dựa trên mô hình được

mô tả dưới dạng phương trình biến đổi ảnh biến dạng f(x,y) thành ảnh lý tưởng

f(x',y') như sau:

y x h y y x h x

y x

Trong đó hx, hy là các phương trình tuyến tính (biến dạng do phối cảnh) hay

bậc hai (biến dạng do ống kính camara)

1.1.2.3 Phân đoạn ảnh

Phân đoạn ảnh có nghĩa là chia một ảnh đầu vào thành nhiều phần khác nhau

hay còn gọi là các đối tượng để biểu diễn phân tích, nhận dạng ảnh Ví dụ: để nhận

dạng chữ (hoặc mã vạch) trên phong bì thư cho mục đích phân loại bưu phẩm, cần

chia các câu, chữ về địa chỉ hoặc tên người thành các từ, các chữ, các số (hoặc các

vạch) riêng biệt để nhận dạng Đây là phần phức tạp khó khăn nhất trong xử lý ảnh

và cũng dễ gây lỗi, làm mất độ chính xác của ảnh Kết quả nhận dạng ảnh phụ

thuộc rất nhiều vào công đoạn này

Kết quả của bước phân đoạn ảnh thường được cho dưới dạng dữ liệu điểm ảnh thô, trong đó hàm chứa biên của một vùng ảnh hoặc tập hợp tất cả các điểm ảnh thuộc về chính vùng ảnh đó Trong cả hai trường hợp, sự chuyển đổi dữ liệu thô này thành một dạng thích hợp hơn cho việc xử lý trong máy tính là hết sức cần thiết, nghĩa là nên biểu diễn một vùng ảnh dưới dạng biên hay dưới dạng một vùng hoàn chỉnh gồm tất cả những điểm ảnh thuộc về nó

- Biểu diễn dạng biên cho một vùng phù hợp với những ứng dụng chỉ quan tâm đến các đặc trưng hình dạng bên ngoài của đối tượng, ví dụ như các góc cạnh

và điểm uốn trên biên

- Biểu diễn dạng vùng lại thích hợp cho những ứng dụng khai thác các tính chất bên trong của đối tượng Ví dụ như vân ảnh hoặc cấu trúc xương của nó Và trong một số ứng dụng thì cả hai cách biểu diễn trên đều cần thiết

1.1.2.4 Biểu diễn và mô tả

a) Biểu diễn

Đầu ra ảnh sau phân đoạn chứa các điểm ảnh của vùng ảnh (ảnh đã phân đoạn) cộng với mã liên kết với các vùng lận cận Việc biến đổi các số liệu này thành dạng thích hợp là cần thiết cho xử lý tiếp theo bằng máy tính Việc chọn các tính

chất để thể hiện ảnh gọi là trích chọn đặc trưng (Feature Selection) gắn với việc

tách các đặc tính của ảnh dưới dạng các thông tin định lượng hoặc làm cơ sở để phân biệt lớp đối tượng này với đối tượng khác trong phạm vi ảnh nhận được Ví dụ: trong nhận dạng ký tự trên phong bì thư, chúng ta miêu tả các đặc trưng của từng ký tự giúp phân biệt ký tự này với ký tự khác

b) Mô tả

Ảnh sau khi số hoá sẽ được lưu vào bộ nhớ, hoặc chuyển sang các khâu tiếp theo để phân tích Nếu lưu trữ ảnh trực tiếp từ các ảnh thô, đòi hỏi dung lượng bộ nhớ cực lớn và không hiệu quả theo quan điểm ứng dụng và công nghệ Thông thường, các ảnh thô đó được đặc tả (biểu diễn) lại (hay đơn giản là mã hoá) theo các

Trang 7

đặc điểm của ảnh được gọi là các đặc trưng ảnh như: biên ảnh, vùng ảnh Một số

phương pháp biểu diễn thường dùng:

• Biểu diễn bằng mã chạy: Phương pháp này thường biểu diễn cho vùng ảnh

Nhận dạng ảnh là quá trình xác định ảnh Quá trình này thường thu được bằng

cách so sánh với mẫu chuẩn đã được lọc (hoặc lưu) từ trước

Nội suy là phán đoán theo ý nghĩa trên cơ sở nhận dạng Ví dụ: một loạt chữ

số và nét gạch ngang trên phong bì thư có thể được nội suy thành mã điện thoại Có

nhiều cách phân loại khác nhau về ảnh Theo lý thuyết về nhận dạng, các mô hình

toán học về ảnh được phân theo hai loại nhận dạng ảnh cơ bản:

- Nhận dạng theo tham số

- Nhận dạng theo cấu trúc

Một số đối tượng nhận dạng khá phổ biến hiện nay đang được áp dụng trong

khoa học và công nghệ là: nhận dạng ký tự (chữ in, chữ viết tay, chữ ký điện tử),

nhận dạng văn bản (Text), nhận dạng vân tay, nhận dạng mã vạch, nhận dạng mặt

người…

1.1.2.6 Cơ sở tri thức

Ảnh là một đối tượng khá phức tạp về đường nét, độ sáng tối, dung lượng

điểm ảnh, môi trường để thu ảnh phong phú kéo theo nhiễu Trong nhiều khâu xử lý

và phân tích ảnh ngoài việc đơn giản hóa các phương pháp toán học đảm bảo tiện

lợi cho xử lý, người ta mong muốn bắt chước quy trình tiếp nhận và xử lý ảnh theo

cách của con người Trong các bước xử lý đó, nhiều khâu hiện nay đã xử lý theo

các phương pháp trí tuệ con người Vì vậy, ở đây các cơ sở tri thức được phát huy

1.1.2.7 Trích chọn đặc điểm

Việc giải quyết bài toán nhận dạng trong những ứng dụng mới, nảy sinh trong cuộc sống không chỉ tạo ra những thách thức về giải thuật, mà còn đặt ra những yêu cầu về tốc độ tính toán Đặc điểm chung của tất cả những ứng dụng đó là những đặc điểm đặc trưng cần thiết thường là nhiều, không thể do chuyên gia đề xuất, mà phải được trích chọn dựa trên các thủ tục phân tích dữ liệu

Việc trích chọn hiệu quả các đặc điểm giúp cho việc nhận dạng các đối tượng ảnh chính xác, với tốc độ tính toán cao và dung lượng nhớ lưu trữ giảm xuống Các đặc điểm của đối tượng được trích chọn tuỳ theo mục đích nhận dạng trong quá trình xử lý ảnh Có thể nêu ra một số đặc điểm của ảnh sau đây:

- Đặc điểm không gian: Phân bố mức xám, phân bố xác suất, biên độ, điểm

uốn v.v

- Đặc điểm biến đổi: Các đặc điểm loại này được trích chọn bằng việc thực

hiện lọc vùng (zonal filtering) Các bộ vùng được gọi là “mặt nạ đặc điểm” (feature mask) thường là các khe hẹp với hình dạng khác nhau (chữ nhật, tam giác, cung tròn v.v )

- Đặc điểm biên và đường biên: Đặc trưng cho đường biên của đối tượng và

do vậy rất hữu ích trong việc trích trọn các thuộc tính bất biến được dùng khi nhận dạng đối tượng Các đặc điểm này có thể được trích chọn nhờ toán tử Gradient, toán

tử la bàn, toán tử Laplace, toán tử “chéo không” (zero crossing)

1.1.3 Một số vấn đề cơ bản trong xử lý ảnh 1.1.3.1 Điểm ảnh (Picture Element)

Gốc của ảnh là ảnh liên tục về không gian và độ sáng Để xử lý bằng máy tính, ảnh cần phải được số hoá Số hoá ảnh là sự biến đổi gần đúng một ảnh liên tục thành một tập điểm phù hợp với ảnh thật về vị trí (không gian) và độ sáng (mức xám) Khoảng cách giữa các điểm ảnh đó được thiết lập sao cho mắt người không phân biệt được ranh giới giữa chúng Mỗi một điểm như vậy gọi là điểm ảnh (PEL: Picture Element) hay gọi tắt là Pixel Trong khuôn khổ ảnh hai chiều, mỗi pixel ứng với cặp tọa độ (x, y)

Trang 8

Điểm ảnh (Pixel) là một phần tử của ảnh số tại toạ độ (x, y) với độ xám hoặc

màu nhất định Kích thước và khoảng cách giữa các điểm ảnh đó được chọn thích

hợp sao cho mắt người cảm nhận sự liên tục về không gian và mức xám (hoặc màu)

của ảnh số gần như ảnh thật Mỗi phần tử trong ma trận được gọi là một phần tử

ảnh

1.1.3.2 Độ phân giải của ảnh

Độ phân giải (Resolution) của ảnh là mật độ điểm ảnh được ấn định trên một

ảnh số được hiển thị

Khoảng cách giữa các điểm ảnh phải được chọn sao cho mắt người vẫn thấy

được sự liên tục của ảnh Việc lựa chọn khoảng cách thích hợp tạo nên một mật độ

phân bố, đó chính là độ phân giải và được phân bố theo trục x và y trong không gian

hai chiều

1.1.3.3 Mức xám của ảnh

Một điểm ảnh (Pixel) có hai đặc trưng cơ bản là vị trí (x, y) của điểm ảnh và

độ xám của nó Dưới đây chúng ta xem xét một số khái niệm và thuật ngữ thường

dùng trong xử lý ảnh

- Mức xám của điểm ảnh là cường độ sáng của nó được gán bằng giá trị số tại

điểm đó

- Các thang giá trị mức xám thông thường: 16, 32, 64, 128, 256 (mức 256 là

mức phổ dụng Lý do từ kỹ thuật máy tính dùng 1 byte (8 bit) để biểu diễn mức

xám Mức xám dùng 1 byte biểu diễn: 28=256 mức, tức là từ 0 đến 255)

- Ảnh đen trắng: là ảnh có hai màu đen, trắng (không chứa màu khác) với mức

xám ở các điểm ảnh có thể khác nhau

- Ảnh nhị phân: ảnh chỉ có 2 mức đen trắng phân biệt tức dùng 1 bit mô tả 21

mức khác nhau Nói cách khác mỗi điểm ảnh của ảnh nhị phân chỉ có thể là 0 hoặc 1

- Ảnh màu: Trong hệ màu RGB (Red, Blue, Green) để tạo nên thế giới màu,

người ta thường dùng 3 byte để mô tả mức màu, khi đó các giá trị màu:

28*3 = 224 ≈ 16,7 triệu màu

1.1.3.4 Quan hệ giữa các điểm ảnh

Một ảnh số giả sử được biểu diễn bằng hàm f(x, y) Tập con các điểm ảnh là S,

cặp điểm ảnh có quan hệ với nhau ký hiệu là p, q Chúng ta nêu một số các khái

niệm sau

a) Các lân cận của điểm ảnh (Image Neighbors)

* Giả sử có điểm ảnh p tại toạ độ (x, y) p có 4 điểm lân cận gần nhất theo chiều đứng và ngang (có thể coi như lân cận 4 hướng chính: Đông, Tây, Nam, Bắc)

{(x-1, y); (x, y-1); (x, y+1); (x+1, y)} = N4(p) trong đó: số 1 là giá trị logic; N4(p) tập 4 điểm lân cận của p

Nam (x-1,y-1) (x,y-1) (x+1,y-1)

Bắc (x-1,y+1) (x,y+1) (x+1,y+1)

Hình 1.3: Lân cận các điểm ảnh của tọa độ (x,y)

* Các lân cận chéo: Các điểm lân cận chéo NP(p) (Có thể coi lân cận chéo là 4 hướng: Đông-Nam, Đông-Bắc, Tây-Nam, Tây-Bắc)

Np(p) = { (x+1, y+1); (x+1, y-1); (x-1, y+1); (x-1, y-1)}

* Tập kết hợp: N8(p) = N4(p) + NP(p) là tập hợp 8 lân cận của điểm ảnh p

* Chú ý: Nếu (x, y) nằm ở biên (mép) ảnh, một số điểm sẽ nằm ngoài ảnh

b) Các mối liên kết điểm ảnh

Các mối liên kết được sử dụng để xác định giới hạn (Boundaries) của đối tượng vật thể hoặc xác định vùng trong một ảnh Một liên kết được đặc trưng bởi tính liền kề giữa các điểm và mức xám của chúng

Giả sử V là tập các giá trị mức xám Một ảnh có các giá trị cường độ sáng từ thang mức xám từ 32 đến 64 được mô tả như sau :

Trang 9

V={32, 33, … , 63, 64}

Có 3 loại liên kết:

* Liên kết 4: Hai điểm ảnh p và q được nói là liên kết 4 với các giá trị cường

độ sáng V nếu q nằm trong một các lân cận của p, tức q thuộc N4(p)

* Liên kết 8: Hai điểm ảnh p và q nằm trong một các lân cận 8 của p, tức q

thuộc N8(p)

* Liên kết m (liên kết hỗn hợp): Hai điểm ảnh p và q với các giá trị cường độ

sáng V được nói là liên kết m nếu

1 q thuộc N4(p) hoặc

2 q thuộc NP(p)

c) Đo khoảng cách giữa các điểm ảnh

Khoảng cách D(p, q) giữa hai điểm ảnh p toạ độ (x, y), q toạ độ (s, t) là hàm

khoảng cách (Distance) hoặc Metric nếu:

1.D(p,q) ≥ 0 (Với D(p,q)=0 nếu và chỉ nếu p=q)

2.D(p,q) = D(q,p)

3.D(p,z) ≤ D(p,q) + D(q,z); z là một điểm ảnh khác

Khoảng cách Euclide: Khoảng cách Euclide giữa hai điểm ảnh p(x, y) và

q(s,t) được định nghĩa như sau:

De(p, q) = [(x - s)2 + (y - t)2]1/2Khoảng cách khối: Khoảng cách D4(p, q) được gọi là khoảng cách khối đồ thị

và được xác định như sau:

D4(p,q) = | x - s | + | y - t | Giá trị khoảng cách giữa các điểm ảnh r: giá trị bán kính r giữa điểm ảnh từ

tâm điểm ảnh đến tâm điểm ảnh q khác

Khoảng cách D8(p, q) còn gọi là khoảng cách bàn cờ giữa điểm ảnh p, q được

xác định như sau:

D8(p,q) = max (| x-s | , | y-t |)

1.2 Toán tử không gian với xử lý ảnh

Thông thường ảnh thu nhận được có nhiễu cần phải loại bỏ hay không sắc nét

bị mờ hoặc cần làm tõ các chi tiết như đường biên ảnh Các toán tử không gian dùng trong kỹ thuật tăng cường ảnh được phân nhóm theo công dụng: làm trơn nhiễu, nổi biên Để làm trơn nhiễu hay tách nhiễu, người ta sử dụng các bộ lọc tuyến tính (lọc trung bình, thông thấp) hay lọc phi tuyến (trung vị, giả trung vị, lọc đồng hình) Từ bản chất của nhiễu (thường tương ứng với tần số cao) và từ cơ sở lý thuyết lọc là: bộ lọc chỉ cho tín hiệu có tần số nào đó thông qua do đó, để lọc nhiễu người ta thường dùng lọc thông thấp (theo quan điểm tần số không gian) hay lấy tổ hợp tuyến tính để san bằng (lọc trung bình) Để làm nổi cạnh (ứng với tần số cao), người ta dùng các bộ lọc thông cao, lọc Laplace

Trước khi xem xét chi tiết các kỹ thuật áp dụng, cần phân biệt các loại nhiễu hay can thiệp trong quá trình xử lý ảnh Trên thực tế tồn tại nhiều loại nhiễu, tuy nhiên người ta thường xem xét 3 loại nhiễu chính: nhiễu cộng, nhiễu nhân và nhiễu xung

- Nhiễu cộng

Nhiễu cộng thường phân bố khắp ảnh Nếu gọi ảnh quan sát (ảnh thu được) là

Xqs, ảnh gốc là Xgốc, nhiễu là η, ảnh thu được có thể biểu diễn bởi:

Nhiễu xung thường gây đột biến tại một số điểm ảnh

1.2.1 Làm trơn nhiễu bằng lọc tuyến tính

Do có nhiều loại nhiễu can thiệp vào quá trình xử lý ảnh nên cần có nhiều bộ lọc thích hợp Với nhiễu cộng và nhiễu nhân ta dùng các bộ lọc thông thấp, trung bình và lọc đồng hình (Homomorphie), với nhiễu xung ta dùng lọc trung vị, giả trung vị, lọc ngoài (Outlier)

Trang 10

a) Lọc trung bình không gian

Với lọc trung bình, mỗi điểm ảnh được thay thế bằng trung bình trọng số của

các điểm lân cận và được định nghĩa như sau:

)ln,km(y)lk(a)

n,m(vNếu trong kỹ thuật lọc trên, ta chọn các trọng số bằng nhau, phương trình trên

)ln,km(yN

1)n,m(vVới : y(m,m): ảnh đầu vào

w là số điểm ảnh trong cửa sổ lọc W

Lọc trung bình có trọng số chính là thực hiện chập ảnh đầu vào với nhân chập

H Nhân chập H trong trường hợp này có dạng:

1H

Trong lọc trung bình, thường người ta ưu tiên cho các hướng để bảo vệ biên

của ảnh khỏi bị mờ khi làm trơn ảnh Các kiểu mặt nạ được sử dụng tùy theo các

trường hợp khác nhau Các bộ lọc trên là bộ lọc tuyến tính theo nghĩa là điểm ảnh ở

tâm cửa số sẽ được thay bởi tổ hợp các điểm lân cận chập với mặt nạ

Giả sử ảnh đầu vào biểu diễn bởi ma trận:

1 7 5 7 5

3 8 1 6 6

1 7 1 7 5

1 7 3 7 4I

Ảnh số thu được bởi lọc trung bình Y = H⊗I có dạng:

22 34 48 48 36

27 34 49 43 36

27 31 46 39 35

16 19 31 26 23

9

1Y

Lọc trung bình trọng số là một trường hợp riêng của lọc thông thấp

1 b 1b b b1 b 1)2b(

2

Ta dễ dàng nhận thấy khi b = 1, Hb chính là Htl (lọc trung bình) Để hiểu rõ hơn bản chất khử nhiễu cộng của các bộ lọc này, ta viết phương trình thu nhận ảnh dưới dạng:

l,

w

W l,

w

N)ln,km(XN

1n,mY

n,m)ln,km(XN

1n,mY

σ+

=

η+

Trang 11

gồm ảnh gốc nhân với hệ số nhiễu Gọi X(m,n)là ảnh thu được, X(m,n) là ảnh gốc

và η(m,n) là nhiễu như vậy:

X(m,n) = X(m,n)* η(m,n) Lọc đồng hình thực hiện lấy logarit của ảnh quan sát Do vậy ta có kết quả sau:

Log(X(m, n)) = log( X ( ,m n) ) + log( η(m, n))

Rõ ràng, nhiễu nhân có trong ảnh sẽ bị giảm Sau quá trình lọc tuyến tính, ta

chuyển về ảnh cũ bằng phép biến đổi hàm e mũ

1.2.2 Làm trơn nhiễu bằng lọc phi tuyến

Các bộ lọc phi tuyến cũng hay được dùng trong kỹ thuật tăng cường ảnh

Trong kỹ thuật này, người ta dùng bộ lọc trung vị, giả trung vị, lọc ngoài Với lọc

trung vị, điểm ảnh đầu vào sẽ được thay thế bởi trung vị các điểm ảnh còn lọc giả

trung vị sẽ dùng trung bình cộng của 2 giá trị “trung vị” (trung bình cộng của max

và min)

a) Lọc trung vị

Trung vị được viết với công thức:

v(m,n) = Trungvi(y(m-k,n-l)) với {k,l} ∈ W

Kỹ thuật này đòi hỏi giá trị các điểm ảnh trong cửa sổ phải xếp theo thứ tự

tăng hay giảm dần so với giá trị trung vị Kích thước cửa số thường được chọn sao

cho số điểm ảnh trong cửa số là lẻ Các cửa sổ hay dùng là cửa sổ có kích thước

v[0]= 2 <giá trị biên>; v[1]=Trungvi(2,3,8)=3; v[2]=Trungvi(3,4,8)=4;

v[3]= Trungvi(8,4,2)=4; v[4]= 2 <giá trị biên>

* Tính chất của lọc trung vị:

- Lọc trung vị là loại lọc phi tuyến Điều này dễ nhận thấy từ:

Trungvi(x(m)+y(m)) ≠ Trungvi(x(m)) + Trungvi(y(m))

- Có lợi cho việc loại bỏ các điểm ảnh hay các hàng mà vẫn bảo toàn độ phân giải

- Hiệu quả giảm khi số điểm trong cửa sổ lớn hay bằng một nửa số điểm trong cửa sổ Điều này dễ giải thích vì trung vị là (Nw+1)/2 giá trị lớn nhất nếu Nwlẻ Lọc trung vị cho trường hợp 2 chiều coi như lọc trung vị tách được theo từng chiều

b) Lọc ngoài (Outlier Filter)

Giả thiết có ngưỡng nào đó cho các mức nhiễu (có thể dựa vào lược đồ xám) Tiến hành so sánh giá trị độ xám của một điểm ảnh với trung bình số học 8 lân cận của nó Nếu sai lệch lớn hơn ngưỡng, điểm ảnh này được coi như nhiễu Trong trường hợp đó, thay thế giá trị của điểm ảnh bằng giá trị trung bình 8 lân cận vừa tính được Bộ lọc ngoài có thể diễn tả bằng công thức sau:

)n,m(u

)w( -n)u(m,khi )w(

với α(w) là trung bình cộng các điểm trong lân cận w; δ là ngưỡng ngoài

Các cửa sổ tính toán thường chọn là 3x3 Tuy nhiên, cửa sổ có thể mở rộng đến 5x5 hay 7x7 để đảm bảo tính tương quan giữa các điểm ảnh Vấn đề quan trọng

là xác định ngưỡng để loại nhiễu mà vẫn không làm mất thông tin của ảnh

1.2.3 Lọc thông thấp, thông cao và lọc dải thông

Toán tử trung bình không gian là lọc thông thấp Nếu hLP(m, n) biểu diễn bộ lọc thông thấp

FIR (Finite Impulse Response) thì bộ lọc thông cao hHP(m, n) có thể được định nghĩa:

hHP(m, n) = δ(m, n) - hLP(m, n)

Bộ lọc dải thông có thể định nghĩa như sau:

HHP(m, n)= hL1(m, n) – hL2(m, n)

Trang 12

với hL1 và hL2 là các bộ lọc thông thấp

Bộ lọc thông thấp thường dùng làm trơn nhiễu và nội suy ảnh Bộ lọc thông

cao dùng nhiều trong trích chọn biên và làm trơn ảnh, còn bộ lọc dải thông có hiệu

quả làm nổi cạnh Về biên sẽ được trình bày kỹ trong các phần sau Tuy nhiên, dễ

nhận thấy, biên là điểm có độ biến thiên nhanh về giá trị mức xám theo quan điểm

về tần số tín hiệu Như vậy, các điểm biên ứng với các thành phần tần số cao Từ đó,

có thể dùng bộ lọc thông cao để cải thiện nhiễu nghĩa là có thể lọc các thành phần

tần số thấp và giữ lại các thành phần tần số cao Vì thế, lọc thông cao thường được

dùng làm trơn biên trước khi tiến thành các thao tác với biên ảnh Dưới đây là một

số mặt nạ dùng trong lọc thông cao:

1 2- 1)3(Các nhân chập thông cao có đặc tính chung là tổng các hệ số của bộ lọc bằng

1 Nguyên nhân chính là ngăn cản sự tăng quá giới hạn của các giá trị mức xám (các

giá trị điểm ảnh vẫn giữ được giá trị của nó một cách gần đúng không thay đổi quá

nhiều với giá trị thực)

1.3 Tổng quan về biên

1.3.1 Biên và các kiểu biên cơ bản

Các đặc trưng của ảnh thường bao gồm các thành phần như: mật độ xám, phân

bố xác suất, phân bố không gian, biên ảnh Biên là một vấn đề chủ yếu và đặc biệt

quan trọng trong phân tích ảnh vì các kĩ thuật phân đoạn ảnh chủ yếu dựa vào biên

Hiện nay có nhiều định nghĩa về biên ảnh và mỗi định nghĩa được sử dụng

trong một số trường hợp nhất định Song nhìn chung, ta có thể hiểu là:

Một điểm ảnh có thể coi là biên nếu ở đó có sự thay đổi đột ngột về mức xám

Ví dụ: Đối với ảnh đen trắng, một điểm được gọi là điểm biên nếu nó là điểm đen

có ít nhất một điểm trắng bên cạnh

Tập hợp các điểm biên tạo thành biên, hay còn gọi là đường bao của ảnh (boundary) Chẳng hạn, trong một ảnh nhị phân, một điểm có thể được gọi là biên nếu đây là một điểm đen và có ít nhất một điểm trắng nằm trong lân cận điểm đó Mỗi một biên là một thuộc tính gắn liền với một điểm riêng biệt và được tính toán từ những điểm lân cận nó Đó là một biến Vector bao gồm hai thành phần:

Hình minh hoạ điểm ảnh có sự biến đổi mức xám u(x) một cách đột ngột:

Hình1.4: Đường biên lý tưởng

Một biên được coi đó là biên lý tưởng khi mà có sự thay đổi cấp xám lớn giữa các vùng trong ảnh Biên này thường chỉ xuất hiện khi có sự thay đổi cấp xám qua một điểm ảnh

Trang 13

thuật số hoá thì đường dốc không còn là đường thẳng mà thành những đường lởm

chởm, không trơn

Hình 1.5: Đường biên dốc

1.3.1.3 Biên không trơn

Trên thực tế, ảnh thường có biên không lý tưởng, các điểm ảnh trên ảnh

thường có sự thay đổi mức xám đột ngột và không đồng nhất, đặc biệt là ảnh nhiễu

Trong trường hợp không nhiễu (biên lý tưởng), bất cứ một sự thay đổi cấp xám nào

cũng thông báo sự tồn tại của một biên Trường hợp đó khó có khả năng xảy ra, ảnh

thường là không lý tưởng, có thể là do các nguyên nhân sau:

- Hình dạng không sắc nét

- Nhiễu: do một loạt các yếu tố như: kiểu thiết bị nhập ảnh, cường độ ánh

sáng, nhiệt độ, hiệu ứng áp suất, chuyển động, bụi…, chưa chắc rằng hai điểm ảnh

có cùng giá trị cấp xám khi được nhập lại có cùng cấp xám đó trong ảnh Kết quả

của nhiễu trên ảnh gây ra một sự biến thiên ngẫu nhiên giữa các điểm ảnh Sự xuất

hiện ngẫu nhiên của các điểm ảnh có mức xám chênh lệch cao làm cho các đường

biên dốc trở lên không trơn chu mà trở thành các đường biên gồ ghề, mấp mô,

không nhẵn, đây chính là đường biên trên thực tế

Ngày nay, những phương pháp phát hiện biên hiện đại thường kết hợp nhiễu

vào trong mô hình của bài toán và trong quá trình phát hiện biên cũng được tính

đến Còn khái niệm về biên nêu ở trên được sử dụng để xây dựng các phương pháp

phát hiên biên trong quá khứ, những mô hình về cách này được coi là đơn giản và

sơ sài

u

x

Hình1.6: Đường biên không trơn

1.3.2 Vai trò của biên trong nhận dạng

Đường biên là một loại đặc trưng cục bộ tiêu biểu trong phân tích nhận dạng ảnh Người ta sử dụng đường biên làm phân cách các vùng xám (màu) cách biệt

Ngược lại, người ta cũng dùng các vùng ảnh để tìm đường phân cách

Như đã đề cập tới ở phần tổng quan về một hệ thống nhận dạng và xử lý ảnh, quá trình nhận dạng có hai giai đoạn cần thực hiện:

- Giai đoạn học: Các đặc điểm của đối tượng mẫu được lưu trữ (gọi là học mẫu) và tập các phần tử mẫu được chia thành các lớp

- Giai đoạn nhận dạng: Khi có đối tượng cần nhận dạng, các đặc điểm của đối tượng sẽ được trích chọn và sử dụng hàm quyết định để xác định đối tượng cần nhận dạng thuộc lớp nào

Như vậy, việc nhận dạng sẽ chính xác nếu các đặc điểm được trích chọn chính xác Trong thực tế, các đặc điểm trích chọn phục vụ cho việc nhận dạng thường là các bất biến [7,8,18,26,30,38,45], bởi vì vấn đề cơ bản trong bài toán nhận dạng ảnh

là xác định các đối tượng không phụ thuộc vào vị trí, kích thước và hướng quay

* Có nhiều loại bất biến được trích chọn như:

- Bất biến thống kê: Các mô men, độ lệch chuẩn của tập ảnh hay các độ đo thống kê khác không phụ thuộc các phép biến đổi tuyến tính

- Bất biến hình học: Số đo kích thước của các đối tượng ảnh

u

x

Trang 14

- Bất biến tô-pô: Biểu diễn các cấu trúc tô-pô của các ảnh như số điểm đỉnh, số

lỗ hổng v.v

- Bất biến đại số: Chu tuyến, phân bố của các điểm ảnh, v.v dựa vào các việc

tổ hợp các hệ số của đa thức mô tả đối tượng ảnh

Các bất biến dùng trong nhận dạng thường được trích chọn từ biên, xương của

đối tượng [3,5,8,18,33,38,39,45,46,48] Do vậy, việc nhận dạng có hiệu quả hay

không phụ thuộc nhiều vào cách biểu diễn hình dạng và mô tả của vật thể

CHƯƠNG II CÁC PHƯƠNG PHÁP PHÁT HIỆN BIÊN CỔ ĐIỂN

Biên là một phần đặc biệt quan trọng trong xử lý ảnh, hầu như trước khi sử dụng các thuật toán phát hiện biên phải trải qua một bước tiền xử lý, đó là quá trình loại bỏ nhiễu Cơ sở của các phép toán phát hiện biên đó là quá trình biến đổi về giá trị độ sáng của các điểm ảnh Tại điểm biên sẽ có sự biến đổi đột ngột về mức xám Đây chính là cơ sở của kỹ thuật phát hiện biên Xuất phát từ cơ sở này, có hai phương pháp phát hiện biên tổng quát, đó là phương pháp phát hiện biên trực tiếp

và phương pháp phát hiện biên gián tiếp

2.1 Phân loại các kỹ thuật phát hiện biên 2.1.1 Phương pháp phát hiện biên trực tiếp

Phương pháp phát hiện biên này nhằm làm nổi biên dựa vào sự biến thiên về giá trị độ sáng của điểm ảnh Kỹ thuật chủ yếu dùng phát hiện biên ở đây là kỹ thuật đạo hàm

- Nếu lấy đạo hàm bậc nhất của ảnh ta có phương pháp Gradient

Phương pháp này bao gồm kỹ thuật Gradient và kỹ thuật la bàn

- Nếu lấy đạo hàm bậc hai của ảnh ta có phương pháp Laplace

2.1.2 Phương pháp phát hiện biên gián tiếp

Là quá trình phân vùng dựa vào phép xử lý kết cấu đối tượng, cụ thể là dựa vào sự biến thiên nhỏ và đồng đều độ sáng của các điểm ảnh thuộc một đối tượng Nếu các vùng của ảnh được xác định thì đường phân ranh giữa các vùng đó chính là biên ảnh cần tìm Việc phát hiện biên và phân vùng đối tượng là hai bài toán đối ngẫu Từ phát hiện biên ta có thể tiến hành phân lớp đối tượng, như vậy là đã phân

Trang 15

vùng được ảnh Và ngược lại, khi đã phân vùng được ảnh nghĩa là đã phân lập được

thành các đối tượng, từ đó có thể phát hiện được biên cần tìm

Tuy nhiên, phương pháp tìm biên trực tiếp thường sử dụng có hiệu quả vì ít

chịu ảnh hưởng của nhiễu Song nếu sự biến thiên độ sáng của ảnh là không cao thì

khó có thể phát hiện được biên, trong trường hợp này việc tìm biên theo phương

pháp trực tiếp tỏ ra không đạt được hiệu quả tốt Phương pháp tìm biên gián tiếp

dựa trên các vùng, đòi hỏi áp dụng lý thuyết về xử lý kết cấu đối tượng phức tạp, vì

thế khó cài đặt, song đạt hiệu quả cao khi sự biến thiên về cường độ sáng là nhỏ

Trong khuôn khổ bản luận văn này ta đề cập nghiên cứu chủ yếu phương pháp

phát hiện biên trực tiếp

2.1.3 Quy trình phát hiện biên

Bước 1: Do ảnh ghi được thường có nhiễu, bước một là phải lọc nhiễu theo các

phương pháp đã tìm hiểu ở các phần trước

Bước 2: Làm nổi biên sử dụng các toán tử phát hiện biên

Bước 3: Định vị biên Chú ý rằng kỹ thuật nổi biên gây tác dụng phụ là gây

nhiễu làm một số biên giả xuất hiện do vậy cần loại bỏ biên giả

Bước 4: Liên kết và trích chọn biên

2.2 Kỹ thuật phát hiện biên Gradient

Kỹ thuật Gradient là kỹ thuật dò biên cục bộ dựa vào cực đại của đạo hàm

Đây là phép toán lấy đạo hàm bậc nhất trong không gian hai chiều

Theo định nghĩa Gradient là một véctơ có các thành phần biểu thị tốc độ thay

đổi giá trị của điểm ảnh, ta có:

dy)y,x()dxy,x()y(y)y,x(

dx)y,x()y,dxx()x(x)y,x(

−+

=

Trong đó dx, dy là khoảng cách giữa 2 điểm kế cận theo hướng x, y tương ứng

(thực tế chọn dx= dy=1) Đây là phương pháp dựa theo đạo hàm riêng bậc nhất theo

Hy

Như vậy kỹ thuật phát hiện biên theo phương pháp này được thực hiện như sau: Sử dụng phép nhân cuộn di chuyển 2 mặt nạ trên ảnh cần tìm biên sao cho tâm chính giữa của mặt nạ trùng với điểm ảnh đang xét

Độ lớn Gradient tại điểm (i,j) được tính theo công thức:

[( j)] G2 G2

Để giảm thời gian tính toán và độ phức tạp ta có xấp xỉ:

G[f(i,j)] ≈ Gx + Gy

⇔ G[f(i,j)] = f(i,j) - f(i+1,j) + f(i,j) - f(i,j-1)

Ta có kết quả tìm biên theo kỹ thuật này như sau:

Trang 16

a) Ảnh gốc b) Ảnh biên

Hình 2.1: Biên ảnh với Pixel difference

2.2.2 Separated Pixel Difference

Đây cũng là một bộ lọc cơ bản dựa theo kỹ thuật Gradient, song bộ lọc này có

khác một chút so với bộ lọc Pixel diference, nó so sánh sự khác nhau giữa các điểm

ảnh và ở đây là hai điểm ảnh ở hai bên của điểm ảnh đang xét

Toán tử này sử dụng mặt nạ 3 x 3, bao gồm hai mặt nạ H1 (theo chiều x) và

H2 (theo chiều y) biểu thị theo hai hướng dọc và ngang như sau:

1 0

1

0 0 0

0 0 00 1- 0

Sử dụng phép nhân cuộn di chuyển 2 mặt nạ trên ảnh cần tìm biên sao cho tâm

chính giữa của mặt nạ trùng với điểm ảnh đang xét

Giá trị điểm ảnh mới sau khi thực hiện Gradient tại điểm (i,j) được tính theo

công thức:

[( j)] G2 G2

G[f(i,j)] ≈ Gx + Gy

⇔ G[f(i,j)] = f(i-1,j) - f(i+1,j) + f(i,j+1) - f(i,j-1)

Ta có kết quả tìm biên theo kỹ thuật này như sau:

y)j(

{y( j) y( j)}

)j(y

)j(y,)j(ymax)j(y

2 1

2 1

Như vậy, ta có kết quả Gradient tại một điểm ảnh (i,j):

y(i,j)= |y(i,j+1)- y(i+1,j)| + |y(i,j)+y(i+1,j+1)|

Kết quả của toán tử Robert sau khi tiến hành tách biên:

Trang 17

Hình 2.4: Biên ảnh với toán tử Prewitt

2.2.5 Toán tử (mặt nạ) Sobel

Toán tử Sobel được Duda và Hart đặt ra năm 1973 với các mặt nạ tương tự

như của Robert nhưng khác cấu hình:

2 - 0 21- 0 1

0 0 0

1- 2- 1-

Hy

Hình 2.6: Biên ảnh với toán tử Frie-Chen

2.2.7 Toán tử Boxcar

Trang 18

Một hạn chế chung đối với toán tử Gradient là không có khả năng phát hiện

biên trong môi trường nhiều nhiễu Điều này đặt ra vấn đề làm giảm bớt bằng việc

mở rộng thêm kích thước của toán tử ra các khu lân cận thông qua vi phân đường

1- 1- 1- 0 1 1 1

1- 1- 1- 0 1 1 1

1- 1- 1- 0 1 1 1

1- 1- 1- 0 1 1 1

1- 1- 1- 0 1 1 1

1- 1- 1- 0 1 1 1

1 1 1 1 1 1 1

1 1 1 1 1 1 1

0 0 0 0 0 0 0

1- 1- 1- 1- 1- 1- 1-

1- 1- 1- 1- 1- 1- 1-

1- 1- 1- 1- 1- 1- 1-

Hy

Hình 2.7: Biên ảnh với toán tử Boxcar

2.2.8 Toán tử Truncated Pyramid

Abdou đã đưa ra ý tưởng dùng thao tác hình chóp nón cụt cho bộ lọc tuyến

tính Toán tử được đưa ra ứng với hai chiều x và y như sau:

1- 2- 2- 0 2 2 1

1- 2- 3- 0 3 2 1

1- 2- 3- 0 3 2 1

1- 2- 3- 0 3 2 1

1- 2- 2- 0 2 2 1

1- 1- 1- 0 1 1 1

1 2 2 2 2 2 1

1 2 3 3 3 2 1

0 0 0 0 0 0 0

1- 2- 3- 3- 3- 2- 1-

1- 2- 2- 2- 2- 2- 1-

1- 1- 1- 1- 1- 1- 1-

Trang 19

Toán tử la bàn do Gradient dựa trên sự đánh giá tất cả các hướng có thể của

một đường biên ảnh trong một ảnh rời rạc Bởi vậy thay vì chỉ áp dụng hai mặt nạ

như các toán tử trong kỹ thuật Gradient ở trên, tám mặt nạ đã được dùng, mỗi cái

cung cấp một cạnh đường biên dọc theo một trong tám hướng có thể của vòng

Như vậy, mỗi điểm ảnh đầu ra là giá trị lớn nhất trong tám kết quả nhân xoắn

của mặt nạ với ma trận ảnh Sau mỗi lần nhân xoắn, ta quay mặt nạ này đi một góc

450 ngược chiều kim đồng hồ : 00, 450, 900, 1350, 1800, 2250, 2700, 3150

2.3.1 Toán tử la bàn Kirsh

Phép toán này được xem như là các toán tử thuần nhất Nó tạo ra một sự thay

đổi nhỏ trong Gradient và tạo ra các sự so sánh lần lượt như các phương pháp trên

Các mặt nạ được sử dụng như sau:

3

-5 0

3

-5 5

3

-5 0

3

-5 3-

3- 0 3

-3- 3- 3

3- 0 5

3- 3- 3

Để tìm ra biên ảnh, mỗi điểm ảnh được nhân xoắn với tất cả các mặt nạ (tâm

của mặt nạ trùng với điểm ảnh đang xét) Kết quả của toán tử tại mỗi điểm là giá trị

lớn nhất trong tám kết quả của việc nhân xoắn

Ký hiệu Ai; i = 1,2, ,8 là Gradient theo 8 hướng như 8 mặt nạ kể trên, khi đó

biên độ Gradient tại điểm ảnh (x,y) được tính theo:

A(x,y) = Max(gi(x,y)) i = 1,2, ,8

Ngày đăng: 05/08/2016, 22:25

HÌNH ẢNH LIÊN QUAN

Hình 1.1: Quá trình xử lý ảnh - luận văn thạc sĩ Nghiên cứu một số phương pháp phát hiện biên
Hình 1.1 Quá trình xử lý ảnh (Trang 5)
Hình 2.2: Biên ảnh với Separated Pixel difference - luận văn thạc sĩ Nghiên cứu một số phương pháp phát hiện biên
Hình 2.2 Biên ảnh với Separated Pixel difference (Trang 16)
Hình 2.1: Biên ảnh với Pixel difference - luận văn thạc sĩ Nghiên cứu một số phương pháp phát hiện biên
Hình 2.1 Biên ảnh với Pixel difference (Trang 16)
Hình  2.3: Biên ảnh với toán tử Robert - luận văn thạc sĩ Nghiên cứu một số phương pháp phát hiện biên
nh 2.3: Biên ảnh với toán tử Robert (Trang 17)
Hình  2.4: Biên ảnh với toán tử Prewitt - luận văn thạc sĩ Nghiên cứu một số phương pháp phát hiện biên
nh 2.4: Biên ảnh với toán tử Prewitt (Trang 17)
Hình  2.7: Biên ảnh với toán tử Boxcar - luận văn thạc sĩ Nghiên cứu một số phương pháp phát hiện biên
nh 2.7: Biên ảnh với toán tử Boxcar (Trang 18)
Hình  2.8: Biên ảnh với toán tử Truncated Pyramid - luận văn thạc sĩ Nghiên cứu một số phương pháp phát hiện biên
nh 2.8: Biên ảnh với toán tử Truncated Pyramid (Trang 18)
Hình  2.9: Biên ảnh với toán tử Kirsh - luận văn thạc sĩ Nghiên cứu một số phương pháp phát hiện biên
nh 2.9: Biên ảnh với toán tử Kirsh (Trang 19)
Hình  2.10: Biên ảnh với toán tử la bàn Prewitt - luận văn thạc sĩ Nghiên cứu một số phương pháp phát hiện biên
nh 2.10: Biên ảnh với toán tử la bàn Prewitt (Trang 20)
Hình  2.11: Biên ảnh với toán tử Robinson 3 - level - luận văn thạc sĩ Nghiên cứu một số phương pháp phát hiện biên
nh 2.11: Biên ảnh với toán tử Robinson 3 - level (Trang 20)
Hình  2.13: Biên ảnh với kỹ thuật Laplace - luận văn thạc sĩ Nghiên cứu một số phương pháp phát hiện biên
nh 2.13: Biên ảnh với kỹ thuật Laplace (Trang 21)
Hình  2.15: Biên ảnh với kỹ thuật Laplace of Gauss - luận văn thạc sĩ Nghiên cứu một số phương pháp phát hiện biên
nh 2.15: Biên ảnh với kỹ thuật Laplace of Gauss (Trang 22)
Hình 3.2: Hình mô tả các điểm biên lân cận - luận văn thạc sĩ Nghiên cứu một số phương pháp phát hiện biên
Hình 3.2 Hình mô tả các điểm biên lân cận (Trang 25)
Hình 3.3: Biên ảnh theo phương pháp Canny - luận văn thạc sĩ Nghiên cứu một số phương pháp phát hiện biên
Hình 3.3 Biên ảnh theo phương pháp Canny (Trang 26)
Hình 3.4: Biên ảnh theo phương pháp Shen-Castan - luận văn thạc sĩ Nghiên cứu một số phương pháp phát hiện biên
Hình 3.4 Biên ảnh theo phương pháp Shen-Castan (Trang 28)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w