Các thao tác Hình thái học nói chung, đặc biệt là Hình thái học số được sử dụng chủ yếu vào việc cải thiện ảnh bằng cách làm rõ tái hiện những nét đặc trưng của các hình dạng, do vậy mà
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2
Trang 2BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2
LUẬN VĂN THẠC SỸ MÁY TÍNH
Người hướng dẫn khoa học: PGS TS Ngô Quốc Tạo
HÀ NỘI, 2014
Trang 3LỜI CẢM ƠN
Bằng sự kính trọng và lòng biết ơn sâu sắc, em xin chân thành cảm ơn PGS TS Ngô Quốc Tạo, người đã tận tình hướng dẫn và giúp đỡ em trong suốt quá trình làm luận văn
Em xin chân thành cảm ơn các thầy cô giáo trong khoa Công nghệ thông tin, phòng Sau đại học trường Đại học Sự phạm Hà Nội 2, các thầy cô
đã trực tiếp giảng dạy các học phần trong khóa học đã tạo điều kiện thuận lợi cho em trong cả quá trình học tập và nghiên cứu tại trường
Xin chân thành cảm ơn gia đình, bạn bè, đồng nghiệp đã quan tâm, giúp đỡ em trong thời gian nghiên cứu và hoàn thành luận văn
Trong quá trình nghiên cứu, luận văn không tránh khỏi những thiếu sót Rất mong nhận được sự góp ý của quý thầy cô và bạn bè đồng nghiệp quan tâm đến luận văn này
Hà Nội, tháng 12 năm 2014
Học viên
Đinh Thị Hường
Trang 4LỜI CAM ĐOAN
Trong quá trình hoàn thành luận văn, tôi đã tìm hiểu, nghiên cứu, tổng hợp nhiều nguồn tài liệu khác nhau, dưới dự chỉ đạo, giúp đỡ của giáo viên hướng dẫn, kết quả của đề tài là sản phẩm lao động của cá nhân tôi Các nguồn tài liệu sử dụng được trích dẫn rõ ràng, khoa học
Nội dung luận văn này chưa từng được công bố hay xuất bản dưới bất
kỳ hình thức nào và cũng không sao chép từ bất kỳ một công trình nghiên cứu nào
Tôi xin cam đoan những điều trên là hoàn toàn đúng
Hà Nội, tháng 12 năm 2014
Học viên
Đinh Thị Hường
Trang 5MỤC LỤC
Trang Trang phụ bìa
LỜI CẢM ƠN 1
LỜI CAM ĐOAN 2
MỤC LỤC 3
DANH MỤC CÁC HÌNH VẼ 5
MỞ ĐẦU 7
CHƯƠNG 1 TỔNG QUAN VỀ PHƯƠNG PHÁP 9
CẢI THIỆN CHẤT LƯỢNG ẢNH 9
1.1 Giới thiệu chung về xử lý ảnh 9
1.2 Giới thiệu ảnh nhị phân 11
1.2.1 Một số khái niệm cơ bản 11
1.2.2 Cải thiện chất lượng ảnh bằng kỹ thuật phát hiện biên và tìm xương 15
1.2.3 Các phép toán Logic liên quan đến ảnh nhị phân 22
1.2.4 Cải thiện chất lượng ảnh bằng phép toán hình thái 25
1.2.5 Kết luận về vấn đề nghiên cứu 26
CHƯƠNG 2 CẢI THIỆN CHẤT LƯỢNG ẢNH NHỊ PHÂN 27
BẰNG PHÉP TOÁN HÌNH THÁI 27
2.1 Các phép toán hình thái cơ bản 28
2.1.1 Phép giãn nhị phân (Dilation [1], [2]) 31
2.1.2 Phép co nhị phân (Erosion [1], [2]) 37
2.1.3 Phép mở ảnh (Opening) và phép đóng ảnh (Closing)[1], [2] 42
2.1.4 Phép biến đổi trúng hoặc trượt (Hit –or-Miss) 46
2.2 Một số tính chất của phép toán hình thái 48
2.3 Một số thuật toán cơ bản của hình thái học 50
2.3.1 Trích lọc biên ảnh (Boundary Extraction ) 50
Trang 62.3.2 Làm mảnh (Thinning) 52
2.4 Sử dụng phép toán hình thái để cải thiện chất lượng biên ảnh 54
2.5 Loại bỏ các đối tượng ở các khu vực nhỏ trong ảnh nhị phân 55
2.6 Sử dụng phép toán hình thái trong nối chữ nét đứt 56
CHƯƠNG 3: CÀI ĐẶT THỬ NGHIỆM CHƯƠNG TRÌNH 58
3.1 Giới thiệu 58
3.2 Các chức năng của chương trình 59
KẾT LUẬN 64
TÀI LIỆU THAM KHẢO 65
Trang 7DANH MỤC CÁC HÌNH VẼ
Trang
Hình 1.1 Quá trình xử lý ảnh 10
Hình 1.2 Các bước cơ bản trong một hệ thống xử lý ảnh 10
Hình 1.3 Mô hình tổng quát của hệ thống nhận dạng ảnh 15
Hình 1.4 Ví dụ về ảnh và xương 20
Hình 1.5 Một số phép toán logic giữa các hình ảnh nhị phân 23
Hình 1.6 Một vài ví dụ về các phần tử cấu trúc 24
Hình 1.7 Một số dạng biểu diễn đường thẳng trong các bản vẽ kỹ thuật 26
Hình 2.1 Ảnh và đối tượng trong ảnh 28
Hình 2.2 Quan hệ giữa hai tập hợp 29
Hình 2.3 Phép biến đổi tập hợp 31
Hình 2.4 Hiệu quả của thao tác nhị phân đơn giản trên một ảnh nhỏ 32
Hình 2.5 Giãn A bởi B 33
Hình 2.6 Giãn mất điểm ảnh 34
Hình 2.7 Phép giãn nhị phân 35
Hình 2.8 Quá trình quét của phần tử cấu trúc trên hình ảnh nhị phân 36
Hình 2.9 Giãn ảnh sử dụng phần tử cấu trúc 37
Hình 2.10 Phép co nhị phân 39
Hình 2.11 Phép co nhị phân trên hai đối tượng 39
Hình 2.12 Quá trình lọc đối tượng 41
Hình 2.13 Ứng dụng của phép co ảnh dưới dạng số nhị phân 42
Hình 2.14 Quá trình thực hiện phép mở ảnh 43
Hình 2.15 Phép mở ảnh trên phương diện ý nghĩa hình học 44
Hình 2.16 Quá trình thực hiện phép đóng ảnh 45
Hình 2.17 Minh họa phép đóng ảnh trên phương diện ý nghĩa hình học 45
Hình 2.18 Minh họa phép biến đổi trúng hoặc trượt 47
Trang 8Hình 2.19 Quá trình tìm biên của đối tượng trên ảnh nhị phân 51
Hình 2.20 Trích lọc biên của đối tượng 51
Hình 2.21 Kết quả làm mảnh đối tượng 52
Hình 2.22 Quá trình làm mảnh đối tượng trong hình ảnh 53
Hình 2.23 Kết quả của phép toán giãn nở 54
Hình 2.24 Kết quả của phép toán co ảnh 54
Hình 2.25 Quá trình xác định được rõ sơ đồ mạch điện 55
Hình 3.1 Giao diện chương trình thử nghiệm 58
Hình 3.2 Phép co với phần tử cấu trúc hình vuông 59
Hình 3.3 Phép giãn với phần tử cấu trúc hình vuông 60
Hình 3.4 Tìm biên theo phương pháp Gradient 61
Hình 3.5 Tìm biên theo phương pháp Laplace 61
Hình 3.7 Làm mảnh đối tượng 62
Hình 3.8 Nối chữ nét đứt 63
Trang 9MỞ ĐẦU
1 Lí do chọn đề tài
Cùng với ngôn ngữ, các thông tin duới dạng hình ảnh đóng một vai trò rất quan trọng trong công việc trao đổi thông tin Chính vì vậy những năm gần đây đã có sự kết hợp rất chặt chẽ giữa ảnh và đồ hoạ trong lĩnh vực xử lý thông tin Trong công nghệ thông tin, xử lý ảnh chứa một vai trò rất quan trọng, bởi các ứng dụng đa dạng và phong phú của nó trong nhiều lĩnh vực khoa học Xử lý ảnh là một bộ phận quan trọng trong việc trao đổi thông tin giữa người và máy Nó góp phần làm cho việc quan sát trở nên tốt hơn
Hình ảnh là một dạng dữ liệu đóng vai trò quan trọng trong việc trao đổi,
xử lý, lưu giữ thông tin Trong một số các loại hình công việc, người ta đều cần đến hình ảnh để mô tả, minh chứng hay diễn đạt những điều mà đôi khi chữ viết hay ngôn ngữ nói không diễn tả hết được, phải tổ chức việc lưu các dạng hình ảnh này như thế nào? Có cần xử lý trước khi lưu chúng không? Câu trả lời là có Do vậy tiền xử lý ảnh là việc cần làm Tăng cường chất lượng ảnh, mà công đoạn đầu tiên là một bước tiền xử lý nhằm xác định ảnh, khắc phục những khiếm khuyết do bước thu nhận ảnh không tốt là việc làm quan trọng Có nhiều phương pháp cho việc cải thiện chất lượng ảnh nói chung và tiền xử lý nói riêng Trong luận văn này tôi chỉ mô tả một vài phương pháp tiền xử lý hình ảnh (chú trọng đến ảnh nhị phân, bởi ảnh của các bản vẽ kỹ thuật về sách Scan thường chỉ là ảnh 2 màu: đen, trắng) nhằm cải thiện chất lượng ảnh nhị phân bằng các thao tác Hình thái học
Các thao tác Hình thái học nói chung, đặc biệt là Hình thái học số được
sử dụng chủ yếu vào việc cải thiện ảnh bằng cách làm rõ (tái hiện) những nét đặc trưng của các hình dạng, do vậy mà có thể tính toán được hay nhận biết được chúng một cách dễ dàng Việc sử dụng các thao tác hình thái và ứng dụng của chúng, đặc biệt là ứng dụng cải thiện chất lượng ảnh cho bước tiền
Trang 10xử lý, trước khi thực hiện những bước kế tiếp cho công việc xử lý ảnh Chính
vì những lí do trên mà tôi đã lựa chọn đề tài: “Nghiên cứu phương pháp cải
thiện chất luợng ảnh nhị phân bằng phép toán hình thái”
2 Mục đích nghiên cứu
Tìm hiểu nghiên cứu một số kỹ thuật nhằm cải thiện chất lượng ảnh nhị phân vào xử lý các đối tượng trong hình ảnh và xây dựng chương trình ứng dụng thực tế
3 Nhiệm vụ nghiên cứu
1 Tìm hiểu về phương pháp cải thiện chất lượng ảnh nhị phân
2 Tìm hiểu về cải thiện chất lượng ảnh bằng phép toán hình thái
3 Ứng dụng của phép toán hình thái trong cải thiện chất lượng ảnh
4 Đối tượng và phạm vi nghiên cứu
Các vấn đề về cải thiện chất lượng ảnh nhị phân bằng phép toán hình thái
5 Phương pháp nghiên cứu
Trong quá trình triển khai đề tài, tôi sử dụng chủ yếu các phương pháp: thu thập tài liệu liên quan đến đề tài, tìm hiểu các tài liệu, các bài báo của các tác giả theo định hướng của giáo viên hướng dẫn
6 Cấu trúc của luận văn
Luận văn gồm phần mở đầu và 03 chương nội dung:
Chương 1: Tổng quan về phương pháp cải thiện chất lượng ảnh
Chương 2: Cải thiện chất lượng ảnh nhị phân bằng phép toán hình thái Chương 3: Cài đặt thử nghiệm chương trình
Sau cùng là Kết luận và Tài liệu tham khảo
Trang 11CHƯƠNG 1 TỔNG QUAN VỀ PHƯƠNG PHÁP
CẢI THIỆN CHẤT LƯỢNG ẢNH
1.1 Giới thiệu chung về xử lý ảnh
Xử lý ảnh là đối tượng nghiên cứu của lĩnh vực thị giác máy, là quá trình biến đổi từ một ảnh mới với các đặc tính và tuân theo ý muốn của người
sử dụng Xử lý ảnh có thể gồm các quá trình phân tích, phân lớp các đối tượng, làm tăng chất lượng, phân đoạn và tách cạnh, gán nhãn cho vùng hay quá trình biên dịch các thông tin hình ảnh của ảnh
Cũng như xử lý dữ liệu bằng đồ họa, xử lý ảnh số là một lĩnh vực của tin học ứng dụng Xử lý dữ liệu bằng đồ họa đề cập đến những hình ảnh nhân tạo, các ảnh này được xem xét như là một cấu trúc dữ liệu và được tạo ra với các chương trình Xử lý ảnh số bao gồm các phương pháp và kỹ thuật biến đổi, để truyền tải hoặc mã hóa các ảnh tự nhiên
Xử lý ảnh là lĩnh vực nghiên cứu, là quá trình biến đổi từ một ảnh ban đầu sang một ảnh mới tuân thủ tính chất các đặc trưng của xử lý ảnh bao gồm
y học (xử lý tế bào, nhiễm sắc thể), nhận dạng chữ in hoặc đánh máy trong văn bản phục vụ cho việc tự động hóa quá trình đọc tài liệu, tăng nhanh tốc độ
và chất lượng thu nhận thông tin từ máy tính
Trang 12Quá trình xử lý ảnh [1] được xem như là quá trình thao tác ảnh đầu vào
nhằm cho ra kết quả mong muốn Kết quả đẩy ra của một quá trình xử lý có
thể là một ảnh "tốt hơn" hoặc một kết luận
Hình 1.1 Quá trình xử lý ảnh Ảnh có thể xem là tập hợp các điểm ảnh và mỗi điểm ảnh được xem
như là đặc trưng cường độ sáng hay một dấu hiệu nào đó tại một vị trí nào đó
của đối tượng trong không gian
Sơ đồ tổng quát của một hệ thống xử lý ảnh [1]:
Hình 1.2 Các bước cơ bản trong một hệ thống xử lý ảnh
Trước hết là quá trình thu nhận ảnh Ảnh có thể thu nhận qua camera,
thường ảnh thu nhận qua camera là tín hiệu tương tự (loại camera ống kiểu
CCIR) nhưng cũng có thể là tín hiệu số hóa (loại CCD)
Ảnh có thể thu nhận từ vệ tinh qua các bộ cảm ứng (sensor), hay ảnh,
sách được quét qua scanner Tiếp theo là quá trình số hóa (Digitalizer) để biến
Lưu trữ
Trang 13đổi tín hiệu tương tự sang tín hiệu rời rạc (lấy mẫu) và số hóa bằng lượng hóa, trước khi chuyển sang giai đoạn xử lý, phân tích hay lưu trữ lại
Quá trình phân tích ảnh thực chất bao gồm nhiều công đoạn nhỏ Trước hết là công việc tăng cường hình ảnh để cải thiện chất lượng hình ảnh Do vậy cần phải tăng cường và khôi phục lại ảnh để làm nổi bật một số đặc tính chính của ảnh Giai đoạn tiếp theo là phát hiện các đặc tính như biên, phân vùng ảnh, trích chọn các đặc trưng, Cuối cùng tùy theo mục đích của quá trình xử
lý ảnh, sẽ là giai đoạn nhận dạng, phân lớp hay các quyết định khác Các bước
cơ bản trong một hệ thống xử lý ảnh có thể mô tả ở hình 1.2
1.2 Giới thiệu ảnh nhị phân
Như đã giới thiệu ở trên trong quá trình xử lý ảnh khi ảnh được nhận vào máy tính phải được mã hóa Hình ảnh khi lưu trữ dưới dạng tập tin phải được số hóa tiêu chuẩn đặt ra là ảnh phải lưu trữ thế nào sao cho các ứng dụng khác nhau, có thể thao tác trên các loại dữ liệu này
1.2.1 Một số khái niệm cơ bản
Một số khái niệm cơ bản trong xử lý ảnh [1], [4]:
1.2.1.1 Ảnh và điểm ảnh
Ảnh trong thực tế là một ảnh liên tục về không gian và về giá trị độ sáng chúng được biểu diễn bằng một thành hai biến thực hoặc phức kí hiệu là f(x,y) Trong đó x, y là các giá trị tọa độ không gian và giá trị của f sẽ tỉ lệ với
độ sáng của ảnh tại thời điểm này
Để có thể xử lý ảnh bằng máy tính cần thiết phải tiến hành số hóa ảnh Trong quá trình số hóa, người ta biến đổi tín hiệu liên tục sang tín hiệu rời rạc, thông qua quá trình lấy mẫu (rời rạc hóa về không gian) và lượng tử hóa thành phần giá trị mà về nguyên tắc mắt thường không phân biệt được hai điểm kề nhau Trong quá trình này, người ta sử dụng khái niệm Picture
Trang 14element mà ta quen gọi hay viết tắt là Pixcel - Phần tử ảnh Như vậy, mỗi ảnh
là một tập hợp các Pixcel
1.2.1.2 Độ phân giải
Độ phân giải (Resolution) là mật độ của ảnh được ấn định trên ảnh số khi hiển thị Như vậy khoảng cách giữa các điểm ảnh được chọn sao cho mắt người vẫn thấy được sự liên tục của ảnh Việc chọn này tạo nên mật độ phân
bổ đó chính là độ phân giải được phân bổ liên tục theo x,y
1.2.1.3 Mức xám
Mức xám (gray level): là kết quả sự mã hóa tương ứng một cường độ sáng của mỗi điểm ảnh với một giá trị số Đây cũng chính là kết quả của quá trình lượng tử hóa Ảnh có nhiều mức xám Cách mã hóa kinh điển thường dùng là 16, 32 hay 64 mức Mã hóa 256 mức là phổ dụng nhất do lý do kỹ thuật vì 28 = 256 (1, 1, 255) nên với 256 mức mỗi pixcel sẽ được mã hóa bởi 8 bit
1.2.1.4 Ảnh nhị phân
Tùy theo vùng các giá trị mức xám của điểm ảnh, mà các ảnh được phân chia thành ảnh màu ảnh xám, hay ảnh nhị phân Ảnh chỉ cho hai mức xám là 0 và 1 thì ta nói đó là một ảnh nhị phân hoặc ảnh đen trắng và các điểm ảnh của nó gọi là điểm ảnh nhị phân
1.2.1.5 Ảnh màu và ảnh xám
* Ảnh màu
Ảnh màu là tổ hợp từ ba màu cơ bản : đỏ (Red), lục (Green), lam (Blue)
và thường thu nhận trên các dải băng tần khác nhau Để biểu diễn cho mỗi điểm ảnh màu cần 3 byte để mô tả 24 bit màu
* Ảnh xám
Ảnh xám là trường hợp đặc biệt của ảnh màu Mỗi điểm ảnh màu có 3 giá trị (Red, Green, Blue), nếu 3 giá trị này bằng nhau thì ta có ảnh xám
Trang 151.2.1.6 Khử nhiễu
Có hai loại nhiễu cơ bản trong quá trình thu nhận ảnh:
- Nhiễu hệ thống: là nhiễu có quy luật có thể khử bằng các phép biến đổi
- Nhiễu ngẫu nhiên: vết bẩn không rõ nguyên nhân có thể khắc phục bằng phép lọc
- Tăng số mức xám: Thực hiện nội suy ra các mức xám trung gian bằng
kỹ thuật nội suy Kỹ thuật này nhằm tăng cường độ mịn cho ảnh
1.2.1.8 Trích chọn đặc điểm
Các đặc điểm của đối tượng được trích chọn tùy theo mục đích nhận dạng trong quá trình xử lý ảnh Có thể nêu ra một số đặc điểm của ảnh sau đây:
Đặc điểm không gian: phân bố mức xám, phân bố xác suất, biên độ, điểm uốn, v.v
Đặc điểm biến đổi: Các đặc điểm loại này được trích chọn bằng việc thực hiện lọc vùng (zonal filtering) Các bộ vùng được gọi là “mặt nạ đặc điểm” (feature mask) thường là các khe hẹp với các hình dạng khác nhau (chữ nhật, tam giác, cung tròn v.v.)
Đặc điểm biên và đường biên: Đặc trưng cho đường biên của đối tượng
và do rất hữu ích trong việc trích chọn các thuộc tính bất biến được dùng khi
Trang 16nhận dạng đối tượng Các đặc điểm này có thể được trích chọn nhờ toán tử Gradient, toán tử Laplace
Việc trích chọn hiệu quả các đặc điểm giúp cho việc nhận dạng các đối tượng ảnh chính xác, với tốc độ tính toán cao và dung lượng nhớ lưu trữ giảm xuống
1.2.1.9 Nhận dạng
Nhận dạng ảnh là quá trình liên quan đến các mô tả đối tượng mà muốn đặc tả nó Quá trình nhận dạng thường đi sau quá trình trích chọn các đặc tính chủ yếu của đối tượng Có hai kiểu mô tả đối tượng:
- Mô tả tham số (nhận dạng theo tham số)
- Mô tả theo cấu trúc (nhận dạng theo cấu trúc)
Trên thực tế, người ta đã áp dụng kỹ thuật nhận dạng khá thành công với nhiều đối tượng khác nhau như: nhận dạng ảnh vân tay, nhận dạng chữ (chữ cái, chữ số, chữ có dấu)
Nhận dạng chữ in hoặc đánh máy phục vụ cho việc tự động hóa quá trình đọc tài liệu, tăng nhanh tốc độ và chất lượng thu nhận thông tin từ máy tính
Nhận dạng chữ viết tay (với mức độ ràng buộc khác nhau về cách viết, kiểu chữ, ) phục vụ cho nhiều lĩnh vực
1.2.1.10 Nén ảnh
Nhằm giảm thiểu không gian lưu trữ Thường được tiến hành theo cả hai khuynh hướng là nén có bảo toàn và không bảo toàn thông tin Nén không bảo toàn thì thường có khả năng là nén cao hơn nhưng khả năng phục hồi thì kém hơn Trên cơ sở hai khuynh hướng, có 4 cách tiếp cận cơ bản trong nén ảnh:
- Nén ảnh thống kê: Kỹ thuật nén này dựa vào việc thống kê tần suất xuất hiện của giá trị các điểm ảnh, trên cơ sở đó mà có chiến lược mã hóa thích hợp Một ví dụ điển hình cho kỹ thuật mã hóa này là *.TIF
Trang 17- Nén ảnh không gian: Kỹ thuật này dựa vào vị trí không gian của các điểm ảnh để tiến hành mã hóa Kỹ thuật lợi dụng sự giống nhau của các điểm ảnh trong các vùng gần nhau Ví dụ cho kỹ thuật này là mã nén *.PCX
- Nén ảnh sử dụng phép biến đổi: Đây là kỹ thuật tiếp cận theo hướng nén không bảo toàn và do vậy, kỹ thuật thường nén hiệu quả hơn, *.JPG chính
là tiếp cận theo kỹ thuật nén này
- Nén ảnh Fractal: Sử dụng tính chất Fractal của các đối tượng ảnh, thể hiện sự lặp lại của các chi tiết Kỹ thuật nén sẽ tính toán để chỉ cần lưu trữ phần gốc ảnh và quy luật sinh ra ảnh theo nguyên lý Fractal
1.2.2 Cải thiện chất lượng ảnh bằng kỹ thuật phát hiện biên và tìm xương
Trong xử lý và nhận dạng ảnh, có một số loại ảnh đường nét gồm các đối tượng là các đường cong có độ dài lớn hơn nhiều so với độ dày của nó, ví
dụ như là ảnh các kí tự, dấu vân tay, sơ đồ mạch điện tử, bản vẽ kỹ thuật, bản đồ…Để xử lý các loại này người ta thường xây dựng các hệ mô phỏng theo cách phân tích ảnh của con người gọi là hệ thống thị giác máy Có nhiều hệ thống được cài đặt theo phương pháp này như hệ thống nhận dạng chữ viết bằng thiết bị quang học OCR (Optical Character Recognition), hệ thống nhận dạng vân tay AFIS (Automated fingerprint Identification System)…
Hình 1.3 Mô hình tổng quát của hệ thống nhận dạng ảnh
Đọc ảnh
Tiền xử lý (nâng cấp và khôi phục)
Trích trọn đặc điểm
Đối sánh Nhận dạng
Trang 18Có nhiều phương pháp trích chọn đặc điểm được biết tới như phương pháp sử dụng sóng ngắn (Wavelet), sử dụng hệ số Fourier, sử dụng các mômen bất biến, sử dụng các đặc trưng của biên như tính trơn và các điểm đặc biệt, sử dụng các đặc trưng tôpô dựa trên phát hiện biên và tìm xương của đường nét ảnh…Phương pháp trích chọn đặc điểm sử dụng ảnh được sử dụng nhiều Kỹ thuật phát hiện biên và tìm xương là một trong nhiều ứng dụng nghiên cứu và giải quyết một số vấn đề của bài toán nêu trên công đoạn tiền
xử lý ảnh
1.2.2.1 Phương pháp phát hiện biên
Biên là vấn đề quan trọng trong trích chọn đặc điểm nhằm tiến tới hiểu ảnh Về mặt toán học người ta xem điểm biên là điểm có sự thay đổi về mức xám Ví dụ: đối với ảnh đen trắng, một điểm được gọi là điểm biên nếu nó là điểm đen có ít nhất một điểm trắng bên cạnh Tập hợp các điểm biên tạo nên biên hay đường bao của đối tượng
Xuất phát từ cơ sở này người ta thường sử dụng hai phương pháp phát hiện biên cơ bản đó là: phát hiện biên trực tiếp và phát hiện biên gián tiếp [1]
a) Phương pháp phát hiện biên trực tiếp
Phương pháp này làm nổi biên dựa vào sự biến thiên mức xám của ảnh
Kỹ thuật chủ yếu dùng để phát hiện biên ở đây là dựa vào sự biến đổi theo hướng Nếu lấy đạo hàm bậc nhất của ảnh ta có kỹ thuật Gradient, nếu lấy đạo hàm bậc hai của ảnh ta có kỹ thuật Laplace
* Kỹ thuật pháp hiện biên Gradient
Theo định nghĩa, Gradient là một véctơ có các thành phần biểu thị tốc
độ thay đổi giá trị của điểm ảnh, ta có:
y x f
dx
y x f y dx x f fx x
y x f
) , ( ) , ( )
, (
) , ( ) , ( )
, (
Trang 19Trong đó: dx, dy là khoảng cách giữa các điểm theo hướng x, y (khoảng cách tính bằng số điểm)
Việc xấp xỉ đạo hàm bậc nhất theo các hướng x, y được thực hiện thông qua hai mặt nạ nhân chập tương ứng sẽ cho ta các kỹ thuật phát hiện biên khác nhau (kỹ thuật Sobel, kỹ thuật Prewitt…)
* Kỹ thuật phát hiện biên Laplace
Các phương pháp đánh giá Gradient ở trên làm việc khá tốt khi mà độ sáng thay đổi rõ nét Khi mức xám thay đổi chậm, miền chuyển tiếp trải rộng, phương pháp cho hiệu quả hơn đó là phương pháp sử dụng đạo hàm bậc hai Laplace
Toán tử Laplace được định nghĩa như sau:
2
2
2
2 2
dy
f dx
) , 1 ( ) , ( ) , ( ) , 1 (
)) , ( ), 1 ( ( ) (
2 2
y x f y x f y x f
y x f y x f y x f y x f
y x f y x f x x
f x x f
x f y f
) , 1 ( ) , ( 2 ) , 1 (
2 2 2 2
y x f y x f y
x f y f
y x f y x f y x f x f
Vậy: 2f f 1 (x 1 ,y) f(x,y 1 ) 4f(x,y) f(x 1 ,y) f(x,y)
b) Phát hiện biên gián tiếp
Nếu bằng cách nào đó ta phân được ảnh thành các vùng thì ranh giới giữa các vùng đó gọi là biên Kỹ thuật dò biên và phân vùng ảnh là hai bài
Trang 20toán đối ngẫu nhau vì dò biên để thực hiện phân lớp đối tượng mà khi đã xong nghĩa là đã phân vùng được ảnh và ngược lại, khi đã phân vùng ảnh đã được phân lớp thành các đối tượng, do đó có thể phát hiện được biên
Có hai kỹ thuật dò biên cơ bản:
- Kỹ thuật thứ nhất: Xét ảnh biên thu được từ ảnh vùng sau một lần duyệt như một đồ thị, sau đó áp dụng các thuật toán duyệt cạnh đồ thị
- Kỹ thuật thứ hai: Dựa trên ảnh vùng, kết hợp đồng thời quá trình dò biên và tách biên Ở đây ta quan tâm cách tiếp cận thứ hai
Trước hết, giả sử ảnh được xét chỉ bao gồm một vùng ảnh 8 – liên thông, được bao bọc bởi một vành đai cách điểm nền
Về cơ bản, các thuật toán dò biên trên một vùng đều bao gồm các bước sau:
- Xác định điểm biên xuất phát
- Dự báo và xác định điểm biên tiếp theo
- Lặp bước 2 cho đến khi gặp điểm xuất phát
Do xuất phát từ những tiêu chuẩn và định nghĩa khác nhau về điểm biên và quan hệ liên thông, các thuật toán dò biên cho ta các đường biên mang các sắc thái rất khác nhau
Kết quả tác động của toán tử dò biên lên một điểm biên là điểm biên +1 Thông thường các toán tử này được xây dựng như một hàm đại số Boolean trên các 8 - láng giềng của điểm biên Mỗi cách xây dựng các toán tử đều phụ thuộc vào định nghĩa quan hệ liên thông và điểm biên Do đó sẽ gây khó khăn cho việc khảo sát các tính chất của đường biên Ngoài ra, vì mỗi bước dò biên đều phải kiểm tra tất cả các 8 - láng giềng của mỗi điểm nên thuật toán thường kém hiệu quả Để khắc phục các hạn chế trên, thay vì sử dụng một điểm biên ta sử dụng cặp điểm biên (ngoài và trong), các cặp điểm này tạo nên tập nền vùng, tiếp theo phân tích toán tử dò biên thành 2 bước:
- Xác định cặp điểm nền vùng tiếp theo
Trang 21- Lựa chọn điểm biên
Trong đó bước thứ nhất thực hiện chức năng của một ánh xạ trên tập nền vùng lên nền vùng tiếp theo và bước thứ hai thực hiện chức năng chọn điểm biên
Thuật toán dò biên tổng quát
Bước 1: Xác định cặp nền – vùng xuất phát
Bước 2: Xác định cặp nền – vùng tiếp theo
Bước 3: Lựa chọn điểm biên
Bước 4: Nếu gặp lại cặp xuất phát thì dừng, nếu không quay lại bước 2 Việc xác định cặp nền - vùng xuất phát được thực hiện bằng cách duyệt ảnh lần lượt từ trên xuống dưới và từ trái qua phải rồi kiểm tra điều kiện lựa chọn cặp nền - vùng Do việc chọn điểm biên chỉ mang tính chất quy ước, nên
ta gọi ánh xạ xác định cặp nền - vùng tiếp theo là toán tử dò biên
c) Kết luận
Phương pháp phát hiện biên trực tiếp tỏ ra khá hiệu quả và ít chịu ảnh hưởng của nhiễu, song nếu sự biến thiên độ sáng không đột ngột, phương pháp tỏ ra kém hiệu quả, phương pháp phát hiện biên gián tiếp tuy khó cài đặt, song lại áp dụng khá tốt trong trường hợp này
1.2.2.2 Kỹ thuật tìm xương
Xương được coi như hình dạng cơ bản của một đối tượng, với số ít các điểm ảnh cơ bản Ta có thể lấy được các thông tin về hình dạng nguyên bản của một đối tượng thông qua xương
Một định nghĩa xúc tích về xương dựa trên tính continum (tương tự như hiện tượng cháy đồng cỏ) được đưa ra bởi Blum (1976) [3] như sau: Giả thiết rằng đối tượng là đồng nhất được phủ bởi cỏ khô và sau đó dựng lên một vòng biên lửa Xương được định nghĩa như nơi gặp của các vệt lửa và tại đó chúng được dập tắt
Trang 22Hình 1.4 Ví dụ về ảnh và xương
Kỹ thuật tìm xương luôn là chủ đề nghiên cứu trong xử lý ảnh những năm gần đây Mặc dù có những nỗ lực cho việc phát triển các thuật toán tìm xương, nhưng các phương pháp đưa ra đều bị mất mát thông tin Có thể chia thành hai loại thuật toán tìm xương cơ bản [1]
- Thuật toán tìm xương dựa trên làm mảnh
- Thuật toán tìm xương không dựa trên làm mảnh
a) Tìm xương dựa trên làm mảnh
Thuật toán làm mảnh ảnh số nhị phân là một trong các thuật toán quan trọng xử lý ảnh và nhận dạng Xương chứa những thông tin bất biến về cấu trúc của ảnh, giúp cho quá trình nhận dạng hoặc vectơ hóa sau này
Thuật toán làm mảnh là quá trình lặp duyệt và kiểm tra tất cả các điểm thuộc đối tượng Trong mỗi lần lặp tất cả các điểm của đối tượng sẽ được kiểm tra: Nếu như chúng thỏa mãn điều kiện xóa nào đó tùy thuộc và mỗi thuật toán thì nó sẽ bị xóa đi Quá trình cứ lặp lại như vậy cho đến khi không còn điểm biên nào được xóa Đối tượng được bóc dần lớp biên cho đến khi điểm nào bị thu mảnh lại chỉ còn các điểm biên
Các thuật toán làm mảnh được phân loại dựa trên phương pháp xử lý các điểm là thuật toán làm mảnh song song và thuật toán làm mảnh tuần tự
Thuật toán làm mảnh song song, là thuật toán mà trong đó các điểm được xử lý theo phương pháp song song, tức là được xử lý cùng một lúc Giá
Trang 23trị của mỗi điểm sau một lần lặp chỉ phụ thuộc vào giá trị của các láng giềng bên cạnh (thường là 8 - láng giềng) mà giá trị của các điểm này đã được xác định trong lần lặp trước đó Trong máy có nhiều bộ vi xử lý sẽ xử lý một vùng của đối tượng, nó có quyền đọc từ các điểm ở vùng khác nhưng chỉ được ghi trên vùng của nó xử lý
Trong thuật toán làm mảnh tuần tự các điểm thuộc đối tượng sẽ được kiểm tra theo một thứ tự nào đó (chẳng hạn các điểm được xét từ trái qua phải, từ trên xuống dưới) Giá trị của các điểm sau mỗi lần lặp không những phụ thuộc vào giá trị của các láng giềng bên cạnh mà còn phụ thuộc vào các điểm đã được xét trước đó trong chính lần lặp đang xét
Chất lượng của thuật toán làm mảnh được đánh giá theo các tiêu chuẩn được liệt kê dưới đây nhưng không nhất thiết phải thỏa mãn đồng thời tất cả các tiêu chuẩn
Bảo toàn tính liên thông của đối tượng và phần bù của đối tượng
Sự tương hợp giữa xương và cấu trúc của ảnh đối tượng
Bảo toàn các thành phần liên thông
Bảo toàn các điểm cụt
Xương chỉ gồm các điểm biên, càng mảnh càng tốt
Bền vững đối với nhiễu
Xương cho phép khôi phục ảnh ban đầu của đối tượng
Xương thu được ở chính giữa đường nét của đối tượng được làm mảnh
Xương nhận được bất biến với phép quay
b) Tìm xương không dựa trên làm mảnh
Để tách được xương của đối tượng có thể sử dụng đường biên của đối tượng Với điểm p bất kỳ trên đối tượng, ta bao nó bởi một đường biên Nếu như có nhiều điểm biên có cùng khoảng cách ngắn nhất tới p thì p nằm trên
Trang 24trục trung vị Tập tất cả các điểm như vậy lập thành trục trung vị hay xương của đối tượng Việc xác định đối tượng được tiến hành thông qua hai bước:
Bước thứ nhất: tính khoảng cách từ mỗi điểm ảnh của đối tượng đến điểm biên gần nhất Như vậy cần phải tính toán khoảng cách tới tất cả các điểm biên của ảnh
Bước thứ hai: khoảng cách ảnh đã được tính toán và các điểm ảnh có giá trị lớn nhất được xem là nằm trên xương của đối tượng
1.2.3 Các phép toán Logic liên quan đến ảnh nhị phân
Phép toán cơ bản nhất được sử dụng trong xử lý ảnh là: phép AND, phép
OR, và phép toán NOT Các tính chất của chúng được định nghĩa trong bảng dưới đây:
Toán tử logic được thực hiện trên một điểm ảnh cơ sở giữa các điểm ảnh tương ứng của hai hoặc nhiều hình ảnh (ngoại trừ NOT, đó là toán tử các điểm ảnh của một hình ảnh đơn giản) Bởi vì toán tử AND của hai biến nhị phân chỉ là 1 khi cả hai biến là 1, vì vậy trong một hình ảnh ở bất kỳ vị trí nào thì với toán tử AND giữa các điểm ảnh tương ứng, ta thu được kết quả là 1 khi và chỉ khi các điểm ảnh đầu vào đều có giá trị là 1 Hình 1.5 là ví dụ để
Trang 25minh họa cho các phép toán logic, phần có màu xẫm là phần có giá trị là 1, phần màu trắng là phần có giá trị là 0
Các phép toán logic khác được xây dựng dựa trên các phép toán đã được định nghĩa ở trên Cho một ví dụ: Phép toán XOR (dựa trên phép toán AND
và NOT), giá trị của nó là 1 nếu giá trị của một trong hai điểm ảnh có giá trị là
1 (không phải là cả hai), và giá trị của nó là 0 khi cả hai điểm ảnh đều có giá trị là 0 hoặc 1 Phép toán này khác phép toán OR, giá trị trả về sẽ là 1 khi một trong hai điểm ảnh đầu vào là 1, hoặc khi cả hai điểm ảnh đầu vào là 1 Phép toán NOT – AND chỉ trả về giá trị là 0 khi cả hai điểm ảnh đầu vào là 1
Hình 1.5 Một số phép toán logic giữa các hình ảnh nhị phân
(A) N-AND (B)
Trang 26Phần có màu xẫm có các giá trị là 1, và phần có màu trắng có các giá trị
là 0
Phép toán hình thái cung cấp hai phép toán cơ bản là phép giãn nhị phân (Dilation) và phép co nhị phân (Erosion), hai phép này là cơ sở ban đầu cho nhiều ứng dụng về hình thái khác
Để đi vào tìm hiểu các phép toán hình thái, đầu tiên ta làm quen với một
số khái niệm quan trọng thường được sử dụng trong bài viết
Phần tử cấu trúc (Constructing elements): Đôi khi được gọi là một nhân (Kernel) Nhưng thuật ngữ này thường được sử dụng cho các đối tượng trong tích chập (Convolutions) Các phần tử cấu trúc thường được quy định theo một mẫu riêng dựa trên tọa độ của một số điểm có liên quan tới đối tượng nào
đó Ta quan sát ví dụ từ hình minh họa phía dưới, đó là các mẫu đặc trưng cho các phần tử cấu trúc có kích thước khác nhau
Hình 1.6 Một vài ví dụ về các phần tử cấu trúc
Ở hình 1.6 có đưa ra hai kiểu phần tử cấu trúc đặc trưng có kích thước 3x3 và 9x9 các vòng tròn đánh dấu gốc của phần tử cấu trúc ở hai kiểu này khác nhau, nhưng đều có đặc điểm chung là vòng đánh dấu tâm điểm luôn được đặt ở điểm có tọa độ ở trung tâm của phần tử cấu trúc
Lưu ý: Ở mỗi tọa độ điểm trên phần tử cấu trúc đều có thể có một giá trị riêng Một ví dụ đơn giản nhất về ứng dụng của phần tử cấu trúc, như sử dụng vào phép co với ảnh nhị phân Ngoài ra còn có nhiều các phần tử cấu trúc
Trang 27phức tạp phục vụ cho các mục đích khác, chẳng hạn như sử dụng để tìm xương hoặc ứng dụng cho các phép toán hình thái trên ảnh xám
Một điểm quan trọng nữa cần lưu ý là các phần tử cấu trúc cũng có thể
có dạng hình chữ nhật, hình tròn… Trên ví dụ minh họa thì trong các phần tử cấu trúc có một số điểm bị bỏ trống, về bản chất thì những chỗ bỏ trống có thể coi như giá trị là 0 hoặc một giá trị nào đó không thuộc phần tử cấu trúc, nếu đưa vào đây sẽ gây khó hiểu với nội dung cần đề cập, nên ở đây các phần tử
đó được để trống
Khi một phép toán hình thái được thực hiện thì các gốc của phần tử cấu trúc thường dịch chuyển lần lượt trên các điểm ảnh Và khi đó giá trị của các điểm ảnh vừa được quét qua sẽ được so sánh với nhau, các kết quả thu được sau khi so sánh phụ thuộc vào phép toán hình thái đang được sử dụng
1.2.4 Cải thiện chất lượng ảnh bằng phép toán hình thái
Hình ảnh trong thực tế khi nhận được qua các thiết bị như: Photocopy, Fax,…ít nhiều đều bị nhiễu, thậm chí có thể biến dạng đến mức độ có thể khiến người nhận được hiểu sai về mặt ý nghĩa Như chúng ta đã biết trong các ngành thiết kế kỹ thuật như: Thiết kế máy, thiết kế xây dựng, thiết kế mạch điện.v.v dù là theo tiêu chuẩn Việt Nam (TCVN) hay ISO (International Standard Oganize), một bản vẽ được thể hiện chỉ xoay quay một dạng đường như: đường thẳng, đường cong khép kín, đường cong mở (có thể lồi hoặc lõm), các cung tròn, elip,…Các dạng đường như thế được biểu diễn bằng những nét vẽ Nét vẽ có thể là nét liền (Continuous), có thể là nét đứt (dash), có thể là nét chấm gạch như đường tâm (Center), có thể là đường khuất (Hide)…(hình 1.7) Mỗi độ lớn của hình vẽ (nét mảnh hoặc nét đậm),
có khi thể hiện một ý nghĩa khác nhau Như trong thể hiện của đường ren của một bulon chẳng hạn: đường chân ren phải được thể hiện bằng một nét đậm Hoặc một đường khuất, sẽ thể hiện cho hình chiếu của một đường thuộc một
Trang 28mặt phẳng nằm ở phía sau của một mặt khác theo góc hình vuông góc với mặt phẳng chiếu Trong khi đó, nét liền sử dụng để biểu diễn cho hình chiếu của đối tượng ở mặt trước nó
Nét đứt Đường tâm Hình 1.7 Một số dạng biểu diễn đường thẳng trong các bản vẽ kỹ thuật
Do vậy, nếu như nét vẽ của một đường thẳng lẽ ra là một nét vẽ liền trong khi đó đường mà chúng ta nhận được lại là nét đứt thì việc đọc các thông tin trên bản vẽ sẽ dẫn đến việc hiểu sai về mặt ý nghĩa là điều không tránh khỏi Để giải quyết bài toán này như: nối liền những nét đứt, nối liền chữ, làm trơn biên ảnh… Các phép toán hình thái nhị phân đã ra đời, thông qua đó các phép đóng ảnh, mở ảnh cũng được định nghĩa để giải quyết bài toán nêu trên
1.2.5 Kết luận về vấn đề nghiên cứu
Cải thiện chất lượng ảnh là một vấn đề không thể thiếu trong quá trình nhận dạng đối tượng Trong thực tế, hình dạng thường được chú trọng hơn kích thước và con người nhận ra các đối tượng xung quanh chủ yếu thông qua hình dạng Chương này đã trình bày hệ thống về các phương pháp cải thiện chất lượng hình ảnh theo xương và biên và giới thiệu sơ lược về các phép toán hình thái học
Các phép toán hình thái học là các phép toán kinh điển trong toán học
đã có nhiều ứng dụng trong toán học Nội dung của chương tiếp theo sẽ đề cập phép toán hình thái trong xử lý ảnh và ứng dụng trong biểu diễn hình dạng của đối tượng
Trang 29CHƯƠNG 2 CẢI THIỆN CHẤT LƯỢNG ẢNH NHỊ PHÂN
BẰNG PHÉP TOÁN HÌNH THÁI
Cải thiện chất lượng ảnh là một bài toán kinh điển trong tiền xử lý ảnh Giải quyết bài toán cải thiện chất lượng ảnh là nhiệm vụ tiên quyết và cũng không thể tránh khỏi của bất kỳ một hệ thống tiền xử lý ảnh nào Vì lẽ đó, cùng với sự phát triển của xử lý ảnh nói chung và tiền xử lý ảnh nói riêng, bài toán cải thiện chất lượng ảnh cũng được quan tâm ngày càng nhiều và dưới nhiều góc độ khác nhau Có rất nhiều hướng tiếp cận cho bài toán cải thiện chất lượng ảnh từ trước tới nay Các thuật toán cải thiện chất lượng ảnh thường được xây dựng cho các hệ thống phân tích ảnh văn bản khác nhau nên chỉ giải quyết cho những loại văn bản cụ thể
Tính khoa học của Hình thái học số mới chỉ thực sự phát huy khả năng của nó kể từ khi máy tính điện tử số ra đời và làm cho hình thái học trở lên thông dụng, có nhiều tính năng mới Những đối tượng trong Hình thái học ta
có thể coi như là tập hợp của các điểm ảnh, nhóm là theo cấu trúc ma trận hai chiều Những thao tác toán học rời rạc trên tập hợp điểm đó được sử dụng để làm rõ những nét đặc trưng riêng của hình dạng đối tượng, do vậy có thể tính toán được hay nhận biết được chúng một cách dễ dàng Phần lớn các phép toán hình thái học được định nghĩa từ hai phép toán cơ bản là phép co nhị phân (Erosion) và phép toán giãn nhị phân (Dilation)
Phép toán cơ sở được kết hợp với một đối tượng là tiêu chuẩn của các phép tập hợp như phép hợp (Union), phép giao (InterSection), và phép bù (Complement) cộng với phép tịnh tiến nào đó Vì vậy trong phần tiếp theo sẽ trình bày các khái niệm về tập hợp thường được sử dụng trong phép toán hình thái
Trang 302.1 Các phép toán hình thái cơ bản
Ta định nghĩa ảnh nhị phân là tập hợp các điểm ảnh có tọa độ (x,y) Chúng ta còn có định nghĩa khác về ảnh, theo quan sát thì có thể xem ảnh như tập hợp các tọa độ rời rạc hoặc liên tục
Theo một định nghĩa nào đó thì tập hợp này tương ứng với các điểm ảnh thuộc các đối tượng hiện hữu trong ảnh
Hình 2.1 Ảnh và đối tượng trong ảnh Hình vẽ cho ta thấy hai đối tượng, hay hai tập hợp A và B trong ảnh Ở đây ta cần phải xác định hệ trục tọa độ như trong hình, quan tâm đến giá trị các điểm ảnh cấu thành lên đối tượng trong ảnh và được giới hạn trên không gian rời rạc Z2
Đầu tiên, ta có A là một tập hợp trong không gian rời rạc Z2 Nếu a = (a1, a2) là một phần tử của tập hợp A thì ta có thể viết như sau:
Ví dụ, khi ta viết một công thức:
Trang 31w w d d D
Tập C là tập hợp gồm các phần tử w, như vậy w được hình thành khi nhân từng tọa độ của các phần tử trong tập hợp D với -1
Nếu mỗi phần tử của tập hợp A cũng là một phần tử trong tập hợp B thì
ta có thể nói A là tập con của B, và được biểu thị như sau:
B
Hợp (Union) của hai tập hợp A và B là tập hợp của các phần tử thuộc
A, B hoặc cả A và B, được biểu thị như sau:
B A
Như vây giao (Intersection) của hai tập hợp A và B là tập hợp các phần
tử thuộc cả A và B, được biểu thị như sau:
B A
Trang 32Phần bù tuyệt đối (Complement) của một tập hợp A là tập hợp các phần
tử không bao gồm các phần tử trong A:
Với w là tập hợp các phần tử thuộc tập hợp A nhưng không thuộc tập hợp B, khái niệm này được minh họa trên Hình 2.2 (d) Phần có màu là kết quả của phép toán giữa hai tập hợp
Sau đây là hai định nghĩa cần bổ sung vì nó được sử dụng rộng rãi trong phép toán hình thái, nhưng nói chung là vẫn chưa tìm được cái căn bản trên thuyết tập hợp
Phản xạ (reflection) của tập hợp B được biểu thị là B^ , và được định nghĩa bằng biểu thức sau:
w w b b B
^
(0.10) Nghĩa là phần tử w được hình thành khi nhân từng tọa độ của tập hợp B với (-1) khi đó vị trí tương đối giữa các điểm trong tập hợp B có xu hướng đối ngược lại so với ban đầu, gọi là tính phản xạ của tập hợp Hay nói cách khác tập hợp B sẽ quay quanh gốc tọa độ một góc 1800
Một điểm z(z1,z2) thuộc tập hợp A, khi z tịnh tiến thì phép tịnh tiến của tập hợp A được biểu thị là (A)z, và được định nghĩa bằng biểu thức sau:
Trang 33hợp A và B ở Hình 2.3., chấm màu đen trên hình vẽ là để biểu thị phản xạ của tập hợp B và sự tịnh tiến của 1 điểm từ tập hợp A
Hình 2.3 Phép biến đổi tập hợp Trong đó: a) Tịnh tiến của tập hợp A từ một điểm z; b) Phản xạ của tập hợp B Lưu ý: Những phần tử riêng lẻ hợp thành B không chỉ có các điểm ảnh
mà còn có các vectơ khi chúng có vị trí tọa độ xác định với điểm gốc [0,0]
2.1.1 Phép giãn nhị phân (Dilation [1], [2])
Tập hợp B thường được coi như là một phần tử cấu trúc (Structuring element) trong giãn nhị phân, cũng như trong các phép toán hình thái khác, tập hợp A là tập hợp các phần tử của hình ảnh gốc
Với A và B là các tập hợp trong Z2, thì phép giãn nhị phân của A theo B (A B) được định nghĩa qua công thức sau: