Tác giả xin cam đoan những kết quả nghiên cứu được trình bày trong luận văn“nội suy ảnh số sử dụng phép toán hình thái và ứng dụng phép lọc hình thái học để nâng cao chất lượng ảnh tài
Trang 1-
HOÀNG VĂN TAM
NỘI SUY ẢNH SỐ
SỬ DỤNG PHÉP TOÁN HÌNH THÁI VÀ ỨNG DỤNG PHÉP LỌC HÌNH THÁI HỌC ĐỂ NÂNG CAO
CHẤT LƯỢNG ẢNH TÀI LIỆU
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS TS NGÔ QUỐC TẠO
THÁI NGUYÊN- 2020
Trang 2LỜI CAM ĐOAN
Tên tôi là:
Sinh ngày:
Học viên lớp:
Hiện đang công tác tại:
Tác giả xin cam đoan những kết quả nghiên cứu được trình bày trong
luận văn“nội suy ảnh số sử dụng phép toán hình thái và ứng dụng phép lọc
hình thái học để nâng cao chất lượng ảnh tài liệu” do PGS.TS Ngô Quốc
Tạo hướng dẫn là hoàn toàn trung thực của tác giả, không vi phạm bất cứ điều
gì trong luật sở hữu trí tuệ và pháp luật Việt Nam Nếu sai, tác giả hoàn toàn chịu trách nhiệm trước pháp luật
Tác giả luận văn
Xác nhận của khoa chuyên môn Xác nhận của người hướng dẫn
khoa học
PGS.TS Ngô Quốc Tạo
Trang 4MỤC LỤC
LỜI CAM ĐOAN i
LỜI CẢM ƠN Error! Bookmark not defined MỤC LỤC iii
DANH MỤC KÍ HIỆU, CÁC CHỮ VIẾT TĂT v
DANH MỤC CÁC HÌNH vi
LỜI MỞ ĐẦU 1
CHƯƠNG 1 TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ PHÉP TOÁN HÌNH THÁI 3
1.1 Xử lý ảnh 3
1.2 Quá trình xử lý ảnh 4
1.3 Các vấn đề cơ bản trong xử lý ảnh 4
1.3.1 Một số khái niệm cơ bản 4
1.3.2 Nắn chỉnh biến dạng 5
1.3.3 Khử nhiễu 6
1.3.4 Chỉnh mức xám 7
1.3.5 Trích chọn đặc điểm 7
1.3.6 Nhận dạng 8
1.3.7 Nén ảnh 9
1.4 Thu nhận và biểu diễn ảnh 10
1.4.1 Thu nhận, các thiết bị thu nhận ảnh 10
1.4.2 Biểu diễn ảnh 10
1.5 Các khái niệm về phép toán hình thái Morphology 10
CHƯƠNG 2 MỘT SỐ TÍNH CHẤT NỘI SUY CỦA PHÉP TOÁN HÌNH THÁI HỌC 13
2.1 Các phép toán hình thái học 13
2.1.1 Các phép toán hình thái học trên ảnh nhị phân 13
2.1.2 Các phép toán hình thái học trên ảnh xám 16
2.1.3 Các phép toán hình thái học trên ảnh màu 22
2.1.3.1 Hình thái học dựa trên biểu đồ đồng bằng 23
Trang 52.1.3.2 Hình thái học dựa trên biểu đồ làm mịn 25
2.1.3.3 Hình thái học cho một loại hình ảnh tương tự 26
2.2 Các tính chất nội suy của phép toán hình thái học 27
2.3 Các phép lọc hình thái học ứng dụng cho ảnh OCR 28
2.3.1 Mô hình ảnh tài liệu kém chất lượng 28
2.3.2 Lọc hình thái học 31
2.3.2.1 Toán tử hình thái trên không gian đồ thị 31
2.3.2.2 Toán tử hình thái trên các phức hợp đơn giản 32
2.3.2.3 Bộ lọc đóng và mở khu vực hình thái 35
CHƯƠNG 3 THỬ NGHIỆM PHÉP LỌC HÌNH THÁI HỌC ỨNG DỤNG CHO ẢNH TÀI LIỆU KÉM CHẤT LƯỢNG 38
3.1 Thiết kế mô hình thử nghiệm 38
3.2 Phép toán hình thái cơ bản 39
3.3 Loại bỏ nhiễu để làm rõ đối tượng 39
3.4 Làm rõ điểm bất thường 41
3.5 Kết hợp các phép toán hình thái để khử nhiễu ảnh 42
KẾT LUẬN 46
TÀI LIỆU THAM KHẢO 47
PHỤ LỤC 48
Trang 6DANH MỤC KÍ HIỆU, CÁC CHỮ VIẾT TẮT Chữ viết tắt Ý nghĩa, dạng viết đầy đủ
ORC Nhận dạng ký tự quang học (Optical Character Recognition) MSE sai số toàn phương trung bình (Mean squared error)
PSNR Tỉ số tín hiệu cực đại trên nhiễu (peak signal-to-noise ratio)
Trang 7DANH MỤC CÁC HÌNH
Hình 1.1 Sơ đồ quá trình xử lý ảnh 4
Hình 1.2 Ảnh thu nhận và ảnh mong muốn 5
Hình 3.1 Minh họa các phép toán hình thái cơ bản 39
Hình 3.2 Làm rõ đối tượng tiền cảnh 40
Hình 3.3 Làm rõ điểm bất thường 42
Hình 3.4 Khử nhiễu ảnh 43
Hình 3.5 Khử nhiễu ảnh ORC 44
Trang 8LỜI MỞ ĐẦU
1 Đặt vấn đề
Hình ảnh trong cuộc sống hiện tại là một dạng dữ liệu đóng vai trò quan trọng trong việc lưu giữ, xử lý và trao đổi thông tin Với thời đại 4.0 nhu cầu lưu trữ và xử lý các tài liệu, văn bản, bản vẽ kỹ thuật,… dưới dạng hình ảnh scan hoặc dưới dạng ảnh là nhu cầu cần thiết Tuy nhiên, các hình ảnh scan hoặc chụp thu được bởi nhiều lý do có thể bị nhiễu, mờ nhòe, đứt nét và không được rõ ràng… dẫn đến việc thu nhận thông tin và xử lý gặp nhiều khó khăn
Vì vậy việc khắc phục những nhược điểm của hình ảnh thu nhận được là việc làm rất cấp thiết Trên thế giới cũng như tại Việt Nam đã có rất nhiều các kỹ thuật được đưa ra, trong đó có xử lý ảnh Các phép toán hình thái trên ảnh cung cấp cho chúng ta những mô tả định lượng về cấu trúc và hình dạng hình học của các đối tượng trong ảnh và nó đang được ứng dụng rộng rãi trong việc nâng cao chất lượng ảnh, phân đoạn ảnh, kiểm tra khuyết điểm trên ảnh,…
Trong luận văn này tác giả sẽ nghiên cứu: “Một số tính chất nội suy ảnh
số sử dụng phép toán hình thái và ứng dụng phép lọc hình thái học để nâng cao chất lượng ảnh tài liệu kém chất lượng”
2 Đối tượng và phạm vi nghiên cứu
Luận văn tập trung khảo sát các đối tượng liên quan đến các phép toán hình thái:
- Lý thuyết cơ bản về xử lý ảnh;
- Các phép toán hình thái
- Tính chất nội suy của phép toán hình thái
3 Hướng nghiên cứu của đề tài
- Nghiên cứu lý thuyết liên quan đến đề tài: Quá trình xử lý ảnh, các vấn đề cơ bản trong xử lý ảnh, phép toán hình thái, tính chất nội suy của phép toán hình thái
- Cài đặt thử nghiệm phép toán hình thái học ứng dụng cho ảnh tài liệu kém chất lượng
Trang 94 Cấu trúc của luận văn và những nội dung nghiên cứu chính
Cấu trúc của luận văn gồm:
Nội dung chính của luận văn:
Chương 1: Tổng quan về xử lý ảnh và phép toán hình thái: Tại chương này tác giả nghiêm cứu về khái niệm xử lý ảnh, quá trình xử lý ảnh và các khái niệm về phép toán hình thái Morphology
Chương 2: Một số tính chất nội suy của phép toán hình thái học: Chương này tác giả sẽ trình bày các phép toán hình thái học trên ảnh xám, ảnh màu và các tính chất nội suy của phép toán hình thái học Tiếp theo đó sẽ trình bày các phép lọc hình thái học cho ảnh OCR
Chương 3: Chương trình thử nghiệm phép lọc hình thái học ứng dụng cho ảnh tài liệu kém chất lượng: Chương này trình bày sơ đồ chương trình, thử nghiệm phép lọc hình thái và đánh giá MSE cũng như đánh giá PSNR
5 Phương pháp nghiên cứu
Trong luận văn học viên sử dụng các phương pháp nghiên cứu chính sau:
- Nghiên cứu lý thuyết: Tổng hợp tài liệu, hệ thống lại các kiến thức, tìm hiểu các khái niệm, thuật toán sử dụng trong đề tài
- Lấy ý kiến chuyên gia
- Lập trình thử nghiệm
Trang 10CHƯƠNG 1 TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ PHÉP TOÁN HÌNH THÁI
Chương này trình bày về khái niệm xử lý ảnh, quá trình xử lý ảnh và các
khái niệm về phép toán hình thái Morphology
1.1 Xử lý ảnh
Con người thu nhận thông tin qua các giác quan, trong đó thị giác đóng vai trò quan trọng nhất Những năm trở lại đây với sự phát triển của phần cứng máy tính, xử lý ảnh và đồ hoạ đã phát triển một cách mạnh mẽ và có nhiều ứng dụng trong cuộc sống Xử lý ảnh và đồ hoạ đóng một vai trò quan trọng trong tương tác người máy Quá trình xử lý ảnh được xem như là quá trình thao tác ảnh đầu vào nhằm cho ra kết quả mong muốn Kết quả đầu ra của một quá trình
xử lý ảnh có thể là một ảnh “tốt hơn” hoặc một kết luận nào đó
Cũng như xử lý dữ liệu bằng đồ hoạ, xử lý ảnh số là một lĩnh vực của tin học ứng dụng Xử lý dữ liệu bằng đồ họa đề cập đến những ảnh nhân tạo, các ảnh này được xem xét như là một cấu trúc dữ liệu và được tạo ra bởi các chương trình Xử lý ảnh số bao gồm các phương pháp và kĩ thuật để biến đổi, để truyền tải hoặc mã hóa các ảnh tự nhiên Mục đích của xử lý ảnh gồm:
Trang 111.2 Quá trình xử lý ảnh
Ảnh có thể xem là tập hợp các điểm ảnh và mỗi điểm ảnh được xem như
là đặc trưng cường độ sáng hay một dấu hiệu nào đó tại một vị trí nào đó của đối tượng trong không gian và nó có thể xem như một hàm n biến P(c1, c2, , cn) Do đó, ảnh trong xử lý ảnh có thể xem như ảnh n chiều
Sơ đồ tổng quát của một hệ thống xử lý ảnh:
Hình 1.1 Sơ đồ quá trình xử lý ảnh 1.3 Các vấn đề cơ bản trong xử lý ảnh
1.3.1 Một số khái niệm cơ bản
Điểm ảnh (pixel – viết tắt là px) là đơn vị nhỏ nhất tạo nên hình ảnh, thường mang một màu duy nhất (kết quả của sự pha trộn các màu cơ bản giữa các kênh màu) Để thông số điểm ảnh có ý nghĩa, người ta phải qui về một đơn
vị kích thước nhất định, như inch hay cm/mm để tính và điểm ảnh thường được diễn đạt theo số lượng điểm trên một inch/cm chiều dài
Các điểm ảnh được tạo thành từ sự tổ hợp 3 màu chính R (red), G (green),
B (blue) Cùng một giá trị có thể hiển thị khác nhau trên các thiết bị khác nhau Màu 16 bit: mỗi màu được mã hóa bằng 5bit hay thêm một bit còn lại cho mau xanh lá cây
Màu 24 bit: mỗi kênh màu được mã hóa bằng 1 byte (8 bit) có giá trị nằm trong đoạn [0-255] mã hóa được 255 * 255 * 255 = 16,581,375 màu hay gọi là
Hệ quyết định
Đổi sánh rút
ra kết luận
Lưu trữ
Trang 12Màu 32 bit: tương tự như màu 24 bit, nhưng ở đây có 8 bit dư không sử dụng (ngoại trừ khả năng sử dụng như kênh alpha) Có vận tốc cao hơn mà phần lớn các phần cứng ngày nay có thể truy cập theo các địa chỉ byte của cấp
số 2
Màu 48 bit: tương tự màu 16 bit nhưng mỗi thành phần được mã hóa bởi
16 bit màu, điều này làm cho mỗi màu có khả năng biểu thị 65.535 sắc thái thay
vì chỉ có 255 Được sử dụng trong chỉnh sửa ảnh chuyên nghiệp do có độ chính xác cao hơn
Màu RGBA: với việc xuất hiện nhu cầu ghép ảnh, việc thêm vào 8 bit dư cho độ trong suốt tạo thành màu 32 bit với một kênh mới là Alpha, biểu diễn
độ trong suốt của điểm ảnh
Ảnh xám hay còn gọi là ảnh đơn sắc (monochromatic) Mức xám của ảnh
là kết quả của sự biến đổi tương ứng 1 giá trị độ sáng của 1 điểm ảnh với 1 giá trị nguyên dương Thông thường nó xác định trong [0, 255] tuỳ thuộc vào giá trị mà mỗi điểm ảnh được biểu diễn Các thang giá trị mức xám thông thường:
16, 32, 64, 128, 256 (mức 256 là mức phổ dụng)
Ảnh nhị phân là ảnh số, trong đó mỗi điểm ảnh được biểu diễn bởi giá trị
là 0 (trắng) hoặc 1 (đen) Ảnh nhị phân được tạo ra bằng cách biến đổi ảnh xám dựa vào một ngưỡng xác định
1.3.2 Nắn chỉnh biến dạng
Ảnh thu nhận thường bị biến dạng do các thiết bị quang học và điện tử
Hình 1.2 Ảnh thu nhận và ảnh mong muốn
Để khắc phục người ta sử dụng các phép chiếu, các phép chiếu thường được xây dựng trên tập các điểm điều khiển
Trang 13Giả sử (Pi, Pi’) i = 1, , n: có n các tập điều khiển
Tìm hàm f: Pi f (Pi) sao cho
∑ |𝑓(𝑃𝑖) − 𝑃𝑖′|2
𝑛
𝑖=1
→ 𝑚𝑖𝑛
Giả sử ảnh i bị biến đổi thông qua các phép biến đổi: Tịnh tiến, quay, tỷ
lệ, biến dạng bậc nhất tuyến tính Khi đó hàm f có dạng:
f (x, y) = (a1x + b1y + c1, a2x + b2y + c2)
Giải hệ phương trình tuyến tính tìm được a1, b1, c1
Tương tự tìm được a2, b2, c2
Từ đó, ta xác định được hàm f
1.3.3 Khử nhiễu
Có 2 loại nhiễu cơ bản trong quá trình thu nhận ảnh
• Nhiều hệ thống: là nhiễu có quy luật có thể khử bằng các phép biến đổi
• Nhiễu ngẫu nhiên: vết bẩn không rõ nguyên nhân, có thể khắc phục bằng các phép lọc
Trang 14• Tăng số mức xám: Thực hiện nội suy ra các mức xám trung gian bằng
kỹ thuật nội suy Kỹ thuật này nhằm tăng cường độ mịn cho ảnh
Đặc điểm biên và đường biên: Là đặc trưng cho đường biên của đối tượng và do vậy rất hữu ích trong việc trích trọn các thuộc tính bất biến được dùng khi nhận dạng đối tượng Các đặc điểm này có thể được trích chọn nhờ toán tử gradient, toán tử la bàn, toán tử Laplace, toán tử “chéo không” (zero crossing) v.v
Việc trích chọn hiệu quả các đặc điểm giúp cho việc nhận dạng các đối tượng ảnh chính xác, với tốc độ tính toán cao và dung lượng nhớ lưu trữ giảm xuống
Trang 151.3.6 Nhận dạng
Nhận dạng tự động (automatic recognition), mô tả đối tượng, phân loại
và phân nhóm các mẫu là những vấn đề quan trọng trong thị giác máy, được ứng dụng trong nhiều ngành khoa học khác nhau Tuy nhiên, một câu hỏi đặt
ra là: mẫu (pattern) là gì? Watanabe, một trong những người đi đầu trong lĩnh vực này đã định nghĩa: “Ngược lại với hỗn loạn (chaos), mẫu là một thực thể (entity), được xác định một cách mơ hồ (vaguely defined) và có thể gán cho nó một tên gọi nào đó” Ví dụ mẫu có thể là ảnh của vân tay, ảnh của một vật nào
đó được chụp, một chữ viết, khuôn mặt người hoặc một ký đồ tín hiệu tiếng nói Khi biết một mẫu nào đó, để nhận dạng hoặc phân loại mẫu đó có thể: Hoặc phân loại có mẫu (supervised classification), chẳng hạn phân tích phân biệt (discriminant analyis), trong đó mẫu đầu vào được định danh như một thành phần của một lớp đã xác định
Hoặc phân loại không có mẫu (unsupervised classification hay clustering) trong đó các mẫu được gán vào các lớp khác nhau dựa trên một tiêu chuẩn đồng dạng nào đó Các lớp này cho đến thời điểm phân loại vẫn chưa biết hay chưa được định danh Hệ thống nhận dạng tự động bao gồm ba khâu tương ứng với
ba giai đoạn chủ yếu sau đây:
1 Thu nhận dữ liệu và tiền xử lý
2 Biểu diễn dữ liệu
3 Nhận dạng, ra quyết định
Bốn cách tiếp cận khác nhau trong lý thuyết nhận dạng là:
1 Đối sánh mẫu dựa trên các đặc trưng được trích chọn
2 Phân loại thống kê
3 Đối sánh cấu trúc
4 Phân loại dựa trên mạng nơ-ron nhân tạo
Trong các ứng dụng rõ ràng là không thể chỉ dùng có một cách tiếp cận đơn lẻ để phân loại “tối ưu” do vậy cần sử dụng cùng một lúc nhiều phương
Trang 16pháp và cách tiếp cận khác nhau Do vậy, các phương thức phân loại tổ hợp hay được sử dụng khi nhận dạng và nay đã có những kết quả có triển vọng dựa trên thiết kế các hệ thống lai (hybrid system) bao gồm nhiều mô hình kết hợp Việc giải quyết bài toán nhận dạng trong những ứng dụng mới, nảy sinh trong cuộc sống không chỉ tạo ra những thách thức về thuật giải, mà còn đặt ra những yêu cầu về tốc độ tính toán Đặc điểm chung của tất cả những ứng dụng
đó là những đặc điểm đặc trưng cần thiết thường là nhiều, không thể do chuyên
gia đề xuất, mà phải được trích chọn dựa trên các thủ tục phân tích dữ liệu 1.3.7 Nén ảnh
Nhằm giảm thiểu không gian lưu trữ Thường được tiến hành theo cả hai cách khuynh hướng là nén có bảo toàn và không bảo toàn thông tin Nén không bảo toàn thì thường có khả năng nén cao hơn nhưng khả năng phục hồi thì kém hơn Trên cơ sở hai khuynh hướng, có 4 cách tiếp cận cơ bản trong nén ảnh:
- Nén ảnh thống kê: Kỹ thuật nén này dựa vào việc thống kê tần xuất xuất hiện của giá trị các điểm ảnh, trên cơ sở đó mà có chiến lược mã hóa thích hợp Một ví dụ điển hình cho kỹ thuật mã hóa này là *.TIF
- Nén ảnh không gian: Kỹ thuật này dựa vào vị trí không gian của các điểm ảnh để tiến hành mã hóa Kỹ thuật lợi dụng sự giống nhau của các điểm ảnh trong các vùng gần nhau Ví dụ cho kỹ thuật này là mã nén *.PCX
- Nén ảnh sử dụng phép biến đổi: Đây là kỹ thuật tiếp cận theo hướng nén không bảo toàn và do vậy, kỹ thuật thướng nến hiệu quả hơn *.JPG chính là tiếp cận theo kỹ thuật nén này
- Nén ảnh Fractal: Sử dụng tính chất Fractal của các đối tượng ảnh, thể hiện sự lặp lại của các chi tiết Kỹ thuật nén sẽ tính toán để chỉ cần lưu trữ phần gốc ảnh và quy luật sinh ra ảnh theo nguyên lý Fractal
Trang 171.4 Thu nhận và biểu diễn ảnh
1.4.1 Thu nhận, các thiết bị thu nhận ảnh
Các thiết bị thu nhận ảnh bao gồm camera, scanner các thiết bị thu nhận này có thể cho ảnh đen trắng Các thiết bị thu nhận ảnh có 2 loại chính ứng với
2 loại ảnh thông dụng là Raster và Vector
Các thiết bị thu nhận ảnh thông thường Raster là camera các thiết bị thu nhận ảnh thông thường Vector là sensor hoặc bàn số hoá Digitalizer hoặc được chuyển đổi từ ảnh Raster
Nhìn chung các hệ thống thu nhận ảnh thực hiện quá trình hai bước: Cảm biến: biến đổi năng lượng quang học thành năng lượng điện; Tổng hợp năng lượng điện thành ảnh
1.4.2 Biểu diễn ảnh
Ảnh trên máy tính là kết quả thu nhận theo các phương pháp số hoá được nhúng trong các thiết bị kỹ thuật khác nhau Quá trình lưu trữ ảnh nhằm hai mục đích là tiết kiệm bộ nhớ và giảm thời gian xử lý
Việc lưu trữ thông tin trong bộ nhớ có ảnh hưởng rất lớn đến việc hiển thị, in ấn và xử lý ảnh được xem như là một tập hợp các điểm với cùng kích thước nếu sử dụng càng nhiều điểm ảnh thì bức ảnh càng đẹp, càng mịn và càng thể hiện rõ hơn chi tiết của ảnh người ta gọi đặc điểm này là độ phân giải
Việc lựa chọn độ phân giải thích hợp tuỳ thuộc vào nhu cầu sử dụng và đặc trưng của mỗi ảnh cụ thể, trên cơ sở đó các ảnh thường được biểu diễn theo hai mô hình cơ bản là mô hình Raster và mô hình Vector
1.5 Một số phương pháp nâng cao chất lượng ảnh
Có nhiều phương pháp khác nhau trong nâng cao chất lượng ảnh như:
- Các phương pháp trên điểm: Biến đổi tuyến tính từng đoạn, biến đổi logarithm, biến đổi âm bản Phương pháp này thích hợp cho việc tăng cường các chi tiết của ảnh
Trang 18- Cân bằng, biến đổi biểu đồ Histogram: biểu đồ Histogram của một ảnh
là biểu đồ mô tả sự phân bố của các giá trị mức xám của các điểm ảnh (Pixel) trong một bức ảnh hoặc một vùng ảnh (Region) Dựa vào biều đồ Histogram
có thể biết được hình ảnh sáng tối như thế nào Cân bằng Histogram (Histogram equalization) là phương pháp làm cho biểu đồ Histogram của ảnh được phân
bố một cách đồng đều Đây là một cách giúp nâng cao chất lượng hình ảnh
- Các phép toán trên miền không gian: Lọc nhiễu, bù nghiêng, giảm mờ
Có nhiều thuật toán nâng cao chất lượng ảnh thuộc nhóm này như: Giảm nhiễu (nhiễu Gauss, nhiễu muối tiêu, nhiễu lốm đốm), lọc mờ (thuật toán Lucy-Richardson, thuật toán Blind Deconvolution, lọc Wiener), bù nghiêng (dùng biến đổi Hough, dùng phương pháp láng giềng gần nhất, sử dụng chiếu nghiêng)
Trong đề tài luận văn này, chúng tôi sử dụng các phép toán hình thái trong nâng cao chất lượng ảnh Chi tiết về các kỹ thuật liên quan sẽ được trình bày ở các phần sau
1.6 Các khái niệm về phép toán hình thái Morphology
Hiểu một cách đầy đủ thì ”Morphology” là hình thái và cấu trúc của đối tượng, hay, nó diễn tả những phạm vi và các mối quan hệ giữa các phần của một đối tượng Hình thái học quá quen thuộc trong các lĩnh vực ngôn ngữ học
và sinh học Trong ngôn ngữ học, hình thái học là sự nghiên cứu về cấu trúc của từ, tập hợp từ, câu và đó cũng là một lĩnh vực nghiên cứu từ nhiều năm nay Còn trong sinh học, hình thái học lại chú trọng tới hình dạng của một cá thể hơn, chẳng hạn có thể phân tích hình dạng của một chiếc lá để từ đó có thể nhận dạng được loại cây đó là cây gì; nghiên cứu hình dạng của một nhóm vi khuẩn, dựa trên các đặc điểm nhận dạng để phân biệt chúng thuộc nhóm vi khuẩn nào, v.v Tuỳ theo trường hợp cụ thể mà có một cách phân lớp phù hợp với nó: Có thể phân lớp dựa trên những hình dạng bao quanh như (elip, tròn, ), kiểu và mức độ của những hình dạng bất quy tắc (lồi, lõm, ), những cấu trúc trong (lỗ, đường thẳng, đường cong, ) mà đã được tích luỹ qua nhiều năm quan sát
Trang 19Tính khoa học của Hình thái học số chỉ mới thực sự phát huy khả năng của nó kể từ khi máy tính điện tử số ra đời và đã làm cho Hình thái học trở nên thông dụng, có nhiều tính năng mới Những đối tượng ảnh trong Hình thái học hầu như, ta có thể coi hầu như là tập hợp của các điểm ảnh, nhóm lại theo cấu trúc 2 chiều Những thao tác toán học cụ thể trên tập hợp điểm đó được sử dụng
để làm rõ (tái hiện) những nét đặc trưng của những hình dạng, do vậy mà có thể tính toán được hay nhận biết được chúng một cách dễ dàng
Trang 20CHƯƠNG 2 MỘT SỐ TÍNH CHẤT NỘI SUY CỦA PHÉP TOÁN HÌNH THÁI HỌC
Chương này trình bày về một số tính chất nội suy của phép toán hình thái học trên nhiều cấu trúc ảnh và định dạng ảnh khác nhau, được thực hiện
trong điều kiện không gian khác nhau
2.1 Các phép toán hình thái học
2.1.1 Các phép toán hình thái học trên ảnh nhị phân
* Phép giãn nở trên ảnh nhị phân
Công thức:
𝑨 ⊕ 𝑩 = {𝒄 | 𝒄 = 𝒂 + 𝒃, 𝒂 ∈ 𝑨, 𝒃 ∈ 𝑩 (2.1) Trong đó:
- A: Là ma trận điểm ảnh của ảnh nhị phân
- B: Là phần tử cấu trúc
Phép giãn nở (Dilation) ảnh sẽ cho ra một tập điểm ảnh c thuộc D(i), bạn hoàn toàn dễ dàng thấy rằng đây là một phép tổng giữa A và B A sẽ là tập con của D(i) Chú ý: Nhận xét này không hoàn toàn đúng với trường hợp phần tử cấu trúc B không có gốc (Origin) hay nói cách khác là gốc mang giá trị 0
Trang 21 Ứng với công thức ở trên, ta lần lượt đặt phần tử cấu trúc vào các điểm ảnh có giá trị 1 của ma trận điểm ảnh Isrc Kết quả thu được là ma trận điểm ảnh Idst
Tính toán
Ta có ở ma trận điểm ảnh Isrc = {(1, 2), (2,1), (2, 2), (2, 3), (2, 4), (2, 5), (3, 2), (3, 3), (3, 4), (3, 5), (4, 2), (4, 4), (5, 1), (5, 2), (5, 3), (5, 4), (5, 5)}
Ta có ở ma trận phần tử cấu trúc B = {(0,0), (-1, 0), (0, 1)} với (0,0) là điểm gốc
Áp dụng công thức phép giãn nở ta có: Isrc(0,0) = {(1, 2), (2,1), (2, 2), (2, 3), (2, 4), (2, 5), (3, 2), (3, 3), (3, 4), (3, 5), (4, 2), (4, 4), (5, 1), (5, 2), (5, 3), (5, 4), (5, 5)}
Isrc(-1,0) = {(0, 2), (1,1), (1, 2), (1, 3), (1, 4), (1, 5), (2, 2), (2, 3), (2, 4), (2, 5), (3, 2), (3, 4), (4, 1), (4, 2), (4, 3), (4, 4), (4, 5)}
Isrc(0, 1) = {(1, 3), (2,2), (2, 3), (2, 4), (2, 5), (2, 6), (3, 3), (3, 4), (3, 5), (3, 6), (4, 3), (4, 5), (5, 3), (5, 3), (5, 4), (5, 5), (5, 6)}
Phép giãn nở của Isrc bởi B là hợp của Isrc(0,0), Isrc(-1,0) và Isrc(0,1) hay là Idst Với phần tử cấu trúc không có điểm gốc (Origin), cách tính toán cũng tương tự
Phép co ảnh sẽ cho ra một tập điểm ảnh c thuộc A, nếu bạn đi chuyển phần
tử cấu trúc B theo C, thì B nằm trong đối tượng A E(i) là một tập con của tập
Trang 22ảnh bị co A Chú ý: Nhận xét này không hoàn toàn đúng với trường hợp phần
tử cấu trúc B không có gốc (Origin) hay nói cách khác là gốc mang giá trị 0
Tính toán
Ta có ở ma trận điểm ảnh Isrc = {(1, 2), (2,1), (2, 2), (2, 3), (2, 4), (2, 5), (3, 2), (3, 3), (3, 4), (3, 5), (4, 2), (4, 4), (5, 1), (5, 2), (5, 3), (5, 4), (5, 5)}
Ta có ở ma trận phần tử cấu trúc B = {(0,0), (-1, 0), (0, 1)} với (0,0) là điểm gốc
Ở đây, ta không quan tâm tới toàn bộ các điểm đen (mang giá trị 1) ở Isrc,
ta chỉ quan tâm tới đến những tọa độ của những điểm đen của Isrc khi mà ta di chuyển phần tử cấu trúc trên đối tượng ảnh Isrc thì gốc của B trùng với một điểm ảnh và các điểm lân cận mang giá trị 1 của phần tử cấu trúc B trùng với điểm đen (Mang giá trị 1) của Isrc theo phần tử cấu trúc B Ví dụ ở đây ta có 6 điểm đen (Mang giá trị 1) trên Isrc phù hợp với điều kiện trên: Isrc(2, 2), Isrc(3, 2), Isrc(3, 3), Isrc(3, 4), Isrc(5, 2), Isrc(2, 4)
Isrc(2,1) = Isrc(2,2) = 1 & Isrc(1,1) = 0 Vậy nên Isrc(2,1) không thỏa với cấu trúc phần tử Nên Isrc(2,1) = 0
Isrc(2,2) = Isrc(1,2) = Isrc(2,3) = 1 Vậy nên Isrc(2,2) thỏa với cấu trúc phần
tử B Nên Isrc(3,3) = 1
Trang 23Với phần tử cấu trúc không có điểm gốc (Origin), cách tính toán cũng tương tự
2.1.2 Các phép toán hình thái học trên ảnh xám
* Phép giãn nở trên ảnh đa mức xám
Công thức
𝑫(𝒊) = (𝑨 ⊕ 𝑩)(𝒙, 𝒚) = 𝒎𝒂𝒙(𝑨(𝒙 + 𝒊, 𝒚 + 𝒊) + 𝑩(𝒊, 𝒋)| (𝒊, 𝒋) ∈ 𝑫B ) (2.3) Trong đó
Trong các phép toán hình thái học, một phần tử cấu trúc có kích thước (NxN) được di chuyển khắp ảnh và thực hiện phép tính toán với từng
Trang 24điểm ảnh (Pixel) của ảnh với (N2 -1) điểm ảnh (Pixel) lân cận (Không tính điểm
ở tâm) Phép tính toán ở đây tùy thuộc vào nội dung của phép toán hình thái học mà từ đó cho ra một kết quả phù hợp:
Nếu gốc của phần tử cấu trúc (Ogirin) nằm ở phía bên trái thì ảnh sẽ có
xu hướng co và giãn nở về phía bên phải
Nếu gốc của phần tử cấu trúc (Ogirin) nằm ở phía bên phải thì ảnh sẽ có
xu hướng co và giãn về nở phía bên trái
Vì vậy: Trong các kết quả của phép toán xử lý hình thái học thì yếu tố quan trọng là phần tử cấu trúc
Chú ý: Những nội dung kiến thức trên đây là phần tử cấu trúc dùng trong các phép toán hình thái học trên ảnh nhị phân Với ảnh đa mức xám thì phần tử cấu trúc tương tự nhưng khác ở chỗ là các giá trị phần tử từ 0 đến 255 chứ không phải là chỉ 0 với 1 như phần tử cấu trúc trên ảnh nhị phân
Phép giãn nở trên ảnh nhị phân
Trang 25cấu trúc B không có gốc (Origin) hay nói cách khác là gốc (Origin) mang giá trị 0
Áp dụng công thức phép giãn nở ta có: Isrc(0,0) = {(1, 2), (2,1), (2, 2), (2, 3), (2, 4), (2, 5), (3, 2), (3, 3), (3, 4), (3, 5), (4, 2), (4, 4), (5, 1),(5, 2),
Trang 26*Phép giãn nở trên ảnh đa mức xám
3 Có thể dễ dàng thấy rằng có một số điểm ảnh Isrc trong tính toán ở trên
có giá trị khác nhau Với các điểm ảnh đó, lúc này ta chỉ việc lấy giá trị lớn
Trang 27nhất (Max) mà ta có được Isrc(2,2) = 60, Isrc(2,3) = 80, Isrc(3,2) = 80, Isrc(3,3) =
Trang 28Tính toán trong vùng ô vuông đỏ
Các điểm ảnh có trong ô Isrc (3,1) = 90, Isrc (4,2) = 50, Isrc (5,2) = 60, Isrc (5,3) = 70, Isrc (6,2) = 5, Isrc (5,1) = 10
Trừ (-) các giá trị ở trên cho 10 (Giá trị phần tử trong phần tử cấu trúc)
Trang 292.1.3 Các phép toán hình thái học trên ảnh màu
Dựa trên việc xây dựng toàn bộ thứ tự trong tập hợp các giá trị nhỏ nhất
(màu sắc) bằng cách sử dụng hàm f: R3 → R, vì vậy nó phù hợp với danh mục với thứ tự giảm Như trong các cách tiếp cận trước đây, hình thái màu được
biến đổi theo hình thái mức xám trong tập các giá trị của f nên tất cả các đặc
tính mong muốn được bảo toàn Các phương pháp tiếp cận RO hiện tại nhằm mục đích áp đặt thứ tự tổng thể chỉ dựa trên màu sắc chứ không phải trên hình
Trang 30ảnh vì vậy họ cố gắng thiết lập thứ tự chuẩn cho tập hợp màu Hơn nữa, chúng phụ thuộc vào không gian màu sắc được lựa chọn
Các phần phụ sau đây giải thích từng biến thể của phương pháp được đề xuất là những cải tiến kế tiếp nhằm sửa chữa những nhược điểm của biến thể trước đó Về cơ bản, chúng dựa trên việc sử dụng biểu đồ của hình ảnh được
xử lý để có được thứ tự màu(công thức 2.7), về cách sử dụng phiên bản làm mịn của biểu đồ(công thức 2.8), và cuối cùng là sử dụng biểu đồ tổng hợp thu được từ một lớp các ảnh tương tự(công thức 2.9)
2.1.3.1 Hình thái học dựa trên biểu đồ đồng bằng
Không giống như kết quả trước đây, hàm f ở đây được tính toán cho từng
hình ảnh và được điều chỉnh cho phù hợp với nó Các vấn đề về chi phí tính toán của việc này sẽ được giải quyết bằng cách làm việc trên các nhóm hình ảnh tương tự Vấn đề rõ ràng là làm thế nào để chọn một hàm tốt cho một hình ảnh cho trước [7]
Ý tưởng đến từ hình thái học nhị phân: xói mòn nhằm mục đích làm giảm các đối tượng thay thế các bộ phận
Hình 2.1 Bản đồ a với sự xói mòn b, sự giãn nở c, sự mở rộng d,
và sự đóng lại của e với một đĩa bán kính 3 điểm ảnh
Phương pháp biểu đồ đơn giản của chúng theo nền Điều ngược lại là đúng với sự giãn nở Nhưng thông thường, nền là vùng lớn nhất của hình ảnh
Trang 31Do đó, xác định nền là màu xuất hiện thường xuyên nhất trong một hình ảnh Đây sẽ là cái ít quan trọng hơn và sẽ bị chi phối bởi tất cả những cái khác Nói chung, một hình ảnh có màu càng ít thường xuyên thì càng chiếm ưu thế Điều này tương đương với việc tạo một biểu đồ màu của hình ảnh và gán giá trị cao nhất của màu cho đỉnh nhỏ nhất, giá trị nhỏ hơn cho đỉnh tiếp theo Nếu hai màu có số điểm ảnh như nhau (điều này rất khó xảy ra trong hình ảnh thực), thì một sự lựa chọn ngẫu nhiên được thực hiện Về mặt hình thức, cho c =(c1, c2,
c3) một màu có ba thành phần trong bất kỳ không gian màu nào, mỗi màu trong
số chúng được lượng tử hóa trong khoảng số nguyên Q {0… q - 1}
Màu biểu đồ của I là một hàm của Q × Q × Q → Z được định nghĩa là:
Mỗi ngăn của biểu đồ chỉ chứa một màu; biểu đồ này là một mảng đơn giản không có tham chiếu đến không gian màu được sử dụng Đối với việc gán
lại các giá trị f, thực tế các giá trị được chỉ định trên thực tế không liên quan, vì
các phép toán hình thái chỉ dựa vào thứ tự giữa các giá trị, chứ không phải bản
thân các giá trị Một lựa chọn thích hợp là f I(x) = N – hI(c), trong đó N là số
điểm ảnh trong I và c = I(x) Hàm f là một ảnh được xác định tại bất kỳ điểm
nào trong đó được xác định và các giá trị của nó là số nguyên trong khoảng 0
… N
Khi hình ảnh bổ trợ này đã được tạo với các giá trị thứ tự f- giá trị được
chỉ định đối với mỗi điểm ảnh, hình thái học có thể được thực hiện trên đó như thể đó là một hình ảnh mức xám Cuối cùng, màu sắc là lấy lại từ nhiệm vụ ban
đầu; ở đây không có sự nhập nhằng trong quá trình này vì hàm f là bất thường
Ưu điểm chính của nó là không phụ thuộc vào không gian màu sử dụng để thể hiện hình ảnh Thật vậy, màu sắc được coi là nhãn đơn thuần
Kết quả của phương pháp này có thể xem trong Hình 2.1
Trang 322.1.3.2 Hình thái học dựa trên biểu đồ làm mịn
Tiểu mục trước có một vấn đề rõ ràng: nó có thể hoạt động cực kỳ hiệu quả tốt cho các hình ảnh có ít màu, như bản đồ, được tạo bởi các mảng phẳng lớn giống hệt nhau tông màu nhưng nó sẽ không hoạt động như mong đợi trong hình ảnh thực được tạo thành bằng cách phân loại liên tục tông màu và sắc thái Đối với những hình ảnh này, mỗi màu cụ thể xuất hiện quá thường xuyên do
đó không thích hợp để lấy tần suất của nó làm tiêu chuẩn quan trọng để đánh giá Cái này có thể được coi là một vấn đề thiếu hoặc không đủ mẫu trong hình ảnh 2D để xây dựng một biểu đồ có ý nghĩa trong không gian màu 3D
Giải pháp đầu tiên đề xuất ở đây là coi biểu đồ màu 3D là xác suất mật
độ của sự xuất hiện của các màu trong hình ảnh và làm mịn nó để mỗi màu phát huy ảnh hưởng lên các màu lân cận Bằng cách này, một màu duy nhất xuất hiện dưới nhiều tông màu hoặc hình thái khác nhau sẽ được sắp xếp đối với các màu phức tạp khác theo toàn bộ tầm quan trọng của nó Sau đó, giải quyết vấn
đề này bằng cách thêm nhiều hình ảnh tương tự Theo cách đó có một số lượng mẫu lớn hơn Hạt nhân làm mịn được chọn, giống với Hanbury, một chức năng tương tự Mỗi điểm ảnh của hình ảnh I = {p1….pn} được coi là một diện tích đơn vị trong không gian màu, sẽ được lượng tử hóa như đã nêu trước đây, và
vì vậy nó là một khối lập phương của Q × Q × Q Khả năng được tạo bởi điểm ảnh pi bởi các màu ci = (c1 i, c2i, c3i) bất cứ lúc nào cj = (c1j, c2j, c3j) của không gian màu sẽ là:
𝑉𝑖𝑗 = {
1 𝑛ế𝑢 𝑟𝑖𝑗 = 0,1
𝑟𝑖𝑗𝒹 𝑛ế𝑢 𝑟𝑖𝑗 ≠ 0,
(2.8)
trong đó rij là khoảng cách thích hợp trong không gian màu đã chọn giữa các điểm ci và cj và tham số làm mịn sao cho d ≥ 1, được chọn Trong các thí nghiệm, đã kiểm tra cho hai khoảng cách trong mỗi không gian màu: Euclidean
và Mahalanobis Lưu ý rằng, kể từ không gian màu Q × Q × Q được lượng tử