Các thao tác hình thái học trên ảnh cung cấp cho chúng ta những mô tả định lượng về cấu trúc và hình dạng hình học của các đối tượng trong ảnh và nó đang được ứng dụng rộng rãi trong việ
Trang 1LƯU THỊ LIỄU
NGHIÊN CỨU PHÉP TOÁN HÌNH THÁI TRONG XỬ LÝ ẢNH VÀ ỨNG
DỤNG NÂNG CAO CHẤT LƯỢNG ẢNH NHỊ PHÂN
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
Hà Nội – Năm 2015
Trang 2LƯU THỊ LIỄU
NGHIÊN CỨU PHÉP TOÁN HÌNH THÁI TRONG XỬ LÝ ẢNH VÀ ỨNG
DỤNG NÂNG CAO CHẤT LƯỢNG ẢNH NHỊ PHÂN
Ngành: Công nghệ thông tin
Chuyên ngành: Truyền dữ liệu và mạng máy tính
Mã số: Chuyên ngành đào tạo thí điểm
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS NGÔ QUỐC TẠO
Hà Nội – Năm 2015
Trang 3Tác giả xin cam đoan những kết quả nghiên cứu được trình bày trong luận văn là hoàn toàn trung thực của tác giả, không vi phạm bất cứ điều gì trong luật sở hữu trí tuệ
và pháp luật Việt Nam Nếu sai, tác giả hoàn toàn chịu trách nhiệm trước pháp luật
Người cam đoan
Lưu Thị Liễu
Trang 4Qua đây tác giả cũng xin gửi lời cảm ơn đến những người thân trong gia đình, bạn bè, đồng nghiệp đã động viên và tạo mọi điều kiện giúp tác giả trong quá trình học tập cũng như trong cuộc sống
Trang 5MỤC LỤC
LỜI CAM ĐOAN 0
LỜI CẢM ƠN 1
MỤC LỤC 2
DANH MỤC CÁC HÌNH VẼ 4
LỜI MỞ ĐẦU 5
CHƯƠNG 1 6
TỔNG QUAN VỀ PHƯƠNG PHÁP NÂNG CAO CHẤT LƯỢNG ẢNH 6
1.1 Giới thiệu chung về xử lý ảnh………6
1.2 Một số vấn đề trong xử lý ảnh……….8
1.2.1 Điểm ảnh (Picture Element) 8
1.2.2 Độ phân giải của ảnh 9
1.2.3 Mức xám của ảnh 9
1.2.4 Quan hệ giữa các điểm ảnh 9
1.2.5 Lược đồ mức xám (Histogram) 10
1.2.6 Biểu diễn ảnh 11
1.2.7 Biến đổi ảnh (Image Transform) 12
1.2.8 Tăng cường ảnh – khôi phục ảnh 12
1.2.9 Nhận dạng ảnh 13
1.2.10 Các loại định dạng tập tin ảnh cơ bản 14
1.2.11 Hiệu chỉnh gamma 15
1.2.12 Phân vùng ảnh 15
1.3 Nâng cao chất lượng ảnh sử dụng các toán tử điểm……… 15
1.3.1 Điều chỉnh độ tương phản 15
1.3.2.Phân ngưỡng nhị phân 16
1.3.3 Biến đổi âm bản 16
1.3.4 Hiệu chỉnh ánh sáng trong ảnh 17
1.3.5 Đổi ảnh RGB sang ảnh grayscale 17
1.4 Nâng cao chất lượng ảnh dùng toán tử không gian……… 19
CHƯƠNG 2 20
PHÉP TOÁN HÌNH THÁI TRONG XỬ LÝ ẢNH 20
2.1 Giới thiệu……… 20
2.2 Phần tử cấu trúc……… 20
2.3 Các phép toán với ảnh nhị phân……….22
2.3.1 Phép giãn nhị phân (Dilation) 22
2.3.2 Phép co nhị phân (Erosion) 26
2.3.3 Phép mở ảnh (Opening) và phép đóng ảnh (Closing)……….29
2.3.3.1 Phép mở ảnh 29
2.3.3.2 Phép đóng ảnh 30
2.4 Các thao tác trên ảnh xám 31 2.4.1 Phép co 31
2.4.2 Phép dãn 32
Trang 62.5 Phép toán hình thái Gradient (Morphology Gradient Operator)………33
2.6 Một số tính chất của phép toán hình thái……… 35
2.7 Một số thuật toán dựa trên phép toán hình thái………35
2.7.1 Trích biên ( Boundary Extraction) 35
2.7.2 Làm đầy (Region Filling) 37
2.7.3 Làm mảnh(Thinning) 38
2.7.4 Làm dày đối tượng trong ảnh – Thickening 41
2.7.5 Tìm khung xương (Skeletonization) 41
CHƯƠNG 3 43
ỨNG DỤNG NÂNG CAO CHẤT LƯỢNG ẢNH VĂN BẢN 43
3.1 Đặt vấn đề………43
3.2 Khắc phục sự đứt nét cho các tài liệu scan đen –trắng……….44
3.3 Khắc phục ảnh văn bản không rõ nét………46
3.4 Giới thiệu chương trình……… 46
3.5 Thực nghiệm……….48
3.6 Đánh giá………50
KẾT LUẬN……….55
TÀI LIỆU THAM KHẢO 54
PHỤ LỤC……… 57
Trang 7DANH MỤC CÁC HÌNH VẼ
Hình 1.1 Các bước cơ bản trong một hệ thống xử lý ảnh 7
Hình 1.2 Biểu đồ Histogram của ảnh 11
Hình 1.3 Hệ tọa độ RGB 18
hình 1.4 Chuyển ảnh màu rgb sang ảnh gray 19
Hình 2.1 Một số hình dáng của phần tử cấu trúc phẳng 21
Hình 2.2 Hiệu quả của thao tác nhị phân đơn giản trên một ảnh nhỏ 22
Hình 2.3 Dãn A bởi B 23
Hình 2.4 Quá trình quét của phần tử cấu trúc trên hình ảnh nhị phân 24
Hình 2.5 Ví dụ quá trình thực hiện của phép mở ảnh 24
Hình 2.6 Quá trình thực hiện phép co nhị phân dùng phần tử cấu trúc đơn giản 27
Hình 2.7 Quá trình lọc đối tượng sử dụng phép co nhị phân và phép giãn nhị phân 28
Hình 2.8 Ứng dụng của phép co ảnh dưới dạng số nhị phân 28
Hình 2.9 Quá trình thực hiệp phép mở ảnh 29
Hình 2.10 Quá trình thực hiện phép đóng ảnh 31
Hình 2.11 Ví dụ về phép toán co ảnh trên ảnh xám với phần tử cấu trúc không phẳng 31
Hình 2.12 Ví dụ về phép toán dãn ảnh trên ảnh xám với phần tử cấu trúc không phẳng 32
Hình 2.13 Ví dụ quá trình thực hiện phép dãn ảnh xám 33
Hình 2.14 Ví dụ về phép toán hình thái Gradient 34
Hình 2.15 Quá trình tìm biên của đối tượng trên ảnh nhị phân 36
Hình 2.16 Ví dụ trích lọc biên của đối tượng 36
Hình 2.17 Quá trình làm đầy đối tượng trong ảnh 38
Hình 2.18 Kết quả làm mỏng đối tượng 39
Hình 2.19 Quá trình làm mảnh đối tượng trong hình ảnh 40
Hình 2.20 Kết quả làm dày đối tượng 41
Hình 2.21 Quá trình thực hiện thuật toán tìm xương 42
Hình 2.22 Ví dụ ảnh tìm xương của các đối tượng 42
Hình 3.1 Hình ảnh văn bản bị xuống cấp……… 43
Hình 3.2 Văn bản bị đứt nét theo chiêu ngang 44
Hình 3.3 Văn bản bị đứt nét theo chiều dọc 44
Hình 3.4 Ví dụ phần tử cấu trúc sẽ giúp giãn chữ theo chiều ngang 45
Hình 3.5 Ví dụ phần tử cấu trúc sẽ giúp giãn chữ theo chiều dọc 45
Trang 8LỜI MỞ ĐẦU Hình ảnh là một dạng dữ liệu đóng vai trò quan trọng trong việc trao đổi, xử
lý, lưu giữ thông tin Hiện nay nhu cầu lưu trữ và xử lý các tài liệu, văn bản, bản vẽ
kỹ thuật,… dưới dạng hình ảnh scan là nhu cầu thiết yếu Tuy nhiên, các hình ảnh scan thu được bởi nhiều lý do có thể bị nhiễu, mờ nhòe, đứt nét… khiến việc thu nhận thông tin và xử lý gặp nhiều khó khăn Vì vậy việc khắc phục những nhược điểm của hình ảnh thu nhận được là việc làm rất cần thiết và quan trọng Đã có rất nhiều các kỹ thuật được đưa ra, trong đó có xử lý hình thái học trên ảnh Các thao tác hình thái học trên ảnh cung cấp cho chúng ta những mô tả định lượng về cấu trúc và hình dạng hình học của các đối tượng trong ảnh và nó đang được ứng dụng rộng rãi trong việc nâng cao chất lượng ảnh, phân đoạn ảnh, kiểm tra khuyết điểm trên ảnh,…
Trong luận văn này tác giả sẽ nghiên cứu về các phép toán hình thái học trên ảnh và ứng dụng vào việc nâng cao chất lượng ảnh scan đen – trắng của các văn bản
Báo cáo luận văn được chia làm 3 chương:
Chương 1 Tổng quan về phương pháp nâng cao chất lượng ảnh: Chương này gồm có các khái niệm ban đầu về xử lý ảnh, các kỹ thuật nâng cao chất lượng ảnh
Chương 2 Phép toán hình thái học trên ảnh: Chương này trình bày các phép co – giãn-đóng – mở ảnh trên ảnh nhị phân, ảnh đa cấp xám và các thuật toán ứng dụng dựa trên các phép toán hình thái
Chương 3 Ứng dụng nâng cao chất lượng ảnh văn bản: Chương này trình bày các kỹ thuật được sử dụng trong việc nâng cao chất lượng ảnh scan đen – trắng của văn bản kém chất lượng (phép đóng ảnh, hiệu chỉnh gamma, phân ngưỡng nhị phân), đồng thời tiến hành cài đặt các phép toán hình thái học, cài đặt chức năng nâng cao chất lượng ảnh văn bản scan đen – trắng; trình bày những hình ảnh thực nghiệm của chương trình
Trang 9CHƯƠNG 1 TỔNG QUAN VỀ PHƯƠNG PHÁP NÂNG CAO CHẤT LƯỢNG ẢNH
1.1 Giới thiệu chung về xử lý ảnh
Cũng như xử lý dữ liệu bằng đồ hoạ, xử lý ảnh là một lĩnh vực của tin học ứng dụng Xử lý dữ liệu bằng đồ họa đề cập đến những ảnh nhân tạo, các ảnh này được xem xét như là một cấu trúc dữ liệu và được tạo ra bởi các chương trình Xử
lý ảnh bao gồm các phương pháp và kỹ thuật để biến đổi, để truyền tải hoặc mã hóa các ảnh tự nhiên Mục đích của xử lý ảnh gồm:
- Mô tả tham số (nhận dạng theo tham số)
- Mô tả theo cấu trúc(nhận dạng theo cấu trúc)
Nhận biết và đánh giá các nội dung của ảnh là sự phân tích một hình ảnh thành những phần có nghĩa để phân biệt đối tượng này với đối tượng khác Dựa vào đó ta
có thể mô tả cấu trúc của hình ảnh ban đầu
Có thể liệt kê một số phương pháp nhận dạng cơ bản như nhận dạng biên của một đối tượng trên ảnh, tách cạnh, phân đoạn hình ảnh Kỹ thuật này được sử dụng nhiều trong y học (xử lý tế bào, nhiễm sắc thể)
Trong thực tế người ta đã áp dụng kỹ thuật nhận dạng khá thành công với nhiều đối tượng khác nhau như: nhận dạng ảnh vân tay, nhận dạng chữ (chữ cái, chữ số, chữ có dấu) Nhận dạng chữ in hoặc đánh máy trong văn bản phục vụ cho việc tự động hoá quá trình đọc tài liệu, tăng nhanh tốc độ và chất lượng thu nhận thông tin từ máy tính, nhận dạng chữ viết tay (với mức độ ràng buộc khác nhau về cách viết, kiểu chữ, )
Các quá trình của xử lý ảnh được tiến hành theo sơ đồ sau:
Trang 10Hình 1.1 Các bước cơ bản trong một hệ thống xử lý ảnh
(theo tài liệu [2])
Sơ đồ này bao gồm các thành phần sau:
a) Phần thu nhận ảnh (Image Acquisition)
Ảnh có thể thu nhận qua camera Thường ảnh thu nhận qua camera là tín hiệu tương tự (loại camera ống kiểu CCIR), nhưng cũng có thể là tín hiệu số hoá (loại CCD - Charge Coupled Device) Ảnh cũng có thể thu nhận từ vệ tinh qua các bộ cảm ứng (sensor), hay ảnh được quét qua scanner Tiếp theo là quá trình số hóa (Digitalizer) để biến đổi tín hiệu tương tự sang tín hiệu rời rạc (lấy mẫu) và số hóa bằng lượng hóa, trước khi chuyển sang giai đoạn xử lý, phân tích hay lưu trữ lại b) Tiền xử lý (Image Processing)
Do những nguyên nhân khác nhau có thể do thiết bị thu nhận ảnh, do nguồn sáng hay do nhiễu, ảnh có thể có độ tương phản thấp, có thể bị suy biến Do vậy Chức năng chính của bộ tiền xử lý là lọc nhiễu, nâng độ tương phản, tăng cường và khôi phục lại ảnh để làm nổi bật một số đặc tính chính của ảnh, hay làm cho ảnh gần giống với trạng thái gốc- trạng thái trước khi ảnh bị biến dạng
c) Phân đoạn (Segmentation) hay phân vùng ảnh
Phân vùng ảnh là tách một ảnh đầu vào thành các vùng thành phần để biểu diễn phân tích, nhận dạng ảnh trên từng vùng
d) Biểu diễn và mô tả
Tìm các vùng đặc trưng điểm ảnh như biên ảnh (Boundary), vùng ảnh (Region),….và biểu diễn lại thông qua các điểm ảnh đặc trưng
e) Nhận dạng và nội suy ảnh (Image Recognition and Interpretation)
Trang 11Nhận dạng ảnh là quá trình xác định ảnh Quá trình này thường thu được bằng cách so sánh với mẫu chuẩn đã được học (hoặc lưu) từ trước Nội suy là phán đoán theo ý nghĩa trên cơ sở nhận dạng Ví dụ: một loạt chữ số và nét gạch ngang trên phong bì thư có thể được nội suy thành mã điện thoại Có nhiều cách phân loai ảnh khác nhau về ảnh Theo lý thuyết về nhận dạng, các mô hình toán học về ảnh được phân theo hai loại nhận dạng ảnh cơ bản:
- Nhận dạng theo tham số
- Nhận dạng theo cấu trúc
Một số đối tượng nhận dạng khá phổ biến hiện nay đang được áp dụng trong khoa học và công nghệ là: nhận dạng ký tự (chữ in, chữ viết tay, chữ ký điện tử), nhận dạng văn bản (Text), nhận dạng vân tay, nhận dạng mã vạch, nhận dạng mặt người…
f) Cơ sở tri thức (Knowledge Base)
Tiếp nhận và xử lý theo phương pháp trí tuệ con người
1.2 Một số vấn đề trong xử lý ảnh
1.2.1 Điểm ảnh (Picture Element)
Ảnh trong thực tế là một ảnh liên tục về không gian và về giá trị độ sáng Để có thể
xử lý ảnh bằng máy tính cần thiết phải tiến hành số hóa ảnh Số hoá ảnh là sự biến đổi gần đúng một ảnh liên tục thành một tập điểm phù hợp với ảnh thật về vị trí (không gian) và độ sáng (mức xám) Khoảng cách giữa các điểm ảnh đó được thiết lập sao cho mắt người không phân biệt được ranh giới giữa chúng Mỗi một điểm như vậy gọi là điểm ảnh (PEL: Picture Element) hay gọi tắt là Pixel Trong khuôn khổ ảnh hai chiều, mỗi pixel ứng với cặp tọa độ (x, y)
Định nghĩa: Điểm ảnh (Pixel) là một phần tử của ảnh số tại toạ độ (x, y) với độ xám hoặc màu nhất định Kích thước và khoảng cách giữa các điểm ảnh đó được chọn thích hợp sao cho mắt người cảm nhận sự liên tục về không gian và mức xám (hoặc màu) của ảnh số gần như ảnh thật Mỗi phần tử trong ma trận được gọi là một phần tử ảnh
Ảnh được xem như là một tập hợp các điểm ảnh Khi được số hóa, nó thường được biểu diễn bởi mảng 2 chiều (ví dụ ảnh I(mxn): m dòng và n cột và có m*n điểm ảnh) Một điểm ảnh có thể được biểu diễn bằng 1, 4, 8, 24 bits
Trang 121.2.2 Độ phân giải của ảnh
Định nghĩa: Độ phân giải (Resolution) của ảnh là mật độ điểm ảnh được ấn định trên một ảnh số được hiển thị
Theo định nghĩa, khoảng cách giữa các điểm ảnh phải được chọn sao cho mắt người vẫn thấy được sự liên tục của ảnh Việc lựa chọn khoảng cách thích hợp tạo nên một mật độ phân bổ, đó chính là độ phân giải và được phân bố theo trục x và y trong không gian hai chiều
Ví dụ: Độ phân giải của ảnh trên màn hình CGA (Color Graphic Adaptor) là một lưới điểm theo chiều ngang màn hình: 320 điểm chiều dọc * 200 điểm ảnh (320*200) Rõ ràng, cùng màn hình CGA 12” ta nhận thấy mịn hơn màn hình CGA 17” độ phân giải 320*200 Lý do: cùng một mật độ (độ phân giải) nhưng diện tích màn hình rộng hơn thì độ mịn (liên tục của các điểm) kém hơn
1.2.3 Mức xám của ảnh
Một điểm ảnh (pixel) có hai đặc trưng cơ bản là vị trí (x, y) của điểm ảnh và độ xám của nó Dưới đây chúng ta xem xét một số khái niệm và thuật ngữ thường dùng trong xử lý ảnh
a) Định nghĩa: Mức xám của điểm ảnh là cường độ sáng của nó được gán bằng giá trị số tại điểm đó
b) Các thang giá trị mức xám thông thường: 16, 32, 64, 128, 256 (Mức 256 là mức phổ dụng Lý do: từ kỹ thuật máy tính dùng 1 byte (8 bit) để biểu diễn mức xám: Mức xám dùng 1byte biểu diễn: 28=256 mức, tức là từ 0 đến 255)
c) Ảnh xám: là ảnh mà các điểm ảnh có mức xám nằm trong khoảng từ 0 đến 255 d) Ảnh nhị phân: ảnh chỉ có 2 mức đen trắng phân biệt tức dùng 1 bit mô tả 21 mức khác nhau Mỗi điểm ảnh của ảnh nhị phân chỉ có thể là 0 hoặc 1
e) Ảnh màu: ảnh tổ hợp từ ba màu cơ bản (Red, Blue, Green) để tạo nên thế giới màu, người ta thường dùng 3 byte để mô tả mức màu, khi đó các giá trị màu:
28*3=224≈ 16,7 triệu màu
1.2.4 Quan hệ giữa các điểm ảnh
Lân cận của điểm ảnh
Giả sử có điểm ảnh p tại tọa độ (x, y), p có các lân cận gần nhất theo chiều ngang và dọc là: (x+1,y), (x-1,y), (x,y+1), (x,y-1) Tập hợp các điểm ảnh này được
Trang 13gọi là lân cận 4 của p, ký hiệu N4(p) Mỗi điểm ảnh có khoảng cách đơn vị đến (x,y), và nếu (x,y) nằm trên biên của ảnh thì lân cận của nó có thể nằm ngoài ảnh
Các lân cận chéo của p có tọa độ: (x+1,y+1), (x+1,y-1), (x-1,y+1), (x-1,y-1) Tập lân cận chéo được ký hiệu NP(p)
Tập lân cận chéo cùng với lân cận 4 tạo thành lân cận 8 của p, ký hiệu N8(p)
(x-1, y-1) (x, y-1) (x+1, y-1) (x-1, y) (x, y) (x+1, y) (x-1, y+1) (x, y+1) (x+1, y+1)
Hình 1.6 Lân cận các điểm ảnh của tọa độ (x, y) Các mối liên kết điểm ảnh
Để xác định tính liên thông của hai điểm ảnh, thì chúng cần thỏa mãn rằng: chúng phải là các lân cận và các cấp xám phải thỏa mãn tiêu chuẩn đề ra về tính tương tự Ví dụ, trong ảnh nhị phân với các giá trị là 0 và 1, hai điểm ảnh có thể là 4-lân-cận, nhưng chúng chỉ được gọi là liên thông nếu và chỉ nếu chúng có các giá trị bằng nhau
Các mối liên kết được sử dụng để xác định giới hạn của đối tượng vật thể hoặc xác định vùng trong một ảnh Một liên kết được đặc trưng bởi tính liền kề giữa các điểm và mức xám của chúng
Cho V là một tập các giá trị cấp xám dùng để xác định tính liền kề trong ảnh Chúng ta có ba loại liền kề sau:
a) Liên kết 4: hai điểm ảnh p và q với giá trị từ V là liên kết 4 nếu q thuộc tập N4(p)
b) Liên kết 8: hai điểm ảnh p và q với giá trị từ V là liên kết 8 nếu q thuộc tập N8(p)
c) Liên kết m(liên kết hỗn hợp): hai điểm p và q với giá trị từ V là liên kết m nếu thỏa mãn một trong hai điều kiện sau:
(i) q thuộc N4(p) hoặc
lệ số điểm ảnh có cùng mức xám trên tổng số điểm ảnh
Trang 14Lược đồ xám cung cấp rất nhiều thông tin về phân bố mức xám của ảnh Cho phép phân tích trong khoảng nào đó phân bố phần lớn các mức xám của ảnh: Ảnh rất sáng hay ảnh rất đậm
Nếu ảnh sáng thì lược đồ xám nằm bên phải (mức xám cao)
Nếu ảnh đậm thì lược đồ xám nằm bên trái (mức xám thấp)
Hình 1.2 Biểu đồ Histogram của ảnh
Mô hình vectơ: Biểu diễn ảnh ngoài mục đích tiết kiệm không gian lưu trữ, dễ dàng cho hiển thị và in ấn, còn phải đảm bảo dễ dàng trong lựa chọn, sao chép, di chuyển, tìm kiếm,…theo những yêu cầu này, kỹ thuật biểu diễn Vector tỏ ra ưu việt hơn Trong mô hình Vector người ra sử dụng hướng giữa các Vector của điểm ảnh lân cận để mã hóa và tái tạo hình ảnh ban đầu Ảnh Vector được thu nhận trực tiếp
từ các thiết bị số hóa như Digital hoặc được chuyển đổi từ ảnh Raster thông qua các chương trình số hóa Công nghệ phần cứng cung cấp những thiết bị xử lý với tốc độ
Trang 15
nhanh và chất lượng cao cho cả đầu vào và ra, nhưng lại chỉ hỗ trợ cho ảnh Raster
Do vậy, những nghiên cứu về biểu diễn Vector đều tập trung chuyển đổi từ ảnh Raster
1.2.7 Biến đổi ảnh (Image Transform)
Thuật ngữ biến đổi ảnh thường dùng để nói tới một lớp các ma trận đơn vị và các kĩ thuật dùng để biến đổi ảnh Biến đổi ảnh nhằm làm giảm các nguyên nhân của ảnh để việc xử lý hiệu quả hơn Như làm rõ hơn các thông tin mà ngời dùng quan tâm nhưng người dùng phải chấp nhận mất đi một số thông tin cần thiết
1.2.8 Nâng cao chất lượng– khôi phục ảnh
Tăng cường ảnh là một bước quan trọng, tạo tiền đề cho xử lý ảnh Nó gồm các kỹ thuật như: lọc độ tương phản, khử nhiễu, nổi màu… Khôi phục ảnh là nhằm loại bỏ các suy giảm trong ảnh
Nâng cao chất lượng ảnh:
Đây là một bước quan trọng, tạo tiền đề cho xử lý ảnh Mục đích chính nhằm làm nổi bật một số đặc tính của ảnh như thay đổi độ tương phản, lọc nhiễu, nổi biên, làm trơn biên, khuếch đại ảnh … nhằm phục vụ cho việc hiển thị hoặc các quá trình phân tích tiếp theo Tùy theo các ứng dụng khác nhau mà chúng ta có các kỹ thuật nâng cao chất lượng ảnh khác nhau
Nâng cao chất lượng ảnh có quan hệ gần gũi với khôi phục ảnh Khi một ảnh
bị nhiễu thì khôi phục ảnh gốc thường đưa đến nâng cao chất lượng ảnh Có một số khác biệt giữa khôi phục ảnh và nâng cao chất lượng ảnh Trong khôi phục ảnh, một ảnh gốc bị nhiễu thì mục tiêu là làm sao cho ảnh sau khi xử lý càng gần giống ảnh gốc càng tốt Còn trong nâng cao chất lượng ảnh thì mục tiêu là làm cho ảnh sau khi
xử lý có được chất lượng tốt hơn khi chưa xử lý Như vậy một ảnh không bị nhiễu thì không thể được xử lý bằng các kỹ thuật khôi phục ảnh nhưng ảnh đó có thể được
xử lý bằng các kỹ thuật nâng cao chất lượng ảnh Nhưng một ảnh bị nhiễu thì nó có thể được xử lý vừa bằng các kỹ thuật khôi phục ảnh vừa bằng các kỹ thuật nâng cao chất lượng ảnh
Khôi phục ảnh
Khôi phục ảnh là quá trình loại bỏ hay tối thiểu hóa các ảnh hưởng của môi trường bên ngoài hoặc do các hệ thống thu nhận ảnh gây ra Về nguyên tắc, khôi phục ảnh nhằm xác định mô hình toán học của quá trình đã gây ra biến dạng, tiếp theo là dùng ánh xạ ngược để xác định lại ảnh
Trang 16Bất kỳ một ảnh nào được thu bằng các thiết bị điện, quang điện hay quang học thường bị nhiễu bởi môi trường cảm biến của các thiết bị đó Các loại nhiễu có thể là nhiễu hệ thống, bị mờ do lệch tiêu điểm camera, nhiễu ngẫu nhiên do chuyển động giữa camera và đối tượng được chụp, nhiễu do khí quyển …
Khôi phục ảnh là dùng các bộ lọc để lọc các ảnh bị nhiễu nhằm giảm tối thiểu sự ảnh hưởng của các loại nhiễu này để cho ra ảnh kết quả càng gần giống ảnh gốc càng tốt Hiệu quả của các bộ lọc khôi phục ảnh phụ thuộc vào sự nhận biết về quá trình nhiễu cùng với quá trình thu nhận ảnh Khôi phục ảnh thường được xử lý trên miền tần số là chủ yếu Bao gồm các kỹ thuật lọc ngược, lọc bình phương tối thiểu (wiener)
1.2.9 Nhận dạng ảnh
Nhận dạng đối tượng chính là quá trình tiến hành phân lớp đối tượng cần nhận dạng vào các lớp Có hai lớp phương pháp tiếp cận chính trong quá trình phân lớp các đối tượng, đó là các phương pháp phân lớp dựa vào đường ranh giới phân biệt giữa các lớp và các phương pháp phân lớp dựa vào phân bố thống kê của các lớp (mô hình markov ẩn, phương pháp phân loại thống kê, Bayesian, trường marko ngẫu nhiên) Trên cơ sở các bài toán thì sẽ có các mô hình nhận dạng phù hợp và các thuật toán đi kèm các mô hình đó Ngoài ra còn một số cách tiếp cận khác trong
lý thuyết nhận dạng đó là đối sánh mẫu dựa trên các đặc trưng được trích chọn, nhận dạng cấu trúc (xâu chuỗi, đồ thị …) nhận dạng dựa trên biểu diễn ngữ pháp văn phạm
Theo tài liệu [1] hệ thống nhận dạng tự động bao gồm 3 khâu tương ứng với
3 giai đoạn chủ yếu sau:
1 Thu nhận dữ liệu, tiền xử lý
2 Biểu diễn dữ liệu
3 Nhận dạng, ra quyết định
Bốn cách tiếp cận khác nhau trong lý thuyết nhận dạng là:
1 Đối sánh mẫu dựa trên các đặc trưng được trích chọn
2 Phân loại thống kê
3 Đối sánh cấu trúc
4 Phân loại dựa trên mạng nơ-ron nhân tạo
Trên thực tế, người ta áp dụng kỹ thuật nhận dạng khá thành công với nhiều bài toán khác nhau như: nhận dạng vân tay, nhận dạng chữ (chữ cái, chữ số, chứ có dấu) Nhận dạng chữ in hoặc đánh máy phục vụ cho việc tự động hóa quá trình đọc tài liệu, tăng nhanh tốc độ và chất lượng thu nhận thông tin từ máy tính Các bài toán và ứng dụng nhận dạng rất phong phú như: Nhận dạng khuôn mặt, nhận dạng
Trang 17người đi bộ, xây dựng các hệ thống giám sát thông minh, rô-bốt, các hệ thống dự báo dựa vào hình ảnh …
1.2.10 Các loại định dạng tập tin ảnh cơ bản
Ảnh thu được sau quá trình số hóa thường được lưu lại cho các quá trình xử
lý tiếp theo hay truyền đi Trong quá trình phát triển của kỹ thuật xử lý ảnh, tồn tại nhiều định dạng ảnh khác nhau từ ảnh đen trắng (với định dạng IMG), ảnh đa cấp xám cho đến ảnh màu: (BMP, GIF, JPEG…) Tuy các định dạng này khác nhau, song chúng đều tuân theo một cấu trúc chung nhất Nhìn chung, một tệp (file) ảnh bất kỳ thường bao gồm 3 phần (theo tài liệu [2]):
- Đầu tệp (Header): Đầu tệp là phần chứa các thông tin về kiểu ảnh, kích thước, độ phân giải, số bit dùng cho 1 pixel, cách mã hóa, vị trí bảng màu…
- Dữ liệu nén (Data Compression): Số liệu ảnh được mã hóa bởi kiểu mã hóa chỉ ra trong phần Header
- Bảng màu (Palette Color): Bảng màu không nhất thiết phải có, ví dụ khi ảnh là đen trắng Nếu có, bảng màu cho biết số màu dùng trong ảnh và bảng màu được sử dụng để hiện thị màu của ảnh Một số các định dạng khác, cấu hình, đặc trưng của từng địng dạng và các tham số
Ảnh BPM (Bitmap): Là ảnh được mô tả bởi một ma trận các giá trị số xác định màu và bảng màu của các điểm ảnh tương ứng khi hiển thị Ưu điểm của ảnh Bitmap là tốc độ vẽ và tốc độ xử lý nhanh Nhược điểm của nó là kích thước rất lớn
Ảnh JPEG (Joint Photographic Experts Group): Là một định dạng ảnh được phát triển để nén dung lượng và lưu trữ ảnh chụp Được sử dụng tốt nhất cho
đồ họa có nhiều màu sắc, ví dụ như là ảnh chụp được scan File ảnh JPEG là ảnh Bitmap đã được nén lại
Ảnh GIF (Graphics Interchange Format): Được phát triển dành cho những ảnh có tính chất thay đổi được Nó được sử dụng tốt nhất cho đồ họa có ít màu, ví dụ như là ảnh hoạt hình hoặc là những bức vẽ với nhiều đường thẳng File ảnh GIF là những ảnh Bitmap được nén lại
Có 2 sự khác nhau cơ bản giữa ảnh GIF và ảnh JPEG:
+ Ảnh GIF nén lại theo cách giữ nguyên toàn bộ dữ liệu ảnh trong khi ảnh JPEG nén lại nhưng làm mất một số dữ liệu trong ảnh
+ Ảnh GIF bị giới hạn bởi số màu nhiều nhất là 256 trong khi ảnh JPEG không giới hạn số màu mà chúng sử dụng
Ảnh TIFF (Tagged Image File Format): Định dạng TIFF cho ta nhiều thông tin về ảnh hơn JPEG, và cũng là file ảnh có kích cỡ lớn nhất trong các định
Trang 18dạng được sử dụng trên máy ảnh Định dạng TIFF có thể biểu thị được độ sâu màu lớn hơn JPEG, nó hỗ trợ đến 48 bit màu, nghĩa là mỗi kênh màu 16 bit (trong môi trường RGB) Vì thế định dạng TIFF có thể tái hiện đến 251 triệu giá trị màu sắc
Vì các files TIFF không nén, nên trong quá trình chỉnh sửa ảnh, mỗi lần lưu lại định dạng này, lượng thông tin hầu như không thay đổi, chất lượng ảnh không bị suy giảm Định dạng TIFF có một nhược điểm đó là dung lượng lớn, thao tác chậm hơn các định dạng khác
1.2.11 Hiệu chỉnh gamma
Gamma có thể hiểu là mối liên hệ giữa đầu vào và kết quả đầu ra của ảnh Nếu chúng ta xét với đầu vào là giá trị độ nhạy sáng của ảnh màu RGB, khi đó mối liên hệ đó được thể hiện theo công thức:
Điều này làm giảm chất lượng hình ảnh và hình ảnh thường tối hơn bình thường
Hiệu chỉnh gamma: Hiệu chỉnh Gamma (Gamma correction) là lấy đảo của Gamma, và khi đó ảnh I’ sau khi hiệu chỉnh gamma:
hiệu chỉnh gamma sẽ làm tăng giá trị xám của các điểm ảnh
Ta có thể tham khảo thêm thông tin về gamma ở tài liệu [14,15,16]
1.2.12 Phân vùng ảnh
Phân vùng là bước then chốt trong xử lý ảnh Giai đoạn này nhằm phân tích ảnh thành những thành phần có tính chất nào đó dựa theo biên hay các vùng liên thông Tiêu chuẩn để xác định các vùng liên thông có thể là mức xám, cùng màu hay độ tương phản
1.3 Nâng cao chất lượng ảnh sử dụng các toán tử điểm
1.3.1 Điều chỉnh độ tương phản
Độ tương phản biểu diễn sự thay đổi độ sáng của đối tượng so với nền hay nói cách khác độ tương phản là độ nổi của điểm ảnh hay vùng so với nền Như vậy, nếu ảnh có độ tương phản kém ta có thể thay đổi theo hàm sau:
(theo tài liệu [2])
Trang 19Các độ dốc xác định độ tương phản tương đối L là số mức xám cực đại Ta có:
ảnh kết quả trùng với ảnh gốc dãn độ tương phản
co độ tương phản
1.3.2.Phân ngưỡng nhị phân
Hay nói cách khác là đổi một ảnh màu sang ảnh đen trắng ta dùng kỹ thuật tác ngưỡng Giả sử ta có ảnh I kích thước (mxn), hai số Min, Max và ngưỡng Khi
đó, kỹ thuật tách ngưỡng được thể hiện qua thuật toán sau:
B1: Thực hiện vòng lặp, thay đổi giá trị độ xám của từng điểm ảnh
Phân ngưỡng động với kỹ thuật SISThreshold (Simple image statistic Threshold tham khảo ở tài liệu [6]): Kỹ thuật này tính toán ngưỡng động bằng cách
sử dụng phương pháp thống kê hình ảnh đơn giản Đối với mỗi điểm ảnh sẽ thực hiện:
+ Tính 2 giá trị Gradient là: |I(x + 1, y) - I(x - 1, y)| và |I(x, y + 1) - I(x, y - 1)| + Trọng lượng (weight) được tính là giá trị lớn nhất của 2 giá trị gradient + Tổng của các trọng lượng sẽ được cập nhật (weightTotal += weight)
+ Tổng của trọng số giá trị điểm ảnh được cập nhật (total += weight * I(x, y) Ngưỡng kết quả được tính là tổng của trọng giá trị điểm ảnh chia tổng trọng lượng
1.3.3 Biến đổi âm bản
Biến đổi âm bản nhận được khi dùng phép biến đổi
Giả sử ta có ảnh I kích thước (mxn) Khi đó kỹ thuật biến đổi âm bản được thể hiện qua thuật toán sau:
B1: Với mỗi điểm ảnh, thực hiện phép toán thay đổi mức xám của nó
Trang 20For(int i=0; i<m;i++)
Để hiệu chỉnh ánh sáng phương pháp đơn giản nhất là thay đổi giá trị điểm ảnh của ảnh Ý tưởng của phương pháp này là thay đổi một cách đồng đều giá trị tại mỗi điểm ảnh, được thực hiện bằng cách cộng giá trị mỗi điểm ảnh với một số nguyên nằm trong khoảng [-255, 255]
Giả sử ta có ảnh I với kích thước (mxn) và một số nguyên c Khi đó thuật toán được
mô tả như sau:
For (i=0,i<m;i++)
For (j=0;j<n;j++)
I[i,j] = I[i,j] +c;
Nếu c>0: ảnh sáng lên
Nếu c<0: Ảnh tối đi
Với ảnh màu ta áp dụng thuật toán trên cho từng kênh màu
1.3.5 Đổi ảnh RGB sang ảnh grayscale
Hệ chuẩn màu CIE-RGB dùng 3 màu cơ bản R, G, B và ký hiệu RGBCIE để phân biệt với các chuẩn khác Như đã nêu trên, một màu là tổ hợp của các màu cơ bản theo một tỷ lệ nào đó Như vậy, mỗi pixel ảnh màu ký hiệu Px, được viết: (T: trong công thức dướ đây là ký hiệu chuyển vị)
Trang 21Hình 1.3 Hệ tọa độ RGB (theo tài liệu [2])
Trong cách biểu diễn này ta có công thức:
đỏ + lục + lơ =1 Công thức này gọi là công thức Maxwell Trong hình trên, tam giác tạo bởi ba đường đứt đoạn gọi là tam giác Maxwell Màu trắng trong hệ tọa độ này được tính bởi:
trắngCIE = (đỏCIE + lụcCIE + lơCIE) = 1 Ảnh xám hay còn gọi là ảnh đơn sắc (monochromatic), là ảnh mà tại mỗi điểm ảnh có một giá trị mức xám Ảnh 8 mức xám sẽ có giá trị mỗi điểm ảnh nằm trong đoạn [0, 7] Ảnh 256 mức xám sẽ có giá trị mỗi điểm ảnh nằm trong đoạn [0, 255] Giá trị điểm ảnh = 0 nghĩa là điểm ảnh đó tối (đen), giá trị điểm ảnh lớn nhất nghĩa là điểm ảnh đó trắng Nói cách khác, giá trị mỗi điểm ảnh càng lớn thì điểm ảnh đó càng sáng
Cường độ sáng được tính theo công thức (chuyển đổi từ RGB sang grayscale):
Độ sáng = 0.2989R + 0.5870G + 01.1140B Hoặc theo công thức:
Độ sáng = 0.3086R + 0.6094G + 0.0820B Chú ý rằng giá trị mỗi điểm ảnh I(x,y) hay còn gọi là cường độ sáng (Luminance Intensity) trong ảnh đa mức xám tính được là tổng trọng số khác nhau của mỗi thành phần màu trong hệ màu RGB Một trong những lý do của việc này là nếu chúng ta sử dụng cùng trọng số, ví dụ (R + G + B) / 3 thì màu đỏ, màu xanh nước biển hay màu xanh da trời sẽ có cùng mức xám sau khi chuyển đổi Mặt khác theo khoa học đã chứng minh thì mắt người nhạy cảm hơn với thành phần màu xanh lá cây và màu đỏ so với xanh da trời
Trang 22hình 1.4 Chuyển ảnh màu rgb sang ảnh gray
1.4 Nâng cao chất lượng ảnh dùng toán tử không gian
Thường là ảnh thu nhận có nhiễu cần phải loại bỏ nhiễu hay ảnh không sắc nét bị mờ hoặc cần làm rõ các chi tiết như đường biên ảnh Các toán tử không gian dùng trong kỹ thuật tăng cường ảnh được phân nhóm theo công dụng: Làm trơn nhiễu, nổi biên Để làm trơn nhiễu hay tác nhiễu người ta sử dụng các bộ lọc tuyến tính (lọc trung bình, lọc thông thấp) hay lọc phi tuyến (lọc trung vị, giả trung vị, lọc đồng hình) Từ bản chất của nhiễu (thường tương ứng với tần số cao) và từ cơ sở lý thuyết lọc là: bộ lọc chỉ cho tín hiệu có tần số nào đó thông qua do đó để lọc nhiễu người ta thường dùng lọc thông thấp hay lấy tổ hợp tuyến tính để san bằng (lọc trung bình) Để làm nổi cạnh (ứng với tần số cao) người ta dùng các bộ lọc thông cao, lọc Laplace Chúng ta có thể tham khảo kỹ thuật và thuật toán các bộ lọc trong tài liệu [2]
(a) (b)
Trang 23CHƯƠNG 2 PHÉP TOÁN HÌNH THÁI TRONG XỬ LÝ ẢNH 2.1 Giới thiệu
“Morphology” là thuật ngữ chỉ sự nghiên cứu về cấu trúc hay hình học (topo) của đối tượng trong ảnh Hình thái học có vai trò rất quan trọng trong các lĩnh vực ngôn ngữ học và sinh học Trong ngôn ngữ học, hình thái học là sự nghiên cứu về cấu trúc của từ, tập hợp từ, câu Còn trong sinh học, hình thái học lại chú trọng tới hình dạng của một cá thể hơn, chẳng hạn có thể phân tích hình dạng của một chiếc
lá để từ đó có thể nhận dạng được đó là loại cây gì, nghiên cứu hình dạng của một nhóm vi khuẩn, dựa trên các đặc điểm nhận dạng để phân biệt chúng thuộc nhóm vi khuẩn nào,…
Trong các ứng dụng thị giác máy tính, xử lý hình thái học có thể được sử dụng để nhận dạng đối tượng, nâng cao chất lượng ảnh, phân đoạn ảnh và kiểm tra khuyết điểm trên ảnh Các phép toán xử lý hình thái học được thực hiện chủ yếu trên ảnh nhị phân và ảnh xám Phần lớn các phép toán hình thái học được định nghĩa từ hai phép toán cơ bản là phép toán co ảnh (Erosion) và giãn ảnh (Dilation) Yếu tố quan trọng trong các phép toán này là lựa chọn một phần tử cấu trúc có hình dáng phù hợp thì ta mới thu được kết quả như mong đợi
2.2 Phần tử cấu trúc
Một phần quan trọng của các thao tác giãn-nở ảnh là phần tử cấu trúc dùng được sử dụng để rê đi khắp ảnh Phần tử cấu trúc hai chiều (phần tử cấu trúc phẳng) được xem là ma trận gồm các phần tử 0 và 1 (thường nhỏ hơn nhiều so với các hình ảnh được xử lý) Các điểm ảnh trung tâm của phần tử cấu trúc, được gọi là gốc (xác định các điểm ảnh sẽ được tác động tới trong quá trình thao tác ảnh) Các điểm ảnh trong phần tử cấu trúc có giá trị 1 được coi là lân cận và cũng sẽ được xem xét tới trong quá trình thực hiện phép co-dãn ảnh
Một số hình dáng của phần tử cấu trúc thường được sử dụng trên ảnh nhị phân: dạng đường theo chiều ngang và dọc, hình vuông, hình ellipse
Trang 24Hình 2.1 Một số hình dáng của phần tử cấu trúc phẳng
(theo tài liệu [3])
Đối với ảnh xám, phần tử cấu trúc là không phẳng, tức là các phần tử cấu trúc
sử dụng các giá trị 0 và 1 để xác định phạm vi của phần tử cấu trúc trong mặt phẳng
x và mặt phẳng y và thêm giá trị độ cao để xác định chiều thứ ba.Cấu trúc phần tử không phẳng gồm có hai phần:
Phần thứ nhất: Một mảng hai chiều gồm có các giá trị 0 và 1, trong đó giá trị bằng 1 xác định hàng xóm của phần tử cấu trúc
0 1 0
1 1 1
0 1 0 Phần thứ hai: Một mảng hai chiều có kích thước bằng với kích thước của mảng hai chiều ở phần thứ nhất nhưng chứa các giá trị thực của phần tử cấu trúc
0 1.3 0 1.5 1 1.4
0 1.6 0 Khi một phép toán hình thái được thực hiện thì các gốc của phần tử cấu trúc thường dịch chuyển lần lượt trên các điểm ảnh Và khi đó giá trị của các điểm ảnh vừa được quét qua sẽ được so sánh với nhau, các kết quả thu được sau khi so sánh phụ thuộc vào phép toán hình thái đang được sử dụng
Trang 252.3 Các phép toán với ảnh nhị phân
2.3.1 Phép giãn nhị phân (Dilation)
Trong luận văn này, ta coi đối tượng ảnh là những điểm đen và nền là những điểm trắng Trước hết, để bắt đầu ta hãy xem hình 2.2a -Tập hợp các điểm ảnh đen tạo nên đối tượng ảnh hình vuông) và trong 2.2b -đối tượng ảnh cũng là hình vuông nhưng là hình vuông lớn hơn so với 2.2a một điểm ảnh về mọi phía, nghĩa là thay mọi lân cận trắng của các điểm ảnh trong 2.2a thành các điểm ảnh đen Đối tượng trong 2.2c cũng được thao tác tương tự Thao tác đó có thể coi như một phép dãn đơn giản, phép dãn một điểm ảnh về mọi phía Việc dãn đó có thể được thực hiện cho đến khi toàn bộ ảnh được thay bằng các điểm ảnh đen Tuy nhiên trong thực tế, đối tượng ảnh được xem như là một tập hợp toán học của các điểm ảnh đen, mỗi điểm ảnh đen được coi như là một điểm trong không gian hai chiều và nó được xác định bởi số hàng và số cột
Hình 2.2 Hiệu quả của thao tác nhị phân đơn giản trên một ảnh nhỏ
(a) Ảnh ban đầu ; (b) Ảnh dãn 1 điểm ảnh; (c) Ảnh dãn 2 điểm ảnh (so với
ảnh ban đầu) (theo tài liệu [5])
Phép giãn nhị phân của tập hợp A bởi tập hợp B là tồn tại các điểm c thuộc sao cho c là tổng của hai điểm tương ứng bất kỳ thuộc tập hợp A và tập hợp B,
định nghĩa này được mô tả qua công thức :
(theo tài liệu [5]) Trong đó, tập C gọi là kết quả của phép dãn A sử dụng phần tử cấu trúc B và gồm các phần tử như được mô tả ở trên, tuy nhiên một vài điểm trong số chúng có thể trùng nhau
Trang 26Hình 2.3 Dãn A bởi B a-Tập A ban đầu ; b- Tập A cộng phần tử (0,0) ;
c - Tập A cộng phần tử (0,1) ; d- Hợp của (b) và (c) kết quả của phép dãn
(theo tài liệu [5]) Nhìn hình 2.3, ta nhận thấy rằng trong các ảnh có hình 1 dấu thập (×) Những phần tử được đánh dấu (×) hoặc đen, hoặc trắng được coi như gốc (Ogirin) của mỗi ảnh Việc xác định vị trí của gốc cấu trúc là rất quan trọng, nó có thể quyết định hướng co, dãn của ảnh Nếu gốc ở bên trái, thì ảnh có xu hướng co, dãn về bên phải, gốc ở bên phải thì co, dãn về trái và nếu gốc ở giữa, tất nhiên, ảnh sẽ dãn đều Trong thí dụ trên do gốc của cấu trúc B ở bên trái nên ta thấy ảnh được dãn về bên phải
Ta có thể coi phép dãn (dilation) là hợp của tất cả các phép dịch bởi các phần
tử của cấu trúc, kí hiệu:
(theo tài liệu [5]) Một ví dụ về phép giãn trên một hình ảnh nhị phân sử dụng phần tử cấu trúc dạng ma trận vuông 3x3 như sau:
Trang 27Hình 2.4 Quá trình quét của phần tử cấu trúc trên hình ảnh nhị phân
Ở ví dụ trên ta các điểm ảnh màu trắng mang giá trị là 1 là các điểm thuộc đối tượng đang cần quan tâm trên ảnh, và phần màu đen mang giá trị 0 là phần nằm ngoài đối tượng Khi thuật toán được thi hành thì phần tử cấu trúc sẽ lần lượt quét qua các điểm ảnh ngoài cùng (Đi theo đường kẻ màu đỏ trên hình vẽ) của đối tượng sau đó thay thế các điểm ảnh trên đối tượng này theo mẫu phần tử cấu trúc Từ đó ta ứng dụng để nối các nét bi đứt gẫy của văn bản do quá trình xuống cấp, với khoảng cách lớn nhất của các nét bị đứt gãy tầm hai điểm ảnh
Hình 2.5 Ví dụ quá trình thực hiện của phép mở ảnh (theo http://www.mathworks.com/help/images/morphology-fundamentals-dilation-
and-erosion.html)
Trong kỹ thuật này, một cửa sổ N+1 x N+1 được rê đi khắp ảnh và thực hiện đối sánh một pixel của ảnh với (N+1)2-1 điểm lân cận (không tính điểm gốc) Phép đối sánh ở đây thực hiện bởi phép tuyển logic Thuật toán biến đổi tóm tắt như sau:
For all pixels I(x,y) do
Begin
Trang 28Tính F or (x,y) // tính or logic
If F or (x,y) then ImaOut (x,y)1
Else ImaOut(x,y)ImaIn(x,y)
Trang 292.3.2 Phép co nhị phân (Erosion)
Ta cũng xét tập hợp A và tập hợp B (Phần tử cấu trúc) trong , thì phép co
nhị phân của tập hợp A bởi phần tử cấu trúc B được kí hiệu A B và viết dưới dạng
công thức như sau:
For all pixels I(x,y) do
Begin
Tính F AND (x,y) {Tính và lôgíc}
- if F AND (x,y) then ImaOut(x,y) < 1
else ImaOut(x,y) <- ImaIn(x,y)
End
Phần tử cấu trúc được dịch
chuyển tới vị trí của một điểm
đen trong ảnh Trong trường
hợp này, các thành viên của cấu
trúc đều phù hợp với những
điểm đen của ảnh, do đó mà kết
quả là một điểm đen
Phần tử cấu trúc được dịch chuyển tới điểm ảnh tiếp theo trong ảnh, và có một điểm không phù hợp do vậy kết quả
là điểm trắng
Trang 30Hình 2.6 Quá trình thực hiện phép co nhị phân dùng phần tử cấu trúc đơn giản
(theo tài liệu [5])
)
b
)
Ở lần dịch chuyển tiếp theo các
thành viên của cấu trúc lại phù
hợp nên kết quả là đen
Tương tự trên, dịch chuyển không phù hợp nên gây ra kết quả là điểm trắng
Trang 31Hình 2.7 Quá trình lọc đối tượng sử dụng phép co nhị phân và phép giãn nhị phân
Quá trình thực hiện có thể được minh họa rõ ràng qua hình vẽ sau:
Hình 2.8 Ứng dụng của phép co ảnh dưới dạng số nhị phân
a) Hình ảnh ban đầu; b) Hình ảnh quá trình co nhị phân trên đối tượng với phần tử cấu trúc 9x9, phần tử được tô đậm màu sẽ có giá trị 1 sau quá trình co nhị phân; c) Phóng to đối tượng và giá trị của đối tượng sau quá trình co nhị phân với phần tử cấu trúc 9x9
+ Erosion có thể tách các đối tượng nối nhau