Trong xử lý ảnh, việc ảnh thu được sau quá trình thu nhận ảnh thông qua các thiết bị chụp ảnh thường không thể tránh khỏi biến dạng, nhiễu hay lỗ hổng bởi các thiết bị quang học và điện
Trang 1Đầu tiên em xin gửi lời cảm ơn chân thành và trân trọng nhất tới PGS TS
Đỗ Năng Toàn, người đã trực tiếp hướng dẫn, giúp đỡ em trong việc hình thành, phát triển và hoàn thành đồ án tốt nghiệp này
Em cũng xin gửi lời cảm ơn trân trọng tới các thầy cô giáo trong khoa Công nghệ thông tin – Đại học Lạc Hồng, những người đã tân tình dạy dỗ và dìu dắt em trong suốt bốn năm học vừa qua để chúng em có những kinh nghiệm, kiến thức vững chắc để hoàn thành đồ án tốt nghiệp này
Em xin chân thành cảm ơn gia đình, bạn bè đã luôn động viên, giúp đỡ em về mọi mặt trong quá trình học tập và nghiên cứu, cũng như góp ý cho đồ án tốt nghiệp
Em rất mong nhận được sự khích lệ, quan tâm, giúp đỡ của các quý thầy
cô và các bạn trong quá trình học tập và công tác sau này, em rất mong muốn được mang một công sức, kiến thức của mình để xây dựng xã hội, xứng đáng với
sự giúp đỡ và tình cảm mà mọi người đã dành cho em
Em xin chân thành cảm ơn!
Trang 2Tôi xin cam đoan luận văn "Nghiên cứu một số kỹ thuật xóa đối tượng nhỏ trong ảnh" là kết quả quá trình học tập, nghiên cứu khoa học độc lập, nghiêm túc
Các số liệu trong luận văn là trung thực, có nguồn gốc rõ ràng, được trích dẫn và có tính kế thừa, phát triển từ các tài liệu, tạp chí, các công trình nghiên cứu
đã được công bố
Các phương pháp nêu trong luận văn được rút ra từ những cơ sở lý luận và quá trình nghiên cứu tìm hiểu của tác giả
Trang 3Trong xử lý ảnh, việc ảnh thu được sau quá trình thu nhận ảnh thông qua các thiết bị chụp ảnh thường không thể tránh khỏi biến dạng, nhiễu hay lỗ hổng bởi các thiết bị quang học và điện tử, đôi khi bởi chính bản thân đối tượng Vì vậy, cần phải
có các cách thức để tìm và phát hiện ra các điểm nhiễu hay lỗ hổng Đây là cơ sở quan trọng trong việc ứng dụng phương pháp này vào thực tiễn của cuộc sống, đặc biệt là trong điều kiện đất nước ta đang từng bước phát triển và đi lên nên việc nghiên cứu các ứng dụng vấn đề này cần được quan tâm và phát triển
Trang 4Trang Trang phụ bìa
Lời cảm ơn
Lời cam đoan
Tóm tắt luận văn
Mục lục
Danh mục hình
PHẦN MỞ ĐẦU 1
Chương 1 2
KHÁI QUÁT VỀ NÂNG CAO CHẤT LƯỢNG ẢNH VÀ BÀI TOÁN XÓA ĐỐI TƯỢNG NHỎ 2
1.1 Khái quát về nâng cao chất lượng ảnh 2
1.1.1 Xử lý ảnh và quá trình thu nhận ảnh 2
1.1.1.1 Mục tiêu của xử lý ảnh 2
1.1.1.2 Một số khái niệm cơ bản 3
1.1.1.3 Ứng dụng của xử lý ảnh 10
1.1.2 Các cách tiếp cận trong việc nâng cao chất lượng ảnh 12
1.1.2.1 Nâng cao chất lượng ảnh bởi thao tác với điểm ảnh 12
1.1.2.2 Nâng cao chất lượng ảnh bởi thao tác với vùng ảnh 19
1.1.2.3 Nâng cao chất lượng ảnh bởi một số kỹ thuật của phép toán hình thái học 20
1.2 Bài toán xóa đối tượng nhỏ 24
1.2.1 Đối tượng nhỏ trong ảnh 24
1.2.2 Bài toán xóa đối tượng nhỏ trong ảnh 28
Chương 2 30
PHÁT HIỆN VÀ XÓA ĐỐI TƯỢNG NHỎ TRONG ẢNH 30
2.1 Phát hiện đối tượng nhỏ trong ảnh 30
2.1.2 Chu tuyến của đối tượng ảnh 32
2.1.3 Thuật toán dò biên 34
2.1.4 Phát hiện nhiễu 41
Trang 52.2 Xóa đối tượng nhỏ trong ảnh 43
2.2.1 Xóa nhiễu 43
2.2.2 Lấp lỗ hổng 48
Chương 3 54
NÂNG CAO CHẤT LƯỢNG ẢNH SAU NẮN CHỈNH BIẾN DẠNG 54
3.1 Nắn chỉnh một cuốn sách 54
3.2 Một số kết quả chương trình 57
3.2 Một số kết quả chương trình 58
3.2.1 Mô tả các chức năng trong chương trình 58
3.2.1.1 Chức năng quản lý các Style (ảnh mẫu) 58
3.2.1.2 Chức năng quản lý các điểm đặc trưng 58
3.2.1.3 Chức năng nâng cao chất lượng ảnh 58
3.2.1.4 Chức năng lưu file ảnh sau khi thực hiện nắn chỉnh 59
3.2.2 Giao diện chính của chương trình 60
3.2.3 Kết quả của một số chức năng trong chương trình 63
KẾT LUẬN VÀ KIẾN NGHỊ 64 Tài liệu tham khảo
Trang 6Hình 1.1: Quá trình xử lý ảnh 2
Hình 1.2: Ảnh minh họa ảnh nhị phân và ảnh xám 3
Hình 1.3: Ảnh minh họa về ảnh màu 4
Hình 1.4: Quan hệ giữa các điểm ảnh 5
Hình 1.5: Lược đồ xám của ảnh 6
Hình 1.6: Ảnh bị dư tối có lược đồ xám tập trung nhiều bên trái 6
Hình 1.7: Hình ảnh sau khi được chỉnh sửa lược đồ xám đã được trải đều 7
Hình 1.8: Hình Các bước cơ bản trong một quá trình xử lý ảnh 8
Hình 1.9: Ảnh chụp cầu Sài Gòn từ vệ tinh 10
Hình 1.10: Ảnh hồng ngoại 11
Hình 1.11: Ảnh gốc 25
Hình 1.12: Ảnh xương 25
Hình 1.13: Kết quả của phép lấp lỗ hổng 29
Hình 1.14: Kết quả của phép khử nhiễu 29
Hình 2.1: Ma trận 8 láng giềng kề nhau 30
Hình 2.2: Ví dụ về chu tuyến của ảnh 31
Hình 2.3: Ví dụ về chu tuyến của đối tượng ảnh 32
Hình 2.4: Chu tuyến ngoài 33
Hình 2.5: Chu tuyến trong 33
Hình 2.6: Ma trận 8-láng giềng kề nhau 40
Hình 2.7: Chu tuyến láng giềng 42
Hình 2.8: Xấp xỉ trên chu tuyến 42
Hình 2.9: Xấp xỉ dưới chu tuyến 42
Hình 2.10: Minh họa phép biến đổi trúng hoặc trượt 44
Hình 2.11: Minh họa điểm ảnh M 50
Hình 2.12: Tìm cặp nền vùng mới 51
Hình 2.13: Bốn đường thẳng cần xét 53
Hình 3.1: Ảnh gốc và mô hình khung mẫu 55
Hình 3.2: Xác định các điểm đặc trưng trên ảnh và khung mẫu 55
Hình 3.3: Ảnh gốc và ảnh được nắn chỉnh 56
Trang 7Hình 3.5: Ảnh gốc và ảnh được nắn chỉnh 63 Hình 3.6: Ảnh nắn chỉnh và ảnh sau khi thực hiện nâng cao chất lượng ảnh 63
Trang 8PHẦN MỞ ĐẦU
Hiện nay, bất cứ sự phát triển của ngành công nghiệp nào đều có sự hiện diện và đóng góp rất to lớn của công nghệ thông tin Xử lý ảnh là một trong những chuyên ngành quan trọng và lâu đời của Công nghệ thông tin Xử lý ảnh được áp dụng trong nhiều lĩnh khác nhau như y học, vật lý, hoá học, tìm kiếm tội phạm, trong quân sự và trong một số lĩnh vực khác
Phần lớn con người thu nhận thông tin bằng thị giác, cụ thể đó là các hình ảnh Vì vậy xử lý ảnh là vấn đề không thể thiếu và hết sức quan trọng để thu được hình ảnh tốt hơn, đẹp hơn, nhằm đáp ứng yêu cầu thông tin khác nhau của người nhận
Trong xử lý ảnh, việc ảnh thu được sau quá trình thu nhận ảnh thông qua các thiết bị chụp ảnh thường không thể tránh khỏi biến dạng, nhiễu hay lỗ hổng bởi các thiết bị quang học và điện tử, đôi khi bởi chính bản thân đối tượng vì vậy, cần phải
có các cách thức để tìm và phát hiện ra các điểm nhiễu hay lỗ hổng Đây là cơ sở quan trọng trong việc ứng dụng phương pháp này vào thực tiễn của cuộc sống, đặc biệt là trong điều kiện đất nước ta đang từng bước phát triển và đi lên nên việc nghiên cứu các ứng dụng vấn đề này cần được quan tâm và phát triển
Hình 1: Đối tượng nhỏ trong ảnh đường nét[7]
Xuất phát từ vấn đề vừa nêu, luận văn này sẽ "Nghiên cứu một số kỹ thuật xóa đối tượng nhỏ trong ảnh" nhằm giúp cho quá trình thao tác ảnh đầu vào để cho
ra kết quả ảnh đầu ra tốt hơn
Trang 9Chương 1 KHÁI QUÁT VỀ NÂNG CAO CHẤT LƯỢNG ẢNH VÀ BÀI TOÁN XÓA
ĐỐI TƯỢNG NHỎ 1.1 Khái quát về nâng cao chất lượng ảnh
Nâng cao chất lượng ảnh là một bước quan trọng, tạo tiền đề cho xử lý ảnh Mục đích chính là nhằm làm nổi bậc một số đặc tính của ảnh như thay đổi độ tương phản, lọc nhiễu, nổi biên, làm trơn biên ảnh, khuyết đại ảnh, Tăng cường ảnh và khôi phục ảnh là 2 quá trình khác nhau về mục đích Tăng cường ảnh bao gồm một loạt các phương pháp nhằm hoàn thiện trạng thái quan sát của một ảnh Tập hợp các
kỹ thuật này tạo nên giai đoạn tiền xử lý ảnh Trong khi đó, khôi phục ảnh nhằm khôi phục ảnh gần với ảnh thực nhất trước khi nó bị biến dạng do nhiều nguyên nhân khác nhau.[5]
1.1.1 Xử lý ảnh và quá trình thu nhận ảnh:[5]
Quá trình xử lý ảnh được xem như là quá trình thao tác trên ảnh đầu vào nhằm cho ra kết quả mong muốn Kết quả đầu ra của một quá trình xử lý ảnh có thể là một ảnh “tốt hơn” hoặc một kết luận
Hình 1.1: Quá trình xử lý ảnh[5]
Trang 101.1.1.2 Một số khái niệm cơ bản:
Điểm ảnh: là một phần tử của ảnh tại tọa độ (x, y) với độ mức xám
hoặc màu nhất định, kích thước khoảng cách giữa các điểm ảnh đó thích hợp sao cho mắt người cảm nhận liên tục về không gian và mức xám của ảnh số gần như ảnh thật
Mức xám của ảnh: là một trong hai đặc trưng cơ bản của điểm ảnh,
mức sáng của điểm ảnh là cường độ sáng của nó được gán bằng giá trị số tại điểm đó
Ảnh đen trắng: là ảnh chỉ bao gồm hai mầu đen và trắng Người ta
phân mức đen trắng thành L mức, nếu xử dụng 8 bít mã hóa mức đen trắng thì L được xác định:
L=2B (nếu B=8 ta có L=28=256)
Nếu L=2, B=1, nghĩa là chỉ có hai mức, mức 1 và 0, còn được gọi là ảnh nhị phân, mức 1 ứng với màu sáng mức 0 ứng với màu tối, nếu L lớn hơn 2 thì ta có ảnh đa cấp xám
Đối với mỗi điểm ảnh được mã hóa trên 8 bít để biểu diễn mức xám,thì số mức xám có thể biể diễn được là 256 Mỗi mức xám được biểu diễn dưới dạng là một số nguyên nằm trong khoảng từ 0 đên 255
Hình 1.2: Ảnh minh họa ảnh nhị phân và ảnh xám[5]
Trang 11Ảnh màu:
Biểu diễn tương tự như ảnh đen trắng, chỉ khác là số phần tử của ma trận biểu diễn cho bằng ba màu riêng rẽ (red, green, blue) Để biểu diễn một điểm ảnh cần 24 bit chia ra làm ba khoảng mỗi khoảng 8 bit
Hình 1.3: Ảnh minh họa về ảnh màu[5]
Độ phân giải của ảnh:
Là khoảng cách giữa các điểm ảnh được chọn sao cho mắt người vẫn thấy được sự liên tục của ảnh, việc lựa chọn khoảng cách thích hợp tạo nên mật độ phân bố, đó chính là độ phân giải và được phân bố theo trục x và y trong không gian hai chiều
Có 3 cách để biểu thị độ phân giải ảnh:
- Biểu thị bằng số lượng điểm ảnh theo chiều dọc và chiều ngang của ảnh (ví dụ: 1024 x 768)
- Biểu thị bằng tổng số điểm ảnh trên 1 tấm ảnh (960.000 pixel)
- Biểu thị bằng số lượng điểm ảnh có trên 1 inch (ppi) hoặc số chấm (dot) có trên 1 inch (dpi)
Ảnh có thể được biểu diễn theo mô hình Vector hoặc mô hình Raster:
Mô hình Raster:
Đây là mô hình biểu diễn ảnh thông dụng nhất hiện nay Ảnh được biểu diễn dưới dạng ma trận các điểm ảnh Tùy theo nhu cầu thực tế mà mỗi điểm ảnh có thể được biểu diễn bởi một hay nhiều bit Mô hình Raster rất thuận lợi cho hiển thị và in ấn
Trang 12Khi xử lý các ảnh Raster, chúng ta quan tâm đến mối quan hệ trong vùng lân cận của các điểm ảnh Các điểm ảnh có thể xếp hàng trên một lưới (Raster) hình vuông, lưới hình lục giác hoặc theo một cách hoàn toàn ngẫu nhiên với nhau:
Hình 1.4: Quan hệ giữa các điểm ảnh[5]
Mô hình Vector:
Biểu diễn ảnh ngoài mục đích tiết kiệm không gian lưu trữ, dễ dàng cho hiển thị và in ấn, còn phải đảm bảo dễ dàng trong lựa chọn, sao chép, di chuyển, tìm kiếm… Theo những yêu cầu này, kỹ thuật biểu diễn Vector tỏ ra ưu việt hơn trong mô hình
Vector người ta sử dụng hướng giữa các Vector của điểm ảnh lân cận
để mã hoá và tái tạo hình ảnh ban đầu Ảnh Vector được thu nhận trực tiếp từ các thiết bị số hóa như Digital hoặc được chuyển đổi từ ảnh Raster thông qua các chương trình số hóa Công nghệ phần cứng cung cấp những thiết bị xử lý với tốc độ nhanh và chất lượng cao cho cả đầu vào và ra, nhưng lại chỉ hỗ trợ cho ảnh Raster Do vậy, những nghiên cứu về biểu diễn Vector đều tập trung chuyển đổi từ ảnh Raster
Mức xám của ảnh:
Mức xám là kết quả sự mã hoá tương ứng một cường độ sáng của mỗi điểm ảnh với một giá trị số - kết quả của quá trình lượng hoá Cách mã hoá kinh điển thường dùng 16, 32 hay 64 mức Mã hoá 256 mức là phổ dụng nhất do lý do kỹ thuật
Vì 28 = 256 (0, 1, , 255), nên với 256 mức, mỗi pixel sẽ được mã hoá bởi 8 bit
Lược đồ xám hay còn gọi là biểu đồ tần suất được biểu diễn trong hệ tọa độ vuông góc Oxy Trong hệ tọa độ này, trục hoành biểu diễn cho số mức xám
từ 0 đến N, N là số mức xám (thường xét với mức 256) Trục tung biểu diễn số điểm ảnh cho một mức xám (số điểm ảnh có cùng mức xám) Cũng có thể biểu diễn là: trục tung là tỉ lệ số điểm ảnh có cùng mức xám trên tổng số điểm ảnh
Trang 13Hình 1.5: Lược đồ xám của ảnh[5]
Lược đồ xám cung cấp rất nhiều thông tin về phân bố mức xám của ảnh Theo thuật ngữ của xử lý ảnh gọi là tính động của ảnh Tính động của ảnh cho phép phân tích trong khoảng nào đó phân bố phần lớn các mức xám của ảnh: ảnh rất sáng hay ảnh rất đậm Nếu ảnh sáng, lược đồ xám nằm bên phải (mức xám cao), còn ảnh đậm lược đồ xám nằm bên trái (mức xám thấp) Hình "Lược đồ xám của ảnh" và hình " Ảnh bị dư tối có lược đồ xám tập trung nhiều bên trái" là một ví dụ
Hình 1.6: Ảnh bị dư tối có lược đồ xám tập trung nhiều bên trái[5]
Trang 14
Hình 1.7: Hình ảnh sau khi được chỉnh sửa lược đồ xám đã được trải đều[5]
Biên: là một vấn đề chủ yếu và cực kỳ quan trọng trong quá trình
phân tích ảnh vì các kỹ thuật phân đoạn ảnh chủ yếu dựa vào biên Cho đến nay chưa có định nghĩa chính xác về biên, với mỗi ứng dụng người ta đưa ra các độ đo khác nhau về biên Một điểm ảnh được gọi là biên nếu nó có sự thay đổi đột ngột về mức xám Ví dụ: Đối với ảnh đen trắng, một điểm được gọi là điểm biên nếu nó là điểm đen có ít nhất một điểm trắng bên cạnh Tập hợp các điểm biên tạo nên biên hay đường bao của đối tượng Dựa trên cơ sở này người ta thường sử dụng hai phương pháp phát hiện biên cơ bản: phát hiện biên trực tiếp và phát hiện biên gián tiếp
Các ảnh thu được sau quá trình số hóa thường được lưu lại cho các quá trình xử lý tiếp theo hay truyền đi Trong quá trình phát triển của kỹ thuật xử lý ảnh, tồn tại nhiều định dạng ảnh khác nhau từ ảnh đen trắng (với định dạng IMG), ảnh đa cấp xám cho đến ảnh màu: (BMP, GIF, JPEG…) Tuy các định dạng này khác nhau, song chúng đều tuân theo một cấu trúc chung nhất Nhìn chung, một tệp ảnh bất kỳ thường bao gồm 3 phần:
- Màu đầu tệp (Header)
- Dữ liệu nén (Data Compression)
- Bảng màu (Palette Color)
Trang 15Dựa trên ảnh đầu vào ta có sơ đồ tổng quát của hệ thống xử lý ảnh như sau:
Hình 1.8: Hình Các bước cơ bản trong một quá trình xử lý ảnh[5]
Thu nhận ảnh:
Các thiết bị thu nhận ảnh có hai loại chính ứng với hai loại ảnh thông dụng là Raster và Vector Các thiết bị thu nhận ảnh Raster là camera còn các thiết bị thu nhận ảnh Vector là sensor hoặc bộ số hoá (digitalizer) hoặc được chuyển đổi từ ảnh Raster Các thiết bị thu ảnh thông thường gồm camera cộng với
bộ chuyển đổi tương tự số AD (Analog to Digital) hoặc scanner chuyên dụng Các thiết bị thu nhận ảnh này có thể cho ảnh đen trắng hoặc ảnh màu Đầu ra của scanner là ảnh ma trận số mà ta quen gọi là bản đồ ảnh (ảnh Bitmap) Bộ số hoá (digitalizer) sẽ tạo ảnh vector có hướng Nhìn chung, các hệ thống thu nhận ảnh thực hiện hai quá trình:
- Cảm biến: biến đổi năng lượng quang học (ánh sáng) thành năng lượng điện
- Tổng hợp năng lượng điện thành ảnh
Tiền xử lý:
Tiền xử lý là bước tăng cường ảnh để nâng cao chất lượng ảnh Do những nguyên nhân khác nhau: có thể do chất lượng thiết bị thu nhận ảnh, do nguồn sáng hay do nhiễu, ảnh có thể bị suy biến Do vậy cần phải tăng cường và khôi phục lại ảnh để làm nổi bật một số đặc tính chính của ảnh, hay làm cho ảnh gần giống nhất với trạng thái gốc - trạng thái trước khi ảnh bị biến dạng
Trích chọn đặc điểm:
Việc trích chọn các đặc điểm giúp cho việc nhận dạng các đối tượng ảnh một cách chính xác hơn với tốc độ tính toán cao và dung lượng nhớ lưu trữ giảm xuống Các đặc điểm của đối tượng được trích chọn tuỳ theo mục đích nhận dạng trong quá trình xử lý ảnh Có thể nêu ra một số đặc điểm của ảnh sau đây:
Trang 16- Đặc điểm không gian: Phân bố mức xám, phân bố xác suất, biên độ, điểm uốn v.v…
- Đặc điểm biến đổi: Các đặc điểm loại này được trích chọn bằng việc thực hiện lọc vùng (zonal filtering) Các bộ vùng được gọi là “mặt nạ đặc điểm” (feature mask) thường là các khe hẹp với hình dạng khác nhau (chữ nhật, tam giác, cung tròn v.v )
- Đặc điểm biên và đường biên: Đặc trưng cho đường biên của đối tượng và do vậy rất hữu ích trong việc trích chọn các thuộc tính bất biến được dùng khi nhận dạng đối tượng Các đặc điểm này có thể được trích chọn nhờ toán tử gradient, toán tử la bàn, toán tử Laplace, toán tử “chéo không” (zero crossing) v.v… Việc trích chọn hiệu quả các đặc điểm giúp cho việc nhận dạng các đối tượng ảnh chính xác, với tốc độ tính toán cao và dung lượng nhớ lưu trữ giảm xuống
lý theo các phương pháp trí tuệ con người Vì vậy, ở đây các cơ sở tri thức - hệ
quyết định được phát huy.
Đối chiếu và đƣa ra kết luận:
Ảnh sau khi xử lý sẽ được lưu trữ, kết hợp với cơ sở tri thức để đưa ra những kết luận phục vụ cho mục đích nhận dạng và nội suy
Trang 171.1.1.3 Ứng dụng của xử lý ảnh:
Ban đầu, các kỹ thuật xử lý ảnh đây chủ yếu được sử dụng để nâng cao chất lượng hình ảnh, chính xác hơn là tạo cảm giác về sự gia tăng chất lượng ảnh quang học trong mắt người quan sát Thời gian gần đây, phạm vi ứng dụng xử
lý ảnh mở rộng không ngừng, có thể nói hiện không có lĩnh vực khoa học nào không sử dụng các thành tựu của công nghệ xử lý ảnh số
Trong y học các thuật toán xử lý ảnh cho phép biến đổi hình ảnh được tạo ra từ nguồn bức xạ X-ray hay nguồn bức xạ siêu âm thành hình ảnh quang học trên bề mặt film x-quang hoặc trực tiếp trên bề mặt màn hình hiển thị Hình ảnh các
cơ quan chức năng của con người sau đó có thể được xử lý tiếp để nâng cao độ tương phản, lọc, tách các thành phần cần thiết (chụp cắt lớp) hoặc tạo ra hình ảnh trong không gian ba chiều (siêu âm 3 chiều)
Trong lĩnh vực địa chất, hình ảnh nhận được từ vệ tinh có thể được phân tích để xác định cấu trúc bề mặt trái đất Kỹ thuật làm nổi đường biên (Image Enhancement) và khôi phục hình ảnh (Image Restoration) cho phép nâng cao chất lượng ảnh vệ tinh và tạo ra các bản đồ địa hình 3-D với độ chính xác cao
Hình 1.9: Ảnh chụp cầu Sài Gòn từ vệ tinh
Trang 18Trong ngành khí tượng học, ảnh nhận được từ hệ thống vệ tinh theo dõi thời tiết cũng được xử lý, nâng cao chất lượng và ghép hình để tạo ra ảnh bề mặt trái đất trên một vùng rộng lớn, qua đó có thể thực hiện việc dự báo thời tiết một cách chính xác hơn Dựa trên các kết quả phân tích ảnh vệ tinh tại các khu vực đông dân cư còn có thể dự đoán quá trình tăng trưởng dân số, tốc độ ô nhiễm môi trường cũng như các yếu tố ảnh hưởng tới môi trường sinh thái Ảnh chụp từ vệ tinh có thể thu được thông qua các thiết bị ghi hình cảm nhận được tia sáng quang học (450-
520 nm), hoặc tia hồng ngoại (760-900 nm) Thiết bị thu hình nhạy cảm với vật thể bức xạ các tia trong miền hồng ngoại sẽ cho ra những bức ảnh trong đó vật thể có nhiệt độ thấp sẽ được phân biệt rõ ràng so với vật thể có nhiệt độ cao hơn Như vậy việc lựa chọn các thiết bị ghi hình khác nhau sẽ tạo ra ảnh có đặc tính khác nhau, tùy thuộc vào mục đích sử dụng trong các lĩnh vực khoa học cụ thể
Hình 1.10: Ảnh hồng ngoại[5]
Xử lý ảnh còn được sử dụng nhiều trong các hệ thống quản lý chất lượng và số lượng hàng hóa trong các dây truyền tự động, ví dụ như hệ thống phân tích ảnh để phát hiện bọt khí bên vật thể đúc bằng nhựa, phát hiện các linh kiện không đạt tiêu chuẩn (bị biến dạng) trong quá trình sản xuất hoặc hệ thống đếm sản phẩm thông qua hình ảnh nhận được từ camera quan sát Xử lý ảnh còn được sử dụng rộng rãi trong lĩnh vực hình sự và các hệ thống bảo mật hoặc kiểm soát truy cập: quá trình xử lý ảnh với mục đích nhận dạng vân tay hay khuôn mặt cho phép phát hiện nhanh các đối tương nghi vấn cũng như nâng cao hiệu quả hệ thống bảo
Trang 19mật cá nhân cũng như kiểm soát ra vào Ngoài ra, có thể kể đến các ứng dụng quan trọng khác của kỹ thuật xử lý ảnh tĩnh cũng như ảnh động trong đời sống như tự động nhận dạng, nhận dạng mục tiêu quân sự, máy nhìn công nghiệp trong các hệ thống điều khiển tự động, nén ảnh tĩnh, ảnh động để lưu và truyền trong mạng viễn thông v.v…
1.1.2 Các cách tiếp cận trong việc nâng cao chất lƣợng ảnh: [5]
1.1.2.1 Nâng cao chất lƣợng ảnh bởi thao tác với điểm ảnh:
Trang 20Tăng giảm độ sáng:
Giả sử ta có I ~ kích thước m x n và số nguyên c Khi đó, kỹ thuật tăng, giảm độc sáng được thể hiện
for (i = 0; i < m; i + +) for (j = 0; j < n; j + +)
I [i, j]= I [i, j]+ c;
- Nếu c > 0: ảnh sáng lên
- Nếu c < 0: ảnh tối đi
Tách ngƣỡng:
Giả sử ta có ảnh I ~ kích thước m x n, hai số Min, Max và ngưỡng
θ khi đó: Kỹ thuật tách ngưỡng được thể hiện
for (i = 0; i < m; i + +) for (j = 0; j < n; j + +)
I [i, j]= I [i, j]> = θ? Max : Min;
Ứng dụng:
Nếu Min = 0, Max = 1 kỹ thuật chuyển ảnh thành ảnh đen trắng được ứng dụng khi quét và nhận dạng văn bản có thể xảy ra sai sót nền thành ảnh hoặc ảnh thành nền dẫn đến ảnh bị đứt nét hoặc dính
Trang 21I [i,j]= I [i,j]/ bunch - size * bunch_size ∀ (i,j)
Ví dụ: Bó cụm ảnh sau với bunch_size= 3
Cân bằng histogram:
Ảnh I được gọi là cân bằng "lý tưởng" nếu với mọi mức xám g, g’
ta có h(g) = h(g’)
Giả sử, ta có ảnh I ~ kích thước m x n new_level ~ số mức xám của ảnh cân bằng
new_level
n
x m
TB ~ số điểm ảnh trung bình của mỗi mức xám của ảnh cân bằng
Trang 220
)()
( ~ số điểm ảnh có mức xám ≤ g Xác định hàm f: g f(g)
TB
g t round g
f
Ví dụ: Cân bằng ảnh sau với new_level= 4
Chú ý: Ảnh sau khi thực hiện cân bằng chưa chắc đã là cân bằng "lý tưởng"
Trang 23Kỹ thuật tách ngƣỡng tự động:
Ngưỡng θ trong kỹ thuật tách ngưỡng thường được cho bởi người sử dụng Kỹ thuật tách ngưỡng tự động nhằm tìm ra ngưỡng θ một cách tự động dựa vào histogram theo nguyên lý trong vật lý là vật thể tách làm 2 phần nếu tổng độ lệnh trong từng phần là tối thiểu
0
)(.)(
1)
Trang 24Biến đổi cấp xám tổng thể:
Nếu biết ảnh và hàm biến đổi thì ta có thể tính được ảnh kết quả và
do đó ta sẽ có được histogram của ảnh biến đổi Nhưng thực tế nhiều khi ta chỉ biết histogram của ảnh gốc và hàm biến đổi, câu hỏi đặt ra là liệu ta có thể có được histogram của ảnh biến đổi Nếu có như vậy ta có thể hiệu chỉnh hàm biến đổi
để thu được ảnh kết quả có phân bố histogram như mong muốn
Bài toán đặt ra là biết histogram của ảnh, biết hàm biến đổi hãy
vẽ histogram của ảnh mới
Ví dụ:
g + 1 nếu g ≤2 f(g)= nếu g = 3
g– 1 nếu g >3 Bước 1: Vẽ Histogram của ảnh cũ f(g)
g
0
Trang 25Bước 2: Vẽ đồ thị hàm f(g) h(g)
Bước 3: Vẽ Histogram của ảnh mới
Đặt q = f(g) h(q) = card ({P | I(P) = q}) = card ({P|I(P) = f(g)}) = card ({P|g = f-1 (I(P))}) =
1 ( )
)(
q f i
i h
Histogram của ảnh mới thua được bằng cách chồng hình và tính giá trị theo các q (= f(g)) theo công thức tính trên Kết quả cuối thu được sau phép quay góc 90 thuận chiều kim đồng hồ
Trang 261.1.2.2 Nâng cao chất lƣợng ảnh bởi thao tác với vùng ảnh:
Phép cuộn và mẫu:
Giả sử ta có ảnh I kích thước M x N, mẫu T có kích thước m x n khi
đó, ảnh I cuộn theo mẫu T được xác định bởi công thức
0
) 1 , 1 (
* ) 1 , 1 ( ) 0 , 0 (
* ) , ( ) , (
* ) , ( )
, (
i j
T y x I T
y x I j i T j y i x I y
x
=I(x,y)+I(x+a,y+1) Tính theo công thức:
0
) , (
* ) , ( )
, (
m
i n
j
j i T j y i x I y
x
Trang 27),(
*),()
,(
m
i n
j
j i T j y i x I y
x
Nhận xét:
Trong quá trình thực hiện phép cuộn có một số thao tác ra ngoài ảnh, ảnh không được xác định tại những vị trí đó dẫn đến ảnh thu được có kích thước nhỏ hơn
Ảnh thực hiện theo công thức
0
),(
*),()
,(
m
i n
j
j i T j y i x I y
0
),(
*),()
giản ta sẽ hiểu phép cuộn là theo công thức
0
),(
*),()
,(
m
i n
j
j i T j y i x I y
x
1.1.2.3 Nâng cao chất lƣợng ảnh bởi một số kỹ thuật của phép toán hình thái học:
Phép toán hình thái cơ bản
Hình thái là thuật ngữ chỉ sự nghiên cứu về cấu trúc hay hình học topo của đối tượng trong ảnh Phần lớn các phép toán của "Hình thái" được định nghĩa từ hai phép toán cơ bản là phép "giãn nở" (Dilation) và phép "co" (Erosion)
Các phép toán này được định nghĩa như sau: Giả thiết ta có đối tượng
X và phần tử cấu trúc (mẫu) B trong không gian Euclide hai chiều Kí hiệu Bx là dịch chuyển của B tới vị trí x
Định nghĩa phép "giãn nở" (Dilation):
Phép "giãn nở" của X theo mẫu B là hợp của tất cả các Bx với x thuộc
X Ta có:
B x
B X
Trang 28Định nghĩa phép "co" (Erosion):
Phép "co" của X theo B là tập hợp tất cả các điểm x sao cho Bx nằm trong X Ta có:
XB = {x : Bx ⊆ X}
Ví dụ: Ta có tập X như sau:
Một số tính chất của phép toán hình thái:
Mệnh đề Tính gia tăng:
Trang 29Mệnh đề Tính phân phối với phép ∪:
Tương tự:
X ⊕ ( B ∪ B’) ⊇ X ⊕ B’
X ⊕ (B ∪ B’) ⊇ (X ⊕ B) ∪ (X ⊕ B’) (1) Mặt khác
∀y∈X⊕(B∪B')⇒∃x∈X sao cho y ∈ (B ∪ B’)x
⇒ X(B∪B’) ⊆ (XB) ∩ (XB’) (3) Mặt khác,
∀x ∈ (X B) ∩ (X B’) Suy ra,
Trang 30Ta có, X ∩ Y ⊆ X
⇒ (X ∩ Y) B ⊆ X B Tương tự: (X ∩ Y) B ⊆ Y B
⇒ (X ∩ Y) B ⊆ (X B) ∩ (Y B) (5) Mặt khác, ∀ x ∈ (X B) ∩ (Y B)
Trang 31B'x ⊆ X B ⇔ (B' ⊕ B)x ⊆ X Thật vậy, do
B'x ⊆ X B nên ∀y∈B'x ⇒ y∈X B
⇒ By ⊆ X
x B y
y
'
⇒ x (B' ⊕ B) x ⊆ X
Mặt khác, (B' ⊕ B)x ⊆ X ⇔ ( B'x ⊕ B) ⊆ X ⇔ B X
x B y
y
'
Trang 32Xương được coi như hình dạng cơ bản của một đối tượng, với số ít các điểm ảnh cơ bản Ta có thể lấy được các thông tin về hình dạng nguyên bản của một đối tượng thông qua xương Một định nghĩa xúc tích về xương dựa trên tính continuum (tương tự như hiện tượng cháy đồng cỏ) được đưa ra bởi Blum (1976) như sau: Giả thiết rằng đối tượng là đồng nhất được phủ bởi cỏ khô và sau đó dựng lên một vòng biên lửa Xương được định nghĩa như nơi gặp của các vệt lửa và tại đó chúng được dập tắt.
Hình 1.11: Ảnh gốc[7]
Hình 1.12: Ảnh xương [7]
Kỹ thuật tìm xương luôn là chủ đề nghiên cứu trong xử lý ảnh những năm gần đây Mặc dù có những nỗ lực cho việc phát triển các thuật toán tìm xương, nhưng các phương pháp được đưa ra đều bị mất mát thông tin Có thể chia thành hai loại thuật toán tìm xương cơ bản:
Trang 33- Các thuật toán tìm xương dựa trên làm mảnh
- Các thuật toán tìm xương không dựa trên làm mảnh
Sơ lƣợc về thuật toán làm mảnh:
Thuật toán làm mảnh ảnh số nhị phân là một trong các thuật toán quan trọng trong xử lý ảnh và nhận dạng Xương chứa những thông tin bất biến về cấu trúc của ảnh, giúp cho quá trình nhận dạng hoặc vectơ hoá sau này
Thuật toán làm mảnh là quá trình lặp duyệt và kiểm tra tất cả các điểm thuộc đối tượng Trong mỗi lần lặp tất cả các điểm của đối tượng sẽ được kiểm tra: nếu như chúng thoả mãn điều kiện xoá nào đó tuỳ thuộc vào mỗi thuật toán thì nó sẽ
bị xoá đi Quá trình cứ lặp lại cho đến khi không còn điểm biên nào được xoá Đối tượng được bóc dần lớp biên cho đến khi nào bị thu mảnh lại chỉ còn các điểm biên
Các thuật toán làm mảnh được phân loại dựa trên phương pháp xử lý các điểm là thuật toán làm mảnh song song và thuật toán làm mảnh tuần tự
Thuật toán làm mảnh song song, là thuật toán mà trong đó các điểm được xử lý theo phương pháp song song, tức là được xử lý cùng một lúc
Giá trị của mỗi điểm sau một lần lặp chỉ phụ thuộc vào giá trị của các láng giềng bên cạnh (thường là 8-láng giềng) mà giá trị của các điểm này đã được xác định trong lần lặp trước đó Trong máy có nhiều bộ vi xử lý mỗi vi xử lý sẽ xử
lý một vùng của đối tượng, nó có quyền đọc từ các điểm ở vùng khác nhưng chỉ được ghi trên vùng của nó xử lý
Trong thuật toán làm mảnh tuần tự các điểm thuộc đối tượng sẽ được kiểm tra theo một thứ tự nào đó (chẳng hạn các điểm được xét từ trái qua phải, từ trên xuống dưới) Giá trị của điểm sau mỗi lần lặp không những phụ thuộc vào giá trị của các láng giềng bên cạnh mà còn phụ thuộc vào các điểm đã được xét trước
đó trong chính lần lặp đang xét
Chất lượng của thuật toán làm mảnh được đánh giá theo các tiêu chuẩn được liệt kê dưới đây nhưng không nhất thiết phải thoả mãn đồng thời tất cả các tiêu chuẩn
Trang 34- Bảo toàn tính liên thông của đối tượng và phần bù của đối tượng
- Sự tương hợp giữa xương và cấu trúc của ảnh đối tượng
- Bảo toàn các thành phần liên thông
- Bảo toàn các điểm cụt
- Xương chỉ gồm các điểm biên, càng mảnh càng tốt
- Bền vững đối với nhiễu
- Xương cho phép khôi phục ảnh ban đầu của đối tượng
- Xương thu được ở chính giữa đường nét của đối tượng được làm mảnh
- Xương nhận được bất biến với phép quay
Một số thuật toán làm mảnh:
Trong phần này điểm qua một số đặc điểm, ưu và khuyết điểm của các thuật toán đã được nghiên cứu
1 Thuật toán làm mảnh cổ điển là thuật toán song song, tạo ra xương
8 liên thông, tuy nhiên nó rất chậm, gây đứt nét, xoá hoàn toàn một số cấu hình nhỏ
2 Thuật toán làm mảnh của Toumazet bảo toàn tất cả các điểm cụt không gây đứt nét đối tượng Tuy nhiên, thuật toán có nhược điểm là rất chậm, rất nhạy cảm với nhiễu, xương chỉ là 4-liên thông và không làm mảnh được với một số cấu hình phức tạp
3 Thuật toán làm mảnh của Y.Xia dựa trên đường biên của đối tượng,
có thể cài đặt theo cả phương pháp song song và tuần tự Tốc độ của thuật toán rất nhanh Nó có nhược điểm là gây đứt nét, xương tạo ra là xương giả (có độ dày là 2 phần tử ảnh)
4 Thuật toán làm mảnh của N.J.Naccache và R.Shinghal Thuật toán
có ưu điểm là nhanh, xương tạo ra có khả năng khôi phục ảnh ban đầu của đối tượng Nhược điểm chính của thuật toán là rất nhạy với nhiễu, xương nhận được phản ánh cấu trúc của đối tượng thấp
5 Thuật toán làm mảnh của H.E.Lu P.S.P Wang tương đối nhanh, giữ được tính liên thông của ảnh, nhưng lại có nhược điểm là xương tạo ra là xương 4-liên thông và xoá mất một số cấu hình nhỏ
Trang 356 Thuật toán làm mảnh của P.S.P Wang và Y.Y.Zhang dựa trên đường biên của đối tượng, có thể cài đặt theo phương pháp song song hoặc tuần tự, xương là 8-liên thông, ít chịu ảnh hưởng của nhiễu Nhược điểm chính của thuật toán là tốc độ chậm
7 Thuật toán làm mảnh song song thuần tuý nhanh nhất trong các thuật toán trên, bảo toàn tính liên thông, ít chịu ảnh hưởng của nhiễu Nhược điểm
là xoá hoàn toàn một số cấu hình nhỏ, xương tạo ra là xương 4-liên thông
Để tách được xương của đối tượng có thể sử dụng đường biên của đối tượng Với điểm p bất kỳ trên đối tượng, ta bao nó bởi một đường biên Nếu như có nhiều điểm biên có cùng khoảng cách ngắn nhất tới p thì p nằm trên trục trung vị Tập tất cả các điểm như vậy lập thành trục trung vị hay xương của đối tượng Việc xác định xương được tiến hành thông qua hai bước:
- Bước 1: tính khoảng cách từ mỗi điểm ảnh của đối tượng đến điểm biên gần nhất Như vậy cần phải tính toán khoảng cách tới tất cả các điểm biên của ảnh
- Bước 2: khoảng cách ảnh đã được tính toán và các điểm ảnh có giá
trị lớn nhất được xem là nằm trên xương của đối tượng
1.2.2 Bài toán xóa đối tượng nhỏ trong ảnh:
Với bài toán xoá đối tượng nhỏ trong ảnh, ta cài đặt chương trình thử nghiệm lọc trung vị
Đầu vào: Một ảnh nhiễu
Đầu ra: Ảnh đã khử nhiễu (bằng phương pháp lọc trung vị)
Hoạt động của chương trình:
Bước 1: Đưa một ảnh có định dạng JPG (hoặc PNG, BMP, GIF, JPEG) (bị ảnh hưởng của nhiễu)
Bước 2: Chương trình quét cửa sổ lọc lần lượt lên các thành phần của ảnh đầu vào; điền các giá trị được quét vào cửa sổ lọc
Bước 3: Xử lý bằng cách thao tác trên các thành phần của cửa sổ lọc
Bước 4: Sắp xếp theo thứ tự các thành phần trong cửa sổ lọc (lọc trung vị) Bước 5: Lưu lại thành phần trung vị, gán cho ảnh đầu ra (lọc trung vị) Buớc 6: Hiển thị ảnh kết quả
Trang 36a) Trước khi lấp lỗ hổng b) Sau khi lấp lỗ hổng
với kích thước là 10 c) Sau khi lấp lỗ hổng với kích thước là 20
Trang 37Chương 2 PHÁT HIỆN VÀ XÓA ĐỐI TƯỢNG NHỎ TRONG ẢNH
2.1 Phát hiện đối tượng nhỏ trong ảnh: [7]
2.1.1 Một số khái niệm cơ bản:
Chu tuyến:
Chu tuyến của một đối tượng ảnh là tập các điểm biên của đối tượng
p0,p1,,pN sao cho pi-1 và pi+1 là các 8-láng giềng của pi và p0= pN Chẳng hạn trong hình 2.2 biểu diễn chu tuyến của ảnh
Hình 2.1: Ma trận 8 láng giềng kề nhau[7]