Một số hình ảnh cho các bộ lọc không gian và kỹ thuật cân bằng màu với ảnh đen trắng trong chương trình thực nghiệm...46 3.3.2.. Một số hình ảnh cho các bộ lọc không gian và kỹ thuật cân
Trang 1LỜI CAM ĐOAN
Tôi xin cam đoan đây là kết quả nghiên cứu của riêng tôi Các kết quả đưa
ra là trung thực và chưa từng được ai công bố trong bất kỳ một tài liệu nào khác.Tôi xin cam đoan tất cả những thông tin được trích dẫn trong luận văn đãđược ghi rõ nguồn gốc
Hải Phòng, ngày 07 tháng 9 năm 2015
Trang 2LỜI CẢM ƠN
Để hoàn thành cuốn luận văn tốt nghiệp này, tôi xin được gửi lời cảm ơnđến toàn thể các thầy cô thuộc khoa Công nghệ thông tin đã tận tình giảng dạytrong suốt thời gian vừa qua đặc biệt là thầy TS Nguyễn Duy Trường Giang-người luôn nhiệt tình và nghiêm khắc trong quá trình dạy và hướng dẫn để tôi cóthể hoàn thành cuốn luận văn này
Một lần nữa, tôi xin chân thành cảm ơn!
MỤC LỤC
LỜI CAM ĐOAN iLỜI CẢM ƠN ii
Trang 3DANH MỤC TỪ VIẾT TẮT VÀ KÝ HIỆU v
DANH MỤC CÁC BẢNG vi
DANH MỤC CÁC HÌNH vii
MỞ ĐẦU 1
1 Tính cấp thiết của đề tài 1
2 Mục tiêu của đề tài 2
3 Đối tượng và phạm vi nghiên cứu 2
4 Phương pháp nghiên cứu 2
5 Dự kiến kết quả đạt được 2
CHƯƠNG I: GIỚI THIỆU CHUNG VỀ XLA VÀ NHỮNG 3
ỨNG DỤNG CỦA NÓ 3
1.1 Giới thiệu chung 3
1.2 Ứng dụng của XLA 5
1.3 Các vấn đề cơ bản trong XLA 7
1.3.1 PEL và ảnh số 7
1.3.2 Độ phân giải của ảnh 8
1.3.4 Mức xám của ảnh 9
1.3.5 Tăng cường ảnh 9
1.3.6 Khôi phục ảnh 10
1.3.7 Phân tích ảnh 11
1.3.8 Nén ảnh 12
CHƯƠNG II: CÁC BỘ LỌC KHÔNG GIAN 13
2.1 Lọc song phương 13
2.1.1 Giới thiệu 14
2.1.2 Ý tưởng 16
2.1.3 Trường hợp Gaussian 18
2.1.4 Lọc song phương so với phạm vi 19
2.1.5 Lọc song phương với ảnh đen trắng 21
2.1.6 Lọc song phương với ảnh màu 24
2.2 Bộ lọc NLM 26
2.2.1 Giới thiệu 26
Trang 42.2.2 Phương pháp nhiễu 28
2.2.3 Bộ lọc Gaussian 28
2.2.4 Lọc lân cận 28
2.2.5 Thuật toán NLM 29
2.3 So sánh hiệu quả của các bộ lọc 32
2.4 Bộ lọc làm sắc nét tuyến tính (Linear sharpen) 35
2.4.1 Mục đích và ý nghĩa 35
2.4.2 Bộ lọc làm sắc nét tuyến tính 35
2.5 Kỹ thuật cân bằng màu 38
2.5.1 Giới thiệu 38
2.5.2 Giả thiết Gray World 38
CHƯƠNG 3: CHƯƠNG TRÌNH THỬ NGHIỆM VỚI CÁC BỘ LỌC KHÔNG GIAN VÀ KỸ THUẬT CÂN BẰNG MÀU 40
3.1 Mục đích 40
3.2 Xây dựng chương trình thử nghiệm 40
3.2.1 Giới thiệu về OpenCV 40
3.2.2 Các bước tiến hành 41
3.3 Kết quả thực nghiệm 46
3.3.1 Một số hình ảnh cho các bộ lọc không gian và kỹ thuật cân bằng màu với ảnh đen trắng trong chương trình thực nghiệm 46
3.3.2 Một số hình ảnh cho các bộ lọc không gian và kỹ thuật cân bằng màu với ảnh màu trong chương trình thực nghiệm 48
KẾT LUẬN 51
TÀI LIỆU THAM KHẢO 52
DANH MỤC TỪ VIẾT TẮT VÀ KÝ HIỆU
Trang 5NLM Bộ lọc Non local-mean
PEL Điểm ảnh (Picture Element)
Trang 7DANH MỤC CÁC HÌNH
1.3 Hình ảnh mạch trước và sau khi được làm nổi 6
2.1 Ví dụ về hoạt động của bộ lọc không gian 13
2.4 Lọc song phương với các sigma khác nhau 22
2.11 Thực nghiệm về lọc nhiễu trên kết cấu tự nhiên 332.12 Thực nghiệm về lọc nhiễu trên kết cấu tự nhiên 332.13 Thực nghiệm về lọc nhiễu trên kết cấu tự nhiên 35
Trang 8MỞ ĐẦU
1 Tính cấp thiết của đề tài
Công nghệ thông tin (CNTT) đang giữ một vai trò quan trọng không chỉtrong các ngành công nghiệp, quân sự, nghiên cứu, giải trí…mà ngay cả trongđời sống và nhu cầu ngày ngày của con người Có rất nhiều các chuyên ngànhkhác nhau trong công nghệ công tin và trong số đó XLA là một chuyên ngànhquan trọng và đã có từ rất lâu đời
Xử lý ảnh (XLA) là một lĩnh vực mang tínhcông nghệvà khoa học Nó làmột ngành khoa học mới mẻ so với nhiều ngành khoa học khác nhưng tốc độphát triển của nó rất nhanh, thu hút các trung tâm nghiên cứu, ứng dụng, đặc biệt
là máy tính chuyên dụng dành riêng cho nó.XLA được ứng dụng để đáp ứng nhucầu thiết yếu của con người và xã hội Các ứng dụng nổi bật của XLA như nhậndạng vân tay, phục chế ảnh, giám sát thực thể, nhận dạng khuôn mặtdựng ảnh3D…đã đem lại nhiều lợi ích trong nhiều lĩnh vực
Con người thu nhận thông tin bằng thị giác, vì thế bất cứ ai cũng mongmuốn thu nhận được hình ảnh có chất lượng tốt Để có được những hình ảnhnhư vậy, bức ảnh ban đầu phải trải qua rất nhiều công đoạn và rất nhiều các kỹthuật được sử dụng để thay đổi và giúp nó có chất lượng tốt hơn như làm trơn,làm sắc nét, lọc nhiễu, cân bằng màu… Tiêu biểu và quan trọng trong số đó là
sử dụng các bộ lọc không gian
Hình ảnh thu được từ các thiết bị thu nhận số như camera, camcoderthường bị ảnh hưởng bởi các nhiễu và điều kiện sáng nên có thể bị mờ, quá tốihoặc quá sáng hoặc không nhấn mạnh được đối tượng chụp Điều đó gây khókhăn rất nhiều cho các công tác học tập, nghiên cứu và ứng dụng thực tiễn, nókhiến cho hiệu quả công việc giảm và độ chính xác không cao đặc biệt là trongcác lĩnh vực đòi hỏi sự tỉ mỉ và chính xác Để khắc phục điều này, các bộ lọckhông gian như lọc song phương, lọc Nonlocal-mean (NLM) và Linear sharpencùng kỹ thuật cân bằng màu sắc là những giải pháp tốt
Trang 9Xuất phát từ thực tế đó, tôi lựa chọn đề tài: “Cải thiện chất lượng ảnh dựatrên các bộ lọc không gian” Đây là vấn đề đã và đang được quan tâm và hứahẹn sẽ được tiếp tục phát triển trong tương lai phù hợp với thực tiễn và cuộcsống, đặc biệt là trong giai đoạn đất nước đang từng bước phát triển và đi lên,CNTT đang thực sự bùng nổ như ngày nay.
2 Mục tiêu của đề tài
Mục tiêu của đề tài là sử dụngcác bộ lọc không gian, kỹ thuật cân bằngmàu để nâng cao chất lượng hình ảnh từ các ảnh tĩnh và video Từ một bức ảnhđầu vào với chất lượng hình ảnh kém như bị nhiễu, mờ, không sắc nét, màu sắc
xa với thực tế, sau khi sử dụng các bộ lọc không gian và kỹ thuật cân bằng màu
sẽ đưa ra một kết quả tốt hơn: sắc nét, mượt,đảm bảo được các đường nét banđầu không mất đi và màu sắc gần hơn với thực tế
3 Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu của đề tài:
Các bộ lọc không gian: Lọc song phương, NLM, Linear sharpen tậptrung chủ yếu vào các thuật toán được sử dụng trong bộ lọc và cách thức hoạtđộng của chúng
Kỹ thuật cân bằng màu sắc
4 Phương pháp nghiên cứu
Trước tiên, nghiên cứu sẽ đưa ra các lý thuyết về XLA và các bộ lọc khônggian, kỹ thuật cân bằng màu được đề cập đến.Dựa trên nền tảng lý thuyết để xâydựng một chương trình thử nghiệmvới ảnh tĩnh và video
5 Dự kiến kết quả đạt được
Đưa ra được kết quả nghiên cứu về mặt lý thuyết: Ý nghĩa và ứng dụng củaXLA nói chung và các bộ lọc không gian, kỹ thuật cân bằng màu nói riêng trong
Trang 10khoa học công nghệ và đời sống.Đưa ra được kết quả của việc áp dụng lý thuyếttrên vào các hình ảnh thực tế thông qua chương trình thử nghiệm.
CHƯƠNG I: GIỚI THIỆU CHUNG VỀ XLA VÀ NHỮNG
ỨNG DỤNG CỦA NÓ 1.1 Giới thiệu chung
Khoảng hơn mười năm trở lại đây, XLA đã được đưa vào giảng dạy trongchương trình đại học ở nước ta Nó là môn học có liên quan đến nhiều lĩnh vực
và cần nhiều kiến thức cơ sở khác nhau Đầu tiên là xử lý tín hiệu số, đây là mộtmôn học cơ bản cho xử lý tín hiệu chung, các khái niệm về các bộ lọc hữuhạn,tích chập, các biến đổi Fourier, Laplace, … Thứ hai, các công cụ toán nhưđại số tuyến tính, sác xuất thống kê Bên cạnh đó là một số kiến thức cần thiếtnhư trí tuệ nhân tao, mạng nơ ron nhân tạo cũng được nhắc đến trong quá trìnhphân tích và nhận dạng ảnh Tiền đề của các phương pháp XLA là các ứng dụng:nâng cao chất lượng ảnh và phân tích ảnh Ứng dụng đi đầu được biết đến lànâng cao chất lượng ảnh báo truyền qua cáp từ London đến NewYork từ nhữngnăm 1920
Nâng cao chất lượng ảnh có liên quan đến việc phân bố mức sáng và độphân giải của ảnh Nâng cao chất lượng ảnh phát triển vào khoảng những năm
1955 Điều này là vì sau chiến tranh thế giới thứ hai, máy tính phát triển nhanhtạo điều kiện thuận lợi cho quá trình XLA số phát triển Năm 1964, máy tính đã
có khả năng xử lý, nâng cao chất lượng ảnh từ mặt trăng và vệ tinh Ranger 7 của
Mỹ cụ thể là: làm nổi đường biên, lưu ảnh Từ năm 1964 đến nay, các phươngtiện nâng cao và xử lý nâng cao chất lượng, nhận dạng ảnh đã phát triển khôngngừng Các phương pháp tri thức nhân tạo như các thuật toán xử lý cảitiến,mạng nơ ron nhân tạo, các công cụ nén ảnh đã ngày càng được áp dụngrộng rãi và gặt hái được nhiều kết quả khả quan Trước đây ảnh thu qua Camera
là các ảnh tương tự (loại Camera ống CCIR) Gần đây, với sự phát triển củacông nghệ, ảnh được lấy ra từ camera là ảnh đen trắng hoặc màu, sau đó nóđược chuyển trực tiếp thành ảnh số tạo thuận lợi cho xử lý tiếp theo (Ví dụ điển
Trang 11Thu nhận ảnh Biến đổi ảnh Nhận dạng và
nội suy
hình là máy ảnh số) Mặt khác, ảnh cũng có thể tiếp nhận qua vệ tinh, có thểđược quét từ ảnh chụp bằng máy quét ảnh
Biến đổi ảnh: Sau bước thu nhận, ảnh được biến đổi bằng việc sử dụngcác kỹ thuật nâng cao chất lượng ảnh để thu được ảnh có chất lượng tốt, chứađựng nhiều thông tin và có thể quan sát bằng mắt
Nhận dạng và nội suy ảnh: Nhận dạng ảnh là quá trình xác định ảnh.Quá trình này thu được bằng cách so sánh với mẫu chuẩn đã được học (hoặclưu) từ trước Nội suy là phán đoán dựa trên ý nghĩa trên cơ sở nhận dạng Vídụ: một loạt nét gạch ngang và chữ số trên phong bì có thể được nội suy thànhloại mã điện thoại Có nhiều cách phân loai ảnh khác nhau về ảnh Theo lýthuyết về nhận dạng, các mô hình toán học về ảnh được phân loại theo hai dạng
Trang 12nhận dạng ảnh cơ bản: Nhận dạng theo cấu trúc vànhận dạng theo tham số Một
số đối tượng nhận dạng phổ biến hiện nay được áp dụng trong khoa học và côngnghệ là: nhận dạng văn bản (Text),nhận dạng ký tự (chữ in, chữ ký điện tửchữviết tay), nhận dạng mã vạch, nhận dạng vân tay, nhận dạng mặt người…
Ảnh là một đối tượng khá phức tạp về độ sáng tối, đường nét, dung lượngPEL, môi trường để thu ảnh phong phú kèm theo nhiễu Trong nhiều khâu phântích và XLA ngoài việc đơn giản hóa các phương pháp toán học đảm bảo tiện lợicho xử lý, người ta mong muốn học hỏi quy trình tiếp nhận và XLA theo cáchcủa con người Trong các bước xử lý đó, nhiều khâu đã xử lý theo các phươngpháp trí tuệ con người Vì vậy, ở đây các cơ sở tri thức được phát huy
1.2 Ứng dụng của XLA
XLA có ứng dụng trong việc lưu trữ dữ liệu, tra cứu thông tin: Để giảmdung lượng lưu trữ ảnh, ảnh được nén dưới dạng *.jpg, *tif
Ứng dụng trong việc nhận dạng: Nhận dang khuôn mặt, vân tay, chữ số, ký
tự, biển số xe…Ứng dụng trong việc xác thực: Xác thực đăng nhập windown 8bằng hình ảnh…
Hình 1.2: Nhận dạng biển số xe
Trong y học, XLA cũng có vai trò rất quan trọng trong việc đưa ra nhữnghình ảnh có chất lượng cao, rõ nét, giúp cho việc chẩn đoán bệnh khách quan,nhanh chóng và chính xác hơn Trong đó, việc làm nổi các chi tiết trong ảnh làmột trong những ứng dụng quan trọng và có ỹ nghĩa
Trang 13Hình 1.3: Hình ảnh mạch trước và sau khi được làm nổi (từ trái qua phải)
Trong công nghiệp, XLA có ứng dụng trong việc xấy dựng các hệ thốngmáy nhìn công nghiệp để kiểm tra và điều khiển các sản phẩm: Hệ thống phântích hình ảnh nhằm phát hiện bọt khí bên trong vật thể được đúc bằng nhựa, pháthiện các linh kiện không đạt tiêu chuẩn trong sản xuất, từ camera quan sát, đếmđược sản phẩm dựa vào hệ thống đếm sản phẩm
Hình 1.4: Ứng dụng của XLA trong công nghiệp
Trang 14XLA còn có ứng dụng hiệu quả trong việc dấu dữ liệu để phục vụ cho việc trao đổi thông tin mật Cụ thể như : Dấu tin trong ảnh, dấu video trong ảnh hay dấu ảnh trong ảnh.
Hình 1.5: Ảnh giấu tin : Ảnh bên trái là được giấu tin, đoạn văn bản bên
phải là đoạn văn bản được giấu trong ảnh
1.3 Các vấn đề cơ bản trong XLA
1.3.1 PEL và ảnh số
Gốc của ảnh hay gọi là ảnh tự nhiê là ảnh liên tục về độ sáng và khônggian Để xử lý bằng máy tính (số) thì hình ảnh cần phải được số hoá Sự biến đổigần đúng một ảnh liên tục thành một tập điểm phù hợp với ảnh thật về độ sáng(mức xám)và vị trí (không gian) gọi là số hóa ảnh Khoảng cách giữa các PELnày được thiết lập sao cho mắt người không thể phân biệt được ranh giới giữachúng Mỗi một điểm như vậy gọi là điểm ảnh (PEL: Picture Element) hay gọitắt là Pixel Trong phạm vi ảnh hai chiều, mỗi pixel ứng với tọa độ (x, y)
Định nghĩa: PEL (pixel) là một phần tử có toạ độ (x, y) của ảnh số với độmàu hoặc xám nhất định Kích thước và khoảng cách giữa các PEL đó đượcchọn phù hợp sao cho mắt người cảm nhận sự liên tục về không gian và mứcxám (hoặc màu) của ảnh số gần như ảnh thật Mỗi một phần tử trong ma trậnđược xem là một phần tử ảnh
Ảnh số là tập hợp các PEL với mức xám phù hợp dùng để mô tả ảnh gần với ảnh thật
Trang 151.3.2 Độ phân giải của ảnh
Định nghĩa: Độ phân giải của ảnh là mật độ PEL được ấn định trên một ảnhsố
Theo định nghĩa, khoảng cách giữa các PEL phải được thiết lập sao chomắt người thấy được sự liên tục của ảnh Việc lựa chọn khoảng cách phù hợp tạonên một mật độ phân bố, đó chính là độ phân giải và được phân bố theo trục y
và trong không gian hai chiều
Ví dụ: Độ phân giải của ảnh trên màn hình CGA là một lưới điểm theochiều ngang màn hình: 320 điểm theo chiều dọc * 200 PEL (320*200) Thực tế
là, cùng màn hình CGA 12 inh ta nhận thấy mịn hơn màn hình CGA 17 inh độphân giải 320*200 Lý do là vì cùng một mật độ (độ phân giải) nhưng diện tíchmàn hình rộng hơn thì độ mịn (liên tục của các PEL) kém hơn
Trang 16Hình 1.6: Sự phân bố PEL: Số lượng PEL phân bố tăng dần trên cùng một
kích thước ảnh
1.3.4 Mức xám của ảnh
Một PEL (một pixel) có hai đặc trưng cơ bản là độ xám của nóvà vị trí (x,y) của PEL Dưới đây là một số khái niệm và thuật ngữ thường được đề cập tớitrong XLA
Định nghĩa: Mức xám của PEL là cường độ sáng của PEL được gán bằnggiá trị số tại điểm đó
Các thang giá trị mức xám thông thường: 16, 32, 64, 128, 256 Mức 256
là mức phổ dụng nhất
Ảnh đen trắng: là ảnh có hai màu trắng và đen(không chứa màu khác)với mức xám ở các PEL có thể khác nhau
Ảnh nhị phân: ảnh chỉ có 2 mức trắng đen phân biệt tức là dùng 1 bit
mô tả 21 mức khác nhau Nói theo một cách khác: mỗi PEL của ảnh nhị phânchỉ có thể là 1 hoặc 0
Ảnh màu: trong phạm vi lý thuyết ba màu RBG(Red, Blue, Green) đểtạo nên thế giới màu, người ta thường dùng 3 byte để mô tả mức màu, khi đó cácgiá trị màu: 28*3=224≈ 16,7 triệu màu
1.3.5 Tăng cường ảnh
Tăng cường ảnh là việc giảm nhiễu ảnh, tăng độ tương phản giữa các cấutrúc Các kỹ thuật tăng cường ảnh còn tăng cường các thuộc tính cảm nhận làmcho ảnh tốt lên, tiện phục vụ cho các xử lý tiếp theo
Các kỹ thuật tăng cường ảnh gồm kỹ thuật phi tuyến, tuyến tính, thíchnghi, cố định, kỹ thuật dựa vào pixel hay kỹ thuật đa mức Các kỹ thuật đượcchia làm hai nhóm: Nhóm tăng cường ảnh trong miền không gian và nhóm phụchồi ảnh trong miền tần số
Các thao tác chính: Làm sắc nét đường biên, lọc phi tuyến, lọc tuyến tính,phóng to, thu nhỏ, làm trơn, thay đổi độ tương phản, sửa đổi mức xám đồ…
Trang 17 Thay đổi độ tương phản: Trong thực tế, khi hai đối tượng có cùng độ sángđặt ở hai nền khác nhau thì sẽ cho ta những cảm nhận khác nhau Chính vì vậy,
độ tương phản thể hiện sự thay đổi độ sáng của đối tượng so với nền, hiểu theomột cách khác thì độ tương phản là độ nổi của PEL so hay một vùng ảnh so vớinền Do điều kiện sáng tối khác nhau hay do biến động của bộ cảm nhận ảnh
mà ảnh của độ tương phản khác nhau Để thay đổi độ tương phản của ảnh thì taphải thay đỏi biên độ trên toàn dải bằng cách biến đổi tuyến tính biên độ đầuvào hay phi tuyến
Lọc tuyến tính: Bao gồm lọc thông thấp, đồng hình và trung bình, loại lọcnày được dùng cho các loại nhiễu phân bố khắp ảnh (nhiễu cộng và nhiễunhân)
Lọc phi tuyến: Bao gồm lọc trung vị, giả trung vị và lọc ngoài Loại lọcnày dùng cho các loại nhiễu gây đột biến tại một PEL (nhiễu xung)
có được ảnh gần nhất với ảnh gốc Nguyên nhân gây ra sự suy giảm ảnh có rấtnhiều và khôi phục ảnh là một trong những lĩnh vực quan trọng trong xử lý hìnhảnh Nguyên nhân của sự suy giảm thường bao gồm mờ và nhiễu Mờ có thể dođối tượng trong hình ảnh bị mất nét khi phơi sáng, trong khi chuyển động mờ cóthể được gây ra khi một đối tượng di chuyển so với máy ảnh khi phơi sáng Mụcđích của phục hồi hình ảnh là để " bù" hoặc "khôi phục" sai hỏng- những cái đã
Trang 18làm suy giảm hình ảnh Suy giảm có nhiều hình thức như chuyển động làm mờ,nhiễu, mất tiêu cự camera Trong trường hợp như làm mờ chuyển động, có thểđưa ra một ước lượng rất tốt so với mờ thực tế và "khôi phục" mờ để khôi phụclại hình ảnh gốc Trường hợp ảnh bị lỗi bởi nhiễu, có thể thực hiện bù nhiễu.
Hình 1.8: Khôi phục ảnh Từ trái qua phải: phần ảnh trước và sau khi được khôi phục
1.3.7 Phân tích ảnh
Mục đích: Đưa ra ra các đặc trưng của ảnh, xây dựng mối quan hệ giữachúng dựa vào các đặc trưng cục bộ.Tìm biên, tách biên, , phân vùng ảnh,làmmảnh đường biên và phân loại đối tượng là các thao tác chính trong phân tíchảnh Các phương pháp chính là phát hiện biên cục bộ, dò biên theo quy hoạchđộng, phân vùng theo miền đồng nhất, phân vùng dựa theo đường biên
Như chúng ta biết, biên là vẫn đề chủ yếu trong phân tích ảnh vì các kỹ thuậtphân đoạn ảnh dựa trên biên là chủ yếu Tập hợp các điểm biên tạo lên biên củahình ảnh, mỗi PEL có thể xem là điểm biên nếu có sự thay đổi mức xám độtngột ở đó Có hai phương pháp phát hiện biên chính là: Phát hiện biên gián tiếp
và phát hiện biên trực tiếp
Biên ảnh là những vùng có cường độ tương phản mạnh, dò biên giúp lọc ranhững thông tin hữu ích trong ảnh mà vẫn giữ được những thuộc tính cấu trúccủa hình ảnh Gradient và Laplacian là hai phương pháp dò biên cơ bản.Gradient dò biên bằng việc tìm kiếm giá trị lớn nhất và giá trị bé nhất trong đạohàm bậc nhất của ảnh, còn Laplacian thì tìm kiếm các vạch không trong đạohàm bậc hai của ảnh
Trang 19Hình 1.9:Kết quả của một phép dò biên
1.3.8 Nén ảnh
Nén ảnh là một kỹ thuật mã hoá các ảnh số hoá để giảm số lượng các bit
dữ liệu cần thiết để biểu diễn ảnh, giảm đi chi phí trong việc lưu trữ ảnh và chiphí về mặt thời gian để truyền ảnh đi xa trong truyền thông nhưng vẫn đảm bảođược chất lượng của ảnh
Nén ảnh thực hiện được là do: thông tin trong bức ảnh không phải là ngẫunhiên mà có trật tự, tổ chức.Vì thế nếu làm rõ được trật tự, cấu trúc đó thì sẽ biếtphần thông tin nào quan trọng nhất trong bức ảnh để biểu diễn và gửi đi với sốlượng bit ít hơn so với ảnh gốc mà vẫn đảm thông tin có được một cách đầy đủ
Ở bên nhận quá trình giải mã sẽ sắp xếp và tổ chức lại được bức ảnh xấp xỉ gầnchính xác so với ảnh gốc nhưng vẫn thỏa mãn chất lượng yêu cầu
Nén ảnh có được bằng cách loại bỏ các phần dư thừa trong ảnh đã được sốhoá Dư thừa có thể là dư thừa về cấp xám, dư thừa thông tin về không gian hay
dư thừa về thời gian
Có hai phương pháp nén ảnh cơ bản là: Nén không mất thông tin, nén mất thôngtin
Nén mất thông tin: Khai thác các thông tin dư thừa và các thông tinkhông liên quan
Nén không mất thông tin: Khai tác các thông tin dư thừa
Hiện nay có một số chuẩn nén hay dùng như: JPEG, MPEG…
Trang 20CHƯƠNG II: CÁC BỘ LỌC KHÔNG GIAN
Trong quá trình XLA chúng ta có thể sử dụng các mặt nạ không giannhằm làm thay đổi cấu trúc ảnh gọi là các bộ lọc không gian
Một bộ lọc không gian là một hoạt động ảnh mà trong đó mỗi giá trị PEL
bị thay thế bởi một hàm của cường độ các PEL trong vùng lân cận của
Hình 2.1: Ví dụ về hoạt động của bộ lọc không gian
Bên cạnh việc giảm nhiễu, làm mượt hình ảnh,các bộ lọc không gian cònlàm sắc nét các chi tiết và giữ lại những cấu trúc đẹp trong hình ảnh Dưới đây làcác bộ lọc được đề cập đến trong đề tài
2.1 Lọc song phương
Song phương là một bộ lọc vừa làm mượt ảnh đồng thời vẫn giữ được cácđường nét của ảnh bằng sự kết hợp phi tuyến tính của các giá trị PEL lân cận.Phương pháp này không lặp đi lặp lại, cục bộ và đơn giản Nó kết hợp các mứcmức xám hoặc màu sắc dựa trên cả sự mật thiết hình học và tương tự về trắcquang của chúng, và ưu tiên giá trị gần hơn giá trị xa trong cả miền và phạm vi.Ngược lại với các bộ lọc hoạt động riêng biệt trên ba dải của một ảnh màu, bộlọc song phương có thể thực thi các số liệu cơ bản về nhận thức màu CIE-Lab,làm mịn màu, và giữ gìn các đường nét để phù hợp với nhận thức của con người.Ngoài ra, trong sự tương phản với việc lọc tiêu chuẩn, lọc song phương khôngtạo ra màu sắc ảo dọc theo các đường nét trong ảnh màu mà làm giảm màu sắc
ảo xuất hiện trong hình ảnh ban đầu
Trang 212.1.1 Giới thiệu
Lọc có lẽ là hoạt động cơ bản nhất của XLA và thị giác máy tính Trong ýnghĩa rộng của thuật ngữ "lọc", các giá trị của hình ảnh được lọc tại một điểm làmột hàm của các giá trị ảnh đầu vào trong một tập hợp giá trị lân cận của cùngmột vị trí Đặc biệt, lọc thông thấp Gaussian tính toán trung bình các giá trị PELđược đánh trọng số trong một tập hợp giá trị lân cận, trong đó, trọng số giảmtheo khoảng cách từ khu trung tâm lân cận Mặc dù những lời giải thích chínhthức và mang tính định lượng về việc suy giảm trọng số đã được đưa ra, theotrực giác hình ảnh thường thay đổi từ từ trong không gian, vì thế các PEL gầnnhau có thể có các giá trị tương tự, và vì vậy việc tính trung bình chúng là thíchhợp Giá trị nhiễu làm hỏng các PEL ở gần nó là có ít tương quan lẫn nhau hơn
so với giá trị tín hiệu, vì vậy nhiễu được lấy trung bình trong khi tín hiệu đượcgiữ nguyên Các giả định về các biến thể không gian thất bại tại các đường nétnhững cái bị làm mờ đi bởi bộ lọc thông thấp Nhiều nỗ lực đã được cống hiến
để giảm ảnh hưởng không mong muốn này Một câu hỏi đặt ra là: Làm thế nàochúng ta có thể ngăn chặn việc trung bình hóa trên các đường nét, trong khi vẫntrung bình hóa trong các khu vực cần làm mịn?
Sự khuếch tán bất đẳng hướng là một câu trả lời phổ biến: biến hình ảnhcục bộ được đo tại mọi điểm, và giá trị PEL được tính trung bình từ các vùnglân cận nơi mà kích thước và hình dạng của nó phụ thuộc vào biến cục bộ.Phương pháp khuếch tán tính trung bình trên các vùng miền được mở rộng bằngcách giải quyết từng phần phương trình vi phân, và được lặp đi lặp lại Việc lặp
đi lặp lại có thể làm tăng các vấn đề về tính ổn định và tùy thuộc vào hiệu quảcủa kỹ thuật tính toán Một phương pháp không lặp đi lặp lại được đề xuất choviệc duy trì độ mịn của đường nét
Nếu ba dải màu sắc hình ảnh được lọc riêng rẽ ra từ một cái khác, màu sắc
bị hỏng gần đường biên ảnh Trong thực tế, các dải khác nhau có mức độ khácnhau của sự tương phản, và chúng được làm mịn khác nhau Làm mịn tách biệtxáo trộn sự cân bằng màu sắc, và sự kết hợp màu sắc không mong đợi xuất hiện.Nhưng với bộ lọc song phương, nó có thể hoạt động trên ba dải cùng một lúc,
Trang 22và có thể đưa ra một cách rõ ràng rằng màu sắc nào là tương tự và màu sắc nào
là không
Ý tưởng lọc song phương cơ bản là để thực hiện trong phạm vi của mộthình ảnh những gì mà các bộ lọc truyền thống làm trong phạm vi của nó HaiPEL có thể được gép với nhau để chiếm vị trí không gian kế bên, hoặc có thể làtương tự như nhau để có các giá trị kế bên, có thể trong một cách có ý nghĩa vềmặt nhận thức Việc gắn kết liên quan đến vùng lân cận trong miền, tương tự vớivùng lân cận trong phạm vi Lọc truyền thống là lọc miền, thực thi việc gắn kếtbằng việc đánh trọng số các giá trị PEL với hệ số dưới với khoảng cách Tương
tự như vậy, chúng tôi xác định phạm vi lọc mà trong đó trung bình giá trị PELvới trọng số phân rã không giống nhau Lọc phạm vi là phi tuyến vì trọng sốcủa chúng phụ thuộc vào cường độ hoặc màu sắc hình ảnh Tính toán, chúng có
vẻ gì phức tạp hơn các bộ lọc tiêu chuẩn không tách rời Nhưng quan trọng nhất,chúng có thể giữ lại các đường nét hình ảnh
Miền không gian vẫn là một khái niệm rất quan trọng Trong thực tế, chúng
ta thấy rằng lọc phạm vi tự nó làm biến dạng bản đồ màu sắc của hình ảnh Khikết hợp lọc phạm vi và miền, thấy rằng sự kết hợp là khá thú vị Đó gọi là lọcsong phương Do lọc song phương giả định một khái niệm rõ ràng về khoảngcách trong phạm vi và trong giới hạn chức năng ảnh, chúng có thể được áp dụngcho bất kỳ chức năng nào khi mà hai khoảng cách có thể được xác định Đặcbiệt, bộ lọc song phương có thể được áp dụng cho ảnh màu dễ dàng như áp dụngcho ảnh đen trắng Các không gian màu CIE-Lab tạo ra không gian màu sắc vớimột phương pháp có ý nghĩa nhận thức tương tự màu sắc, trong đó khoảng cáchEuclide ngắn tương quan mạnh mẽ với màu sắc mà con người có thể phân biệt
Vì vậy, nếu chúng ta sử dụng số liệu này trong bộ lọc song phương, hình ảnh sẽđược làm mịn và đường nét được giữ theo cách đó được điều chỉnh tới cách thểhiện của con người Chỉ có màu sắc tương tự về nhận thức được tính trung bìnhvới nhau, và chỉ những đường nét có tính nhận thức và có thể nhìn thấy mớiđược giữ lại Các khái niệm về lọc song phương sẽ được đề cập dưới đây
Trang 23Nếu bộ lọc là thay đổi bất biến, c (; x) chỉ là một hàm của sự khác biệtvector , và là không đổi.
Lọc phạm vi được định nghĩa tương tự:
Ngoại trừ rằng đo sự tương quang giữa các PEL ở trung tâm vùng ảnh x vàcủa một điểm gần đó Như vậy, các hàm tương tự s hoạt động trong phạm vi củahàm hình ảnh f, trong khi hàm ghép c hoạt động trong miền của f Việc chuẩnhóa hằng số (2) được thay thế bởi:
Trái với những gì xảy ra với các hàm tương đồng c, chuẩn hóa cho các hàmtương tự s phụ thuộc vào hàm hình ảnh f Chúng ta nói rằng các hàm tương tự s
là không thiên vị nếu nó chỉ phụ thuộc vào sự khác biệt Sự phân bố không giancủa các cường độ ảnh không có vai trò trong lọc phạm vi được thực hiện bởichính nó Kết hợp cường độ từ toàn bộ ảnh, tuy nhiên, làm ít hơn, vì giá trị hìnhảnh xa x nên không ảnh hưởng đến giá trị cuối cùng tại x Ngoài ra, lọc phạm vichỉ đơn thuần là thay đổi bản đồ màu của một hình ảnh, và do đó ít được sửdụng Các giải pháp thích hợp là kết hợp lọc miền và lọc phạm vi, qua đó thựcthi cả hai miền hình học và trắc quang Lọc kết hợp có thể được mô tả như sau:
Với chuẩn hóa
Trang 24Kết hợp lọc miền và phạm vi sẽ được thể hiện như lọc song phương Nóthay thế các giá trị PEL tại x với trung bình của các giá trị PEL tương tự lân cận.Trong khu vực được làm mịn, giá trị PEL trong một vùng tương đồng nhỏtương tự như các khu khác, và các hàm tương tự được chuẩn hóa s là giốngnhau Như một hệ quả, các bộ lọc song phương đóng vai trò cơ bản như một bộlọc miền tiêu chuẩn, những khác biệt tương quan yếu giữa các giá trị PEL gây rabởi nhiễu.
Bây giờ một ranh giới rõ ràng giữa một vùng tối và vùng sáng, như tronghình 2.2(a) Khi bộ lọc song phương được tập trung, nói rằng, trên một PEL ởbên sáng của đường biên, các hàm tương tự s của các giá trị giả định gần 1 chocác PEL trên cùng một bên, và gần 0 cho các PEL ở bên tối Các hàm tương tựđược thể hiện trong hình 2.2(b) cho một bộ lọc hỗ trợ tập trung hai PEL bênphải của các bước trong hình 2.2(a) Việc chuẩn hóa thuật ngữ đảm bảo rằngcác trọng số cho tất cả các PEL tăng thêm một Kết quả là, các bộ lọc thay thếcác PEL sáng trung tâm bằng trung bình của các PEL sáng trong vùng lân cậncủa nó, và về cơ bản bỏ qua các PEL tối Ngược lại, khi bộ lọc tập trung vào mộtPEL tối, các PEL sáng được bỏ qua thay thế Vì vậy, như thể hiện trong hình2.2(c), việc lọc được thực hiện tốt tại các ranh giới, nhờ vào thành phần của lọcmiền, và các cạnh sắc nét được giữ lại đồng thời, nhờ thành phần của lọc phạmvi
Hình 2.2: Lọc song phương (a) Một bước cấp độ màu xám 100 bị nhiễu loạn bởi nhiễu Gaussian với các mức xám (b) Kết hợp trọng số tương tự cho một vùng lân cận tập trung hai PEL-bên phải của bước (a) Các thành phần
Trang 25của lọc phạm vi ngăn chặn hiệu quả các PEL trên bên tối (c) Bước (a) sau khi
lọc song phương với = 50 mức xám và = 5 PEL.
2.1.3 Trường hợp Gaussian
Một trường hợp đơn giản và quan trọng của lọc song phương là lọcGaussian thay đổi bất biến, trong đó cả hai hàm tương đồng và hàm tương tự
là những hàm Gaussian của khoảng cách Euclide giữa các đối số đó Cụ thể hơn,
c là đối xứng xuyên tâm
Trong đó :
là khoảng cách Euclide giữa Hàm tương tự s là hoàn toàn giống như c:
Trong đó :
là một phương pháp đo phù hợp của khoảng cách giữa hai giá trị cường độ
và f Trong các trường hợp vô hướng, điều này có thể đơn giản là chênh lệchtuyệt đối của sự khác biệt PEL hay vì nhiễu tăng với cường độ ảnh, một phiênbản phụ thuộc cường độ của nó
Sự mở rộng hình học trong miền được lựa chọn dựa trên số lượng mongmuốn của lọc thông thấp Một lượng lớn sẽ làm mờ nhiều hơn, có nghĩa là, nókết hợp các giá trị từ vị trí xa hình ảnh Ngoài ra, nếu một hình ảnh được thu nhỏhoặc phóng to, phải được điều chỉnh cho phù hợp để có được kết quả tươngđương Tương tự như vậy, sự mở rộng trắc quang trong phạm vi hình ảnh đượcthiết lập để đạt được số lượng mong muốn các PEL được kết hợp Có thể nói,PEL có giá trị gần hơn với cái khác được trộn lẫn với nhau và giá trị xa hơn thìkhông Nếu ảnh bị khuếch đại hoặc suy giảm, phải được điều chỉnh cho phùhợp để kết quả không thay đổi
Trang 262.1.4 Lọc song phương so với phạm vi
Khi ta kết hợp việc lọc phạm vi với việc lọc miền để tạo ra các bộ lọc songphương Ta thấy rằng sự kết hợp này là điều cần thiết Để kí hiệu đơn giản, lýthuyết giới hạn với hình ảnh đen trắng, nhưng những kết quả tương tự vẫn ápdụng tốt cho hình ảnh gồm nhiều dả Điểm chính ở đây là cho thấy việc lọcphạm vi chỉ đơn thuần là thay đổi bản đồ xám của ảnh được áp dụng Đây là một
hệ quả trực tiếp của thực tế là một bộ lọc phạm vi không có khái niệm về khônggian
Hãy xem là được sự phân bố tần số của các mức xám trong những hìnhảnh đầu vào Trong trường hợp rời rạc là biểu đồ các cấp độ màu xám : là một sốnguyên điển hình nằm trong dải từ 0 đến 255, và là một phần của PEL có giá trịmàu xám của Trong trường hợp liên tục là một phần của vùng ảnh có giá trịxám giữa và
Thao tác đơn giản, bỏ qua cho sự thiếu hụt về không gian, chỉ ra rằng cácbiểu thức cho bộ lọc phạm vi có thể được kết hợp như sau:
Trong đó :
(2.11)
độc lập với vị trí x Phương trình (7) cho thấy việc lọc phạm vi là một chuyểnđổi đơn giản về mức độ xám Các ánh xạ hạt nhân là hàm mật độ, trong đó nó làkhông âm và có đơn vị tích phân Nó bằng với biểu đồ được đánh trọng sốhàm tương tự s được tập trung tại f và chuẩn hóa cho đơn vị diện tích Trong đóchính thức là một hàm mật độ
Trang 27Hình 2.3: Biểu đồ cường độ ảnh(a)Mộtbiểu đồ ảnh đơn thức (solid), và chức năng tương tự Gaussian s(nét đứt) Sản phẩm chuẩn hóa của chúng (chấm) là bị lệch sang bên phải (b) Biểu đồ (solid) của cường độ ảnh cho các bước trong hình 2.2(a) và (nét đứt) cho ảnh được lọc trong hình 2.2(c) (c) Biểu
đồ của cường độ ảnh cho ảnh trong hình 2.6(a)(solid) và cho các ảnh đầu ra với
=100, =3 (nét đứt) và với =100, =10 (chấm) từ hình 2.4.
Trong thực tế, giả sử rằng các biểu đồ của hình ảnh đầu vào là một đườngcong đứt như trong hình 2.3 (a), và xem xét giá trị đầu vào của f nằm ở cả haibên của đường cong hình chuông này Trong đó các hàm tương tự đối xứng sđược tập trung tại f, trên sườn lên của biểu đồ, các sản phẩm sản xuất mật độlệch ) Ở phía bên trái của chiếc chuông, bị nghiêng về bên phải, và ngược lại
Kể từ khi chuyển đổi giá trị là trung bình của mật độ lệch này, chúng ta có ởphía bên trái và ở phía bên phải Như vậy, hai cánh của biểu đồ được nén lại vớinhau
Lúc đầu, kết quả cho thấy rằng lọc phạm vi là một ánh xạ đơn giản của bản
đồ màu xám dường như làm cho lọc phạm vi khá không hiệu quả Mọi thứ khác
đi khi lọc phạm vi được kết hợp với bộ lọc miền để tạo thành lọc song phương,như thể hiện trong phương trình (5) và (6) Trong thực tế, xem xét đầu tiên mộthàm miền tương đồng c là hằng số trong một cửa sổ tâm tại x, và là 0 ở chỗkhác Sau đó, các bộ lọc song phương chỉ đơn giản là một bộ lọc phạm vi ápdụng cho các cửa sổ Ảnh được lọc vẫn là kết quả của một ánh xạ cục bộ củabản đồ màu xám, nhưng rất thú vị, bởi vìánh xạ là khác nhau tại các điểm khácnhau trong hình ảnh
2.1.5 Lọc song phương với ảnh đen trắng
Chúng ta tiếp tục phân tích hiệu suất của bộ lọc song phương trên hình ảnhđen trắng Hình 2.6(a) và 2.6(b) bên đưới cho thấy khả năng của bộ lọc songphương cho việc loại bỏ các cấu trúc Một số lượng lượng tử hóa mức xám cóthể được nhìn thấy trong hình 2.6(b), nhưng điều này là do quá trình in ấn,không phải bởi bộ lọc Những hình ảnh "đơn giản hóa" minh họa bằng hình2.6(b) có thể cho thấy ích lợicủa việc nén dữ liệu mà không mất đặc tính hình
Trang 28dạng tổng thể trong các ứng dụng như truyền hình ảnh, chỉnh sửa hình ảnh vàthao tác, mô tả hình ảnh cho phục hồi Chú ý rằng trong bức ảnh con vượn châuPhi thì râu của nó mỏng hơn so với cửa sổ của bộ lọc và vẫn còn sắc nét sau khilọc Các giá trị cường độ PEL tối được tính trung bình từ cả hai phía của râu,trong khi các PEL sáng từ râu được bỏ qua bởi vì các thành phần phạm vi của bộlọc Ngược lại, khi các bộ lọc tập trung ở đâu đó trên râu thì chỉ có giá trị PELtại râu được tính trung bình với nhau.
Hình 2.4 cho thấy ảnh hưởng của các giá trị khác nhau của thông số và trênảnh kết quả Các hàng tương ứng với số lượng khác nhau của lọc miền, cột là sốlượng khác nhau của lọc phạm vi Khi giá trị của hằng số lọc phạm vi là lớn(100 hoặc 300) đối với các giá trị phạm vi tổng thể trong ảnh (từ 1 đến 254), cácthành phần phạm vi của các bộ lọc có tác dụng rất ít tới : tất cả các giá trị PELtrong bất kỳ khu vực có cùng trọng số từ lọc phạm vi, và lọc miền hoạt độngnhư một bộ lọc Gaussian chuẩn Hiệu ứng này có thể được nhìn thấy trong haicột cuối cùng của hình 2.4 Đối với giá trị nhỏ hơn thông số lọc dải (10 hoặc30), lọc phạm vi chiếm ưu thế về mặt nhận thức, vì nó duy trì đường nét
Tuy nhiên, cho = 10, chi tiết hình ảnh đã được loại bỏ bởi giá trị nhỏ hơnlại xuất hiện Điều này dường như là nghịch lý hiệu quả có thể được nhận thấy ởhàng cuối cùng của hình 2.4, và trong mẫu đặc biệt ấn tượng cho = 100, = 10này hình ảnh sinh động hơn ở trên, mặc dù hơi mờ Đây là kết quả của việcchuyển đổi bản đồ màu xám và kết quả nén biểu đồ Trong thực tế, = 10 là mộtGaussian rộng, và bộ lọc song phương một bộ lọc phạm vi Vì giá trị cường độchỉ được ánh xạ bởi một bộ lọc phạm vi, việc mất đi các chi tiết không xảy ra.Hơn nữa, kể từ khi một bộ lọc phạm vi nén các biểu đồ hình ảnh, những hìnhảnh đầu ra dường như là mơ hồ Hình 2.3(c) cho thấy các biểu đồ cho các hìnhảnh đầu vào và cho hai hình ảnh đầu ra cho = 100, = 3, và cho =100, = 10
Trang 29Hiệu quả nén là hiển nhiên.
Hình 2.4: Chi tiết từ hình 2.6(a) được xử lý với các bộ lọc song phương với các
giá trị phạm vi và các thông số miền khác nhau
Lọc song phương với các thông số = 3 và = 50 giá trị cường độ PELđược
áp dụng cho các hình ảnh trong hình 2.5(a) và 2.5(b) Chú ý rằng hầu hết các cấutrúc tốt đã được lọc đi, và tất cả các đường nét là sắc nét như trong ảnh gốc
Về thời gian tính toán, các bộ lọc song phương chậm hơn hai lần so vớimột bộ lọc miền không phân chia của cùng một kích thước Các thành phần dảiphụ thuộc phi tuyến trên hình ảnh, và không thể tách rời Một thủ thuật đơn giản