Ngay với hệ luật mờ đơn giản sau R1: If luminance input is dark then luminance output is darker R2: If luminance input is bright then luminance output is brighter R3: If luminance inpu
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC
VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ
_
NGUYỄN VĂN QUYỀN
NGHIÊN CỨU NÂNG CAO ĐỘ TƯƠNG PHẢN ẢNH
THEO TIẾP CẬN ĐẠI SỐ GIA TỬ
Chuyên ngành: Cơ sở toán học cho tin học
Mã số: 9 46 01 10
TÓM TẮT LUẬN ÁN TIẾN SỸ TOÁN HỌC
Hà Nội, 2018
Trang 2Người hướng dẫn khoa học 1: TS Trần Thái Sơn
Người hướng dẫn khoa học 2: PGS.TS Nguyễn Tân Ân
Phản biện 1: ………
………
Phản biện 2: ………
………
Phản biện 3: ………
………
Luận án được bảo vệ trước Hội đồng chấm luận án tiến sĩ, họp tại Học viện Khoa học và Công nghệ - Viện Hàn lâm Khoa học và Công nghệ Việt Nam vào hồi … giờ …, ngày … tháng … năm …
Có thể tìm hiểu luận án tại:
1 Thư viện Học viện Khoa học và Công nghệ
2 Thư viện Quốc gia Việt Nam
Công trình được hoàn thành tại: Học viện Khoa học và Công nghệ -
Viện Hàn lâm Khoa học và Công nghệ Việt Nam
Trang 3DANH MỤC CÁC CÔNG TRÌNH ĐÃ CÔNG BỐ
[1] Nguyễn Văn Quyền, Trần Thái Sơn, Nguyễn Tân Ân, Ngô Hoàng
Huy, Đặng Duy An, Một phương pháp mới để nâng cao độ tương phản
ảnh mầu theo hướng tiếp cận trực tiếp, Tạp chí Công nghệ Thông tin và
Truyền thông, Tập V-1 số 17(37), 06-2017, trang 59-74
[2] Nguyễn Văn Quyền, Ngô Hoàng Huy, Nguyễn Cát Hồ, Trần Thái Sơn,
Xây dựng độ đo thuần nhất và nâng cao độ tương phản ảnh mầu theo tiếp cận trực tiếp dựa trên đại số gia tử, Tạp chí Công nghệ Thông tin
và Truyền thông, Tập V-21 số 18(38), 12-2017, trang 19-32
[3] Nguyễn Văn Quyền, Trần Thái Sơn, Nguyễn Tân Ân, “Thiết kế hàm
biến đổi độ xám dạng chữ S tăng cường độ tương phản ảnh sử dụng ĐSGT”, Kỷ yếu hội thảo quốc gia về nghiên cứu Cơ bản và Ứng dụng công nghệ thông tin lần thứ 10 (Fair 10), Thành phố Đà Nẵng, 8-2017, trang 884-897
[4] Nguyễn Văn Quyền, Nguyễn Tân Ân, Đoàn Văn Hòa, Hoàng Xuân
Trung, Tạ Yên Thái, Phương pháp xây dựng một histogram mở rộng
cho ảnh đa kênh và ứng dụng, Tạp chí Nghiên cứu Khoa học và Công
nghệ quân sự, số 49, tháng 6-2017, trang 117-131
[5] Nguyễn Văn Quyền, Nguyễn Tân Ân, Đoàn Văn Hòa, Tạ Yên Thái,
Hoàng Xuân Trung, Xây dựng độ đo thuần nhất cho ảnh mầu dựa trên
các toán tử t-Norm”, Tạp chí Nghiên cứu Khoa học và Công nghệ quân
sự, số 50, tháng 8-2017, trang 127-137
Trang 4MỞ ĐẦU
Nâng cao độ tương phản (ĐTP) ảnh là một vấn đề quan trọng trong xử lý
và phân tích hình ảnh, là một bước cơ bản trong phân tích, phân đoạn ảnh Nâng cao độ tương phản ảnh được phân loại thành hai tiếp cận chính: (1) Các phương pháp gián tiếp và (2) các phương pháp trực tiếp
a) Đối với các phương pháp gián tiếp
Có nhiều kỹ thuật đã đề xuất được tìm thấy trong tài liệu tham khảo
Phương pháp tăng cường độ tương phản gián tiếp chỉ biến đổi histogram
mà không sử dụng bất kỳ một độ đo tương phản nào
Trong vài năm gần đây, nhiều nhà nghiên cứu đã áp dụng lý thuyết tập
mờ để phát triển các kỹ thuật mới nhằm nâng cao độ tương phản của ảnh
Các thuật toán theo tiếp cận mờ thường dẫn đến yêu cầu thiết kế một hàm biến đổi mức xám dạng chữ S (Hàm liên tục đơn điệu tăng, giảm giá trị mức xám đầu vào khi đầu vào dưới ngưỡng, và ngược lại tăng giá trị mức xám đầu vào khi đầu vào ở trên ngưỡng) Tuy nhiên việc lựa chọn hàm thuộc trong suy diễn hệ luật mờ để tạo ra hàm biến đổi mức xám có dạng chữ S không phải là việc dễ dàng Ngay với hệ luật mờ đơn giản sau
R1: If luminance input is dark then luminance output is darker
R2: If luminance input is bright then luminance output is brighter
R3: If luminance input is gray then luminance output is gray
thì kết quả lập luận mờ sử dụng các tập mờ (fuzzy set) là không hiển nhiên và khá khó khăn để đạt được hàm biến đổi mức xám dạng chữ S phù hợp
b) Đối với các phương pháp nâng cao độ tương phản trực tiếp
Trong một thời gian dài cho đến nay hầu như chỉ có các nghiên cứu của Cheng và cộng sự là theo hướng tiếp cận trực tiếp, các tác giả đã đề xuất một phương pháp biến đổi độ tương phản tại mỗi điểm ảnh dựa trên định nghĩa một
độ đo thuần nhất cho điểm ảnh Ngoài ra, Cheng và cộng sự cũng đã đề xuất một thuật toán sử dụng hàm S-function có tham số để biến đổi ảnh đa cấp xám I đầu vào sau đó nâng cao độ tương phản của ảnh biến đổi theo phương pháp trực tiếp
Các thuật toán của Cheng là cơ sở của phép nâng cao độ tương phản các ảnh đa cấp xám Tuy vậy các thuật toán này vẫn còn tồn tại một số hạn chế sau khi áp dụng cho ảnh mầu, ảnh đa kênh…:
(i) Ảnh nâng cao độ tương phản có thể không thay đổi mức độ sáng của mầu so với ảnh gốc
(ii) Dùng các ảnh đã được biến đổi theo phương pháp biến đổi ảnh của Cheng để nâng cao độ tương phản ảnh có thể làm mất chi tiết của ảnh gốc
Về độ đo thuần nhất cho điểm ảnh, Cheng đề xuất cách ước lượng giá trị
Khi thử nghiệm với ảnh mầu, chúng tôi nhận thấy với phép kết nhập này ảnh kết quả có thể không trơn
Trang 52
Thực tế giá trị độ thuần nhất của điểm ảnh là một giá trị mờ và chúng ta
có thể áp dụng lập luận mờ để thu nhận giá trị này
Do lý thuyết tập mờ không có cơ sở hình thức giữa các quan hệ của biến ngôn ngữ và các tập mờ và quan hệ thứ tự giữa các từ nên cần xem xét sử dụng một phương pháp lập luận mờ luôn đảm bảo thứ tự
Qua khảo sát, phân tích và thực nghiệm chúng tôi đã rút ra kết luận :
Thứ nhất, phép lập luận if-then dựa trên tập mờ rất khó đảm bảo hình
dạng chữ S của hàm biến đổi mức xám Phép nâng cao độ tương phản theo hướng tiếp cận trực tiếp của Cheng sử dụng một hàm biến đổi mức xám dạng chữ S không đối xứng, giá trị mức xám biến đổi có thể rơi ra ngoài miền giá trị của độ xám
Thứ hai, độ đo thuần nhất của Cheng vẫn còn một vài hạn chế, chẳng hạn
ảnh kết quả có thể không trơn
Thứ ba, sử dụng trực tiếp thuật toán của Cheng trên kênh ảnh gốc thì độ
sáng của ảnh kết quả có thể ít thay đổi Để thay đổi được độ sáng cần phải biến đổi ảnh gốc trước khi áp dụng phép nâng cao độ tương phản của Cheng Phép biến đổi ảnh của Cheng có thể làm mất chi tiết của ảnh gốc
Vấn đề nghiên cứu của luận án là:
Vấn đề 1: Thiết kế hàm biến đổi mức xám dạng chữ S và đối xứng
Vấn đề 2: Xây dựng độ đo thuần nhất địa phương của ảnh
Vấn đề 3: Xây dựng phép mờ hóa ảnh không đánh mất chi tiết ảnh gốc
CHƯƠNG 1
TỔNG QUAN VỀ NÂNG CAO ĐỘ TƯƠNG PHẢN ẢNH
VÀ TIẾP CẬN ĐẠI SỐ GIA TỬ GIẢI HỆ LUẬT MỜ
Chương này trình bày các khái niệm về đại số gia tử (ĐSGT) và phương pháp lập luận xấp xỉ dựa trên ĐSGT, giới thiệu tổng quan của các phương pháp nâng cao độ tương phản ảnh như một số phương pháp gián tiếp, phương pháp trực tiếp Phân tích, đề xuất sử dụng ĐSGT áp dụng nâng cao độ tương phản theo phương pháp trực tiếp
Trang 63
1.1 Đại số gia tử: một số vấn đề cơ bản
1.1.1 Các khái niệm cơ bản về đại số gia tử
Miền ngôn ngữ X = Dom(X) của một biến ngôn ngữ X có thể được tiên đề
G là tập các phần tử sinh, H là tập các gia tử (hedge) còn “” là quan hệ cảm
sinh ngữ nghĩa trên X Giả thiết trong G có chứa các phần tử hằng 0, 1, W với ý
nghĩa là phần tử bé nhất, phần tử lớn nhất và phần tử trung hòa (neutral) trong
X Ta gọi mỗi giá trị ngôn ngữ x X là một hạng từ (term) trong ĐSGT
với ngữ nghĩa là cận trên đúng và cận dưới đúng của tập H(x) khi tác động lên x,
luận án chỉ quan tâm đến ĐSGT tuyến tính, kể từ đây nói ĐSGT cũng có nghĩa
là ĐSGT tuyến tính
hx Với mỗi x X, ký hiệu H(x) là tập tất cả các hạng từ u X sinh từ x bằng
tăng ngữ nghĩa của một hạng, gia tử âm làm giảm ngữ nghĩa của hạng từ Không
h2 < < h p}
1.1.2 Các hàm đo trong đại số gia tử tuyến tính
Gọi H(x) là tập các phần tử của X sinh ra từ x bởi các gia tử Vì vậy, kích thước của tập H(x) có thể biểu diễn tính mờ của x Độ đo tính mờ của x, ta ký
Định nghĩa 1 Cho AX = (X, G, H, , , ) là một ĐSGT tuyến tính đầy
(2) fm(x) = 0, với các x thỏa H(x) = {x} Đặc biệt, fm(0) = fm(W) = fm(1)
= 0;
) (
) ( )
(
) (
y fm
hy fm x
fm
hx fm
y, vì vậy nó được gọi là độ đo tính mờ của các gia tử và được ký hiệu bởi (h)
Mệnh đề 1 Với độ đo tính mờ fm và đã được định nghĩa trong Định
nghĩa 1, ta có:
Trang 7fm(x) = (hn) (h1)fm(c)
(1.1)
Định nghĩa 2 Một hàm dấu Sign : X {-1, 0, 1} là một ánh xạ được
(2) Sign(hc) = -Sign(c) nếu h âm đối với c; Sign(hc) = Sign(c) nếu
h dương đối với c;
Sign(h'hx) = Sign(hx), nếu h'hx hx và h' dương đối với h;
(4) Sign(h'hx) = 0, nếu h'hx = hx
(1.2)
Mệnh đề 2 Với mọi gia tử h và phần tử xX nếu sign(hx) =+1 thì hx > x
và nếu sign(hx) = -1 thì hx < x
Định nghĩa 3 Cho fm là hàm độ đo tính mờ trên X Một hàm định lượng
ngữ nghĩa (SQM) v trên X (kết hợp với fm) được định nghĩa như sau:
( )
j Sign
i h i fm x h j x h j x fm x x
j h Sign x x j
(
) ( )
j Sign
Trang 85
(1.4)
quát chúng ta có thể giả sử đầu vào là các vector có ngữ nghĩa là giá trị số đã được chuẩn hóa về đoạn [0,1]
số cũng được chuẩn hóa trong [0, 1]
Vấn đề FMCR bây giờ được chuyển vào nội suy bề mặt và được giải nhờ
sử dụng một phương pháp nội suy nào đó Trong ĐSGT, phương pháp này được thực hiện như sau:
Bước 1: Xác định ĐSGT cho các biến ngôn ngữ
1 ,
1 , 1 ,
Bước 2: Xác định một phương pháp nội suy trên Snorm
Trang 91.2 Nâng cao độ tương phản ảnh theo tiếp cận của Cheng
1.2.1 Tham số trích rút tự động (từ ảnh đa cấp xám) bằng thuật toán của Cheng
a Dải động mức xám: là đoạn [a,c] được tính dựa trên histogram của ảnh
b Phép biến đổi ảnh sử dụng S-function
( , ) ( , o p t, ) ( ( , ); , o p t, )
I I i j S I a b c S fu n c I i j a b c
trong đó [a, c] là dải động mức xám là các tham số được ước lượng tự động khi khảo sát các đỉnh histogram và bopt được ước lượng dựa trên nguyên lý cực đại fuzzy entropy:
ở đây H là độ đo fuzzy entropy thông dụng
c Tính các tham số địa phương của ảnh xám gốc (hoặc ảnh đã được biến
lệch chuẩn V ij , và moment bậc 4 R 4,ij
d Tính độ đo thuần nhất của từng điểm ảnh xám gốc (hoặc ảnh đã được biến đổi) dựa trên phép kết nhập 4 giá trị địa phương
đ Tính độ sáng xung quanh (non-homogeneity gray value) của từng điểm ảnh xám gốc (hoặc ảnh đã được biến đổi)
Trang 10i Nếu sử dụng ảnh biến đổi ở bước c-h thì cần áp dụng biến đổi ngược của phép biến đổi ảnh để nhận được điểm ảnh kết quả đầu ra cuối cùng
Phép nâng cao độ tương phản của Cheng thỏa mãn luật: Tại từng điểm
ảnh trên đó tác động bước c-h, độ thuần nhất điểm ảnh càng cao thì mức độ nâng tương phản tại điểm ảnh đó càng thấp (tạm ký hiệu là: RCE-rule of
contrast enhancement)
Do một biến đổi ảnh là đơn điệu tăng, thường bảo toàn cường độ biên ảnh
và giá trị entropy địa phương nên luật RCE nói chung cũng thỏa mãn với ảnh gốc ngay cả khi trong phép nâng cao độ tương phản trực tiếp có sử dụng một biến đổi ảnh
1.2 Một số chỉ số đánh giá độ tương phản ảnh
Sử dụng chỉ số entropy thông dụng cho từng ảnh xám, chỉ số được tính như sau:
K k k
Sử dụng chỉ số fuzzy entropy thông dụng cho từng ảnh xám, chỉ số được tính như sau:
1
1 ,
( ) ( )
K k k
Trang 111.2.3 Chỉ số độ tương phản trực tiếp của một kênh ảnh (lấy trung bình giá trị độ
đo tương phản tại từng điểm ảnh, chỉ số này do nghiên cứu sinh đề xuất)
'
, i j '
'
( , ) ( , ) ( , )
CHƯƠNG 2
BIẾN ĐỔI ẢNH ĐA KÊNH VÀ XÂY DỰNG HÀM BIẾN ĐỔI CHỮ S THEO TIẾP CẬN ĐẠI SỐ GIA TỬ VÀ ỨNG DỤNG NÂNG CAO
ĐỘ TƯƠNG PHẢN ẢNH ĐA KÊNH
Chương này trình bày về histogram mờ, phương pháp xác định nhiều dải động mức xám dựa vào histogram mờ - cơ sở để xây dựng phép biến đổi ảnh đa kênh và phương pháp xây dựng hàm biến đổi độ xám dạng chữ S dựa trên đại số gia tử
2.1 Ước lượng nhiều dải động mức xám dựa vào phân cụm mờ FCM
Sử dụng phân cụm mờ để ước lượng dải động của mức xám của từng kênh ảnh của ảnh đa kênh Lưu ý rằng trong một số biểu diễn màu như biểu diễn màu RGB, các kênh ảnh là không độc lập mà có độ tương quan cao, vì thế cách làm ước lượng dải động của từng kênh ảnh độc lập là không hoàn toàn phù hợp trong trường hợp tổng quát
Sử dụng phân cụm FCM, việc ước lượng dải động mức xám của từng cụm ảnh là dễ dàng hơn do tính đồng nhất cao của giá trị mức xám trong một cụm Với một tổ hợp K kênh ảnh của ảnh I để thuận tiện chúng ta ký hiệu
1, { I ,I , ,I }
K
cụm, C ≥ 2 Thuật toán lặp FCM cực tiểu hóa hàm mục tiêu:
J V
2 2
, , 1
Trang 12Nhƣ vậy với FCM chúng ta nhận đƣợc bảng các giá trị độ thuộc từng cụm
2.2 Histogram mờ với phân cụm FCM
Định nghĩa 2.1 Lƣợc đồ xám mờ
2.3 Thuật toán ƣớc lƣợng nhiều dải động mức xám dựa vào histogram mờ
Ƣớc lƣợng từng vùng mức xám tập trung của histogram mờ Đây là nguyên
lý để xác định đƣợc nhiều dải động mức xám của một kênh ảnh của ảnh đa kênh
Thuật toán 2.1: Ƣớc lƣợng C dải động mức xám của một cụm trong một
tổ hợp kênh ảnh sử dụng histogram mờ
Đầu vào: K kênh của ảnh I (trong một biểu diễn màu), I1,K { I , ,I }1 K , tham
Trang 13Thuật toán 2.1 có độ phức tạp tồi nhất là O(M*N*L), trong đó L là tham số
số lần lặp tối đa của thuật toán FCM chuẩn
2.4 Biến đổi kênh ảnh
Định nghĩa 2.2: Phép biến đổi kênh ảnh của một tổ hợp kênh trong một
biểu diễn màu của ảnh đầu vào
Nhận xét: Mệnh đề 2.2 nói lên tính chất ảnh kết quả sau khi biến đổi bảo
toàn chi tiết của kênh ảnh đầu vào trong miền giá trị mức xám, không xảy ra trường hợp các điểm ảnh có gía trị mức xám nhỏ sau khi biến đổi ảnh lại biến thành các điểm ảnh có giá trị mức xám lớn
Để so sánh với phương pháp biến đổi ảnh của Cheng, chúng tôi chọn 6 ảnh minh họa kết quả như sau:
#1: Kích thước 352x254
tập dữ liệu TID2013)
Trang 14Hình 2.2 Ảnh mờ hóa của ảnh #1,#5 sử dụng biến đổi ảnh của Cheng (a),(c) và
ảnh kết quả sử dụng thuật toán đề xuất 2.1 (b), (d) tương ứng
Trên hình ảnh mờ hóa của ảnh #1, #5 sử dụng biến đổi của Cheng, chi tiết ảnh ở các vùng được đánh dấu hình chữ nhật là bị mất, trong khi đó ảnh biến đổi sử dụng nhiều dải động ước lượng từ phân cụm FCM cho tổ hợp kênh RGB (thuật toán 2.1) chi tiết ảnh được giữ tốt hơn
Bảng 2.1 So sánh giá trị Havg trên kênh R, G và B của các ảnh
là kết quả của phép mờ hóa – biến đổi ảnh
Ảnh Độ đo fuzzy entropy trung
Trang 1512
2.5 Nâng cao độ tương phản ảnh kết hợp với biến đổi ảnh
Thuật toán 2.1: Nâng cao độ tương phản ảnh màu sử dụng biểu diễn màu HSV Đầu vào: Ảnh màu I trong biểu diễn màu RGB, có kích thước M x N
sổ)
Đầu ra: Ảnh màu RGB Inew, và tùy chọn trả về: CMR, CMG,CMB, Eavg ,
Bước 1: Gọi (IH, IS, IV) là biểu diễn màu của I trong không gian màu HSV
Bước 2: Với dữ liệu đầu vào là tổ hợp kênh (IS, IV), tham số số cụm là C và
Bước 3: Xác định ảnh biến đổi FS, FV của kênh IS, IV theo công thức (2.5), định nghĩa 5 với các dải động mức xám được ước lượng từ bước 2 cho mỗi kênh
S và V
Bước 4: Tính các giá trị mức xám không thuần nhất {δS,ij}, {δV,ij}, số mũ
Bước 5: Tính độ tương phản và xác định kênh ảnh xám mới của kênh FS và
I ( , )
1
, 1
t t t t
C g C
i j
C g C
I ( , )
1
, 1
t t t t
C g C
i j
C g C
Lưu ý ở đây kênh S được đánh chỉ số k = 1, kênh V được đánh chỉ số k = 2
Bước 6: Chuyển đổi ảnh (IH, IS,new, IV,new) trong biểu diễn màu HSV về biểu
Bước 7: Bước tùy chọn, tính các chỉ số khách quan CM{R,G,B}, Eavg và Havg