Kỹ thuật thủy vân ẩn dựa trên biến đổi DCT có vị trí nổi bật vì những lý do sau: - Thứ nhất, nhờ biến đổi DCT mà có thể loại bỏ sự tương quan giữa các điểm ảnh trong miền không gian, giú
Trang 1HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
Nguyễn Lê Cường
NGHIÊN CỨU GIẢI PHÁP NÂNG CAO CHẤT LƯỢNG THỦY VÂN SỬ DỤNG BIẾN ĐỔI COSINE RỜI RẠC TRÊN ẢNH JPEG
LUẬN ÁN TIẾN SĨ KĨ THUẬT
HÀ NỘI - 2012
Trang 2HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
Nguyễn Lê Cường
NGHIÊN CỨU GIẢI PHÁP NÂNG CAO CHẤT LƯỢNG THỦY VÂN SỬ DỤNG BIẾN ĐỔI COSINE RỜI RẠC TRÊN ẢNH JPEG
Chuyên ngành: Kĩ thuật điện tử
Trang 3LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cứu do tôi thực hiện Các số liệu và kết quả trình bày trong luận án là trung thực, chưa được công bố bởi bất kỳ tác giả nào hay ở bất kỳ công trình nào khác
Tác giả
Nguyễn Lê Cường
Trang 4LỜI CẢM ƠN
Luận án Tiến sĩ này được thực hiện tại Học viện Công nghệ Bưu chính Viễn thông dưới sự hướng dẫn của GS.TS Nguyễn Bình và TS Nguyễn Ngọc Minh Nghiên cứu sinh bày tỏ lòng biết ơn sâu sắc tới các thầy về sự giúp đỡ, tạo điều kiện thuận lợi để nghiên cứu sinh hoàn thiện công trình nghiên cứu của mình Nghiên cứu sinh cũng xin chân thành cảm ơn các nhà khoa học, tác giả các công trình nghiên cứu được trích dẫn trong luận án này vì đó là nguồn tư liệu quý báu cung cấp kiến thức cho nghiên cứu sinh trong quá trình nghiên cứu hoàn thiện luận
án
Nghiên cứu sinh xin được cảm ơn lãnh đạo Học viện Công nghệ Bưu chính Viễn thông đã tạo mọi điều kiện để nghiên cứu sinh được thực hiện và hoàn thành chương trình nghiên cứu của mình Tôi cũng xin chân thành cảm ơn Khoa Quốc tế
và Đào tạo sau đại học, Khoa Kỹ thuật Điện tử 1, Học viện Công nghệ Bưu chính Viễn thông và các đồng nghiệp đã hợp tác và giúp đỡ tôi trong quá trình nghiên cứu của mình
Tôi xin gửi lời cảm ơn tới lãnh đạo nhà trường và các đồng nghiệp tại Khoa Điện tử-Viễn thông, trường Đại học Điện lực đã tạo điều kiện thuận lợi cho tôi trong quá trình vừa làm nghiên cứu sinh vừa công tác tại trường
Cuối cùng là sự biết ơn tới gia đình đã động viên, giúp đỡ tôi có đủ thời gian, sức khỏe, nghị lực để hoàn thành luận án
Hà Nội, tháng 05 năm 2012
Tác giả
Nguyễn Lê Cường
Trang 5MỤC LỤC
LỜI CAM ĐOAN i
LỜI CẢM ƠN ii
MỤC LỤC iii
CÁC TỪ VIẾT TẮT vi
DANH MỤC BẢNG BIỂU ix
DANH MỤC HÌNH VẼ x
MỞ ĐẦU 1
CHƯƠNG 1 7
TỔNG QUAN VỀ CÁC NGHIÊN CỨU TRONG LĨNH VỰC THỦY VÂN SỐ 7
1.1 Giới thiệu chương 7
1.2 Khảo sát những nghiên cứu gần đây về các kỹ thuật thủy vân ảnh số và tấn công nén ảnh số 11
1.2.1 Một số công trình liên quan đến kỹ thuật thủy vân trên ảnh số 11
1.2.2 Một số nghiên cứu về tấn công nén ảnh số đối với thủy vân 17
1.2.3 Nhận xét 20
1.3 Phương pháp thủy vân trong miền DCT và tấn công nén ảnh JPEG 21
1.3.1 Biến đổi cosine rời rạc (DCT) 21
1.3.2 Tấn công nén ảnh JPEG 23
1.4 Kết luận chương 26
CHƯƠNG 2 27
CHẤT LƯỢNG THỦY VÂN ẨN TRƯỚC TẤN CÔNG NÉN ẢNH JPEG 27
2.1 Giới thiệu chương 27
2.2 Đánh giá chất lượng của thủy vân 27
2.3 Phương pháp thủy vân dựa trên sai số lượng tử 30
2.3.1 Giới thiệu phương pháp thủy vân thông thường trên miền DCT 30
2.3.2 Đề xuất phương pháp thủy vân dựa trên sai số lượng tử 32
2.3.3 Thử nghiệm và kết quả 34
2.4 Đề xuất phương pháp thủy vân cải tiến dựa trên bù sai số lượng tử 37
2.4.1 Giới thiệu 37
Trang 62.4.2 Phân bố thống kê của sai số lượng tử trong phép nén ảnh JPEG và khái niệm
bù sai số lượng tử 38
2.4.3 Nội dung phương pháp và các biện luận 40
2.4.4 Thực nghiệm và kết quả 41
2.5 Kết luận chương 44
CHƯƠNG 3 45
THỦY VÂN TRÊN ẢNH SỐ TRƯỚC NÉN ẢNH JPEG VỚI TỈ SỐ NÉN KHÁC NHAU 45
3.1 Giới thiệu chương 45
3.2 Ảnh hưởng của nén ảnh JPEG với tỉ số nén khác nhau 45
3.3 Đề xuất phương pháp ước lượng các tham số trong trường hợp toàn ảnh 47
3.3.1 Giới thiệu 47
3.3.2 Một số đại lượng và bài toán ước lượng tham số 48
3.3.3 Thuật giải QEWM-AO 50
3.3.4 Cải tiến phương pháp QEWM-AO-phương pháp QEWM-AOA 52
3.3.5 Thuật giải QEWM-AOA 53
3.3.6 Thử nghiệm và kết quả 54
3.4 Đề xuất phương pháp ước lượng các tham số thích nghi đối với từng hệ số 60
3.4.1 Giới thiệu 60
3.4.2 Một số định nghĩa 61
3.4.3 Dung lượng chứa thủy vân của ảnh gốc 63
3.4.4 Tỷ số đỉnh tín hiệu trên nhiễu cực tiểu 64
3.4.5 Xây dựng thuật toán nhúng thủy vân thích nghi 65
3.4.6 Thử nghiệm và kết quả 68
3.5 Kết luận chương 73
CHƯƠNG 4 75
ĐỀ XUẤT MỘT MÔ HÌNH QUẢN TRỊ THỦY VÂN ẨN TRÊN ẢNH SỐ 75
4.1 Giới thiệu chương 75
4.2 Thiết kế tổng thể hệ thống 75
4.2.1 Chức năng của hệ thống 75
4.2.2 Yêu cầu đối với hệ thống 76
4.2.3 Đề xuất sơ đồ khối của hệ thống 76
Trang 74.3 Các thành phần của hệ thống 77
4.3.1 Cơ sở dữ liệu 77
4.3.2 Tính toán tham số và nhúng thủy vân 80
4.3.3 Khôi phục và đánh giá thủy vân 81
4.3.4 Module giao tiếp người dùng 81
4.4 Một minh họa cho ứng dụng của hệ thống 82
4.5 Kết luận chương 84
KẾT LUẬN 85
DANH MỤC CÁC CÔNG TRÌNH ĐÃ CÔNG BỐ CỦA TÁC GIẢ 87
TÀI LIỆU THAM KHẢO 89
Trang 8CÁC TỪ VIẾT TẮT
A/D Analog to Digital Conversion Biến đổi tương tự-số
DFT Discrete Fourier Transform Biến đổi Fourier rời rạc
DRM Digital Right Management Quản lý bản quyền dữ liệu số
DWT Discrete Wavelet Transform Biến đổi sóng con rời rạc
FPGA Field Programable Gate Array Ma trận cổng logic lập trình được
Trang 9IDCT Inverse Descrete Cosine
Distributed Đƣợc phân bố chồng khít độc lập
IPP Intellectual Property Protection Bảo vệ sở hữu trí tuệ
JPEG Joint Photographic Experts Group Nhóm phối hợp các chuyên gia về
ảnh
MPEG Moving Picture Expert Group Nhóm chuyên gia về ảnh động
Trang 10PSNR Peak signal-to-noise ratio Tỉ số đỉnh tín hiệu trên nhiễu
QEWM Quantization Error Watermarking Thủy vân dựa trên sai số lượng tử
Sai số bình phương trung bình chuẩn (Căn bậc hai của sai số bình phương trung bình)
RST Rotation, Scale and Translation Quay, thay đổi tỉ lệ và dịch
SDM Sampling Distribution of Means Cắt mẫu phân bố của các trung
bình
TWM Trivial Watermarking Method Phương pháp thủy vân thông
thường
WTGM Wavelet Tree Group Modulation Điều chế nhóm cây sóng con
Trang 11DANH MỤC BẢNG BIỂU
Bảng 1.1 Các hệ số DC và AC trong ma trận biến đổi DCT 8x8 23 Bảng 1.2 Bảng lượng tử cho thành phần chói với q=75 24 Bảng 2.1 Hệ số nhúng , hệ số tương quan và tỉ số đỉnh tín hiệu trên nhiễu PSNR 36 Bảng 2.2 Hệ số nhúng , với hệ số tương quan γ và tỉ số đỉnh tín hiệu trên nhiễu PSNR tương ứng 43 Bảng 3.1 Giá trị các đại lượng tương ứng với 58 Bảng 3.2 Các tham số và kết quả của phương pháp thủy vân QEWM-AOA và QEWM- AMN 72
Trang 12DANH MỤC HÌNH VẼ
Hình 1.1 Sơ đồ phân loại kỹ thuật nén ảnh 18
Hình 1.2 Sơ đồ tóm tắt lược đồ mã hóa và giải mã JPEG dùng biến đổi DCT 24
Hinh 2.1 Các vùng tần số trong ma trận các hệ số DCT 30
Hinh 2.2 a Ảnh gốc b Thủy vân gốc 35
Hinh 2.3 Thực hiện theo phương pháp QEWM với =0.02 35
Hinh 2.4 Thực hiện theo phương pháp TWM với =0.02 35
Hinh 2.5 Hệ số nhúng , hệ số tương quan ứng với phương pháp QEWM và TWM 36 Hinh 2.6 Hệ số nhúng và tỉ số đỉnh tín hiệu trên nhiễu PSNR ứng với phương pháp QEWM và TWM 37
Hinh 2.7 Phân bố của sai số lượng tử ảnh Lena với các hệ số chất 40
Hinh 2.8 a Ảnh gốc b Thủy vân gốc 42
Hinh 2.9 Thực hiện theo phương pháp TWM với=0.015 42
Hinh 2.10 Thực hiện theo phương pháp QEWM-A với =0.08 42
Hình 3.1 Tỉ số đỉnh tín hiệu trên nhiễu PSNR với ứng với ( , ) c q khác nhau 56
Hình 3.2 Trị trung bình của hệ số tương quan với (q c, ) khác nhau thỏa mãn PSNR>T_PSNR và >T_ 57
Hình 3.3 Phương sai của hệ số tương quan với ( , ) c q khác nhau thỏa mãn PSNR>T_PSNR và >T_ 57
Hình 3.4 Độ hội tụ của hệ số tương quan với ( , ) c q khác nhau thỏa mãn PSNR>T_PSNR và >T_ 57
Trang 13Hình 3.5 Hệ số tương quan 58
Hình 3.6 a Ảnh gốc b Thủy vân gốc 58
Hình 3.7 Ảnh chứa thủy vân với các tham số q c =90, =0.02 và thủy vân khôi phục được 59
Hình 3.8 Ảnh chứa thủy vân với các tham số qc=59, =0.09 và thủy vân khôi phục được 59
Hình 3.9 Ảnh chứa thủy vân với các tham số q c =51, =0.06 và thủy vân khôi phục được 59
Hình 3.10 Ảnh chứa thủy vân với các tham số q c =54, =0.08 và thủy vân khôi phục được 59
Hình 3.11 a Ảnh gốc b Thủy vân gốc 71
Hình 3.12 Đặc tuyến biểu diễn mối quan hệ giữa ngưỡng bền vững thres_ và dung lượng chứa thủy vân tính theo đơn vị dB: dB=log 10 ( thres_) của ảnh Lena 71
Hình 3.13 Hệ số tương quan giữa thủy vân gốc và thủy vân khôi phục sau tấn công 73
Hình 3.14 Phương pháp QEWM-AOA với các tham số được ước lượng q c =54, =0.08 và thủy vân khôi phục 71
Hình 3.15 Phương pháp QEWM-AMN với thres_ =0.380 và thủy vân khôi phục 72
Hình 3.16 Phương pháp QEWM-AMN với thres_ =0.335 và thủy vân khôi phục 72
Hình 3.17 Phương pháp QEWM-AMN với thres_ =0.290 và thủy vân khôi phục 72
Hình 4.1 Sơ đồ khối của hệ thống 76
Hình 4.2 Một số ảnh trong thư viện ảnh gốc 79
Hình 4.3 Một số ảnh trong thư viện thủy vân 79
Hình 4.4 Đồ thị sắp xếp các hệ số DCT của ảnh gốc và thủy vân giảm dần 79
Hình 4.5 Đặc tuyến quan hệ giữa độ bền vững và dung lượng thủy vân của các ảnh 80
Trang 14Hình 4.6 Đặc tuyến hệ số tương quan giữa thủy vân gốc và thủy vân khôi phục được đối
với tấn công nén JPEG với hệ số chất lượng q khác nhau 80
Hình 4.7 Hiển thị kết quả nhúng thủy vân 81
Hình 4.8 Đặc tuyến tỉ số PSNR tối thiểu-Ngưỡng giới hạn độ bền của 83
Hình 4.9 Kết quả nhúng và khôi phục thủy vân sau tấn công với ảnh Baboon 83
Trang 15MỞ ĐẦU
Một trong những vấn nạn trong kỷ nguyên kỹ thuật số mà chúng ta đang phải đương đầu hiện nay là vấn nạn vi phạm bản quyền nội dung số Người sở hữu nội dung số càng dễ dàng quảng bá sản phẩm của mình thì lại càng khó khăn trong việc bảo vệ quyền và lợi ích hợp pháp của mình đối với các sản phẩm đó Việc thông tin số dễ dàng được nhân bản và phân phối đi dẫn đến yêu cầu cần có những công cụ hữu hiệu về mặt pháp lý cũng như kỹ thuật để bảo vệ bản quyền Đã có nhiều giải pháp kỹ thuật, trong đó có thủy vân số, ra đời nhằm giải quyết vấn đề này Ảnh số là một trong những nội dung số quan trọng nhất, các nhà nghiên cứu đã đề xuất rất nhiều loại kỹ thuật thủy vân trên ảnh số với các ứng dụng khác nhau Ứng dụng quan trọng và cơ bản nhất của thủy vân số là thủy vân trên ảnh số để bảo vệ bản quyền ảnh số Trong đó, thủy vân ẩn thường được sử dụng vì tính ẩn của thủy vân là một đặc trưng quan trọng trong các ứng dụng giấu tin trên ảnh số hay đánh dấu bản quyền ảnh số mà vẫn đảm bảo chất lượng ảnh Ngoài việc đảm bảo chất lượng ảnh sau khi đánh dấu thì thủy vân còn phải bền vững trước các tác động từ bên ngoài lên ảnh chẳng hạn như các phép xử lý ảnh Đối với ảnh số thì việc nén ảnh, đặc biệt là nén JPEG, là phép xử lý ảnh được sử dụng phổ biến Kỹ thuật thủy vân ẩn dựa trên biến đổi DCT có vị trí nổi bật vì những lý do sau:
- Thứ nhất, nhờ biến đổi DCT mà có thể loại bỏ sự tương quan giữa các điểm ảnh trong miền không gian, giúp xác định các vùng tần số nhúng thủy vân phù hợp có tính đến đặc tính của hệ thống thị giác mắt người, đảm bảo điều khiển được tính ẩn của thủy vân lẫn chất lượng ảnh chứa thủy vân
- Thứ hai, biến đổi DCT yêu cầu ít sự phức tạp tính toán và tài nguyên hơn so với nhiều biến đổi khác
Trang 16- Cuối cùng, biến đổi này được sử dụng hết sức rộng rãi và đã cho thấy hiệu quả của nó trong các phép xử lý ảnh Điều này cho phép thực hiện thủy vân số trên miền DCT song song với các kỹ thuật xử lý ảnh khác cũng sử dụng biến đổi này như phép nén ảnh JPEG
Đã có rất nhiều nghiên cứu về vấn đề thủy vân trên ảnh số dựa trên biến đổi DCT và ứng dụng của nó Các kết quả đạt được đã có đóng góp thiết thực trong lĩnh vực bảo vệ bản quyền cũng như bảo mật dữ liệu số Tuy nhiên các tác giả trước thường phải giải quyết các vấn đề gặp phải sau đây:
- Tính ẩn và chất lượng ảnh chứa thủy vân mâu thuẫn với độ bền vững của thủy vân trước các tấn công Sở dĩ như vậy là vì khi tăng lượng thông tin nhúng vào ảnh, chẳng hạn như nhúng lặp lại nhiều lần hoặc vào nhiều vị trí khác nhau trong ảnh gốc, thì sẽ nâng cao khả năng khôi phục được thủy vân trước các tấn công nhưng sẽ làm thủy vân dễ bị phát hiện hơn cũng như làm suy giảm chất lượng ảnh gốc nhiều hơn
- Các phép xử lý trên miền DCT cũng chính là các tấn công phổ biến,
cụ thể và điển hình là một trong những tấn công phổ biến nhất hiện nay đối với thủy vân trên ảnh số là phép JPEG có tổn hao Trong đó, quá trình lượng
tử hóa các hệ số DCT của ảnh theo bảng lượng tử hóa là quá trình quan trọng để làm giảm dung lượng ảnh và cũng làm tổn hao thông tin hay suy giảm chất lượng ảnh nhiều nhất Đây cũng chính là tác nhân quan trọng nhất dẫn đến suy giảm chất lượng thủy vân chứa trong ảnh
Nhiều phương án dung hòa mâu thuẫn này đã được nghiên cứu và đề xuất Một số phương án đã được đề xuất và thử nghiệm thành công trong đó
có phương án thủy vân dựa trên miền DCT dựa trên tính toán sai số lượng tử hóa của phép nén JPEG trên miền này Tuy nhiên hầu hết các lược đồ này
Trang 17mới chỉ cho phép nhúng thủy vân nhị phân dựa trên sai số lượng tử hóa, ít đề cập đến việc nhúng các dữ liệu đa cấp xám cũng như vấn đề lượng hóa, tối
ưu hóa, quản lý chất lượng của quá trình nhúng (đảm bảo dung lượng thủy vân, đảm bảo chất lượng ảnh chứa thủy vân, đảm bảo độ bền vững trước tấn công nén JPEG với các tỉ số nén khác nhau ) cũng chưa được đề cập một cách thấu đáo
Chính vì vậy tác giả đã chọn đề tài “Nghiên cứu giải pháp nâng cao chất lượng thủy vân sử dụng biến đổi cosine rời rạc trên ảnh JPEG” để thực hiện luận án tiến sĩ của mình Mục đích của những nghiên cứu trình bày trong luận án là nhằm giải quyết các vấn đề nêu trên ở khía cạnh chất lượng ảnh chứa thủy vân, tính bền vững của thủy vân trước tấn công nén ảnh JPEG
Nhiệm vụ cụ thể để thực hiện mục đích trên gồm:
1 Tìm giải pháp nâng cao chất lượng thủy vân ẩn trên ảnh số chống lại tấn công nén JPEG thông qua việc nghiên cứu tác nhân gây ảnh hưởng và cách khắc phục ảnh hưởng của nén JPEG đến chất lượng thủy vân
2 Tìm phương pháp nhúng thủy vân ẩn vào ảnh số trên miền DCT đáp ứng các yêu cầu cho trước về chất lượng ảnh chứa thủy vân, độ bền vững của thủy vân trước tấn công nén ảnh JPEG với tỉ số nén thay đổi
3 Xây dựng mô hình hệ thống thủy vân số có tính mở nhằm tạo điều kiện cho việc ứng dụng hiệu quả các kết quả đạt được
Luận án sử dụng phương pháp nghiên cứu tổng hợp - phân tích, đề xuất
- chứng minh - thử nghiệm - đánh giá Kết quả tổng hợp các kết quả nghiên cứu đã có của các tác giả khác có liên quan đến đề tài sẽ được luận án sử dụng trong việc phân tích tìm ra các ưu nhược điểm từ đó đề xuất các phương pháp mới nhằm phát huy các ưu điểm, hạn chế các nhược điểm hoặc
Trang 18tìm ra phương thức áp dụng phù hợp nhất trước các yêu cầu ứng dụng cụ thể Các phương pháp mới sẽ được chứng minh bằng lý thuyết và kiểm chứng bằng thực nghiệm để đánh giá kết quả, rút ra kết luận
Luận án sử dụng các công cụ toán học và các công cụ của lý thuyết xử
lý tín hiệu số, xử lý ảnh, mã hóa, lý thuyết thống kê, tối ưu hóa để giải quyết yêu cầu nghiên cứu [1], [4], [5], [6], [7], [8], [9] Các chức năng lập trình,
mô phỏng của phần mềm Matlab [3], thư viện ảnh mẫu USC [66] được sử dụng như là công cụ để thử nghiệm đánh giá các kết quả nghiên cứu
Trên cơ sở các phương pháp và công cụ nghiên cứu nêu trên, những nhiệm vụ đề ra đã được thực hiện và có các kết quả sau:
1 Đề xuất khái niệm “bù sai số lượng tử” trên cơ sở nghiên cứu ảnh hưởng và khảo sát thống kê phân bố của sai số lượng tử trong nén ảnh JPEG Đây là cơ sở để cải tiến cũng như đề xuất các phương pháp thủy vân mới chống lại ảnh hưởng của tấn công nén ảnh JPEG đối với chất lượng thủy vân
2 Đề xuất các phương pháp thủy vân thích nghi, đảm bảo chất lượng ảnh chứa thủy vân ẩn cũng như nâng cao độ bền vững của thủy vân trước phép nén ảnh JPEG
3 Đề xuất một mô hình hệ thống quản trị thủy vân trên ảnh số là cơ sở cho việc xây dựng và phát triển các ứng dụng thủy vân nhằm sử dụng một cách hiệu quả các kết quả của luận án
Những kết quả nghiên cứu được trình bày trong bốn chương của luận
án, ngoài phần mở đầu và kết luận Cụ thể như sau:
Chương 1 có tiêu đề “Tổng quan về các nghiên cứu trong lĩnh vực thủy vân số” trình bày khái quát về luận cứ, các kết quả nghiên cứu điển hình của
Trang 19các tác giả trong và ngoài nước có liên quan đến đề tài, đây chính là tiền đề cho các nghiên cứu của luận án
Chương 2 với tiêu đề “Chất lượng của thủy vân ẩn trước tấn công nén ảnh JPEG” trình bày tóm tắt về chất lượng, phương pháp đánh giá chất lượng thủy vân trên khía cạnh chất lượng ảnh chứa thủy vân và độ bền vững của thủy vân Trên cơ sở nghiên cứu ảnh hưởng của quá trình lượng tử hóa các hệ số DCT trong nén ảnh JPEG đến chất lượng thủy vân, chương này trình bày khái niệm “bù sai số lượng tử” và nội dung các phương pháp nâng cao chất lượng thủy vân dựa trên sai số lượng tử và bù sai số lượng tử Chương 3 “Thủy vân ẩn trên ảnh số trước nén ảnh JPEG với tỉ số nén khác nhau” tóm tắt ảnh hưởng của nén ảnh JPEG với các tỉ số nén khác nhau đến chất lượng thủy vân, nội dung các đề xuất phương pháp ước lượng tham
số toàn ảnh và ước lượng tham số thích nghi nhằm đảm bảo chất lượng thủy vân trước tấn công nén ảnh với các tỉ số nén khác nhau, so sánh ưu nhược điểm của các phương pháp này
Chương 4 “Đề xuất một mô hình quản trị thủy vân trên ảnh số” trình bày nội dung mô hình đề xuất hệ thống thủy quản trị các ứng dụng thủy vân
ẩn trên ảnh số đã được đề xuất và tóm tắt một số ví dụ minh họa cho hiệu quả của việc sử dụng hệ thống này
Các đề xuất mới trong luận án về cơ bản được sử dụng để tạo ra các ứng dụng nâng cao chất lượng thủy vân số, chống lại tấn công nén ảnh JPEG dùng trong lĩnh vực bảo vệ bản quyền dữ liệu số…Tuy nhiên kết quả và phương pháp tiếp cận của các đề xuất này có thể là cơ sở cho các nghiên cứu tiếp theo để xây dựng các phương pháp thủy vân hiệu quả hơn nữa, có khả năng chống lại nhiều tấn công khác nhau, phù hợp với từng trường hợp ứng
Trang 20dụng cụ thể và cho các lĩnh vực khác nhƣ bảo mật dữ liệu số, truyền tin bí mật, xác thực tính toàn vẹn, điều khiển sao chép, giám sát nội dung số…
Trang 21CHƯƠNG 1 TỔNG QUAN VỀ CÁC NGHIÊN CỨU TRONG LĨNH
VỰC THỦY VÂN SỐ
1.1 Giới thiệu chương
Kỹ thuật thuỷ vân số đang nổi lên như là một giải pháp trước các thách thức của lĩnh vực truyền thông Do sự phát triển mạnh mẽ của nội dung số
đa phương tiện đã dẫn đến đòi hỏi phải xây dựng phương thức an toàn để phân phối hợp pháp các nội dung số đó Hơn nữa, nhờ sự phát triển nhanh chóng của Internet và các hệ thống đa phương tiện trong môi trường phân tán mà các chủ sở hữu nội dung số dễ dàng truyền tải, phân phối các dữ liệu
đi Điều đó làm cho vấn đề bảo vệ bản quyền nội dung số ngày càng trở nên bức thiết [47], [51] Các công cụ xử lý ảnh số được phổ biến cũng làm tăng các lỗ hổng cho việc sao chép, sửa đổi, phân tán bất hợp pháp các hình ảnh
số An ninh ảnh số có một ý nghĩa rất lớn với mọi mặt của Internet Bên cạnh đó, gần đây, các kỹ thuật giấu dữ liệu số điển hình là kỹ thuật thủy vân
đã thu hút nhiều chú ý [2], [30] Thủy vân số được triển khai để ngăn cấm sao chép hoặc khai thác bất hợp pháp các dữ liệu số [39], [57][56]
Thủ tục nhúng dữ liệu vào một yếu tố đa phương tiện như âm thanh, hình ảnh hoặc video số được biết đến là thủy vân số Sau đó, người ta có thể tách ra hoặc phát hiện dữ liệu đã nhúng để phục vụ cho nhiều mục đích khác nhau bao gồm bảo vệ bản quyền, điều khiển truy cập và theo dõi quảng bá Thủy vân là một tín hiệu nhỏ được bổ sung vào dữ liệu số gốc (còn gọi là dữ liệu bao phủ, dữ liệu gốc) trong quá trình nhúng thủy vân Dữ liệu gốc có chứa thủy vân có thể bị thay đổi theo một cách nào đó gọi là các tấn công Tín hiệu được tách ra sau đó gọi là thủy vân khôi phục Thủy vân có thể
Trang 22được dùng để xác định người mua/bán, bằng chứng sở hữu, và những vấn đề tương tự khác Thủy vân số có thể được phân loại thành thủy vân ảnh số, thủy vân video số và thủy vân âm thanh số phụ thuộc vào phạm vi ứng dụng Hiện nay các ứng dụng thủy vân số tập trung vào lĩnh vực bảo vệ bản quyền ảnh và video số và bảo vệ bí mật thông tin số Thông thường, thủy vân là một mã được nhúng trong một ảnh Nó cũng có thể đóng vai trò chữ ký số, cung cấp hình ảnh với một cảm giác về quyền sở hữu hoặc xác thực Thủy vân cũng có thể chính là thông tin cần bảo mật Điểm mạnh đầu tiên của thủy vân số là thủy vân không bị tách rời khỏi vật phủ
Tùy vào ứng dụng cụ thể thủy vân cần phải có một hoặc nhiều đặc tính quan trọng , bao gồm: tính khó cảm nhận, chịu đựng biến dạng chung, chống lại các tấn công, mang nhiều bit thông tin, có khả năng cùng tồn tại với thủy vân khác, ít yêu cầu về tính toán khi chèn và tách thủy vân [40] Trong lĩnh vực thủy vân trên ảnh số, thủy vân cần đáp ứng các yêu cầu tiếp theo dưới đây:
Tính trong suốt: Thủy vân nhúng vào không phá hủy độ trung thực
ảnh chứa
Tính bền vững: Thủy vân cần khó bị phát hiện và loại bỏ một cách bất
hợp pháp Muốn vậy thủy vân cần phải linh hoạt để tránh được những tấn công Những tấn công đó có thể là phép nén (JPEG, JP2000), phép thay đổi
tỉ lệ, phép quay, phép xén, phép loại bỏ hàng và cột, phép thêm nhiễu, phép lọc, mật mã và tấn công thống kê, cũng như phép chèn các thủy vân khác [57]
Thủy vân số được phân chia thành nhiều loại theo nhiều cách khác nhau Bao gồm các lược đồ thủy vân non-blind (không mù), semi-blind (bán
Trang 23mù) và blind (mù) trên cơ sở các yêu cầu về tách và phát hiện thủy vân [55], [22] Trong các lược đồ thủy vân không mù, để xác định thủy vân trong ảnh
có chứa thủy vân cần sự hỗ trợ của ảnh gốc và khóa bí mật Các lược đồ thủy vân bán mù yêu cầu cả khóa bí mật và chuỗi bit thủy vân Ngược lại, với các kỹ thuật thủy vân mù thì chỉ cần khóa bí mật để tách thủy vân từ ảnh
có chứa thủy vân Có thể cho dữ liệu nhúng (thủy vân) ẩn hoặc hiện (rõ) Trong trường hợp thủy vân rõ, thủy vân được nhúng trong ảnh gốc và có thể nhìn thấy bằng mắt thường Thủy vân rõ có hạn chế nhiều mặt Nó ảnh hưởng đến độ trung thực của ảnh và dễ bị tấn công bằng các phép xử lý ảnh Còn trong trường hợp thủy vân ẩn, thủy vân không thể nhìn thấy bằng mắt
mà cần sử dụng công cụ đặc biệt cùng với các thông tin khác (nếu có) để tách ra khỏi ảnh chứa [61]
Thủy vân bền vững thường được thiết kế để chống lại các cấn công ảnh như phóng to, thu nhỏ, cắt, nén ảnh Nó thường áp dụng trong lĩnh vực bảo
vệ bản quyền tác giả Ngược lại thủy vân dễ vỡ (fragile watermarking) được thiết kế để xác định bất cứ sự thay đổi nhỏ nào của các nội dung số ban đầu [61] Nó được sử dụng để quyết định liệu hình ảnh có bị thay đổi hay không
Nó có thể xác thực tính toàn vẹn của hình ảnh
Các ứng dụng của thủy vân được nhắc lại một cách ngắn gọn trong như sau [14], [30]:
- Bảo vệ bản quyền: Thủy vân về cơ bản là được ứng dụng để bảo vệ
bản quyền Mục đích là để tránh các bên khác tuyên bố bản quyền bằng cách nhúng các thông tin xác định chủ sở hữu Ứng dụng này phải đảm bảo thủy vân đã nhúng phải bền vững không thể bị loại bỏ và không gây ra sự thay đổi đáng kể nào đối với các dữ liệu số Bên cạnh độ bền vững, một số các yêu cầu khác cũng rất quan trọng Ví dụ, thủy vân phải có thể xác định chủ
Trang 24sở hữu đích thực khi các bên tranh chấp bản quyền nhau khác cùng nhúng thủy vân vào nội dung số
- Chữ ký: Các chủ sở hữu nội dung số được xác nhận bởi thủy vân
Chữ ký có thể được sử dụng bởi một người dùng muốn có quyền sao chép
và xuất bản hợp pháp nội dung số từ chủ sở hữu
- Đánh dấu: Thủy vân có thể được dùng để nhận ra những người mua
nội dung Điều này hỗ trợ rất tốt cho việc truy tìm nguồn gốc của bản sao bất hợp pháp
- Theo dõi việc quảng bá thông tin và xuất bản: Thủy vân được dùng
để trợ giúp các hệ thống tự động giám sát chương trình phát sóng truyền hình, đài phát thanh, mạng máy tính và các kênh phân phối khác để theo dõi nội dung xuất hiện khi nào và ở đâu
- Xác thực: Thủy vân mã hóa thông tin cần thiết để kết luận rằng nội
dung là xác thực
- Điều khiển sao chép: Thủy vân bao gồm các thông tin về các quy tắc
sử dụng và sao chép mà chủ sở hữu nội dung mong muốn thực thi Thông thường là các quy tắc dễ thỏa mãn như “Không được sao chép nội dung này” hoặc “Có thể sao chép nội dung này, nhưng không được sao chép từ các bản sao”
- Truyền thông bí mật: Các tín hiệu nhúng được sử dụng để truyền tải
thông tin bí mật từ một người hoặc máy tính này tới người hoặc máy tính khác, không có bất kỳ ai có thể biết được thông tin đang được truyền đi
Trang 25Chương này trình bày tổng quan về kỹ thuật thủy vân số Trong đó, luận án giới thiệu tổng quát về thủy vân số, điểm qua một số xu hướng đã được nghiên cứu, hoàn thiện của các tác giả trong và ngoài nước có liên quan đến đề tài Phần này cũng nhắc lại một số nét cơ bản về nén ảnh, cụ thể
là nén ảnh JPEG, trên quan điểm coi đó là một tấn công đối với thủy vân Qua đó, luận án nêu và phân tích những vấn đề còn tồn tại của phương pháp thủy vân nói chung, phương pháp thủy vân ẩn trên ảnh số sử dụng biến đổi DCT nhằm chống lại tấn công nén ảnh JPEG nói riêng Đây chính là tiền đề cho những nghiên cứu trong luận án
1.2 Khảo sát những nghiên cứu gần đây về các kỹ thuật thủy vân ảnh số và tấn công nén ảnh số
1.2.1 Một số công trình liên quan đến kỹ thuật thủy vân trên ảnh số
1.2.1.1 Phương pháp miền không gian
Kỹ thuật chân phương nhất là nhúng thủy vân vào các bít có trọng số thấp nhất (LSB) [34] Đây là phương pháp dễ thực hiện nhưng cũng rất dễ bị nhận biết và tấn công vì đơn giản, chỉ cần đặt tất cả các bit LSB này về không (0) hoặc một (1) là có thể phá hủy hoàn toàn thủy vân Bên cạnh đó, một khi đã bị nhận biết thủy vân theo phương pháp này cũng dễ bị thay đổi bởi người tấn công Một cải tiến của phương pháp này là sử dụng một bộ tạo chuỗi giả ngẫu nhiên để xác định những điểm ảnh được dùng để nhúng thủy vân sao cho không thể dễ dàng phát hiện ra thủy vân nữa Dù vậy thì tính bền vững của thủy vân theo kỹ thuật này vẫn là vấn đề lớn nhất khi người ta vẫn có thể loại bỏ thủy vân theo cách trên mà không làm ảnh hưởng nhiều đến chất lượng ảnh
Trang 26Rất nhiều nỗ lực để cải thiện tính bền vững của phương pháp thủy vân trong miền không gian đã được tiến hành Một số sử dụng các loại mã hóa chống lỗi, sửa sai để đối phó với tấn công Mahfuzur Rahman và Koichi Harada đã đề xuất một phương pháp nhúng thủy vân theo vị trí [37] trong đó
độ bền vững đối với sự thay đổi trái phép của một bit trong chuỗi 8 bit được tăng cường bằng việc kết hợp kiểm tra chẵn lẻ Thủy vân được chia thành nhiều phần, mỗi phần được nhúng vào các vị trí khác nhau của vật phủ, do
đó, nếu một phần nào đó của thủy vân tại một vị trí bị mất thì bộ giải mã sửa lỗi có thể được dùng để lấy lại thông tin từ những vị trí khác Phương pháp này có đặc điểm đơn giản, hiệu quả, tính toán nhanh và không tốn kém Phương pháp thủy vân này chống lại được các tấn công không chủ ý như việc hoán đổi, xoay, phóng to/thu nhỏ…và loại bỏ nhiễu sau các tấn công chủ định
Các đặc điểm của hệ thống thị giác của mắt người (HVS) được nghiên cứu và lợi dụng rộng rãi để đảm bảo chất lượng ảnh chứa thủy vân Lu và các đồng sự đã trình bày một lược đồ thủy vân mù và bền vững với mục đích xác thực và bảo vệ dữ liệu đa phương tiện [48] Trong đó, các thông tin xấp
xỉ của ảnh gốc được giữ trong quá trình giấu bằng cách sử dụng các ngưỡng mặt nạ được định nghĩa dựa trên hệ thống thị giác người Quá trình nhúng ẩn thủy vân được thực hiện một lần và thủy vân có thể được trích rút cho các ứng dụng khác nhau trong quá trình tách Một dải bền vững bất đối xứng áp dụng cho thủy vân dễ vỡ để phát hiện giả mạo cố ý và dung sai giả mạo không cố ý Hiệu quả cao nhất mà lược đồ thủy vân của họ cho xác thực nội dung và bảo vệ bản quyền đã được chứng minh bằng kết quả Wenfei Zheng
và Yanpeng Wu đề xuất một lược đồ nhúng thủy vân rõ thích nghi trong miền không gian sử dụng các đặc điểm của ảnh đối với hệ thống thị giác của
Trang 27mắt người [64] Đầu tiên các hệ số tỉ lệ và hệ số nhúng của quá trình nhúng thủy vân trong miền không gian được tính toán bằng cách kết hợp các đặc điểm của ảnh gốc và ảnh thủy vân như độ chói và độ cảm nhận bề mặt Sau
đó thủy vân rõ được nhúng vào ảnh gốc bằng cách điều chỉnh thích nghi hệ
số nhúng và hệ số tỉ lệ Các kết quả thử nghiệm cho thấy thủy vân nhúng trong ảnh có độ tương phản cao hơn, chất lượng ảnh chứa thủy vân tốt hơn
và khả năng chống lại các tấn công nhằm loại bỏ thủy vân cũng được cải thiện
1.2.1.2 Phương pháp miền tần số
Ở đây đề cập chủ yếu đến các phương pháp thủy vân trong miền DCT
và trong miền DWT và phương pháp sử dụng kết hợp cả hai biến đổi này
Saraju P Mohanty và các cộng sự đã phát triển các phương pháp thủy vân trên miền DCT dựa trên việc chia các điểm ảnh của ảnh gốc và thủy vân gốc thành các khối 8x8 sau đó thực hiện biến đổi DCT để thu được các khối 8x8 các hệ số DCT tương ứng [41], [42] Các hệ số DCT của thủy vân sau
đó được cộng vào các hệ số DCT của ảnh gốc theo một tỉ lệ nhất định phụ thuộc vào hệ số nhúng Các đặc tính của ảnh thể hiện trong miền DCT cho phép việc lựa chọn hệ số nhúng thích hợp cho phép thu được thủy vân ẩn hay thủy vân hiện cũng như đáp ứng các yêu cầu khác về tính chất và ứng dụng của thủy vân
Ý tưởng sử dụng trải phổ để nhúng thủy vân trong miền DCT được đề xuất bởi Cox và các cộng sự [20] Phương pháp này coi ảnh gốc và thủy vân
là kênh thông tin và tín hiệu được truyền qua, tương ứng Phần phổ tín hiệu quan trọng đối với mắt người được trải ra bằng thông điệp thủy vân Nhiễu Gauss giống như các thủy vân được sử dụng để hoàn thiện tính bảo mật
Trang 28Ảnh đã nhúng thủy vân sẽ bị hư hại nếu cố gắng phá hủy thủy vân Vì cần sử dụng ảnh gốc khi tách thủy vân nên nó là lược đồ thủy vân không mù Nói chung, thủy vân có thể được nhúng trong các hệ số sóng con của ảnh cũng như video sử dụng phương pháp trải phổ [65]
Wu và Hsieh đã đề xuất một thuật toán thủy vân để nhúng một tín hiệu
ẩn vào dữ liệu đa phương tiện nhằm chứng thực việc xác định chủ sở hữu và ngăn chặn việc sao chép trái phép [59] Họ đã đề xuất một kỹ thuật thủy vân hiệu quả dựa trên biến đổi DCT Phương pháp của họ là nhúng thủy vân vào ảnh và trích tách thủy vân từ ảnh đã nhúng thủy vân có hiệu suất cao hơn nhờ sử dụng cây zero trong việc sắp xếp các hệ số DCT Phương pháp của
họ rất phù hợp cho các hệ thống thời gian thực vì nó có thể trích tách trực tiếp thủy vân đã nhúng từ ảnh đã nhúng thủy vân mà không cần ảnh gốc Hơn nữa, họ đã cung cấp thủy vân số bền vững bằng việc sử dụng lược đồ trải phổ thông tin thủy vân Đặc tính khó cảm nhận và tính bền vững của thủy vân đã được khẳng định bằng các kết quả
Chih-Yang Lin and Yu-Tai Lin giới thiệu kỹ thuật thủy vân sử dụng biến đổi DWT [16] Kỹ thuật này giúp phân tách ảnh gốc thành bốn ảnh thành phần HH, LH, HL và LL tương ứng với các miền tần số khác nhau theo hai chiều không gian Việc phân tách có thể được tiếp tục thực hiện đối với từng ảnh thành phần cho đến khi đạt được mong muốn tìm kiếm ảnh thành phần thích hợp và nhúng thủy vân vào đó Kỹ thuật thủy vân này cho phép đảm bảo chất lượng ảnh gốc, dung lượng thủy vân, tính bền vững của thủy vân và cho phép tách mù thủy vân Maha Sharkas và cộng sự đề xuất thuật toán thủy vân kép trên miền DWT, trong đó một thủy vân phụ dưới dạng một chuỗi giả ngẫu nhiên được nhúng vào thủy vân chính trong miền DWT trước khi nó được nhúng vào ảnh gốc trên miền này [36] Kỹ thuật này
Trang 29đã chứng tỏ sự bền vững qua các thử nghiệm với nhiều loại tấn công khác nhau
Việc kết hợp biến đổi DWT và DCT đã được thực hiện hiệu quả trong nhiều kỹ thuật thủy vân ảnh số [13], [44], [28], [52] Trong phương pháp kết hợp của Saeed K Amirgholipour và Ahmad R Naghsh-Nilchi [54], thủy vân dưới dạng một ảnh logo được xáo trộn trước khi được nhúng vào các hệ số DWT mức 3 của ảnh gốc, sau đó các băng con DWT được biến đổi DCT và chuỗi giả ngẫu nhiên của thủy vân được nhúng vào các hệ số DCT trung bình Thử nghiệm đã cho thấy sự cải thiện trong tính bền vững và chất lượng ảnh chứa thủy vân của phương pháp này Tương tự, Ali Al Haj [12][12] đã đưa ra một thuật toán thủy vân ảnh số sử dụng kết hợp DWT-DCT Kỹ thuật thủy vân được thực hiện thông qua việc nhúng thủy vân vào các băng con DWT mức một và hai của ảnh chủ sau đó áp dụng biến đổi DCT trên các khối băng con DWT đã chọn Sự kết hợp hai biến đổi đã nâng cao hiệu suất thủy vân rất nhiều so với phương pháp chỉ dùng DWT Wolfgang và các cộng sự [59] đã nghiên cứu tỉ mỉ hiệu suất của biến đổi cosine rời rạc (DCT)
và biến đổi wavelet rời rạc (DWT) dựa trên các kỹ thuật thuỷ vân trải phổ cho các thuật toán nén ảnh màu sử dụng DCT và DWT Họ khẳng định rằng việc kết hợp thuỷ vân và các biến đổi mã hoá làm nâng cao hiệu quả Tuy nhiên, các kết quả mô phỏng của họ phần nào đó không thuyết phục và không có cải tiến lý thuyết nào cho giả thuyết của họ Kundur và Hatzinakos [32] nhất trí dựa trên cả phân tích và thông qua kết quả mô phỏng rằng việc
sử dụng cùng một biến đổi cho cả thuỷ vân và nén dẫn đến hiệu suất cận tối
ưu cho kỹ thuật thuỷ vân lượng tử dựa trên mã hoá lặp based)
Trang 30(repetition-code-Trong [24], [25] Eggers và Girod đưa ra phân tích chi tiết các ảnh hưởng lượng tử đến các lược đồ thuỷ vân trải phổ trong miền DCT Chu Hong Fei và các cộng sự đưa ra một phương pháp phân tích mối quan hệ giữa miền nhúng thuỷ vân ẩn với hiệu suất phép nén thông tin dựa trên khối [18] Bằng cách tính độ phức tạp của các phương pháp nhúng dựa trên kỹ thuật trải phổ và kỹ thuật lượng tử hóa, họ thiết kế một thuật toán thuỷ vân lai mới khai thác tốt nhất những ưu điểm của cả hai kỹ thuật thuỷ vân này
Họ cũng kiểm chứng các nhận xét lý thuyết thông qua việc thực hiện phần mềm, kiểm tra và so sánh các lược đồ thuỷ vân trải phổ, dựa trên lượng tử hoá và thuỷ vân lai Tuy nhiên các phương pháp trên đều gặp phải một hoặc một vài nhược điểm sau: ảnh hưởng nhiều tới chất lượng ảnh gốc, thiếu bền vững khi bị tấn công nén với các tỉ số nén khác nhau, dung lượng thủy vân thấp, khó kiểm soát được chất lượng ảnh chứa thủy vân, chất lượng thủy vân khôi phục được sau tấn công…
kế này cho phép giảm công suất nguồn tiêu thụ, thực hiện trong thời gian thực, tin cậy và dễ tích hợp vào các thiết bị điện tử dân dụng Saraju P.Mohanty và các cộng sự cũng thực hiện hệ thống thủy vân ẩn bền vững thời gain thực trên FPGA của Xilinx [44]
Trang 31Thiết kế hệ thống trung tâm tái sử dụng được, thủy vân cấu phần ( thành phần trong hệ thống phần mềm) và mật mã là những kỹ thuật hiện có
để thúc đẩy việc bảo vệ sở hữu trí tuệ phần mềm và phần cứng Andrew B Kahng và các cộng sự đã mô tả các quy tắc cơ bản, các kỹ thuật cơ bản và ví
dụ ứng dụng cho kỹ thuật thủy vân dựa trên IPP [10] Họ sử dụng các công
cụ công nghiệp hàng đầu để thực hiện các giao thức này Tính ưu việt trong phương pháp của họ cùng với giá thành chấp nhận được đã được chứng minh trong các trường hợp thiết kế thực tế Thêm vào đó, tính bền vững của lược đồ thủy vân chống lại các cuộc tấn công ngẫu nhiên cũng đã được minh chứng
1.2.2 Một số nghiên cứu về tấn công nén ảnh số đối với thủy vân
1.2.2.1 Vài nét về tấn công nén ảnh
Nén ảnh có tổn hao về bản chất làm suy giảm chất lượng đối với thủy vân trên ảnh số và có thể xem như là một trong những phép tấn công phổ biến nhất bởi ứng dụng rộng rãi của nó trong đời sống xã hội [18], [21], [30], [33], [59], [56] Trong phần này, hai kỹ thuật nén ảnh phổ biến nhất là JPEG
và JPEG2000 được phân tích để làm rõ các nguyên nhân làm biến đổi thủy vân trên ảnh số khi ảnh có chứa thủy vân được nén [11], [38], [52]
Một tính chất chung nhất của tất cả các ảnh số là giá trị tương quan giữa các điểm ảnh cạnh nhau lớn, dẫn đến dư thừa thông tin sử dụng khi biểu diễn ảnh, dẫn đến việc mã hoá không tối ưu [11], [38] Do đó công việc cần làm
để nén ảnh là phải tìm được các biểu diễn ảnh với giá trị tương quan của các điểm ảnh cạnh nhau là nhỏ nhất để giảm thiểu độ dư thừa thông tin của ảnh Thực tế, có hai kiểu dư thừa thông tin theo không gian biểu diễn được phân loại như sau:
Trang 32- Dư thừa trong miền không gian xuất hiện do tương quan trên quan điểm quang học giữa các giá trị điểm ảnh của ảnh, các điểm ảnh lân cận của ảnh có giá trị gần giống nhau
- Dư thừa trong miền tần số xuất hiện do tương quan quang học giữa các mặt phẳng màu hoặc dải phổ khác nhau
Trọng tâm của việc nén ảnh là tìm giải pháp giảm kích thước bộ nhớ (số bit) cần dùng để biểu diễn ảnh trên cơ sở loại bớt dư thừa trong miền không gian và miền tần số càng nhiều càng tốt Các kỹ thuật nén ảnh được phân loại như hình 1.1
Hình 1.1 Sơ đồ phân loại kỹ thuật nén ảnh
1.2.2.2 Ảnh hưởng của các kỹ thuật nén ảnh đến thủy vân
Theo sơ đồ (Hình 1.1) nén ảnh có hai hướng chính, bao gồm:
- Kỹ thuật nén không mất thông tin (lossless compression): ảnh khôi phục giống hoàn toàn so với ảnh gốc Tuy nhiên, nén không tổn hao chỉ đạt được hiệu quả nén nhỏ
Mã hóa biến đổi
Mã hóa băng con
Lượng tử hóa vector
Lượng tử hóa
vô hướng
Trang 33- Kỹ thuật nén có mất thông tin (lossy compression): ảnh khôi phục có
sự sai khác so với ảnh gốc nhưng sự mất mát thông tin không cảm nhận được ở điều kiện cảm nhận hình ảnh thông thường Kỹ thuật này có thể đạt
được hiệu quả nén cao hơn nhiều so với kỹ thuật nén không tổn hao Tuy nhiên đây chính là tác nhân cơ bản làm giảm chất lượng thậm chí làm biến dạng đến mức không còn khôi phục được thủy vân nhúng trong ảnh [13], [17], [18], [23],[23], [56]
Mã hóa biến đổi được dùng rất phổ biến trong kỹ thuật nén ảnh có mất thông tin Mã hoá dựa trên phép biến đổi trước tiên đối với ảnh để chuyển miền biểu diễn ảnh từ miền không gian sang một miền khác Tiếp đó, thực hiện mã hoá đối với các hệ số biến đổi Các phép biến đổi phổ biến là: biến đổi cosine rời rạc DCT (sử dụng trong chuẩn nén ảnh JPEG) [11] và biến đổi sóng con rời rạc DWT (sử dụng trong chuẩn nén ảnh JPEG2000) [35]
Đối với JPEG, sau khi được biến đổi cosine rời rạc, sự tương quan giữa các điểm ảnh của một ảnh trong miền không gian được giải tương quan thành các tần số rời rạc khác nhau trong miền tần số Quá trình lượng tử hoá
là dựa trên đặc điểm sinh lý của hệ thống thị giác của con người, đó là, nhạy cảm cao hơn với những tần số thấp và kém hơn đối với tần số cao [64] Các phương pháp lượng tử hóa vô hướng được thiết kế sao cho có thể giảm sự dư thừa dữ liệu mà vẫn giữ được tính trung thực của ảnh Các hệ số tần số được lượng tử hoá thô (bước lượng tử lớn) đối với các hệ số tần số cao và lượng
tử hoá tinh (bước lượng tử nhỏ) đối với các hệ số có tần số thấp Bảng lượng
tử hoá được lấy tỉ lệ để tạo ra các mức nén thay đổi tuỳ theo tốc độ bít và chất lượng ảnh Việc lượng tử hoá sẽ tạo ra rất nhiều giá trị 0, đặc biệt là ở tần số cao Quá trình làm tròn trong khi lượng tử hoá chính là nguyên nhân
Trang 34chính gây ra sự tổn hao nhưng lại là nhân tố chính đem lại hiệu suất nén [27], [41], [42], [43], [59]
Tương tự đối với JPEG2000 các hệ số của phép biến đổi sóng con được lượng tử hoá Quá trình lượng tử hoá cho phép đạt tỷ lệ nén cao hơn bằng cách thể hiện các giá trị biến đổi với độ chính xác tương ứng cần thiết với mức chi tiết của ảnh cần nén Các hệ số biến đổi được lượng tử hoá theo phép lượng tử hoá vô hướng Các hàm lượng tử hoá khác nhau được áp dụng cho các băng con khác nhau Trong dạng biến đổi nguyên, đặt bước lượng tử bằng 1 Với dạng biến đổi thực thì bước lượng tử được chọn tương ứng cho từng băng con riêng rẽ Bước lượng tử của mỗi băng do đó phải có ở trong dòng bit truyền đi để phía thu có thể giải lượng tử cho ảnh [36], [16], [13], [45], [28], [53], [54], [12][12] Lượng tử hóa trong JPEG2000 có tác dụng ít hơn đối với hiệu suất nén và cũng ít ảnh hưởng đến chất lượng thủy vân hơn
so với nén JPEG [17], [24]
1.2.3 Nhận xét
Mã hoá thị giác là phép nén đa phương tiện mất thông tin lợi dụng cấu trúc sinh học của thị giác con người Cả phép nén và thuỷ vân đều dựa trên thực tế rằng những thay đổi nhỏ trong biểu diễn tín hiệu sẽ không dễ nhận thấy khi hiển thị Đối với phép nén, những thay đổi này là việc giảm số lượng bit lưu trữ cần thiết Đối với kỹ thuật thuỷ vân, những thay đổi này được sử dụng trong việc nhúng và dò tìm thuỷ vân Để kết hợp thành công
mã hoá thị giác với thủy vân, chúng ta phải xác định mức độ thỏa hiệp phù hợp sao cho cả hai quá trình đều có thể đạt được nhiệm vụ của chúng [56]
Trong một ảnh số, các thành phần tần số cao chủ yếu tập trung ở vùng biên của ảnh do tại đó giá trị mức xám của các điểm ảnh có độ chênh lệch
Trang 35lớn Trong khi đa số các ảnh, các chi tiết của ảnh thường thay đổi chậm, chênh lệch mức xám giữa các điểm ảnh gần nhau nhỏ Nên có thể nói phổ tần của ảnh tập trung chủ yếu ở miền tần số thấp và không có nhiều thông tin của ảnh ở tần số cao Trong các phương pháp nén ảnh JPEG, bước lượng tử hóa đối với dải tần cao lớn hơn so với bước lượng tử hóa ở dải tần thấp giúp loại bớt dư thừa thông tin trong miền tần số cao Với JPEG2000, biến đổi sóng con chia dải tần số của ảnh thành nhiều dải tần con và mã hoá ở mỗi dải tần bởi một số lượng bit khác nhau Ví dụ, ở dải tần số cao không cần dùng số lượng bit mã hoá nhiều như ở miền tần số thấp [18], [24] Như vậy,
để thủy vân bền vững sau phép nén ảnh JPEG ta cần phải giấu thủy vân trong miền biến đổi và tránh tác động đến quá trình lượng tử hóa, phần tiếp theo sẽ phân tích kỹ hơn vấn đề này
1.3 Phương pháp thủy vân trong miền DCT và tấn công nén ảnh JPEG
1.3.1 Biến đổi cosine rời rạc (DCT)
Biến đổi cosine rời rạc là một biến đổi toán học nhằm chuyển đổi miền biểu diễn các tín hiệu từ miền không gian sang miền tần số và được ứng dụng nhiều trong các phép xử lý tín hiệu như xử lý ảnh, xử lý video Về bản chất, biến đổi cosine rời rạc là phần thực của biến đổi Fourier rời rạc Để hiểu rõ hơn về biến đổi cosine rời rạc, trước tiên ta xem xét một vài điểm thiết yếu nhìn từ góc độ ứng dụng của biến đổi Fourier [58]
Nếu một ảnh được coi như một hàm của biên độ (cường độ sáng) với khoảng cách như là biến, thì theo lý thuyết Fourier hàm đó có thể được xây dựng bởi một chuỗi các hàm sine và cosine tăng dần theo tần số Khi hàm chỉ gồm có các thành phần sine thì gọi là biến đổi sine, và nếu hàm chỉ gồm
Trang 36các thành phần cosine thì nó được gọi là biến đổi cosine Cả biến đổi Fourier, sine và cosine đều có các ứng dụng riêng trong xử lý ảnh Tuy nhiên, trong nén ảnh, video thì hầu hết đều sử dụng biến đổi cosine vì nó có thể loại bỏ sự tương quan giữa các điểm ảnh trong miền không gian đồng thời yêu cầu ít sự phức tạp tính toán và tài nguyên hơn
Cặp biến đổi thuận nghịch cosine rời rạc một chiều được thể hiện hệ số
biến đổi cosine rời rạc C(u) với biến tín hiệu f(x) như sau:
N
u x x
f u u
(
N
u x u
C u x
01
)(
u N
u N
u
Tuy nhiên dữ liệu về ảnh số được biểu diễn bởi các thành phần của các
ma trận hai chiều nên biến đổi cosine rời rạc hai chiều được sử dụng Các hệ
số C(u, v) của biến đổi cosine rời rạc 2 chiều (u, v) của hàm tín hiệu f(x, y)
u x y
x f v
u v
u
C
N y
N
)12(cos2
)12(cos),()
()()
u x v
u C v u y
x
f
N u
N
)12(cos2
)12(cos),()()()
Trang 37Trong đó: α(u), α(v) đƣợc định nghĩa theo nhƣ (1.3),
f(x,y) là phần tử ma trận hai chiều (x, y),
N là số hàng hay số cột,
C(u,v) là hệ số biến đổi cosine rời rạc
Hệ số biến đổi DCT thứ nhất C(0,0) gọi là hệ số một chiều (Direct
Current-DC), nó biểu diễn giá trị trung bình của ma trận điểm ảnh, trong khi
đó tất cả các hệ số còn lại là thành phần xoay chiều (Alternative
Current-AC) C(0,0) là trung bình của tất cả các giá trị điểm ảnh của ma trận 8x8
trong miền không gian, cho biết độ sáng trung bình của ma trận ảnh Bảng 1.1 cho biết vị trí của các hệ số DC và AC trong ma trận các hệ số biến đổi cosine rời rạc 8x8
Trang 38quá trình nén đối với từng thành phần tương tự như quá trình được trình bày dưới đây
Hình 1.2 Sơ đồ tóm tắt lược đồ mã hóa và giải mã JPEG dùng biến đổi DCT
Sau khi thực hiện biến đối DCT, 64 hệ số sẽ được lượng tử hoá dựa trên
một bảng lượng tử gồm 64 phần tử Q(i, j) với 0 ≤i, j ≤7 Bảng này được xác
định cụ thể theo chất lượng và tỉ lệ nén mong muốn, các thử nghiệm trong luận án này sử dụng bảng lượng tử phổ biến nhất đối với thành phần chói trong ảnh màu hoặc ảnh đa cấp xám, cung cấp bởi JPEG Baseline Annex K, được thiết kế dựa trên các kinh nghiệm thực tế về cảm nhận sinh lý hình ảnh
bởi Lohscheller [11] Ví dụ, ứng với hệ số chất lượng là q=75 có các bước
lượng tử hóa tương ứng trong Bảng 1.2
Trang 39Mỗi phần tử trong ma trận lượng tử là một số nguyên có giá trị từ 1 tới 255
Mỗi hệ số DCT C(i, j) được chia bởi tham số kích thước bước lượng tử tương ứng Q(i, j) trong ma trận lượng tử và được làm tròn tới số nguyên gần
),(,
j i Q
j i C round j
i F
n n
(1.6)
Quá trình giải lượng tử được thực hiện theo phương trình sau:
),(),()
,(
' i j F i j Q i j
C n n (1.7)
Mục đích của việc lượng tử hoá là giảm số lượng bit cần để lưu trữ các
hệ số biến đổi bằng việc giảm độ chính xác của các hệ số này cho nên lượng
tử là quá trình xử lý có mất thông tin Theo sơ đồ có thể thấy quá trình lượng
tử hóa trong trường hợp nêu ở đây là nguyên nhân chủ yếu làm mất thông tin Sở dĩ như vậy là vì trong một hệ thống nén có tổn hao dựa trên biến đổi DCT có 3 nguyên nhân gây sai số trong hệ thống nén [23], [26], [49]:
+ Sai số dấu phẩy tĩnh - phụ thuộc vào độ chính xác tĩnh số học được dùng trong việc thực hiện thuật toán DCT trong hầu hết các hệ thống thực tế Sai số này có thể được giảm thiểu khi sử dụng các biến số có chiều dài bit lớn
+ Sai số làm tròn trong quá trình chuyển các hệ số có giá trị thực thành các hệ số nguyên có dấu trước khi mã hóa Sai số này tương đương với sai
số khi lượng tử hóa với bước lượng tử hóa là 1
+ Sai số khi lượng tử hóa các hệ số DCT theo bảng lượng tử hóa ứng với các tỉ số nén hay hệ số chất lượng nhất định Vì trong nén ảnh JPEG các bước lượng tử hóa trong bảng này thường là các số nguyên lớn hơn 1 rất
Trang 40nhiều nên sai số lượng tử hóa là nguyên nhân gây sai số chủ yếu trong nén ảnh JPEG và được coi là tấn công trực tiếp nguy hiểm nhất đối với thủy vân được nhúng
Như vậy có thể thấy rằng bản thân biến đổi DCT không làm mất (hoặc làm mất rất ít) thông tin vì DCT là một biến đổi tuyến tính chuyển các giá trị của điểm ảnh từ miền không gian thành các hệ số trong miền tần số Trong khi đó lược đồ nén JPEG chỉ ra rằng chính quá trình lượng tử hóa mới làm mất thông tin của ảnh và cũng chính là tấn công đối với thủy vân [18], [25]
1.4 Kết luận chương
Thủy vân số là lĩnh vực nghiên cứu đang phát triển với mục tiêu thêm các thông tin ẩn hoặc các thông báo bản quyền trong phương tiện truyền thông số Mỗi một hệ thống thủy vân được đề xuất đều nhằm một mục đích
là nhúng thủy vân bền vững ẩn vào phương tiện truyền thông số Các hệ thống này bị ràng buộc để đáp ứng hai yêu cầu mâu thuẫn nhau Đó là yêu cầu về khả năng chống lại việc loại bỏ thủy vân một cách có hoặc không có chủ định và yêu cầu độ duy trì độ trung thực cao đối với ảnh có nhúng thủy vân… Đối với thủy vân ẩn còn phải thỏa mãn yêu cầu là khó bị cảm nhận được bằng mắt thường Để đạt được nhiệm vụ này, nhiều kỹ thuật đã được khai thác trong các miền biểu diễn tín hiệu ảnh khác nhau, để đảm bảo chất lượng ảnh chứa thủy vân và/hoặc tính bền vững của thủy vân trước tấn công Điển hình trong các kỹ thuật đó là phương pháp thủy vân ẩn trong miền DCT nhằm chống lại tấn công nén ảnh JPEG [12], [17], [27], [41], [54], [60] Đây cũng chính là đối tượng và mục tiêu nghiên cứu trong các phần tiếp theo của luận án